Parsování html stránky – PHP – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Parsování html stránky – PHP – Fórum – Programujte.comParsování html stránky – PHP – Fórum – Programujte.com

 

beachboy0
Návštěvník
6. 5. 2011   #1
-
0
-

Cau, potreboval bych získat data z cizí stránky, a nevim jakym stylem parsovat ta data. Predem diky.

Vzor dat na strance:

<div class="eListing">

<h4>Chuck vs. </h4>
<div class="eDetail">
<div class="eColumnA">
<p class="eColumnTitle">Air date: xx/xx/xx</p>
<img class="eThumb" src="/chuck/images/placeholders/152x81.jpg" width="152" height="81" />
<p class="eCaption"> episode description </p>
</div>
<div class="eColumnB">
<p class="eColumnTitle">Video</p>
<div class="videoCategory">
<img src="/chuck/images/placeholders/80x45.jpg" width="80" height="45" />
<p>Highlight
<a href="#">Watch Now</a></p>
</div>
<div class="videoCategory">
<img src="/chuck/images/placeholders/80x45.jpg" width="80" height="45" />
<p>2-Minute Replay
<a href="#">Watch Now</a></p>
</div>
</div>
<div class="eColumnC">
<p class="eColumnTitle">Related Content</p>
<div class="relatedLinks">
<a class="recap" href="">Recap</a>
<a class="episodePhotos" href="">Episode Photos</a>
</div>
</div>
<div class="clear"></div>
</div>
</div>

Nahlásit jako SPAM
IP: 195.113.159.–
insider0
Věrný člen
6. 5. 2011   #2
-
0
-

podivej se na regularni vyrazy

Nahlásit jako SPAM
IP: 78.45.33.–
I don't want to see you go,[br] The sky is over[br] Even though we can't afford[br] The sky is over,[br] The sky is over us.[br][br] CIVILIZATION IS OVER
mc
~ Anonymní uživatel
12 příspěvků
6. 5. 2011   #3
-
0
-

insider napsal:
podivej se na regularni vyrazy



záleží, co přesně chce parsovat. Obecné html pouhým regulárním příkazem parsovat nejde.

Parsery html existují, řešilo se na podobné diskuzi na rootu:

http://forum.root.cz/index.php?topic=2157.msg17038#msg17038

Nahlásit jako SPAM
IP: 213.211.34.–
beachboy0
Návštěvník
6. 5. 2011   #4
-
-1
-
Mimo téma

Jak jsem prilozil ten vzor, tak bych potreboval ziskat pouze tyto dve veci, ktere se na strance nekolikrat vyskytuji

<h4>Chuck vs. </h4> 

<p class="eColumnTitle">Air date: xx/xx/xx</p>

Nahlásit jako SPAM
IP: 83.208.238.–
m->29+6
Super člen
8. 5. 2011   #5
-
0
-

Na to ti stačia tie Regulárne výrazy:
/<h4>([^<]*)<\/h4>/gi
/<p class="eColumnTitle">([^<]*)<\/p>/gi

Nahlásit jako SPAM
IP: 83.240.51.–
hrach
~ Redaktor
+1
Boss
9. 5. 2011   #6
-
-2
-
Mimo téma

Zamykam, priste zkus trosku hledat. Otazky typu: tady mam toto a potrebuji toto, jak to udelat? tu neberu.

Nahlásit jako SPAM
IP: 88.101.68.–
http://jan.skrasek.com@hrachcz – webdeveloper
Zjistit počet nových příspěvků

Přidej příspěvek

Toto téma je starší jak čtvrt roku – přidej svůj příspěvek jen tehdy, máš-li k tématu opravdu co říct!

Ano, opravdu chci reagovat → zobrazí formulář pro přidání příspěvku

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 4 hosté

Podobná vlákna

Parsování HTML — založil Mutagen

Stazeni html stranky — založil seitec

CSS HTML Okraj stranky — založil dominik

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032024 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý