HTML Agility Pack - parsování html – .NET – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu
Reklama
Reklama

HTML Agility Pack - parsování html – .NET – Fórum – Programujte.comHTML Agility Pack - parsování html – .NET – Fórum – Programujte.com

 

Hledá se programátor! Plat 1 800 € + bonusy (firma Boxmol.com)
Batou
~ Anonymní uživatel
1 příspěvek
28. 3. 2013   #1
-
0
-

Ahoj.

Učím se s HtmlAgilityPack, snažím se z webové stránky získat text. Konkrétně se jedná o tag <a> a získání textu z něj (tedy něco ve stylu <a rel="nofollow" href="daleko.cz"> toto chci získat </a>).

Následuje ukázka kódu. Chybová hláška: Formát URI není určený (determined). Cílem je textBox1 vypsat obsah všech obsahů tagu anchor.

        private void button1_Click(object sender, EventArgs e)
        {
            HtmlWeb web = new HtmlWeb();
            HtmlAgilityPack.HtmlDocument doc = web.Load("www.seznam.cz");
            var nodes = doc.DocumentNode.SelectNodes("//a[@href]");
           
            foreach(var node in nodes){ 
              textBox1.AppendText(node.FirstChild.InnerText + "\n");
           }

        }

Díky, B.

Nahlásit jako SPAM
IP: 90.180.236.–
Reklama
Reklama
JardaJirava0
Stálý člen
2. 4. 2013   #2
-
0
-

Ahoj,

tvůj problém je už při stahování stránky metodou Load. je třeba použít plnou adresu tedy http://www.seznam.cz.

Pěkný den,

Nahlásit jako SPAM
IP: 77.78.85.–
MCAD, MCPD
http://jirava.net/blog
http://xaml.cz - Magazín moderních technologií založených na XAML
Zjistit počet nových příspěvků

Přidej příspěvek

Toto téma je starší jak čtvrt roku – přidej svůj příspěvek jen tehdy, máš-li k tématu opravdu co říct!

Ano, opravdu chci reagovat → zobrazí formulář pro přidání příspěvku

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 84 hostů

Podobná vlákna

Parsování HTML — založil Mutagen

Parsování html stránky — založil beachboy

HTML do HTML — založil xp

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032016 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý