Vypsání počtu určitých slov v textu – PHP – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Vypsání počtu určitých slov v textu – PHP – Fórum – Programujte.comVypsání počtu určitých slov v textu – PHP – Fórum – Programujte.com

 

Nikishek0
Newbie
28. 5. 2013   #1
-
0
-

Ahoj, přemýšlím jak na jednu věc...

natáhl jsem si zdrojový kód stránky do proměnné, z tohoto zdrojáku potřebuji zjistit počet určitých slov nebo třeba i několika stejných slov po sobě. Příklad:

Fusce semper rhoncus ullamcorper. In blandit dui vel odio dapibus nec aliquam erat gravida. Vestibulum ante lorem ipsum primis in faucibus. Aenean turpis odio, ultrices in sagittis non, lorem ipsum, convallis a neque. Etiam lectus nisi, porttitor ut faucibus non, sollicitudin id urna.

Výskyt lorem ipsum = 2

Napadá mě použití funkce preg_match v nějakém cyklu? Nebo je na to něco robustnějšího?

Také bych ještě potřeboval píchnout s diakritikou a kódováním. Výsledky se mi zobrazují v terminálu a text zdrojáku natažený v té proměnné vypadá asi takto: HlavnĂ­ stránka. Pomocí iconv() mi to bohužel nešlo   Ale to už je vedlejší problém.

Nahlásit jako SPAM
IP: 78.102.113.–
Nikishek0
Newbie
28. 5. 2013   #2
-
0
-

Tak s první částí už jsem si pomohl sám. Pokud by někdo znal nějakou lepší syntaxi nebudu se bránit  

$string = 'Vestibulum ante lorem ipsum primis in faucibus. Aenean turpis odio, ultrices in sagittis non, lorem ipsum, convallis a neque.';
$word   = 'lorem ipsum';

$word_escaped = preg_quote($word, '~');
$pattern = '~\b' . $word_escaped . '\b~';

$count = preg_match_all($pattern, $string, $matches);
echo $word." = ".$count."x";
Nahlásit jako SPAM
IP: 78.102.113.–
CZechBoY+4
Věrný člen
28. 5. 2013   #3
-
0
-

#2 Nikishek
tohle je zajímavý řešení, jestli funguje tak bych se v tom nehrabal :D

u toho kodování si zjisti jak kodovanej ten řetězec je když ho vytáhneš a potom do jakýho kodování ho musíš převíst
iconv by to měl dát
kdyžtak pošli ještě kod

Nahlásit jako SPAM
IP: 213.192.10.–
peter
~ Anonymní uživatel
4016 příspěvků
29. 5. 2013   #4
-
0
-

Nikishek - iconv ma nekolik parametru. Ten text vypada na utf-8, pokud ma stranka utf-8 (meta + php header()), pak by se to melo zobrazit spravne. Pokud ne, tak iconv. http://php.net/…mbstring.php

Nahlásit jako SPAM
IP: 193.84.207.–
KIIV
~ Moderátor
+43
God of flame
29. 5. 2013   #5
-
0
-

#2 Nikishek
jestli nepotrebujes seznam tech nalezenejch slov, tak bych to klidne vynechal -> preg_match_all($pattern, $string)

Nahlásit jako SPAM
IP: 62.168.56.–
Program vždy dělá to co naprogramujete, ne to co chcete...
Markaos0
Návštěvník
4. 6. 2013   #6
-
0
-

   

A co strpos()    

Nahlásit jako SPAM
IP: 89.24.19.–
Linux is like a wigwam
No gates, no windows, apache inside.
KIIV
~ Moderátor
+43
God of flame
4. 6. 2013   #7
-
0
-

#6 Markaos
ten preg_match_all to zmakne na jeden zatah... (ikdyz technicky vzato jsou regexpy pomalejsi jak nejaky strpos)

Nahlásit jako SPAM
IP: 94.112.32.–
Program vždy dělá to co naprogramujete, ne to co chcete...
Zjistit počet nových příspěvků

Přidej příspěvek

Toto téma je starší jak čtvrt roku – přidej svůj příspěvek jen tehdy, máš-li k tématu opravdu co říct!

Ano, opravdu chci reagovat → zobrazí formulář pro přidání příspěvku

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 51 hostů

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032024 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý