Získávání informací z webu – Regulární výrazy – Fórum – Programujte.com

TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Trvalé přihlášení

Zapomněl jsi heslo?

Získávání informací z webu – Regulární výrazy – Fórum – Programujte.com

Rozšířené hledání ›

Nejnovější témata ve fóru

10:02, Java CyStack Endpoint – Řešení kybernetické bezpečnosti na míru…

09:17, C / C++ Velikost polev C++?

09:22, Java CyStack Platform – Integrované kyberbezpečnostní řešení pr…

09:48, C / C++ STL Search, std::distance atd?

15:16, C / C++ Vyčtení informci z .DLL v C/C++

13:12, Inzerce Vytvoření programu pro řízení můstku

Stavba Laser Arény
Laser Game Brno

Získávání informací z webu

Toto vlákno bylo označeno za vyřešené.

fix 0

Stálý člen

7. 9. 2021 #1

Ahoj všem, nevíte někdo prosím o nějakém webovém nástroji, do kterého bych vložil web, zvolil element (například obrázek), pak kliknul na něco jako "přidat podobné". Ono by mi to vyplivlo nějaký regulární výraz či něco podobného, co bych pak použil v bash skriptu. Neumí to třeba nějak přímo prohlížeč? Výsledek by byl seznam všech URL obrázků. Řeší se to vůbec přes regex? Nechám si poradit. Rád bych se vyhnul používání nějakých dalších kodu třetích stran. Ideálně, aby to bylo něco univerzálního, co bych mohl použít i v bash/sh. Jednoduše stráhnout stránku wget/curl něco a pak už jen z toho HTML zdroje v textu vybrat co mě zajímá.

Zjednodušený dotaz: Jak z kompletní HTML stránky získat seznam obrázků (v konkrétním divu webu, nikoliv všechny) a jejich alternativního popisu?

Díky moc za rady.

Nahlásit jako SPAM

IP: 31.30.163.–

Blog.Glor.cz - blog nejenom o cestování

peter

~ Anonymní uživatel
~ 4035 příspěvků

7. 9. 2021 #2

Zajímavé

Zobrazit udělené karmy příspěvku od uživatelů

▲

fix +

https://developer.mozilla.org/en-US/docs/Web/Guide/Parsing_and_serializing_XML
https://developer.mozilla.org/…MLSerializer

1. vytvoris si stahuj.php
do nej das echo file_get_content($url)
2. pouzijes dom parser nebo pridas ten string do elementu, jako innerHTML, treba skryteho divu
3. a pak uz to mas jednoduche, nejakyelement.getElementsByTagName('IMG')
Samozrejme to jde filtrovat uz v php, jak chces.

Nahlásit jako SPAM

IP: 2001:718:2601:258:98bb:9bbe:d86a:1900...–

fix 0

Stálý člen

8. 9. 2021 #3

PHP mi v tomto případě nevyhovuje, na tom serveru nemám webový server a jen kvuli téhle blbostičce se mi ho nechce spravovat, takže jsem si poradil čistě server skriptem přes kombinaci unixových sed a awk, když se to podělá, tak to můžu snadno opravit.

Ale díky za rady, vzpomněl jsem si, že s tímto XML parserem vlastně v základu umím. :-)

Nahlásit jako SPAM

IP: 31.30.163.–

ashleykeith 0

Duch

8. 9. 2021 #4

As you have discussed the web designs. It's great to see you here we are an american web design company in the USA. We deal in all kinds of web formation and services related to the web. Get in touch with the best web design company in USA and ask the expert you want to know. Hope you will get a satisfactory answer and will feel pleased to get in touch with us.

Nahlásit jako SPAM

IP: 45.130.83.–

gna

~ Anonymní uživatel
~ 1905 příspěvků

8. 9. 2021 #5

#3 fix
PHP nemusíš spouštět přes web server.

Nahlásit jako SPAM

IP: 213.211.51.–

fix 0

Stálý člen

8. 9. 2021 #6

Jo, už jsem spouštěl PHP z CLI, ale myslel jsem spíše databázoví, nemám rád sqlite. To je ale fuk, už to mám hotové. Díky. :-)