Získávání informací z webu – Regulární výrazy – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Získávání informací z webu – Regulární výrazy – Fórum – Programujte.comZískávání informací z webu – Regulární výrazy – Fórum – Programujte.com

 

Toto vlákno bylo označeno za vyřešené.
fix0
Stálý člen
7. 9. 2021   #1
-
0
-

Ahoj všem, nevíte někdo prosím o nějakém webovém nástroji, do kterého  bych vložil web, zvolil element (například obrázek), pak kliknul na něco jako "přidat podobné". Ono by mi to vyplivlo nějaký regulární výraz či něco podobného, co bych pak použil v bash skriptu. Neumí to třeba nějak přímo prohlížeč? Výsledek by byl seznam všech URL obrázků. Řeší se to vůbec přes regex? Nechám si poradit. Rád bych se vyhnul používání nějakých dalších kodu třetích stran. Ideálně, aby to bylo něco univerzálního, co bych mohl použít i v bash/sh. Jednoduše stráhnout stránku wget/curl něco a pak už jen z toho HTML zdroje v textu vybrat co mě zajímá.

Zjednodušený dotaz: Jak z kompletní HTML stránky získat seznam obrázků (v konkrétním divu webu, nikoliv všechny) a jejich alternativního popisu?

Díky moc za rady.

Nahlásit jako SPAM
IP: 31.30.163.–
peter
~ Anonymní uživatel
3706 příspěvků
7. 9. 2021   #2
-
+1
-
Zajímavé
fix +

https://developer.mozilla.org/en-US/docs/Web/Guide/Parsing_and_serializing_XML
https://developer.mozilla.org/…MLSerializer


1. vytvoris si stahuj.php
do nej das echo file_get_content($url)
2. pouzijes dom parser nebo pridas ten string do elementu, jako innerHTML, treba skryteho divu
3. a pak uz to mas jednoduche, nejakyelement.getElementsByTagName('IMG')
Samozrejme to jde filtrovat uz v php, jak chces.

Nahlásit jako SPAM
IP: 2001:718:2601:258:98bb:9bbe:d86a:1900...–
fix0
Stálý člen
8. 9. 2021   #3
-
0
-

PHP mi v tomto případě nevyhovuje, na tom serveru nemám webový server a jen kvuli téhle blbostičce se mi ho nechce spravovat, takže jsem si poradil čistě server skriptem přes kombinaci unixových sed a awk, když se to podělá, tak to můžu snadno opravit.

Ale díky za rady, vzpomněl jsem si, že s tímto XML parserem vlastně v základu umím. :-)

Nahlásit jako SPAM
IP: 31.30.163.–
8. 9. 2021   #4
-
0
-

As you have discussed the web designs. It's great to see you here we are an american web design company in the USA. We deal in all kinds of web formation and services related to the web. Get in touch with the best web design company in USA and ask the expert you want to know. Hope you will get a satisfactory answer and will feel pleased to get in touch with us.

Nahlásit jako SPAM
IP: 45.130.83.–
gna
~ Anonymní uživatel
1485 příspěvků
8. 9. 2021   #5
-
0
-

#3 fix
PHP nemusíš spouštět přes web server.

Nahlásit jako SPAM
IP: 213.211.51.–
fix0
Stálý člen
8. 9. 2021   #6
-
0
-

Jo, už jsem spouštěl PHP z CLI, ale myslel jsem spíše databázoví, nemám rád sqlite. To je ale fuk, už to mám hotové. Díky. :-)

Nahlásit jako SPAM
IP: 31.30.163.–
Zjistit počet nových příspěvků

Přidej příspěvek

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 32 hostů

Podobná vlákna

Získávání dat z bazarů — založil thebighead

Získávání dat z jiných serverů — založil DaveLister

Moderátoři diskuze

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032021 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý