Index Webových Stránek – PHP – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Index Webových Stránek – PHP – Fórum – Programujte.comIndex Webových Stránek – PHP – Fórum – Programujte.com

 

Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
14. 9. 2013   #1
-
0
-

Čau jelikož dělám webový vyhledávač což už mám tak chcu aby se to nepřidávalo jen po jedne stránce ale po více stránek třeba že napíšu google.cz tak mi to vše najde a zaindexuje do mysql O Googlu , Google Vyhledávač , Google Plus , atd... něco podobného je sphider.... :) WEB : http://mccowmods,mzf.cz/

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
14. 9. 2013   #2
-
0
-

Nemáš vyhledávač. Protože to by jsi musel vlastnit obdobnou DB jako má Google. A protože ji nemáš, tak je jasné, že používáš GoogleSearch. A proto se ti jen musím smát, jak se tu chlubíš něčím takovým...

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #3
-
0
-

Ne nemáte pravdu můj vyhledávač vyhledává v MySql databázi kde jsou uložené stránky :)

Nahlásit jako SPAM
IP: 62.168.2.–
z_moravec
~ Redaktor
+3
Posthunter
15. 9. 2013   #4
-
0
-

#3 Domiš -Mickey-
Pak ale vyhledává jen v pár stránkách a není prakticky použitelný. MySQL určitě není vhodný typ databáze pro tyto účely. Mimoto potřebuješ hodně výkonného robota na indexování webů a samozřejmě to nelze provozovat na jednom serveru.

Co se týče původního dotazu, tak těch možností je několik. Nejjednodušší je asi projít html kód stránky, vyhledat odkazy, rozdělit je na vnitřní a vnější a postupně projít ty vnitřní. Samozřejmě musíš ukládat, kdy jsi kterou stránku navštívil, abys mohl prběžně provádět aktualizace nasbíraných dat.

Nahlásit jako SPAM
IP: 46.39.170.–
Spát lze čtyři hodiny denně, spát déle je nemístný přepych.
Thomas Alva Edison
Matěj Andrle+1
Grafoman
15. 9. 2013   #5
-
0
-

#3 Domiš -Mickey-
To odpovídá tomu, jak je to nefukční. Je nereálné konkurovat Googlu. Je to projekt k ničemu - ztráta času - umřeš zbytečně brzo kvůli tomu... :D

Za Googlem stojí miliardové korporace. Nestačily by ti na to milióny - musel by jsi mít miliardy... Tedy na to, aby jsi mohl konkurovat Googlu. Každý idiot by dokázal udělat jednoduchý vyhledávač - kdyby měl zdroj DB, a do ní cpal dotazy. Tady jde o ty peníze a o dobu, za kterou se dokázal Google všude zakořenit.

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #6
-
0
-

Brzo to budu hostovat v racku který stojí 200 000 ročně a to je teda dost hodně takže by to mohlo , a ještě jak se takový robot vytváří?

Nahlásit jako SPAM
IP: 62.168.2.–
z_moravec
~ Redaktor
+3
Posthunter
15. 9. 2013   #7
-
0
-

#6 Domiš -Mickey-
Máš opravdu naivní představy, zkus se podívat na jakém železe jede google, nebo i malý vyhledávač typu seznam.

Nahlásit jako SPAM
IP: 46.39.170.–
Spát lze čtyři hodiny denně, spát déle je nemístný přepych.
Thomas Alva Edison
Matěj Andrle+1
Grafoman
15. 9. 2013   #8
-
0
-

Jestli něco vyděláš, tak -200 000 Kč. Dále se zeptám - k čemu to bude? I kdyby jsi měl miliardy a udělal ten vyhledávač. K čemu? Google tu je a není to jen vyhledávač. Takže i ty by jsi musel udělat prvně něco více, než Google. A k čemu? Tohle není sen - to je nějaká psychicá porucha... (Vždyť si neuvědomuješ své sebedestruktivní chování - to hraničí s masochismem...)

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #9
-
0
-

z_moravec pošli mi jak vypadá server kde je google

Nahlásit jako SPAM
IP: 62.168.2.–
z_moravec
~ Redaktor
+3
Posthunter
15. 9. 2013   #10
-
0
-

#9 Domiš -Mickey-
Co tak zagooglovat?

http://www.google.com/about/datacenters/

Nahlásit jako SPAM
IP: 46.39.170.–
Spát lze čtyři hodiny denně, spát déle je nemístný přepych.
Thomas Alva Edison
Matěj Andrle+1
Grafoman
15. 9. 2013   #11
-
0
-

Zabírá to 4 haly... (Velké haly... :D)

https://www.google.cz/search?hl=cs&site=imghp&tbm=isch&source=hp&biw=1278&bih=962&q=google+server&oq=google+server&gs_l=img.3...3670.6418.0.7609.13.11.0.2.0.0.269.1001.7j2j1.10.0....0...1ac.1.26.img..8.5.369.qxS9ECyoqko

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #12
-
0
-

uppps :) 

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #13
-
0
-

Google má navíc servery po celém světě... :D

A kolik lidí je obsluhuje... :D A tady přijde jeden sotva programátor - a chce převálcovat Google... :D

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #14
-
0
-

Po celém to zas ne... :D

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #15
-
0
-

Má...

Prostě chceš překonat miliardovou korporaci - co čekáš? Že jede na nějakém IPhonu? :D

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #16
-
0
-

Tak mám se do toho pustit nebo ne naplno?

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #17
-
0
-

Ty jsi fakt narušený... Jak chceš sehnat tolik pozemků, lidí, PC atd.? Kde máš ty miliardy na to?

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #18
-
0
-

Chtěl jsem si jen prostě udělat vyhledávač ne youtube atd...

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #19
-
0
-

Mamíííí. Máš miliardu - 1? Máš 2? Máš 20? Pak ano - jdi do toho! Nemáš? Kdo by to používal, kdyby to umělo najít jen 4 slova? A zapomeneme na peníze - máš 200 miliard - kdo by to používal? Proč by opustil Google? K čemu by to bylo?

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #20
-
0
-

Myslel jsem si že mi pomůžete s tím indexováním a vy mně jen furt poučujete!

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #21
-
0
-

Nemáš 200 miliard. Problém vyřešen. Vydělej je a má smysl ti radit dál. Takhle jen dokazuješ svoji hloupost...

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #22
-
0
-

Nejsem hloupy to si zase moc nedovoluj

Nahlásit jako SPAM
IP: 62.168.2.–
z_moravec
~ Redaktor
+3
Posthunter
15. 9. 2013   #23
-
0
-

#20 Domiš -Mickey-
Můžeš začít studovat třeba tady:

http://infolab.stanford.edu/~backrub/google.html

Nahlásit jako SPAM
IP: 46.39.170.–
Spát lze čtyři hodiny denně, spát déle je nemístný přepych.
Thomas Alva Edison
Matěj Andrle+1
Grafoman
15. 9. 2013   #24
-
0
-

Nebo? Hloupý jsi 100%. Vždyť se ti vůbec nedá domluvit. Nenapsal jsi jediný rozumný důvod proč vůbec dělat vyhledávač. Nenapsal jsi jedinou rozumnou větu - jak to chceš udělat. Já tě nehodlám podporovat v sebevražedné misi. Nikdy v životě mě nenapadlo chtít udělat druhý Google, druhé WoW atd. Vím na co mám - proč jen tihle nováčci musí být tak idealističtí... :D

Nahlásit jako SPAM
IP: 78.136.150.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
15. 9. 2013   #25
-
0
-

Stránku jsem zastavil!

Nahlásit jako SPAM
IP: 62.168.2.–
Matěj Andrle+1
Grafoman
15. 9. 2013   #26
-
0
-

Konečně! :D V prvé řadě si zvol životní cestu. A ne vzdušný zámek. Můžeš dělat ve funkcionálním programování pro AI - třeba se pokusit překonat Argument čínského pokoje atd.

Nahlásit jako SPAM
IP: 78.136.150.–
Martin Kozibrátka0
Stálý člen
15. 9. 2013   #27
-
0
-

Koukám, že jste tu Domiš -Mickey- pěkně rozebrali :)

Nahlásit jako SPAM
IP: 88.83.169.–
Savana.cz - neomezený webhosting za pár kaček :)
crazy
~ Moderátor
+10
Grafoman
16. 9. 2013   #28
-
0
-

#24 Matěj Andrle
Proč by měl být hloupý? Já si myslím, že každý z nás měl takové sny ;)

Nahlásit jako SPAM
IP: 2001:718:2:48:2c3c:faef:5...–
All you need is vision and time.
Martin Kozibrátka0
Stálý člen
16. 9. 2013   #29
-
+1
-
Zajímavé

#28 crazy
Souhlas, nemusí se nic podařit, důležité je se na tom něco naučit.

Nahlásit jako SPAM
IP: 188.120.221.–
Savana.cz - neomezený webhosting za pár kaček :)
Matěj Andrle+1
Grafoman
16. 9. 2013   #30
-
0
-

#28 crazy
Čti co píši - šlo mi o to, že chtěl v projektu pokračovat i když jsme se mu snažili vysvětlit, jak je to nereálné. Co se může naučit na něčem, co nemůže vytvořit? Leda, že je hloupý, nic neumí a nikdy nebude programátorem. Z tohohle jiného, než deprese nevznikne... Jedna věc je mít vzdušný zámek a druhá snažit se jej naplnit... Myslím to upřímě a vážně. Když se bude honit za sny, brzy narazí na to, že to nikam nevede... Když se prvně naučí pořádně programovat a bude sledovat aktuální horké pozice, bude mít naději...

Nahlásit jako SPAM
IP: 78.136.150.–
z_moravec
~ Redaktor
+3
Posthunter
16. 9. 2013   #31
-
+3
-
Zajímavé

#30 Matěj Andrle

To už trochu přeháníš. To že se snaží o realizaci obtížného, příp. nerálného projektu rozhodně neznamená, že nemůže být dobrým programátorem, nebo že je hloupý. Kdyby všichni uvažovali tímto způsobem, tak dodnes žijeme v jeskyních.

Nahlásit jako SPAM
IP: 46.39.170.–
Spát lze čtyři hodiny denně, spát déle je nemístný přepych.
Thomas Alva Edison
Matěj Andrle+1
Grafoman
16. 9. 2013   #32
-
-3
-
Otravné

#31 z_moravec
? Opravdu čtěte, co píši. Píši, že když bude dělat do nereálného projektu, narazí a přijde deprese - vzdá to a bude se podceňovat... Bude si připadat neschopný atd. Učil jsem už tolik lidí - jen málo kdo to nevzdal. Takže vím o čem mluvím - chcte to od začátku mít na dohled horizont...

Nahlásit jako SPAM
IP: 78.136.150.–
crazy
~ Moderátor
+10
Grafoman
16. 9. 2013   #33
-
0
-

#32 Matěj Andrle
Jak už psal Martin Kozibrátka:

Souhlas, nemusí se nic podařit, důležité je se na tom něco naučit.

Nahlásit jako SPAM
IP: 2001:718:2:48:1d37:d0ac:2...–
All you need is vision and time.
peter
~ Anonymní uživatel
4016 příspěvků
17. 9. 2013   #34
-
0
-

Matěj Andrle - Takova ostuda, ze tu taci lidi jeste jsou, co se takhle navazeji do druhych :) At si dela, co chce, ne? Treba je to pokusny nebo skolni projekt.

Domiš -Mickey- - Ti to vsechno uz psali. Google dostane stranku, v ni vyhleda odkazy. Interni projde a vyhleda dalsi odkazy, externi si ulozi k pozdejsimu prohledavani. Soucasne si pritom ulozi text bez html a soucasne vyradi stranky presahujici 40k nebo ty, ktere obsahuji velky pomer html / plain-text (cili, kdyz tam nekdo nacpe js, css ne externe). Co se tyce indexu, tak google ma servery s daty a servery s indexy. Cili, na jednom serveru lide vyhledavaji a ten je zatizen a jiny server posila data prislusici k indexum (vsechno se posila gzipovane). Indexove servery ma pak ve vetsim poctu, datovych pak tolik netreba. Cas od casu pak dela aktualizece. Navic ma nejspis indexy rozhozene na servery podle pismen, dvojpismen. A ty, ktere se vyhledavaji casteji, tak ma vicekrat zklonovane. Proste, je to silene komplikovana zalezitost.

Seznam.cz bych jako vyhledavac neuvadel, ten je proti google nicka a navic 10x vic zatezuje tvou stranku nez google, jestli si vedes nekde navstevnost stranky vyhledavaci. Navic si myslim, ze vyhledavace seznam moc neumim, on je predevsim katalog stranek. Co si tam uzivatele registruji, to tam je. ten humbug, co delal v tv, najdes tam, co neznas, ten byl trapny, protoze na seznamu nic neni, to neni vyhledavac :) Ledaze bys hledal nejakou firmu, tak je 1:10 sance, ze ma stranky a ze je nekdo registroval do seznamu.
 

Nahlásit jako SPAM
IP: 193.84.207.–
Domiš -Mickey-
~ Anonymní uživatel
12 příspěvků
20. 9. 2013   #35
-
0
-

Jsem tu zase celý ten projekt obnovím díky vám že jste se mě zastali doufám že mi pomůžete :)

Nahlásit jako SPAM
IP: 62.168.2.–
Zjistit počet nových příspěvků

Přidej příspěvek

Toto téma je starší jak čtvrt roku – přidej svůj příspěvek jen tehdy, máš-li k tématu opravdu co říct!

Ano, opravdu chci reagovat → zobrazí formulář pro přidání příspěvku

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 20 hostů

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032024 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý