Cesta do dokonalého vyhledávače Infographic

Zveřejnění: Vaše podpora pomáhá udržovat provoz webu! Za některé služby, které na této stránce doporučujeme, dostáváme poplatek za doporučení.


Cesta do dokonalého vyhledávače

To je zajímavé. Bylo období – asi před dvěma desítkami let – kdy většina z nás nevěděla o internetu.

Jistě, někteří z nás byli vystaveni Lycos a AltaVista, ale internet a konkrétně vyhledávače, jak jsou nyní? V žádném případě. Pokud jsme chtěli někoho kontaktovat, vyhledali jsme je v telefonním seznamu. Pokud jsme chtěli prozkoumat historii Byzantské říše, šli jsme do knihovny. Nebylo okamžité uspokojení z toho, že jsem šel do Google a hledal cokoli a všechno.

V dnešní době jsou vyhledávače v našem každodenním životě natolik zakořeněné, že o něčem už ani nemyslíme. Jednoduše otevřeme okno prohlížeče (nebo mobilní zařízení), zadáme to, co hledáme, a za sekundu máme odpověď nebo řešení.

Jediný čas, kdy lidé opravdu věnují pozornost této myšlence „vyhledávače“, je, když Google vydává novou aktualizaci algoritmu. Tyto aktualizace jsou obvykle znamením pro firmy a obchodníky, že je čas aktualizovat své webové stránky, aby zůstali v dobrých milostech společnosti Google pro účely hodnocení. Podniky proto při dodržování zákonů vyhledávačů hledají nejlepší zájmy svých návštěvníků.

Na konci dne se o to ve vyhledávačích nakonec zajímají: uživatelé internetu. Pomáháme jim propojit je s potřebnými informacemi a udržovat je v bezpečí, zatímco to dělají.

Ale to není to, jak internet nebo vyhledávače původně vypadaly – nebo se snažily dělat –
zpět v 60. letech, kdy to všechno začalo. Pokud nejste obeznámeni s historií vyhledávačů, zapněte se. Vezmeme vás na dlouhou a větrnou cestu přes všechny vyhledávače, které vydláždily cestu na Google.

Ne tak SMART jako Google: Cesta k dokonalému vyhledávači

Ne tak SMART jako Google: Cesta k dokonalému vyhledávači

Téměř každý, kdo má připojení k internetu, už dříve použil vyhledávač, ale přemýšleli jste někdy, jak se vyhledávač objevil? Kdo to vymyslel? Jaký byl první? Pak následujte, protože máme celý příběh.

Předchůdce

  • Název:
    • SMART Information Retrieval System
      • SMART je zkratka pro Saltonův magický automatický retrívr textu
  • Vydáno:
    • Šedesátá léta
  • Použití:
    • Interaktivní informační databáze
  • Vyvinul:
    • Gerard Salton
    • Chris Buckley
    • Ostatní na Cornell University
  • Inovace:
    • Vektorový prostorový model:
      • Metoda automatického vážení výsledků vyhledávání k zobrazení těch, které jsou pro uživatele nejrelevantnější
    • Relevance zpětná vazba:
      • Způsob, jak mohou uživatelé hodnotit relevanci výsledků vyhledávání
    • Rocchioova klasifikace:
      • Typ klasifikační metody, která zvyšuje přesnost vyhledávání

Na začátku

  • Před příchodem World Wide Web a vyhledávačů, internet byl:
    • Kolekce webů pro přenos souborů (FTP), na kterých by uživatelé mohli procházet a hledat konkrétní sdílené soubory
    • Diskusní skupiny, kde lidé interagovali a distribuovali informace, například FAQ.
  • První
    • Název:
      • Archie
    • Vydáno:
      • 1990
    • Použití:
      • Index archivu FTP
    • Vyvinul:
      • Alan Emtage
      • Peter Deutsch
      • Bill Heelan
    • Inovace:
      • Povoleno vzdáleným uživatelům prohlížet seznamy anonymních serverů FTP, které obsahují:
        • Software
        • FAQs
        • Archivy zpráv
      • Pravidelně a automaticky aktualizujte seznam dostupných serverů
    • Další informace:
      • V září 1990 sestavil Archie databázi 210 stránek
      • V roce 1992 Archie obsahoval 2,6 milionu souborů (zhruba 150 GB dat)
  • Archie’s Friends
    • Název:
      • Rozrazil
      • Jughead
    • Vydáno:
      • 1993
    • Použití:
      • Gopherův index
    • Vyvinul:
      • Fred Barrie a Steven Foster
      • Rhett Jones
    • Inovace:
      • Oba motory byly vyvinuty, aby usnadnily vyhledávání na serverech Gopher
      • Veronica vytvořila indexy Gopherových prostých textových souborů
      • Jughead mohl použít booleovské vyhledávací termíny k prohledání jediného serveru Gopher
    • Další informace:
      • Přestože se Archie nechtěl odkazovat na komiksovou postavu, lidé, kteří napsali následující Veronicu a Jughead, si mysleli, že by bylo pokračující v tématu
      • Backronymy byly vytvořeny pro oba:
        • Veronica: „Velmi snadný síťový index zaměřený na hlodavce do počítačových archivů“
        • Jughead: „Jonzyho univerzální výkop a hierarchie hierarchie hieropie“
      • Veronica prohledávala 5 500 serverů Gopher a indexovala přes 10 milionů položek / dokumentů
  • Vynález webu
    • V roce 1989 začal Tim Berners-Lee a jeho tým v CERN pracovat na HTTP:
      • Systém pro odesílání a přijímání hypertextových dokumentů, které by se navzájem propojovaly na jakémkoli webu.
      • Bylo rychle rozšířeno, aby:
        • Větší vyjednávání klient-server
        • Metadata
        • Bezpečnostní
    • Zahrnuty první prohlížeče:
      • ViolaWWW
      • Dobře
      • MidasWWW
      • Mozaika
    • S rostoucím počtem webových serverů se web stal rozhraním pro přístup k internetu:
      • Nové servery byly ohlášeny v části „Co je nového“ na webu NCSA
        • Mnoho webových stránek poskytlo svůj vlastní seznam „zajímavých webů“.
      • Tento centrální seznam nemohl držet krok s růstem, který vytvořil potřebu najít a uspořádat všechny informace na webu

Není nutný robot

  • Název:
    • ALIWEB, což znamená Archie-Like Indexing for WEB
  • Vydáno:
    • Říjen 1993
  • Formát:
    • Index webových stránek s vlastním vstupem
  • Vyvinul:
    • Martijn Koster
  • Inovace:
    • HTTP ekvivalent Archie
    • Nepoužili jsme robota prohledávání webu
      • Webmasteři zúčastněných webů museli zveřejňovat své vlastní indexové informace pro každou stránku, kterou chtějí uvést
        • Výhody:
          • Uživatelé mohli popsat své vlastní weby
          • Robot neběžel, aby snědl čistou šířku pásma
        • Nevýhody:
          • Indexování souborů bylo pro většinu lidí komplikované
          • Obtížnost použití znamenala relativně malou databázi
  • Další informace:
    • Pokusili se vyrovnat složitost přidáním dalších databází do vyhledávání ALIWEB, ale nemohli konkurovat novějším vyhledávacím strojům založeným na botech.

Indexer

  • Název:
    • WebCrawler
  • Vydáno:
    • 1994
  • Použití:
    • Index procházení webových stránek
  • Vyvinul:
    • Brian Pinkerton
  • Inovace:
    • První prolézací modul k indexování celých webových stránek, nikoli pouze názvů souborů nebo webových stránek
  • Další informace:
    • Při prvním uvedení na trh měl WebCrawler dokumenty z více než 6 000 serverů
    • Pět měsíců po svém vydání obdržela v průměru 15 000 dotazů denně
    • WebCrawler rychle rostl tak populární, že byl během dne téměř nepoužitelný

Spider knihovny

  • Název:
    • Lycos
  • Vydáno:
    • 1994
  • Použití:
    • Index webových stránek
  • Vyvinul:
    • Michael Mauldin
  • Inovace:
    • Největší knihovna indexovaných webů v té době
  • Další informace
    • Lycos je pojmenován podle vlčího pavouka, Lycosidae Lycosa, protože pavouk loví svou kořist spíše než ji chytit na webu
    • Na veřejnosti měl Lycos k dispozici 54 000 dokumentů
    • Za měsíc identifikovala téměř 400 000 dokumentů
    • Během pěti měsíců identifikoval Lycos 1,1 milionu dokumentů
    • V listopadu 1996 obsahoval jeho katalog 60 milionů dokumentů

Slovo Smiths

  • Název:
    • Vzrušení, původně pojmenované Architext
  • Vydáno:
    • 1995
  • Použití:
    • Index slov webových stránek
  • Vyvinutý šesti studenty Stanford:
    • Joe Kraus
    • Ben Lutch
    • Ryan McIntyre
    • Martin Reinfried
    • Graham Spencer
    • Mark Van Haren
  • Inovace:
    • Díky myšlence pohledu na vztahy slov pomocí statistické analýzy, průkopnického přístupu v té době, bylo vyhledávání relevantnější
    • Po uvedení na trh společnost Excite.com indexovala 1,5 milionu stránek, což je v té době velké množství
  • Další informace:
    • Excite podepsal významné dohody s Netscape a Microsoft
    • Excite pokračoval v růstu s příjmy přesahujícími 150 milionů dolarů od roku 1998
    • Dva spolužáci ze Stanfordu, Larry Page a Sergey Brin, založili společnost Google a nabídli v roce 1999 prodej své společnosti společnosti Excite za milion dolarů.
      • Byli ochotni se vyrovnat za pouhých 750 000 dolarů
      • Společnost Excite odmítla to, co by se stalo největším vyhledávačem v historii – společností se 180 miliardami dolarů
    • Yahoo chtěl koupit Excite, ale byl odmítnut
    • V roce 1999 se společnost Excite sloučila se společností @Home Network a v roce 2001 zkrachovala

Proto-Google

  • Název:
    • AltaVista
  • Vydáno:
    • 1995
  • Použití:
    • Fulltextový index webových stránek
  • Vyvinul:
    • Louis Monier
    • Michael Burrows
  • Inovace:
    • Historie SEO se považuje za „první prohledávatelnou plnotextovou databázi na celosvětovém webu s jednoduchým rozhraním“
    • První vyhledávací stroj, který hledat:
      • snímky
      • Zvuk
      • Video
    • Vytvořeno Babel Fish, první vícejazyčné vyhledávání, které by mohlo překládat:
      • Angličtina
      • francouzština
      • Němec
      • italština
      • portugalština
      • španělština
      • ruština
  • Další informace:
    • AltaVista znamená „pohled shora“
    • V roce 1996 byl AltaVista největším webovým indexem
      • 33 GB ve velikosti
      • 30 milionů stránek z 225 000 serverů
      • Přístup byl v průměru 12 milionůkrát denně
        • To je zhruba 140krát za sekundu

Web Butler

  • Název:
    • Zeptejte se Jeevese
  • Vydáno:
    • 1997
  • Použití:
    • Index webových stránek přirozeného jazyka
  • Vyvinul:
    • Garrett Gruener
    • David Warthen
  • Inovace:
    • Vyvinutý jako vyhledávač v přirozeném jazyce
    • Lidští editoři pomáhali s některými běžnými vyhledávacími dotazy
  • Další informace:
    • Butler je odkaz na Jeeves komorníka od P.G. Wodehouse’s Jeeves-Wooster romány
    • V roce 2010 se Ask Ask Jeeves rebranding jako komunitní otázka & Odpověď

Šampión

  • Název:
    • Google
  • Vydáno
    • 1998
  • Použití:
    • Rekurzivní index webových stránek
  • Vyvinul:
    • Larry Page
    • Sergey Brin
  • Inovace:
    • PageRank vytvořil systém vážení citací, který:
      • Hodnocení webových stránek, které byly důvěryhodnější na základě síly jiných webů, které na ně odkazovaly
      • Dnes je to základ pro téměř všechny vyhledávače
  • Další informace:
    • „Stránka“ v PageRank odkazuje na Larryho stránku, nikoli na webové stránky.
    • Díky svému zaměření na zpětné odkazy byl Google původně pojmenován „BackRub“
    • První web, který prohledávač Google prohledával, byla domovská stránka Stanfordské univerzity
    • Index společnosti Google má více než 100 milionů GB
    • Lidé používají Google k provádění více než sto miliard vyhledávání každý měsíc
      • To je více než 40 000 vyhledávání za sekundu
    • Chytré karty Google:
      • Používá uživatelské rozhraní v přirozeném jazyce k:
        • Odpověz na otázku
        • Dejte doporučení
        • Provádějte akce delegováním požadavků na sadu webových služeb
      • Je inteligentní osobní asistent, přístupný:
        • V aplikaci pro mobilní vyhledávání Google
        • Ve webovém prohlížeči Google Chrome
      • Může aktivně poskytovat informace, které předpovídá, na základě vyhledávacích zvyklostí uživatele
      • Umožňuje lidem používat Chytré karty k získání správných informací ve správný čas, aniž by je museli hledat
        • Automaticky organizuje informace do jednoduchých karet, které se objeví, když je uživatelé potřebují
        • Uživatelé získají dojížďku do práce před prací, najdou oblíbená místa v okolí a získají aktuální skóre svého oblíbeného týmu

Malé motory, které by mohly

Google v současné době nemá mnoho konkurentů, ale tady jsou dva, kteří se snaží, i přes obrovské šance, o to nejlepší:

  • Duck Duck Go
    • Nároky na odstranění veškerého spamu, který Google poskytuje ve svých výsledcích
    • Má čisté rozhraní
    • Nesleduje uživatele
    • Má mnohem méně reklam než Google
  • Bing
    • Vyhledávač společnosti Microsoft
    • Poskytuje podobné výsledky jako Google
    • Má mnohem menší databázi webových stránek
    • Yahoo! používá Bing pro svůj vyhledávač

Zatímco většina lidí si myslí, že „Google“, když uslyší „vyhledávač“, před spuštěním webového prolézacího modulu Page a Brin existovalo několik různých motorů. I když dnes Veronica nebo Lycos příliš mnoho lidí nepoužívá, internet by nebyl bez nich.

Zdroje: searchenginehistory.com, sigir.org, csse.monash.edu.au, nlp.stanford.edu, seobythesea.com, groups.google.com, savetz.com, dummies.com, searchenginearchive.com, netlingo.com, searchnetworking. techtarget.com, whatis.techtarget.com, salientmarketing.com, learnthenet.com, ryanmacintyre.com, searchenginepeople.com, todayifoundout.com, thehistoryofseo.com, wiley.com, dictionary.reference.com, mashable.com, archiv. wired.com, google.com

Zdroje

  • Historie vyhledávačů: Od roku 1945 do dneška Google
  • Systém SMART – výsledky vyhledávání a plány do budoucna (PDF)
  • Inteligentní prostředí pro vyhodnocení systému vyhledávání (PDF)
  • Bodování, vážení rerm a vektorový model vesmíru
  • Relevance Feedback a Pseudo Relevance Feedback
  • Rocchioova klasifikace
  • Server internetového archivního serveru
  • Článek Kevina Savetze
  • Co je FTP?
  • Vyhledávače před webem
  • Pokles na Archie, Gopher, Veronica a Jughead
  • Co je Veronica?
  • Co je Jughead?
  • Veronica, babička vyhledávačů – 1993
  • Archie’s Pal, Jughead – 1993
  • Prohledávání databází
  • Stručná historie excite
  • 7 vyhledávačů Google odstraněno
  • Excite měl šanci koupit Google za 750 000 $, ale odmítl to
  • Krátká historie raných vyhledávačů
  • Historie vyhledávačů
  • Krátká historie raných vyhledávačů
  • Lycos – 1994
  • Alta Vista v technologii
  • Ask.com se znovu zaměřuje na komunitu Q&A
  • Narození společnosti Google
  • Jak funguje vyhledávání
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map