Пътешествието до перфектната търсачка | Инфографика

Разкриване на информация Вашата поддръжка помага за поддържането на сайта! Печелим такса за препращане за някои от услугите, които препоръчваме на тази страница.


Пътешествието до перфектната търсачка

Интересно е. Имаше време – преди около две десетилетия – когато повечето от нас не знаеха за Интернет.

Разбира се, някои от нас бяха изложени на Lycos и AltaVista, но Интернет и по-конкретно търсачки, каквито са сега? Няма начин. Ако искахме да се свържем с някого, ги потърсихме в телефонния указател. Ако искахме да изследваме историята на Византийската империя, отидохме в библиотеката. Нямаше незабавно удовлетворение от това да отидете в Google и да търсите всичко и всичко.

В наши дни търсачките са толкова навлезли в ежедневието ни, че това вече не е нещо, за което наистина мислим. Просто отваряме прозореца на браузъра (или мобилното си устройство), въвеждаме това, което търсим, и секунда по-късно имаме отговор или решение.

Единственият път, когато хората наистина обръщат внимание на тази идея за „търсачка“, е когато Google пусне нов ъпдейт на алгоритъма. Тези актуализации обикновено са знак за фирмите и търговците, че е време да актуализират уебсайта си, за да останат в добри грации на Google за целите на класирането. Следователно, спазвайки законите на търсачките, предприятията също се грижат за най-добрите интереси на своите посетители.

В края на деня това е, за което в крайна сметка се грижат търсачките: интернет потребителите. Помощ за свързването им с информацията, от която се нуждаят, и запазването им в безопасност, докато го правят.

Но това не е това, което интернет или търсачките първоначално изглеждаха – или целяха да направят –
още през 60-те години, когато всичко това започва. Ако не сте запознати с историята на търсачките, закопчайте. Ще ви отведем по дълъг и ветровит път през всички търсачки, които проправиха пътя към Google.

Не толкова SMART като Google: Пътешествието до перфектната търсачка

Не толкова SMART като Google: Пътешествието до перфектната търсачка

Почти всички с интернет връзка са използвали търсачка преди, но замисляли ли сте се как се е появила търсещата машина? Кой го е измислил? Кое беше първото? След това следвайте, защото имаме цялата история.

Предшественикът

  • Име:
    • SMART система за извличане на информация
      • SMART е съкращение за Magical Automatic Retriever of Text на Салтън
  • Издаден:
    • 1960
  • Употреба:
    • Интерактивна информационна база данни
  • Разработено от:
    • Джерард Салтън
    • Крис Бъкли
    • Други от университета Корнел
  • Иновациите:
    • Модел на векторното пространство:
      • Метод за автоматично претегляне на резултатите от търсенето за показване на най-подходящите за потребителя
    • Отзиви за уместността:
      • Начин за потребителите да класират уместността на резултатите от търсенето
    • Rocchio класификация:
      • Тип метод за класификация, който увеличава прецизността на търсенето

В началото

  • Преди появата на световната мрежа и търсачките интернет беше:
    • Колекция от файлови протоколи за прехвърляне на файлове (FTP), където потребителите могат да навигират, за да намерят конкретни споделени файлове
    • Групи за новини, където хората взаимодействаха и разпространяваха информация като често задавани въпроси.
  • Първият
    • Име:
      • Арчи
    • Издаден:
      • 1990
    • Употреба:
      • FTP архивен индекс
    • Разработено от:
      • Alan Emtage
      • Питър Дойч
      • Бил Хелън
    • Иновациите:
      • Разрешено на отдалечените потребители да преглеждат списъци на анонимни FTP сайтове, съдържащи:
        • Софтуер
        • Често задавани въпроси
        • Архив на новини
      • Периодично и автоматично актуализиран списък на наличните сървъри
    • Друга информация:
      • През септември 1990 г. Арчи състави база данни от 210 сайта
      • През 1992 г. Арчи съдържаше 2,6 милиона файла (приблизително 150 GB данни)
  • Приятели на Арчи
    • Име:
      • вероника
      • Jughead
    • Издаден:
      • 1993
    • Употреба:
      • Gopher index
    • Разработено от:
      • Фред Бари и Стивън Фостър
      • Rhett Jones
    • Иновациите:
      • И двата двигателя са разработени, за да улеснят търсенето през Gopher сървърите
      • Вероника създаде индекси на файлове с горен текст Gopher
      • Jughead може да използва булеви термини за търсене, за да прегледа един единствен сървър Gopher
    • Друга информация:
      • Въпреки че Арчи не е имал за цел да се позовава на героя на комикса, хората, които са написали последващите Вероника и Джугхед, смятат, че ще бъде ангажирано да продължат темата
      • Backronyms са създадени и за двете:
        • Вероника: „Много лесен индекс за гризачи, ориентиран към гризачите към компютърни архиви“
        • Jughead: „Универсална разкопка и показване на йерархията на Йонзи“
      • Вероника претърси 5500 сървъра Gopher и индексира над 10 милиона позиции / документи
  • Изобретение в мрежата
    • През 1989 г. Тим Бърнърс-Ли и неговият екип от CERN започват работа по HTTP:
      • Система за изпращане и получаване на документи за хипертекст, които биха се свързвали помежду си в един вид мрежа.
      • Той бе бързо допълнен, за да предостави:
        • По-големи преговори между клиент и сървър
        • Metadata
        • Сигурност
    • Включени ранни браузъри:
      • ViolaWWW
      • Erwise
      • MidasWWW
      • мозайка
    • С нарастването на броя на уеб сървърите, мрежата се превърна в интерфейс за достъп до Интернет:
      • Нови сървъри бяха обявени под „Какво ново“ на сайта на NCSA
        • Много уебсайтове предоставиха свой собствен списък с „интересни сайтове“.
      • Този централен списък не можеше да бъде в крак с растежа, което създаде необходимост от намиране и организиране на цялата информация в мрежата

Не е необходим робот

  • Име:
    • ALIWEB, което означава Archie-Like Indexing за WEB
  • Издаден:
    • Октомври 1993г
  • Формат:
    • Индекс на уебсайтове за самостоятелно влизане
  • Разработено от:
    • Мартийн Костер
  • Иновациите:
    • HTTP еквивалент на Archie
    • Не използвах робот за търсене в мрежата
      • Уеб администраторите на участващите сайтове трябваше да публикуват информация за своите индекси за всяка страница, която искат да изброят
        • Предимства:
          • Потребителите могат да опишат собствените си сайтове
          • Робот не се движеше около изяждането на мрежовата честота
        • Недостатъци:
          • Индексирането на файлове беше сложно за повечето хора
          • Трудността на използване означаваше сравнително малка база данни
  • Друга информация:
    • Те се опитаха да компенсират сложността чрез добавяне на други бази данни в ALIWEB търсения, но не можеха да се конкурират с по-новите търсачки, базирани на бот

Индексът

  • Име:
    • WebCrawler
  • Издаден:
    • 1994
  • Употреба:
    • Индексиране на уебсайт за обхождане
  • Разработено от:
    • Брайън Пинкертън
  • Иновациите:
    • Първо роботът индексира цели уеб страници, а не само имена на файлове или уебсайтове
  • Друга информация:
    • При първото си пускане WebCrawler разполага с документи от над 6000 сървъра
    • Пет месеца след излизането му, той получава средно 15 000 заявки на ден
    • WebCrawler бързо стана толкова популярен, че беше почти неизползваем през деня

Библиотеката Паяк

  • Име:
    • Lycos
  • Издаден:
    • 1994
  • Употреба:
    • Индекс на уебсайтове
  • Разработено от:
    • Майкъл Маулдин
  • Иновациите:
    • Най-голямата библиотека на индексирани сайтове по това време
  • Друга информация
    • Ликосът е кръстен на паяка вълк, Lycosidae Lycosa, защото паякът лови плячката си, а не го улавя в паяжина
    • В разгара си Ликос разполагаше с 54 000 документа
    • Той идентифицира близо 400 000 документа за един месец
    • За пет месеца Lycos беше идентифицирал 1,1 милиона документи
    • До ноември 1996 г. неговият каталог съдържаше 60 милиона документа

The Word Smiths

  • Име:
    • Вълнувайте, първоначално кръстен Архист
  • Издаден:
    • 1995
  • Употреба:
    • Индекс на уебсайтовите думи
  • Разработено от шест студфордски студенти:
    • Джо Краус
    • Бен Лъч
    • Райън Макинтайър
    • Мартин Райнфрид
    • Греъм Спенсър
    • Марк Ван Харен
  • Иновациите:
    • Направете търсенето по-уместно, като използвате идеята за разглеждане на взаимоотношенията на думи чрез статистически анализ, новаторски подход по това време
    • След старта си Excite.com беше индексирал 1,5 милиона страници, голям брой за това време
  • Друга информация:
    • Excite бяха сключили големи сделки с Netscape и Microsoft
    • Excite продължи да нараства с приходи над 150 милиона долара към 1998 г.
    • Двама студенти от Станфорд, Лари Пейдж и Сергей Брин, основани на Google, и предложиха да продадат компанията си на Excite за милион долара през 1999 г.
      • Те бяха готови да се споразумеят само за 750 000 долара
      • Excite отказа това, което ще стане най-голямата търсачка в историята – компания на стойност 180 милиарда долара
    • Yahoo искаше да купи Excite, но беше отказан
    • Excite се сляха с @Home Network през 1999 г., а те фалираха през 2001 година

Прото Google

  • Име:
    • AltaVista
  • Издаден:
    • 1995
  • Употреба:
    • Пълен текст на уебсайт индекс
  • Разработено от:
    • Луи Моние
    • Майкъл Бъроуз
  • Иновациите:
    • Смятан от Историята на SEO като „първата база данни с възможност за търсене в цял свят с прост интерфейс“
    • Първа търсачка, която да потърси:
      • Снимки
      • звуков
      • Видео
    • Създадена Babel Fish, първото многоезично търсене, което може да преведе:
      • Английски
      • Френски
      • Немски
      • Италиански
      • португалски
      • испански
      • Руски
  • Друга информация:
    • AltaVista означава „поглед отгоре“
    • През 1996 г. AltaVista е най-големият уеб индекс
      • 33GB размер
      • 30 милиона страници от 225 000 сървъра
      • Достъп до средно 12 милиона пъти на ден
        • Това е приблизително 140 пъти в секунда

Уеб Бътлър

  • Име:
    • Попитайте Jeeves
  • Издаден:
    • 1997
  • Употреба:
    • Индекс на уебсайт на естествен език
  • Разработено от:
    • Гарет Грюнер
    • Дейвид Уортън
  • Иновациите:
    • Разработен е като търсачка за естествен език
    • Човешките редактори помогнаха с някои общи заявки за търсене
  • Друга информация:
    • Икономът е препратка към Jeeves the valet от P.G. Романите на Джейвс-Уустър на Wodehouse
    • През 2010 г. Ask Jeeves се самоопредели като въпрос на Общността & Служба за отговори

Шампионът

  • Име:
    • Google
  • освободен
    • 1998
  • Употреба:
    • Рекурсивен индекс на уебсайта
  • Разработено от:
    • Лари Пейдж
    • Сергей Брин
  • Иновациите:
    • PageRank създаде система за претегляне на цитати, която:
      • Оценяваме кои уебсайтове са по-надеждни въз основа на силата на други уебсайтове, които са свързани с тях
      • Днес това е основата на почти всички търсачки
  • Друга информация:
    • „Страница“ в PageRank се отнася за Лари Пейдж, а не за уеб страници.
    • Поради фокуса си върху връзки, Google първоначално беше наречен „BackRub“
    • Първият уебсайт, който търсачката на Google търси, беше началната страница на университета в Станфорд
    • Индексът на Google е с размер над 100 милиона GB
    • Хората използват Google, за да извършват над сто милиарда търсения всеки месец
      • Това е над 40 000 търсения в секунда
    • Google Now:
      • Използва потребителски интерфейс на естествен език за:
        • Отговори на въпросите
        • Дайте препоръки
        • Извършвайте действия, като делегирате заявки към набор от уеб услуги
      • Интелигентен личен асистент е достъпен:
        • В приложението за търсене за мобилни устройства Google
        • В уеб браузъра Google Chrome
      • Може активно да предоставя информация, която прогнозира, въз основа на навиците на търсене на потребителя
      • Позволява на хората да използват карти Now, за да получат правилната информация в подходящия момент, без да се налага да я търсят
        • Той автоматично организира информация в прости карти, които се появяват точно когато потребителите се нуждаят от тях
        • Потребителите получават трафик на работното място преди работа, намират популярни места наблизо, получават текущия резултат на любимия си екип

Малките двигатели, които можеха

В момента Google няма много конкуренти, но ето две, които се опитват да направят всичко възможно, въпреки огромните коефициенти:

  • Duck Duck Go
    • Претендира да премахне всички спам, които Google предоставя в своите резултати
    • Има чист интерфейс
    • Не проследява потребители
    • Има много по-малко реклами от Google
  • Bing
    • Търсачката на Microsoft
    • Предоставя подобни резултати на Google
    • Има много по-малка база данни от уеб страници
    • Yahoo! използва Bing за своята търсачка

Докато повечето хора си мислят, че „Google“, когато чуят „търсачка“, имаше няколко различни двигателя, преди уеб сканирането на Page и Brin да излети. Въпреки че днес не много хора използват Вероника или Ликос, интернет няма да бъде това, което е без тях.

Източници: searchchenginehistory.com, sigir.org, csse.monash.edu.au, nlp.stanford.edu, seobythesea.com, groups.google.com, savetz.com, dummies.com, searchchenginearchive.com, netlingo.com, searchnetworking. techtarget.com, whatis.techtarget.com, salientmarketing.com, learnnthenet.com, ryanmacintyre.com, searchchenginepeople.com, todayifoundout.com, thehistoryofseo.com, wiley.com, dictionary.reference.com, mashable.com, архив. wired.com, google.com

Източници

  • История на търсачките: От 1945 г. до Google Днес
  • Системата SMART – Резултати за извличане и бъдещи планове (PDF)
  • Интелигентната среда за оценка на системата за извличане (PDF)
  • Точкуване, претегляне на Rerm и модел на векторното пространство
  • Отзиви за релевантността и отзиви за релевантността на псевдо
  • Класификация на Рокио
  • Интернет сървър за архивен сървър
  • Статия от Кевин Савец
  • Какво е FTP?
  • Предварителни уеб търсачки
  • The Lowdown на Арчи, Гофер, Вероника и Джугхед
  • Какво е Вероника?
  • Какво е Jughead?
  • Вероника, бабата на търсачките – 1993г
  • Palchie на Archie, Jughead – 1993
  • Търсене на бази данни
  • Кратка история на Excite
  • 7 търсачки Google заличени
  • Excite имаше шанс да купя Google за $ 750 000, но го отказа
  • Кратка история на ранните търсачки
  • История на търсачките
  • Кратка история на ранните търсачки
  • Lycos – 1994
  • Alta Vista в технологиите
  • Попитайте.com се възстановява отново с фокус върху общността Q&А
  • Раждането на Google
  • Как работи търсенето
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map