המסע למנוע החיפוש המושלם | אינפוגרפיק

גילוי נאות: התמיכה שלך עוזרת להפעיל את האתר! אנו מרוויחים דמי הפניה עבור חלק מהשירותים שאנו ממליצים עליהם בדף זה.


המסע למנוע החיפוש המושלם

זה מעניין. הייתה תקופה – לפני כשני עשורים – שרובנו לא ידענו על האינטרנט.

בטח, חלקנו נחשפנו לליקואים ולאלטוויסטה, אך האינטרנט ובמיוחד מנועי חיפוש כפי שהם נראים כעת? אין סיכוי. אם רצינו ליצור קשר עם מישהו, חיפשנו אותם בספר הטלפונים. אם רצינו לחקור את ההיסטוריה של האימפריה הביזנטית, הלכנו לספריה. לא הייתה שום סיפוק מיידי לגשת לגוגל ולחפש כל דבר.

בימינו, מנועי חיפוש כל כך מבושרים בחיי היומיום שלנו שזה לא משהו שאנחנו אפילו לא חושבים עליו יותר. אנו פשוט פותחים את חלון הדפדפן שלנו (או מכשיר נייד), מקלידים את מה שאנחנו מחפשים, ושנייה לאחר מכן יש לנו תשובה או פיתרון.

הפעם היחידה בה אנשים באמת שמים לב לרעיון הזה של “מנוע חיפוש” הוא כאשר גוגל משחררת עדכון אלגוריתם חדש. עדכונים אלה הם בדרך כלל סימן לעסקים ומשווקים שהגיע הזמן לעדכן את אתר האינטרנט שלהם כדי להישאר בחסד הטוב של גוגל למטרות דירוג. כתוצאה מכך, על ידי ציות לחוקים של מנועי חיפוש, עסקים מחפשים גם את טובת המבקרים שלהם.

בסופו של יום, בסופו של דבר מעניין אותם מנועי החיפוש: משתמשי אינטרנט. עזרה בחיבורם למידע הדרוש להם ושמירה עליהם על בטיחותם בזמן שהם עושים זאת.

אך לא כך נראו האינטרנט או מנועי החיפוש בתחילה – או שמטרתם לעשות –
בשנות השישים, כשהכל התחיל. אם אינך מכיר את ההיסטוריה של מנועי החיפוש, התאמץ. אנו הולכים לקחת אותך בדרך ארוכה וסוערת בכל מנועי החיפוש שסללו את הדרך לגוגל.

לא חכם כמו גוגל: המסע אל מנוע החיפוש המושלם

לא חכם כמו גוגל: המסע אל מנוע החיפוש המושלם

כמעט כל מי שיש לו חיבור לאינטרנט השתמש בעבר במנוע חיפוש, אבל האם תהית אי פעם איך נוצר מנוע החיפוש? מי המציא את זה? מה היה הראשון? ואז עקוב אחריו, כי יש לנו את כל הסיפור.

קודמו

  • שם:
    • מערכת אחזור מידע חכמה
      • SMART הוא ראשי תיבות של הרטריבר האוטומטי הקסום של Salton
  • פורסם:
    • שנות השישים
  • להשתמש:
    • מאגר מידע אינטראקטיבי
  • פותח על ידי:
    • ג’רארד סלטון
    • כריס באקלי
    • אחרים באוניברסיטת קורנל
  • חידושים:
    • מודל חלל וקטורי:
      • שיטה לשקלול תוצאות חיפוש באופן אוטומטי כדי להציג את הרלוונטיות ביותר למשתמש
    • משוב רלוונטי:
      • דרך למשתמשים לדרג את הרלוונטיות של תוצאות חיפוש
    • סיווג רוקיו:
      • סוג של שיטת סיווג המגדילה את דיוק החיפוש

בהתחלה

  • לפני כניסת האינטרנט ומנועי החיפוש, האינטרנט היה:
    • אוסף של אתרי פרוטוקול העברת קבצים (FTP) שבהם משתמשים יכולים לנווט כדי למצוא קבצים משותפים ספציפיים
    • קבוצות דיון בהן אנשים קיימו אינטראקציה והפיצו מידע כמו שאלות נפוצות.
  • הראשון
    • שם:
      • ארצ’י
    • פורסם:
      • 1990
    • להשתמש:
      • אינדקס ארכיב FTP
    • פותח על ידי:
      • אלן פטיג ‘
      • פיטר דויטש
      • ביל הילן
    • חידושים:
      • אפשר למשתמשים מרוחקים לחפש ברשימות של אתרי FTP אנונימיים המכילים:
        • תוכנה
        • שאלות נפוצות
        • ארכיוני חדשות
      • רשימת שרתים זמינים מעת לעת ומעודכנת באופן אוטומטי
    • מידע אחר:
      • בספטמבר 1990 ריכז ארצ’י מאגר של 210 אתרים
      • ארצ’י הכיל 2.6 מיליון קבצים (בערך 150 GB של נתונים) בשנת 1992
  • החברים של ארצ’י
    • שם:
      • ורוניקה
      • ג’ג’ד
    • פורסם:
      • 1993
    • להשתמש:
      • מדד גופר
    • פותח על ידי:
      • פרד בארי וסטיבן פוסטר
      • רט ג’ונס
    • חידושים:
      • שני המנועים פותחו כדי להקל על החיפוש דרך שרתי גופר
      • ורוניקה יצרה אינדקסים של קבצי טקסט רגיל של גופר
      • Jughead יכול להשתמש במונחי חיפוש בוליאניים כדי לחפש דרך שרת Gopher יחיד
    • מידע אחר:
      • למרות שארצ’י לא נועד להתייחס לדמות של קומיקס, האנשים שכתבו את ורוניקה וג’והד שלאחר מכן חשבו שזה יהיה מעניין להמשיך את הנושא.
      • נימוקים נוצרו עבור שניהם:
        • ורוניקה: “מדד רשת מכרסם מכרסם מאוד קל לארכיונים ממוחשבים”
        • ג’והד: “חפירה ותצוגה של היררכיה אוניברסלית של גונזי של ג’ונזי”
      • ורוניקה חיפשה ב- 5,500 שרתי גופר ואינדקסה למעלה מ- 10 מיליון פריטים / מסמכים
  • המצאת האינטרנט
    • בשנת 1989, טים ברנרס-לי וצוותו ב- CERN החלו לעבוד על HTTP:
      • מערכת לשליחה וקבלה של מסמכי היפרטקסט שיקשרו זה לזה במעין רשת.
      • זה הוגדל במהירות לספק:
        • משא ומתן גדול יותר על שרת לקוחות
        • מטא נתונים
        • אבטחה
    • דפדפנים מוקדמים כללו:
      • ויולה
      • שגוי
      • MidasWWW
      • פסיפס
    • ככל שגדל מספר שרתי האינטרנט, האינטרנט הפך לממשק לגישה לאינטרנט:
      • שרתים חדשים הוכרזו תחת “מה חדש” באתר NCSA
        • אתרים רבים סיפקו רשימה משלהם של “אתרים מעניינים.”
      • רשימה מרכזית זו לא הצליחה לעמוד בקצב הצמיחה, מה שיצר צורך למצוא ולארגן את כל המידע באינטרנט

אין רובוט נחוץ

  • שם:
    • ALIWEB, העומדת על אינדקס דמויי ארצ’י עבור ה- WEB
  • פורסם:
    • אוקטובר 1993
  • פורמט:
    • אינדקס אתר כניסה עצמית
  • פותח על ידי:
    • מרטין קוסטר
  • חידושים:
    • מקבילה HTTP של ארצ’י
    • לא השתמש ברובוט לחיפוש באינטרנט
      • מנהלי אתרים של אתרים שמשתתפים נאלצו לפרסם מידע אינדקס משלהם עבור כל עמוד שהם רוצים לרשום
        • יתרונות:
          • משתמשים יכולים לתאר את האתרים שלהם
          • הרובוט לא התרוצץ באכילת רוחב הפס נטו
        • חסרונות:
          • אינדקס קבצים היה מסובך עבור רוב האנשים
          • הקושי בשימוש פירושו בסיס נתונים קטן יחסית
  • מידע אחר:
    • הם ניסו לקזז את המורכבות על ידי הוספת מאגרי נתונים אחרים לחיפושים ב- ALIWEB, אך זה לא יכול היה להתחרות במנועי החיפוש החדשים-מבוססי-בוט.

המדד

  • שם:
    • WebCrawler
  • פורסם:
    • 1994
  • להשתמש:
    • אינדקס סריקה של אתרים
  • פותח על ידי:
    • בריאן פינקרטון
  • חידושים:
    • הסורק הראשון לאינדקס של דפי אינטרנט שלמים, ולא רק שמות קבצים או אתרים
  • מידע אחר:
    • עם פרסום ה- WebCrawler היו לראשונה מסמכים של מעל 6,000 שרתים
    • חמישה חודשים לאחר שחרורה היא קיבלה 15,000 שאילתות בממוצע ליום
    • WebCrawler הפך במהירות כל כך פופולרי שהוא כמעט בלתי שמיש במהלך היום

עכביש הספרייה

  • שם:
    • לייקוס
  • פורסם:
    • 1994
  • להשתמש:
    • אינדקס אתר
  • פותח על ידי:
    • מיכאל מולדין
  • חידושים:
    • הספרייה הגדולה ביותר של אתרים באינדקס באותה תקופה
  • מידע אחר
    • לייקוס נקרא על שמו של עכביש הזאב, Lycosidae Lycosa, מכיוון שהעכביש צוד את טרפו במקום לתפוס אותו ברשת
    • ליקוס היו ברשות הציבור 54,000 מסמכים זמינים
    • היא זיהתה כמעט 400,000 מסמכים בחודש אחד
    • בתוך חמישה חודשים זיהו לייקוס 1.1 מיליון מסמכים
    • בנובמבר 1996, הקטלוג שלה הכיל 60 מיליון מסמכים

המלים סמית ‘

  • שם:
    • Excite, ששמו במקור Architext
  • פורסם:
    • 1995
  • להשתמש:
    • אינדקס מילות אתר
  • פותח על ידי שישה סטודנטים מסטנפורד:
    • ג’ו קראוס
    • בן לץ ‘
    • ראיין מקינטייר
    • מרטין ריינפריד
    • גרהם ספנסר
    • מארק ואן הרן
  • חידושים:
    • הפך את החיפוש לרלוונטי יותר על ידי שימוש ברעיון של התבוננות ביחסי מילים באמצעות ניתוח סטטיסטי, גישה פורצת דרך באותה תקופה
    • עם ההשקה, Excite.com צירף לאינדקס 1.5 מיליון עמודים, מספר גדול באותה תקופה
  • מידע אחר:
    • Excite חתמה על עסקאות גדולות עם נטסקייפ ומיקרוסופט
    • Excite המשיכה לצמוח עם הכנסות של יותר מ -150 מיליון דולר החל משנת 1998
    • שני סטודנטים לסטנפורד, לארי פייג ‘וסרגיי ברין, הקים את גוגל, והציעו למכור את החברה שלהם ל- Excite תמורת מיליון דולר בשנת 1999.
      • הם היו מוכנים להסתפק ב -750 אלף דולר בלבד
      • Excite דחה את מה שיהפוך למנוע החיפוש הגדול ביותר בהיסטוריה – חברת 180 מיליארד דולר
    • יאהו רצתה לקנות את Excite, אך נדחתה
    • Excite התמזגה עם רשת @Home בשנת 1999, והם פשטו את הרגל בשנת 2001

הפרוטו-גוגל

  • שם:
    • AltaVista
  • פורסם:
    • 1995
  • להשתמש:
    • אינדקס אתר טקסט מלא
  • פותח על ידי:
    • לואי מונייר
    • מייקל בורס
  • חידושים:
    • ההיסטוריה של SEO נחשבת כ”מסד הנתונים הראשון לטקסט מלא שניתן לחפש באינטרנט ברחבי העולם עם ממשק פשוט “
    • מנוע חיפוש ראשון לחיפוש:
      • תמונות
      • שמע
      • וידאו
    • יצר את Babel Fish, החיפוש הרב-לשוני הראשון, שיכול לתרגם:
      • אנגלית
      • צרפתית
      • גרמנית
      • איטלקית
      • פורטוגזית
      • ספרדית
      • רוסית
  • מידע אחר:
    • פירוש AltaVista “מבט מלמעלה”
    • בשנת 1996 AltaVista היה אינדקס האינטרנט הגדול ביותר
      • גודל 33GB
      • 30 מיליון עמודים מתוך 225,000 שרתים
      • ניגש בממוצע 12 מיליון פעמים ביום
        • זה בערך 140 פעמים בשנייה

באטלר האינטרנט

  • שם:
    • תשאל את ג’יבס
  • פורסם:
    • 1997
  • להשתמש:
    • אינדקס אתרים בשפה טבעית
  • פותח על ידי:
    • גארט גרונר
    • דייוויד וורטן
  • חידושים:
    • פותח להיות מנוע חיפוש בשפה טבעית
    • עורכים אנושיים סייעו בכמה שאילתות חיפוש נפוצות
  • מידע אחר:
    • באטלר הוא התייחסות לג’יבס הצוות מ P.G. רומני Jeeves-Wooster של Wodehouse
    • ב- 2010, שאל ג’יבס מיתג את עצמו מחדש כשאלת קהילה & שירות מענה

האלוף

  • שם:
    • גוגל
  • שוחרר
    • 1998
  • להשתמש:
    • אינדקס אתר רקורסיבי
  • פותח על ידי:
    • לארי פייג ‘
    • סרגיי ברין
  • חידושים:
    • PageRank יצרה מערכת שקלול ציטוטים ש:
      • הערכה אילו אתרים היו אמינים יותר בהתבסס על חוזק אתרים אחרים שקושרו אליהם
      • כיום זהו הבסיס כמעט לכל מנועי החיפוש
  • מידע אחר:
    • “עמוד” ב- PageRank מתייחס לארי פייג ‘ולא לדפי אינטרנט.
    • בשל ההתמקדות בקישורים נכנסים, גוגל נקראה במקור “BackRub”
    • האתר הראשון שחיפש הסורק של גוגל היה עמוד הבית של אוניברסיטת סטנפורד
    • האינדקס של גוגל גדול ממאה מיליון GB
    • אנשים משתמשים בגוגל כדי לבצע יותר ממאה מיליארד חיפושים מדי חודש
      • זה מעל 40,000 חיפושים בשנייה
    • Google Now:
      • משתמש בממשק משתמש בשפה טבעית ל:
        • תענה על שאלות
        • תעשו המלצות
        • בצע פעולות על ידי האצלת בקשות לסט של שירותי אינטרנט
      • הוא עוזר אישי אינטליגנטי, נגיש:
        • בתוך אפליקציית החיפוש הנייד של גוגל
        • בדפדפן האינטרנט של Google Chrome
      • יכול לספק באופן יזום מידע שהוא צופה בהתבסס על הרגלי החיפוש של המשתמש
      • מאפשר לאנשים להשתמש בכרטיסי Now כדי לקבל את המידע הנכון בזמן הנכון מבלי שהם צריכים לחפש אותו
        • הוא מארגן מידע באופן אוטומטי לכרטיסים פשוטים המופיעים בדיוק כאשר משתמשים זקוקים להם
        • משתמשים זוכים לתעבורת נסיעות לפני העבודה, מוצאים מקומות פופולריים בקרבת מקום, מקבלים את הציון הנוכחי של הצוות המועדף עליהם

המנועים הקטנים שיכולים

לגוגל אין כיום הרבה מתחרים, אבל הנה שניים שמנסים כמיטב יכולתם, למרות הסיכויים העצומים:

  • ברווז ברווז גו
    • טוענת להסרת כל הספאם שגוגל מספקת בתוצאותיה
    • בעל ממשק נקי
    • לא עוקב אחר משתמשים
    • יש הרבה פחות מודעות מגוגל
  • בינג
    • מנוע החיפוש של מיקרוסופט
    • מספק תוצאות דומות ל- Google
    • יש מסד נתונים קטן בהרבה של דפי אינטרנט
    • יאהו משתמש בבינג במנוע החיפוש שלה

בעוד שרוב האנשים חושבים על “גוגל” כשהם שומעים “מנוע חיפוש”, היו כמה מנועים שונים לפני שהסורק של עמוד וסר האינטרנט של ברין המריא. אמנם לא רבים משתמשים כיום בורוניקה או לייקוס, האינטרנט לא יהיה מה שהוא בלעדיהם.

מקורות: searchenginehistory.com, sigir.org, csse.monash.edu.au, nlp.stanford.edu, seobythesea.com, groups.google.com, savetz.com, dummies.com, searchenginearchive.com, netlingo.com, searchnetworking. techtarget.com, whatis.techtarget.com, salientmarketing.com, learningthenet.com, ryanmacintyre.com, searchenginepeople.com, todayifoundout.com, thehistoryofseo.com, wiley.com, dictionary.reference.com, mashable.com, ארכיון. wired.com, google.com

מקורות

  • היסטוריה של מנועי חיפוש: משנת 1945 ל- Google Today
  • מערכת SMART – תוצאות אחזור ותוכניות עתידיות (PDF)
  • הסביבה החכמה להערכת מערכות אחזור (PDF)
  • ניקוד, שקלול Rerm ודגם החלל הווקטורי
  • משוב רלוונטי ומשוב לזכר בדוי
  • סיווג רוקיו
  • שרת ארכיון אינטרנט
  • מאמר מאת קווין סבץ
  • מה זה FTP?
  • מנועי חיפוש מקדימים ברשת
  • השפל על ארצ’י, גופר, ורוניקה וג’והד
  • מה זה ורוניקה?
  • מה זה ג’ג’ד?
  • ורוניקה, סבתם של מנועי חיפוש – 1993
  • ארצ’י פאל, ג’והד – 1993
  • חיפוש בבסיסי נתונים
  • היסטוריה קצרה של ריגוש
  • 7 מנועי חיפוש שגוגל מחוסל
  • ל- Excite היה סיכוי לקנות את גוגל במחיר של 750 אלף דולר, אך דחה אותה
  • היסטוריה קצרה של מנועי חיפוש מוקדמים
  • היסטוריה של מנועי חיפוש
  • היסטוריה קצרה של מנועי חיפוש מוקדמים
  • לייקוס – 1994
  • אלטה ויסטה בטכנולוגיה
  • Ask.com מחזק את עצמו תוך התמקדות בשאלת הקהילה&א
  • לידתו של גוגל
  • איך עובד עובד
Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map