SNOBOL: למדו על שפת עיבוד טקסטים זו משנות ה -60

גילוי נאות: התמיכה שלך עוזרת להפעיל את האתר! אנו מרוויחים דמי הפניה עבור חלק מהשירותים שאנו ממליצים עליהם בדף זה.


SNOBOL – שפה מונחית ושילוב סימבולית – היא משפחה של שפות תכנות שפותחו במקור באמצע שנות השישים, בעיקר לצורך עיבוד טקסטים וניתוח מחרוזות.

הערה מהירה על גרסאות ויישומים

המהדורה היציבה האחרונה של SNOBOL על ידי המפתחים המקוריים הייתה SNOBOL4, בשנת 1967. תוכלו לראות שספרים וגם אתרים משתמשים בשני “SNOBOL” וגם “SNOBOL4” (ולפעמים גם “Snobol”). על כל דבר אחר 1967, כולם מתייחסים לאותה גרסה (סופית) של השפה.

היו גם קומץ הרחבות ויישומים. Snocone הוא מעבד מקדים לשפה המספק סוכר תחבירי לשפה, ומקלה על השימוש בו. SPITBOL הוא מהדר עבור SNOBOL; זה עניין מיוחד מכיוון שבמקור נהוג היה לחשוב ש- SNOBOL אינה ניתנת לתיאום. יש גם את שפת התכנות של כדור השלג, אשר נכתבה בהשראת ושמה SNOBOL.

בגלל הרחבות אלה ואחרות, יש אנשים שמשתמשים בביטוי “וניל SNOBOL” כאשר הם מתייחסים לקוד המיישם רק את המפרט SNOBOL4 המקורי, ולא כל תכונות נוספות..

על השפה

SNOBOL נוצר במיוחד לצורך מניפולציה של טקסט ומחרוזות. מסיבה זו יש לו תכונה ייחודית יחסית: דפוסים נחשבים לסוגי נתונים מהשורה הראשונה. זה מאפשר לתמרן את התבניות עצמן, ממש כמו כל מבנה נתונים אחר. בנוסף, ניתן להתייחס למיתרים כאל קוד ולהעריך. זה מאפשר שימוש רקורסיבי בדפוסים ועיבוד וניתוח מחרוזות מורכבים מאוד. תוכנית SNOBOL יכולה אפילו לשנות את קוד המקור שלה.

דפוסים ב- SNOBOL יכולים להיות פשוטים, כמו טפסי טקסט קצרים או מחרוזות דמויות רגקס. אבל הם יכולים גם להיות מורכבים ביותר, כמו תיאור רשמי מלא של הדקדוק של שפה. ניתן לכתוב פרשני שפות לתכנות ב- SNOBOL, כמו גם ניתוח דקדוקי שפה טבעיים, בדיקת איות ומנועי תרגום (בתיאוריה).

SNOBOL היה פופולרי מאוד באקדמיה למדעי המחשב בשנות ה -60 וה -70, והיה בשימוש נרחב במדעי הרוח עד שנות השמונים. זה נופל במידה רבה משימוש בשלב זה, לטובת תכנות ביטוי רגולרי רגיל פחות עוצמתי בשפות כמו Awk ופרל. עדיין יש קומץ מפתחי SNOBOL נאמנים, ולשפה יש פוטנציאל להיות שימושי כמו תמיד.

הדרכות מקוונות

  • מדריך Snobol4, הדרכה משנת 1985 מאת מארק אמר;
  • אמר גם כתב וניל Snobol4: מדריך הדרכה ועיון (PDF) ומאקרו SPITBOL: השפה SNOBOL4 בעלת הביצועים הגבוהים (PDF);
  • באמצעות SNOBOL / SITBOL ב- TWENEX.ORG, מדריך זה מיועד ליישום SITBOL של SNOBOL, לשימוש במערכת SDF Public Access TOPS-20 – יש כאן כמה הוראות פלטפורמה ספציפיות להפליא, אך גם הדרכה טובה בנושא SNOBOL עצמה;
  • SNOBOL4 מצגת Powerpoint, זה מספק רק את השקופיות ממצגת ב- SNOBOL – לא מבוא עצמאית מעולה, אבל שווה לחפש סקירה כללית על מושגי מפתח;
  • שימוש ב- SNOBOL ב- MTS, מדריך לשימוש בשפה במערכת המסוף הראשי של מישיגן – זה יכול להיות שימושי, יחד עם אמולטור הרקולס, אם אתה צריך לעבוד על מערכת SNOBOL מדור קודם..

כלים

  • SPITBOL, יישום מורכב של SNOBOL, זמין ב- Github;
  • SnoPy, ספריית Python המאפשרת להשתמש בדפוסי טקסט מבוססי SNOBOL;
  • מיני מתורגמן SNOBOL, כתוב ב- F #;
  • יישום מאקרו של SNOBOL4 ב- C.

למידה קהילתית ומתמשכת

  • קבוצת הדואר האלקטרוני של יאהו, למפתחי SNOBOL ואנשים העובדים בטכנולוגיית עיבוד טקסט דומה;
  • SNOBOL4.com, אתר העוסק בשפה של חברה שהוקמה על ידי מארק אמר, כותב מספר ספרים ומדריכים בנושא השפה;
  • רשימת הרשימות של SNOBOL.

ספרים על SNOBOL

  • ספרים כלליים על הלשון:
    • פריימר Snobol4, מאת ראלף גריסוולד: מבוא בסיסי לשפה, שנכתב על ידי אחד מממציאיו;
    • שפת התכנות Snobol4, מאת ראלף גריזולד: “הספר הירוק”, זהו הספר הקלאסי על השפה;
    • עיבוד מחרוזות ורשימות בסנובול 4: טכניקות ויישומים, מאת ראלף גריזוולד;
    • הקדמת המתכנת לסנובול, מאת וורד דאגלס מאורר.
  • נושאים מיוחדים בתכנות SNOBOL:
    • תכנות SNOBOL למדעי הרוח, מאת סוזן הוקי;
    • אלגוריתמים בסנובול 4, מאת ג’יימס גימפל;
    • יישום המאקרו של סנובול 4: ניתוח מקרים של פיתוח תוכנה בלתי תלוי במכונה, מאת ראלף גריזוולד.

האם עלי ללמוד SNOBOL?

SNOBOL אינה שפה פופולרית במיוחד, ואין הרבה מעסיקים שמחפשים מפתחי SNOBOL. לכן, מבחינת קידום הקריירה, עדיף שתתמקדו בשפות מבוקשות יותר.

עם זאת, אם אתה מעוניין במחשוב ממוקד טקסט (חיפוש, תרגום, עיבוד בשפה טבעית, ניתוח ספרותי), אולי תרצה לבלות קצת עם SNOBOL: במיוחד אם כבר דחפת את הגבולות של מה שניתן להשיג באמצעות קבוע ביטויים.

כלי טקסט אחרים

אם אתה מעוניין ב- SNOBOL, תרצה לבדוק כמה כלים אחרים לעיבוד וניתוח טקסט.

  • ערכת הכלים לשפה טבעית, פלטפורמת פייתון לעבודה עם נתונים בשפה אנושית;
  • Stanford CoreNLP, חבילה של כלים מבוססי Java לניתוח שפה טבעית;
  • Awk, שפת תסריטים שתוכננה במיוחד לעיבוד טקסטים;
  • פרל, שפת תסריטים נוספת, הנחשבת כביצוע ליישום הביטוי הרגיל הטוב ביותר הקיים;
  • ANTLER הוא כלי נוסף להכרת שפה, וניתן להשתמש בו לניתוח שפות טבעיות ומלאכותיות (מחשב) כאחד;
  • Apache OpenNLP, ערכת כלים ללימוד מכונות לעיבוד שפות טבעיות;
  • Apache Lucene, חבילה של כלי תוכנת חיפוש בג’אווה ובפייתון;
  • GATE, אדריכלות כללית להנדסת טקסטים, מסגרת ל”פתרון כמעט כל בעיה בעיבוד טקסטים; “
  • פרולוג, שפת תכנות לוגית שהומצאה לעיבוד שפה טבעית;
  • אייקון, שפה נוספת לעיבוד טקסטים שנוצרה על ידי ראלף גריסוולד לאחר עבודתו ב- SNOBOL.

אולי תרצה גם לקרוא טקסט אילוף: כיצד למצוא, לארגן ולנהל אותו, מאת אינגרסול, מורטון ופריס. הספר מספק סקירה נהדרת של עיבוד טקסטים, עם דוגמאות באמצעות כמה מכלי התוכנה המפורטים לעיל.

לבסוף, בדוק את TAPoR3, אתר וקהילה מקוונת המוקדשת לכלים לניתוח טקסט.

המשך קריאה ומשאבים

יש לנו מדריכים נוספים, הדרכות ואינפוגרפיות הקשורים לקידוד ופיתוח:

  • מדריך ומשאבים לפרל: זהו מדריך מצוין להתחלת העבודה עם שפת תסריטים עוצמתית זו.
  • Awk Resources: למד שפת סקריפט חזקה זו הזמינה ברוב המחשבים.
  • משאבי פרולוג: זה יתחיל עם שפת התכנות ההיגיון האייקונית הזו.

עיבוד שפה טבעית מתעורר לחיים!

המדע של עיבוד שפות טבעיות עבר דרך ארוכה מאז ימי SNOBOL. גלה את כל זה באינפוגרפיה שלנו, כיצד להימנע מהתאהבות בצ’ט-בוט. זה מכסה את ההיסטוריה הארוכה של מחשבים “חושבים” – ואף עשוי להציל אותך מלב שבור!

איזה קוד אתה צריך ללמוד?
כיצד להימנע מהתאהבות בצ’ט בוט

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map