الشروع في العمل مع GATE (العمارة العامة لهندسة النصوص)

إفشاء: يساعدك دعمك في الحفاظ على تشغيل الموقع! نحصل على رسوم إحالة لبعض الخدمات التي نوصي بها في هذه الصفحة.


العمارة العامة لهندسة النصوص (GATE) هي مجموعة من الأدوات المكتوبة بلغة جافا ، وتستخدم لمعالجة اللغة البشرية وتحليلها واستخراج المعلومات. GATE مفتوح المصدر ومجاني ، تم إصداره بموجب رخصة جنو العمومية الصغرى (LGPL).

يتم استخدام GATE في العديد من مهام وتطبيقات معالجة اللغات المختلفة ، مثل: استخراج الويب ، واستخراج المعلومات ، والتوظيف ، ودعم القرار ، وما إلى ذلك.

تاريخ موجز للبوابة

تم تطوير GATE في الأصل في جامعة شيفيلد ، إنجلترا ، وتم إصداره مبدئيًا في عام 1995. استمر تطوير GATE منذ الإصدار الأولي ، ولا يزال مستمرًا ، مع أحدث إصدار مستقر من GATE هو الإصدار 8.1 ، بتاريخ 2 يونيو 2015.

يتم تنفيذ أعمال التطوير الأساسية من قبل فريق بحث GATE ، بدعم من العديد من المساهمين في المجتمع.

ميزات البوابة

تدعم GATE حاليًا تحليل اللغات التالية: الإنجليزية ، الإسبانية ، الصينية ، العربية ، البلغارية ، الفرنسية ، الألمانية ، الهندية ، الإيطالية ، السيبيونو ، الرومانية ، والروسية.

يمكن لـ GATE قبول إدخال النص من تنسيقات مختلفة ، مثل TXT و HTML و XML و Doc و PDF. قواعد البيانات المدعومة هي Java Serial و PostgreSQL و Lucene و Oracle.

علاوة على ذلك ، تتفاعل GATE معهم باستخدام واجهة برمجة تطبيقات Java Database Connectivity (JDBC).

بعد سنوات من التطوير ، أصبحت GATE الآن حلًا ثابتًا وناضجًا لمعالجة اللغات البشرية يتضمن عميل سطح مكتب للمطورين ، وتطبيق ويب يستند إلى سير العمل ، ومكتبة جافا ، وبنية ، وعملية مصقولة.

مطور جيت

مطور GATE هو بيئة تطوير متكاملة (IDE) توفر واجهة مستخدم رسومية (GUI) لإنشاء مكونات برامج معالجة اللغة البشرية.

يأتي مطور GATE مزودًا بمجموعة مكونة لاستخراج المعلومات (IE) تسمى نظام استخراج المعلومات الجديد تمامًا (ANNIE).

ANNIE عبارة عن مجموعة من مكونات استخلاص المعلومات ، تتكون من رمز مميز ، ومعجم جغرافي ، ومقسّم جملة ، وجزء من مُوسم الكلام ، ومحول طاقة كيانات مسماة ، ومُعلِّم ثقة.

GATE Teamware

GATE Teamware عبارة عن منصة إدارة قائمة على الويب للتعليق التوضيحي واللغة التعاونية.

باستخدام GATE Teamware ، يمكنك استخدام القوى العاملة الموزعة لمعالجة اللغة ، باستخدام واجهة الويب الخاصة بها لعرض التعليقات النصية وإضافتها وتحريرها. تُستخدم الإدارة المستندة إلى الويب أيضًا لإعداد المشروع وتتبعه وإدارته.

إذا كنت مهتمًا بتشغيل GATE Teamware ، فإن أسهل طريقة للحصول عليه هي شراء خادم ظاهري مُهيأ مسبقًا وجاهز لتشغيل GATE Teamware الظاهري من GATE Cloud. GATE Teamware مفتوح المصدر ، مع رمزه المستضاف على SourceForge.

مضمن GATE

GATE Embedded هي مكتبة فئة معالجة اللغات في GATE ، والتي يتم تنفيذها في جافا. وهو عبارة عن إطار عمل كائني التوجه يستخدم في جميع أنظمة GATE ، ويشكل العناصر الأساسية لمطور البوابة.

يتيح لك GATE Embedded إضافة وظائف معالجة اللغة إلى تطبيقاتك الخاصة. هذه أداة مفيدة للغاية للمبرمجين وهي متوفرة كمجموعة من أرشيفات جافا (JARs).

باستخدام GATE

GATE هي واحدة من أدوات معالجة اللغة البشرية الأكثر شعبية. تحتوي GATE أيضًا على أكبر مجتمع من المستخدمين من بين جميع حلول البرامج المماثلة. جعل استخدامه على نطاق واسع وتاريخ التطوير الطويل GATE حلاً مستقرًا وفعالًا وشاملًا لمعالجة اللغات.

تستخدم GATE في العلوم للتجارب المتعلقة بحساب اللغة ، حيث توفر إمكانية تكرار التجارب والتقييم الكمي والقياس والتعاون.

في التعليم ، غالبًا ما تستخدم GATE في الأمثلة والتمارين في دورات هندسة اللغة الطبيعية.

تتضمن الاستخدامات التجارية لـ GATE استخدامه كأداة لتحليل ملاحظات العملاء ، واستخدام GATE للتعليق على المستندات العلمية والبحث عنها في مجال البحوث الصيدلانية ، ومعالجة التسميات التوضيحية في مكتبات الصور الضخمة في وسائل الإعلام والصحافة ، وما إلى ذلك.

إذا كنت ترغب في تجربة GATE ، فهي بسيطة. ما عليك سوى تنزيل مثبت GATE وتشغيله ، واتباع إرشادات التثبيت المفصلة. GATE هو حل عبر الأنظمة الأساسية ، لذلك يمكن تشغيله على أي نظام يدعم Java.

موارد GATE

إذا كنت تعمل في مهام حسابية تتضمن معالجة لغة بشرية ، فيجب إلقاء نظرة أكثر تفصيلاً على GATE وبعض الموارد التالية:

  • صفحة GATE الرئيسية هي مكان جيد للبدء. يمكنك العثور على دليل مستخدم GATE والوثائق المفيدة الأخرى ، بالإضافة إلى دعم GATE وملفات التثبيت والعروض التوضيحية وما إلى ذلك.

  • يمكن الوصول إلى موقع GATE Public Wiki أيضًا من الصفحة الرئيسية لـ GATE ، لكننا قررنا تحديده ، نظرًا للعديد من الأمثلة والمحتوى المفيد من الدورات التدريبية الخاصة بـ GATE.

  • يحتوي موقع American National Corpus على موقع تعليمي قصير حول الاستخدام الأساسي للبوابة.

كتب GATE

الكتب التي تغطي معالجة اللغة البشرية و GATE نادرة جدًا ، ولكن الكتب المتوفرة مفيدة وشائعة. نوصي بالكتب التالية:

  • معالجة النصوص مع GATE (2011) من قبل Cunningham و Maynard و Bontcheva: يتضمن هذا الكتاب دليلاً لاستخدام GATE Developer و GATE Embedded ، وفصول حول جميع المجالات الرئيسية للوظائف ، مثل معالجة لغات متعددة ومجموعات كبيرة من النصوص غير المنظمة ، مثل فضلا عن وثائق البرنامج المساعد كاملة. ينشأ معظم محتوى الكتاب من دليل مستخدم GATE عبر الإنترنت.

  • بناء تطبيقات البحث: Lucene و Lingpipe و Gate (2008) بواسطة Manu Konchady: هذا الكتاب هو دليل عملي لبناء تطبيقات البحث باستخدام برامج مفتوحة المصدر. يعد كل من Lucene و LingPipe و Gate أدوات شائعة مفتوحة المصدر لإنشاء تطبيقات بحث قوية. يصف بناء تطبيقات البحث وظائف من GATE تتضمن استخراج الكيان ، وجزءًا من علامات الكلام ، واستخراج الجملة ، ورمز النص.

  • مقدمة في التعليق التوضيحي اللغوي وتحليلات النص (محاضرات توليفية حول تقنيات اللغة البشرية) (2009) بقلم غراهام ويلكوك: يقدم هذا الكتاب مقدمة أساسية للتعليق اللغوي وتحليلات النص. تم وصف ومقارنة بنيتي تحليل النصوص الرئيسيتين ، GATE و UIMA ، مع تمارين عملية توضح كيفية تكوينها وتخصيصها.

استنتاج

GATE هو حل شعبي وناضج. نظرًا لشعبيته ، فإنه مدعوم من قبل مجتمع كبير ونشط ، والذي يضمن أنه سيكون موجودًا لسنوات قادمة.

ومع ذلك ، فإن GATE ليس للجميع. يقتصر استخدامه على العديد من المنافذ الصغيرة نسبيًا. من ناحية أخرى ، فإن استخدامه في المنافذ المذكورة منتشر على نطاق واسع. تسمح مرونة GATE باستخدامها في عدد لا يحصى من الصناعات والمنظمات ، بدءًا من الأدوية الكبيرة إلى التعليم.

أفضل ما في الأمر ، إذا لم تكن مقتنعًا أنك بحاجة إليه ، فيمكنك تجربة GATE بدون تكلفة ، وإذا كنت ترغب في ذلك ، يمكنك نشره في المشاريع التجارية تمامًا مثل أي برنامج مفتوح المصدر ، طالما أنك تلتزم بـ LGPL المعايير.

مزيد من القراءة والموارد

لدينا المزيد من الأدلة والبرامج التعليمية والرسوم البيانية ذات الصلة بالتشفير والتطوير:

  • جافا: مقدمة ، وكيفية التعلم والموارد: إذا كنت ستستخدم GATE ، فستحتاج إلى التحقق من هذه المقدمة للغة برمجة Java.

  • سكالا برمجة مقدمة: تعلم كل شيء عن سكالا – جافا الجديدة والمحسنة.

  • موارد Prolog: تم تصميم Prolog خصيصًا للقيام بمعالجة اللغة الطبيعية.

كيفية تجنب الوقوع في الحب مع Chatbot

هل أنت مهتم بمعالجة اللغة الطبيعية؟ تعرف على كل شيء عن تاريخها ، كيفية تجنب الوقوع في الحب مع Chatbot. لقد قطعت شوطًا طويلاً.

كيفية تجنب الوقوع في الحب مع Chatbot
كيفية تجنب الوقوع في الحب مع Chatbot

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map