ما هو البرمجة اللغوية العصبية؟ شرح معالجة اللغة الطبيعية
تُعد معالجة اللغة الطبيعية فرعًا من فروع الذكاء الاصطناعي يمكّن أجهزة الكمبيوتر من فهم اللغة ومعالجتها وتوليدها تمامًا كما يفعل الأشخاص – ويتزايد استخدامها في الأعمال بسرعة.
تعريف معالجة اللغة الطبيعية
معالجة اللغة الطبيعية (NLP) هي فرع من فروع الذكاء الاصطناعي (AI) الذي يتعامل مع تدريب أجهزة الكمبيوتر على فهم اللغة ومعالجتها وتوليدها. يتم تشغيل محركات البحث وخدمات الترجمة الآلية والمساعدين الصوتيين من خلال التكنولوجيا.
في حين أن المصطلح يشير في الأصل إلى قدرة النظام على القراءة ، فقد أصبح منذ ذلك الحين لغة عامية لجميع اللغويات الحسابية. تشمل الفئات الفرعية توليد اللغة الطبيعية (NLG) – قدرة الكمبيوتر على إنشاء اتصال خاص به – وفهم اللغة الطبيعية (NLU) – القدرة على فهم اللغة العامية ، واللفظ الخاطئ ، والأخطاء الإملائية ، والمتغيرات الأخرى في اللغة.
أحدث إدخال نماذج المحولات في بحث عام 2017 بعنوان “الاهتمام هو كل ما تحتاجه” من قبل باحثي Google ثورة في البرمجة اللغوية العصبية ، مما أدى إلى إنشاء نماذج الذكاء الاصطناعي التوليدية مثل تمثيلات التشفير ثنائية الاتجاه من المحول (BERT) و DistilBERT اللاحقة – أصغر وأسرع و أكثر كفاءة BERT – Generative Generated Transformer (GPT) ، و Google Bard.
كيف تعمل معالجة اللغة الطبيعية
تستفيد البرمجة اللغوية العصبية من خوارزميات التعلم الآلي (ML) المدربة على بيانات غير منظمة ، عادةً ما تكون نصية ، لتحليل كيفية هيكلة عناصر اللغة البشرية معًا لنقل المعنى. يتم إدخال العبارات والجمل وكتب كاملة في بعض الأحيان في محركات تعلم الآلة حيث تتم معالجتها باستخدام القواعد النحوية والعادات اللغوية الواقعية للناس وما شابه ذلك. تستخدم خوارزمية البرمجة اللغوية العصبية هذه البيانات للعثور على الأنماط واستقراء ما سيأتي بعد ذلك. على سبيل المثال ، ستتعلم خوارزمية الترجمة التي تدرك أنه في الفرنسية ، “سأذهب إلى الحديقة” هي “Je vais au parc” أن تتنبأ بأن “سأذهب إلى المتجر” تبدأ أيضًا بـ “Je vais au . ” كل ما تحتاجه الخوارزمية بعد ذلك هو كلمة “مخزن” لإكمال مهمة الترجمة.
تطبيقات البرمجة اللغوية العصبية
الترجمة الآلية هي أحد تطبيقات البرمجة اللغوية العصبية القوية ، ولكن البحث هو الأكثر استخدامًا. في كل مرة تبحث فيها عن شيء ما في Google أو Bing ، فإنك تساعد في تدريب النظام. عند النقر فوق نتيجة بحث ، يفسرها النظام على أنها تأكيد على أن النتائج التي تم العثور عليها صحيحة ويستخدم هذه المعلومات لتحسين نتائج البحث في المستقبل.
تعمل روبوتات المحادثة بنفس الطريقة. تتكامل مع Slack و Microsoft Messenger وبرامج الدردشة الأخرى حيث تقرأ اللغة التي تستخدمها ، ثم يتم تشغيلها عند كتابة عبارة مشغلة. يعمل المساعدون الصوتيون مثل Siri و Alexa أيضًا عندما يسمعون عبارات مثل “مرحبًا ، أليكسا”. لهذا يقول النقاد أن هذه البرامج تستمع دائمًا ؛ إذا لم يكونوا كذلك ، فلن يعرفوا أبدًا متى تحتاجهم. ما لم تقم بتشغيل أحد التطبيقات يدويًا ، يجب أن تعمل برامج البرمجة اللغوية العصبية في الخلفية ، في انتظار هذه العبارة.
تأخذ نماذج Transformer تطبيقات مثل ترجمة اللغة وروبوتات المحادثة إلى مستوى جديد. تتيح الابتكارات مثل آلية الانتباه الذاتي والاهتمام متعدد الرؤوس لهذه النماذج تقييم أهمية الأجزاء المختلفة من المدخلات بشكل أفضل ، ومعالجة تلك الأجزاء بالتوازي بدلاً من التسلسل.
يلاحظ Rajeswaran V ، كبير المديرين في Capgemini ، أن نموذج GPT-3 الخاص بـ Open AI قد أتقن اللغة دون استخدام أي بيانات مصنفة. من خلال الاعتماد على علم التشكل – دراسة الكلمات ، وكيفية تكوينها ، وعلاقتها بالكلمات الأخرى في نفس اللغة – يمكن لـ GPT-3 أداء ترجمة اللغة بشكل أفضل بكثير من النماذج الحديثة الحالية ، كما يقول.
تعد أنظمة البرمجة اللغوية العصبية التي تعتمد على نماذج المحولات قوية بشكل خاص في NLG.
أمثلة على معالجة اللغة الطبيعية
تأتي البيانات بأشكال عديدة ، لكن أكبر مجموعة بيانات غير مستغلة تتكون من نص – ونص غير منظم على وجه الخصوص. براءات الاختراع ، ومواصفات المنتج ، والمنشورات الأكاديمية ، وأبحاث السوق ، والأخبار ، ناهيك عن مواجز الوسائط الاجتماعية ، تحتوي جميعها على نص كمكون أساسي ويتزايد حجم النص باستمرار. قم بتطبيق التكنولوجيا على الصوت وسيصبح المسبح أكبر. فيما يلي ثلاثة أمثلة لكيفية استخدام المؤسسات للتكنولوجيا:
- يقود Edmunds حركة المرور باستخدام GPT: أنشأ المورد عبر الإنترنت لمخزون السيارات والمعلومات مكوّنًا إضافيًا ChatGPT يعرض بياناته غير المهيكلة – مراجعات المركبات ، والتصنيفات ، والافتتاحيات – إلى الذكاء الاصطناعي التوليدي. يمكّن المكون الإضافي ChatGPT من الإجابة على أسئلة المستخدم حول المركبات بمحتواها المتخصص ، مما يؤدي إلى توجيه حركة المرور إلى موقعه على الويب.
- إيلي ليلي يتغلب على أزمة الترجمة: مع وجود فرق عالمية تعمل في مجموعة متنوعة من اللغات ، طورت شركة الأدوية Lilly Translate ، وهو حل NLP محلي ، للمساعدة في ترجمة كل شيء من مواد التدريب الداخلية والاتصالات الرسمية والتقنية إلى الوكالات التنظيمية. تستخدم Lilly Translate نماذج لغة البرمجة اللغوية العصبية والتعلم العميق المدربة على علوم الحياة ومحتوى Lilly لتوفير ترجمة فورية لكل من Word و Excel و PowerPoint والنصوص للمستخدمين والأنظمة.
- تستخدم Accenture البرمجة اللغوية العصبية لتحليل العقود: تساعد أداة Accenture Legal Intelligent Contract Exploration (ALICE) الخاصة بالشركة المنظمة القانونية لشركة الخدمات العالمية المكونة من 2800 متخصص في إجراء عمليات بحث نصية عبر أكثر من مليون عقود ، بما في ذلك البحث عن بنود العقد. تستخدم ALICE “تضمين كلمة” لتصفح مستندات العقد فقرة بفقرة ، بحثًا عن كلمات رئيسية لتحديد ما إذا كانت الفقرة تتعلق بنوع بند معين من بنود العقد.
برامج معالجة اللغة الطبيعية
سواء كنت تقوم ببناء روبوت محادثة أو مساعد صوتي أو تطبيق نص تنبؤي أو تطبيق آخر باستخدام البرمجة اللغوية العصبية في جوهره ، فستحتاج إلى أدوات لمساعدتك على القيام بذلك. وفقًا لمراكز تقييم التكنولوجيا ، تتضمن البرامج الأكثر شيوعًا ما يلي:
- مجموعة أدوات اللغة الطبيعية (NLTK) ، إطار عمل مفتوح المصدر لبناء برامج بايثون للعمل مع بيانات اللغة البشرية. تم تطويره في قسم علوم الكمبيوتر والمعلومات في جامعة بنسلفانيا ويوفر واجهات لأكثر من 50 مجموعة وموارد معجمية ، ومجموعة من مكتبات معالجة النصوص ، ومغلفات لمكتبات معالجة اللغة الطبيعية ، ومنتدى مناقشة. يتم تقديم NLTK بموجب ترخيص Apache 2.0.
- ماليت ، حزمة مفتوحة المصدر تعتمد على جافا للغة البرمجة اللغوية العصبية الإحصائية ، وتصنيف المستندات ، والتكتل ، ونمذجة الموضوع ، واستخراج المعلومات ، وتطبيقات تعلم الآلة الأخرى للنص. تم تطويره بشكل أساسي في جامعة ماساتشوستس أمهيرست.
- SpaCy ، مكتبة مفتوحة المصدر لمعالجة اللغة الطبيعية المتقدمة مصممة بشكل صريح للاستخدام الإنتاجي بدلاً من البحث. تم ترخيص SpaCy من قبل معهد ماساتشوستس للتكنولوجيا ، وقد تم تصميمه مع وضع علوم البيانات عالية المستوى في الاعتبار ويسمح بالتنقيب في البيانات العميقة.
- فهم أمازون. لا تتطلب خدمة Amazon هذه خبرة ML. الغرض منه هو مساعدة المؤسسات في العثور على رؤى من البريد الإلكتروني ومراجعات العملاء ووسائل التواصل الاجتماعي وتذاكر الدعم والنصوص الأخرى. يستخدم تحليل المشاعر واستخراج جزء من الكلام والترميز لتحليل النية وراء الكلمات.
- ترجمة جوجل كلاود. تستخدم واجهة برمجة التطبيقات البرمجة اللغوية العصبية (NLP) لفحص نص المصدر لتحديد اللغة ثم استخدام الترجمة الآلية العصبية لترجمة النص ديناميكيًا إلى لغة أخرى. تسمح واجهة برمجة التطبيقات للمستخدمين بدمج الوظائف في برامجهم الخاصة.
دورات معالجة اللغة الطبيعية
هناك مجموعة متنوعة من الموارد المتاحة لتعلم إنشاء وصيانة تطبيقات البرمجة اللغوية العصبية ، والعديد منها مجاني. يشملوا:
- NLP – معالجة اللغة الطبيعية باستخدام Python من Udemy. تقدم هذه الدورة التدريبية مقدمة حول معالجة اللغة الطبيعية في لغة بايثون ، بناءً على الموضوعات المتقدمة مثل تحليل المشاعر وإنشاء روبوتات المحادثة. يتكون من 11.5 ساعة من الفيديو عند الطلب ومقالين وثلاثة موارد قابلة للتنزيل. تبلغ تكلفة الدورة 94.99 دولارًا أمريكيًا ، والتي تتضمن شهادة إتمام.
- علم البيانات: معالجة اللغة الطبيعية في بايثون من Udemy. تهدف هذه الدورة إلى المبتدئين في البرمجة اللغوية العصبية الذين هم على دراية ببايثون ، وتتضمن هذه الدورة بناء عدد من تطبيقات ونماذج البرمجة اللغوية العصبية ، بما في ذلك خوارزمية فك التشفير ، وكاشف البريد العشوائي ، ونموذج تحليل المشاعر ، وأداة تدوير المقالة. تتكون الدورة من 12 ساعة من الفيديو عند الطلب وتكلفتها 99.99 دولارًا ، والتي تتضمن شهادة إتمام.
- تخصص معالجة اللغة الطبيعية من كورسيرا. تهدف هذه المجموعة ذات المستوى المتوسط من أربع دورات إلى إعداد الطلاب لتصميم تطبيقات البرمجة اللغوية العصبية مثل تحليل المشاعر والترجمة وتلخيص النص وروبوتات المحادثة. يتضمن شهادة مهنية.
- التدريب العملي على معالجة اللغة الطبيعية (NLP) باستخدام Python من Udemy. هذه الدورة مخصصة للأفراد ذوي الخبرة الأساسية في البرمجة في أي لغة ، وفهم مفاهيم البرمجة الموجهة للكائنات ، ومعرفة الرياضيات الأساسية إلى المتوسطة ، ومعرفة عمليات المصفوفة. إنه قائم تمامًا على المشروع ويتضمن إنشاء مصنف نصي للتنبؤ بمشاعر التغريدات في الوقت الفعلي ، وملخص للمقالات يمكنه جلب المقالات والعثور على الملخص. تتكون الدورة من 10.5 ساعة من الفيديو حسب الطلب وثماني مقالات ، وتكلفتها 19.99 دولارًا ، والتي تتضمن شهادة إتمام.
- معالجة اللغة الطبيعية في TensorFlow بواسطة Coursera. تعد هذه الدورة التدريبية جزءًا من تخصص ممارسة TensorFlow في Coursera ، وتغطي استخدام TensorFlow لبناء أنظمة معالجة لغة طبيعية يمكنها معالجة النصوص وجمل الإدخال في شبكة عصبية. تقول كورسيرا إنها دورة متوسطة المستوى وتقدر أنها ستستغرق أربعة أسابيع من الدراسة بمعدل أربع إلى خمس ساعات في الأسبوع لإكمالها.