اللّغة العربيّة والذكاء الاصطناعيّ

اللّغة العربيّة والذكاء الاصطناعيّ
Spread the love

يدفعُنا التطرُّق إلى موضوع اللّغة العربيّة والذكاء الاصطناعيّ للرجوع إلى الجذور، ولكنْ ليس في ما يخصّ اللّغة، فجذورها معروفة وواضِحة، بل إلى جذور التّداخُل بين التقنيّات المعلوماتيّة واللّغات الطّبيعيّة، بما فيها اللّغة العربيّة.

هذا التداخل بين المعلوماتيّة كعِلم والعلوم اللّغويّة أدّى إلى ظهور ما نسمّيه حاليّاً “حَوسبة اللّغة” أو “اللّسانيّات الحاسوبيّة”، وهي من أولى العلوم الجديدة المُنبثِقة عن هذا التداخُل البَيْنيّ الذي كان أساس بروز مفهوم الذكاء الاصطناعيّ، وهو مفهوم بدأ مع العمل على بناء برمجيّات للترجمة الآليّة من اللّغة الروسيّة إلى الإنكليزيّة.

إنّ حَوسبة اللّغة هي مجموعة من التطبيقات التي تَستخدم خوارزميّات الذكاء الاصطناعيّ في حلِّ المَسائل اللّغويّة. فالتطبيقات التي ترتكز على خوارزميّات الذكاء الاصطناعي (التعلُّم الآليّ والتعلّم المعمّق) تهدف إلى جعْل ما هو مُضمَر في النصّ واضحاً للآلة، أي لا لبس فيه، وذلك من خلال بناء برمجيّات “تتعلّم” من التجارب السابقة، بحسب المدوّنات التي ترتكز عليها خلال مرحلة التعلّم الآلي؛ فاللّبس اللّغوي والغموض وعدم التحديد المعنوي هي ظواهر أساسيّة في اللّغة، ولولاها لما كان باستطاعتنا القيام بعمليّة التواصل المتشعّبة والمُتباينة والمُتناقضة، ولَوقعْنا في معضلةِ محدوديّة التعبير.

المُفارَقة تكمن في أنّ برمجيّات الحاسوب التي ترتكز على خوارزميّات الذكاء الاصطناعي أو غيرها من الخوارزميّات، لا يمكن أن تتعامل مع ما هو مُلتبِس؛ ذلك أنّ طبيعة البرمجيّات الحاسوبيّة قائمة على عمليّات حسابيّة تتعامل مع مُعطيات قابلة للحساب. من هنا يُطرح السؤال: هل اللّغة قابلة للحساب؟ بمعنى آخر، هل الفكر هو عمليّة حسابيّة، لكونه يتمثّل بالرموز اللّغويّة!

طبعا، إنّ ما ينطبق على اللّغات الطبيعيّة ينطبق على اللّغة العربيّة، ولكنْ بحسب البنية الصرفيّة والنحويّة والدلاليّة لكلٍّ منها. وإذا كانت العمليّة اللّغويّة عمليّة ذهنيّة تُسمّى “ذكاء”، فإنّ مَكْنَنة هذه العمليّة تُسمّى ذكاءً اصطناعيّاً، أي مُحاكاة الذكاء البشري. هذا من الناحية التعبيريّة اللّغويّة. فالدماغ البشري مسؤول عن كلّ الأمور المتعلّقة بالعمليّة الفكريّة، كما أنّه مسؤول عن كلّ الحركات التي يقوم بها الإنسان، كتحريك اليدَين والأكل والشرب والهَضْم. وإذا كانت بعض العمليّات متكرّرة، كالمشي والصعود والنزول وفكّ بعض قطع السيارات وتركيبها… ومن المُمكن أن تصبح مُمكننة، فماذا عن اللّغة؟ هذا هو السؤال الفعلي الذي من المُفترض بالذكاء الاصطناعي الإجابة عنه، والذي نطمح إلى أن نصل إلى حلٍّ فعليٍّ له مُستقبلاً!

إنَّ اللّغة المتمثّلة بالخطاب والنصّ، ليست عمليّة متكرّرة، واستخدام الكلمات نفسها لا يجري بالطريقة نفسها خلال التعبير الشفهي والكتابي، أي أنّنا لا نستخدمها بالمعنى نفسه في لحظات وسياقات مُختلفة، ما يدفعنا إلى البحث عن أدوات ترفع اللّبس اللّغوي، فهل هذا مُمكن؟ هل الآلة تفكِّر؟ لا، الآلة لا تفكّر كما يفكّر العقل البشري، بل تنفِّذ مجموعة من العمليّات الحسابيّة التي تتناسب مع التركيبة الفيزيائيّة للحواسيب المبنيَّة على تبادُل شحنات كهربائيّة بين الخلايا الصناعيّة داخل الحواسيب.

ولعلّ أبرز تحدّيات التعرُّف الآليّ إلى الكلمات هي ظاهرة الإدماج. على سبيل المثال، في كلمة “فهم”، هل “الفاء” هي جزء من الكلمة أو أنّها “فاء” العطف؟ هذا أوّلاً. ثانياً، إنَّ التشكيل يعدّ أيضاً جزءاً من الصّعوبات في التعرُّف إلى الكلمة، فكلمة “فهْم” من دون تشكيل قد تُقرأ بأشكالٍ مُختلفة: فهمٌ، فهَّمَ، فَهِم! وإذا تعرَّفنا إلى الكلمات، هل سنتعرَّف إلى معانيها! ففي السياقات المُختلفة تأخذ الكلمات معاني مُختلفة، فكلمة “شوكي” في “أرضي شوكي” ليست نفسها في “النخاع الشوكي”!

طبعاً، إنَّ صعوبة التعرُّف إلى الكلمات تؤدّي إلى صعوبة التعرُّف إلى التركيب النحوي، ومن ثمّ صعوبة بناء المعنى الدلالي للجملة. هذا إذا ما كنّا نتحدَّث عن التعرّف إلى مضمون النصّ من كلماتٍ وجُمل، ولكنْ تبقى أمورٌ عديدة، منها السياق الخارجي للنصّ والزمان والمكان النصّي وغيرها من الظواهر التي تؤدّي دَوراً في بناء المعنى.

الفروقات ما زالت عميقة

في السنوات الأخيرة، وبعد أن باتت النصوص الرقميّة مُتاحة بشكلٍ كبير، وصار من السهل بناء مدوّنات نصيّة يُمكن العمل عليها، وباتت الحواسيب سريعة في التنقيب وتنفيذ البرمجيّات، اتَّجه بعض العاملين في مجال حَوسبة اللّغة إلى استخدام طُرقٍ جديدة ترتكز على السياق النصّي في البحث اللّساني. ترتكز هذه الآليّة على المدوّنات النصيّة التي تُستخدم كبيانات لتدريب خوارزميّات الذكاء الاصطناعي؛ فكلّما كانت النصوص كثيرة صار تعلُّم الآلة يسير بشكلٍ أفضل، وزادت نسبة الإجابات الصحيحة، مهما كانت التطبيقات التي نحن بصدد بنائها.

ومن نافل القول إنّ حَوسبة اللّغة العربيّة مجال عملٍ بحثيّ وأكاديميّ قائم بذاته في العالَم، وفي بعض الجامعات العربيّة ومَراكز الأبحاث العامّة والخاصّة. وتوجد بعض التطبيقات والبرمجيّات المُتاحة، ولكنْ، للأسف، من الصعب الوصول إليها والاعتماد عليها، لأسبابٍ تقنيّة، ولعدم تضافُر الفِرق البحثيّة في المجال في العالَم العربي.

ثمّة اليوم في العالَم الكثير من التطبيقات الحاسوبيّة التي تُعالِج اللّغة العربيّة آليّاً، وثمّة أيضاً الكثير من المَراكز البحثيّة الأكاديميّة المتخصّصة في هذا الشأن، ولكنْ ليس هناك مُنتجات فعليّة مُتاحة بسهولة. وفي المُختبرات الغربيّة أيضاً، ثمّة الكثير من العاملين في مجال حَوسبة اللّغة العربيّة، وخصوصاً بعد أحداث 11 أيلول (سبتمبر)، ويرتبط ذلك بالمُراقَبة الآليّة لكلّ ما يُكتب في العالَم العربي، ولكنّ حضور اللّغة العربيّة على الإنترنت ما زال ضعيفاً مُقارَنةً بباقي اللّغات التي يُعدّ تعداد الناطقين بها أقلّ بكثير من المتحدّثين بالعربيّة. فحضور اللّغة العربيّة على الشبكة لغاية شهر تشرين الأوّل (أكتوبر) 2019 كان يأتي في المَرتبة 17 عالَميّاً، على الرّغم من أنّ اللّغة العربيّة هي الخامسة عالَميّاً، علماً أنَّ التقنيّات تقدِّم خدمة لها، وذلك من خلال تعزيز انتشارها وأرشفتها وترجمتها، لأنّ العمل حاليّاً لا يتطلَّب إلّا العقل البشري الذي يُعَدّ رأس المال الحالي، شرط أن نتعامل معها بحِكمة!

استطراداً، من المُمكن أن تكون خورزميّات الذكاء الاصطناعي على نسبة عالية من التعقيد لكي تُساعد في حلّ المسائل المتكرّرة، وهي متّصلة بقواعد بيانات ضخمة على مستوى العالَم، ولكنّ هذه الخوارزميّات تعمل على اختيار الإجابات بحسب نسبة الاحتملات التي تعطيها الحواسيب المُتشابِكة.

حتّى الآن من الصّعب بناء “ذكاء اصطناعي” للآلات وفق مبادئ الذكاء البشري. وعندما يحصل ذلك لن يستطيع الإنسان السيطرة عليه. وتكمن صعوبة صياغة الذكاء في التمثيل الثنائي للمعلومات التي هي عبارة عن رموزٍ للتمثيل الفيزيائي للشحنات الكهربائيّة التي تعمل على تبادُل الإشارات في الحواسيب ونقلها. ففي الحواسيب، تأتي النتائج من خلال حلول مُلائِمة مسبقاً للمسائل. أمّا نقل الإشارات في الدماغ البشري فهو عمليّة معقّدة، نظراً إلى تداخُل العديد من الخصائص الفيزئيائيّة والكيميائيّة، ذلك أنّه مؤلَّف من 86 إلى 100 مليار خليّة عصبيّة، وكلّ خليّة عصبيّة متّصلة بما يقارب 100000 خليّة مُجاوِرة. وهناك ما يُقارِب 100000 مليون رابط مع الخلايا المُجاورِة، وفي كلّ واحدة منها علاقات مشفّرة تنقل الإشارات من خليّة إلى أخرى، أي يوجد ما يُقارب 100 مليار مُعالِجٍ للمعلومات تُساعد الإنسان على التواصل، كما أنّ القرارات التي يتّخذها غير محدَّدة مسبقاً… والتفكير يُصاغ على أساس وصلات جديدة ومتجدّدة باستمرار.

كذلك، إنّ ذكاء الآلات ليس سوى حساب لشحنات إلكترونيّة داخل الحاسوب، والإنسان هو مَن يعطي هذا الحساب معنى. فالفروقات بين الذكاء البشري والذكاء الاصناعي ما زالت عميقة، والذكاء الاصطناعي هو، حتّى اليوم، اصطلاحٌ دعائيّ، ذلك أنّ الحواسيب تقدِّم أجوبة وفقاً للخوارزميّات التي كَتبها الإنسان.

لحسن الحظ، إنّ الذكاء البشري ليس رقميّاً، وإلّا كنّا جميعنا مُتشابهين أو مُستنسَخين. وأرجو أن لا نصل إلى هذه الحالة التي تنتهي بها فردانيّة كلّ شخص وخصوصيّته، وتنتهي بالتالي هويّتنا. إنّ الخوف من التقنيّات لا يكمن في محاولة بناء برمجيّات تُحاكي الذكاء البشري، بل تقريب الإنسان وترويضه ليُصبح كالآلة!

Optimized by Optimole