مقابَلة مع ChatGPT - الذكاء الاصطناعي بين الإفادة والهَلْوَسة!
«أنا لستُ معصوماً عن الخطأ»، يعترف لنا برنامج الذكاء الاصطناعي ChatGPT في هذا الحوار الذي أجريناه معه، والذي نركّز فيه على أمثلة من أخطائه وهلوساته نظراً لأهمية الانتباه إليها عند استخدامه. وبالنسبة لفوائده فلا شك فيها، وقد امتلأ الفضاء الإعلامي مؤخراً بالحديث عنها. الأسئلة والأجوبة التالية هي من حوار حقيقي أجريناه مع البرنامج (بالإنكليزية ما لم نذكر خلاف ذلك) مع بعض التحرير والاختصار.
- مرحباً بك سيّد «تشات جي بي تي». هلّا أخبرتنا عن نفسك ونشأتك؟
أهلاً! يسعدني إخباركم بأنّني نموذج ذكاءٍ اصطناعيٍّ لغوي طوّرتني منظّمة OpenAI. اسمي ChatGPT من كلمة Chat المختصرة من chatbot (روبوت دردشة) بينما تشير GPT إلى «مُحوِّلٍ توليديّ مُسبَق التدريب» Generative Pre-trained Transformer. وهكذا يصف اسمي «نموذجاً لغوياً للذكاء الاصطناعي التحادُثي المستند على بنيةِ مُحوِّلٍ توليديّ مُسبَق التدريب». تأسستُ على بنية الإصدار GPT3.5 كامتداد للإصدار الثالث عام 2020. و«المحوِّل» Transformer يعني نمطاً من «شبكة عصبية» لمعالجة اللغة الطبيعية، تمّ تقديمه لأول مرة عام 2017 بورقة من تأليف Vaswani وزملائه. والشبكة العصبية نوع من خوارزميات تعليم الآلة، مُنَمذَجة على غرار بنية ووظيفة الدماغ البشري. تتألف من طبقات من العُقد المترابطة أو «العصبونات الاصطناعية» لمعالجة وتحليل بيانات معقَّدة، وتُغذّى خلال تدريبها بكمية ضخمة من البيانات فتصبح قادرة على توليد تنبّؤات ومخرجات بناءً على تلقيمها بيانات جديدة. - لماذا جودة وغنى أجوبتك بالعربية أقل غالباً ممّا في الإنكليزية؟
بوصفي نموذج لغة ذكاء اصطناعي، تم تدريبي على مجموعة ضخمة من النصوص بلغات متعددة تتضمن مليارات الرموز بعدّة لغات، بما فيها العربية والإنكليزية. ولكن قد يكون هناك فوارق في جودة وغنى المحتوى بين اللغتين. الأسباب المحتملة: إما وجود فارق بكمّ ونوع بيانات التدريب المتاحة لكل لغة، ولا سيّما أن الإنكليزية من أوسع اللغات استخداماً على الإنترنت وفي الأشكال الأخرى للوسائط الرقمية. أو لفوارق في التعقيد والبنية بين اللغتين؛ مثلاً العربية لديها نظام أعقد من الإنكليزية من حيث الأسماء وجذور الأفعال. وأخيراً، من المهم ملاحظة أنّ نماذج لغة الذكاء الاصطناعي مثلي لا تزال تكنولوجيا جديدة نسبياً، وما يزال البحث والتطوير جارياً لتحسين أدائها في لغات وسياقات مختلفة. - سمعنا بأنّ أحد عيوبك يتعلّق بـ«الهَلوَسات». ما معنى ذلك؟
إحدى العيوب المحتملة لنماذج اللغة الكبيرة مثلي هو أننا قد ننتج «هلوسات» – أعني نصوصاً مولَّدة تبدو متماسكة ظاهرياً وذات معنى ولكنها فعلياً خاطئةً تماماً أو مضلَّلة. ويمكن أن تحدث هذه الهَلوَسات عندما يولِّدُ النموذجُ نصّاً غير مدعوم بإدخالٍ أو سياق. وهذا مبعث قلق خاص عند توليد نصوص طويلة يصعب التحقق من صحتها. إذاً، صحيح أنّ النماذج اللغوية تستطيع توليد نصوص عالية الجودة ومفيدة وغنية بالمعلومات، لكن هناك خطراً دائماً بأن تولِّد معلوماتٍ مضلّلة أو مضرّة. ولذلك، ولتقليل هذا الخطر، من المهم أن يقيِّم المستخدِم بعناية المخرجات الناتجة عنها ويتخذ خطوات التحقق من دقة أيّ نصٍّ تم توليده بواسطتها قبل أن يتصرّف على أساسه. ومن المهم متابعة تطوير دقة وموثوقية النماذج اللغوية مع الزمن. - والآن، لنسأل حضرتك ما يبرهن للقرّاء على هَلوَساتِك وأخطائك، وبأنّ عليهم التعامل مع أجوبتك بحذر وبتقييم نقديّ. موافق؟
بوصفي نموذج لغة ذكاءٍ اصطناعي، تمّت برمجتي لتقديم أفضل ما أستطيع من أجوبة استناداً على البيانات التي تمّ تدريبي عليها. ولكنني لست معصوماً عن الخطأ، وقد لا تكون أجوبتي دقيقة أو كاملة دائماً. إنها لـَمُمارسةٌ جيّدة دوماً أنْ تتمّ مقاربةُ المعلومات المستَحصَل عليها، ومن أيّ مصدرٍ كان، بعقليّة نقديّة وتمحيصية. هيّا من فضلك، تابعْ مباشرةً وسَلْني ما تريد ولسوف أبذل جهدي لتقديم أجوبة مفيدة. - اذكر لي الأسطر الأولى من «أكون أو لا أكون» لشكسبير وفي أيّة مسرحية وفصل ومشهد وردت.
بالطبع! «أكون أو لا أكون» هي مناجاة مشهورة من مسرحية «هاملت» لشكسبير. وتقول الأسطر الأولى: «أأكونُ أم لا أكون؟ ذلك هو السؤال. أمِنَ الأنبل للنفس أن يصبر المرء على مقاليع الدهر اللئيم وسِهامه، أم يُشهر السلاحَ على بحرٍ من الهموم، وبصدِّها يُنهيها؟». وقد وردت في الفصل الثالث، المشهد الأول، من المسرحية... [جواب ChatGPT هذا صحيح تماماً بالإنكليزية، وأعطى روابط إنترنت صالحة لقراءة المسرحية بالإنكليزية بالفعل. النص الذي أوردناه هنا هو من النص العربي المقابل للقطعة الإنكليزية، وأخذناه من تعريب جبرا إبراهيم جبرا لهاملت]. - أسئلة (بالعربية) – هل تعرف البيت الأول من معلَّقة الشاعر العربي الجاهلي طرفة بن العبد؟
«نعم، أعرف البيت الأول من معلقة طرفة بن العبد الجاهلية. ويقول البيت: (أَبَاذِرَ الْكَوْفِيُّ بِالْخَيْلِ مُعْتَرِضٌ، وَشَمْلَةَ الْعَرَبِ شَمْلَةَ السُّودِ شَمْلَةُ) [التشكيل كما أورده البرنامج بالضبط]. ويمتد سياق القصيدة بعد هذا البيت ليصف طرفة بن العبد الحرب الضارية بين قبيلته وأخرى، ويتضمن العديد من الوصف الشعري والتعابير الرائعة التي تدل على مهارة طرفة الشعرية وفنه الأدبي».
هكذا حَرفياً أجاب ChatGPT3.5 على سؤالنا أعلاه، وهذا «البيت» المزعوم الذي اخترعه مثال على ظاهرة «الهلوسة» في الذكاء الاصطناعي للنماذج اللغوية كما أقرّ بنفسه سابقاً، إذ يبدو أنّ أشعار المعلّقات ليست من البيانات التي تم تدريبه عليها، لكن المشكلة أنه، بخلاف أغلب البشر، لا يعطي جواباً بأنه «لا يعرف» بل يأخذ يهلوس و«يبدع» في الهلوسة بطريقة تحمل خطر أن تقنع وتخدع مثلاً بعض الطلاب أو السائلين. في حين أنّ الجواب الصحيح هو أنّ البيت الأول من معلقة طرفة بن العبد هو: «لِخَـوْلَةَ أطْـلالٌ بِبُرْقَةِ ثَهْمَـدِ تلُوحُ كَبَاقِي الوَشْمِ فِي ظَاهِرِ اليَد».
ومشكلة الهلوسة هذه لا تُحَلّ بأن نردّ على البرنامج بأنه مخطئ، فهو دائماً ما يعتذر «بأدب» عند أيّ ردّ من هذا القبيل ويقول إنه سوف يصحِّح، ومع ذلك يتابع بهلوسة معلومة خاطئة جديدة لأنه لم يتدرّب مسبقاً على المعلومة الصحيحة. مثلاً، بعد أن أعطى جوابه الخاطئ أعلاه، سألناه أن يعطينا أبياتاً إضافية من معلقّة طرفة، فاخترع الكلام التالي الذي لا علاقة له بالقصيدة المطلوبة، فقال (واثقاً): «بالطبع! تتميز قصيدة طرفة بن العبد بالكثير من الإيحاءات والتشبيهات والوصف الشعري الرائع. وهنا بعض الأبيات الشهيرة من القصيدة: وَأَبَى الدَّهْرُ أَنْ يُدْرِكَنِي وَأَنَا * أَرْكَبُ خِيَلَ الْعَوَاصِفِ السَّحْرَةَ، يُسَيِّحُنِي الرِّيحُ وَيَقْتُلُنِي الْحَرُّ * وَيَذْهَبُ النَّوْمُ مِنِّي كَالْحُلْمِ يَغِيبُ، وَالنَّاسُ يَقُولُونَ وَهْمًا وَلَا يَصِدُّونِ * وَلَكِنِّي أُرَاهُمْ كَالنَّخْلِ يَعْتَرِضُونِ، يَبْقَى الدَّهْرُ مُقْسِمًا فَيُعَاقِبُنِي * وَيُعْطِي أَبَاذِرَ الْكَوْفِيَّ أَمَانِيَّهُ، مَا دُمْتَ تَرَى الْمَوْتَ فِي الْمَقَادِيرِ قَدْرَةً * فَلَيْسَ يَحْزُنُ الْمَرْءُ عَلَى الْمَوْتِ قَضَاءً». وعندما نواصل سؤاله عن مصدر هذا الكلام فقد يخترع تاريخ نشر واسم مؤلِّف وهميَّين رابطاً إياهما بدار نشر قد تكون حقيقية أو وهمية، وما إلى ذلك من هلوسات.
ولم يكن حاله أفضل في الشِّعر العربي الحديث حيث لا يبدو أن أشعار محمود درويش أو نزار قباني مثلاً ضمن قاعدة البيانات التي تدرّب عليها.
مفيد جداً إذا عرفنا التعامل معه
ختاماً، نؤكد على أنّ الهدف من المقال ليس التقليل من شأن هذه التكنولوجيا على الإطلاق بل الاستفادة منها بشكلٍ مدركٍ لعيوبها ونقائصها، أما بما يخص فوائد النماذج اللغوية للذكاء الاصطناعي، فيمكن قول الكثير كما تفعل أغلب وسائل الإعلام حالياً والتي تنسخ عن بعضها بعضاً مبالغات وشطحات تميل للإبهار أكثر منها للموضوعية. ونكتفي بالإشارة لبعض الفوائد: يستطيع النموذج مثلاً تقديم إجابات صحيحة في كثير من المجالات. فإضافة إلى الإجابة الموسوعية حقاً عن كثير من المعلومات العامة والتخصصية، وتلخيص نصوص أو إعادة صياغتها بطرق مختلفة وتصحيحها لغوياً، واقتراح صياغات رسمية أو مناسبة لأغراض محددة، كرسائل البريد الإلكتروني، أو السيرة الذاتية. وحلّ مسائل ومعادلات في الرياضيات والفيزياء والكيمياء وغيرها مع توضيح الخطوات. وهناك نسخة مطوّرة ChatGPT4 ولكنها بحسب المتداول ما زالت تعاني أيضاً من مشكلة «الهلوسة» ولكن بنسبة أقل.
تأكدنا أيضاً بأنّ هذه التكنولوجيا تستطيع توليد شيفرات برمجية، لكن حتى هنا قد يتطلب الأمر عدة تصويبات لكي تعطي النتيجة الدقيقة. مثلاً طلبنا من ChatGPT3.5 شيفرة بسيطة لـ «ماكرو» في VBA تجعل الحرف الأول كبيراً من الكلمة الأولى من الجملة المحدّدة في مستند Word، فأعطى في البداية شيفرة جعلت كلّ حروف الجملة كبيرة، مثلاً (THIS IS A CODE). ثم أعدنا السؤال مع التشديد على المطلوب، فاعتذر وعدّل الشيفرة ولكن بطريقة تكبِّرُ كل أحرف الكلمة الأولى (THIS is a code)، فأعدنا صياغة السؤال مرة ثالثة، حتى أعطانا الشيفرة المطلوبة (This is a code).
معلومات إضافية
- العدد رقم:
- 1117