هذه المقالة هي ترجمة كاملة تنشر لأول مرة باللغة العربية لمقال نشرته شركة أوبن إي آي (OpenAI) الأمريكية، شرحت فيه عن طرق إنشاء وتطوير وعمل نماذجها اللغوية المستخدمة في تطبيقات الذكاء الاصطناعي، وبينت فيه بعض المسائل المتعلقة بالتدريب والخصوصية.
خضعت نماذج اللغة الضخمة لدينا في شركة أوبن أي آي (OpenAI)- ومنها النموذج المستخدم في روبوت المحادثة الآلي "شات جي بي تي" (ChatGPT)- للتطوير اعتمادًا على ثلاثة مصادر رئيسة للمعلومات هي: المعلومات المتاحة للعموم في شبكة الإنترنت، والمعلومات التي نحصل على ترخيص باستخدامها من جهات خارجية، والمعلومات التي يوفرها مستخدمو التطبيق والمدربون البشريون في الشركة.
تُوفر هذه المقالة لمحة عامة عن المعلومات المتاحة للعموم، التي نعتمد عليها في تطوير نماذجنا اللغوية، وتبين كذلك طريقتنا في جمع هذه المعلومات واستعمالها بما يمتثل لقوانين الخصوصية. ومن المستحسن هنا الاطلاع على سياسة الخصوصية لدينا والمقال التالي لاستيعاب طريقتنا في جمع المعلومات من مستخدمي خدماتنا واستعمالها، ومنها خيار رفض استعمال محادثات المستخدم في "شات جي بي تي" لتعليم نماذجنا وتطويرها.
ما هو شات جي بي تي؟ وما آلية عمله؟
يعرف "شات جي بي تي" بأنه خدمة متاحة عبر شبكة الإنترنت ومعتمدة على الذكاء الاصطناعي، فهذه الخدمة تتيح استخدام الروبوت في ترتيب أحد النصوص أو تلخيصها، أو كتابة نص جديد كلياً. وخضع "شات جي بي تي" للتطوير بطريقة معينة تُعينه على فهم أسئلة المستخدم وتعليماته ثم الرد عليها؛ إذ يعكف على "قراءة" قدر كبير من النص الموجود، ويتعلّم منه طريقة ظهور الكلمات ضمن السياق مع كلمات أخرى. وبعدها يستفيد من الأمور التي تعلمها ليتنبأ بالكلمة التالية المُرجّحة التي قد تظهر تبعًا لطلب المستخدم، ثم يتنبأ بجميع الكلمات التالية وهكذا دواليك. ويتشابه "شات جي بي تي" في ذلك مع قدرات النص التنبؤي (التلقائي) المستخدم في محركات البحث والهواتف الذكية والبريد الإلكتروني.
خضع "شات جي بي تي" للتطوير بطريقة معينة تُعينه على فهم أسئلة المستخدم وتعليماته ثم الرد عليها؛ إذ يعكف على "قراءة" قدر كبير من النص الموجود، ويتعلّم منه طريقة ظهور الكلمات ضمن السياق مع كلمات أخرى. وبعدها يستفيد من الأمور التي تعلمها ليتنبأ بالكلمة التالية المُرجّحة التي قد تظهر تبعًا لطلب المستخدم، ثم يتنبأ بجميع الكلمات التالية وهكذا دواليك.
ولنضرب هنا مثلًا على هذه العملية؛ فقد يحاول النموذج خلال مرحلة تعليمه (التدريب) إكمال الجملة التالية: (بدلاً من الانعطاف يسارًا، استدارت المرأة...)، فيجيب قبل خضوعه للتدريب بكلمات عشوائية، بيد أنه يقرأ ويتعلم من أسطر النص، فيتحسن فهمه لهذا النوع من الجمل، وبذلك يأتي بتنبؤ أكثر دقة للكلمة التالية. وبعدها يعيد العملية عبر عدد ضخم من الجمل.
ولمّا وجدت أعداد كثيرة من الكلمات المحتملة التي ربما تحل محل الموضع الفارغ في الجملة (مثل استدارت يمينًا أو استدارت حول أو استدارت خلفًا)، فإن هناك عنصرًا عشوائيًا في طريقة إجابة النموذج وردّه. وفي حالات كثيرة تجيب نماذجنا بأساليب مختلفة عن السؤال نفسه.
وعلى العموم تتكون نماذج التعلم الآلي من سلاسل كبيرة من الأرقام- تدعى بـ "عوامل الترجيح" أو "المعلمات"- ومن رمز يفسر هذه الأرقام ويضعها حيز التنفيذ. ولا توجد في هذه النماذج أي نسخ من البيانات أو المعلومات التي تعلمتها، ولا تحتفظ بها ولا تخزنها أساسًا، وإنما الحاصل أنه كلما تعلم النموذج أمرًا جديدًا، تتغير بعض الأرقام التي يتكون منها تغيرًا طفيفًا لإبداء ما تعلمه. ففي المثال السابق اطلع النموذج على معلومات أعانته على التحسن، فانتقل من توقع كلمات عشوائية خاطئة إلى الإتيان بكلمات أدق. فما حدث ليس إلا تغيرًا طفيفًا في الأرقام، ولم يخزن النموذج أو ينسخ الجمل التي قرأها واطلع عليها.
ما طبيعة المعلومات المستخدمة في تعلم شات جي بي تي؟
كما أسلفنا الذكر خضع "شات جي بي تي"، وسائر خدماتنا الأخرى، للتطوير اعتمادًا على المعلومات المتاحة للعموم في شبكة الإنترنت، والمعلومات التي نحصل على ترخيص باستخدامها من جهات خارجية، والمعلومات التي يوفرها مستخدمو التطبيق والمدربون البشريون في الشركة. وتُعنى هذه المقالة تحديدًا بالنوع الأول، وهو المعلومات المتاحة للعموم في شبكة الإنترنت.
وننوه هنا إلى أننا لا نعتمد إلّا المعلومات المتاحة للجمهور علانية ودون مقابل في شبكة الإنترنت؛ فنحن لا نسعى، مثلًا، إلى جمع المعلومات من مواقع الويب المظلم أو من المواقع التي تتبنى طريقة جدار الدفع لعرض محتواها. فالشركة تطبق عوامل التصفية لفرز جميع المعلومات، والتخلص من بعضها الذي لا تريد تكريسه لتدريب نماذجها، وترفض أن تُولّده تلك النماذج في ردودها، وهذا يتضمن الكلام المحرض على الكراهية، والمحتوى الإباحي، والمواقع التي تجمع المعلومات الشخصية والرسائل العشوائية وغيرها. وبعد ذلك تُخصص الشركة المعلومات الباقية لتعليم نماذجها.
لا ينسخ شات جي بي تي معلومات التدريب، ولا يخزنها ولا يحتفظ بها في قاعدة بيانات، وإنما يتعلم طبيعة الارتباطات بين الكلمات، فتعينه هذه المعارف والخبرات على تحديث أرقامه/عوامل الترجيح لديه.
كذلك لا ينسخ "شات جي بي تي" معلومات التدريب، ولا يخزنها ولا يحتفظ بها في قاعدة بيانات، وإنما يتعلم طبيعة الارتباطات بين الكلمات، فتعينه هذه المعارف والخبرات على تحديث أرقامه/عوامل الترجيح لديه. وهنا يعتمد النموذج على عوامل الترجيح في التنبؤ بالكلمات، وإنشاء كلمات جديدة حسب طلب المستخدم؛ أي أنه لا ينسخ ويلصق معلومات التدريبات، وإنما مثله كمثل شخص قرأ كتابًا معينًا ثم ألقاه جانبًا، فلا يستطيع هذا النموذج، وسائر نماذج الشركة، بلوغ معلومات التدريب بمجرد الانتهاء من تعلمها والاطلاع عليها.
هل المعلومات الشخصية معتمدةٌ في تعليم "شات جي بي تي"؟
ينطوي قسط وافر من البيانات المتاحة في الإنترنت على صلة بمختلف الأفراد، لذلك تتضمن معلومات التدريب لدينا معلومات شخصية على سبيل المصادفة؛ فنحن لا نسعى قط للحصول على معلومات شخصية لتدريب نماذجنا.
إن غايتنا من معلومات التدريب هي تحسين قدرة نماذجنا على التعرف على اللغات، ومساعدتها في فهمها والاستجابة لها، ونحن إلى ذلك لن نستخدم بتاتًا أي معلومات شخصية ضمن معلومات التدريب بغرض إنشاء ملفات تعريفية للأفراد، أو التواصل معهم، أو تقديم الإعلانات إليهم، أو بيعهم أي خدمات أو منتجات، أو حتى بيع معلوماتهم إلى جهات أخرى.
ولعل نماذجنا تستفيد من المعلومات الشخصية للاطلاع على تلاءم الأسماء والعناوين ضمن سياق اللغة والجمل، أو للتعرف على المشاهير والشخصيات العامية. ويعزز هذا الأمر قدرة نماذجنا في الإتيان بردود مناسبة على المواضيع المشابهة.
كيف يمتثل تطوير "شات جي بي تي" لقوانين الخصوصية؟
إننا نستخدم معلومات التدريب استخدامًا قانونيًا، فنماذج اللغة الضخمة تتضمن تطبيقات كثيرة ذات فوائد جمة؛ فهي إلى ذلك تفيد الأفراد في مجالات صناعة المحتوى، وتحسين جودة خدمة العملاء، وتطوير البرامج، ودعم الأبحاث العلمية وما شابه ذلك، ولا تتحقق معظم هذه الفوائد إلّا بوجود كمية كبيرة من المعلومات الكافية لتدريب النماذج وتعليمها. فليس الغرض من استخدامنا معلومات التدريب التأثير سلبًا على الأفراد، خاصة أن مصادر تلك المعلومات متاحة أساسًا للعموم. وبناء على هذه الأسباب جميعها فإننا نركن في جمعنا واستخدامنا للمعلومات الشخصية المضمنة في معلومات التدريب إلى مصالحنا المشروعة وفقًا لقوانين الخصوصية، مثل القانون العام لحماية البيانات (GDPR). ونحن لا نألُ جهدنا للوفاء بالتزامات الامتثال، لذلك أنجزنا تقييمًا بتأثير حماية البيانات، وذلك لنكفل أننا نجمع تلك البيانات ونستعملها على وجه قانوني ومسؤول.
إننا نرد على طلبات الاعتراض والحقوق المماثلة، فقد تتضمن ردود "شات جي بي تي" أحيانًا بعض معلومات شخصية عن الأفراد الذين يتكرر ظهور معلومات في شبكة الإنترنت، مثل الشخصيات العامة. ويستطيع الأفراد في بعض الهيئات القضائية الاعتراض على طريقة معالجة بياناتهم الشخصية، وذلك عبر تعبئة النموذج التالي. وللأفراد حق الوصول إلى بياناتهم الشخصية المدرجة في معلومات التدريب لدينا، ولهم حق حذفها أو تقييدها أو تصحيحها. وهذا الأمر متاح لهم عبر التواصل مع عنوان البريد الإلكتروني: dsar@openai.com..
وهنا يجب التنويه إلى أن بعض تلك الحقوق ليست حقوقًا مطلقة بموجب قوانين الخصوصية، فلنا خيار رفض الطلب إن وجد مسوغ قانوني يتيح لنا ذلك. بيد أن أهم أولوياتنا هو حماية البيانات الشخصية والامتثال الدائم لقوانين الخصوصية السارية.
إننا نصون معلومات التدريب، ونحد من استخدامها ومشاركتها، ونسعى جاهدين للمحافظة على أمن هذه المعلومات، لذلك نتبع إجراءات تقنية ومادية وإدارية معقولة تجاريًا، مثل ضوابط الوصول وسجلات المراجعة وأذونات القراءة فقط وتشفير البيانات المخزنة.
كذلك نتخذ بعض التدابير والخطوات لتقليل معالجة البيانات الشخصية عند تدريب نماذجنا؛ فنحن مثلًا نفرز المعلومات ونستبعد من مواقع الويب التي تجمع بيانات شخصية كثيرة، ونحاول تدريب نماذجنا على رفض الإجابة عن أي طلبات للحصول على معلومات حساسة أو خاصة عن الأفراد. ونحن نمتنع كليًا عن بيع معلومات التدريب لدينا إلى جهات خارجية، ونكشف عن بعضها عند الضرورة، وبما يمتثل لسياسة الخصوصية التي ننتهجها.
وطالما احتجنا إلى معلومات التدريب لتأدية الغرض منها، فإننا نحتفظ بها؛ وهنا يتوقف طول مدة احتفاظنا بها على عوامل كثيرة، مثل حجم المعلومات ونوعها ومدى حساسيتها، فضلًا عن الضرر الناجم عن استخدامها أو مشاركتها دون إذن، ومدى فائدة هذه البيانات في تدريب نماذجنا أو تحديثها.