النماذج اللغوية الكبيرة

النموذج اللغوي الكبير هو نموذج تعلم عميق قادر على توليد اللغة ومعالجة اللغة الطبيعية وفهم السياق وابداء الآراء وطرح الاسئلة والإجابة عليها كذلك .

غالباً ماتكون النماذج اللغوية الكبيرة هي الصورة النمطية عن الذكاء الاصطناعي في السنوات الأخيرة .

النشأة والإمكانيات

في الواقع النماذج اللغوية الكبيرة لم تكن ذات شهرة واسعة قبل عقد 2020 الحالي , فقبل ذلك كانت مهمات الذكاء الاصطناعي تقتصر على وظائف قصيرة كالأتمتة وأنظمة التوصيات ولم تصل إلى هذه المرحلة إلا قبل وقت قليل تقريباً .

على مايبدو أن أول نموذجين لغوية كبيرة كانت :

  • Google Bert 2018
  • GPT-1 2017


صورة بيرت صورة جي بي تي 1
Bert GPT1

مميزات

غالباً ماقامت النماذج اللغوية الكبيرة بتسريع المهمات ودفع عجلة التنمية , على الأرجح حتى مفهوم الذكاء الاصطناعي لم ينتشر إلا من بعد إنتشارها وخصوصاً مع “لحظة إطلاق شات جي بي تي 3.5” الشهيرة في نوفمبر 2022 م .


غالباً ماتُدرب النماذج اللغوية الكبيرة على بيانات ضخمة تعرف بـالبيانات الضخمة تُخزن في قواعد بيانات مختلفة الأنواع وحتى في ملفات نصية ذات صيغٍ مختلفة , وعدد المعاملات في النماذج اللغوية الكبيرة قد يتجاوز المليارات , ومدة التدريب والتكلفة كذلك تكون عالية مقارنة بتكلفة ومدة تدريب النماذج اللغوية الصغيرة والأنواع الأخرى من الذكاء الاصطناعي .

بما معناه

أنك يومياً تستخدم نماذج لغوية كبيرة إذا كنت تستخدم شات جي بي تي 5 أو جوجل جيمناي أو ديب سيك أو حتى كلود .

أمثلة أخرى على نماذج لغوية صغيرة وكبيرة :

  • Meta Llama 3.2
  • Qwen 2.5
  • Google Gemma-2
  • OpenAI GPT4o Mini
  • Huggingface SmolLM
  • TinyLlama

وبسبب إنتشار النماذج اللغوية الكبيرة انتشر استخدام منصات خاصة بهذه النماذج اللغوية الصغيرة والكبيرة مثل : - Huggingface

Huggingface


  • Kaggle

Kaggle


  • Openrouter

Openrouter



مصادر ومراجع :