Kimi K2: النموذج مفتوح المصدر بتريليون معامل الذي يشغّل Cursor

أصدرت Moonshot AI، شركة ذكاء اصطناعي صينية مدعومة من علي بابا، نموذج Kimi K2 — نموذج مزيج خبراء بتريليون معامل بأوزان مفتوحة بترخيص MIT معدّل. فقط 32 مليار معامل تنشط لكل رمز، ما يجعله فعّالًا رغم حجمه الضخم. دُرِّب على 15.5 تريليون رمز ويحتل المرتبة الأولى بين النماذج مفتوحة المصدر في SWE-bench Verified وLiveCodeBench v6 ومعايير رياضية عدة.
التوقيت مهم. في مارس 2026 كشفت Cursor أن نموذج Composer 2 للبرمجة مبني على هيكلية Kimi من Moonshot. عندما تكون الأداة التي يستخدمها ملايين المطورين لكتابة الشيفرة مدعومة بنموذج مفتوح الأوزان من شركة بكين الناشئة، فقد تغيّرت ديناميكيات المنافسة في الذكاء الاصطناعي جذريًا.
تريليون معامل، 32 مليار نشط
K2 يستخدم هيكلية مزيج الخبراء بـ384 وحدة خبرة، تُختار 8 لكل رمز مع خبير واحد مشترك. هذا يعني أن كل خطوة توليد تستخدم 32 مليار معامل فقط بينما يحتفظ النموذج الكامل بتريليون معامل من المعرفة المتخصصة. الهيكلية تستخدم انتباهًا متعدد الرؤوس كامنًا مشتقًا من تحليل قوانين التوسع نفسه وراء DeepSeek-V3.
دُرِّب النموذج باستخدام MuonClip، محسّن جديد يمنع عدم استقرار التدريب عند هذا الحجم. تفيد Moonshot بعدم وجود أي عدم استقرار أثناء التدريب المسبق بأكمله — إنجاز هندسي ملحوظ لنموذج بتريليون معامل. نافذة السياق الأساسية 128 ألف رمز، وتمتد إلى 256 ألفًا في متغيري Thinking وK2.5.
أداء المعايير
في LiveCodeBench v6، يسجّل K2 نسبة 53.7% متجاوزًا Claude Sonnet 4 عند 48.5% وGPT-4.1 عند 44.7%. في SWE-bench Verified بتقييم وكلاء متعدد المحاولات يصل 71.6% — خلف Claude Sonnet عند 80.2% لكن متقدمًا بفارق كبير على DeepSeek-V3 عند 38.8%. في الرياضيات يسجّل K2 نسبة 97.4% في MATH-500، الأعلى بين جميع النماذج المختبرة، و49.5% متوسطًا في AIME 2025 متفوقًا على Gemini 2.5 Flash عند 46.6%.
في المنطق والاستدلال يسجّل K2 نسبة 89.0% في ZebraLogic مقابل 73.7% لـClaude Sonnet 4 و58.5% لـGPT-4.1. في GPQA-Diamond وهو معيار علمي على مستوى الدراسات العليا يسجّل 75.1% متقدمًا على جميع النماذج المقارنة. هذه النتائج تضع K2 في منافسة مباشرة مع النماذج المملوكة الرائدة — وهو مفتوح الأوزان بالكامل.
لماذا تهم الأوزان المفتوحة هنا
K2 صدر بترخيص MIT معدّل يسمح بالاستخدام التجاري. الأوزان متاحة على HuggingFace بصيغة block-fp8، ويُدعم النشر عبر vLLM وSGLang وKTransformers وTensorRT-LLM. هذا يعني أن أي شركة تستطيع تشغيل هذا النموذج على بنيتها التحتية دون إرسال بيانات إلى واجهة API خارجية.
الأثر العملي كبير. Cursor بنت Composer 2 على هذه الهيكلية. أي أداة برمجة أو تكامل مع بيئة تطوير يستطيع استخدام هذه الأوزان أساسًا. بسعر 0.57 دولار لكل مليون رمز إدخال و2.40 دولار لكل مليون رمز إخراج عبر واجهة Moonshot — أو مجانًا عند الاستضافة الذاتية — K2 يقدّم أداءً من مستوى النماذج الرائدة بجزء من تسعير النماذج المملوكة.
عائلة النموذج
أصدرت Moonshot عدة متغيرات من K2. K2-Base نموذج أساسي للضبط المخصص. K2-Instruct نسخة محسّنة للمحادثة للاستخدام المباشر. K2-Thinking يضيف استدلالًا خطوة بخطوة مع استدعاء الأدوات، وK2-Turbo-Preview يقدّم استدلالًا سريعًا بـ60 إلى 100 رمز في الثانية. في يناير 2026 أصدرت Moonshot نموذج K2.5 الذي يوسّع الأساس بقدرات متعددة الوسائط — نص ورؤية وفهم فيديو — مدرّب على 15 تريليون رمز متعدد الوسائط إضافي.
العائلة بأكملها متاحة على HuggingFace تحت منظمة moonshotai، ومستودع GitHub جمع أكثر من 10,500 نجمة. للمطورين الذين يقيّمون النماذج لمهام البرمجة، K2 الآن أقوى خيار مفتوح الأوزان متاح، والفجوة مع النماذج المملوكة تستمر بالتضييق.
روابط المصادر
المصدر: Moonshot AI