وزير التموين: لا نية لزيادة أسعار الخبز أو السلع التموينية أو السكر العام المقبل    مقتل 16 شخصا في حريق دار مسنين بإندونيسيا    أحمد عبد الله محمود يكشف ملامح شخصيته في «علي كلاي»    وداع موجع في كواليس التصوير... حمزة العيلي يفقد جده والحزن يرافقه في «حكاية نرجس»    هل تتزوج لطيفة في 2026؟.. توقعات «بسنت يوسف» تثير الجدل    رفع حالة الطوارئ بالسويس تزامنًا مع انقطاع المياه 12 ساعة    مكتب الرئاسة التايواني: المناورات الصينية تمثل تحديا للقانون والنظام الدوليين    عمرو يوسف يكشف تفاصيل صداقته القوية ب عمرو دياب    بإطلالة شعبية مفاجئة.. درة تخطف الأنظار بكواليس «علي كلاي» في رمضان 2026    كوريا الشمالية تجري تجربة إطلاق صاروخ كروز بعيد المدى    هبوط حاد لأسعار الذهب عالميًا.. وخسائر الأوقية تتجاوز 30 دولارًا    بالرقص والهتاف.. احتفالات واسعة في طهطا عقب إعلان فرز اللجان الانتخابية    الحوثى: أى وجود إسرائيلى فيما يعرف بإقليم أرض الصومال سيكون هدفا عسكريا لنا    مصرع وإصابة 111 شخصا بسبب انحراف قطار عن القضبان في المكسيك    نتيجة الحصر العددى للأصوات بالدائرة الثامنة دار السلام سوهاج    مباحث العبور تستمع لأقوال شهود العيان لكشف ملابسات حريق مخزن كراتين البيض    كشف ملابسات تعليق بشأن سرقة دراجة نارية لطفل بدمياط    حسام حسن يستقر على رباعي دفاع منتخب مصر أمام أنجولا    اليوم، الاجتماع الأخير للجنة الرئيسية لتطوير الإعلام بعد انتهاء مهامها    الدفاع الروسية تعلن إسقاط 21 مسيرة أوكرانية خلال ثلاث ساعات    كشف ملابسات منشور بشأن إدعاء خطف سيدة بكفر الشيخ    يحيى حسن: التحولات البسيطة تفكك ألغاز التاريخ بين الواقع والافتراض    فوضى السوشيال ميديا    البوصلة والربان!    الفرق بين الحزم والقسوة في التعامل مع الأبناء    النيابة الإدارية تنعى مستشارة لقيت مصرعها أثناء عودتها من الإشراف على الانتخابات    ترامب: أوكرانيا وروسيا تقتربان من اتفاق بشأن إقليم دونباس    طفرة غير مسبوقة بالمنيا.. استرداد 24 ألف فدان وإيرادات التقنين تقفز ل2 مليار جنيه    مواقيت الصلاة اليوم الإثنين 29 ديسمبر 2025 في القاهرة والمحافظات    ما هو فضل الدعاء وقت الفجر؟    متحدث الوزراء: الدولة لن تستبعد أي أسرة من منظومة الدعم بسبب عدد أفرادها    مشروبات تهدئ المعدة بعد الإفراط بالأكل    BeOn تحصل على استثمار استراتيجي بالدولار لدعم التوسع الإقليمي وتطوير حلول CRM الذكية    الداخلية السورية: احتجاجات الساحل نتيجة دعوات انفصالية    وزير الإسكان: تم وجارٍ تنفيذ نحو مليون و960 ألف وحدة سكنية متنوعة    اشتعال المنافسة، كوت ديفوار والكاميرون يكتفيان بالتعادل الإيجابي في أمم أفريقيا 2025    على رأسهم مصر.. 3 منتخبات حسمت تأهلها رسميا بعد الجولة الثانية لمجموعات أمم أفريقيا 2025    أمم إفريقيا – تعرف على جميع مواعيد مباريات الجولة الثالثة    حسم التأهل مبكرًا.. مصر ونيجيريا والجزائر إلى دور ال16 من أمم أفريقيا 2025    طاهر أبو زيد: مكاسب حسام حسن مع المنتخب إنجاز رغم الظروف.. والمرحلة المقبلة أصعب    كأس عاصمة مصر - أحمد عبد الله يدير لقاء الأهلي ضد المقاولون العرب تحكيميا    شحتة كاريكا يكشف مفاجأة عن الراحل أحمد دقدق: أوصى بحذف أغانيه    الجزائر يتصدر المجموعة الخامسة ب6 نقاط ليحسم تأهله رسميا لدور 16 بأمم أفريقيا    منير فخري عبد النور: ضعف المشاركة أبرز سلبيات المشهد الانتخابي الأخير لمجلس النواب    محافظ البحيرة: تطوير مدينة رشيد لتحويلها إلى وجهة سياحية عالمية    مصرع طفلين في تصادم بالفرافرة    محافظ الفيوم يتابع غلق لجان التصويت في اليوم الثاني لانتخابات النواب بالدائرتين الأولى والرابعة    الصحة تكشف أبرز خدمات مركز طب الأسنان التخصصي بزهراء مدينة نصر    تفاصيل وفاة مُسن بتوقف عضلة القلب بعد تعرضه لهجوم كلاب ضالة بأحد شوارع بورسعيد    عاجل- رئيس الوزراء يستقبل المدير العام للمركز الأفريقي لمكافحة الأمراض ويؤكد دعم مصر لاستضافة الآلية الأفريقية للشراء الموحد    الأزهر للفتوي: ادعاء معرفة الغيب والتنبؤ بالمستقبل ممارسات تخالف صحيح الدين    سقوط عنصرين جنائيين لغسل 100 مليون جنيه من تجارة المخدرات    وزارة الداخلية تضبط 4 أشخاص جمعوا بطاقات الناخبين    محمود حميدة: طارق النبراوي يفهم معنى العمل العربي المشترك وقادر على رسم المستقبل    صاحب الفضيلة الشيخ / سعد الفقي يكتب عن : شخصية العام!    دار الإفتاء توضح حكم إخراج الزكاة في صورة بطاطين    تعرف على مواقيت الصلاة اليوم فى سوهاج    هيئة الرعاية الصحية تستعرض إنجازات التأمين الصحي الشامل بمحافظات إقليم القناة    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



الصين تدخل سباق الذكاء الاصطناعى.. نماذج التفكير DeepSeek-R1 تتميز فى الأداء
نشر في اليوم السابع يوم 25 - 01 - 2025

كشفت شركة DeepSeek عن الجيل الأول من نماذج DeepSeek-R1 وDeepSeek-R1-Zero المصممة لمعالجة مهام الاستدلال المعقدة، ويتم تدريب DeepSeek-R1-Zero فقط من خلال التعلم التعزيزي واسع النطاق (RL) دون الاعتماد على الضبط الدقيق الخاضع للإشراف (SFT) كخطوة أولية.
وفقًا لشركة DeepSeek، أدى هذا النهج إلى ظهور طبيعي ل "العديد من سلوكيات الاستدلال القوية"، بما في ذلك التحقق الذاتي والتأمل وتوليد سلاسل فكرية واسعة النطاق (CoT).
وشرح باحثو DeepSeek: "أن [DeepSeek-R1-Zero] هو أول بحث مفتوح يثبت أن قدرات الاستدلال لدى طلاب الماجستير في القانون يمكن تحفيزها من خلال التعلم التعزيزي فقط، دون الحاجة إلى الضبط الدقيق الخاضع للإشراف".
لا يؤكد هذا الإنجاز على الأسس المبتكرة للنموذج فحسب، بل يمهد الطريق أيضًا للتقدم الذي يركز على التعلم التعزيزي في مجال الذكاء الاصطناعي الاستدلالي.
ومع ذلك، فإن قدرات DeepSeek-R1-Zero تأتي مع بعض القيود، وتتضمن التحديات الرئيسية "التكرار اللانهائي، وضعف قابلية القراءة، وخلط اللغات"، والتي قد تشكل عقبات كبيرة في التطبيقات في العالم الحقيقي، ولمعالجة هذه العيوب، طورت DeepSeek نموذجها الرائد: DeepSeek-R1.
نماذج التفكير DeepSeek-R1
يعتمد DeepSeek-R1 على سابقه من خلال دمج بيانات البداية الباردة قبل تدريب التعلم المعزز، وتعمل خطوة التدريب المسبق الإضافية هذه على تعزيز قدرات التفكير في النموذج وحل العديد من القيود المذكورة في DeepSeek-R1-Zero.
كما أن DeepSeek-R1 يحقق أداءً مماثلاً لنظام o1 الذي نال استحسانًا كبيرًا من OpenAI عبر مهام الرياضيات والترميز والمنطق العام، مما يعزز مكانته كمنافس رائد.
اختار DeepSeek إتاحة كل من DeepSeek-R1-Zero وDeepSeek-R1 كمصدر مفتوح إلى جانب ستة نماذج أصغر حجمًا.
ومن بين هذه النماذج، أظهر DeepSeek-R1-Distill-Qwen-32B نتائج استثنائية، حتى أنه تفوق على o1-mini من OpenAI عبر معايير متعددة.
شاركت DeepSeek رؤى حول خط تطوير نموذج التفكير، والذي يدمج مزيجًا من الضبط الدقيق الخاضع للإشراف والتعلم التعزيزي.
وفقًا للشركة، تتضمن العملية مرحلتين من SFT لإنشاء القدرات الأساسية للعقلانية وغير العقلية، بالإضافة إلى مرحلتين من التعلم التعزيزي مصممتين لاكتشاف أنماط التفكير المتقدمة ومواءمة هذه القدرات مع التفضيلات البشرية.
تبنت DeepSeek ترخيص MIT لمستودعها وأوزانها، مما يوسع الأذونات للاستخدام التجاري والتعديلات اللاحقة.
ويُسمح بالأعمال المشتقة، مثل استخدام DeepSeek-R1 لتدريب نماذج لغة كبيرة أخرى (LLMs).


انقر هنا لقراءة الخبر من مصدره.