ماهية الخوارزمية    الكهرباء والعمليات المستقلة تقود مستقبل قطاع الطاقة    خطوات سريعة لمعرفة فاتورة الكهرباء لشهر أبريل 2026    الجيش الكويتي: الدفاعات الجوية تتصدى لهجمات صاروخية ومسيرات معادية    الإمارات تشارك في اجتماع وزراء الخارجية بشأن مضيق هرمز    وزير خارجية البحرين: قرار بشأن مضيق هرمز لحماية الملاحة    إعلام عبري: أضرار بمحطة القطار الخفيف سبيدور في تل أبيب جراء سقوط شظايا صاروخ إيراني    خبير استراتيجي يُحذر: ترامب قد يلجأ لسيناريوهات خطيرة لانتزاع انتصارات وهمية    المؤبد لسائق توك توك وعامل لاتجارهم في المواد المخدرة بشبرا الخيمة    انهيار بئر على شاب في قنا.. والدفاع المدني يكثف جهوده لانتشاله    دون إصابات.. إخماد حريق مصنعين بالمنطقة الصناعية في نجع حمادي    دياب عن مسلسل هي كيميا: قمت ب شيفت كارير من شخصية القاتل إلى الكوميديا    بورسعيد وصندوق التنمية الحضرية توقعان مذكرة تفاهم لتعزيز مشروعات التنمية العمرانية المتكاملة    حصاد وفير لبنجر السكر في الإسماعيلية.. إنتاجية مرتفعة وخطة للتوسع إلى 25 ألف فدان تعزز آمال الاكتفاء الذاتي    قيادي بحركة فتح: النزاعات الإقليمية تشغل العالم عن القضية الفلسطينية    محمد موسى يهاجم البلوجرز: تجاوزوا كل الخطوط الحمراء    مسؤول روسي يدعو إلى تكثيف الجهود الجماعية لحل الوضع المتعلق بإيران    "ماشي بالعصاية".. تعرض محمد محمود عبد العزيز لوعكة صحية    وزارة الصحة: بعض آلام المعدة تكون عرضا لجلطة في القلب    إسبانيا تتصدر قائمة المرشحين للفوز بكأس العالم    فيفا يعلن زيادة أسعار تذاكر كأس العالم    مصرع وإصابة 7 أشخاص في انقلاب سيارة بأسوان    مصدر مقرب من إبراهيم عادل يكشف ل في الجول القيمة الحقيقية للشرط الجزائي بعقده    بعدما لوح السيسي بفقدان الاستقرار .. ما إمكانية تداول السلطة برغبة شعبية في مصر؟    مكتبة الإسكندرية تحتفي بالأعمال المترجمة للشيخ محمد الحارثي    الموت يفجع إمام عاشور، وهذا ما كتبه على إنستجرام    اجتماع للجنة التنسيقية لهيئات منظومة التأمين الصحي الشامل بالأقصر    الصحة العالمية تطلب تمويلا 30.3 مليون دولار للاستجابة للأزمة الصحية المتفاقمة في الشرق الأوسط    «الشيوخ» يبحث دمج ذوي الإعاقة في سوق العمل وتحويلهم إلى قوة إنتاجية    سقوط 6 عناصر شديدة الخطورة في قبضة شرطة المراغة بسوهاج    تفاصيل الاجتماع الفني لبطولة كأس العالم للجمباز الفني القاهرة 2026    إسكندر: نعيد تشكيل ملف العمالة المصرية عبر التأهيل والتشغيل المنظم لحماية الشباب من الهجرة غير الشرعية    وكيل صحة الدقهلية يفتتح فعاليات المؤتمر الثالث لمستشفى صدر المنصورة    بدء غلق كوبري الدقي المعدني جزئيا لمدة 3 أيام    فينيسيوس ومبابي يتصدران قائمة الأعلى أجراً فى الدوري الإسباني    استقرار سعر الدينار الكويتي أمام الجنيه في البنك المركزي مساء اليوم    ضبط كافيه ومطعم وبازار مخالفين لقرار الغلق في مرسى مطروح    فلسفة شاعر    محافظ الدقهلية يشهد احتفالية يوم اليتيم باستاد المنصورة ويكرم الأمهات المثاليات    مازن الغرباوي وشريف دسوقي وسامح الصريطى فى حفل ختام ملتقى نغم للمسرح    سداسية نظيفة.. سيدات برشلونة يسحقن ريال مدريد في دورى أبطال أوروبا.. فيديو    دونجا: الزمالك سيفوز على الأهلي وبيراميدز وقادر على التتويج بالدوري    حكام قمة الأهلي والزمالك في الكرة النسائية    لحسن العشرة والوفاء صور.. وفاة زوجة بعد ساعة من وفاته حزنا عليه في كفر الشيخ.. فيديو    محمود زين عضوًا في لجنة السينما الجديدة    حفل تأبين شيخ الإذاعيين فهمي عمر الثلاثاء المقبل في ماسبيرو    الثلاثاء.. انطلاق المؤتمر السادس لقسم الأمراض الصدرية بطب الأزهر بأسيوط    هل تارك الصلاة إذا مات يوم الجمعة يدخل الجنة؟ أمين الفتوى يجيب    نائب محافظ سوهاج يشهد الحفل الختامي لمسابقة نقابة المهندسين للقرآن الكريم 2026    حبس 9 متهمين باستغلال الأطفال في أعمال التسول بشوارع القاهرة    المواعيد الجديدة لعقد اختبار TOFAS للبرمجة بالقاهرة    وزيرالتعليم: نركز على ترسيخ القيم الأخلاقية في المناهج المطورة    رئيس الوزراء يلتقي السفير علاء يوسف بعد تعيينه رئيسًا للهيئة العامة للاستعلامات    وزارة الري: استقرار حالة المناسيب والتصرفات والجسور بشبكة الترع والمصارف    كلية التربية النوعية جامعة طنطا تستضيف نقيب الممثلين لبحث سبل رعاية الطلاب ودعم مواهبهم    دعاء الرياح.. اللهم إنى أسألك خيرها وأعوذ بك من شرها وشر ما فيها    المستشار حامد شعبان سليم يكتب عن : "الوقت" !?    دعاء للمسافرين وقت العواصف الترابية وانعدام الرؤية.. الشيخ أحمد خليل يحذر ويُوجه المسلمين للحذر والدعاء    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



الصين تدخل سباق الذكاء الاصطناعى.. نماذج التفكير DeepSeek-R1 تتميز فى الأداء
نشر في اليوم السابع يوم 25 - 01 - 2025

كشفت شركة DeepSeek عن الجيل الأول من نماذج DeepSeek-R1 وDeepSeek-R1-Zero المصممة لمعالجة مهام الاستدلال المعقدة، ويتم تدريب DeepSeek-R1-Zero فقط من خلال التعلم التعزيزي واسع النطاق (RL) دون الاعتماد على الضبط الدقيق الخاضع للإشراف (SFT) كخطوة أولية.
وفقًا لشركة DeepSeek، أدى هذا النهج إلى ظهور طبيعي ل "العديد من سلوكيات الاستدلال القوية"، بما في ذلك التحقق الذاتي والتأمل وتوليد سلاسل فكرية واسعة النطاق (CoT).
وشرح باحثو DeepSeek: "أن [DeepSeek-R1-Zero] هو أول بحث مفتوح يثبت أن قدرات الاستدلال لدى طلاب الماجستير في القانون يمكن تحفيزها من خلال التعلم التعزيزي فقط، دون الحاجة إلى الضبط الدقيق الخاضع للإشراف".
لا يؤكد هذا الإنجاز على الأسس المبتكرة للنموذج فحسب، بل يمهد الطريق أيضًا للتقدم الذي يركز على التعلم التعزيزي في مجال الذكاء الاصطناعي الاستدلالي.
ومع ذلك، فإن قدرات DeepSeek-R1-Zero تأتي مع بعض القيود، وتتضمن التحديات الرئيسية "التكرار اللانهائي، وضعف قابلية القراءة، وخلط اللغات"، والتي قد تشكل عقبات كبيرة في التطبيقات في العالم الحقيقي، ولمعالجة هذه العيوب، طورت DeepSeek نموذجها الرائد: DeepSeek-R1.
نماذج التفكير DeepSeek-R1
يعتمد DeepSeek-R1 على سابقه من خلال دمج بيانات البداية الباردة قبل تدريب التعلم المعزز، وتعمل خطوة التدريب المسبق الإضافية هذه على تعزيز قدرات التفكير في النموذج وحل العديد من القيود المذكورة في DeepSeek-R1-Zero.
كما أن DeepSeek-R1 يحقق أداءً مماثلاً لنظام o1 الذي نال استحسانًا كبيرًا من OpenAI عبر مهام الرياضيات والترميز والمنطق العام، مما يعزز مكانته كمنافس رائد.
اختار DeepSeek إتاحة كل من DeepSeek-R1-Zero وDeepSeek-R1 كمصدر مفتوح إلى جانب ستة نماذج أصغر حجمًا.
ومن بين هذه النماذج، أظهر DeepSeek-R1-Distill-Qwen-32B نتائج استثنائية، حتى أنه تفوق على o1-mini من OpenAI عبر معايير متعددة.
شاركت DeepSeek رؤى حول خط تطوير نموذج التفكير، والذي يدمج مزيجًا من الضبط الدقيق الخاضع للإشراف والتعلم التعزيزي.
وفقًا للشركة، تتضمن العملية مرحلتين من SFT لإنشاء القدرات الأساسية للعقلانية وغير العقلية، بالإضافة إلى مرحلتين من التعلم التعزيزي مصممتين لاكتشاف أنماط التفكير المتقدمة ومواءمة هذه القدرات مع التفضيلات البشرية.
تبنت DeepSeek ترخيص MIT لمستودعها وأوزانها، مما يوسع الأذونات للاستخدام التجاري والتعديلات اللاحقة.
ويُسمح بالأعمال المشتقة، مثل استخدام DeepSeek-R1 لتدريب نماذج لغة كبيرة أخرى (LLMs).


انقر هنا لقراءة الخبر من مصدره.