۰

هوش مصنوعی DeepSeek-R2 احتمالاً تا دو هفته دیگر معرفی می‌شود

چهارشنبه ۲۲ اسد ۱۴۰۴ ساعت ۲۱:۱۳
هوش مصنوعی DeepSeek-R2 احتمالاً تا دو هفته دیگر معرفی می‌شود
شرکت چینی دیپ‌سیک احتمالاً در ماه جاری میلادی از مدل جدید هوش مصنوعی خود موسوم به DeepSeek-R2 رونمایی خواهد کرد.
به گزارش منابع چینی، زمان دقیق رونمایی از مدل DeepSeek-R2 هنوز مشخص نشده است، اما گفته می‌شود که رونمایی از این مدل در نیمه دوم همین ماه صورت خواهد پذیرفت. رونمایی از DeepSeek-R2 به عنوان پیشرفته‌ترین مدل دیپ‌سیک از این جهت اهمیت دارد که OpenAI نیز به‌تازگی از مدل GPT-5 خود رونمایی کرده است.
مدل DeepSeek-R2 به‌زودی معرفی خواهد شد
انتظار می‌رود DeepSeek-R2 با به‌کارگیری یک ساختار پیشرفته‌تر از Mixture of Experts جهشی چشمگیر در معماری خود را تجربه کند. این مدل همچنین یک Gating network هوشمندتر را برای مدیریت بهتر پردازش‌های سنگین در مرحله استنتاج ادغام خواهد کرد.
برخی منابع آگاه گفته‌اند که این مدل می‌تواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند که تقریباً دو برابر نسخه قبلی با ۶۷۱ میلیارد پارامتر است. بااین‌حال، این عدد همچنان کمتر از ChatGPT-4/5 خواهد بود که بیش از ۱.۸ تریلیون پارامتر دارد.
همچنین در راستای برنامه‌های چین برای خودکفایی در عرصه هوش مصنوعی، مدل DeepSeek-R2 به‌طور کامل بر روی تراشه‌های Ascend 910B هواوی آموزش دیده است. خوشه پردازشی هواوی با ارائه ۵۱۲ پتافلاپس توان پردازشی در دقت FP16 و با بهره‌وری ۸۲ درصدی ظاهراً توانسته به ۹۱ درصد عملکرد خوشه‌های مبتنی بر انویدیا A100 دست یابد.
به گفته تحلیلگران، این اقدام گامی حیاتی از سوی چین در جهت کاهش وابستگی به سخت‌افزارهای هوش مصنوعی ساخت آمریکا است. همچنین گزارش‌ها حاکی از آن است که هزینه آموزش DeepSeek-R2 به لطف استفاده از سخت‌افزار بومی و تکنیک‌های بهینه‌سازی، ۹۷ درصد کمتر از GPT-4 بوده است. به همین دلیل انتظار می‌رود دیپ‌سیک دسترسی API را با قیمت‌های پایین‌تر ارائه دهد.
 
نام شما

آدرس ايميل شما
نظر شما *

پربازدیدترین