استارتاپ چینی دیپسیک از یک مدل هوش مصنوعی آزمایشی جدید به نام DeepSeek-V3.2-Exp رونمایی کرده است که با یک معماری جدید به نام «توجه پراکنده» وعده میدهد هزینه استفاده از هوش مصنوعی برای تحلیل متون طولانی را تا نصف کاهش دهد. این پیشرفت میتواند دسترسی به مدلهای هوش مصنوعی قدرتمند را برای شرکتهای کوچکتر ممکن کند.
مدلهای هوش مصنوعی امروزی برای درک یک متن، باید به تمام کلمات و جملات آن «توجه» کنند. این فرایند، به خصوص در متون بسیار طولانی، به قدرت محاسباتی و هزینه سرور بسیار زیادی نیاز دارد. اما رویکرد جدید DeepSeek که «توجه پراکنده» (DSA) نام دارد، این معادله را تغییر میدهد.
این سیستم به جای پردازش تمام اطلاعات، به صورت هوشمند و گزیده عمل میکند. تصور کنید یک شرکت هواپیمایی میخواهد بهترین مسیر را پیدا کند؛ پس بهجای بررسی تمام مسیرهای ممکن در جهان، فقط گزینههای منطقی را فیلتر میکند. «توجه پراکنده» نیز دقیقاً همین کار را با دادهها انجام میدهد. این سیستم ابتدا با یک ماژول هوشمند، مهمترین بخشهای متن را شناسایی و سپس فقط کلمات (یا توکنهای) مهم را برای تحلیل نهایی انتخاب میکند. این فرایند بار محاسباتی را به شدت کاهش میدهد و به گفته دیپسیک، میتواند هزینه استفاده از API را در سناریوهای دارای متن طولانی تا ۵۰ درصد کاهش دهد.
به گزارش CNBC، این پیشرفت یک خبر عالی برای کل اکوسیستم فناوری است. کاهش چشمگیر هزینهها به این معناست که توسعهدهندگان، محققان و شرکتهای کوچکتر که توانایی پرداخت هزینههای زیاد سرور را ندارند، اکنون میتوانند از مدلهای قدرتمند هوش مصنوعی برای ساخت اپلیکیشنهای خود استفاده کنند. این اتفاق میتواند به موج جدیدی از خلاقیت و رقابت در بازار منجر شود.
با وجود تمام مزایا، این رویکرد یک نگرانی اساسی نیز دارد: اطمینانپذیری. سؤال اصلی این است که هوش مصنوعی چگونه تصمیم میگیرد که کدام دادهها مهم و کدام غیرمهم هستند؟
«اکاترینا آلماسک» (Ekaterina Almasque)، یکی از سرمایهگذاران برجسته در حوزه هوش مصنوعی، میگوید: «واقعیت این است که این مدلها بسیاری از ظرافتها را از دست میدهند. سؤال واقعی این است که آیا آنها مکانیسم درستی برای حذف دادههای غیرمهم دارند؟»