سه‌شنبه 18 شهریور 1404
DeepSeek
Picture of کیارش اقبالی
کیارش اقبالی
دبیر تحریریۀ مُصوّر | مدیر محصول

فهرست

در دنیای هوش مصنوعی که تاکنون تحت سلطۀ شرکت‌های آمریکایی مانند OpenAI، Google DeepMind و Meta بوده است، ورود یک بازیگر جدید از چین با مدلی قدرتمند و متن‌باز، تعادل این بازار رقابتی را به چالش کشیده است. مدل DeepSeek R1، تازه‌ترین مدل زبانی بزرگ (LLM) که توسط شرکت چینی دیپ‌سیک (DeepSeek) معرفی شده، نه‌تنها از نظر عملکرد قابل‌مقایسه با مدل‌های پیشرفتۀ غربی است، بلکه با هزینه‌ای به‌مراتب کمتر توسعه یافته است. این موضوع موجب شده است که سیلیکون‌ولی و سایر مراکز فناوری جهان، با دقت عملکرد و پیامدهای این مدل را زیر نظر بگیرند.

هوش مصنوعی DeepSeek R1 با ۶۷۱ میلیارد پارامتر و معماری بهینه‌شده، توانسته است در حوزه‌هایی همچون پردازش زبان طبیعی، حل مسائل ریاضی و کدنویسی، عملکردی چشمگیر از خود نشان دهد. انتشار متن‌باز این مدل و امکان دسترسی رایگان به آن، می‌تواند موجی از نوآوری‌های جدید را در سراسر جهان به همراه داشته باشد. اما درعین‌حال، این رویکرد نگرانی‌هایی را دربارهٔ رقابت در هوش مصنوعی، تأثیرات ژئوپلیتیکی و حتی امنیت سایبری برانگیخته است.

اولین واکنش‌ها در سیلیکون‌ولی و بازارهای جهانی نشان می‌دهند که ظهور DeepSeek R1 تنها یک رویداد فناورانه نیست، بلکه ممکن است سرآغاز تحولی بزرگ در اکوسیستم هوش مصنوعی جهانی باشد. برخی تحلیل‌گران آن را گامی مهم در خودکفایی چین در هوش مصنوعی می‌دانند، درحالی‌که برخی دیگر آن را تهدیدی برای جایگاه انحصاری شرکت‌های آمریکایی قلمداد می‌کنند. با بررسی جزئیات این مدل، اهداف شرکت DeepSeek و تأثیرات آن بر رقابت جهانی، می‌توان درک بهتری از آیندۀ این حوزه پیدا کرد.

پیشینۀ شرکت DeepSeek

شرکت DeepSeek در سال ۲۰۲۳ توسط لیانگ ونفنگ (Liang Wenfeng) و تیمی از متخصصان هوش مصنوعی تأسیس شد. این استارتاپ چینی از همان ابتدا با رویکردی متفاوت پا به میدان رقابت گذاشت: توسعۀ مدل‌های هوش مصنوعی متن‌باز که بتوانند با بازیگران بزرگی مانند OpenAI و Google رقابت کنند، اما با هزینه‌ای به‌مراتب کمتر. درحالی‌که بسیاری از شرکت‌های غربی دسترسی کاربران به مدل‌های خود را پشت دیوارهای پرداخت و سیاست‌های سخت‌گیرانه نگه می‌دارند، DeepSeek به‌دنبال ارائۀ راهکارهایی است که دسترسی عمومی را تسهیل کند و اکوسیستم هوش مصنوعی را برای توسعه‌دهندگان در سراسر جهان بازتر کند.

اهداف و مأموریت‌ها

هوش مصنوعی DeepSeek از ابتدا بر دو مأموریت کلیدی متمرکز بوده است:

  1. توسعۀ مدل‌های قدرتمند، مقرون‌به‌صرفه و کارآمد: برخلاف غول‌های فناوری که از سخت‌افزارهای گران‌قیمت و سرمایه‌گذاری‌های کلان برای آموزش مدل‌های خود استفاده می‌کنند، DeepSeek رویکردی بهینه و اقتصادی را در پیش گرفته است. مدل DeepSeek R1 که تنها با ۵.۶ میلیون دلار هزینۀ آموزشی توسعه یافته، نشان‌دهندۀ توانایی این شرکت در کاهش هزینه‌ها و افزایش بهره‌وری محاسباتی است.
  2. ترویج مدل‌های متن‌باز و مشارکتی: برخلاف شرکت‌هایی مانند OpenAI که مدل‌های پیشرفتۀ خود را پشت درهای بسته نگه می‌دارند، DeepSeek ادعا می‌کند که معتقد است که آیندۀ هوش مصنوعی در دسترسی آزاد نهفته است. انتشار DeepSeek R1 به‌صورت متن‌باز، به محققان، توسعه‌دهندگان و شرکت‌های نوپا اجازه می‌دهد تا از این مدل در پروژه‌های خود استفاده کنند و حتی آن را بهبود بخشند. این استراتژی، نه‌تنها به گسترش استفاده از هوش مصنوعی کمک می‌کند، بلکه DeepSeek را به یکی از رهبران جریان دموکراتیزه کردن هوش مصنوعی تبدیل می‌کند.

نقطۀ تمایز DeepSeek در مقایسه با سایر رقبا، تمرکز آن بر ساخت مدل‌های پیشرفته با منابع محدودتر است. این شرکت ثابت کرده که می‌توان مدل‌هایی قدرتمند و رقابتی را بدون اتکا به زیرساخت‌های عظیم و سرمایه‌گذاری‌های میلیارد دلاری توسعه داد. با این استراتژی، DeepSeek اکنون به‌عنوان یکی از مهم‌ترین بازیگران نوظهور در صحنۀ هوش مصنوعی شناخته می‌شود و می‌تواند به عاملی تعیین‌کننده در تغییر توازن قدرت میان چین و غرب تبدیل شود.

بیشتر بخوانید  کلیات سند ملی هوش مصنوعی تصویب شد

DeepSeek

ویژگی‌ها و نوآوری‌های DeepSeek R1

هوش مصنوعی DeepSeek R1 با ارائۀ یک مدل زبانی پیشرفته و مقرون‌به‌صرفه، نشان داده است که رقابت در دنیای هوش مصنوعی دیگر محدود به شرکت‌های بزرگ سیلیکون‌ولی نیست. این مدل با ۶۷۱ میلیارد پارامتر، یکی از بزرگ‌ترین مدل‌های زبانی حال حاضر به شمار می‌رود و از یک معماری مبتنی بر Transformer استفاده می‌کند که بهینه‌سازی‌شده برای عملکرد بالاتر و مصرف کمتر منابع محاسباتی است.

قدرت پردازش و معماری DeepSeek R1

مدل هوش مصنوعی DeepSeek R1 برخلاف بسیاری از مدل‌های هم‌رده که نیازمند ابررایانه‌های گران‌قیمت و سخت‌افزارهای پیشرفته هستند، توانسته با بهره‌گیری از روش‌های بهینه‌سازی مصرف منابع، عملکردی قابل‌مقایسه با برترین مدل‌های موجود را ارائه دهد.

برخی از مهم‌ترین ویژگی‌های فنی این مدل عبارت‌اند از:

  • ۶۷۱ میلیارد پارامتر: این حجم عظیم از پارامترها، امکان پردازش و درک زبان طبیعی را با دقتی بالا فراهم می‌کند.
  • مدل دو مرحله‌ای پردازش (Two-stage Training): این هوش مصنوعی از یک رویکرد دو مرحله‌ای برای آموزش استفاده کرده است که شامل پیش‌آموزش گسترده روی حجم عظیمی از داده‌ها و سپس بهینه‌سازی از طریق یادگیری نظارت‌شده و ریزتنظیمات خاص است.
  • کاهش هزینه‌های پردازشی: برخلاف مدل‌هایی مانند GPT-4 که نیازمند میلیاردها دلار سرمایه‌گذاری هستند، DeepSeek R1 تنها با ۵.۶ میلیون دلار توسعه یافته است. این دستاورد، حاصل استفاده از روش‌های هوشمندانه در پردازش داده و تخصیص بهینۀ منابع پردازشی بوده است.

مقایسۀ عملکرد با دیگر مدل‌های پیشرو

هوش مصنوعی DeepSeek R1 در آزمایش‌های متعدد نشان داده که در بسیاری از حوزه‌ها می‌تواند با مدل‌های پیشرفتۀ آمریکایی رقابت کند. برخی از مهم‌ترین مقایسه‌های عملکردی این مدل عبارت‌اند از:

  • مسائل ریاضی: در حل مسائل ریاضی، DeepSeek R1 عملکردی نزدیک به OpenAI-o1 دارد و در برخی آزمون‌های استاندارد مانند GSM8K حتی نتایج بهتری ثبت کرده است.
  • کدنویسی و برنامه‌نویسی: این مدل قادر است کدهای پیچیده را تحلیل، تکمیل و تصحیح کند. آزمایش‌ها نشان داده که عملکرد آن در برخی از چالش‌های برنامه‌نویسی، با مدل‌های برتر OpenAI برابری می‌کند.
  • استدلال منطقی و پاسخ به سؤالات: در تست‌های استاندارد MMLU (مدل‌های ارزیابی درک زبان طبیعی)، DeepSeek R1 توانسته است امتیازاتی نزدیک به ChatGPT-3.5 کسب کند که نشان‌دهندۀ توانایی بالای آن در پردازش زبان طبیعی است.

استفادۀ بهینه از منابع محاسباتی

یکی از برجسته‌ترین جنبه‌های DeepSeek R1، توانایی آن در ارائۀ عملکردی رقابتی با هزینه‌ای بسیار کمتر است. در حالی که توسعۀ مدل‌هایی مانند GPT-4 به میلیاردها دلار سرمایه نیاز دارد، DeepSeek R1 با ۵.۶ میلیون دلار آموزش داده شده است. این صرفه‌جویی قابل‌توجه، نتیجۀ استفاده از تکنیک‌های زیر است:

  • بهینه‌سازی فرایند آموزش مدل، کاهش مصرف انرژی و استفاده از سخت‌افزارهای مقرون‌به‌صرفه
  • تمرکز بر یادگیری بهینۀ داده‌ها، به‌جای افزایش بی‌رویۀ تعداد پارامترها
  • به‌کارگیری روش‌های جدید در پردازش و فشرده‌سازی داده‌ها

تأثیرات بر بازار و واکنش‌ها

ورود DeepSeek R1 به عرصۀ هوش مصنوعی نه‌تنها واکنش‌های گسترده‌ای در دنیای فناوری برانگیخته، بلکه تأثیرات محسوسی بر بازارهای مالی نیز داشته است. انتشار این مدل موجب نگرانی سرمایه‌گذاران در شرکت‌های آمریکایی فعال در حوزۀ هوش مصنوعی شد، به‌ویژه شرکت‌هایی که تاکنون موقعیت انحصاری در این صنعت داشته‌اند.

پس از معرفی DeepSeek R1، ارزش سهام برخی از شرکت‌های مطرح حوزۀ نیمه‌هادی و هوش مصنوعی کاهش یافت. به‌عنوان‌مثال:

  • سهام Nvidia، یکی از تأمین‌کنندگان اصلی پردازنده‌های گرافیکی (GPU) مورد استفاده در آموزش مدل‌های هوش مصنوعی، افتی ۱۷ درصدی را تجربه کرد. دلیل این کاهش، نگرانی از آن بود که مدل‌های چینی بتوانند با استفاده از سخت‌افزارهای ارزان‌تر و بهینه‌تر، نیاز به GPUهای پیشرفته را کاهش دهند.
  • سهام OpenAI و شرکت‌های وابسته به آن، مانند Microsoft، با کاهش ناچیزی مواجه شدند، اما تحلیلگران هشدار داده‌اند که اگر مدل‌های متن‌باز و کم‌هزینه مانند DeepSeek R1 محبوب شوند، ارزش بازار این شرکت‌ها می‌تواند در درازمدت تحت‌تأثیر قرار گیرد.
بیشتر بخوانید  پرسش‌های اساسی برای انتخاب راهکارهای مناسب مبتنی بر هوش مصنوعی در ارتباطات

بازیگران بزرگ سیلیکون ولی، از جمله OpenAI، Google DeepMind و Meta، به دقت عملکرد DeepSeek R1 را زیر نظر گرفته‌اند. برخی از تحلیلگران بر این باورند که ورود DeepSeek به این عرصه می‌تواند باعث تغییر در استراتژی‌های شرکت‌های غربی شود. به‌عنوان‌مثال:

  • Meta، که از پیشگامان مدل‌های متن‌باز است (با انتشار Llama 2)، احتمالاً برای حفظ رقابت‌پذیری خود، روی توسعۀ نسخه‌های جدیدتر و پیشرفته‌تر سرمایه‌گذاری بیشتری خواهد کرد.
  • OpenAI، که تاکنون مدل‌های خود را به‌صورت بسته و غیررایگان ارائه می‌داد، ممکن است برای مقابله با رشد مدل‌های متن‌باز، سیاست‌های جدیدی اتخاذ کند. به‌عنوان‌مثال، OpenAi، دسترسی به مدل O3-Mini را برای کاربران رایگان کرده است.
  • Google DeepMind، که در رقابت با OpenAI مدل‌ Gemini را عرضه کرده، احتمالاً باید استراتژی خود را در قبال مدل‌های چینی بازنگری کند.

چالش‌ها و نگرانی‌ها

  1. محدودیت‌های صادرات تراشه‌های پیشرفته به چین و تأثیر آن بر توسعۀ هوش مصنوعی
    دولت ایالات متحده در سال ۲۰۲۳ محدودیت‌های شدیدی بر صادرات تراشه‌های پیشرفته مانند پردازنده‌های سری A100 و H100 شرکت Nvidia به چین اعمال کرد. هدف از این اقدام، کند کردن پیشرفت چین در توسعۀ مدل‌های هوش مصنوعی پیشرفته بود. بااین‌حال، DeepSeek R1 نشان داده که حتی با این محدودیت‌ها، چین قادر به توسعۀ مدل‌های رقابتی است.
    این مسئله ممکن است مقامات آمریکایی را مجبور کند که رویکرد سخت‌گیرانه‌تری در قبال فناوری‌های هوش مصنوعی چینی اتخاذ کنند، یا حتی دسترسی این مدل‌ها را در بازارهای بین‌المللی محدود نمایند.
  2. نگرانی‌ها دربارهٔ مدل‌های متن‌باز و امنیت سایبری
    انتشار مدل‌های هوش مصنوعی قدرتمند به‌صورت متن‌باز، همزمان که موجب تسریع نوآوری می‌شود، نگرانی‌هایی دربارهٔ امنیت و سوءاستفاده‌های احتمالی ایجاد کرده است. برخی از چالش‌های اصلی این مدل‌ها شامل موارد زیر است:
  • امکان سوءاستفاده در کمپین‌های اطلاعاتی و جعل اخبار: مدل‌های متن‌باز، برخلاف مدل‌های بسته که تحت نظارت شرکت‌های بزرگ هستند، قابل تغییر و سفارشی‌سازی برای مقاصد خاص‌اند. این می‌تواند به انتشار گستردۀ اطلاعات نادرست یا حتی توسعۀ ابزارهای پیشرفته‌تر برای حملات سایبری منجر شود.
  • چالش‌های اخلاقی در توسعۀ هوش مصنوعی در کشورهای مختلف: مدل‌های متن‌باز می‌توانند به‌سرعت توسط دولت‌ها، شرکت‌ها و گروه‌های مختلف اصلاح و برای اهداف خاصی استفاده شوند. به‌همین‌دلیل، برخی کارشناسان پیشنهاد داده‌اند که چارچوب‌های نظارتی جهانی برای کنترل استفاده از مدل‌های هوش مصنوعی متن‌باز ایجاد شود.

انتشار DeepSeek R1، نه‌تنها از نظر فنی، بلکه از نظر ژئوپلیتیکی و اقتصادی نیز تحولی مهم در دنیای هوش مصنوعی محسوب می‌شود. این مدل نشان داده است که چین، حتی تحت فشارهای خارجی و تحریم‌های فناوری، همچنان قادر به توسعۀ مدل‌هایی با سطحی بالا و رقابتی است.

آیا این مدل نقطۀ آغازی برای رقابت جدی‌تر میان چین و ایالات متحده در هوش مصنوعی خواهد بود؟ به نظر می‌رسد که شرکت‌های آمریکایی باید استراتژی‌های خود را بازنگری کنند تا بتوانند در برابر مدل‌های کم‌هزینه‌تر، بهینه‌تر و متن‌باز چینی رقابت کنند.

در نهایت، اگر مدل‌های هوش مصنوعی متن‌باز بتوانند به جریان اصلی این صنعت تبدیل شوند، چشم‌انداز توسعۀ هوش مصنوعی به کلی تغییر خواهد کرد. در سال‌های آینده، احتمالاً شاهد گسترش دسترسی عمومی به مدل‌های هوش مصنوعی، افزایش رقابت میان قدرت‌های جهانی و شاید حتی وضع قوانین سخت‌گیرانه‌تر برای نظارت بر این فناوری باشیم.

آینده متعلق به چه کسی خواهد بود؟ شرکت‌های بزرگ آمریکایی یا استارتاپ‌های چینی که با منابع محدود، مدل‌هایی قدرتمند تولید می‌کنند؟ پاسخ این سؤال در سال‌های پیش رو روشن خواهد شد.

 

Picture of کیارش اقبالی
کیارش اقبالی
دبیر تحریریۀ مُصوّر | مدیر محصول
Picture of کیارش اقبالی
کیارش اقبالی
دبیر تحریریۀ مُصوّر | مدیر محصول

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *