دوشنبه 14 مهر 1404
مدل‌های کمّی بزرگ
Picture of علی شاکر
علی شاکر
پژوهشگر ارتباطات و هوش مصنوعی

فهرست

در سلسله یادداشت‌های پیشین، از رویکردهای گوناگون هوشمندسازی ماشین — از هوش مصنوعی نمادین گرفته تا هوش ارتباط‌گرا و یادگیری تقویتی — صحبت و نحوۀ شکل‌گیری هر کدام را در عرصه‌‌های مختلف روزنامه‌نگاری و روابط‌عمومی بررسی کردیم.

اکنون می‌خواهیم گام تازه‌ای برداریم و دو مفهوم کلیدی را که در سال‌های اخیر برجسته شده‌اند، یعنی مدل‌های زبانی بزرگ (LLMs) و مدل‌های کمّی بزرگ (LQMs)، با هم مقایسه کرده و نقش آن‌ها را در روزنامه‌نگاری داده‌محور و آیندۀ ارتباطات تبیین کنیم. همچنین به این پرسش می‌پردازیم که استفاده از مدل‌های کمّی بزرگ چه پیش‌نیازهایی دارد و روزنامه‌نگاران برای بهره‌برداری از آن‌ها به چه مهارت‌ها و ابزارهایی احتیاج خواهند داشت.

من علی شاکر هستم؛ روزنامه‌نگار و پژوهشگر هوش مصنوعی که می‌خواهم در این سلسله‌ یادداشت‌ها در درجۀ نخست دربارۀ اصول کاربرد هوش مصنوعی در رسانه بیشتر بدانم و بخوانم و بعد آن را در اختیار شما بگذارم.

طی ۱۱ یادداشت «از قلم تا الگوریتم» کم‌وبیش سعی کردیم از پشت دریچۀ روزنامه‌نگاری و روابط‌عمومی به سه رویکرد ابتدایی در مطالعات هوش مصنوعی نگاهی بیندازیم. گفتیم که هوش مصنوعی طی تاریخ کوتاه خود تاکنون سه رویکرد اساسی داشته است. رویکردهای نمادین، ارتباط‌گرا و رفتارگرا.

پیش از ورود به مبحث ال‌ال‌ام‌ها و مدل‌های کمّی بزرگ، به یاد داشته باشیم که هوش مصنوعی مسیری طولانی را از دهه‌های گذشته طی کرده است. در یادداشت‌های قبلی، از سه پارادایم اصلی هوشمندسازی صحبت کردیم:

  1. رویکرد نمادین: مبتنی بر منطق، قوانین و استدلال صریح است. سیستم‌های خبره از این رویکرد برای استنتاج استفاده می‌کنند.
  2. رویکرد ارتباط‌گرا (شبکه‌های عصبی): مبتنی بر یادگیری ماشین از داده‌های فراوان و ساختارهای شبکه‌ای برای شبیه‌سازی یادگیری انسانی استفاده می‌کند.
  3. رویکرد یادگیری تقویتی: مدلی که با آزمون‌وخطا و دریافت پاداش یا تنبیه از محیط، سیاست بهینه برای انجام یک کار را یاد می‌گیرد.

هشدار: بدون خواندن بخش‌های پیشین، خواندن این بخش فقط وقت تلف کردن‌ است.

  1. مقدمه؛ رسانه در عصر هوش مصنوعی
  2. چه شد به ماشین‌ها اجازه دادیم تصمیم بگیرند؟
  3. ظهور هوش مصنوعی نمادین: راه‌حل‌های نوین برای مسائل پیچیده
  4. سیستم‌های خبره چه‌طور محتوای خبری را ارتقا می‌دهند؟
  5. از بحران تا بهبود: نقش هوش مصنوعی در مدیریت روابط‌عمومی
  6. ماشین‌ها چگونه مانند ما یاد می‌گیرند؟ نگاهی به رویکرد ارتباط‌گرا
  7. انتقال تجربۀ روزنامه‌نگارانه به شبکه‌های عصبی؛ چگونه ماشین‌ها احساسات را محاسبه می‌کنند؟
  8. چشم‌های مصنوعی که می‌بینند و می‌فهمند؛ کاربرد شبکه‌های عصبی در تحلیل تصاویر خبری
  9. از تشخیص چهره تا تحلیل اخبار؛ سفر به دنیای شبکه‌های عصبی پیچشی در روزنامه‌نگاری
  10. رمزگشایی از نگاه مخاطبان: کاربرد شبکه‌های عصبی پیچشی در ارزیابی کمپین‌های تبلیغاتی
  11. هوش مصنوعی رفتارگرا، مسیر تازه‌ای در روزنامه‌نگاری: از موشِ آزمایشگاهی تا خبرنگار دیجیتال

 

در عصر حاضر، آنچه بیشتر موردتوجه رسانه‌ها و متخصصان قرار گرفته، مدل‌های زبانی بزرگ (LLM) مانند GPT است. اما دنیای هوش مصنوعی تنها به متون ختم نمی‌شود. همان‌گونه که روزنامه‌نگارانِ امروز برای تحلیل داده‌های آماری یا مالی با چالش‌های جدید روبرو هستند، نسل تازه‌ای از مدل‌ها به نام مدل‌های کَمّی بزرگ (LQM) هم پا به عرصه گذاشته‌اند تا این شکاف را پر کنند.

در این یادداشت به کاربردهای مدل‌های کمّی بزرگ (LQM) و نقش آن در روزنامه‌نگاری داده‌محور می‌پردازیم و مشخص می‌کنیم چه تفاوتی با ال‌ال‌ام‌ها (LLMs) دارد.

ال‌ال‌ام (LLM) چیست؟

مدل‌های زبانی بزرگ یا LLM‌ها، شبکه‌های عصبی غول‌پیکری هستند که برای درک و تولید زبان طبیعی آموزش دیده‌اند. دادۀ ورودی آن‌ها متن است: کتاب‌ها، مقالات، وب‌سایت‌ها و انواع نوشته‌هایی که در اینترنت می‌توان یافت. هدف این مدل‌ها، پیش‌بینی کلمۀ بعدی در یک جمله، خلاصه‌سازی، ترجمه، یا پاسخ به پرسش‌های متنی است. از جمله کاربردهای معروف آن می‌توان به چت‌بات‌ها، سیستم‌های پاسخ‌گویی خودکار، ابزارهای تولید محتوا و حتی تولید کد در برنامه‌نویسی اشاره کرد.

برای یک روزنامه‌نگار، «مدل‌های زبانی بزرگ» زمانی جذاب می‌شود که بخواهد از آن برای نگارش سریع گزارش، ویراستاری متون، یافتن ایده‌های جدید یا مصاحبه با یک «ربات گزارشگر» استفاده کند. همچنین در عرصۀ ارتباطات و روابط‌عمومی، این مدل‌ها می‌توانند برای پاسخ‌گویی به پرسش‌های متداول یا تولید بیانیه‌های خبری به کار روند. مهم‌ترین نقطۀ قوت مدل‌های زبانی بزرگ درک ساختار زبان و تولید متن به نسبت روان و معنادار است.

ال.‌کیو.‌ام (LQM) چیست؟

در مقابل، «مدل‌های کمّی بزرگ» (LQM) روی داده‌های عددی و آماری تمرکز دارند. اگر مدل‌های زبانی بزرگ درک زبان را انجام می‌دهند، مدل‌های کمّی بزرگ هم با حجم عظیمی از داده‌های کمّی (مانند قیمت سهام، شاخص‌های اقتصادی، داده‌های هواشناسی، داده‌های سنجش از راه دور و…) تغذیه می‌شوند تا الگوهای پنهان در این اعداد را کشف کنند. این مد‌ل‌ها می‌توانند پیچیده‌ترین مدل‌های آماری، پیش‌بینی‌های زمانی، ریسک‌سنجی مالی، تحلیل سناریو، یا حتی شبیه‌سازی پدیده‌های فیزیکی را انجام دهند.

در یک تحریریه یا اتاق خبر داده‌محور، مدل‌های کَمّی بزرگ می‌تواند منبع قدرتمندی برای تحلیل داده‌های آماری باشد؛ مثلاً برای پیش‌بینی نتایج انتخابات بر اساس نظرسنجی‌های گسترده، تحلیل تأثیر تغییرات آب‌وهوایی بر حوزۀ کشاورزی، یا ارزیابی شاخص‌های اقتصادی در سطح کلان. این مدل‌ها به‌ویژه در زمینۀ «روزنامه‌نگاری داده‌محور» اهمیت فراوانی پیدا می‌کنند، جایی که خبرنگار نیاز به درک و تحلیل عمیق داده‌های ساختارمند دارد.

بیشتر بخوانید  از کودتای لیتیوم تا سلطه بر ایکس: نقشۀ راه قدرت‌یابی ایلان ماسک

تفاوت کلیدی LLM و LQM

ویژگی مدل زبانی بزرگ
(Large Language Model)
مدل کمّی بزرگ
(Large Quantitative Model)
نوع داده ورودی متن و زبان طبیعی داده‌های عددی، آماری، سری‌های زمانی، سنجش‌های کمی
کاربرد اصلی تولید و درک متن، پاسخ به سؤالات، ترجمه، تلخیص پیش‌بینی کمّی، تحلیل آماری، بهینه‌سازی، شبیه‌سازی
ساختار شبکه معمولاً مبتنی بر معماری‌های ترنسفورمر یا RNN در قلمرو زبان ممکن است از شبکه‌های عصبی خاص، مدل‌های آماری پیچیده (مانند شبکه‌های بیزی)، یا ترکیب روش‌های یادگیری ماشینی و روش‌های سنتی آماری بهره ببرد.
چالش‌های اجرایی مدیریت سوگیری متنی، کنترل محتوای نامناسب، محدودیت منابع محاسباتی مدیریت داده‌های با کیفیت، یکپارچه‌سازی منابع متعدد، تفسیر نتایج آماری پیچیده

نقش LLMs و LQMs در روزنامه‌نگاری داده‌محور

امروزه بسیاری از تحریریه‌ها در سراسر جهان تلاش می‌کنند تا فراتر از اخبار ساده و متنی حرکت کنند و به روزنامه‌نگاری داده‌محور روی‌آورند. در این رویکرد، داده‌های کمّی به ستون فقرات گزارش‌های تحقیقی، اینفوگرافیک‌ها و تحلیل‌های عمیق بدل می‌شوند. ابزارهای مرتبط با مدل زبانی بزرگ می‌توانند به خبرنگار کمک کنند تا سؤالات پژوهشی خود را شفاف‌تر و دقیق‌تر کنند و متونی روان برای توضیح داده‌ها بنویسد یا حتی اطلاعات پس‌زمینه‌ای لازم برای درک مسائل پیچیده را به دست آورد. از سوی دیگر، مدل‌های کمّی بزرگ می‌توانند داده‌های کلان را تحلیل و الگوهای مهم را به شکلی عمیق‌تر کشف کند. نتیجۀ هم‌افزایی این دو مدل می‌تواند گزارشی باشد که هم از نظر قدرت تحلیل آماری و هم از نظر بیان و روایت، غنی و کارآمد است.

تصور کنید در حوزۀ اقتصاد، خبرنگاری قصد دارد روند تورم یا نوسان ارزی را در بازه‌ای ده‌ساله بررسی کند. مدل کمّی بزرگ با تحلیل سری زمانی داده‌های اقتصادی، الگوها و پیش‌بینی‌های محتمل را ارائه می‌دهد و مدل زبانی بزرگ این خروجی را دریافت کرده، در قالب متنی قابل‌فهم برای مخاطب، خلاصه و روایت می‌کند. چنین رویکردی ضمن سرعت‌بخشی به فرایند روزنامه‌نگاری، عمق بیشتری نیز به تحلیل می‌بخشد.

آیا برای استفاده از مدل‌های کمّی بزرگ باید با اصول علوم داده آشنا باشیم؟

بله، و هرچه پیش‌تر برویم این نیاز پررنگ‌تر می‌شود. مدل‌های کمّی بزرگ به طور ذاتی با مسائل پیچیدۀ آماری و ریاضی سروکار دارند. در نتیجه، برای استفادۀ مؤثر از آن‌، می‌بایست روزنامه‌نگاران و تحلیل‌گران داده درکی پایه‌ای از مباحث زیر داشته باشند:

  1. آمار و احتمال: فهم مفاهیم اولیه همچون میانگین، واریانس، توزیع‌های احتمالی و روش‌های آماری.
  2. یادگیری ماشینی: شناخت انواع الگوریتم‌های یادگیری نظارت‌شده، بدون نظارت و تقویتی و آگاهی از نحوۀ ارزیابی مدل‌ها (Accuracy، Precision، Recall و…).
  3. پاک‌سازی و مدیریت داده: روش‌های شناسایی داده‌های پرت، مدیریت داده‌های گمشده و انتخاب ویژگی‌های مهم برای مدل‌سازی.
  4. تفسیر نتایج: مهم‌ترین بخش کار، توانایی ترجمۀ خروجی مدل به زبان ساده و بیان محدودیت‌های مدل است.

هرچه قدر روزنامه‌نگار با این مفاهیم آشناتر باشد، بهتر می‌تواند نتایج حاصل از مدل را بررسی کند، سوگیری‌های ممکن را تشخیص دهد و گزارش‌های دقیقی منتشر کند. در غیر این صورت، ممکن است با سیاه‌جعبه‌هایی مواجه شود که خروجی‌شان رمزآلود است و هیچ مبنای محکم برای روایت خبری به دست نمی‌دهد.

LQM و آیندۀ روزنامه‌نگاری

ازآنجایی‌که یکی از ویژگی‌های روزنامه‌نگاران در جهان این است که مباحث پیچیدۀ مالی را به زبانی همه‌فهم و ساده بیان می‌کنند، باید گفت که استفاده از ابزارهایی که در زمینه‌های اعداد و ارقام و استخراج الگوهای عددی تخصص دارند، می‌تواند به ابزار مناسبی برای روزنامه‌نگار تبدیل شود تا به کمک آن بتواند بر شفافیت و تأثیر گزارشی که تهیه می‌کند، بیفزاید.

۱. ترکیب قدرت زبانی و کمّی

یکی از مهم‌ترین روندهای آتی، تلفیق مدل‌های زبانی بزرگ و مدل‌های کمّی بزرگ در ابزارهای هیبریدی است. این ابزارها می‌توانند هم داده‌های کمّی را تحلیل کنند و هم نتایج را در قالب زبان طبیعی برای خبرنگار یا مخاطب توضیح دهند. به‌عبارت‌دیگر، بخش تحلیلی و توصیفی به شکلی هم‌افزا در اختیار تحریریه قرار می‌گیرد.

۲. سرعت بیشتر در تولید محتوای عمیق

با گسترش دیتاست‌های عمومی و پیشرفت سخت‌افزارها، فرایند تحلیل داده به‌صورت بی‌درنگ[1] انجام می‌شود. نتیجه این می‌شود که در جریان رویدادهای مهم سیاسی، اقتصادی یا اجتماعی، خبرنگاران می‌توانند خیلی سریع الگوها را تشخیص دهند و تحلیل‌های دقیقی ارائه کنند، بدون آنکه چند روز در انتظار گزارش‌های تحلیلی باقی بمانند.

۳. چالش‌های اخلاقی و شفافیت

با افزایش نقش مدل‌های کمّی بزرگ و مدل‌های زبانی بزرگ در تصمیم‌گیری و شکل‌دهی به روایت رسانه‌ها، پرسش‌هایی دربارۀ شفافیت و پاسخ‌گویی این مدل‌ها مطرح می‌شود. همان‌طور که یک خبرنگار در مواجهه با منبع خبر انسانی، سوگیری‌ها و انگیزه‌های او را ارزیابی می‌کند، در مواجهه با مدل‌های هوش مصنوعی نیز باید به ساختار داده، روش آموزش و امکان سوگیری الگوریتمیک حساس باشد.
روزنامه‌نگاران آینده، ترکیبی از مهارت‌های سنتی نوشتن و گزارشگری را با دانش تحلیلی و فناورانه ترکیب می‌کنند. اصول بازجویی از داده[2] در کنار اصول نگارش حرفه‌ای، نقش مهمی را در موفقیت رسانه‌ها ایفا خواهد کرد.

بیشتر بخوانید  سهم تاکسی‌های اینترنتی از کل سفرهای درون‌شهری کمتر از ۶‌ درصد است

در فرایند بازجویی از داده، داده‌ها تحلیل و ارزیابی می‌شوند تا صحت، دقت و کامل‌بودنشان تضمین شود. هدف از این بررسی‌ها، شناسایی و تصحیح خطاها، حذف داده‌های نادرست یا ناقص و اطمینان از کیفیت بالای داده‌ها برای استفاده در تحلیل‌ها و تصمیم‌گیری‌هاست.

این فرایند شامل مراحلی مانند پاک‌سازی داده‌ها، شناسایی ناهنجاری‌ها، بررسی سازگاری و یکپارچگی داده‌ها و اطمینان از انطباق آن‌ با استانداردهای موردنیاز است. با انجام «بازجویی از داده»، می‌توان به نتایج تحلیلی قابل اعتمادتر و تصمیم‌گیری‌های مؤثرتری دست یافت.

پرسش‌های مرسوم

چطور می‌توانم داده‌هایم را برای مدل کمّی بزرگ آماده کنم؟

ابتدا باید داده‌های خود را تمیز و یکپارچه کرده، فرمت آن‌ها را استاندارد کنید (مثلاً در قالب CSV یا SQL). سپس باید شاخص‌های مهم را بر اساس پرسش اصلی شناسایی و انتخاب کنید. در نهایت، ممکن است نیاز باشد داده‌ها را نرمال‌سازی کرده و به‌صورت سری زمانی یا جداول چندبعدی سازمان‌دهی نمایید.

چه مقدار داده برای آموزش مدل کمّی بزرگ (LQM) لازم است؟

وابسته به مسئله و حوزۀ کاری است. برای پیش‌بینی مالی پیچیده، داده‌های تاریخی چندساله و چندبعدی نیاز دارید. برای بررسی الگوهای ساده‌تر، ممکن است دادۀ کمتری کفایت کند. به‌طورکلی، هرچه دادۀ بیشتری داشته باشید، مدل شما می‌تواند الگوهای پیچیده‌تری را کشف کند.

اگر دانش کافی در علوم داده نداشته باشم، آیا می‌توانم از مدل کمّی بزرگ استفاده کنم؟

امروزه پلتفرم‌های خودکارسازی یادگیری ماشین (AutoML) یا ابزارهای آنلاین زیادی وجود دارد که فرایند مدل‌سازی را ساده کرده‌اند. بااین‌حال، برای درک صحیح خروجی و محدودیت‌های مدل، یادگیری مبانی علوم داده و آمار توصیه می‌شود. بدون این دانش، امکان تفسیر نادرست نتایج بالا می‌رود.

مدل‌های کمّی بزرگ چه‌قدر قابل اعتمادند؟

میزان اعتماد به خروجی مدل کمّی بزرگ به کیفیت داده، ساختار مدل و دقت فرایند ارزیابی بستگی دارد. نباید خروجی هیچ مدل هوش مصنوعی را حقیقت مطلق پنداشت؛ بلکه مثل سایر منابع خبری، باید با نگاه انتقادی و راستی‌آزمایی به آن نگریست.

چه کسی مسئول خطاهای احتمالی مدل است؟

این پرسش به همان موضوع اخلاق در هوش مصنوعی بازمی‌گردد. در نهایت، سازمان خبری یا روزنامه‌نگاری که از مدل استفاده می‌کند مسئول راستی‌آزمایی نتایج است. مدل ممکن است خطا کند یا سوگیری داشته باشد؛ این شما هستید که باید پیش از انتشار خروجی، صحت آن را بسنجید و به مخاطبان اطلاع دهید.

***

روزنامه‌نگاری در عصر هوش مصنوعی تنها به مهارت نوشتن و مصاحبه خلاصه نمی‌شود. امروز، با ظهور مدل‌های زبانی بزرگ (LLMs)، گامی بزرگ به سمت هوش زبانی برداشته‌ایم و شاهد چت‌بات‌هایی هستیم که می‌توانند متن‌های قابل‌درک و روان بنویسند یا حتی تحلیل محتوای متنی انجام دهند.

در کنار آن، ظهور مدل‌های کمّی بزرگ (LQMs) نیز نشان‌دهندۀ راهکاری قدرتمند در مواجهه با داده‌های انبوه کمّی است. راهکاری که می‌تواند چراغ راهی برای روزنامه‌نگاران داده‌محور باشد. اما بهره‌مندی از این ظرفیت عظیم، بدون درک مفاهیم پایه‌ای علوم داده و یادگیری ماشینی میسر نخواهد بود.

روزنامه‌نگاران آینده نیازمند ترکیبی از مهارت‌های سنتی و مدرن‌اند: درکی عمیق از روش‌های مصاحبه و روایت‌سازی خبری در کنار توانایی تحلیل داده‌های عظیم با استفاده از ابزارهای هوش مصنوعی. مدل‌های کمّی بزرگ و مدل‌های زبانی بزرگ در کنار هم می‌توانند زنجیره‌ای کامل از «تحلیل داده» تا «تولید محتوا» را شکل دهند، اما نباید فراموش کرد که مسئولیت صحت و اعتبار اطلاعات نهایی بر دوش خبرنگار است. این ابزارها امکانات تازه‌ای فراهم می‌کنند، اما در نهایت خبرنگاران هستند که باید تصمیم بگیرند چگونه و در چه مسیری از هوش مصنوعی برای روایت حقیقت بهره ببرند.

اینجاست که روزنامه‌نگاران علاوه بر آشنایی با کتابخانه‌های یادگیری ماشین (مانند TensorFlow و  PyTorch) و ابزارهای تحلیل داده (مثل pandas و NumPy)، حتماً می‌بایست مبانی آماری و روش‌های کمّی پژوهش را هم بدانند. متأسفانه گاهی مبانی آمار و روش‌های کمّی چندان جدی گرفته نمی‌شود و اکنون می‌دانیم که فهم این مباحث چه‌قدر می‌تواند در کیفیت کار یک روزنامه‌نگار تأثیر بگذارد.

پس به جز اینکه از مدل‌های کمّی بزرگ در گزارش‌های تحلیلی خود کمک می‌گیریم، می‌توانیم به درک کامل‌تری از محدودیت‌ها، سوگیری‌ها و کاربردهای صحیح آن برسیم. آیندۀ روزنامه‌نگاری به این پیوند میان هوش انسانی و هوش ماشینی گره‌خورده است؛ پیوندی که اگر به‌درستی مدیریت شود، می‌تواند افق‌های تازه‌ای را در ارائۀ اخبار و گزارش‌های دقیق و عمیق بگشاید.

 

منابع مورد استفاده:

DecoupLinkAI™. (2024, November 23). What’s the difference between LLMs & LQMs, or Large Language Models & Large Quantitative Models? DecoupLinkAI™. https://decouplinkai.medium.com/whats-the-difference-between-llms-lqms-or-large-language-models-large-quantitative-models-c0cddddf6b21

Laghari, R. (2024, August 11). The Future of AI: Large Quantitative Models (LQMs) as the Next Frontier in Data-Driven Decision Making. Medium. https://medium.com/@riazleghari/the-future-of-ai-large-quantitative-models-lqms-as-the-next-frontier-in-data-driven-decision-89b9a9aad76f

[1] Real-Time

[2] Data Scrutiny

Picture of علی شاکر
علی شاکر
پژوهشگر ارتباطات و هوش مصنوعی
Picture of علی شاکر
علی شاکر
پژوهشگر ارتباطات و هوش مصنوعی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *