در سلسله یادداشتهای پیشین، از رویکردهای گوناگون هوشمندسازی ماشین — از هوش مصنوعی نمادین گرفته تا هوش ارتباطگرا و یادگیری تقویتی — صحبت و نحوۀ شکلگیری هر کدام را در عرصههای مختلف روزنامهنگاری و روابطعمومی بررسی کردیم.
اکنون میخواهیم گام تازهای برداریم و دو مفهوم کلیدی را که در سالهای اخیر برجسته شدهاند، یعنی مدلهای زبانی بزرگ (LLMs) و مدلهای کمّی بزرگ (LQMs)، با هم مقایسه کرده و نقش آنها را در روزنامهنگاری دادهمحور و آیندۀ ارتباطات تبیین کنیم. همچنین به این پرسش میپردازیم که استفاده از مدلهای کمّی بزرگ چه پیشنیازهایی دارد و روزنامهنگاران برای بهرهبرداری از آنها به چه مهارتها و ابزارهایی احتیاج خواهند داشت.
من علی شاکر هستم؛ روزنامهنگار و پژوهشگر هوش مصنوعی که میخواهم در این سلسله یادداشتها در درجۀ نخست دربارۀ اصول کاربرد هوش مصنوعی در رسانه بیشتر بدانم و بخوانم و بعد آن را در اختیار شما بگذارم.
طی ۱۱ یادداشت «از قلم تا الگوریتم» کموبیش سعی کردیم از پشت دریچۀ روزنامهنگاری و روابطعمومی به سه رویکرد ابتدایی در مطالعات هوش مصنوعی نگاهی بیندازیم. گفتیم که هوش مصنوعی طی تاریخ کوتاه خود تاکنون سه رویکرد اساسی داشته است. رویکردهای نمادین، ارتباطگرا و رفتارگرا.
پیش از ورود به مبحث الالامها و مدلهای کمّی بزرگ، به یاد داشته باشیم که هوش مصنوعی مسیری طولانی را از دهههای گذشته طی کرده است. در یادداشتهای قبلی، از سه پارادایم اصلی هوشمندسازی صحبت کردیم:
- رویکرد نمادین: مبتنی بر منطق، قوانین و استدلال صریح است. سیستمهای خبره از این رویکرد برای استنتاج استفاده میکنند.
- رویکرد ارتباطگرا (شبکههای عصبی): مبتنی بر یادگیری ماشین از دادههای فراوان و ساختارهای شبکهای برای شبیهسازی یادگیری انسانی استفاده میکند.
- رویکرد یادگیری تقویتی: مدلی که با آزمونوخطا و دریافت پاداش یا تنبیه از محیط، سیاست بهینه برای انجام یک کار را یاد میگیرد.
هشدار: بدون خواندن بخشهای پیشین، خواندن این بخش فقط وقت تلف کردن است.
- مقدمه؛ رسانه در عصر هوش مصنوعی
- چه شد به ماشینها اجازه دادیم تصمیم بگیرند؟
- ظهور هوش مصنوعی نمادین: راهحلهای نوین برای مسائل پیچیده
- سیستمهای خبره چهطور محتوای خبری را ارتقا میدهند؟
- از بحران تا بهبود: نقش هوش مصنوعی در مدیریت روابطعمومی
- ماشینها چگونه مانند ما یاد میگیرند؟ نگاهی به رویکرد ارتباطگرا
- انتقال تجربۀ روزنامهنگارانه به شبکههای عصبی؛ چگونه ماشینها احساسات را محاسبه میکنند؟
- چشمهای مصنوعی که میبینند و میفهمند؛ کاربرد شبکههای عصبی در تحلیل تصاویر خبری
- از تشخیص چهره تا تحلیل اخبار؛ سفر به دنیای شبکههای عصبی پیچشی در روزنامهنگاری
- رمزگشایی از نگاه مخاطبان: کاربرد شبکههای عصبی پیچشی در ارزیابی کمپینهای تبلیغاتی
- هوش مصنوعی رفتارگرا، مسیر تازهای در روزنامهنگاری: از موشِ آزمایشگاهی تا خبرنگار دیجیتال
در عصر حاضر، آنچه بیشتر موردتوجه رسانهها و متخصصان قرار گرفته، مدلهای زبانی بزرگ (LLM) مانند GPT است. اما دنیای هوش مصنوعی تنها به متون ختم نمیشود. همانگونه که روزنامهنگارانِ امروز برای تحلیل دادههای آماری یا مالی با چالشهای جدید روبرو هستند، نسل تازهای از مدلها به نام مدلهای کَمّی بزرگ (LQM) هم پا به عرصه گذاشتهاند تا این شکاف را پر کنند.
در این یادداشت به کاربردهای مدلهای کمّی بزرگ (LQM) و نقش آن در روزنامهنگاری دادهمحور میپردازیم و مشخص میکنیم چه تفاوتی با الالامها (LLMs) دارد.
الالام (LLM) چیست؟
مدلهای زبانی بزرگ یا LLMها، شبکههای عصبی غولپیکری هستند که برای درک و تولید زبان طبیعی آموزش دیدهاند. دادۀ ورودی آنها متن است: کتابها، مقالات، وبسایتها و انواع نوشتههایی که در اینترنت میتوان یافت. هدف این مدلها، پیشبینی کلمۀ بعدی در یک جمله، خلاصهسازی، ترجمه، یا پاسخ به پرسشهای متنی است. از جمله کاربردهای معروف آن میتوان به چتباتها، سیستمهای پاسخگویی خودکار، ابزارهای تولید محتوا و حتی تولید کد در برنامهنویسی اشاره کرد.
برای یک روزنامهنگار، «مدلهای زبانی بزرگ» زمانی جذاب میشود که بخواهد از آن برای نگارش سریع گزارش، ویراستاری متون، یافتن ایدههای جدید یا مصاحبه با یک «ربات گزارشگر» استفاده کند. همچنین در عرصۀ ارتباطات و روابطعمومی، این مدلها میتوانند برای پاسخگویی به پرسشهای متداول یا تولید بیانیههای خبری به کار روند. مهمترین نقطۀ قوت مدلهای زبانی بزرگ درک ساختار زبان و تولید متن به نسبت روان و معنادار است.
ال.کیو.ام (LQM) چیست؟
در مقابل، «مدلهای کمّی بزرگ» (LQM) روی دادههای عددی و آماری تمرکز دارند. اگر مدلهای زبانی بزرگ درک زبان را انجام میدهند، مدلهای کمّی بزرگ هم با حجم عظیمی از دادههای کمّی (مانند قیمت سهام، شاخصهای اقتصادی، دادههای هواشناسی، دادههای سنجش از راه دور و…) تغذیه میشوند تا الگوهای پنهان در این اعداد را کشف کنند. این مدلها میتوانند پیچیدهترین مدلهای آماری، پیشبینیهای زمانی، ریسکسنجی مالی، تحلیل سناریو، یا حتی شبیهسازی پدیدههای فیزیکی را انجام دهند.
در یک تحریریه یا اتاق خبر دادهمحور، مدلهای کَمّی بزرگ میتواند منبع قدرتمندی برای تحلیل دادههای آماری باشد؛ مثلاً برای پیشبینی نتایج انتخابات بر اساس نظرسنجیهای گسترده، تحلیل تأثیر تغییرات آبوهوایی بر حوزۀ کشاورزی، یا ارزیابی شاخصهای اقتصادی در سطح کلان. این مدلها بهویژه در زمینۀ «روزنامهنگاری دادهمحور» اهمیت فراوانی پیدا میکنند، جایی که خبرنگار نیاز به درک و تحلیل عمیق دادههای ساختارمند دارد.
تفاوت کلیدی LLM و LQM
ویژگی | مدل زبانی بزرگ (Large Language Model) |
مدل کمّی بزرگ (Large Quantitative Model) |
نوع داده ورودی | متن و زبان طبیعی | دادههای عددی، آماری، سریهای زمانی، سنجشهای کمی |
کاربرد اصلی | تولید و درک متن، پاسخ به سؤالات، ترجمه، تلخیص | پیشبینی کمّی، تحلیل آماری، بهینهسازی، شبیهسازی |
ساختار شبکه | معمولاً مبتنی بر معماریهای ترنسفورمر یا RNN در قلمرو زبان | ممکن است از شبکههای عصبی خاص، مدلهای آماری پیچیده (مانند شبکههای بیزی)، یا ترکیب روشهای یادگیری ماشینی و روشهای سنتی آماری بهره ببرد. |
چالشهای اجرایی | مدیریت سوگیری متنی، کنترل محتوای نامناسب، محدودیت منابع محاسباتی | مدیریت دادههای با کیفیت، یکپارچهسازی منابع متعدد، تفسیر نتایج آماری پیچیده |
نقش LLMs و LQMs در روزنامهنگاری دادهمحور
امروزه بسیاری از تحریریهها در سراسر جهان تلاش میکنند تا فراتر از اخبار ساده و متنی حرکت کنند و به روزنامهنگاری دادهمحور رویآورند. در این رویکرد، دادههای کمّی به ستون فقرات گزارشهای تحقیقی، اینفوگرافیکها و تحلیلهای عمیق بدل میشوند. ابزارهای مرتبط با مدل زبانی بزرگ میتوانند به خبرنگار کمک کنند تا سؤالات پژوهشی خود را شفافتر و دقیقتر کنند و متونی روان برای توضیح دادهها بنویسد یا حتی اطلاعات پسزمینهای لازم برای درک مسائل پیچیده را به دست آورد. از سوی دیگر، مدلهای کمّی بزرگ میتوانند دادههای کلان را تحلیل و الگوهای مهم را به شکلی عمیقتر کشف کند. نتیجۀ همافزایی این دو مدل میتواند گزارشی باشد که هم از نظر قدرت تحلیل آماری و هم از نظر بیان و روایت، غنی و کارآمد است.
تصور کنید در حوزۀ اقتصاد، خبرنگاری قصد دارد روند تورم یا نوسان ارزی را در بازهای دهساله بررسی کند. مدل کمّی بزرگ با تحلیل سری زمانی دادههای اقتصادی، الگوها و پیشبینیهای محتمل را ارائه میدهد و مدل زبانی بزرگ این خروجی را دریافت کرده، در قالب متنی قابلفهم برای مخاطب، خلاصه و روایت میکند. چنین رویکردی ضمن سرعتبخشی به فرایند روزنامهنگاری، عمق بیشتری نیز به تحلیل میبخشد.
آیا برای استفاده از مدلهای کمّی بزرگ باید با اصول علوم داده آشنا باشیم؟
بله، و هرچه پیشتر برویم این نیاز پررنگتر میشود. مدلهای کمّی بزرگ به طور ذاتی با مسائل پیچیدۀ آماری و ریاضی سروکار دارند. در نتیجه، برای استفادۀ مؤثر از آن، میبایست روزنامهنگاران و تحلیلگران داده درکی پایهای از مباحث زیر داشته باشند:
- آمار و احتمال: فهم مفاهیم اولیه همچون میانگین، واریانس، توزیعهای احتمالی و روشهای آماری.
- یادگیری ماشینی: شناخت انواع الگوریتمهای یادگیری نظارتشده، بدون نظارت و تقویتی و آگاهی از نحوۀ ارزیابی مدلها (Accuracy، Precision، Recall و…).
- پاکسازی و مدیریت داده: روشهای شناسایی دادههای پرت، مدیریت دادههای گمشده و انتخاب ویژگیهای مهم برای مدلسازی.
- تفسیر نتایج: مهمترین بخش کار، توانایی ترجمۀ خروجی مدل به زبان ساده و بیان محدودیتهای مدل است.
هرچه قدر روزنامهنگار با این مفاهیم آشناتر باشد، بهتر میتواند نتایج حاصل از مدل را بررسی کند، سوگیریهای ممکن را تشخیص دهد و گزارشهای دقیقی منتشر کند. در غیر این صورت، ممکن است با سیاهجعبههایی مواجه شود که خروجیشان رمزآلود است و هیچ مبنای محکم برای روایت خبری به دست نمیدهد.
LQM و آیندۀ روزنامهنگاری
ازآنجاییکه یکی از ویژگیهای روزنامهنگاران در جهان این است که مباحث پیچیدۀ مالی را به زبانی همهفهم و ساده بیان میکنند، باید گفت که استفاده از ابزارهایی که در زمینههای اعداد و ارقام و استخراج الگوهای عددی تخصص دارند، میتواند به ابزار مناسبی برای روزنامهنگار تبدیل شود تا به کمک آن بتواند بر شفافیت و تأثیر گزارشی که تهیه میکند، بیفزاید.
۱. ترکیب قدرت زبانی و کمّی
یکی از مهمترین روندهای آتی، تلفیق مدلهای زبانی بزرگ و مدلهای کمّی بزرگ در ابزارهای هیبریدی است. این ابزارها میتوانند هم دادههای کمّی را تحلیل کنند و هم نتایج را در قالب زبان طبیعی برای خبرنگار یا مخاطب توضیح دهند. بهعبارتدیگر، بخش تحلیلی و توصیفی به شکلی همافزا در اختیار تحریریه قرار میگیرد.
۲. سرعت بیشتر در تولید محتوای عمیق
با گسترش دیتاستهای عمومی و پیشرفت سختافزارها، فرایند تحلیل داده بهصورت بیدرنگ[1] انجام میشود. نتیجه این میشود که در جریان رویدادهای مهم سیاسی، اقتصادی یا اجتماعی، خبرنگاران میتوانند خیلی سریع الگوها را تشخیص دهند و تحلیلهای دقیقی ارائه کنند، بدون آنکه چند روز در انتظار گزارشهای تحلیلی باقی بمانند.
۳. چالشهای اخلاقی و شفافیت
با افزایش نقش مدلهای کمّی بزرگ و مدلهای زبانی بزرگ در تصمیمگیری و شکلدهی به روایت رسانهها، پرسشهایی دربارۀ شفافیت و پاسخگویی این مدلها مطرح میشود. همانطور که یک خبرنگار در مواجهه با منبع خبر انسانی، سوگیریها و انگیزههای او را ارزیابی میکند، در مواجهه با مدلهای هوش مصنوعی نیز باید به ساختار داده، روش آموزش و امکان سوگیری الگوریتمیک حساس باشد.
روزنامهنگاران آینده، ترکیبی از مهارتهای سنتی نوشتن و گزارشگری را با دانش تحلیلی و فناورانه ترکیب میکنند. اصول بازجویی از داده[2] در کنار اصول نگارش حرفهای، نقش مهمی را در موفقیت رسانهها ایفا خواهد کرد.
در فرایند بازجویی از داده، دادهها تحلیل و ارزیابی میشوند تا صحت، دقت و کاملبودنشان تضمین شود. هدف از این بررسیها، شناسایی و تصحیح خطاها، حذف دادههای نادرست یا ناقص و اطمینان از کیفیت بالای دادهها برای استفاده در تحلیلها و تصمیمگیریهاست.
این فرایند شامل مراحلی مانند پاکسازی دادهها، شناسایی ناهنجاریها، بررسی سازگاری و یکپارچگی دادهها و اطمینان از انطباق آن با استانداردهای موردنیاز است. با انجام «بازجویی از داده»، میتوان به نتایج تحلیلی قابل اعتمادتر و تصمیمگیریهای مؤثرتری دست یافت.
پرسشهای مرسوم
چطور میتوانم دادههایم را برای مدل کمّی بزرگ آماده کنم؟
ابتدا باید دادههای خود را تمیز و یکپارچه کرده، فرمت آنها را استاندارد کنید (مثلاً در قالب CSV یا SQL). سپس باید شاخصهای مهم را بر اساس پرسش اصلی شناسایی و انتخاب کنید. در نهایت، ممکن است نیاز باشد دادهها را نرمالسازی کرده و بهصورت سری زمانی یا جداول چندبعدی سازماندهی نمایید.
چه مقدار داده برای آموزش مدل کمّی بزرگ (LQM) لازم است؟
وابسته به مسئله و حوزۀ کاری است. برای پیشبینی مالی پیچیده، دادههای تاریخی چندساله و چندبعدی نیاز دارید. برای بررسی الگوهای سادهتر، ممکن است دادۀ کمتری کفایت کند. بهطورکلی، هرچه دادۀ بیشتری داشته باشید، مدل شما میتواند الگوهای پیچیدهتری را کشف کند.
اگر دانش کافی در علوم داده نداشته باشم، آیا میتوانم از مدل کمّی بزرگ استفاده کنم؟
امروزه پلتفرمهای خودکارسازی یادگیری ماشین (AutoML) یا ابزارهای آنلاین زیادی وجود دارد که فرایند مدلسازی را ساده کردهاند. بااینحال، برای درک صحیح خروجی و محدودیتهای مدل، یادگیری مبانی علوم داده و آمار توصیه میشود. بدون این دانش، امکان تفسیر نادرست نتایج بالا میرود.
مدلهای کمّی بزرگ چهقدر قابل اعتمادند؟
میزان اعتماد به خروجی مدل کمّی بزرگ به کیفیت داده، ساختار مدل و دقت فرایند ارزیابی بستگی دارد. نباید خروجی هیچ مدل هوش مصنوعی را حقیقت مطلق پنداشت؛ بلکه مثل سایر منابع خبری، باید با نگاه انتقادی و راستیآزمایی به آن نگریست.
چه کسی مسئول خطاهای احتمالی مدل است؟
این پرسش به همان موضوع اخلاق در هوش مصنوعی بازمیگردد. در نهایت، سازمان خبری یا روزنامهنگاری که از مدل استفاده میکند مسئول راستیآزمایی نتایج است. مدل ممکن است خطا کند یا سوگیری داشته باشد؛ این شما هستید که باید پیش از انتشار خروجی، صحت آن را بسنجید و به مخاطبان اطلاع دهید.
***
روزنامهنگاری در عصر هوش مصنوعی تنها به مهارت نوشتن و مصاحبه خلاصه نمیشود. امروز، با ظهور مدلهای زبانی بزرگ (LLMs)، گامی بزرگ به سمت هوش زبانی برداشتهایم و شاهد چتباتهایی هستیم که میتوانند متنهای قابلدرک و روان بنویسند یا حتی تحلیل محتوای متنی انجام دهند.
در کنار آن، ظهور مدلهای کمّی بزرگ (LQMs) نیز نشاندهندۀ راهکاری قدرتمند در مواجهه با دادههای انبوه کمّی است. راهکاری که میتواند چراغ راهی برای روزنامهنگاران دادهمحور باشد. اما بهرهمندی از این ظرفیت عظیم، بدون درک مفاهیم پایهای علوم داده و یادگیری ماشینی میسر نخواهد بود.
روزنامهنگاران آینده نیازمند ترکیبی از مهارتهای سنتی و مدرناند: درکی عمیق از روشهای مصاحبه و روایتسازی خبری در کنار توانایی تحلیل دادههای عظیم با استفاده از ابزارهای هوش مصنوعی. مدلهای کمّی بزرگ و مدلهای زبانی بزرگ در کنار هم میتوانند زنجیرهای کامل از «تحلیل داده» تا «تولید محتوا» را شکل دهند، اما نباید فراموش کرد که مسئولیت صحت و اعتبار اطلاعات نهایی بر دوش خبرنگار است. این ابزارها امکانات تازهای فراهم میکنند، اما در نهایت خبرنگاران هستند که باید تصمیم بگیرند چگونه و در چه مسیری از هوش مصنوعی برای روایت حقیقت بهره ببرند.
اینجاست که روزنامهنگاران علاوه بر آشنایی با کتابخانههای یادگیری ماشین (مانند TensorFlow و PyTorch) و ابزارهای تحلیل داده (مثل pandas و NumPy)، حتماً میبایست مبانی آماری و روشهای کمّی پژوهش را هم بدانند. متأسفانه گاهی مبانی آمار و روشهای کمّی چندان جدی گرفته نمیشود و اکنون میدانیم که فهم این مباحث چهقدر میتواند در کیفیت کار یک روزنامهنگار تأثیر بگذارد.
پس به جز اینکه از مدلهای کمّی بزرگ در گزارشهای تحلیلی خود کمک میگیریم، میتوانیم به درک کاملتری از محدودیتها، سوگیریها و کاربردهای صحیح آن برسیم. آیندۀ روزنامهنگاری به این پیوند میان هوش انسانی و هوش ماشینی گرهخورده است؛ پیوندی که اگر بهدرستی مدیریت شود، میتواند افقهای تازهای را در ارائۀ اخبار و گزارشهای دقیق و عمیق بگشاید.
منابع مورد استفاده:
DecoupLinkAI™. (2024, November 23). What’s the difference between LLMs & LQMs, or Large Language Models & Large Quantitative Models? DecoupLinkAI™. https://decouplinkai.medium.com/whats-the-difference-between-llms-lqms-or-large-language-models-large-quantitative-models-c0cddddf6b21
Laghari, R. (2024, August 11). The Future of AI: Large Quantitative Models (LQMs) as the Next Frontier in Data-Driven Decision Making. Medium. https://medium.com/@riazleghari/the-future-of-ai-large-quantitative-models-lqms-as-the-next-frontier-in-data-driven-decision-89b9a9aad76f
[1] Real-Time
[2] Data Scrutiny