من علی شاکر هستم؛ روزنامهنگار و پژوهشگر هوش مصنوعی که میخواهم در این سلسله یادداشتها در درجۀ نخست دربارۀ اصول کاربرد هوش مصنوعی در رسانه بیشتر بدانم و بخوانم و بعد آن را در اختیار شما بگذارم.
در یادداشت شمارۀ ۳ «از قلم تا الگوریتم» به بررسی تاریخچه و اهمیت رویکردهای منطقی و نمادین در هوش مصنوعی پرداختیم و حالا در این بخش میخواهیم به کمک مثالهایی از دنیای روزنامهنگاری و روابطعمومی کمی از بحثهای تاریخی فاصله بگیریم و به نحوۀ عملکرد ماشینهایی بپردازیم که موج اول هوشمندسازی را شکل دادند.
در این یادداشت، با معرفی اجزای اصلی سیستمهای خبره و بررسی چگونگی استفاده از آنها در ویرایش و بهبود کیفیت نگارش اخبار، نگاهی میاندازیم به اینکه چگونه این فناوری میتواند به خبرنگاران کمک کند تا محتوای دقیقتر، روانتر و اخلاقیتری ارائه دهند. برای اینکه ممکن است مطلب کمی طولانی شود، مثالهای مرتبط با روابطعمومی را در یادداشت شمارۀ پنج کمی پس از این یادداشت منتشر میکنیم.
سیستمهای خبره[1] یکی از اولین و موفقترین کاربردهای هوش مصنوعی نمادین هستند که هدفشان شبیهسازی تصمیمگیری و قضاوت یک انسان خبره در یک حوزۀ خاص است. این سیستمها از دو بخش اصلی تشکیل شدهاند: پایگاه دانش[2] و موتور استنتاج[3].
پایگاه دانش شامل مجموعهای از حقایق و قوانین است که دانش تخصصی حوزۀ مورد نظر را در بر میگیرد و موتور استنتاج از این دانش برای پاسخ به سؤالات، حل مسائل و ارائۀ توصیهها استفاده میکند.
فرض کنید یک سیستم خبره برای ویرایش و بهبود مقالات خبری طراحی شده است. این سیستم میتواند در عرصۀ رسانهها به خبرنگاران کمکهای زیادی بکند. کمکهایی مثل:
- بررسی صحت اطلاعات: با تطبیق دادههای مقاله با منابع معتبر، اشتباهات را پیدا میکند.
- پیشنهاد بهبود سبک نگارش: با تحلیل ساختار جملات و پاراگرافها، پیشنهادهایی برای روانتر شدن متن ارائه دهد.
- رعایت اصول اخلاقی: مطمئن میشود که مقاله با استانداردهای اخلاقی روزنامهنگاری مطابقت دارد یا نه؛ مثلاً استفاده نکردن از زبان تبعیضآمیز.
- تشخیص تناقضات: نقاطی که ممکن است با بخشهای دیگر مقاله یا مقالات قبلی تناقض داشته باشند را شناسایی کند.
نحوۀ قضاوت سیستمهای خبره در ویرایش مطالب
برای درک چگونگی قضاوت این سیستمها در ویرایش و بهبود مقالات خبری، بیایید به زبان ساده و بدون استفاده از ریاضیات پیچیده، این فرایند را توضیح دهیم.
۱. پایگاه دانش
پایگاه دانش، مخزن اطلاعات ماست که یک سیستم هوشمند (مثل یک چتبات یا یک سیستم توصیهگر) از آن برای پاسخگویی به پرسشها یا انجام وظایف استفاده میکند. این پایگاه دانش شامل دو بخش اصلی است:
- شواهد[4]: برای ما روزنامهنگارها شواهد یا همان فکتها مهم است. پس در اینجا اطلاعات یا شواهد ثابت و معین دربارۀ حوزۀ مورد نظر ما وجود دارد؛ مثلاً اینکه ما از زبان تبعیضآمیز یا قومگرا در مطالب خود استفاده نمیکنیم.
- قوانین: قوانین همان دستورالعملهایی که به سیستم میگویند چگونه از شواهد موجود استفاده کند. این قوانین بهصورت شرطی بیان میشوند؛ یعنی «اگر... آنگاه...». مثلاً «اگر جملهای حاوی کلمات توهینآمیز و قومگرایانه باشد، آنگاه باید جایگزینی برای آن پیشنهاد شود.»
۲. موتور استنتاج
موتور استنتاج در واقع مغز سیستم ماست و همین موتور استنتاج است که تصمیم میگیرد بر مبنای ورودیها چه تصمیمی بگیرد. پس موتور استنتاج با استفاده از منطق، از شواهد و قوانین موجود در پایگاه دانش استفاده میکند و از آن نتیجه میگیرد.
قضاوت سیستم خبره در ویرایش اخبار:
برای تشریح این بخش، عالمان علوم رایانه معمولاً از توابع عددی استفاده میکنند ولی از آنجایی که مخاطبان این یادداشتهای آموزشی روزنامهنگاران هستند، میتوانیم نشان دهیم که در رویکرد نمادین ما چهطور میتوانیم از ماشینها بخواهیم که شبیه ما خبرنگاران فکر کنند.
۱. دریافت ورودی:
فرض کنید بهعنوان دبیر سرویس، خبری دریافت میکنید. این خبر یک ورودی است. پس سیستم خبره هم متن مقاله را بهعنوان ورودی دریافت میکند. برای مثال، خبر دربارۀ وقوع زلزله در یکی مناطق شرقی کشور است.
۲. تحلیل متن:
همانطور که دبیر سرویس ابتدا نگاهی به سر تا پای خبر میاندازد، در این مرحله نیز سیستم مقاله را به اجزای کوچکتر مانند جملات، کلمات و پاراگرافها تقسیم میکند. با استفاده از تکنیکهای پردازش زبان طبیعی، سیستم معنای جملات و ساختار کلی متن را درک میکند. برای مثال، سیستم تشخیص میدهد که این خبر تیتر، لید، بدنه و پیشینۀ خبر دارد و در هر بخش چه اطلاعاتی گنجانده شده است.
۳. بررسی صحت اطلاعات:
همانطور که ممکن است یک دروازهبان خبر، اطلاعات خبر را با منابع معتبری که میشناسد، مقایسه کند، این ماشین که با رویکرد نمادین کار میکند نیز اطلاعات موجود در مقاله را با منابع معتبر در پایگاه دانش مقایسه میکند. گفتیم که پایگاه دانشگاه در واقع منبع اطلاعات ماست. فرض کنید در خبر به زلزلۀ ۸.۴ ریشتری اشاره شده باشد، درحالیکه، ماشین منابع معتبر دیگر را بررسی میکند و در مییابد عدد درست ۴.۸ ریشتر است. یعنی سیستم این تناقض را میشناسد و به خبرنگار اطلاع میدهد تا آن را اصلاح کند.
۴. پیشنهاد بهبود سبک نگارش:
ما در کار روزنامهنگاری بر مبنای قواعد و قوانین خاصی کار را پیش میبریم. چون جای انتشار مطلب محدودی داشتیم و از آن مهمتر اینکه میبایست به گونهای بنویسیم که مخاطبان مطالب ما آن را دوست داشته باشند. چه روزنامهنگاری را به طور تجربی یاد بگیریم چه دانشگاهی، اصول نگارشی هست که میبایست آن را رعایت کنیم.
سیستم نیز با استفاده از قوانین مربوط به نگارش صحیح، متن را ارزیابی میکند. این قوانین ممکن است شامل موارد زیر باشند:
- تعداد کلمات تیتر بیشتر از ۸ نباشد.
- تعداد کلمات لید، بین ۳۰ تا ۴۰ کلمه باشد.
- از فعل «میباشد» استفاده نمیکنیم و به جای آن مینویسیم: «است».
- از افعال معلوم استفاده میکنیم.
بهعنوانمثال، اگر لید خبر ما طولانی و پیچیده باشد، سیستم پیشنهاد میدهد آن را به جملات کوتاهتر تقسیم کند تا خوانایی مقاله افزایش یابد. این کاری است که سیستمهای سئو نیز انجام میدهند.
۵. رعایت اصول اخلاقی:
همانطور که ما روزنامهنگاران به مثابۀ یک شهروند آگاه از حقوق خویش میدانیم که باید اصولی اخلاقی را در کار خود رعایت کنیم، حالا میتوانیم این اصول را در قالب قوانین منطقی و به زبان ریاضی به ماشین بیاموزیم. بنابراین سیستم متن دریافتی را بررسی میکند که عبارتهای نامناسب، تبعیضآمیز و قومگرایانه در متن نباشد. تأکید میکنم که ما این قوانین را پیشتر به سیستم یاد دادهایم در قالب قوانین منطقی.
۶. تشخیص تناقضات:
فرض کنید در خبر میخوانیم روز شنبه سیل مناطق وسیعی از شهر را با خود میبرد. در ادامه، در خبر میخوانیم این سیل یکشنبه میآید. به طور منطقی یکی از این روزها میبایست زمان واقعه باشد. پس میتوانیم از سیستم بخواهیم اطلاعات بخشهای مختلف خبر با هم مقایسه کند و ببیند آیا سازگار هستند یا نه.
نقش موتور استنتاج در این مراحل
همانطور که گفتیم موتور استنتاج نقش مغز متفکر این ماشین را بازی میکند از این رو از طریق روشهایی سعی میکند متن ارسالی را درک کند.
استفاده از منطق شرطی:
یکی از شیوههایی که موتور استنتاج به کار میگیرد، استفاده از منطق شرطی است. یعنی صفحهبند اگر ببینید تعداد کلمات تیتر بیشتر از هشتتاست از دبیر صفحه میخواهد آن را تصحیح کند. در زندگی روزمره هم ما این کار را زیاد انجام میدهیم. «اگر باران بیاید، پس چتر بر میدارم».
زنجیرهسازی قوانین:
همانطور که ما بهعنوان یک خبرنگار در طول روز فقط یک نوع تابع «اگر-آنگاه» را بررسی نمیکنیم و مجموعهای از آن را در ذهن داریم سیستم هم از چندین قانون بهصورت پشت سر هم استفاده کند تا به نتیجه برسد. مثلاً میتوانیم به سیستم بگوییم «اگر تعداد کلمات تیتر مطلب بیشتر از هشتتاست و حاوی کلمهای توهینآمیز است، ابتدا پیشنهاد کوتاه کردن جمله را بده و سپس کلمات نامناسب را جایگزین کن.»
استفاده از درخت تصمیمگیری:
سیستم از ساختارهایی شبیه به درخت استفاده میکند که هر شاخۀ آن نمایانگر یک تصمیم یا قانون است. این به سیستم کمک میکند تا مسیرهای مختلف را بر اساس شرایط دنبال کند. ما روزنامهنگارها شبیه این کار را انجام میدهیم.
فرض کنید خبری زیر دستمان آمده که میگوید: «مسئولان در این روستا ۵۰ کیلومتر نوری جاده ساختند» همین که این جمله را میبینیم از خود میپرسیم کیلومتر نوری؟! آیا برای برای سنجش طول جاده از سرعت نور استفاده میکنیم؟ خیر؛ پس روی این بخش خط میکشیم و آن را اصلاح میکنیم. سیستم خبره با استفاده از درخت تصمیمگیری به شکل زیر عمل میکند:
گذر از گرۀ ریشه: آیا اطلاعات موجود در مقاله با منابع معتبر همخوانی دارد؟
- اگر بله: برو گره بعدی
- اگر خیر: هشدار بده و بگو به اصلاح نیاز است
همانطور که دیدیم، در این رویکرد هوشمندی ماشین، یعنی رویکرد نمادین، قضاوت بیشتر از طریق دانش پیشینی و منطق پیش میرود. ماشین در اینجا به محاسبات پیچیده نیازی ندارد؛ چون تمام تصمیمها بر اساس قوانین از پیش تعریفشده با منطقی ساده انجام میشود.
همچنین این سیستم از الگوریتمهایی برای جستوجو، مقایسه و جایگزینی کلمات استفاده میکند. پردازش متن و تحلیل ساختار جملات نیز بهصورت خودکار انجام میشود.
سیستمهای خبره با ترکیب دانش تخصصی و قوانین منطقی، میتوانند به طور خودکار متنها را تحلیل کرده و پیشنهادهایی برای بهبود ارائه دهند. در دنیای روزنامهنگاری، این سیستمها به خبرنگاران کمک میکنند تا مقالاتی دقیقتر، روانتر و اخلاقیتر بنویسند، بدون اینکه نیاز به دانش ریاضی پیچیده باشد. این ابزارها با شناسایی الگوها، کلمات حساس و استفاده از قوانین، به بهبود کیفیت محتوا و رعایت استانداردهای حرفهای کمک میکنند.
در یادداشت بعدی در مورد مثالهای مرتبط با روابطعمومی صحبت خواهیم کرد.
[1] Expert Systems
[2] Knowledge Base
[3] Inference Engine
[4] Facts