Nowcasting Iran's Quarterly Economic Growth Using Sentiment Analysis of News Texts

Beiranvand, Morteza; Razmi, Seyed Mohammad Javad; Malek Sadati, Seyed Saeed

doi:10.22096/esp.2025.2044951.1795

Nowcasting Iran's Quarterly Economic Growth Using Sentiment Analysis of News Texts

Document Type : Original Article

Authors

Morteza Beiranvand ¹

Seyed Mohammad Javad Razmi ²

Seyed Saeed Malek Sadati ³

¹ PhD student in Economics, Faculty of Administrative Sciences and Economics, Ferdowsi University of Mashhad, Mashhad. Iran.

² Professor, Faculty of Administrative Sciences and Economics, Ferdowsi University of Mashhad, Mashhad, Iran.

³ Assistant Professor, Faculty of Administrative Sciences and Economics, Ferdowsi University of Mashhad, Mashhad, Iran.

10.22096/esp.2025.2044951.1795

Abstract

This study introduces a novel framework for nowcasting Iran's quarterly GDP growth by leveraging sentiment analysis of economic news. A web crawler was employed to collect economic news articles from March 2005 to December 2023. The sentiment orientation (negative, neutral, positive) and intensity of each article were quantified using the Persian adaptation of the SentiStrength lexicon. Quarterly aggregation of these scores formed a composite news sentiment index. Statistical analysis reveals a significant correlation between this index and quarterly economic growth, offering valuable insights into Iran's short-term economic fluctuations. Furthermore, incorporating the sentiment index into a forecasting model leads to superior performance metrics compared to a benchmark univariate time-series model. By capturing shifts in economic sentiment in real-time, this approach provides a more timely and comprehensive understanding of Iran's economic trajectory, even prior to the release of official GDP statistics.

Keywords

Economic News

Nowcasting

Economic Growth

Sentiment Analysis

Big Data

Text Mining

Subjects

Economic Development, Technological Change, and Growth

مقدمه

برای طراحی سیاست‌های اقتصادی مناسب، سیاست‌گذاران باید ارزیابی و درک دقیقی از وضعیت فعلی اقتصاد داشته باشند. سایر عوامل اقتصادی نیز نیاز به چنین درکی دارند تا بتوانند تصمیم‌های صحیح اقتصادی بگیرند. آمار رسمی که در بازه‌های زمانی مختلف به‌صورت عمومی منتشر می‌شوند از مهم‌ترین منابع اطلاعاتی برای ارزیابی و درک وضعیت اقتصاد محسوب می‌شوند. انتشار این آمار به دلیل مسائل مختلفی همچون دشواری‌های آمارگیری و پیچیدگی‌های محاسباتی با تأخیر صورت می‌گیرد. برای مثال در ایران، مطابق با تقویم انتشارات و تجدیدنظرهای مرکز آمار ایران، برآورد اولیه فصلی از تولید ناخالص داخلی و رشد اقتصادی به‌مثابه اصلی‌ترین شاخص‌های اقتصاد کلان با 60 تا 90 روز تأخیر منتشر می‌شود. این تأخیر باعث می‌شود که از وضعیت فعلی اقتصاد و حتی گذشته اخیر (Recent Past)، اطلاعات ناقصی در دسترس باشد. در ادبیات اقتصادی رفع مسئله عدم دسترسی به اطلاعات به‌هنگام از وضعیت متغیرهای اقتصادی، ذیل مفهومی تحت عنوان کنون‌بینی (Nowcasting) تعریف می‌شود. در کنون‌بینی رشد اقتصادی، هدف استفاده از هرگونه اطلاعات بالقوه مفید برای برآورد این متغیر اقتصادی قبل از انتشار آمار رسمی است. این اطلاعات طیف متنوعی از داده‌های مرسوم و کم‌بسامد مانند آمار بیکاری و تجارت گرفته تا داده‌های جدید و پربسامد مانند تراکنش‌های پرداخت الکترونیکی یا داده‌های موتورهای جست‌وجو را دربرمی‌گیرد. در ایران، استفاده از این اطلاعات با محدودیت‌های ویژه‌ای مواجه است. از یک‌سو، سایر داده‌های رسمی نیز با تأخیر منتشر می‌شوند و از سوی دیگر، کلان‌داده‌هایی همچون آمار تراکنش‌های پرداخت الکترونیکی نیز به‌ندرت در دسترس عموم قرار دارند. به دلیل این محدودیت‌ها این پژوهش استفاده از منابع داده متون خبری را برای کنون‌بینی رشد اقتصادی پیشنهاد می‌کند. متون خبری به‌صورت به‌هنگام و برخط منتشر می‌شوند، وقفه انتشار ندارند و دسترسی به آنها محدودیت کمتری دارد. علاوه بر این، متون خبری نه‌تنها منبع کلیدی اطلاعات هستند، بلکه ابزاری برای ارزیابی احساسات و دیدگاه‌های روزنامه‌نگاران، تحلیلگران و کارشناسان درباره شرایط اقتصادی نیز می‌باشند. متون خبری، همانند اکثر ارتباطات انسانی، اغلب شامل محتوای روایی و احساسات هستند و به همین دلیل، ساخت شاخص‌های حسی مبتنی بر آنها می‌تواند ابزاری مستقیم برای ارزیابی انواع شوک‌های اقتصادی یا نماینده‌ای از مواردی مانند اطمینان یا انتظارات باشد. در مطالعات اقتصادی، داده‌های حسی معمولاً به‌منزله یکی از متغیرهای توضیحی استاندارد به مدل‌ها اضافه می‌شوند و سپس عملکرد مدل‌های پیش‌بینی با این ادغام مورد بررسی قرار می‌گیرد.^[1] اگرچه استفاده از داده‌های متنی به زبان‌های مختلف در مطالعات اقتصادی رایج بوده است، این پژوهش از اولین مطالعاتی است که داده‌های متنی خبری فارسی را به کار می‌گیرد. نوآوری دیگر این پژوهش ساخت شاخص حسی برای اقتصاد ایران است که علاوه بر دارا بودن توانایی اندازه‌گیری احساسات اقتصادی، پیش‌بینی‌های اقتصادی را به‌ویژه در افق‌های زمانی کوتاه‌مدت بهبود می‌بخشد. برخلاف شاخص‌های مبتنی بر پرسشنامه، این شاخص قابلیت ردیابی مستمر تغییرات در احساسات و انتظارات عوامل اقتصادی را با کمترین وقفه زمانی دارد و به‌روزرسانی آن آسان است. در ادامه پژوهش، ابتدا پیشینه نظری با تأکید بر مفاهیم، تاریخچه و رویکردهای کنون‌بینی و تحلیل احساس در ادبیات اقتصادی بررسی خواهد شد. در گام بعد، پژوهش‌هایی مرور می‌شوند که از داده‌های متنی خبری و روش تحلیل احساس برای پیش‌بینی متغیرهای اقتصاد کلان استفاده کرده‌اند. در قسمت روش پژوهش، ضمن معرفی مدل استفاده‌شده در پژوهش و معیارهای ارزیابی عملکرد این مدل، داده‌های استفاده‌شده در این پژوهش معرفی می‌شوند. در انتها، بعد از تخمین مدل و با توجه به نتایج، پیشنهادهایی ارائه خواهد شد.

2. پیشینه تحقیق

2-1. پیشینه نظری

2-1-1. کنون‌بینی

بانبورا و همکاران،^[2] کنون‌بینی را به معنای پیش‌بینی حال، گذشته بسیار نزدیک و آینده بسیار نزدیک تعریف کرده‌اند. این اصطلاح از ترکیب دو واژه اکنون (Now) و پیش‌بینی (Forecasting) ساخته شده است. اصطلاح کنون‌بینی نخستین بار در حوزه هواشناسی و در پاسخ به نیاز روزافزون بخش صنعت و خدمات به پیش‌بینی‌های به‌هنگام از شرایط جوی با استفاده از آخرین اطلاعات در دسترس به کار رفته است. این اصطلاح بعد از مطالعه جیانونی و همکاران^[3] با عنوان «کنون‌بینی تولید ناخالص داخلی و تورم: محتوای اطلاعاتی بلادرنگ داده‌های اقتصاد کلان» در اقتصاد رایج شد و بعد از آن انبوهی از مقالات منتشر شدند که هدفشان ارائه برآوردهای به‌هنگام از شاخص‌های اقتصاد کلان به‌ویژه تولید ناخالص داخلی بوده است.

دلیل اقبال اقتصاددانان به این موضوع، تأخیر قابل‌توجه در انتشار اطلاعات شاخص‌های اقتصادی است که منجر به عدم شناسایی تحولات اقتصادی در زمان واقعی می‌شود. برای ‌مثال در کشورهای G7، اولین برآورد رسمی تولید ناخالص داخلی فصلی با تأخیری در حدود یک تا دو ماه بعد از سه‌ماهه مرجع منتشر می‌شود.^[4] اهمیت روزافزون در دسترس بودن برآوردهای به‌هنگام از شرایط اقتصادی به‌ویژه پس از بحران مالی سال ۲۰۰۸، پژوهشگران و متخصصان اقتصادی را به توسعه مدل‌های اقتصادسنجی سوق داده است که به‌طور خاص هدفشان پیش‌بینی متغیرهای اقتصاد کلان در دوره فعلی یا حداکثر دوره آینده است.^[5] این مدل‌ها اغلب برمبنای شاخص‌های با تواتر بالا و وقفه انتشار اندک توسعه یافته‌اند. این شاخص‌ها به دو دسته شاخص‌های سخت و نرم تقسیم می‌شوند. شاخص‌های سخت مانند میزان تولیدات صنعتی، شاخص‌های خرده‌فروشی و نرخ بیکاری که به‌طور مستقیم اطلاعات کمّی از سطح فعالیت اقتصادی را نشان می‌دهند. از طرف دیگر، شاخص‌های نرم مانند شاخص مدیران خرید بر اساس نظرسنجی‌ها و پرسشنامه‌ها، احساسات و انتظارات عوامل اقتصادی را بازتاب می‌دهند.^[6] اخیراً استفاده از مجموعه داده‌های بزرگ که از منابع گوناگون اطلاعاتی ناشی می‌شوند در زمینه اقتصاد به‌طور گسترده‌ای فراگیر شده است. این کلان‌داده‌ها امکان دسترسی به اطلاعات ارزشمندی را قبل از انتشار آمار رسمی فراهم می‌کنند و تحلیل‌هایی نوآورانه و دقیق‌تر در زمینه‌های مختلف اقتصادی را ممکن می‌سازند.^[7] این مجموعه داده‌های بزرگ، دامنه گسترده‌ای از کلان‌داده‌ها همچون مصرف برق و انرژی، داده‌های ترافیکی و حمل‌ونقل، داده‌های موتورهای جست‌وجو، داده‌های پرداخت الکترونیکی، تصاویر ماهواره‌ای و اسناد متنی را دربرمی‌گیرد.^[8] داده‌های متنی در جایگاه یکی از مهم‌ترین انواع کلان‌داده‌ها، به دلیل ماهیت بدون‌ساختار خود با داده‌های سنتی متفاوت هستند. آنها منبعی ارزشمند از اطلاعات کیفی در زمینه اقتصاد هستند که اغلب از طریق قوانین پیچیده زبانی رمزگذاری شده‌اند.^[9]

داده‌های متنی از منابع گوناگونی مانند اسناد دیجیتال، خبرگزاری‌ها، رسانه‌های اجتماعی، نظرات آنلاین، وبلاگ‌ها و منابع دیگر در دسترس قرار دارند. شناسایی و استخراج الگوهای قابل فهم از این داده‌ها یکی از اهداف اصلی در حوزه متن‌کاوی است. این حوزه از زمینه داده‌کاوی الهام گرفته است.^[10] در مطالعات اقتصادی، اغلب با استفاده از تحلیل احساس متون به‌مثابه یکی از کاربردهای مهم متن‌کاوی، احساس و جهت‌گیری متن کشف و شاخص‌های حسی بر مبنای آن ساخته می‌شود، سپس این شاخص‌ها به‌صورت مستقل یا در ترکیب با سایر اطلاعات در مدل‌های پیش‌بینی اقتصادی به کار گرفته می‌شوند.

2-1-2. تحلیل احساس

تحلیل احساس، که به آن عقیده‌کاوی (Opinion Mining)نیز می‌گویند، حوزه مطالعاتی است که نظرات، احساسات، ارزیابی‌ها، نگرش‌ها و عواطف افراد را نسبت به موجودیت‌هایی از قبیل محصولات، خدمات، سازمان‌ها، افراد، مسائل، رویدادها، موضوعات و ویژگی‌های هر یک از آنها تجزیه و تحلیل می‌کند.^[11] تحلیل احساس به‌منزله شاخه‌ای از یادگیری ماشین، داده‌کاوی، پردازش زبان طبیعی (Natural Language Processing) و زبان‌شناسی رایانشی (Computational Linguistics) در نظر گرفته می‌شود که عناصری از جامعه‌شناسی و روان‌شناسی را نیز در خود جای داده است.^[12]

برخلاف زبان‌شناسی و پردازش زبان طبیعی که پیشینه پژوهشی طولانی دارند، اصطلاح تحلیل احساس احتمالاً اولین بار در ابتدای قرن بیست‌ویکم در پژوهش‌ها پدیدار شده است، ولی امروزه تحلیل احساس تحت سه عامل اصلی به یک زمینه پژوهشی بسیار فعال تبدیل شده است. اولین عامل در گسترش آن، کاربرد فراوان در حوزه‌های مختلف است. برای مثال، کاربردهای تجاری تحلیل احساس در بخش صنعت، محرکی قوی برای تحقیقات بیشتر در این زمینه است. دوم، گسترش دامنه استفاده از آن باعث بروز مسائل فنی جدیدی شده است که حل آن نیازمند پژوهش‌های جدید و نوآورانه هستند. سومین و احتمالاً مهم‌ترین عامل این است که برای نخستین بار در تاریخ بشر، مقدار عظیمی از داده‌ها در اینترنت و شبکه‌های اجتماعی تولید و منتشر می‌شوند که شامل نظرات و احساسات افراد هستند. بدون این مجموعه داده‌های بزرگ، انجام دادن پژوهش‌های زیادی امکان‌پذیر نبود. بنابراین، نباید عجیب باشد که آغاز و رشد سریع تحلیل احساس همزمان با شکوفایی رسانه‌های اجتماعی رخ داده است.^[13] اگرچه تحلیل احساس برای کشف احساس در منابع اطلاعاتی مانند صوت، عکس و ویدیو نیز استفاده می‌شود، اما اغلب پژوهش‌ها متمرکز بر کشف احساسات در متون طبیعی بوده‌اند.^[14]

2-1-2-1. وظایف تحلیل احساس

می‌توان وظایف اصلی و مسائل اساسی را که تحلیل احساس با آنها روبه‌رو است در سه دسته تشخیص ذهنیت (Subjectivity Detection)، تشخیص قطبیت (Polarity Detection) و وظایف تکمیلی تقسیم کرد.^[15]

1. تشخیص ذهنیت: هدف تشخیص ذهنیت، طبقه‌بندی متن به‌صورت خودکار به جملات ذهنی یا حاوی نظر در مقابل جملات عینی یا خنثی است. از این وظیفه، تحلیل احساس برای شناسایی جملات ذهنی یعنی جملاتی که بیانگر نظر، دیدگاه یا احساس نویسنده است و حذف جملات عینی که تنها واقعیتی را بیان می‌کند و نظر و حسی در آنها نیست، استفاده می‌شود.

2. تشخیص قطبیت: تشخیص قطبیت به‌مثابه اصلی‌ترین و معروف‌ترین وظیفه در تحلیل احساس شناخته می‌شود به‌طوری که در بسیاری از پژوهش‌ها این دو عبارت به‌جای یکدیگر استفاده می‌شوند. این وظیفه می‌تواند یک طبقه‌بندی باینری (مثبت یا منفی) یا طبقه‌بندی چندگانه (بسیار منفی، منفی، خنثی، مثبت یا بسیار مثبت) ارائه دهد.

3. وظایف تکمیلی: ازجمله این وظایف می‌توان به ایجاد منابع واژگان حسی (Sentiment Lexicon)، استخراج جنبه‌ها یا ویژگی‌های یک محصول یا خدمت از متن، تشخیص نظرات جعلی و تشخیص کنایه را نام برد.

2-1-2-2. سطوح تحلیل احساس

تحلیل احساس متون طبیعی را می‌توان در سه سطح شامل جمله، سند و جنبه انجام داد.

1. تحلیل احساس در سطح جمله: هدف از طبقه‌بندی احساسات در سطح جمله، ارزیابی اسناد بر اساس نظر موجود در هر جمله و طبقه‌بندی جملات بر حسب دارا بودن احساسات مثبت، منفی یا خنثی است.^[16]

2. تحلیل احساس در سطح سند: در این سطح، هدف طبقه‌بندی قطبیت کلی سند است به این معنا که آیا یک سند در کل، یک احساس یا نظر منفی یا مثبت را بیان می‌کند. هر سند براساس احساس کلی نویسنده در مورد یک موجودیت واحد (برای ‌مثال، محصولی مشخص) طبقه‌بندی می‌شود. طبقه‌بندی بهترین عملکرد را در سطح سند زمانی دارد که سند توسط شخصی نوشته شده باشد و برای اسنادی که چند موجودیت را ارزیابی یا مقایسه می‌کنند، مناسب نیست.^[17]

3. تحلیل احساس در سطح جنبه: اگرچه تحلیل احساس متن در سطح سند و جمله در بسیاری از موارد مفید است، اما تمام جزئیات لازم را ارائه نمی‌دهد. برای مثال، اینکه یک سند احساس مثبتی درباره یک موجودیت خاص دارد، به این معنی نیست که نویسنده به همه جنبه‌های آن موجودیت احساس مثبت دارد و به‌طور مشابه، اینکه یک سند احساس منفی داشته باشد، نشان‌دهنده نظر منفی نویسنده درباره همه جنبه‌های آن موجودیت نیست. هدف تحلیل احساس در این سطح، شناسایی و استخراج جنبه‌های مختلف از متن و سپس تعیین قطبیت هر جنبه است.^[18]

2-1-2-3. رویکردهای تحلیل احساس

تحلیل احساس اغلب با سه رویکرد یادگیری ماشین (Machine Learning Approach)، رویکرد مبتنی بر واژه‌نامه (Lexicon-based Approach) و رویکرد ترکیبی (Hybrid Approach) انجام می‌شود.^[19]

1. رویکرد یادگیری ماشین: در رویکرد یادگیری ماشین برای طبقه‌بندی قطبیت احساسات، از مجموعه داده‌های آموزش و آزمایش استفاده می‌شود. این رویکرد به یکی از سه شیوه یادگیری با نظارت (Supervised Learning)، یادگیری بدون نظارت (Unsupervised Learning)و یادگیری نیمه نظارتی (Semi-supervised Learning) انجام می‌شود.^[20]

2. رویکرد مبتنی بر واژه‌نامه: رویکرد مبتنی بر واژه‌نامه یا واژه‌نامه‌محور یکی از مهم‌ترین رویکردهای تحلیل احساس است. در این روش، سیستم‌های توسعه‌یافته با استفاده از واژه‌نامه‌های از پیش‌ساخته که متشکل از واژگان و عبارات حاوی احساس و نمره عددی احساس آنها است، یک نمره مجموع برای عبارت، جمله یا سند موردنظر را محاسبه می‌کنند و همین عدد را به‌عنوان احساس آن در نظر می‌گیرند.^[21]

3. رویکرد ترکیبی: این رویکرد، توان عملیاتی تحلیل واژگانی را با انعطاف‌پذیری رویکردهای یادگیری ماشین ترکیب می‌کند، به‌طوری که می‌تواند از مزایای هر دو رویکرد بهره‌مند شود و در عین حال از محدودیت‌های آنها جلوگیری کند. ویژگی اصلی این رویکرد به ارث بردن دقت بالا از یادگیری ماشین و ثبات از رویکرد بر مبتنی بر واژه‌نامه است.^[22]

2-2. پیشینه تجربی

همگام با گسترش انواع داده‌های متنی و پیشرفت روش‌های ذخیره‌سازی و تجزیه و تحلیل این داده‌ها، مطالعات اقتصادی زیادی بر استفاده از این نوع کلان‌داده متمرکز شده‌اند. گارز^[23] با مرور مطالعات اقتصادی که از داده‌های متنی استفاده کرده‌اند؛ برخی از این مطالعات را برحسب نوع رسانه، هدف مطالعه و روش تحلیل دسته‌بندی کرده است. در این بخش، برخی پژوهش‌هایی که از داده‌های متنی خبری و به‌کارگیری روش‌های مختلف متن‌کاوی ازجمله تحلیل احساس برای پیش‌بینی متغیرهای اقتصاد کلان استفاده کرده‌اند، اشاره می‌شود. در مطالعه سئو و همکاران^[24] از یک مدل انتقالی یادگیری عمیق برای ساختن یک شاخص احساس مبتنی بر اخبار اقتصادی کره‌جنوبی استفاده شده است. این شاخص، که از اطلاعات روزانه اخبار بهره می‌برد، قادر است تغییرات در احساسات اقتصادی را قبل از انتشار شاخص‌های رسمی ماهیانه‌ای مانند شاخص احساس مصرف‌کننده شناسایی کند و به‌مثابه یک ابزار پیشرو در تشخیص نقاط عطف و علل نوسانات اقتصادی عمل کند.

در پژوهشی دیگر اپریگلیانو و همکاران^[25] نشان می‌دهند که با استفاده از مجموعه‌ای از شاخص‌های حسی که از مقالات خبری استخراج می‌شوند، می‌توان پیش‌بینی‌های دقیق‌تری درباره شاخص‌های اقتصاد کلان ایتالیا ازجمله رشد تولید ناخالص داخلی و تولید صنعتی داشت. این شاخص‌های حسی، اطلاعات به‌هنگامی در مورد وضعیت اقتصاد ارائه می‌دهند و قادرند نقاط عطف و روندهای اقتصادی را سریع‌تر از شاخص‌های مرسوم شناسایی کنند و به همین دلیل در پیش‌بینی‌های کوتاه‌مدت به‌ویژه در دوره‌های افزایش عدم اطمینان، کارآمدتر هستند؛ همچنین نتایج نشان داد که ترکیب این شاخص‌های حسی با منابع داده دیگر، دقت مدل‌های پیش‌بینی را بهبود می‌بخشد. شپیرو و همکاران^[26] با استفاده از رویکرد مبتنی بر واژه‌نامه، سری‌های زمانی حسی را با تحلیل احساس اخبار اقتصادی در دوره زمانی 1980-2015 ایجاد کردند و با استفاده از روش‌های یادگیری ماشین نشان دادند که این سری‌های زمانی می‌توانند برای پیش‌بینی به‌هنگام متغیرهای اقتصادی در آمریکا به کار گرفته شوند. سکی و همکاران^[27]یک شاخص حسی بر اساس مقالات خبری برای ژاپن ساختند که همبستگی قوی با شاخص‌های رسمی مبتنی بر نظرسنجی دارند و در عین حال بینش بیشتری در مورد روند اقتصاد کلان و احساسات فعالان اقتصادی منعکس می‌کند. مطالعه تیلی و همکاران^[28]نشان داد که با استفاده از شبکه‌های عصبی و جداسازی سیگنال‌های مهم از حجم زیادی از داده‌های اخبار بین‌المللی، می‌توان از داده‌های حسی استخراج‌شده از این اخبار بهره‌برداری کرد. به‌کارگیری داده‌های حسی مستخرج از این اخبار می‌تواند دقت مدل‌های پیش‌بینی اقتصاد کلان را به‌طور قابل‌توجهی در مقایسه با مدل‌های خودرگرسیون و رویکردهای مرسوم که صرفاً بر داده‌های اقتصادی یا معیارهای احساسی ساده متکی هستند، افزایش دهد. رمبوکاسینگ و کایتکوفسکی^[29] با استفاده از رویکرد مبتنی بر واژه‌نامه و الگوریتم‌های یادگیری ماشینی، رابطه بین احساسات مستخرج از مقالات خبری روزنامه‌های بزرگ بریتانیا و شاخص‌های اقتصادی مختلف مانند تورم، رشد تولید ناخالص داخلی و نرخ بیکاری را بررسی کردند. نتایج نشان داد که روایت‌های گزارش‌شده در رسانه‌ها می‌توانند اطلاعاتی پیشرو برای متغیرهای اقتصاد کلان فراهم کنند و استفاده از این اطلاعات در مقایسه با مدل‌های استاندارد، بهبود قابل‌توجهی در عملکرد مدل‌های پیش‌بینی بیکاری و رشد تولید ناخالص داخلی داشته است. با این حال، قدرت پیش‌بینی آنها برای شاخص‌های اقتصادی مختلف، متفاوت است. ثورسرود^[30]توانایی استفاده از داده‌های متنی اخبار را به‌مثابه مکمل شاخص‌های اقتصادی استاندارد برای نظارت و درک پویایی چرخه تجاری اثبات کرد. این شاخص مبتنی بر اخبار که با استفاده از روش‌های پردازش زبان طبیعی از مجموعه بزرگی از مقالات خبری نروژ ایجاد شده است در تواتر بالاتر (روزانه) و بدون تأخیر در دسترس است و می‌تواند روندهای اقتصادی و نقاط عطف را سریع‌تر به تصویر بکشد. آردیا و همکاران^[31]نشان دادند که افزودن داده‌های حسی مبتنی بر اخبار به مدل‌های پیش‌بینی در مقایسه با استفاده از روش‌هایی که صرفاً بر شاخص‌های اقتصادی و مالی تکیه دارند، باعث افزایش دقت پیش‌بینی نرخ رشد نه‌ماهه و سالانه تولید صنعتی آمریکا می‌شود. فیوریگل و گوردن^[32]در کنار روش شمارش واژگان، رویکرد مدل‌سازی معنایی را توسعه دادند که با تحلیل احساس اخبار مالی می‌تواند شاخص‌های اقتصاد کلان را برای آلمان و اتحادیه اروپا به‌طور مؤثر پیش‌بینی کند.

3. روش تحقیق

3-1. تحلیل احساس با رویکرد واژه‌نامه محور

واژه‌نامه‌های زیادی برای تعیین قطبیت کلمه‌ها وجود دارند. هر واژه‌نامه، سازوکار خاصی را برای تعیین قطبیت استفاده می‌کند و روش خاصی را برای نشان دادن قطبیت کلمه‌ها به کار می‌برد. برای مثال، کلماتی مانند «خوب»، «زیبا» و «شگفت‌انگیز» احساسات مثبتی را به انسان منتقل می‌کنند، در حالی که کلماتی همچون «بد»، «زشت» و «ترسناک» دارای قطبیت منفی هستند. این نکته مهم است که بیشتر کلمات دارای بار حسی درواقع صفت و قید هستند، اما برخی نام‌ها مانند «زباله» و افعالی مثل «نفرت داشتن» و «عشق ورزیدن» نیز می‌توانند دارای بار حسی باشند. این کلمات ممکن است دارای وزن یا بدون وزن باشند. وزن در اینجا به معنای یک عدد یا احتمال است که برای هر کلمه در نظر گرفته می‌شود تا سطح مثبت یا منفی بودن آن کلمه را نشان دهد. این رویکرد اغلب برای محاسبه جهت‌گیری اسناد با توجه به جهت‌گیری معنایی کلمات و عبارات درون اسناد استفاده می‌شود.^[33] سنتی‌استرنگت (Senti Strength) ازجمله این واژه‌نامه حسی است که توسط تلوال و همکاران^[34]برای زبان انگلیسی و در ادامه برای سایر زبان‌ها ازجمله زبان فارسی، توسعه پیدا کرده است و برای تحلیل احساس و محاسبه نمره حسی متون از لیست‌های زیر استفاده می‌کند:

1. لیست کلمات حسی: مجموعه‌ای از اصطلاحات مثبت و منفی است که هرکدام دارای مقداری از 5- تا 5 هستند.

2. لیست کلمات پرسشی: حاوی چند کلمه پرسشی پرتکرار است.

3. لیست کلمات نفی: حاوی چند کلمه نفی پرتکرار برای معکوس کردن کلمات حسی بعد از خود است.

4. لیست نمادهای حسی: مکمل لیست اول و ترکیب علامت‌هایی است که برای بیان احساسات استفاده شد.

برخی کلمات نمونه از این فهرست‌ها در جدول (1) نشان داده شده است.

جدول (1): نمونه‌ای از لیست واژه‌های سنتی‌استرنگت

نمره حسی	نمونه کلمات	نوع لیست
2+	ارزنده	لیست کلمات حسی
3+	عالی
2-	تحمیل
3-	تنش
-	چرا	لیست کلمات پرسشی
-	چگونه	لیست کلمات پرسشی
-	هرگز	لیست کلمات نفی
-	هیچ	لیست کلمات نفی
1+	:-D	لیست نمادهای حسی
1-	:’(	لیست نمادهای حسی

سنتی‌استرنگت، احساس کلی یک متن طولانی را با احساسات مثبت و منفی کلی هر جمله محاسبه می‌کند و مانند سایر الگوریتم‌هایی که تحلیل احساس بر مبنای واژه‌نامه را به کار می‌برند بر این منطق استوار است که نویسنده‌ای که احساس منفی نسبت به یک موضوع دارد، برآیند کلماتی که استفاده می‌کند منفی‌تر است و بالعکس. در مطالعات اقتصادی، این واژه‌نامه برای کشف احساس متون در زمینه‌های مختلفی به‌کار رفته است.^[35]استفاده از نسخه فارسی این واژه‌نامه در مطالعات اقتصادی به زبان فارسی نیز سابقه دارد.^[36]

3-2. مدل اقتصادسنجی و معیارهای ارزیابی

مدل مورد استفاده در این پژوهش مطابق رابطه (1) قابل نمایش است که در آن Y_tرشد اقتصادی و NSI_tشاخص حسی اخبار (News Sentiment Index) است.

برای اندازه‌گیری دقت پیش‌بینی مدل از معیارهای ارزیابی میانگین قدر مطلق خطا (Mean Absolute Error) (MAE) جذر میانگین مربعات خطا (Root Mean Square Error) (RMSE)و ضریب نابرابری تایل (Theil Inequality Coefficient) (TIC) استفاده خواهد شد. هر سه معیار، مطابق با روابط (4-2)، مقدار خطا را از مقایسه مقادیر واقعی(Y_t) و پیش‌بینی (Y^f_t) محاسبه می‌کنند.^[37]

m طول دوره پیش‌بینی است که از T+1 تا T+m می‌باشد.

3-3. مجموعه داده‌ها

در این مطالعه از داده‌های رشد اقتصادی فصلی ایران مستخرج از سایت مرکز آمار ایران به قیمت‌های ثابت سال 1390 و در بازه زمانی فصل اول سال 1384 تا فصل سوم سال 1402، استفاده شده است. برای ساخت شاخص حسی نیز از اخبار اقتصادی خبرگزاری فارس در همان دوره استفاده شده است. در مقدمات انجام دادن این پژوهش برای استخراج اخبار اقتصادی فارسی، خبرگزاری‌ها و وبگاه‌های خبری مختلفی بررسی و در نهایت خبرگزاری فارس برای منبع اطلاعاتی این پژوهش انتخاب شد. این انتخاب با توجه به سه معیار وجود آرشیو اخبار در دوره‌های زمانی کافی، مرجع بودن خبرگزاری و قابلیت دسترسی و استخراج اخبار به‌صورت برخط انجام شده است. برای برازش صحیح مدل‌های رگرسیونی باید تعداد مشاهدات به حد کافی بالا باشد به همین دلیل برخی خبرگزاری‌ها به علت عدم وجود دوره‌های زمانی کافی از آرشیو اخبار، کنار گذاشته شدند. لازم به ذکر است امکان ترکیب اخبار چند خبرگزاری برای رفع این نقص نیز بررسی شد که به علت قالب‌های متفاوت و فرمت‌های مختلف انتشار و ذخیره‌سازی اخبار هر یک از این خبرگزاری‌ها و دشواری‌های پردازشی تجمیع متون فارسی از منابع مختلف، امکان تجمیع و پردازش متون فراهم نشد. معیار دوم یعنی مرجع بودن یک خبرگزاری، تضمینی برای این نکته است که خبرگزاری برای پوشش تمامی مخاطبان و حفظ آمار بالای بازدید از همه بخش‌های اقتصاد و از جنبه‌های مختلف خبر منتشر می‌کند و به همین دلیل احتمال مغفول ماندن یک بخش یا حوزه اقتصادی کاهش می‌یابد. از طرف دیگر، مرجع بودن یک خبرگزاری، اگرچه تضمین نمی‌کند که سوگیری‌های احتمالی در نحوه خبررسانی کاهش یابد؛ اما احتمال انتشار اخبار جعلی و بدون منبع را کمتر می‌کند. در این پژوهش مرجع بودن خبرگزاری با توجه به معیارهای تحلیل دامنه و رتبه‌بندی سایت آلکسا (Alexa) تعیین شده است. براساس این رتبه‌بندی، خبرگزاری فارس یا توجه به ترافیک ورودی سایت در سال 1400 رتبه 42 را در میان همه سایت‌های فارسی‌زبان داشته است و در سال 1399 در مقایسه با سه خبرگزاری پربازدید مهر، ایسنا و ایرنا در رتبه دوم قرار گرفته است. آخرین عامل و شاید مهم‌ترین عامل در انتخاب خبرگزاری مناسب این بوده است که از لحاظ فنی امکان استخراج اخبار با روش مورد استفاده در این پژوهش وجود داشته باشد. برخی خبرگزاری‌هایی که دو معیار قبلی را داشتند با استفاده از روش‌های فنی خاص، محدودیت پاسخگویی به درخواست‌های خودکار وب کراولینگ را برای ذخیره‌سازی خودکار اخبار ایجاد کرده‌اند و خبرگزاری فارس تنها خبرگزاری بود که امکان استخراج اخبار آن با ابزار در دسترس این پژوهش فراهم شد.

4. برآورد مدل

در ابتدا با روش خزش (Web Crawling)، 301،498 خبر اقتصادی در دوره زمانی مورد بررسی از پایگاه اینترنتی خبرگزاری فارس استخراج شد. در ادامه با به‌کارگیری واژه‌نامه سنتی‌استرنگت در محیط زبان برنامه‌نویسی پایتون، نمره حسی هر خبر مشخص شد. همانطور که پیش‌تر اشاره شد این ابزار از واژه‌نامه‌ای از کلمات حسی موزون استفاده می‌کند که به‌صورت دستی توسط متخصصان زبان‌شناسی انتخاب شده است. در تحلیل احساس هر خبر از همه اجزای آن خبر شامل عنوان، خلاصه و متن اصلی استفاده شده است. وقتی ابزار سنتی‌استرنگت، متنی را می‌خواند آن را به کلمات تشکیل‌دهنده آن تقسیم و علائم نگارشی را از هم جدا می‌کند. سپس، هر کلمه از نظر مطابقت با هر یک از واژه‌های حسی واژه‌نامه بررسی می‌شود و اگر مطابقت یافت شود، امتیاز حسی مرتبط حفظ می‌شود. نمره کلی برای یک جمله بالاترین نمره مثبت و منفی برای کلمات تشکیل‌دهنده آن و برای چند جمله از حداکثر امتیاز هر جمله گرفته می‌شود. جدول (2)، نمونه‌ای از نمره حسی اختصاص یافته‌شده به اخبار جمع‌آوری‌شده را نشان می‌دهد. این امتیازات را می‌توان به‌مثابه نماگرهایی از وضعیت واقعی اقتصاد تفسیر کرد. برای مثال، اخبار منتشرشده از تعطیلی ناشی از همه‌گیری کرونا نشانگر کاهش احتمالی ارزش افزوده بخش خدمات است. نمونه‌ای دیگر، وقتی تعداد اخبار زیادی در یک فصل درباره احتمال کاهش قیمت نفت منتشر می‌شود، احتمالاً شاهد کاهش ارزش افزوده بخش نفت خواهیم بود. به همین ترتیب، افزایش اخبار مثبت نسبت به شاخص بورس، می‌تواند حاکی از انتظارات مثبت فعالان اقتصادی باشد.

جدول (2): نمونه‌ای از نمره حسی اختصاص‌یافته به اخبار

نمره حسی	عنوان خبر	ردیف
3-	اختلاف نظر اعضای اوپک در مورد افزایش تولید نفت (21/01/1384)	1
4-	احتمال آغاز خاموشی محدود در برخی استان‌ها از فردا (19/08/1403)	2
2+	شاخص کل فقط یک پله تا 71 هزار واحد (6/11/1394)	3
1-	عدم اتصال سیستمی دستگاه‌ها عامل زمان‌بر شدن اخذ مجوزها (20/12/1398)	4
3+	پیش‌بینی افزایش ۳۰ درصدی تولید گندم در کشور (20/01/1402)	5
5-	تعطیلی اصناف به علت پیک پنجم کرونا از امروز (13/04/1400)	6
0	کاهش سهم بخش دولتی از حق بیمه‌ها (7/02/1403)	7
2+	افزایش صادرات غیرنفتی به بیش از 45 میلیارد دلار (27/01/1390)	8

منبع: محاسبات پژوهش

با تجمیع نمره حسی اخبار و مقیاس‌بندی با روش MIN- MAXبرای هر دوره سه‌ماهه، یک سری زمانی از شاخص حسی اخبار (NSI) ایجاد شده است. قبل از تخمین مدل پژوهش ابتدا لازم است آزمون‌های نرمال بودن و مانا بودن داده‌ها به‌منزله فروض زیربنایی تخمین مدل، انجام شود. جدول (3) نتایج این آزمون‌ها را نشان می‌دهد.

جدول (3): نتایج آزمون‌های پیش از تخمین

نوع آزمون	فرض صفر	متغیر	مقدار آماره	مقدار احتمال	نتیجه آزمون
Jarque-Bera Test	نرمال بودن متغیر	Y	50/1	473/0	متغیر نرمال است.
Jarque-Bera Test	نرمال بودن متغیر	NSI	18/3	203/0	متغیر نرمال است.
Dickey-Fuller Test	نامانا بودن متغیر	Y	38/4-	000/0	متغیر مانا است.
Dickey-Fuller Test	نامانا بودن متغیر	NSI	03/4-	002/0	متغیر مانا است.

منبع: محاسبات پژوهش

بعد از تأیید فرضیه‌های نرمال بودن و مانا بودن متغیرها مدل برای دوره زمانی این پژوهش، یعنی از ابتدای سال 1384 تا فصل سوم سال 1402 تخمین زده شده است. جدول (4) نتایج برآورد مدل را نشان می‌دهد.

جدول (4): نتایج برآورد رشد اقتصادی با شاخص حسی اخبار 03/1402-01/1384

متغیرهای مستقل	ضرایب	انحراف معیار	آماره t	مقدار احتمال
c	414/3-	413/1	416/2-	018/0
Y(-1)	705/0	073/0	570/9	000/0
NSI	662/0	226/0	926/2	004/0
R²			67/0

منبع: محاسبات پژوهش

با توجه به علامت و معناداری ضریب NSI، این فرضیه که داده‌های حسی را می‌توان برای کنون‌بینی رشد اقتصادی به کاربرد در سطح اطمینان 99 درصد تأیید می‌شود. به عبارت دیگر می‌توان گفت برآیند احساس اخبار اقتصادی منتشرشده در رسانه‌های خبری می‌تواند در درک شرایط اقتصادی در زمان واقعی استفاده شود. زمانی که برآیند احساس اخبار منتشرشده مثبت باشد انتظار رشد اقتصادی مثبت داریم و بالعکس. به منظور اطمینان از تفسیرپذیری نتایج مدل، آزمون‌های پس از برآورد شامل نرمال بودن جملات خطا، عدم وجود خودهمبستگی و ناهمسانی واریانس در جملات خطا و عدم وجود همخطی بین متغیرهای توضیحی انجام شده است. نتایج این آزمون‌ها در جدول (5) نمایش داده شده است.

جدول (5): نتایج آزمون‌های پس از تخمین

نوع آزمون	فرض صفر	آماره	احتمال	نتیجه آزمون
Jarque-Bera Test	نرمال بودن جملات خطا	462/3	177/0	جملات خطا نرمال است.
Breusch-Godfrey Serial Correlation LM Test	عدم خودهمبستگی بین جملات خطا	879/0	419/0	خودهمبستگی بین جملات خطا وجود ندارد.
Heteroskedasticity Test: White	عدم ناهمسانی واریانس جملات خطا	605/0	692/0	واریانس جملات خطا ثابت است.
VIF test	VIF<10 عدم وجود هم خطی	174/1	-	بین متغیرهای توضیحی هم خطی وجود ندارد.

منبع: محاسبات پژوهش

برای مقایسه عملکرد مدل پیشنهادی، الگوی سری زمانی تک متغیره نیز به‌منزله مدل معیار برآورد شده است. مرتبه این الگو بر مبنای روش باکس-جنکینز به‌صورت AR(1) تعیین شد. این مدل چون به مقادیر گذشته متغیر متکی است و به اطلاعات اضافه‌ای برای برآورد نیاز ندارد و همواره بعد از هر فصل مرجع (به شرط انتشار اطلاعات آمار رشد فصل قبل‌تر) قابل برآورد است، مبنای خوبی برای مقایسه سایر مدل‌های پیش‌بینی است. جدول (6)، نتایج معیارهای ارزیابی پیش‌بینی مدل با شاخص حسی اخبار و مدلAR(1) را نشان می‌دهد.

جدول (6): معیارهای ارزیابی

نوع مدل	معیارهای ارزیابی
نوع مدل	RMSE	MAE	TIC
مدل AR(1)بدون شاخص حسی	50/3	76/2	30/0
مدل با شاخص حسی اخبار	30/3	56/2	28/0

منبع: محاسبات پژوهش

مطابق نتایج به‌دست‌آمده از جدول (6)، استفاده از داده‌های حسی اخبار در مقایسه با الگوی سری زمانی تک متغیره، باعث کاهش خطای پیش‌بینی می‌شود. نمودار (1)، مقادیر واقعی رشد اقتصادی و مقادیری را که از برآورد مدل در کل دوره مورد بررسی به دست آمده است، نشان می‌دهد.

نمودار (1): مقایسه مقادیر واقعی و مقادیر مدل کنون‌بینی 03/1402- 01/ 1384

منبع: محاسبات پژوهش

یافته‌ها نشان می‌دهد که روندهای احساسات مثبت که از اخبار اقتصادی قابل استخراج است اغلب با دوره‌های رونق اقتصادی همسو هستند. به عبارت دیگر، افزایش تعداد اخبار اقتصادی مانند افزایش آمار اشتغال، بهبود شاخص‌های بازار سرمایه، افزایش صادرات و افزایش قیمت نفت، نشانه‌هایی از بهبود وضعیت اقتصاد و به دنبال آن افزایش رشد اقتصادی هستند. در مقابل، احساسات منفی با رکود یا عدم اطمینان همراه هستند و اخبار منفی مانند افزایش نرخ بیکاری، کاهش تولید صنعتی یا ناپایداری‌های سیاسی، به‌مثابه نشانه‌ای از وجود احساسات منفی در بازارها در نهایت رکود اقتصادی یا کاهش رشد اقتصادی را نشان می‌دهند. شناخت به‌هنگام این احساسات می‌تواند به کاهش نوسانات اقتصادی کمک کند. برای مثال، اگر در دوره رکود، احساسات منفی به‌شدت افزایش یابد، این می‌تواند نشانه‌ای از لزوم تغییر در سیاست‌های اقتصادی و مالی باشد. علاوه بر این با افزودن شاخص حسی ساخته‌شده از اخبار به مدل پیش‌بینی رشد اقتصادی فصلی، می‌توان به محض پایان هر فصل مرجع، برآوردی به هنگام و کارا از رشد اقتصادی همان فصل داشت. این برآورد می‌تواند به همه عوامل اقتصادی در شناسایی و مدیریت ریسک‌های مرتبط با نوسانات اقتصادی کمک کند.

5. نتیجه‌گیری و پیشنهادها

سیاست‌گذاران، سرمایه‌گذاران، شرکت‌ها، سازمان‌ها و افراد برای تنظیم صحیح برنامه‌ها و اقدامات خود به اطلاعات به‌هنگام از شرایط اقتصاد کلان ازجمله رشد اقتصادی نیاز دارند. این پژوهش نشان می‌دهد که متون خبری می‌تواند نقش مهمی در ارائه این اطلاعات داشته باشد. برخلاف آمار رسمی، اخبار به‌صورت روزانه و بدون وقفه زمانی منتشر می‌شوند و امکان دسترسی برخط به آنها در کنار توسعه بی‌وقفه روش‌های یادگیری ماشین، باعث گسترش روزافزون استفاده از این کلان‌داده ارزشمند در مطالعات اقتصادی شده است. در ایران این منبع داده به‌ندرت مورد توجه قرارگرفته است. این پژوهش در جایگاه یکی از معدود مطالعات به زبان فارسی در این حوزه از تحلیل احساس برای کمّی‌سازی اطلاعات بدون‌ساختار متنی استفاده کرده است. در ابتدا 301،498 خبر اقتصادی با روش خزش از اینترنت استخراج شده است. در گام بعدی با استفاده از نسخه فارسی واژه‌نامه سنتی‌استرنگت، نمره یا امتیاز حسی هر خبر مشخص و با تجمیع سه‌ماهه این امتیازات، شاخص حسی فصلی ساخته شده است. نتایج نشان می‌دهد که این شاخص رابطه معنی‌داری از لحاظ آماری با رشد اقتصادی دارد.

افزایش مجموعه داده‌های متنی که در حجم بسیار زیاد و از راه منابع اطلاعاتی مختلف در دسترس قرار گرفته‌اند در کنار توسعه روش‌های مبتنی بر یادگیری ماشین و هوش مصنوعی که مدیریت این داده‌ها را ممکن ساخته است؛ فرصت ارزیابی به‌هنگام شرایط اقتصادی را ورای داده‌های رسمی استاندارد برای همه کشورها فراهم کرده است. با این حال در کشورهای در حال توسعه که سیستم‌های آماری به اندازه کشورهای با درآمد زیاد و توسعه‌یافته قوی نیست، اهمیت داده‌های جدید و روش‌های نوین بیشتر هم می‌شود و با کمک این داده‌ها و روش‌ها می‌توان برخی شکاف‌های اطلاعاتی را کاهش داد و در نتیجه به‌طور مؤثری سیستم آماری را در ارائه آمار اقتصادی تقویت کرد. به همین علت است که تحلیل‌های متنی در اقتصاد ایران برای تخمین متغیرهایی اهمیت دارد که در زمان واقعی در دسترس نیستند یا توسط منابع رسمی اندازه‌گیری نمی‌شوند. مدل کنون‌بینی رشد اقتصادی معرفی‌شده در این پژوهش به بانک مرکزی و دولت کمک می‌کند تا با شناسایی به‌موقع روندهای اقتصادی، سیاست‌های پولی و مالی خود را بهینه‌سازی کنند. برای مثال، اگر پیش‌بینی‌ها نشان‌دهنده رشد اقتصادی اندک باشند، بانک مرکزی ممکن است نرخ بهره را کاهش دهد؛ همچنین این سیاست‌گذاران می‌توانند اثربخشی سیاست‌های اقتصادی گذشته و حال را بهتر ارزیابی کنند. کنون‌بینی رشد اقتصادی به‌مثابه ابزاری برای مدیریت انتظارات شرکت‌ها و سرمایه‌گذاران نیز به کاهش عدم اطمینان در مورد آینده اقتصادی کمک می‌کند که این امر به نوبه خود به کاهش ریسک و بهبود فرایند تصمیم‌گیری فعالان اقتصادی منجر می‌شود. برای پیشنهاد مطالعات بعدی می‌توان در کنار استفاده از شاخص حسی این پژوهش، کلان‌داده‌های دیگری همچون تصاویر ماهواره‌ای، داده‌های حمل‌ونقل، داده‌های مصرف انرژی و داده‌های پرداخت الکترونیکی را به منظور کاهش خطای پیش‌بینی به کار برد؛ همچنین می‌توان با استفاده از سایر رویکردهای تحلیل احساس و استفاده از مدل‌های یادگیری ماشین، عملکرد مدل این پژوهش را بهبود داد.

[1]. Andres Algaba et al., “Econometrics meets sentiment: An overview of methodology and applications,” Journal of Economic Surveys 34, no. 3 (2020): 517-518.

[2]. Marta Banbura, Domenico Giannone, and Lucrezia Reichlin, “Nowcasting,” in The Oxford handbook of economic forecasting, eds. Clements, Michael P. and David F. Hendry (OUP USA, 2011), 193.

[3]. Domenico Giannone, Lucrezia Reichlin, and David H. Small, “Nowcasting GDP and inflation: the real-time informational content of macroeconomic data releases,” ECB working paper, no. 633 (2006): 1-52.

[4]. Danilo Cascaldi-Garcia, Matteo Luciani, and Michele Modugno, “Lessons from Nowcasting GDP across the World,” International Finance Discussion Paper 1385 (2023): 5-6.

[5]. Boriss Siliverstovs, “New York FED staff nowcasts and reality: What can we learn about the future, the present, and the past?,” Econometrics 9, no. 1 (2021): 1.

[6]. Mary Keeney, Bernard Kennedy, and Joelle Liebermann, “The value of hard and soft data for short-term forecasting of GDP,” Economic Letters, no. 11 (2012): 1.

[7]. Ziqi Zang, “Three Essays on Big Data in International Finance” (PhD diss., UCLA, 2019), 1.

[8]. Luca Barbaglia et al., “Testing big data in a big crisis: Nowcasting under COVID-19,” International Journal of Forecasting 39, no. 4 (2023): 1548-1563; Lucas Manchado Marcos, “Nowcasting with Alternative Data” )Bachelor's thesis, Polytechnic University of Catalonia, 2023(, 8.

[9]. Valentina Aprigliano et al., “The power of text-based indicators in forecasting Italian economic activity,” International Journal of Forecasting 39, no. 2 (2023): 791.

[10]. Andreas Hotho, Andreas Nürnberger, and Gerhard Paaß, “A brief survey of text mining,” Journal for Language Technology and Computational Linguistics 20, no. 1 (2005): 19-62.

[11]. Bing Liu, Sentiment analysis and opinion mining ([n.p]: Springer Nature, 2022), 7.

[12]. Lin Yue et al., “A survey of sentiment analysis in social media,” Knowledge and Information Systems 60 (2019): 618.

[13]. Liu. Sentiment analysis, 7-8.

[14]. عبدالصمد کرامت‌فر، «مدل‌سازی چند جریانی زمینه نظرات برای تحلیل احساس»(رساله دکترا، دانشگاه قم، 1400)، 3.

[15]. Akshi Kumar and Mary Sebastian Teeja, “Sentiment analysis: A perspective on its past, present and future,” International Journal of Intelligent Systems and Applications 4, no. 10 (2012): 4;

زینب رجبی، محمدرضا ولوی، و مریم حورعلی، «مروری بر روش‌های تحلیل احساس در متون فارسی»، فصل‌نامه پردازش علائم و داده‌ها 19، شماره 2 (تابستان 1401): 112

[16]. Liu. Sentiment analysis, 49.

[17]. Marouane Birjali, Mohammed Kasri, and Abderrahim Beni-Hssane, “A comprehensive survey on sentiment analysis: Approaches, challenges and trends,” Knowledge-Based Systems 226, no. 107134 (2021): 3.

[18]. Liu. Sentiment analysis, 11.

[19]. Birjali, Kasri, and Beni-Hssane, “A comprehensive survey,” 8-10.

[20]. Zohreh Madhoushi, Abdul Razak Hamdan, and Suhaila Zainudin, “Sentiment analysis techniques in recent works,” science and information conference (SAI) (2015): 288-291.

[21]. کرامت‌فر، «مدل‌سازی چند جریانی»، 4.

[22]. Birjali, Kasri, and Beni-Hssane, “A comprehensive survey,” 16-17.

[23]. Marcel Garz, “Macroeconomic news: A literature survey and methodological guidelines,” SSRN 4643970 (2023):1-30.

[24]. Beomseok Seo, Younghwan Lee, and Hyungbae Cho, “Measuring News Sentiment of Korea Using Transformer,” Korean Economic Review 40, no. 1 (2024): 149-176.

[25]. Valentina Aprigliano et al., “The power of text-based,” 791-808.

[26]. Adam Hale Shapiro, Moritz Sudhof, and Daniel J. Wilson, “Measuring news sentiment,” Journal of econometrics 228, no. 2 (2022): 221-243.

[27]. Kazuhiro Seki, Yusuke Ikuta, and Yoichi Matsubayashi, “News-based business sentiment and its properties as an economic index,” Information Processing & Management 59, no. 2, 102795 (2022): 1-16.

[28]. Sonja Tilly, Markus Ebner, and Giacomo Livan, “Macroeconomic forecasting through news, emotions and narrative,” Expert Systems with Applications 175, no. 114760 (2021): 1-12.

[29]. Dooruj Rambaccussing and Andrzej Kwiatkowski, “Forecasting with news sentiment: Evidence with UK newspapers,” International Journal of Forecasting 36, no. 4 (2020): 1501-1516.

[30]. Leif Anders Thorsrud, “Words are the new numbers: A newsy coincident index of the business cycle,” Journal of Business & Economic Statistics 38, no. 2 (2020): 393-409.

[31]. David Ardia, Keven Bluteau, and Kris Boudt, “Questioning the news about economic growth: Sparse forecasting using thousands of news-based sentiment values,” International Journal of Forecasting 35, no. 4 (2019): 1370-1386.

[32]. Stefan Feuerriegel and Julius Gordon,“News-based forecasts of macroeconomic indicators: A semantic path model for interpretable predictions,” European Journal of Operational Research 272, no. 1 (2019): 162-175.

[33]. Fatemeh Hemmatian and Mohammad Karim Sohrabi, “A survey on classification techniques for opinion mining and sentiment analysis,” Artificial intelligence review 52, no. 3 (2019): 1526-1531.

[34]. Mike Thelwall et al., “Sentiment strength detection in short informal text,” Journal of the American society for information science and technology 61, no. 12 (2010): 2544-2558.

[35]. Joanna Strycharz, Nadine Strauss, and Damian Trilling, “The role of media coverage in explaining stock market fluctuations: Insights for strategic financial communication,” International Journal of Strategic Communication 12, no. 1 (2018): 67-85; Tiran Rothman, and Chen Yakar, “Empirical Analysis Тowards the Effect of Social Media on Cryptocurrency Price and Volume,” European Scientific Journal, ESJ 15 (2019): 31-52; Anna Brosius, Erika J. van Elsas, and Claes H. de Vreese, “Bad news, declining trust? Effects of exposure to economic news on trust in the European Union,” International Journal of Public Opinion Research 32, no. 2 (2020): 223-242.

[36]. مرتضی آهنگری آهنگرکلایی، علی سبطی، و مهدی یعقوبی، «ساخت واژگان به‌صورت خودکار برای تحلیل نظرات در حوزه بورس»، فصل‌نامه پردازش علائم و داده‌ها 20، شماره 2 (تابستان 1402): 3-20؛ عظیم زارعی، داود فیض، و غزاله طاهری، «ارائه چارچوب هوشمندی بازار اجتماعی مبتنی بر وب 0/2 با استفاده از تکنیک متن‌کاوی در وب‌سایت‌های رسانه‌های اجتماعی (مورد مطالعه: تحلیل رقابتی در بین برندهای سامسونگ و امرسان)»، پژوهش‌های مدیریت در ایران 24، شماره 4 (1399): 98-125.

[37]. علی سوری، اقتصادسنجی پیشرفته، چاپ 1، جلد 2 (تهران: انتشارات نور علم، 1400(، 870-872.

Bibliography

Ahangari Ahangarkolaei, Morteza, Ali Sebti, and Mehdi Yaghoubi. “Automatically generate sentiment lexicon for the Persian stock market.” Signal and Data Processing 20, no. 2 (2023): 3-20. https://dx.doi.org/ 10.61186/jsdp.20.2.3.[In Persian]

Algaba, Andres, David Ardia, Keven Bluteau, Samuel Borms, and Kris Boudt. “Econometrics meets sentiment: An overview of methodology and applications.” Journal of Economic Surveys 34, no. 3 (2020): 512-547.

Aprigliano, Valentina, Simone Emiliozzi, Gabriele Guaitoli, Andrea Luciani, Juri Marcucci, and Libero Monteforte. “The power of text-based indicators in forecasting Italian economic activity.” International Journal of Forecasting 39, no. 2 (2023): 791-808. https://dx.doi.org/10.1016/j.ijforecast.2022.02.006.

Ardia, David, Keven Bluteau, and Kris Boudt. “Questioning the news about economic growth: Sparse forecasting using thousands of news-based sentiment values.” International Journal of Forecasting 35, no. 4 (2019): 1370-1386. https://dx.doi.org/10.1016/j.ijforecast.2018.10.010.

Banbura, Marta, Domenico Giannone, and Lucrezia Reichlin. “Nowcasting” in The Oxford handbook of economic forecasting , edited by Clements, Michael P., and David F. Hendry, 193-224. OUP USA, 2011.

Barbaglia, Luca, Lorenzo Frattarolo, Luca Onorante, Filippo Maria Pericoli, Marco Ratto, and Luca Tiozzo Pezzoli. “Testing big data in a big crisis: Nowcasting under COVID-19.” International Journal of Forecasting 39, no. 4 (2023): 1548-1563. https://dx.doi.org/10.1016/j.ijforecast.2022.10.005.

Birjali, Marouane, Mohammed Kasri, and Abderrahim Beni-Hssane. “A comprehensive survey on sentiment analysis: Approaches, challenges and trends.” Knowledge-Based Systems 226, 107134 (2021): 1-26. https://dx.doi.org/10.1016/j.knosys.2021.107134.

Brosius, Anna, Erika J. van Elsas, and Claes H. de Vreese. “Bad news, declining trust? Effects of exposure to economic news on trust in the European Union.” International Journal of Public Opinion Research 32, no. 2 (2020): 223-242. https://dx.doi.org/10. 1093/ijpor/edz025.

Cascaldi-Garcia, Danilo, Matteo Luciani, and Michele Modugno. “Lessons from Nowcasting GDP across the World.” International Finance Discussion Paper 1385 (2023): 1-37. http://dx.doi.org/10.17016/IFDP.2023.1385.

Feuerriegel, Stefan, and Julius Gordon. “News-based forecasts of macroeconomic indicators: A semantic path model for interpretable predictions.” European Journal of Operational Research 272, no. 1 (2019): 162-175. https://dx.doi.org/10.1016/j.ejor.2018.05.068.

Garz, Marcel. “Macroeconomic news: A literature survey and methodological guidelines.” SSRN 4643970 (2023):1-30 http://dx.doi.org/10.2139/ssrn.4643970.

Giannone, Domenico, Lucrezia Reichlin, and David H. Small. “Nowcasting GDP and inflation: the real-time informational content of macroeconomic data releases.” ECB working paper, no. 633 (2006): 1-52. http://dx.doi.org/10.2139/ssrn.873658.

Hemmatian, Fatemeh, and Mohammad Karim Sohrabi. “A survey on classification techniques for opinion mining and sentiment analysis.” Artificial intelligence review 52, no. 3 (2019): 1495-1545. https://dx.doi.org/10.1007/s10462-017-9599-6.

Hopp, Daniel. “Benchmarking Econometric and Machine Learning Methodologies in Nowcasting.” UNCTAD Research Paper, no. 83 (2022) :1-31 .https://dx.doi.org/10.13140/RG.2.2.13344.87042.

Hotho, Andreas, Andreas Nürnberger, and Gerhard Paaß. “A brief survey of text mining.” Journal for Language Technology and Computational Linguistics 20, no. 1 (2005): 19-62. https://dx.doi.org/ 10.21248/jlcl.20.2005.68.

https://dx.doi.org/10.1111/joes.12370.

Keeney, Mary, Bernard Kennedy, and Joelle Liebermann. “The value of hard and soft data for short-term forecasting of GDP.” Economic Letters, no .11 (2012): 1-6.

Keramatfar, Abdalsamad. “Multi-stream modeling of comments’ contexts for sentiment analysis.” PhD diss., University of Qom, 2021. [In Persian]

Kumar, Akshi, and Mary Sebastian Teeja. “Sentiment analysis: A perspective on its past, present and future.” International Journal of Intelligent Systems and Applications 4, no. 10 (2012): 1-14. https://dx.doi.org/ 10.5815/ijisa.2012.10.01.

Liu, Bing. Sentiment analysis and opinion mining. [N.P]: Springer Nature, 2022.

Madhoushi, Zohreh, Abdul Razak Hamdan, and Suhaila Zainudin. “Sentiment analysis techniques in recent works.” science and information conference (SAI) (2015): 288-291. https://dx.doi.org/ 10.1109/SAI.2015.7237157.

Manchado Marcos, Lucas. “Nowcasting with Alternative Data.” Bachelor's thesis, Polytechnic University of Catalonia, 2023.

Rajabi, Zeinab, Mohamadreza Valavi, and Maryam Hourali. “Sentiment analysis methods in Persian text: A survey.” Signal and Data Processing 19, no. 2 (2022): 107-132. https://dx.doi.org/ 10.52547/jsdp.19.2.107. [In Persian]

Rambaccussing, Dooruj, and Andrzej Kwiatkowski. “Forecasting with news sentiment: Evidence with UK newspapers.” International Journal of Forecasting 36, no. 4 (2020): 1501-1516. https://dx.doi.org/10.1016/j.ijforecast.2020.04.002.

Rothman, Tiran, and Chen Yakar. “Empirical Analysis Тowards the Effect of Social Media on Cryptocurrency Price and Volume.” European Scientific Journal, ESJ 15 (2019): 31-52. https://dx.doi.org/10.19044/esj.2019.v15n31p52 .

Seki, Kazuhiro, Yusuke Ikuta, and Yoichi Matsubayashi. “News-based business sentiment and its properties as an economic index.” Information Processing & Management 59, no. 2, 102795 (2022): 1-16. https://dx.doi.org/10.1016/j.ipm.2021.102795.

Seo, Beomseok, Younghwan Lee, and Hyungbae Cho. “Measuring News Sentiment of Korea Using Transformer.” Korean Economic Review 40, no. 1 (2024): 149-176.

Shapiro, Adam Hale, Moritz Sudhof, and Daniel J. Wilson. “Measuring news sentiment.” Journal of econometrics 228, no. 2 (2022): 221-243. https://dx.doi.org/10.1016/j.jeconom.2020.07.053.

Siliverstovs, Boriss. “New York FED staff nowcasts and reality: What can we learn about the future, the present, and the past?” Econometrics 9, no. 1 (2021): 1-11. https://dx.doi.org/10.3390/econometrics9010011.

Souri, Ali. Advanced Econometrics.Volume 2 . Tehran: Noor Elm Press, 2021. [In Persian]

Strycharz, Joanna, Nadine Strauss, and Damian Trilling. “The role of media coverage in explaining stock market fluctuations: Insights for strategic financial communication.” International Journal of Strategic Communication 12, no. 1 (2018): 67-85. https://dx.doi.org/10.1080/1553118X.2017.1378220.

Thelwall, Mike, Kevan Buckley, Georgios Paltoglou, Di Cai, and Arvid Kappas. “Sentiment strength detection in short informal text.” Journal of the American society for information science and technology 61, no. 12 (2010): 2544-2558. https://dx.doi.org/10.1002/asi.21416.

Thorsrud, Leif Anders. “Words are the new numbers: A newsy coincident index of the business cycle.” Journal of Business & Economic Statistics 38, no. 2 (2020): 393-409. https://dx.doi.org/10.1080/07350015.2018.1506344.

Tilly, Sonja, Markus Ebner, and Giacomo Livan. “Macroeconomic forecasting through news, emotions and narrative.” Expert Systems with Applications 175, 114760 (2021): 1-12. https://dx.doi.org/10.1016/j.eswa.2021.114760.

Yue, Lin, Weitong Chen, Xue Li, Wanli Zuo, and Minghao Yin. “A survey of sentiment analysis in social media.” Knowledge and Information Systems 60 (2019): 617-663. https://dx.doi.org/10.1007/s10115-018-1236-4.

Zang, Ziqi. “Three Essays on Big Data in International Finance.” PhD diss., UCLA, 2019.

Zarei, Azim, Davood Feiz, and Ghazale Taheri. “Providing Social Market Intelligence Framework based on web 2.0 Using Text-Mining Technique on Social Media Websites (Case Study: Competitive Analysis between Samsung and Emersun Brands).” Management Research in Iran 24, no.4 (2021): 98-125. [In Persian]

Send comment about this article

Name *

Enter Name.

Email Address *

Enter a valid email address.

Affiliation *

Enter a vaid affiliation.

Comments *

Enter comments (At leaset 10 words)

Security Code *