Comparing the Efficiency of Statistical Models and Machine-Learning Models and Choosing the Optimal Model for Predicting Net Profit and Operating Cash Flows

Document Type : Research Paper

Authors

1 MSc. of Financial Management, Faculty of Economics and Management, Urmia University, Urmia, Iran

2 Assistant Professor, Department of Accounting, Faculty of Economics and Management, Urmia University, Urmia, Iran

Abstract

The present study compared the predictive performance of machine-learning models and statistical models for forecasting profit and operational cash flow by using a combination of accrual and cash variables. The research method encompassed 3 main stages: data set and variable selection, modeling, and estimation. The study focused on companies listed on the Tehran Stock Exchange (TSE), analyzing data from 184 companies over the period of 2012-2021. The findings indicated that accrual variables exhibited greater explanatory power than cash variables in predicting net profit and future operating cash flow. Furthermore, the comparison of machine-learning and statistical models for forecasting net profit and future operating cash flow revealed that the artificial intelligence approach exhibited superior capability. Specifically, symbolic regression among the machine-learning models and the probit model among the statistical models demonstrated higher performance. Additionally, the results indicated that certain statistical models outperformed some machine-learning models while, on average, machine-learning models outperformed statistical models.
Keywords: Classification, Data Mining, Machine Learning, Net Profit Forecasting, Operating Cash Flow Forecasting.
 
Introduction
In the current intensely competitive business environment, precise prediction of financial outcomes has emerged as a pivotal element in organizational triumph. Projecting crucial financial indicators, such as net profit and operating cash flows, equips businesses with the insight needed to make well-informed choices regarding investment strategies, resource distribution, and comprehensive financial strategizing. The capacity to anticipate future financial performance enables organizations to streamline operations and mitigate risks. Consequently, there is an escalating need for effective forecasting models.
This study had two primary objectives: firstly, assessing the predictive capability of accrual and cash variables for forecasting profit and future cash flows and secondly, comparing the efficacy of statistical models and machine-learning models in predicting net profit and operating cash flows. Statistical models seek to scrutinize historical data patterns and underlying relationships to anticipate future financial outcomes. Conversely, machine-learning models have emerged as a potent alternative, employing advanced computational techniques to glean insights from data and make predictions without explicit programming. This research was guided by four hypotheses:
First hypothesis: The predictive capability of accrual ‎variables for future net profit significantly exceeds that of cash variables.‎
Second hypothesis: The predictive capacity of accrual ‎variables for future operational cash flow significantly surpasses that of cash variables.‎
Third hypothesis: Machine-learning models outperform statistical ‎models significantly in predicting net profit.‎
Fourth hypothesis: Machine-learning models outperform statistical ‎models significantly in predicting operational cash flows.‎
 
Materials & Methods
This study utilized the Bourseview software database, Rahavard Novin, and the Codal website for analyzing and drawing conclusions regarding the hypotheses. Additionally, data-mining software, such as Weka, SPM, RapidMiner, SPSS Modeler, and Eureqa, were employed for modeling, while Stata econometric and statistical software was used for the Vuong test, EViews for descriptive statistics, SPSS for mean comparison test, and Excel for data sorting and categorization. Following the application of these specified tools, 184 companies listed on the Tehran Stock Exchange (TSE) were examined. Initially, the study investigated the ability to explain each category of cash and accrual variables for net profit and future operating cash flow through special regression estimation of panel data and the Vuong test. Subsequently, the superior model was utilized for modeling and the average performance of the machine-learning models was compared with that of statistical models.
 
Findings
The significance of Vuong statistic in predicting net profit at a 1% significance level suggested a notable difference in the explanatory power of the two models with the model of accrual variables demonstrating higher explanatory power than that of the cash flow statement variables. Conversely, the non-significance of the Vuong statistic at the 5% significance level for predicting operational cash flow indicated no significant difference in the explanatory power of the two models. The performance results of both statistical and machine-learning models indicated that the symbolic regression classifier, utilizing the genetic algorithm to predict net profit, exhibited the best overall performance and provided valuable results in the longitudinal test sample. Following symbolic regression, the linear support vector machine and MARS ranked second and third, respectively, in overall performance. Similarly, the symbolic regression classifier, employing the genetic algorithm to predict operating cash flow, demonstrated the best overall performance in the longitudinal test samples. After symbolic regression, the deep learning classifier and MARS ranked second and third, respectively, in overall performance.
 
Discussion & Conclusions
In accordance with testing of the first and second hypotheses of the research, which posited that accrual variables have a greater explanatory capacity for net profit and future operating cash flow compared to cash variables, the coefficients of determination of the models were compared after estimating the appropriate panel data approach. The investigation results indicated that accrual variables indeed possessed greater explanatory power for net profit, thus providing no grounds for rejecting the first hypothesis of the study. However, in the case of operating cash flow, while the explanatory value of accrual variables surpassed that of cash variables, there was no statistically significant difference in the explanation between accrual and cash variables. Consequently, the second hypothesis of the research was rejected. In accordance with testing of the third and fourth hypotheses of the current study, which posited that machine-learning models outperform statistical models in predicting net profit and operating cash flow, the AUC criterion was derived through the implementation of both statistical and machine-learning models. By comparing the success rates of the statistical and machine-learning models, it was observed that the machine-learning models significantly outperformed statistical models in predicting net profit and operational cash flow. Therefore, there was no basis for rejecting the third and fourth hypotheses of the study.

Keywords

Main Subjects


مقدمه

در چشم‌انداز تجاری بسیار رقابتی امروزی، پیش‌بینی دقیق نتایج مالی به عاملی حیاتی در موفقیت سازمان تبدیل شده است. پیش‌بینی معیارهای مالی کلیدی مانند سود خالص و جریان‌های نقدی عملیاتی به کسب‌وکارها قدرت می‌دهد تا تصمیمات آگاهانه دربارۀ استراتژی‌های سرمایه‌گذاری، تخصیص منابع و برنامه‌ریزی مالی کلی اتخاذ کنند. توانایی پیش‌بینی عملکرد مالی آتی به سازمان‌ها اجازه می‌دهد تا عملیات را بهینه کنند، ریسک‌ها را کاهش دهند و فرصت‌ها را به‌موقع استفاده کنند؛ درنتیجه تقاضای فزاینده‌ای برای مدل‌‌های پیش‌بینی کارا وجود دارد که پیش‌‌بینی‌‌های دقیق و قابل‌اعتمادی را برای این شاخص‌‌های مالی مهم ارائه می‌دهد (Parlina & Budianto, 2021).

اجزای مختلف سود عامل توضیحی مهمی برای پیش‌‌بینی جریان نقد و سود آتی است. منابع موجود در تجزیه‌وتحلیل صورت‌‌های مالی اغلب از بررسی اجزای تعهدی و جریان نقدی سود جاری به‌منظور پیش‌بینی سودهای آتی حمایت می‌کند (Oz et al., 2021). اطلاعات سود شامل اقلام تعهدی و جریان‌‌های نقدی است که هر دو بر عملکرد شرکت در آینده تأثیر می‌‌گذارد (Sharawi, 2021). به‌طور سنتی، تجزیه‌وتحلیل مالی برای مدت طولانی به عملکرد حسابداری از طریق متغیرهای تعهدی بستگی دارد؛ با این ‌حال، این اشکال متغیر‌‌ها متأثر از اشکالات اساسی هستند که ویژگی‌های حسابداری تعهدی است. بیشتر نسبت‌های محاسبه‌شده به‌طور معمول فقط بر صورت وضعیت ‌‌مالی و صورت سود و زیان تمرکز دارد و این در حالی است که صورت جریان‌‌های نقدی نیز بینش مفیدی از تجزیه‌وتحلیل متغیرها ارائه می‌دهد. متغیر‌های صورت‌‌‌ وضعیت ‌مالی فقط چشم‌اندازی از تاریخ در زمان ارائه می‌دهد؛ در حالی ‌که صورت جریان وجوه نقد نشان‌دهندۀ فعالیت برای دوره‌ای مداوم است. صورت سود و زیان نتایج عملیات را برای یک دورۀ زمانی گزارش می‌‌کند؛ اما سایر تغییرات مهم در منابع را که ناشی از فعالیت‌‌های تأمین مالی و سرمایه‌گذاری است، افشا نمی‌‌کند. صورت جریان وجوه نقد با ارائۀ اطلاعات اضافی نسبت به‌ صورت وضعیت مالی و سود و زیان توانایی سازمان را برای عملکرد کارآمد، تأمین مالی و پرداخت تعهدات تکمیل می‌‌کند (Barua & Saha, 2015).

هدف اول این پژوهش، ارائۀ نمایی کلی از متغیر‌‌های جریان نقدی و تعهدی به‌عنوان یک ابزار تحلیلی قدرتمند و مؤثر است. اگرچه محتوای اطلاعاتی متغیرهای تعهدی و صورت جریان‌های نقدی ممکن است عاملی توضیحی برای سودها و جریان‌‌های نقدی آینده باشد، توانایی آنها در شناسایی سود و جریان نقد آتی بررسی نشده است؛ از این ‌رو، این پژوهش در مرحلۀ اول، به‌دنبال بررسی توانایی توضیح‌دهندگی متغیرهای تعهدی و نقدی برای سود و جریان نقد آتی است. به‌طور خاص، این پژوهش پیش‌بینی سود خاص و جریان نقد عملیاتی آتی را با مجموعه‌‌ای از متغیرهای نقدی و تعهدی بررسی می‌‌کند که توانایی توضیح‌دهندگی بیشتری دارد.

در قلمرو مدل‌سازی پیش‌بینی، دو رویکرد برجسته جذابیت جالب‌‌توجهی به دست آورده‌اند: مدل‌های آماری و یادگیری ماشین. مدل‌های آماری مدت‌‌هاست که به‌عنوان ابزاری اساسی در تحلیل و پیش‌‌بینی داده‌‌ها استفاده می‌‌شود. این مدل‌ها براساس مفروضات از پیش تعریف‌شده و الگوریتم‌های ریاضی، با استفاده از فن‌هایی مانند تحلیل رگرسیون، تحلیل سری‌های زمانی و مدل‌سازی اقتصادسنجی ساخته ‌شده است (Monahan, 2018). هدف مدل‌های آماری با بررسی الگوهای داده‌های تاریخی، گرفتن روابط و پویایی‌های اساسی به‌منظور ایجاد پیش‌بینی برای نتایج مالی آینده است. (Martins, 2022).

از سوی دیگر، مدل‌های یادگیری ماشین به‌عنوان جایگزینی قدرتمند ظاهر می‌شود‌ و از فن‌های محاسباتی پیشرفته برای یادگیری از داده‌ها و پیش‌بینی بدون برنامه‌نویسی صریح استفاده می‌کند (Petropoulos et al., 2020). الگوریتم‌های یادگیری ماشین مانند شبکه‌های عصبی، درخت‌های تصمیم‌گیری و ماشین‌های بردار پشتیبان، قابلیت‌های چشمگیری را در مدیریت مجموعۀ داده‌های پیچیده و با ابعاد زیاد نشان داده است (Ashtab et al., 2017). این مدل‌ها در گرفتن روابط غیرخطی، شناسایی الگوهای پیچیده و تطبیق با دینامیک داده‌های در حال تغییر برتری دارند. حوزۀ یادگیری ماشینی در سال‌های اخیر شاهد پیشرفت‌های جالب‌توجهی بوده که به افزایش کاربرد آن در حوزه‌های مختلف ازجمله امور مالی منجر شده است (Dastile et al., 2020).

سؤال کلیدی که مطرح می‌‌شود، این است: کدام رویکرد، مدل‌‌های آماری یا یادگیری ماشینی راه‌حل بهینه را برای پیش‌بینی سود خالص و جریان‌های نقد عملیاتی ارائه می‌دهد؟ در حالی ‌که هر دو روش مزایای خود را دارد و مزایا و محدودیت‌های متمایزی را نیز ارائه می‌کند که باید به‌دقت بررسی شود. مدل‌های آماری پایه‌ای محکم را مبتنی بر نظریۀ آماری و امکان تفسیر و استنتاج فراهم می‌کند. آنها اغلب به فرضیات صریح دربارۀ داده‌ها نیاز دارند و برای تخمین پارامتر به فن‌های آماری تثبیت‌شده تکیه می‌‌کنند (Mullainathan & Spiess, 2017). در مقابل، مدل‌های یادگیری ماشین با اجازه‌دادن به داده‌ها برای هدایت فرآیند تصمیم‌گیری مدل، پتانسیل افزایش دقت و انعطاف‌پذیری را ارائه می‌کند؛ با این ‌حال، این انعطاف‌پذیری گاهی اوقات به قیمت تفسیرپذیری تمام می‌شود؛ زیرا مدل‌های یادگیری ماشینی به دلیل معماری پیچیده و عملکرد داخلی پیچیده‌ای که دارند، اغلب به‌عنوان مدل‌های جعبه سیاه در نظر گرفته می‌شوند (Anand et al., 2019).

هدف این پژوهش، بررسی چالش مهم مقایسۀ کارایی مدل‌های آماری و یادگیری ماشین در پیش‌بینی سود خالص و جریان‌های نقدی عملیاتی است. با انجام تحلیلی جامع از این دو رویکرد، هدف، ارائۀ بینشی دربارۀ نقاط قوت و ضعف مربوط به آنهاست و تصمیم‌گیرندگان را قادر می‌کند تا هنگام انتخاب مدل بهینه برای پیش‌بینی مالی، انتخاب‌‌های آگاهانه‌‌ای داشته باشند. برای رسیدن به این هدف، معیار ارزیابی AUC در نظر گرفته شده است. به‌طور خلاصه، این مقاله به گفتمان جاری پیرامون انتخاب مدل‌های پیش‌بینی مناسب برای پیش‌بینی مالی کمک می‌کند. با بررسی کارایی مدل‌های آماری و یادگیری ماشین در پیش‌بینی سود خالص و جریان‌های نقدی عملیاتی، هدف این است که شکاف بین نظریه و عمل پر شود و متخصصان و پژوهشگران با دانش لازم برای تصمیم‌گیری آگاهانه دربارۀ انتخاب مدل تجهیز شوند.

در پژوهش‌‌های گذشته اگرچه پیش‌‌بینی از طریق مدل‌‌های یادگیری ماشین و آماری انجام ‌شده است، تاکنون این مدل‌‌ها در رابطه با پیش‌‌بینی سود خالص و جریان نقد عملیاتی با یکدیگر مقایسه نشده است؛ همچنین بررسی نتایج پژوهش‌‌های پیشین نشان‌دهندۀ آن است که تعداد معدودی از مدل‌‌ها در هر پژوهش بررسی شده است که در این پژوهش برای جامعیت بیشتر موضوع از لیست جامع‌‌تری از مدل‌‌های آماری و یادگیری ماشین استفاده‌ شده است. علاوه بر این، در پژوهش حاضر توان متغیر‌‌های تعهدی و نقدی در پیش‌‌بینی سود خالص و جریان نقد عملیاتی آتی بررسی شده و برای دقیق‌بودن نتایج برخلاف پژوهش‌‌های پیشین که فقط از نمونۀ آزمایشی مقطعی استفاده ‌شده است، در این پژوهش از نمونۀ آزمایشی طولی نیز در بررسی مدل‌‌ها استفاده ‌شده است؛ بنابراین پژوهش حاضر با استفاده از 35 طبقه‌بندی‌کنندۀ غیر پارامتری و یادگیری ماشین، از طریق شش طبقه‌بندی‌کنندۀ پارامتری و مدل‌های آماری، پیش‌بینی سود و جریان نقدی عملیاتی آتی را بررسی کرده است.

 

مبانی نظری

واژۀ سود یکی از مفاهیم پیچیدۀ جهان تجارت است که شاید نتوان تعریف دقیقی از سود ارائه کرد که موردقبول همگان قرار گیرد. در میان تعاریف مختلفی که تاکنون از سود ارائه ‌شده است، تعریف ذیل یکی از جامع‌‌ترین آنهاست: «سود از تغییر در حقوق صاحبان سهام یا تغییر در خالص دارایی‌‌های یک واحد اقتصادی طی دوره‌ای مالی ناشی می‌‌شود. به‌عبارت ‌دیگر، سود برآیند کلیۀ تغییرات در حقوق صاحبان سهام طی یک دورۀ مالی، به‌جز تغییرات ناشی از سرمایه‌‌گذاری توسط صاحبان سهام و توزیع منابع بین آنان است» (Curtis et al., 2021).

نالاردی[1] (2020) بر این باور است که واژۀ سود مفهومی انتزاعی است. در صورتی‌ که وجه نقد مفهومی عینی است. وی معتقد است که تداوم فعالیت بنگاه اقتصادی از اولین موارد موردتوجه بوده است و وجه نقد از مهم‌‌ترین عوامل ادامۀ حیات هر بنگاه اقتصادی به‌حساب می‌آید. تنها شرکت‌‌هایی به فعالیت خود ادامه می‌دهند که علاوه بر سودآور بودن، امکان تأمین نیازهای نقدی خود را نیز داشته باشند. توجه به وضعیت نقدینگی بنگاه برای پرداخت‌های روزمره از ضروریات است. این در حالی است که سود به‌خوبی این اطلاعات را بیان نمی‌‌کند؛ اما صورت جریان‌های نقدی امکان فراهم‌کردن چنین اطلاعاتی را دارد. یک عقیده در تصدیق سود حسابداری این است که سود در طول زمان به‌طور پیوسته توانایی این را داشته است که سرافراز بماند.

یک اصل اساسی در حسابداری این است که صورت‌های مالی تهیه‌شده براساس روش‌های اقلام تعهدی، اطلاعات بیشتری نسبت به حسابداری نقدی دارد که نتیجۀ آن این است که اقلام تعهدی سود را بیشتر از جریان‌های نقدی تبیین می‌‌کند؛ همان‌طور که در ادبیات دانشگاهی بیان‌ شده است، اصل این است که اقلام تعهدی این مشکل را بهبود می‌بخشد که جریان‌‌های نقدی تحقق‌یافته دارای مشکلات زمان‌‌بندی و تطبیق هستند که باعث می‌‌شود، آنها معیاری پیچیده و پرحرف و حدیث برای عملکرد شرکت باشند. درواقع، مدل‌های اقلام تعهدی تحلیلی به این نتیجه می‌رسند که سود، پیش‌بینی‌کنندۀ بهتر برای جریان‌های نقدی عملیاتی آتی نسبت به جریان‌های نقدی عملیاتی فعلی است (Ball & Nikolaev, 2020). ادبیات گزارش هیئت استانداردهای حسابداری مالی (1978) بیان می‌‌کند که: علاقۀ کاربران به جریان‌های نقدی آتی شرکت و توانایی آن برای ایجاد جریان‌های نقدی مطلوب اغلب به علاقه‌مندی به اطلاعات مربوط به سود شرکت منجر می‌شود تا اطلاعات مستقیم دربارۀ جریان‌های نقدی شرکت. بخش عمده‌‌ای از اطلاعات مربوط به جریان‌‌های نقدی با سود تأمین می‌‌شود؛ به‌عنوان‌مثال، با کسرکردن اقلام تعهدی از سود مقدار جریان‌های نقدی به دست می‌آید. به‌طور کلی جزء تعهدی سود به نسبت جزء نقدی آن عدم قطعیت بیشتری دارد؛ به این دلیل که اقلام تعهدی با قضاوت‌‌ها، برآوردها و تخصیص‌‌ها (از جریان‌های نقد تولیدشده در دیگر دوره‌ها) ایجاد می‌‌شوند، در صورتی‌ که جزء نقدی سود عینی‌‌تر است (Nguyen & Nguyen, 2020). با توجه به پژوهش‌های قبلی در رابطه با ویژگی‌‌های کیفی سود، کیفیت اقلام تعهدی نسبت به سایر ویژگی‌‌های کیفی سود برای تعیین ریسک اطلاعاتی مربوط به جریان‌‌های نقدی مناسب‌‌تر است (Khodamipour et al., 2013). اقلام تعهدی، بخش مهم سیستم گزارشگری مالی است که شامل هر چیزی است که بین سود و جریان نقدی فاصله ایجاد می‌‌کند. آ‌‌نها منعکس‌کنندۀ طیف وسیعی از تصمیمات شرکتی، ازجمله فروش، تولید، سرمایه‌گذاری، حسابداری و انتخاب‌‌های مدیریت نقدی شرکت هستند. به‌خوبی ثابت ‌شده است که از دو شرکت با سود یکسان جاری، شرکتی که اقلام تعهدی بیشتری گزارش می‌کند، سود کمتری در آینده خواهد داشت. این پیوند بین اقلام تعهدی و سودآوری آتی که اغلب با این جمله خلاصه می‌شود که «اقلام تعهدی نسبت به جریان‌های نقدی دوام کمتری دارد»، برای ارزیابی شرکت، تجزیه‌وتحلیل صورت‌های مالی و طیف وسیعی از مسائل در حسابداری مهم است. آیا شرکت‌ها از اقلام تعهدی برای مدیریت سود استفاده می‌کنند؟ آیا اقلام تعهدی مثبت یا منفی بزرگ منعکس‌کنندۀ شرایط اقتصادی شرکت است یا اطلاعاتی را دربارۀ کیفیت سود نشان می‌دهد؟ دو توضیح اصلی برای تداوم پایین اقلام تعهدی، اولین بار از سوی اسلون بیان شد (Sloan, 1996). اول، این‌که ذهنیت و تحریف در گزارشگری مالی به خطای اندازه‌‌گیری گذرا در اقلام تعهدی و سود منجر می‌‌شود؛ دوم، اقلام تعهدی ارتباط نزدیکی با سرمایه‌‌گذاری دارند و به دلیل کاهش بازده به مقیاس، هزینه‌های تعدیل مرتبط با سرمایه‌گذاری یا محافظه‌‌کاری در حسابداری، سودآوری آتی کمتر را پیش‌بینی می‌‌کند (Christensen et al., 2022). اقلام تعهدی بیشتر با تغییرات گذرا در حاشیۀ سود مرتبط است و سودهای بعدی کمتر را پیش‌بینی می‌کند؛ زیرا امروزه افزایش قیمت نهاده‌ها هزینه‌های تولید و موجودی شرکت را افزایش می‌دهد؛ اما زمانی که موجودی به فروش می‌رسد، سودهای آتی را کاهش می‌دهد. علاوه بر این، افزایش تقاضا به افزایش موقت سود و سرمایه در گردش و به‌دنبال آن بازگشت میانگین در متغیرها منجر می‌‌شود؛ زیرا رقابت قیمت‌‌ها و سودآوری را به سطوح تعادلی بلندمدت خود بازمی‌گرداند؛ درنتیجه اقلام تعهدی به‌طور مثبت با سود جاری مرتبط است؛ اما با کنترل این رابطه، با سودهای بعدی ارتباط منفی دارد. به‌طور خلاصه، تداوم پایین اقلام تعهدی به دلیل واکنش تولید، فروش و سود به تغییرات در بازارهای محصول شرکت است (Lewellen & Resutek, 2019).

بال و نیکولایف[2] (2020) این سؤال را که آیا طبق چارچوب مفهومی هیئت استانداردهای حسابداری مالی (FASB, 1978) سودهای مبتنی بر اقلام تعهدی اطلاعات بهتری دربارۀ جریان‌های نقدی عملیاتی آتی نسبت به خود جریان‌های نقدی عملیاتی ارائه می‌دهد، بین شرکت‌‌های پذیرفته‌شده در بورس اوراق بهادار هلند از سال 1999 تا 2019 بررسی کردند و به این نتیجه رسیدند که سود بهتر از جریان‌های نقدی عملیاتی عمل می‌کند. بر این اساس فرضیه‌‌های اول و دوم پژوهش به‌صورت زیر تدوین می‌‌شود:

فرضیۀ اول: توانایی توضیح‌‌دهندگی متغیرهای تعهدی برای سود خالص آتی به‌طور معناداری بیشتر از متغیرهای نقدی است.

فرضۀ دوم: توانایی توضیح‌‌دهندگی متغیرهای تعهدی برای جریان نقد عملیاتی آتی به‌طور معناداری بیشتر از متغیرهای نقدی است.

مدل‌های آماری از دیرباز به‌عنوان سنگ‌بنای تحلیل و پیش‌بینی داده‌ها عمل کرده است. این مدل‌ها مبتنی بر نظریۀ آماری هستند و از فن‌های تثبیت‌شده مانند تحلیل رگرسیون و سری‌های زمانی برای ثبت روابط بین متغیرها و ایجاد پیش‌بینی استفاده می‌کنند (Chatfield, 2020). مدل‌های آماری چندین مزیت ازجمله تفسیرپذیری، استنتاج، توانایی ترکیب دانش و فرضیات قبلی دربارۀ داده‌ها ارائه می‌دهد (Barboza et al., 2017). تفسیرپذیری مدل‌های آماری به متخصصان اجازه می‌دهد تا تأثیر متغیرها را درک کرده و اهمیت ضرایب آنها را ارزیابی کنند، تصمیم‌گیری را تسهیل می‌کند و بینش‌های ارزشمندی دربارۀ پویایی‌های اساسی داده‌های مالی ارائه می‌دهد (Montgomery et al., 2019). علاوه بر این، مدل‌های آماری اغلب به نقاط دادۀ کمتری برای تولید پیش‌بینی‌های قابل‌اعتماد نیاز دارد و آنها را برای سناریوهایی با در دسترس بودن داده‌های محدود مناسب می‌کند.(Ahn et al., 2020)

با این‌ حال، مدل‌های آماری محدودیت‌های خاصی دارند که باید در نظر گرفته شوند. این مدل‌ها اغلب خطی‌بودن بین متغیرها را فرض می‌کند و ممکن است برای گرفتن روابط غیرخطی پیچیده تلاش کند (Bishop & Nasrabadi, 2006). آنها بر مفروضاتی مانند استقلال، نرمال‌بودن و همسانی واریانس تکیه می‌‌کنند که ممکن است در مجموعۀ داده‌های مالی دنیای واقعی وجود نداشته باشد (Mills, 2019)؛ درنتیجه مدل‌های آماری ممکن است در صورت مواجهه با توزیع داده‌های غیرخطی یا غیر نرمال، پیش‌بینی‌های کمتر از حد بهینه را ایجاد کند. به‌علاوه، مدل‌های آماری ممکن است با مجموعه داده‌های با ابعاد بالا که حاوی متغیرهای متعددی است، مشکل داشته باشد؛ زیرا اغلب به انتخاب دقیق متغیر و ساده‌سازی مدل برای جلوگیری از برازش بیش‌ازحد نیاز دارد.(Gelman et al., 2020)

از سوی دیگر، مدل‌های یادگیری ماشینی، رویکردی انعطاف‌پذیر و مبتنی بر داده‌ها را برای پیش‌بینی مالی ارائه می‌دهد. این مدل‌ها ازجمله شبکه‌های عصبی، درخت‌های تصمیم‌گیری و ماشین‌های بردار پشتیبان از فن‌های محاسباتی پیشرفته برای یادگیری خودکار الگوها و روابط از داده‌ها بدون تکیه بر مفروضات صریح استفاده می‌کند ((Raschka & Mirjalili, 2020. مدل‌های یادگیری ماشین قابلیت‌های پیش‌بینی استثنایی را با گرفتن روابط غیرخطی پیچیده و انطباق با دینامیک داده‌ها در حال تغییر نشان داده است .(Bengio (et al., 2021 آنها در سناریوهایی که روابط بین متغیرها پیچیده یا به‌خوبی درک نشده است، برتری دارند.

یکی از مزیت‌های اولیۀ مدل‌های یادگیری ماشین، توانایی آنها در مدیریت مجموعه داده‌های با ابعاد بالا با تعداد زیادی متغیر است (Hastie et al., 2009). این مدل‌ها ویژگی‌های مرتبط را به‌طور خودکار شناسایی می‌کنند و بازنمایی‌های داخلی خود را برای ثبت الگوهای زیربنایی در داده‌ها تطبیق می‌دهند .(Goodfellow et al., 2016) مدل‌های یادگیری ماشینی انواع مختلفی از داده‌ها ازجمله داده‌های عددی، مقوله‌ای و متنی را مدیریت می‌کند و آنها را برای طیف گسترده‌ای از وظایف پیش‌بینی مالی قابل‌اجرا می‌سازد (Chen & Guestrin, 2016). علاوه بر این، مدل‌های یادگیری ماشینی از فن‌های مجموعه مانند بسته‌بندی و تقویت برای بهبود دقت پیش‌بینی با ترکیب خروجی‌های مدل‌های متعدد استفاده می‌کنند .(Breiman, 1996)

با این‌ حال، مدل‌های یادگیری ماشینی بدون چالش نیستند. یکی از نگرانی‌های کلیدی، ماهیت جعبه سیاه آنهاست که مانع از تفسیرپذیری و درک مکانیسم‌های اساسی مدل می‌شود (Murdoch et al., 2019). برخلاف مدل‌های آماری، مدل‌های یادگیری ماشین دقت پیش‌بینی را بر تفسیرپذیری اولویت می‌دهند و توضیح چگونگی و چرایی پیش‌بینی‌های خاص را دشوار می‌کنند (Caruana
et al., 2015
). این عدم تفسیرپذیری نگرانی‌های قانونی و اخلاقی ایجاد می‌کند، به‌ویژه در حوزه‌هایی مانند امور مالی که شفافیت و پاسخگویی بسیار مهم است (Rudin, 2019). به‌علاوه، مدل‌های یادگیری ماشینی ازنظر محاسباتی فشرده است، به منابع محاسباتی قابل‌توجهی نیاز دارد و آنها را برای برنامه‌های پیش‌بینی بلادرنگ یا محیط‌هایی باقابلیت‌های محاسباتی محدود کمتر مناسب می‌سازد (Huang et al., 2017).

رجب‌زاده و همکاران (2022)، طی پژوهشی با عنوان پیش‌‌بینی جریان وجه نقد عملیاتی شرکت‌‌های پذیرفته‌شده در بورس اوراق بهادار تهران با استفاده از روش یادگیری ماشین جریان نقد عملیاتی را با رویکرد هوش مصنوعی PLSVM و CART در بازۀ زمانی 1390 تا 1397 بررسی کردند و نشان دادند که رویکرد هوش مصنوعی قانون‌‌گرا و غیرخطی پارامتریک توانایی زیادی در پیش‌‌بینی نقدینگی شرکت‌‌های بورس اوراق بهادار تهران دارد. حبیب‌زاده و ایزدپور (2020)، تأثیر 34 متغیر را بر صحت پیش‌بینی سودآوری شرکت‌های پذیرفته‌شده توسط بورس اوراق بهادار تهران بررسی کردند. نتایج مقایسه نشان‌دهندۀ آن بود که استفاده از درخت تصمیم C5 با دقت 54/93 درصد بهترین پیش‌‌بینی را دارد و سپس مدل شبکۀ عصبی با دقت 45/81 درصد دقیق‌‌تر از ماشین بردار پشتیبان با دقت 35/69 درصد شده است و خطای کمتر دارد. مهربان‌‌پور و حبیب‌زاده (2017)، سودآوری شرکت‌‌ها را خوشه‌بندی و پیش‌بینی کردند. شرکت‌ها به سه خوشه تبدیل شدند و با استفاده از درخت تصمیم C5، تجزیه‌وتحلیل خوشه‌ای و متغیرهای مؤثر بر سودآوری شناسایی و نشان داده شد که 8 متغیر شامل: سود ناخالص به‌ کل دارایی‌‌ها، فروش به‌کل دارایی‌‌ها، سود به حقوق صاحبان سهام، سود عملیاتی به فروش خالص، سود و زیان انباشته به حقوق صاحبان سهام، سود خالص به فروش خالص، کل بدهی‌‌ها به ‌کل دارایی‌‌ها و دارایی‌‌های جاری به ‌کل دارایی‌‌ها بر سودآوری شرکت‌‌ها تأثیر می‌‌گذارد؛ درنتیجه با استفاده از این متغیر‌‌ها، پیش‌بینی سه خوشه انجام شد و دقت آنها به‌ترتیب برابر با 34/86، 15/88 و 68/81 درصد است. آناند و همکاران[3] (2019) به‌دقت طبقه‌‌بندی 57 تا 64 درصد برای معیار‌‌های سودآوری در مقایسه با 50 درصد گام تصادفی دست‌‌ یافتند. آنها دریافتند که دقت طبقه‌‌بندی در افق‌‌های یک تا پنج‌ساله یکسان است و نشان دادند که روش‌‌های یادگیری ‌‌ماشین عملکرد پیش‌‌بینی بهتری نسبت به روش‌‌های سنتی مبتنی بر رگرسیون ارائه می‌‌دهد. شینیو و همکاران[4] (2020) به‌طور جامع امکان‌‌پذیری و مناسب‌بودن اتخاذ مدل‌‌های یادگیری ماشین را بر پیش‌‌بینی مبانی شرکت (سود) ارزیابی کردند و نشان دادند که در مقایسه با مدل‌های آماری سنتی قبلی مانند رگرسیون لجستیک روش آنها در دقت و سرعت پیش‌بینی به پیشرفت رضایت‌بخشی دست ‌یافته است. با توجه به مبانی نظری و پیشینۀ پژوهش، فرضیۀ سوم و چهارم پژوهش به شرح زیر بیان می‌‌شود:

فرضیۀ سوم: عملکرد مدل‌‌های یادگیری ماشین نسبت به مدل‌‌های آماری در پیش‌‌بینی سود خالص به‌طور معناداری بیشتر است.

فرضیۀ چهارم: عملکرد مدل‌‌های یادگیری ماشین نسبت به مدل‌‌های آماری در پیش‌‌بینی جریان نقد عملیاتی به‌طور معناداری بیشتر است.

 

روش پژوهش

در این پژوهش برای تجزیه‌وتحلیل و نتیجه‌‌گیری درخصوص فرضیه‌‌ها از بانک اطلاعاتی نرم‌افزار بورس‌‌ویو برای داده‌های مربوط به متغیرهای صورت جریان وجوه نقد، ره‌آورد نوین برای داده‌های صورت ‌وضعیت مالی و صورت سود و زیان و برای متغیر استهلاک و نواقص موجود از سایت کدال (سایت اطلاع‌رسانی ناشران اوراق بهادار) استفاده‌ شده است. از نرم‌افزارهای داده‌کاوی Weka، SPM، Rapidminer، SPSS Modeler، Eureqa برای مدل‌سازی و نرم‌‌افزارهای اقتصادسنجی و آماری  Stataبرای آزمون ونگ، EViwes برای آمار توصیفی، SPSS برای آزمون مقایسۀ میانگین‌ها و برای مرتب‌سازی و دسته‌بندی داده‌‌ها از Excel استفاده ‌شده است.

جامعۀ آماری، کلیۀ شرکت‌‌های پذیرفته‌شده در بورس اوراق بهادار تهران در بازۀ زمانی 1391 تا 1400 را شامل می‌‌شود که شرایط زیر را دارند: شرکت در گروه شرکت‌‌های سرمایه‌گذاری یا واسطه‌‌گری مالی نباشد؛ علت این امر، ماهیت متفاوت عملیات شرکت‌های مذکور است؛ اطلاعات مالی آن برای دورۀ مدنظر در اختیار باشد؛ زیرا شرکت‌هایی که داده‌های مالی گمشده یا ناقص دارد، باعث سوگیری یا نادرستی در یافته‌ها می‌شود؛ در طول دورۀ مدنظر پژوهش تغییر سال مالی نداشته باشد؛ زیرا به یکپارچگی و سازگاری پژوهش کمک می‌کند؛ در طول دورۀ مدنظر پژوهش در بورس حضور داشته باشد؛ زیرا شرکت‌هایی که در بورس نباشد، ممکن است شفافیت و الزامات گزارشگری مالی مانند شرکت‌های سهامی عام نداشته و دورۀ مالی شرکت‌‌ها منتهی به 29/12 هر سال باشد تا اثر چرخه‌های تجاری خنثی شود. پس از اعمال محدودیت‌های مذکور 184 شرکت بورس اوراق بهادار تهران بررسی شد.

از داده‌‌های 59 متغیر تعهدی و نقدی استفاده‌ شده است که تعریف عملیاتی متغیرها در جدول (1) بیان ‌شده است. همۀ متغیرها به‌جز نسبت‌‌ها بر دارایی ابتدای سال تقسیم‌ شده است. در ابتدا، توانایی تبیین هر دسته از متغیر‌‌های نقدی و تعهدی برای سود خالص و جریان نقد عملیاتی آتی از طریق تخمین رگرسیون خاص داده‌‌های تابلویی و آزمون ونگ بررسی ‌شده و سپس مدل برتر برای مدل‌سازی مورداستفاده قرار گرفته است. مدل‌های پیش‌‌بینی مورداستفاده در این پژوهش اگرچه فهرست جامعی نیست، 41 مدل انتخاب‌شده برای پژوهش حاضر نشان‌دهندۀ پرکاربردترین و مورد استنادترین مدل‌‌های طبقه‌‌بندی در ادبیات است. در یک ‌سمت طیف، مدل‌‌های خطی به نسبت ساده‌ای وجود دارد که در ادبیات شایع است؛ اما توانایی محدودی برای مدل‌سازی روابط غیرخطی و ناهمسانی در مجموعه داده‌ها دارد. در وسط طیف مدل‌‌هایی قرار گرفته که برای کنترل غیرخطی بودن و ناهمسانی مجهزتر است. انعطاف‌پذیری بیشتر این مدل‌ها اغلب به قیمت تفسیرپذیری کمتر ختم می‌شود. در سمت دیگر طیف، مدل‌های غیرخطی و کلی وجود دارد که به شیوه‌‌ای طراحی شده است که همۀ روابط و تعاملات غیرخطی را در مجموعۀ داده نمایش دهند (برای مروری بر کاربرد‌‌های مدرن و مطالعۀ بیشتر به هستی و همکاران (2009) مراجعه کنید). برای مدل‌سازی و اعتبارسنجی 70 درصد از داده‌‌ها به‌عنوان دادۀ آموزش و 30 درصد از داده‌‌ها به‌عنوان داده آزمایش در نظر گرفته ‌شده است.

 

جدول (1) تعاریف عملیاتی متغیرهای پژوهش

Table (1) Operational definitions of research variables

متغیر

تعریف عملیاتی

منبع

نسبت جاری x1

 

باروا و سها (2015)

نسبت سریعx2

 

باروا و سها  (2015)

گردش دارایی‌ها x3

 

باروا و سها  (2015)

نسبت بدهی به کل دارایی x4

 

باروا و سها  (2015)

نسبت پوشش هزینۀ ثابت x5

 

باروا و سها (2015)

بازدۀ فروش x6

 

باروا و سها  (2015)

بازدۀ حقوق صاحبان سهام x7

 

باروا و سها  (2015)

بازدۀ سرمایه به کار گرفته‌شده x8

 

باروا و سها  (2015)

سرمایه، سرمایه‌گذاری شده به ازای هر ریال تأمین مالی x9

 

باروا و سها  (2015)

حاشیۀ سود ناخالص x10

تغییرات حاشیۀ سود ناخالص - تغییرات فروش

سنگ و هنکاک (2012)

هزینه‌های عمومی اداری و فروش x11

تغییرات هزینۀ عمومی اداری و فروش – تغییرات فروش

سنگ و هنکاک (2012)

مالیات x12

هزینۀ مالیات که از صورت سود و زیان قابل‌استخراج است.

آرتور و همکاران (2010)

هزینۀ بهره x13

هزینۀ مالی که از صورت سود و زیان قابل‌استخراج است.

آرتور و همکاران (2010)

سایر درآمدها x14

سایر درآمدها که از صورت سود و زیان قابل‌استخراج است.

آرتور و همکاران (2010)

بهای تمام‎شده x15

بهای تمام‎شده که از صورت سود و زیان قابل‌استخراج است.

مولنگا و باتیا (2017)

فروش x16

فروش که از صورت سود و زیان قابل‌استخراج است.

مولنگا، باتیا (2017)

تغییرات بدهی x17

تغییرات کل بدهی‌ها (کوتاه‌مدت + بلندمدت)

حسینی مهر و نوری فرد (2014)

انتشار سهام x18

تغییرات در سود انباشته – تغییرات در حقوق صاحبان سهام

حسینی مهر و نوری فرد (2014)

خالص سرمایه در گردش x19

بدهی جاری – دارایی جاری

حسینی مهر و نوری فرد (2014)

سود خالص قبل از اقلام فوق‌العاده به‌اضافۀ استهلاک x20

استهلاک + سود خالص قبل از اقلام غیرمترقبه

الضمری و اسماعیل
(2014)

سود خالص به‌علاوه استهلاک x21

سود خالص + استهلاک

مولنگا، باتیا (2017)

اقلام تعهدی بلندمدت x22

تعهدات بلندمدت غیر بدهی - دارایی جاری - کل دارایی‌ها

لولن و رسوتک (2019)

سرمایه در گردش عملیاتی x23

بدهی جاری عملیاتی - دارایی جاری عملیاتی

مولنگا، باتیا (2017)

سود عملیاتی x24

سود قبل از بهره و مالیات

اوز و همکاران (2021)

استهلاک دارایی‌های مشهود x25

استهلاک دارایی‌های ثابت

اوز و همکاران (2021)

اقلام تعهدی کل x26

جریان نقد عملیاتی – سود خالص

اوز وهمکاران (2021)

تغییرات حساب‌های دریافتنی x27

تغییرات حساب‌های دریافتنی

اوز وهمکاران (2021)

تغییرات حساب‌های پرداختنی x28

تغییرات حساب‌های پرداختنی

اوز و همکاران (2021)

تغییرات موجودی کالا x29

تغییرات موجودی کالا

اوز و همکاران (2021)

سود تقسیمی پرداختنی x30

سود تقسیمی پرداختنی که از صورت ‌وضعیت مالی استخراج می‌شود

کوورسکی (2013)

گردش دارایی‌های ثابت x31

 

باروا و سها  (2015)

بازپرداخت وام x32

 

باروا و سها  (2015)

نسبت پوشش بدهی x33

 

باروا و سها  (2015)

نسبت پوشش بهره x34

 

باروا و سها  (2015)

سود خالص x35

سود خالص که از صورت سود و زیان قابل‌استخراج است.

اوز و همکاران (2021)

نسبت وجوه نقد به بدهی کوتاه‌مدت x36

 

باروا و سها  (2015)

نسبت پوشش نیازهای حیاتی شرکت x37

 

باروا و سها  (2015)

نسبت وجوه نقد به دارایی ثابت x38

 

باروا و سها (2015)

نسبت سرمایه‌گذاری مجدد x39

 

باروا و سها (2015)

نسبت وجه نقد به بدهی x40

 

باروا و سها (2015)

نسبت پوشش هزینۀ نقدی ثابت x41

 

باروا و سها (2015)

نسبت وجه نقد به فروش x42

 

باروا و سها  (2015)

نسبت وجه نقد به حقوق صاحبان سهام x43

 

باروا و سها (2015)

نسبت وجه نقد به سرمایۀ به کار گرفته‌شده x44

 

باروا و سها  (2015)

نسبت پرداخت سود تقسیمی x45

 

باروا و سها (2015)

سرمایۀ سرمایه‌گذاری‌شده به‌ازای هر ریال تأمین مالی x46

 

باروا و سها  (2015)

سود تقسیمی دریافتی x47

سود تقسیمی دریافت‌شده که از صورت جریان وجوه نقد قابل‌استخراج است.

آرتور و همکاران (2010)

بهره پرداختی نقدی x48

هزینۀ بهرۀ پرداختی که از طریق صورت جریان‌های نقدی قابل‌استخراج است.

آرتور و همکاران (2010)

بهرۀ دریافتی نقدی x49

بهرۀ دریافتی که از صورت جریان‌های نقدی قابل‌استخراج است.

آرتور و همکاران (2010)

مالیات پرداختی نقدی x50

مالیات بر درآمد پرداختی که از صورت جریان نقدی قابل‌استخراج است.

آرتور و همکاران (2010)

فروش نقدی x51

تغییرات در حساب‌های دریافتنی – فروش

چنگ و هالی (2008)

بهای تمام‌شدۀ نقدی x52

تغییرات حساب پرداختنی - تغییرات موجودی کالا - بهای تمام‌شدۀ کالای فروش‌رفته

چنگ و هالی (2008)

جریان نقد عملیاتی x53

جریان نقدی حاصل از عملیات که از صورت جریان‌های نقدی قابل‌استخراج است.

شوبیت (2021)

جریان نقد سرمایه‌گذاری x54

جریان نقدی حاصل از فعالیت‌های سرمایه‌گذاری که از صورت جریان‌های نقدی قابل دریافت است.

شوبیت (2021)

جریان نقد تأمین مالی x55

جریان نقدی حاصل از تأمین مالی که از صورت جریان‌های نقدی قابل‌استخراج است.

شوبیت (2021)

جریان نقد آزاد x56

خالص مخارج سرمایه‌ای – وجه نقد عملیاتی

شوبیت (2021)

نسبت پوشش بدهی نقدی x57

 

باروا و سها  (2015)

بازپرداخت وام نقدی x58

 

باروا و سها  (2015)

نسبت پوشش بهره نقدی x59

 

باروا و سها (2015)

 

رگرسیون نمادین یک مدل رگرسیون عملکردی است که الگوریتم ژنتیک را بهبود می‌‌بخشد. رگرسیون نمادین شبیه به یک دانشمند رباتیک به‌طور خودکار روابطی را براساس ویژگی‌های داخلی داده‌ها برقرار می‌کند. مدل، عملکردی با بیشترین برازش را برای نشان‌دادن این رابطه پیدا و پارامترها و ساختار هر مدل رگرسیونی را تعیین می‌کند. هستۀ رگرسیون نمادین براساس نظریۀ تکامل داروین است که عوامل مهم را انتخاب می‌کند تا به‌تدریج مدلی را شکل دهد و به‌طور خودکار عوامل غیر مهم را از مدل جدا کند. این نظریه براساس اصل برنامه‌ریزی ژنتیکی است. این رویکرد به پژوهشگران کمک می‌کند تا سهم هر عامل را در یک مدل تعیین کنند. به ‌عبارت ‌دیگر، وجود عوامل، بیانگر فراوانی و وقوع نشان‌دهندۀ اهمیت است (Liu & Zhang, 2022).

برای آزمون فرضیۀ پژوهش، مقایسۀ مدل‌‌های آماری و یادگیری ماشین از معیار [5]AUC استفاده‌ شده است. معیار AUC کل ناحیۀ دوبعدی زیر منحنی ROC را از (0,0) تا (1,1) اندازه‌گیری می‌کند. AUC معیاری کلی از عملکرد در تمام آستانه‌‌های طبقه‌‌بندی ممکن ارائه می‌‌دهد. AUC به‌عنوان معیاری تک عددی جایگزینی برای ارزیابی و مقایسۀ الگوریتم‌های یادگیری ماشین پیشنهاد شده و معیار بهتری نسبت به ‌دقت است. علاوه بر این، ازنظر آماری نیز سازگار است (Ling et al., 2003).

بنابراین مطابق با جونز و همکاران عملکرد پیش‌بینی‌کنندۀ همۀ طبقه‌بندی‌کننده‌ها با استفاده از ناحیۀ زیر منحنی (AUC) مقایسه و نتایج برای پیش‌‌بینی سود خالص و جریان نقد عملیاتی به‌صورت کلی، مقطعی و طولی اندازه‌‌گیری شده است (Jones et al., 2017).

 

یافته‌‌ها

ابتدا، برای متغیر‌‌های سود خالص و جریان نقد عملیاتی افزایش و کاهش نسبت به سال قبل به‌عنوان یک و صفر کدگذاری شده است؛ زیرا از الگوریتم‌های طبقه‌‌بندی یادگیری ماشین استفاده شده است؛ بنابراین متغیرهای وابسته از نوع باینری و متغیرهای مستقل کمی است؛ به همین دلیل دو جدول جداگانه برای آمار توصیفی در جدول‌‌های (2) و (3) ارائه‌ شده است.

 

جدول (2) تحلیل توصیفی متغیرهای پژوهش

Table (2) Descriptive analysis of variables

متغیر

میانگین

میانه

انحراف معیار

بیشینه

کمینه

چولگی

کشیدگی

آمارۀ جارک برا

احتمال آماره

x1

505/1

311/1

740/0

539/3

601/0

311/1

217/4

259/670

000/0

x2

967/0

846/0

557/0

481/2

285/0

228/1

067/4

716/492

000/0

x3

151/1

940/0

722/0

213/3

301/0

352/1

277/4

715/735

000/0

x4

561/0

563/0

190/0

886/0

211/0

130/0-

117/2

952/45

000/0

x5

676/0

341/0

851/0

148/3

099/0-

729/1

127/5

917/1322

000/0

x6

182/0

142/0

183/0

606/0

084/0-

744/0

784/2

568/134

000/0

x7

308/0

307/0

249/0

738/0

167/0-

026/0-

123/2

899/47

000/0

x8

331/0

310/0

253/0

825/0

118/0-

219/0

283/2

317/46

000/0

x9

050/0

017/0

093/0

321/0

056/0-

649/1

136/5

535/1066

000/0

x10

240/0

147/0

334/0

039/1

223/0-

908/0

070/3

155/670

000/0

x11

226/0-

137/0-

325/0

230/0

010/1-

910/0-

110/3

321/766

000/0

x12

027/0

017/0

030/0

102/0

000/0

094/1

168/3

561/554

000/0

x13

041/0

032/0

037/0

125/0

000/0

847/0

729/2

798/80

000/0

x14

029/0

012/0

042/0

154/0

015/0-

657/1

073/5

860/803

000/0

x15

939/0

703/0

681/0

773/2

235/0

351/1

988/3

861/1331

000/0

x16

258/1

037/1

759/0

206/3

379/0

138/1

524/3

774/106

000/0

x17

110/0

070/0

169/0

511/0

136/0-

847/0

030/3

237/39

000/0

x18

048/0

000/0

093/0

335/0

000/0

087/2

240/6

863/40

000/0

x19

212/0

195/0

296/0

813/0

316/0-

209/0

449/2

503/264

000/0

x20

266/0

216/0

217/0

781/0

033/0-

824/0

922/2

254/836

000/0

x21

241/0

183/0

225/0

805/0

050/0-

008/1

286/3

926/14

000/0

x22

435/0

374/0

308/0

229/1

062/0

018/1

440/3

908/141

000/0

x23

363/0

354/0

299/0

933/0

167/0-

125/0

277/2

172/363

000/0

x24

233/0

179/0

210/0

730/0

059/0-

823/0

898/2

198/183

000/0

x25

030/0

023/0

024/0

092/0

005/0

258/1

805/3

938/1109

000/0

x26

076/0

046/0

170/0

468/0

198/0-

631/0

893/2

355/710

000/0

x27

011/0-

004/0-

159/0

314/0

352/0-

129/0-

030/3

468/217

000/0

x28

008/0-

003/0-

131/0

250/0

306/0-

302/0-

271/3

999/2776

000/0

x29

001/0-

001/0

108/0

218/0

234/0-

164/0-

079/3

271/342

000/0

x30

367/0

100/0

512/0

556/1

000/0

415/1

590/3

781/263

000/0

x31

899/4

022/4

075/3

527/9

518/1

408/0

609/1

185/439

000/0

x32

036/0

014/0

099/0

195/0

087/0-

452/0

998/1

906/697

000/0

x33

537/4

487/3

152/3

006/9

259/1

399/0

493/1

977/464

000/0

x34

977/5

587/4

974/3

153/11

919/1

307/0

327/1

217/116

000/0

x35

207/0

147/0

217/0

745/0

080/0-

002/1

246/3

233/1273

000/0

x36

310/0

194/0

382/0

334/1

161/0-

340/1

152/4

223/24

000/0

x37

245/0

124/0

387/0

298/1

228/0-

386/1

299/4

226/203

000/0

x38

601/0

388/0

810/0

822/2

625/0-

231/1

301/4

998/331

000/0

x39

117/0

097/0

118/0

373/0

069/0-

515/0

571/2

249/293

000/0

x40

268/0

167/0

332/0

183/1

129/0-

425/1

435/4

714/33

000/0

x41

459/0

225/0

628/0

302/2

180/0-

703/1

182/5

857/206

000/0

x42

146/0

112/0

159/0

504/0

109/0-

620/0

750/2

144/561

000/0

x43

277/0

239/0

298/0

926/0

262/0-

339/0

655/2

769/114

000/0

x44

233/0

204/0

242/0

738/0

193/0-

316/0

510/2

974/214

000/0

x45

342/0

204/0

476/0

523/1

433/0-

921/0

394/3

421/949

000/0

x46

040/0

025/0

042/0

158/0

002/0

562/1

624/4

055/10

007/0

x47

050/0

018/0

066/0

230/0

000/0

532/1

229/4

661/81

000/0

x48

037/0

027/0

035/0

119/0

000/0

938/0

907/2

364/5

068/0

x49

009/0

003/0

014/0

053/0

000/0

025/2

162/6

245/29

000/0

x50

021/0

016/0

021/0

074/0

000/0

044/1

231/3

357/6

042/0

x51

996/0

845/0

731/0

796/2

000/0

841/0

189/3

585/460

000/0

x52

681/0

508/0

600/0

272/2

000/0

198/1

823/3

525/160

000/0

x53

157/0

122/0

175/0

581/0

111/0-

821/0

187/3

004/117

000/0

x54

056/0-

027/0-

100/0

090/0

336/0-

372/1-

660/4

659/153

000/0

x55

083/0-

071/0-

130/0

168/0

368/0-

303/0-

921/2

493/185

000/0

x56

093/0

070/0

157/0

454/0

174/0-

582/0

994/2

245/191

000/0

x57

619/4

711/3

428/3

750/9

810/0

397/0

611/1

688/177

000/0

x58

335/1

692/0

446/1

710/3

000/0

698/0

860/1

400/194

000/0

x59

094/5

376/3

181/4

078/11

936/0

457/0

499/1

737/327

000/0

 

یکی از کاربردهای مهم جدول، آمار توصیفی بیان نوع توزیع داده‌‌هاست. با توجه به این‌که احتمال آمارۀ آزمون جارک‌برا کمتر از
5 درصد است، به‌جز متغیر بهرۀ پرداختی نقدی، سایر متغیرهای این پژوهش دارای توزیع نرمال نیست. گفتنی است که برای خنثی‌کردن اثرات داده‌‌های پرت از تکنیک وینسورایزین (در سطح 5 و 95 درصد) استفاده شده است. انحراف معیار سود خالص و سود عملیاتی به‌ترتیب با مقدار 217/0 و 210/0 بیشتر از جریان نقدی ناشی از عملیات با مقدار 175/0 است که نشان‌دهندۀ آن است که سود نوسان‌های بیشتری نسبت به جریان نقدی حاصل از عملیات دارد. میانۀ جریان نقدی عملیاتی دارای مقدار 122/0 است که نشانۀ خوبی در نظر گرفته می‌شود و به این معناست که این شرکت‌های بورس تهران با فعالیت‌‌های اساسی عملیاتی خود پول نقد تولید می‌کنند. علامت منفی برای جریان نقدی حاصل از فعالیت‌های سرمایه‌گذاری با مقدار 027/0- به این معنی است که شرکت‌های موردمطالعۀ بورس تهران برای توسعۀ کار خود در خرید دارایی‌های ثابت سرمایه‌گذاری می‌کنند. درنهایت، جریان نقدی منفی ناشی از فعالیت‌های مالی با مقدار 071/0- به این معناست که شرکت‌ها سرمایۀ خود را کاهش می‌دهند یا گزینۀ محتمل‌تر، نشان‌دهندۀ پرداخت تعهدات این شرکت‌هاست.

 

جدول (3) تحلیل توصیفی متغیرهای وابستۀ پژوهش

Table (2) Descriptive analysis of dependent variables

نام متغیر

مقدار

تعداد

درصد

کاهش سود خالص

0

690

45

افزایش سود خالص

1

843

55

کاهش جریان نقد عملیاتی

0

748

49

افزایش جریان نقد عملیاتی

1

785

51

 

به‌منظور آزمون فرضیۀ اول و دوم، متغیرهای وابسته با هرکدام از دستۀ متغیرهای تعهدی و نقدی از طریق رگرسیون خاص داده‌‌های تابلویی برازش شده و سپس ضریب تعیین استخراج‌شده حاصل از برازش مدل‌‌ها از طریق آزمون ونگ مقایسه شده است. متغیرهای تعهدی پژوهش حاضر از  X35 - X1 و متغیرهای نقدی از X59 ‌‌‌‌X36 - است. معناداری آمارۀ ونگ (2082/9) برای پیش‌‌بینی سود خالص در سطح معناداری یک درصد نشان‌دهندۀ این موضوع است که بین توان تبیین دو مدل، اختلاف معناداری وجود دارد و مدل با متغیرهای تعهدی نسبت به مدل با متغیرهای صورت جریان‌‌های نقدی از توان بیشتری برای تبیین برخوردار است.
عدم معناداری آمارۀ ونگ در سطح معناداری پنج درصد برای پیش‌‌بینی جریان نقد عملیاتی نشان‌دهندۀ این موضوع است که اختلاف معناداری بین توان تبیین دو مدل وجود ندارد؛ اما هنوز هم ضریب متغیرهای تعهدی بیشتر از متغیر‌‌های نقدی است؛ درنتیجه برای پیش‌‌بینی سود و جریان نقد عملیاتی از طریق مدل‌‌های یادگیری ماشین و آماری از مجموعۀ متغیرهای تعهدی استفاده‌ شده است. نتایج حاصل از مقایسۀ ضریب تعیین مدل‌‌ها در جدول (4) ارائه ‌شده است.

 

جدول (4) نتایج ضریب تعیین حاصل از تخمین مدل‌ها و مقایسۀ مدل‌‌ها با آزمون ونگ

Table (4) Results of R-squared obtained from estimation of models and comparison of models with Vuong test

 

ضریب تعیین

ضریب تعیین تعدیل‌شده

آمارۀ آزمون ونگ

احتمال آماره

تخمین سود خالص با مجموعۀ متغیر‌‌های تعهدی

6088/0

5985/0

2082/9

0000/0

تخمین سود خالص با مجموعۀ متغیر‌‌های نقدی

4316/0

4224/0

تخمین جریان نقد عملیاتی با مجموعۀ متغیر‌‌های تعهدی

3211/0

3032/0

2484/1

2119/0

تخمین جریان نقد عملیاتی با مجموعۀ متغیر‌‌های نقدی

3022/0

2909/0

 

نمونۀ آزمایشی فقط برای ارزیابی عملکرد پیش‌بینی خارج از نمونه استفاده می‌شود؛ در حالی‌ که مجموعۀ آموزشی فقط برای تخمین مدل استفاده می‌شود؛ برای نمونه، در آزمون مقطعی، هیچ توجهی به ترتیب زمانی داده‌‌ها نمی‌‌‌‌شود. ممکن است داده‌‌های سال 1398 در نمونۀ تخمینی و داده‌‌های سال 1391 در نمونۀ آزمایشی وجود داشته باشد. جونز و همکاران[6] (2017) خاطرنشان می‌‌کنند، نمونه‌‌های آزمایشی که از همان دورۀ زمانی نمونۀ آموزشی برآورد گرفته ‌شده‌ است، هیچ اعتبار بین زمانی ارائه نمی‌‌دهد؛ از این ‌رو، قادر نیست، آزمون مناسبی از توانایی پیش‌‌بینی یک مدل ارائه دهد. به‌منظور مقایسۀ عملکرد طبقه‌بندی‌کننده‌ها در یک محیط پیش‌بینی واقعی‌تر، از نمونۀ آزمایشی طولی نیز استفاده‌ شده است؛ بنابراین مطابق با جونز و همکاران (2017) عملکرد پیش‌بینی‌کنندۀ همۀ طبقه‌بندی‌کننده‌ها با استفاده از ناحیۀ زیر منحنی (AUC) مقایسه می‌شود. نتایج برای پیش‌بینی سود خالص و جریان نقد عملیاتی به‌صورت کلی که میانگین تخمین حالت مقطعی و طولی است، در جدول (5) گزارش شده است.

 

جدول (5) نتایج عملکرد مدل‌های آماری و یادگیری ماشین

Table (5) Performance results of statistical models and machine learning

مدل

پیش‌بینی سود، عملکرد کلی

پیش‌بینی جریان نقد، عملکرد کلی

AUC

رتبه

AUC

رتبه

بیز ساده [7]

646/0

28

667/0

16

پروبیت [8]

803/0

5

790/0

6

رگرسیون لجستیک [9]

799/0

6

790/0

4

حاشیه بزرگ سریع [10]

806/0

4

790/0

5

یادگیری عمیق [11]

788/0

11

800/0

2

درخت تصمیم [12]

609/0

35

599/0

24

جنگل تصادفی [13]

790/0

9

717/0

14

تقویت گرادیان [14]

798/0

7

785/0

8

ماشین‌بردار پشتیبان [15]

776/0

13

789/0

7

ماشین بردار پشتیبان کتابخانه‌‌ای [16]

645/0

29

527/0

38

ماشین‌بردار پشتیبان خطی [17]

818/0

2

784/0

9

ماشین‌بردار پشتیبان تکاملی [18]

620/0

33

533/0

36

ماشین‌بردار پشتیبان ازدحام ذرات [19]

606/0

36

544/0

35

آنالیز تشخیص خطی [20]

762/0

15

709/0

15

آنالیز تشخیص درجه دوم [21]

352/0

41

504/0

40

آنالیز تشخیص منظم [22]

354/0

40

514/0

39

شبکۀ عصبی [23]

769/0

14

726/0

13

پروسپترون چندلایه [24]

790/0

10

763/0

10

پرسپترون [25]

779/0

12

739/0

11

درخت چاید [26]

701/0

19

644/0

18

درخت کوئست [27]

686/0

21

636/0

19

لیست تصمیم [28]

641/0

30

613/0

21

شبکه بیزین [29]

681/0

24

564/0

31

درخت سی 5[30]

610/0

34

581/0

27

کا نزدیک‌‌ترین همسایه [31]

637/0

31

560/0

32

درخت کارت [32]

604/0

37

579/0

29

رگرسیون نمادین [33]

831/0

1

811/0

1

آی بی کا [34]

599/0

38

528/0

37

کا استار [35]

632/0

32

546/0

34

یادگیری با وزن محلی [36]

712/0

18

613/0

22

آدابوست [37]

714/0

17

603/0

23

جدول تصمیم [38]

684/0

22

573/0

30

هرس افزایشی مکرر [39]

666/0

25

580/0

28

پارت [40]

700/0

20

616/0

20

استامپ تصمیم [41]

665/0

26

554/0

33

درختان مدل لجستیک [42]

756/0

16

653/0

17

درخت هوفدینگ [43]

682/0

23

585/0

25

سی 4.5 [44]

648/0

27

583/0

26

ایکس جی بوست [45]

795/0

8

733/0

12

مارس [46]

813/0

3

791/0

3

کاکس [47]

429/0

39

499/0

41

 

نتایج حاصل از عملکرد مدل‌های آماری و یادگیری ماشین نشان‌دهندۀ آن بود که طبقه‌بندی‌کنندۀ‌ رگرسیون نمادین با استفاده از الگوریتم ژنتیک برای پیش‌بینی سود خالص، در عملکرد کلی با 831/0 AUC= و در نمونۀ آزمایشی طولی بهترین عملکرد را داشته است. این میزان از AUC نشان‌دهندۀ عملکرد طبقه‌بندی خوب و مفید است. در رتبه‌بندی عملکرد کلی پس از رگرسیون نمادین، به‌ترتیب ماشین بردار پشتیبان خطی با 818/0 AUC = در رتبۀ دوم قرار می‌گیرد که عملکرد خوب و مفیدی ارائه می‌‌دهد؛ رگرسیون کمانک تطبیقی چند متغیره (مارس) با 813/0  AUC= در رتبۀ سوم قرار می‌‌گیرد؛ طبقه‌‌بندی‌کنندۀ حاشیۀ بزرگ سریع نیز با 806/0 AUC=در رتبۀ چهارم قرار می‌گیرد؛ مدل آماری پروبیت و رگرسیون لجستیک نیز به‌ترتیب با 803/0 AUC= و 799/0 AUC= در رتبه‌های پنجم و ششم قرار می‌‌گیرند که عملکرد بسیار نزدیک به یکدیگر دارند. سایر طبقه‌بندی‌کننده‌ها در رتبه‌های بعدی قرار می‌گیرند که AUC کمتر از 8/0 دارند و نشان از عملکرد ضعیف و یا تصادفی است؛ در حالی‌ که برخی فن‌های یادگیری ماشین عملکرد برتری ارائه می‌‌دهد، روش‌های سادۀ آماری نیز عملکرد قابل‌قبول و بهتری را از برخی فن‌های معروف یادگیری ماشین ارائه می‌‌دهد. طبقه‌بندی‌کنندۀ رگرسیون نمادین با استفاده از الگوریتم ژنتیک برای پیش‌بینی جریان نقد عملیاتی، در عملکرد کلی با
811/0  AUC= و در نمونۀ‌ آزمایشی طولی، بهترین عملکرد را داشته است. این میزان از AUC نشان‌دهندۀ عملکرد طبقه‌بندی خوب و مفید است. در رتبه‌بندی عملکرد کلی پس از رگرسیون نمادین به‌ترتیب طبقه‌بندی‌کنندۀ یادگیری عمیق با 800/0AUC=  در رتبۀ دوم قرار می‌گیرد که عملکرد خوب و مفید ارائه می‌‌دهد. رگرسیون مارس با 791/0 AUC= در رتبۀ سوم قرار می‌گیرد که عملکرد به نسبت ضعیفی را ارائه می‌‌دهد؛ اما از یک طبقه‌بندی تصادفی بهتر عمل می‌‌کند. سایر طبقه‌‌بندی‌کننده‌ها در رتبه‌های بعدی قرار می‌گیرند که نشان از عملکرد ضعیف یا تصادفی است.

درنهایت، مقایسه‌‌ای کلی میان مدل‌‌های یادگیری ماشین و آماری انجام ‌شده است که در جدول (6) نتایج آن گزارش شده است. نتایج جدول (6) نشان‌دهندۀ آن است که با توجه به این‌که احتمال آمارۀ آزمون یک‌سویه کمتر از پنج درصد است، دقت عملکرد مدل‌‌های یادگیری ماشین از مدل‌‌های آماری به‌طور معناداری بیشتری است.

 

جدول (6) نتایج مقایسۀ میانگین مدل‌‌های آماری و یادگیری ماشین

Table (6) Results of comparing the average of statistical models and machine learning

 

آمارۀ Z

احتمال آمارۀ آزمون یک‌سویه

احتمال آمارۀ آزمون دوسویه

مقایسۀ عملکرد مدل‌ برای پیش‌‌بینی جریان نقد عملیاتی

445/2

007/0

014/0

مقایسۀ عملکرد مدل‌ها برای پیش‌‌بینی سود خالص

345/4

000/0

000/0

 

نتایج جدول (6) نشان‌دهندۀ آن است که با توجه به این‌که احتمال آمارۀ آزمون یک‌سویه کمتر از پنج درصد است، دقت عملکرد مدل‌های یادگیری ماشین از مدل‌های آماری به‌طور معناداری بیشتری است.

 

نتایج و پیشنهاد‌‌ها

توانایی بنگاه اقتصادی در تولید سود و جریان نقد آتی جزء مهمی از فرآیند ‌و برنامه‌‌ریزی سرمایه‌‌گذاران، اعتباردهندگان و سایر ذی‌‌نفعان است. از گذشتۀ دور تاکنون موضوع پیش‌‌بینی سود و جریان نقد آتی از موضوعات داغ موردبررسی پژوهشگران و فعالان حوزۀ مالی بوده است. این امر به این دلیل است که از شاخص‌‌های عملکردی سود و جریان نقد عملیاتی می‌‌توان در حوزه‌‌های مختلف ازجمله مدل‌‌های ارزش‌‌گذاری بنگاه اقتصادی، بررسی توانایی پرداخت تعهدات، بررسی میزان ریسک بنگاه، تجزیه‌وتحلیل عملکرد شرکت و تصمیمات مدیریت برای بهبود کارایی شرکت استفاده کرد. در این صورت اگر بتوان با دقت قابل‌قبولی سود و جریان نقد عملیاتی آتی را پیش‌‌بینی کرد، بخش قابل‌توجهی از نیاز به محتوای اطلاعاتی در سرمایه‌گذاران، اعتباردهندگان و سایر ذی‌‌نفعان پاسخ داده می‌شود.

در راستای آزمون فرضیۀ اول و دوم پژوهش مبنی بر این‌که توانایی توضیح‌دهندگی متغیرهای تعهدی برای سود خالص و جریان نقد عملیاتی آتی بیشتر از متغیرهای نقدی است، پس از تخمین مدل با رویکرد مناسب داده‌‌های تابلویی، ضریب تعیین مدل‌‌ها با یکدیگر مقایسه شده است. نتایج بررسی‌‌ها نشان‌دهندۀ آن بود که برای سود خالص متغیرهای تعهدی توانایی توضیح‌دهندگی بیشتری دارد؛ بنابراین دلیلی بر رد فرضیۀ اول پژوهش وجود ندارد؛ اما دربارۀ جریان نقد عملیاتی اگرچه مقدار تبیین متغیرهای تعهدی بیشتر از متغیرهای نقدی است، ازنظر آماری تفاوت معناداری بین تبیین متغیرهای تعهدی و نقدی وجود ندارد؛ بنابراین فرضیۀ دوم پژوهش رد شد. این نتایج با یافته‌های بال و نیکولایف و بیانیۀ شمارۀ یک مفاهیم حسابداری مبنی بر بهتربودن سیستم تعهدی از سیستم نقدی به‌عنوان معیاری برای سنجش عملکرد شرکت در یک راستاست (Ball & Nikolaev, 2020). در تشریح این موضوع می‌توان گفت که حسابداری تعهدی سعی می‌‌کند، آثار مالی رویدادها را در زمان تحقق رویداد ثبت کند، نه‌تنها در زمانی که وجه نقد دریافت شود؛ بنابراین گفته می‌شود، حسابداری تعهدی مشکلات زمان‌بندی و تطابق موجود در جریان‌‌های نقدی را ندارد؛ اما در هر حال اقلام تعهدی به احتمال حاوی خطای اندازه‌گیری است.

در راستای آزمون فرضیۀ سوم و چهارم پژوهش حاضر مبنی بر این‌که مدل‌‌های یادگیری ‌‌ماشین نسبت به مدل‌‌های آماری عملکرد برتری را در پیش‌بینی سود خالص و جریان نقد عملیاتی ارائه می‌‌دهد، معیار AUC با اجرای مدل‌‌های آماری و یادگیری ماشین استخراج ‌شده و سپس درصد موفقیت مدل‌‌های آماری و یادگیری ماشین توسط آزمون مقایسۀ نسبت‌ها مقایسه شد. بررسی نتایج نشان‌دهندۀ آن بود که مدل‌‌های یادگیری‌‌ ماشین به‌طور معناداری از مدل‌‌های آماری در پیش‌بینی سود خالص و جریان نقد عملیاتی عملکرد برتری دارد؛ بنابراین دلیلی بر رد فرضیۀ سوم و چهارم پژوهش وجود ندارد. نتایج پژوهش با یافته‌‌های اوز و همکاران (2020)، چن و همکاران[48] (2022)، آشتاب و همکاران (2017)، حجازی (2012) مطابقت دارد. بهترین عملکرد بین مدل‌‌های یادگیری ماشین مربوط به رگرسیون نمادین با استفاده از الگوریتم ژنتیک و بهترین عملکرد بین مدل‌‌های آماری مربوط به مدل پروبیت است.

پیش‌بینی دقیق سود خالص و جریان‌های نقد عملیاتی برای ارزیابی ریسک، مدیریت ریسک مالی و برنامه‌ریزی مالی استراتژیک بسیار مهم است. درک نقاط قوت و محدودیت‌های این مدل‌ها به مدیران در تصمیم‌گیری آگاهانه و کاهش خطرات کمک می‌کند. بنا بر نتایج پژوهش حاضر پیشنهاد می‌‌شود، مدیران نهاد‌‌های مالی به مدل‌‌های یادگیری ماشین و به‌طور خاص مدل رگرسیون نمادین توجه داشته باشند.

در ادامه، برای انجام پژوهش‌‌های هم‌راستا با موضوع این پژوهش و توسعۀ آن پیشنهاد‌‌هایی به پژوهشگران آتی ارائه می‌‌شود. در پژوهش حاضر، از متغیرهای مالی و حسابداری استفاده شده است. به پژوهشگران توصیه می‌‌شود، پیش‌‌بینی سود را با نقش متغیرهای کلان اقتصادی در عملکرد شرکت بررسی کنند. پژوهش‌‌های آینده پتانسیل ترکیب مدل‌های آماری و یادگیری ماشین را برای استفاده از نقاط قوت و کاهش محدودیت‌های آن‌ها بررسی می‌کند. رویکردهای ترکیبی روشی جدید برای بهبود نتایج پیش‌‌بینی است.

عملکرد مدل‌های آماری و یادگیری ماشین در پیش‌بینی سود خالص و جریان‌های نقد عملیاتی ممکن است در صنایع، بخش‌ها یا شرایط اقتصادی مختلف متفاوت باشد. اذعان به این نکته مهم است که یافته‌های این مطالعه ممکن است به‌طورکلی قابل‌اجرا نباشد و ممکن است نیاز به سفارشی‌سازی یا اعتبارسنجی در زمینه‌ها یا صنایع خاص داشته باشد. مدل‌‌های یادگیری ماشین به علت فرآیند آموزش و آزمایش به تعداد داده‌‌های در دسترس متکی هستند؛ بنابراین محدودیت پژوهش حاضر در کمبود داده‌هاست.

 

[1]. Nallareddy

[2]. Ball & Nikolaev

[3]. Anand et al

[4]. Xinyue et al

[5]. Area under the ROC Curve

[6]. Jones et al

[7]. Naive Bayes

[8]. probit

[9]. Logistic Regression

[10]. Fast Large Margin

[11]. Deep Learning

[12]. Decision Tree

[13]. Random Forest

[14]. Gradient Boosted Trees

[15]. Support Vector Machine

[16]. Library support vector machine

[17]. Linear SVM

[18]. Evolutionary SVM

[19]. PSO SVM

[20]. Linear discriminant analysis

[21]. Quadratic discriminant analysis

[22]. regularized discriminant analysis

[23]. neural network

[24]. A multilayer perceptron

[25]. perceptron

[26]. chaid

[27]. quest

[28]. decision list

[29]. bayesian network

[30]. C.

[31]. KNN Algorithm

[32]. CART tree

[33]. Symbolic Regression

[34]. IBK

[35]. Kstar

[36]. Locally weighted learning

[37]. AdaBoost

[38]. DecisionTable

[39]. Repeated Incremental Pruning

[40]. PART

[41]. Decision Stump

[42]. logistic model trees

[43]. HoeffdingTree

[44]. C.4.5

[45]. Xgboost

[46]. MARS

[47]. COX

[48]. Chen et al

Ahn, S. C., Horenstein, A. R., & Ma, Y. (2020). Efficient principal component regression estimation with heteroscedastic errors and general singular covariance matrix. Journal of Econometrics, 214(1), 30-52. https://doi.org/10.1016/j.jeconom.2019.12.007
Al-Dhamari, R. A., & Ismail, K. N. I. K. (2014). An investigation into the effect of surplus free cash flow, corporate governance and firm size on earnings predictability. International Journal of Accounting and Information Management, 22(2), 118-133.‏ https://doi.org/10.1108/IJAIM-05-2013-0037
Anand, V., Brunner, R., Ikegwu, K., & Sougiannis, T. (2019). Predicting profitability using machine learning. Available at SSRN 3466478. https://dx.doi.org/10.2139/ssrn.3466478
Arthur, N., Cheng, M., & Czernkowski, R. (2010). Cash flow disaggregation and the prediction of future earnings. Accounting & Finance, 50(1), 1-30.‏ https://doi.org/10.1111/j.1467-629X.2009.00316.x
Ashtab, A., Haghighat, H., & kordestani, G. (2017). Comparison of financial distress prediction models accuracy and its effect on earnings management tools. Accounting and Auditing Review, 24(2), 147-172. https://doi.org/10.22059/acctgrev.2017.231176.1007585 [In Persian].
Ball, R., & Nikolaev, V. V. (2020). FASB was right: Earnings beat cash flows when predicting future cash flows. Chicago Booth Research Paper, 20-23.‏ https://dx.doi.org/10.2139/ssrn.3689802
Barboza, F., Kimura, H., & Altman, E. (2017). Machine learning models and bankruptcy prediction. Expert Systems with Applications, 83, 405-417.‏‏ https://doi.org/10.1016/j.eswa.2017.04.006
Barua, S., & Saha, A. K. (2015). Traditional ratios vs. cash flow-based ratios: Which one is better performance indicator. Advances in Economics and Business, 3(6), 232-251.
Bengio, Y., Courville, A., & Vincent, P. (2021). Representation learning: A review and new perspectives. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(8), 1798-1828. https://doi.org/10.1109/TPAMI.2013.50
Bishop, C. M., & Nasrabadi, N. M. (2006). Pattern recognition and machine learning 4, (4), 738). springer.‏
Bradshaw, M. T., Drake, M. S., Myers, J. N., & Myers, L. A. (2012). A re-examination of analysts’ superiority over time-series forecasts of annual earnings. Review of Accounting Studies, 17(4), 944-968.‏ https://doi.org/10.1007/s11142-012-9185-8
Breiman, L. (1996). Bagging predictors. Machine Learning, 24(2), 123-140. https://doi.org/10.1007/BF00058655
Caruana, R., Lou, Y., Gehrke, J., Koch, P., Sturm, M., & Elhadad, N. (2015). Intelligible models for healthcare: Predicting pneumonia risk and hospital 30-day readmission. In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (1721-1730). https://doi.org/10.1145/2783258.2788613
Chatfield, C. (2020). The Analysis of Time Series: An Introduction. CRC Press.
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (785-794). https://doi.org/10.1145/ 2939672.2939785
Chen, X., Cho, Y. H., Dou, Y., & Lev, B. (2022). Predicting future earnings changes using machine learning and detailed financial data. Journal of Accounting Research, 60(2), 467-515.‏ https://doi.org/10.1111/1475-679X.12429
Cheng, C. S., & Hollie, D. (2008). Do core and non-core cash flows from operations persist differentially in predicting future cash flows?. Review of Quantitative Finance and Accounting, 31(1), 29-53. https://doi.org/10.1007/s11156-007-0062-7‏.
Christensen, T. E., Huffman, A., Lewis‐Western, M. F., & Scott, R. (2022). Accruals earnings management proxies: Prudent business decisions or earnings manipulation?  Journal of Business Finance & Accounting, 49(3-4), 536-587.‏ https://doi.org/10.1111/jbfa.12585
Curtis, A., Li, V., & Patrick, P. H. (2021). The use of adjusted earnings in performance evaluation. Review of Accounting Studies, 26(4), 1290-1322. https://doi.org/10.1007/s11142-021-09580-1
Dastile, X., Celik, T., & Potsane, M. (2020). Statistical and machine learning models in credit scoring: A systematic literature survey. Applied Soft Computing, 91, 106263.‏ https://doi.org/10.1016/j.asoc.2020.106263
FASB (1978). Statement of financial accounting concepts no. 1, objectives of financial reporting by business enterprises. Norwalk, CT: Financial Accounting Standards Board.
Francis, J., LaFond, R., Olsson, P., & Schipper, K. (2005). The market pricing of accruals quality. Journal of Accounting and Economics, 39(2), 295-327.‏ https://doi.org/10.1016/j.jacceco.2004.06.003
Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and Other Atories. Cambridge University Press.
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
Habibzade, M., & Ezadpour, M. (2020). Using neural network approach to predict company’s profitability and comparison with decision tree c5 and Support Vector Machine (SVM). Financial Knowledge of Securities Analysis, 13(46), 39-56. [In Persian].
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning: Data mining, inference, and prediction. Springer.
Hejazi, R., Mohamadi, S., aslani, Z., & Aghajani, M. (2012). Earnings management prediction using neural networks and decision tree in TSE. Accounting and Auditing Review, 19(2), 31-46. [In Persian]. https://www.doi.org/10.22059/acctgrev.2012.29198
Hosseinimehr, S. G., & Nourifard, Y. (2014). The persistence of accruals and investment in operating and investment cycle. Accounting and Finance Research, 3(2), 92-111.‏
Huang, G. B., Zhou, H., Ding, X., & Zhang, R. (2017). Extreme learning machines: A survey. International Journal of Machine Learning and Cybernetics, 8(2), 513-531. https://doi.org/10.1007/s13042-016-0559-2
Jones, S., Johnstone, D., & Wilson, R. (2017). Predicting corporate bankruptcy: An evaluation of alternative statistical frameworks. Journal of Business Finance & Accounting, 44(1-2), 3-34.‏ https://doi.org/10.1111/jbfa.12218
Khodamipour, A., Pourahmad, R. & Turkzadeh M. A. (2013). The influence of financial variables’ time lags in predicting operating profit and operating cash flows. Management Accounting, 6(3), 45-56. [In Persian].
Kowerski, M. (2013). Dividends and earnings quality in Poland. E-Finance: Financial Internet Quarterly, 9(3), 42-51.‏
Lewellen, J., & Resutek, R. J. (2019). Why do accruals predict earnings?. Journal of Accounting and Economics,
67(2-3), 336-356.‏ https://doi.org/10.1016/j.jacceco.2018.12.003
Li, F. (2010). The information content of forward-looking statements in corporate filingsa na¨ıve bayesian machine learning approach, Journal of Accounting Research 48(5): 1049– 1102. https://doi.org/10.1111/j.1475-679X.2010.00382.x
Ling, C. X., Huang, J., & Zhang, H. (2003). AUC: A statistically consistent and more discriminating measure than accuracy. In Ijca, 3, 519-524.
Liu, H., & Zhang, Z. (2022). Probing the carbon emissions in 30 regions of China based on symbolic regression and Tapio decoupling. Environmental Science and Pollution Research, 29(2), 2650-2663. https://doi.org/10.1007/s11356-021-15648-x
Martins, A. I. (2022). Earnings prediction using machine learning methods and analyst comparison. [Un Published Doctoral dissertation].‏ Universidade Católica Portuguesa.
MehrabanPour, M. R., & Habibzadeh, M. (2017). Clustering and forecasting the profitability of companies listed in the Tehran Stock Exchange with the C5 decision tree approach. Empirical Studies of Financial Accounting. 15(59),
135-157. [In Persian].
Mills, T. C. (2019). The Econometric Modelling of Financial Time Series. Cambridge University Press.
Monahan, S. J. (2018). Financial statement analysis and earnings forecasting. Foundations and Trends in Accounting, 12(2), 105-215.‏
Montgomery, D. C., Jennings, C. L., & Kulahci, M. (2019). Introduction to Time Series Analysis and Forecasting. John Wiley & Sons.
Mulenga, M., & Bhatia, M. (2017). The review of literature on the role of earnings, cash flows and accruals in predicting of future cash flows. Accounting and Finance Research, 6(2), 59-70.‏
Mullainathan, S., & Spiess, J. (2017). Machine learning: An applied econometric approach. Journal of Economic Perspectives, 31(2), 87-106.‏
Murdoch, W. J., Singh, C., Kumbier, K., Abbasi Asl, R., & Yu, B. (2019). Interpretable machine learning: Definitions, methods, and applications. Proceedings of the National Academy of Sciences, 116(44), 22071-22080. https://doi.org/10.1073/pnas.1900654116
Nallareddy, S., Sethuraman, M., & Venkatachalam, M. (2020). Changes in accrual properties and operating environment: Implications for cash flow predictability. Journal of Accounting and Economics, 69(2-3), 101313. https://doi.org/10.1016/j.jacceco.2020.101313
Nguyen, H., & Nguyen, T. (2020). The prediction of future operating cash flows using accrual-based and cash-based accounting information: Empirical evidence from Vietnam. Management Science Letters, 10(3), 683-694.‏ http://dx.doi.org/10.5267/j.msl.2019.9.010 ‏
Oz, I. O., Yelkenci, T., & Meral, G. (2021). The role of earnings components and machine learning on the revelation of deteriorating firm performance. International Review of Financial Analysis, 77, 101797.‏ https://doi.org/10.1016/j.irfa.2021.101797
Parlina, N. D., & Budianto, E. (2021). Implementation of cash flow as a measuring tool in predicting future net income:(Case study at Kedai Nyobian 8 daily period September–October 2020). Journal of Management, Accounting, General Finance and International Economic Issues, 1(1), 16-24.‏ https://doi.org/10.55047/marginal.v1i1.6
Petropoulos, A., Siakoulis, V., Stavroulakis, E., & Vlachogiannakis, N. E. (2020). Predicting bank insolvencies using machine learning techniques. International Journal of Forecasting, 36(3), 1092-1113.‏ https://doi.org/10.1016/j.ijforecast.2019.11.005
Rajabzadeh, H., Gorganli davaji, J., Naderian, A., & Ashrafi, M. (2022). Forecast the operating cash flow of accepted companies In Tehran Stock Exchange using machine learning method. Management Accounting, 15(52), 59-78.
https://www/doi.org/10.30495/jma.2022.20205 [In Persian].
Raschka, S., & Mirjalili, V. (2020). Python Machine Learning: Machine Learning and Deep Learning with Python, Scikit-Learn, and TensorFlow 2. Packt Publishing.
Rudin, C. (2019). Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence, 1(5), 206-215. https://doi.org/10.1038/s42256-019-0048-x
Seng, D., & Hancock, J. R. (2012). Fundamental analysis and the prediction of earnings. International Journal of Business and Management, 7(3), 32.‏
Sharawi, H. (2021). Earnings versus cash flows in predicting future cash flows: Evidence from Egypt and KSA. Alexandria Journal of Accounting Research, 1(1), 18-34.‏
Shubita, M. F. (2021). The ability of cash flows to predict the earning: Evidence from Jordan. Investment Management & Financial Innovations, 18(4), 36.‏
Sloan, R. G. (1996). Do stock prices fully reflect information in accruals and cash flows about future earnings?, The Accounting Review, 289–315.
Xinyue, C., Zhaoyu, X., & Yue, Z. (2020). Using Machine Learning to Forecast Future Earnings. Atlantic Economic Journal, 48(4), 543-545.‏ https://doi.org/10.1007/s11293-020-09691-1
Zhang, X. F. (2007). Accruals, investment, and the accrual anomaly. The Accounting Review, 82(5), 1333-1363.‏ https://doi.org/10.2308/accr.2007.82.5.1333