A Novel Approach to Predicting Financial Distress by Using Financial Network-Based Information and the Integrated Method of Gradient Boosting Decision Tree

Document Type : Research Paper

Authors

1 Associate Professor, Department of Financial Engineering, Faculty of Accounting and Financial Sciences, University of Tehran, Tehran, Iran

2 Ph.D. Candidate, Department of Financial Management and Insurance, Alborz Campus, Faculty of Management, University of Tehran, Tehran, Iran

3 Associate Professor, Department of Financial Management, Faculty of Management, University of Tehran, Tehran, Iran

4 Assistant Professor, Department of Financial Management, Faculty of Management, University of Tehran, Tehran, Iran

Abstract

This study aimed to evaluate the performance of the gradient boosting decision tree model, the parameters of which were optimized with the improved Gray Wolf Algorithm (GWO) by adding financial network-related variables via the selected models of predicting financial distress. The proposed model of this study was implemented on the data of 123 manufacturing companies admitted to the Tehran Stock Exchange and Iran Fara Bourse Co. (IFB) from 2014 to 2021. Initially, the financial network was formed and then, the financial distress of companies was predicted by integrating the network-based variables with financial ratios and using a gradient boosting decision tree model. The model of the gradient boosting decision tree had better performance in terms of precision and Type I error by adding Financial Network Indicators (FNI) compared to the two models of K-Nearest Neighbor (KNN) and Logistic Regression (LR). Companies with betweenness centrality and high degree centrality were found to be less prone to financial distress and vice versa. This is the first study to predict financial distress by using financial network-related variables integrated with financial ratio variables through the novel gradient boosting decision tree method, the parameters of which were optimized with the improved GWO.
Keywords: Financial Distress, Financial Network, Gradient Boosting Decision Tree, Improved Gray Wolf Algorithm (GWO), Centrality Criteria.
 
Introduction
Previous studies on predicting financial distress have mainly adopted financial variables in financial statements as explanatory variables, while ignoring some other potentially useful information, such as financial network-related information. Disregarding such information for predicting financial distress is one of the significant gaps in the literature. Therefore, the present study aimed to evaluate the performance of the gradient boosting decision tree model, the parameters of which were optimized with the improved Gray Wolf Algorithm (GWO), along with the financial network-related variables, which showed another gap in the literature, and then compare its findings with the two recently widely used models of K-Nearest Neighbor (KNN) and Logistic Regression (LR). The following questions were posed in the present study.

Can the integrated IGWO-GBDT model provide a better prediction of financial distress compared to the widely selected models of LR and KNN?
Does the inclusion of financial network variables improve the performance of the integrated IGWO-GBDT model for predicting financial distress?
Does the inclusion of financial network variables improve the performance of the widely used models of LR and KNN for predicting financial distress?

 
Materials & Methods
The sample of this study included all the manufacturing companies listed in the Tehran Stock Exchange and Iran Fara Bourse Co. (IFB) from 2014 to 2021, of which 123 companies were selected. The information of the last 30 trading days in each fiscal year was used to form the financial network variables. Finally, 8 financial variables were selected based on those adopted by Ebrahimi Sarvolia et al. (2018), including current ratio, net ratio of working capital to total asset, ratio of current asset to total asset, profit margin, return on assets, return on equity, book to market ratio, and size of company. Furthermore, the total debt ratio, a widely used variable in previous studies, was added to the financial variables. Regarding the financial network variables, the 4 variables of degree centrality, betweenness centrality, eigenvector centrality, and closeness centrality were selected similar to those selected by Montasheri and Sadeqi (2020) and Liu et al. (2019). More than one criterion was applied to measure financial distress in this study. Any companies that met at least one of the four mentioned criteria were considered distressed in that year. These criteria were subject to Article 141 of the Commercial Law, suffering losses for 3 consecutive years (Damoori & Hozhabrie, 2019), subject to Article 412 of the Commercial Law, referring to a debt ratio higher than 1 (Poorheidari & Koopaei, 2011), and had negative equity.
 
Findings
The findings indicated that the mean degree of centrality for companies with financial health was 0.203, while it was 0.193 for the distressed companies. Betweenness centrality was 0.007 for the distressed and non-distressed companies. Regarding eigenvector centrality, the means of healthy companies and those with financial distress were 0.083 and 0.104, respectively. Also, the values of closeness centrality were 0.525 and 0.496 for the mentioned companies, respectively. Table 5 shows that all the 3 models have performed quite well in terms of prediction of the class of healthy companies, while the error was below 10%. Still, the distinguished performances of these models were revealed when they could accurately and appropriately predict the class of financially distressed companies, which included only 12% of observations. The type I errors in the LR and KNN models were respectively 20 and 40%, bearing huge costs. In other words, these two models mistakenly predicted distressed companies as healthy ones in 20 and 40% of cases. However, the type I error of the proposed research model was only 5%, indicating high accuracy of the model.
 
Table 5. Comparison of the performances of the 3 studied models with and without financial network variables




FN-GBDT


GBDT


FN-KNN


KNN


FN-LR


LR


 




0.982


0.96


0.895


0.906


0.907


0.901


Accuracy




0.05


0.11


0.40


0.31


0.20


0.24


Error 1




0.013


0.033


0.065


0.011


0.078


0.086


Error 2




0.933


0.989


0.907


0.916


0.959


0.932


AUC




0.968


0.927


0.748


0.826


0.858


0.833


G-mean




 
Discussion and Conclusion
(1) Financial network variables can be employed to explore useful information in the financial network and improve the prediction performances of classifiers.
(2) According to the definition of centrality, companies with high centrality, especially betweenness centrality and degree centrality, are less prone to financial distress and vice versa.
(3) The improved GWO is a practical method for selecting the parameters of the gradient boosting model.
(4) The gradient boosting decision tree model is highly efficient when the frequency ratio of the samples of each class is significantly different from those of other classes. The experimental findings revealed that the proposed model outperformed the other two models in predicting financial distress. This was confirmed by the adopted evaluation criteria.

Keywords

Main Subjects


مقدمه

پیش‌بینی درماندگی مالی که به‌عنوان «پیش‍بینی ورشکستگی و پیش‌بینی شکست کسب و کار» نیز شناخته می‌شود، جایگاه حیاتی برای تصمیم‌گیرندگان مالی مانند سرمایه‌گذاران، اعتباردهندگان و مدیران شرکت‌ها دارد. از یک‌سو مدیران به ارزیابی ریسک شرکت در زمان تدوین و طراحی برنامه‌های توسعه برای شرکت نیازمند هستند و از سوی دیگر اعتباردهندگان و سرمایه‌گذاران نیز به ارزیابی شاخص‌های وضعیت مالی شرکت نظیر نقدشوندگی، کفایت سرمایه و سودآوری نیازمند هستند؛ بنابراین پیش از آنکه آنها در زمینۀ اعتباری یا سرمایه‌گذاری تصمیم بگیرند باید از این اطلاعات باخبر شوند. با توجه به اینکه بهره‌وران شرکت تا حد زیادی از پیش‌بینی درماندگی مالی شرکت بهره می‌برند (Yang et al, 2001)، کاربرد پیش‌بینی درماندگی مالی مطالعات زیادی را به‌دنبال داشته است. براساس مطالعات پیشین در این حوزه، بیشتر مطالعات روی ساخت الگو‌های پیش‌بینی درماندگی مالی با استفاده از رویکردهای آماری یا داده‌کاوی با هدف بهبود عملکرد پیش‌بینی الگو متمرکز بوده است (Gepp et al., 2010; Chen et al., 2011; Kumar & Ravi (2007. اگرچه ایجاد الگو‌های پیش‌بینی مبتنی‌بر داده است، ولی بسیار ضروری است بهترین استفاده از تمام اطلاعات موجود در ارتباط با شرکت، برای پیش‌بینی اینکه آیا شرکت‌ در موقعیت نکول یا درماندگی مالی هست یا خیر صورت گیرد؛ درنتیجه عملکرد پیش‌بینی درماندگی مالی نه‌تنها با الگوها و روشهایی تعیین می‌شود که برای پیش‌بینی به‌کار می‌برند، براساس به‌کارگیری اطلاعات موجود نیز ارزیابی می‌شود. مطالعات پیشین دربارۀ پیش‌بینی درماندگی مالی به‌طور عمده از متغیرهای مالی موجود در صورت‌های مالی به‌صورت متغیرهای توضیحی استفاده می‌کردند؛ به همین دلیل برخی از اطلاعات مفید دیگر بالقوه لحاظ نمی‌شد. ازجمله این اطلاعات نادیده‌ گرفته شده به اطلاعات موجود در شبکۀ مالی[1] اشاره می‌شود که استفاده‌نکردن از آن در پیش‌بینی درماندگی مالی، یکی از شکاف‌های اصلی موجود در اصول موضوع پژوهش است. شرکت‌های پذیرفته‌شده در بورس اوراق بهادار به‌عنوان یک «شبکۀ مالی پیچیده[2]» در نظر گرفته می‌شوند که شرکت‌ها درجایگاه گره‌ها و همبستگی میان بازده سهام آنها به‌صورت روابط میان آنها در نظر گرفته شود. مانتگنا در سال (1999) در ارائۀ بازار مالی به‌صورت شبکه پیش‌قدم شد (Mantegna, 1999)؛ برای مثال ارتباط بین دو شرکت با بازده سهامشان و از‌طریق محاسبۀ ضریب همبستگی میان سری‌های زمانی‌شان مرتبط می‌شوند. درک بازار مالی به‌صورت یک شبکۀ پیچیده این امکان را فراهم می‌سازد تا سازمان و فرایند تکامل شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تجزیه و تحلیل شوند. علاوه‌بر این، از دیدگاه تحلیل شرکت‌ها، سنجه‌های مبتنی‌بر شبکه مانند مرکزیت[3] تعداد ارتباطات یک شرکت و همین‌طور تعداد شرکت‌های مرتبط با آن را اندازه‌گیری و پس از آن، نفوذ و مرکزیت یک شرکت در بازار مالی را نیز کشف می‌کند؛ بدین‌ترتیب احتمال اینکه آن شرکت در‌معرض درماندگی مالی قرار می‌گیرد، مشخص و با سنجه‌های مبتنی‌بر شبکه شناسایی می‌شود. با توجه به شکاف اشاره‌شده در اصول پیش‌بینی درماندگی مالی و برمبنای تحلیل شبکه، این پژوهش در تلاش است سنجه‌های مناسبی از شبکه را به‌کار گیرد و با ترکیب آنها با متغیرهای مالی، با دقت بیشتری بنگاه‌های دارای درماندگی مالی و سلامت مالی را از یکدیگر متمایز سازد. همان‌طور‌که اشاره شد در زمینۀ روش‌های کمی پیش‌بینی درماندگی مالی در ابتدا روش‌های آماری شامل تحلیل نسبت تکین (Beaver, 1968)، تحلیل تمایزی چندگانه (Altman, 1968) و رگرسیون لجستیک (Lau, 1987) استفاده شد. پس از آن روش‌های داده‌کاوی مانند شبکۀ عصبی (Chauhan et al., 2009; Chen & Du, 2009; Iturriaga & Sanz, 2015)، ماشین بردار پشتیبان (Chaudhuri & De, 2011; Hsieh et al., 2012; Chen & Hsiao, 2008) و درخت تصمیم Sun & Li, 2008; Chen et al., 2011)) نیز به‌منظور پیش‌بینی درماندگی استفاده شد. درمقایسه با جداسازهای تکین، از روش‌های ترکیبی[4] این انتظار می‌رود که واریانس خطای تخمین را کاهش دهند و به‌طورکلی عملکرد شناسایی را بهبود بخشند. بنابراین در سال‌‌های اخیر، پیش‌بینی درماندگی مالی براساس روش‌‌های ترکیبی روند فزاینده‌ای در این زمینه داشته است (Zhang & Haghani, 2015; Zheng et al., 2008; Guelman, 2012).

روش درخت تصمیم تقویت گرادیان[5]یک روش ترکیبی وگونه‌ای از روش‌های بوستینگ است. GBDT به‌طور هدفمند درخت‌های جدیدی برای کمینه‌کردن تابع هزینه که با الگو‌های ساخته‌شدۀ قبلی شکل گرفته است، اضافه می‌کند. روش GBDT سودمندی‌اش را در برخی حوزه‌ها مانند پیش‌بینی زمان سفر، رتبه‌بندی شبکه‌ها و الگوسازی زیان بیمه‌ها اثبات کرده است؛ بنابراین GBDT توانایی پیش‌بینی بالقوه‌ای نسبت‌به روش‌های دیگر ترکیبی برای پیش‌بینی درماندگی مالی دارد. باید ذکر کرد کارامدی روش GBDT در پیش‌بینی درماندگی مالی به بهینه‌سازی شاخص‌های آن بستگی دارد (Friedman, 2001). بهینه‌ساز گرگ خاکستری (Mirjalili et al., 2014) به‌صورت یک عضو جدید الگوریتم‌های الهام‌گرفته از طبیعت، سلسله‌مراتب اجتماعی و رفتارهای شکارکردن گرگ‌های خاکستری را تقلید می‌کند. مشخصه‌های اصلی بهینه‌ساز گرگ خاکستری شامل سلسله‌مراتب اجتماعی، محاصرۀ طعمه، شکارکردن، حمله‌کردن به طعمه (بهره‌برداری[6]) و جست‌وجوی طعمه (کشف)[7] است. به‌دلیل توانایی خوب بهینه‌ساز گرگ خاکستری در جست‌وجو‌، از این بهینه‌ساز در حوزه‌های مختلفی استفاده شده است. موآنگ کوت و همکاران از بهینه‌ساز گرگ خاکستری همراه اصلاحاتی که در آن انجام دادند، برای آموزش شبکه‌های عصبی شبکه‌های تابع - پیوندی پایه شعاعی گاوسی-q[8] استفاده کردند. نتایج آزمایش نشان داد الگوریتم پیشنهادی، عملکرد بهتری از روش‌های دیگر فرا‌ابتکاری داشت (Muangkote et al., 2014). کمکی و کیوانفر با موفقیت از بهینه‌ساز گرگ خاکستری برای مسئلۀ اصلی دو مرحله‌ای برنامه‌ریزی جریان کار فروشگاه همراه زمان فروش محصولات استفاده کردند تا بهره‌‌وری را به‌طور درخور ملاحظه‌ای بهبود بخشند (Komaki & Kayvanfar, 2015). سلیمان و همکاران از بهینه‌ساز گرگ خاکستری استفاده کردند تا مسئلۀ توزیع بهینه توان واکنش[9] را حل کنند (Sulaiman et al., 2015). باوجود کاربردهای مختلف الگوریتم گرگ خاکستری در حوزه‌های مختلف و عملکرد مقبول آن باید خاطرنشان کرد این الگوریتم کاستی‌هایی دارد که در بخش روش پژوهش به‌تفصیل به آن اشاره شده است. بر اساس همین در این پژوهش از نسخۀ بهبود‌یافته آن استفاده شده است. همچنین تا‌جایی‌که بررسی شده است و مطالعات نشان می‌دهد، شایستگی این الگوریتم برای تنظیم بهینه شاخص‌های موجود در روش درخت تصمیم تقویت گرادیان آزمایش نشده که خود این موضوع یکی از شکاف‌های موجود در اصول موضوع پژوهش است؛ بنابراین این پژوهش چند هدف را دنبال می‌کند: از‌جمله اینکه عملکرد الگوی درخت تصمیم تقویت گرادیان را که شاخص‌هایش با الگوریتم گرگ خاکستری بهبود‌یافته، بهینه شده است، در ترکیب با متغیرهای مبتنی بر شبکۀ مالی که شکاف دیگری در اصول موضوع پژوهش به حساب می‌آید، برای پیش‌بینی درماندگی مالی بررسی می‌کند؛ نتایج آن را نیز با دو الگوی پرکاربرد و جدید در این حوزه یعنی رگرسیون لجستیک که به‌دلیل استفادۀ زیاد آن در این حوزه انتخاب شده‌ و k نزدیک‌ترین همسایه که یکی از جدیدترین رو‌ش‌ها در این حوزه است، با توجه به معیارهایی مانند دقت، سطح زیر منحنی ROC، خطای نوع اول و دوم و G-mean مقایسه می‌کند؛ در پایان بررسی می‌کند آیا افزودن متغیرهای شبکۀ مالی عملکرد الگو‌های پیش‌بینی درماندگی مالی را بهبود می‌بخشد یا خیر؟

با ارزیابی و بررسی اصول موضوع مشخص شد چندین بحث در این حوزه به مطالعات بیشتری نیازمند است که در ادامه به آنها اشاره شده است:

۱) بیشتر مطالعات این حوزه تنها متغیرهای مالی سنتی یا متغیرهای بازار را به‌صورت ورودی الگو برای پیش‌بینی درماندگی مالی در نظر گرفتند. برخی از متغیرهای مبتنی‌بر شبکه‌های مالی و تأثیرشان در پیش‌بینی درماندگی مالی بررسی نشده است. بر‌اساس دیدگاه لیو و همکاران ازآنجاکه بازده سهام به‌طور هم‌زمان انواع مختلفی از ارتباط را در میان شرکت‌ها بیان کرده، به‌روزترین اطلاعات در بازار را نیز منتقل می‌کند، بنابراین با لحاظ‌نکردن اثر اطلاعات شبکۀ مالی، اطلاعات پیش‌بینی‌کنندۀ مهم و مؤثری از دست خواهد رفت
(Liu et al., 2019). اینکه آیا متغیرهای مبتنی بر شبکه عملکرد پیش‌بینی را بهبود می‌بخشد یا خیر یک پرسش جدید است که بررسی نشده است.

2) براساس یافته‌های پژوهش آلاکا و همکاران بخش زیادی از مطالعات در این حوزه از روش‌های آماری یا داده‌کاوی مانند تحلیل تمایزی چندگانه، لاجیت، شبکۀ عصبی و ماشین بردار پشتیبان به‌صورت الگوی طبقه‌بندی برای پیش‌‌بینی درماندگی مالی استفاده کرده‌اند (Alaka et al., 2018). با‌این‌حال توانایی بالقوۀ الگوهای ترکیبی مانند درخت تصمیم تقویتی برای پیش‌بینی درماندگی مالی کمتر مطالعه شده است. علاوه بر این با استفاده از بهینه‌ساز گرگ خاکستری بهبودیافته نیز شاخص‌های الگوی درخت تصمیم تقویتی بهینه می‌شود که این نیز یک تلاش به‌نسبت جدید است.

۳) الگوی شبکۀ مالی، بهینه‌ساز گرگ خاکستری و درخت تصمیم برای پیش‌بینی درماندگی مالی بر‌اساس مجموعه داده‌های شرکت‌های پذیرفته‌شده در بورس و فرابورس ایران یک کار جدید است و پیش‌بینی عملکرد الگوی پیشنهادی را اعتبار می‌بخشد.

4) به‌یقین بیشتر پژوهش‌های انجام‌شده درخصوص پیش‌بینی درماندگی مالی، برای اینکه در انتخاب نهایی نمونه، بین تعداد شرکت‌های درمانده و سالم تناسب ایجاد کنند، از روش حذف استفاده کرده‌اند (برای مثال Liu et al., 2019; Aydin et al., 2022) و بدین‌ترتیب بسیاری از اطلاعات واقعی را نادیده گرفته‌اند. این اقدام برای ایجاد نسبت برابر و یا نسبت‌های سه به یک و یا کمی بیشتر میان شرکت‌های سالم و درمانده صورت گرفته است. در‌صورتی‌که یکی از اهداف این پژوهش آن است که ابزاری شناسایی کند که بدون نیاز به حذف اطلاعات و حتی باوجود نسبت‌های بسیار متفاوت میان شرکت‌های سالم و درمانده، با دقت زیاد و خطای کم پیش‌بینی انجام دهد.

بر‌اساس ضرورت‌هایی که به آن اشاره شد، این پژوهش به‌دنبال آن است تا عملکرد الگوی درخت تصمیم تقویت گرادیان را که شاخص‌هایش با الگوریتم گرگ خاکستری بهبودیافته بهینه شده است، در پیوند با متغیرهای مبتنی‌بر شبکۀ مالی برای پیش‌بینی درماندگی مالی بررسی کند. نتایج آن را نیز با برخی الگو‌های پرکاربرد در حوزۀ پیش‌بینی درماندگی مالی[10] و با توجه به معیارهای مختلف مقایسه کند. در‌پایان بررسی کند آیا افزودن متغیرهای شبکۀ مالی عملکرد الگو‌های پیش‌ینی درماندگی مالی را بهبود می‌بخشد یا خیر؟

برای تحقق اهداف پژوهش و رسیدن به نتایج نهایی، سؤالات پژوهش به شرح زیر مطرح شده است تا با پاسخ به آنها پژوهش در مسیر درست هدایت شود.

1) آیا الگوی ترکیبی IGWO – GBDT برای پیش‌بینی درماندگی مالی در مقایسه با الگوهای پرکاربرد منتخب (LR, KNN) عملکرد بهتری دارد؟

2) آیا استفاده از متغیرهای شبکۀ مالی (FNI) عملکرد الگوی ترکیبی IGWO – GBDT را برای پیش‌بینی درماندگی مالی بهبود می‌بخشد؟

3) آیا استفاده از متغیرهای شبکۀ مالی (FNI) عملکرد الگو‌های پرکاربرد منتخب (LR, KNN) را برای پیش‌بینی درماندگی مالی بهبود می‌بخشد؟

ساختار مقاله: درادامه مبانی نظری و تشریح مفاهیم اصلی پژوهش بیان شده است. پس از آن پیشینۀ تجربی و پژوهش‌های داخلی و خارجی بررسی شده است. سپس روش پژوهش و یافته‌های حاصل از آن به‌تفصیل بیان شده و در‌پایان نیز نتیجه‌گیری و پیشنهادات کاربردی و پژوهشی و منابع مقاله ذکر شده است.

 

 

 

مبانی نظری

شبکه‌های پیچیده ابزارهای توانمندی برای نشان‌دادن و مطالعۀ تعامل میان پدیده‌ها در دنیای واقعی هستند. شناسایی و استخراج گره‌های اثرگذار در شبکه‌های پیچیده تبدیل‌به یک حوزۀ پژوهشی مهم شده است؛ زیرا اثرات گسترده‌ای در ابعاد مختلف دارند. مبانی نظری شبکه‌های پیچیده در زمینه‌های مختلفی شامل علوم طبیعی، اقتصاد، علم مدیریت، علوم زیست‌شناسی و علوم کامپیوتر مورد توجه شایانی قرارگرفته است؛ بنابراین طراحی روش‌های سریع و اثربخش جهت شناسایی گره‌های اثرگذار در شبکه پیچیده یک اولویت حیاتی است (Sheng et al., 2019). همانطورکه در مقدمه نیز اشاره شد، شرکت‌های پذیرفته‌شده در بورس اوراق بهادار به‌صورت یک شبکۀ مالی پیچیده[11] درنظر گرفته می‌شوند که شرکت‌ها درجایگاه گره‌ها و همبستگی میان بازده سهام آنها درجایگاه روابط میان آنها هستند. مانتگنا در سال 1999 در ارائۀ بازار مالی به‌صورت شبکه پیش‌قدم شد (Mantegna, 1999). برای مثال ارتباط بین دو شرکت با بازده سهام‌شان و ازطریق محاسبۀ ضریب همبستگی میان سری‌های زمانی‌شان مرتبط می‌شوند. درک بازار مالی به‌صورت یک شبکه پیچیده اجازه می‌دهد سازمان و فرایند تکامل شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تجزیه و تحلیل شوند. شبکه‌های بازار مالی با درنظر‌گرفتن رویکردی مبتنی‌بر ماتریس‌های همبستگی ساخته شده‌اند. این روش ضرایب همبستگی میان سری‌های زمانی دو سهم i و j را در نظر گرفته است که با رابطۀ زیر محاسبه می‌شوند (Liu et al., 2019):

رابطۀ (1)

 

رابطۀ (2)

 

در این رابطه  بازده سهم i است که ازطریق رابطۀ (2) به دست آمده و  قیمت پایانی سهام i در روز t است. فاصله میان دو سهم i و j با رابطۀ (3) محاسبه می‌شود. این یک معیار واقعی است که از ۳ قاعدۀ کلی فاصله پیروی می‌کند. در‌صورتی‌که ضریب همبستگی میان بازده سهام دو شرکت مستقیم و کامل باشد، آنگاه فاصله میان آنها صفر خواهد شد؛ اما اگر همبستگی معکوس و کامل باشد، آنگاه فاصله بیشینه و برابر 2 می‌شود (Comin et.al, 2020).

رابطۀ (3)

 

در رابطۀ (3)، اگرd (i, j) = 0 و فقط اگر i = jو d (i, j) = d (j, i) و d (i, j) ≤ d (i, k) + d (k, j). ارتباط میان دو بنگاه با شباهت یا تضاد میان رفتار بازده سهامشان در طول زمان منعکس می‌شود. مسافت‌های میان N بنگاه با یک ماتریس مسافت متقارن N*N ارائه می‌شود که آن را «D» می‌نامیم. ازطریق ماتریس مسافت، ماتریس موزون w ایجاد شده است که برای نشان‌دادن توپولوژی شبکۀ پیچیده به‌کار می‌رود. سهم i و سهم j ازطریق یک لینک با وزن  به یکدیگر مرتبط هستند؛ بنابراین قوی‌ترین لینک‌ها، سهام با بیشترین مشابهت سری‌های زمانی را به یکدیگر مرتبط می‌کنند (Liu et al., 2019).

رابطۀ (4)

 

در این پژوهش علاوه‌بر 9 نسبت مالی، از متغیرهای مبتنی‌بر شبکه نیز به‌صورت پیش‌بینی‌ کننده‌های درماندگی مالی استفاده می‌شود. براساس کارهای ابتدایی در نظریه اقتصادی و اجتماعی، این پژوهش از چهار معیار مرکزیت شبکه، شامل مرکزیت درجه، مرکزیت بینابینی، مرکزیت نزدیکی و مرکزیت بردار ویژه براساس پژوهش منتشری و صادقی (1399) و پژوهش لیو و همکاران بهره می‌برد (Liu et al., 2019). براساس دیدگاه شنگ و همکاران این معیارهای مرکزیت به‌تنهایی تمام ویژگی‌های شبکه را اندازه‌گیری نمی‌کنند و باید باهم به‌کار روند (Sheng et al., 2019).

یکی از گسترده‌ترین معیارهای مرکزیت، درجه مرکزیت است که به‌صورت تعداد روابط مستقیمی که یک گره معین را دربرمی‌گیرد، تعریف می‌شود. میزان درجه درجایگاه خطر فوری یک گره برای گرفتن هرچه در جریان شبکه وجود دارد (مانند اطلاعات)، تفسیر می شود. در تحلیل شبکه‌های موزون، درجۀ مرکزیت به‌ طور کلی به میزان مجموعه اوزان گسترده می‌شود. این معیار به‌صورت زیر رابطه‌‌‌بندی می‌شود (Montasheri and Sadeghi, 2020؛ Liu et.al., 2019):

 

رابطه (5)

در این رابطه w ماتریس مجاورت وزنی است که در آن مقدار  وزن مسیر بین گره i و گرهj  است. براساس درجۀ مرکزیت، گره‌های اصلی در بازار مالی، شناسایی و پرارتباط‌ترین و جانبی‌ترین (حاشیه‌ترین) شرکت‌ها در بازار مالی شناخته می‌شوند.

یک معیار متداول به‌منظور اندازه‌گیری نفوذ یک گره در شبکه، مرکزیت بردار ویژه است. این معیار، امتیازهای نسبی تمام گره‌ها در شبکه و ارتباط گره‌ها با گره‌های با امتیاز زیاد را نشان می‌دهد که در شبکه بیشترین تأثیر را داشته‌اند. برای یک شبکۀ معین G := (V,E) با  تعداد گره‌های مشخص. A = (  ماتریس مجاورتی است؛ جایی‌که  اگر گره i با گره j ارتباط داشته باشد و در غیر این صورت  است. مرکزیت نسبی گره به‌صورت زیر تعریف می‌شود (Montasheri and Sadeghi, 2020؛ Liu et.al., 2019):

رابطۀ (6)

 

 

در اینجا M(i) یک مجموعه از همسایه‌های i و λ یک مقدار ثابت است. با یک بازآرایی مختصر آن رابطه به‌صورت معادلۀ بردار ویژه بازنویسی می‌شود.

رابطۀ (7)

 

در کل، مقادیر ویژه بسیار متفاوتی وجود خواهد داشت و برای هر مقدار ویژه غیرصفر راه حل وجود دارد. الزامات بیشتری است که تمام ارزش‌ها در مقادیر ویژه باید نامنفی باشد تا تنها بیشترین مقادیر ویژه به اندازه‌گیری مرکزیت دلخواه منجر شود. با دنبال‌کردن شیوۀ بالا اندازه‌گیری می‌کنند چگونه یک شرکت در شبکۀ مالی پیچیده و به‌هم مرتبط جای گرفته است. هرچه مرکزیت بردار ویژه بیشتر باشد، شرکت در شبکه در جایگاه مرکزی‌تری قرار گرفته است. تعامل بین دو گره غیر مجاور به گره‌هایی که در مسیر بین دو گره قرار گرفته اند، بستگی دارد. قرارگیری بینابینی گره‌ها به‌طور بالقوه کنترل روی تعاملات میان دو گره غیر مجاور را به‌دنبال خواهد داشت. بینابینی بر‌اساس مفهوم مسیرهای شبکه ایجاد شده است. نیومن در سال 2007 یک مسیر در یک شبکه را به‌صورت پیامد پیمودن گره‌ها با دنبال‌کردن ارتباطات از یک گره به گره دیگر در طی شبکه تعریف می‌کند. یک مسیر، کوتاه‌ترین مسیر در شبکه از یک گره به گره دیگر است (کوتاه‌ترین خط ترسیم‌شده بین دو نقطه). بینابینی یک گره با نسبتی ازکوتاه‌ترین مسیرها بین جفت گره‌هایی که از این گره عبور کردند، محاسبه می‌شود. فریمن شاخص مرکزیت بینابینی را ازنظر ریاضی به‌صورت زیر تعریف کرده است (Freeman, 1977):

 

رابطۀ (8)

 

در این رابطه  کل تعداد کوتاه‌ترین مسیرها از گره j به گره l و  تعداد کوتاه‌ترین مسیرهایی است که ازطریق گره j عبور کرده‌اند. مرکزیت بینابینی براساس این مفهوم ساخته شده است که یک گره مرکزی محسوب می‌شود، اگر نیاز باشد با جفت گره‌های دیگر مرتبط باشد. شرکت با مرکزیت بینابینی زیاد تأثیر مهمی بر شرکت‌های دیگر دارد؛ زیرا اطلاعاتی را که از آن عبور می‌کند، متوقف یا تحریف می‌کند.

مرکزیت نزدیکی نشان می‌دهد یک گره تا چه اندازه به سایر گره‌ها نزدیک است؛ به عبارت دیگر، تعداد گام‌هایی که طول می‌کشد از یک گره خاص به گره دیگری در شبکه رسید. هرچه مقدار مرکزیت نزدیکی یک گره بیشتر باشد، انتشار اطلاعات از این گره به گره‌های دیگر سریع‌تر خواهد بود. مقدار مرکزیت نزدیکی بیشتر برای یک گره به این معناست که آن گره در کوتاه‌ترین فاصلۀ ممکن برای اتصال به گره‌های دیگر قرار گرفته است و بنابراین از قابلیت دسترسی خوبی در شبکه بهره می‌برد. برای اندازه‌گیری مرکزیت نزدیکی از رابطۀ زیر استفاده می‌شود که در این رابطه  کوتاه‌ترین فاصله میان گره i و j است. اگر گره i به ‌طور مستقیم به تمام گره‌ها وصل باشد، این معیار برابر با 1 خواهد شد (Comin et.al, 2020).

رابطه (9)

 

بهینه‌ساز گرگ خاکستری، یک الگوریتم فراابتکاری موفق مبتنی‌بر جمعیت است که برمبنای زندگی اجتماعی گرگ‌ها طراحی شده است (Zhou et al., 2014). این سبک زندگی به طور معمول به سلسله مراتب رهبری وابسته است و رفتارهای مشارکتی شکار در واقع اصلی‌ترین عامل الهام‌بخش این الگوریتم الهام‌گرفته از طبیعت است (Heidari & Aliabbaspour, 2016). در نسخۀ اصلی بهینه‌ساز گرگ خاکستری، هر گروه یک چینش سلسله‌مراتبی دارد و هرکدام از اعضای گروه باید وظیفه‌ای درجایگاه یک عضو گروه داشته باشند (Niu et al., 2016). برای شکارکردن، رهبر یا رهبران خاصی که اعضای رده بالا هستند، هر گرگ را هدایت می‌کنند. رتبه‌بندی گرگ‌ها برمبنای توانایی ذهنی‌شان مانند هوشیاری و سرپرستی انجام می‌شود، نه بر مبنای قابلیت‌های جسمانی؛ بنابراین سه گرگی که شناخت بهتری از مکان احتمالی طعمه دارند، به‌ترتیب با عناوین «آلفا، بتا و دلتا» شناخته می‌شوند و اعضای دیگر را هدایت می‌کنند. مراحل شکار شامل محاصره و حمله‌کردن به طعمه است. سپس هر گرگ باید مکان کنونی خود را با توجه به موقعیت رهبران در تمام مراحل شکار تغییر دهد. همانند بهینه‌سازهای دیگر الهام‌گرفته از طبیعت، در مرحلۀ اول بهینه‌ساز گرگ خاکستری برخی از جواب‌های احتمالی به‌صورت تصادفی در چشم انداز فضایی جست‌وجو پراکنده می‌شوند. در تمام تکرارها، سه جواب برتر با عناوین «آلفا، بتا و دلتا» شناخته می‌شوند. این عامل‌های رهبر طراحی شده‌اند تا عوامل دیگر را در جهت شناخت مکان‌های بهتر در فضای هدف هدایت کنند. بقیۀ جواب‌ها را «امگا» می‌نامند. این گرگ‌ها تلاش می‌کنند مکان‌های خود را با توجه به قانون زیر تغییر دهند.

رابطۀ (10)

 

رابطۀ (11)

 

جایی‌که t عدد تکرار است و  شاخصی است که از دو به صفر کاهش می‌یابد. XP و X به‌ترتیب مکان‌های طعمه و گرگ‌ها و r1 و r2 مقادیر تصادفی در [0,1] هستند. برای اینکه به شناخت روشنی از اثرات معادلات اشاره‌شده برسیم، بردار موقعیت عامل‌های جستجو و مجموعه‌ای از همسایگانشان در شکل (1) نشان داده شده است. این طرح‌ها نشان می‌دهد گرگ‌ها به موقعیت‌های گوناگون نزدیک طعمه با تغییردادن مقادیر بردارهای A و C می‌رسند. علاوه ‌بر این، بردارهای تصادفی r1 و r2 در طول دوره‌ تکرار به‌روزرسانی می‌شوند تا به گرگ کمک کند به هر نقطه در میان نقاط ترسیم‌شده در شکل(1) برسد.

 

شکل (1) جایگاههای شکارچیان نزدیک طعمه (Heidari & Aliabbaspour, 2016)

Figure (1) The positions of the hunters near the prey (Heidari & Aliabbaspour, 2016)

 

گرگ‌های امگا رهبرانشان را به‌صورت زیر دنبال می‌کنند:

رابطه (12)

 

 

 

رابطه (13)

 

 

 

رابطه (14)

 

 

 

 

جایی‌که Xα   Xδ , Xβ به‌ترتیب موقعیت‌های آلفا، بتا و دلتا هستند. C3, C2 ,C1  سه برداری هستند که به‌صورت تصادفی ایجاد شده‌اند و X (t) جواب کنونی است. بردار حرکت سه‌بعدی شکارچیان در شکل (2) نشان داده شده است.

 

شکل (2) بردار حرکت سهبعدی گرگ‌ها (Heidari & Aliabbaspour, 2016)

Figure (2) 3D motion vector of wolves (Heidari & Aliabbaspour, 2016)

 

همان‌طور‌که میرجلیلی و همکاران و حیدری و پهلوانی بیان کردند، دو شاخص A وC به رویکرد بهینۀ گرگ خاکستری کمک می‌کند تا چشم‌انداز مسئله را کشف و بهره‌برداری کند (Mirjalili et al., 2014; Heidari & Pahlavani, 2017). با کاهش A، ۵۰ درصد فرآیند بهینه‌سازی به کشف و ۵۰ درصد به بهره‌برداری اختصاص می‌یابد. با وجود این، زمانی‌که ǀAǀ > 1 باشد، بهینه‌ساز گرگ خاکستری کشف می‌کند و زمانی که ǀAǀ<1 باشد، فضای عینی را بهره برداری می‌کند. بردار C در مقایسه با A موقتی نیست و وزن‌دهی‌های تصادفی انتخاب‌شده را در [1و0] دارد. این بردار به بهینه‌ساز گرگ خاکستری کمک می‌کند تا رفتارهای تصادفی سازی شدۀ بیشتری را در سراسر جست‌وجو نشان دهد و برای مشکل توقف در بهینۀ محلی مفید است. کارآمدی بهینه‌ساز گرگ خاکستری در مواجهه با شرایط مختلف ثابت شده است. با وجود این، حیدری و علی عباس‌پور بیان کرده‌اند بهینه‌ساز ابتدایی گرگ خاکستری ممکن است در زمانی که با برخی از موقیعت‌های پیچیدۀ دنیای واقعی مواجه می‌شود، در تلۀ بهینۀ محلی گیر بیفتد. این نقطه‌ضعف به‌دلیل اکتشاف‌نکردن گسترده در مقابله با برخی از چشم‌اندازهای برازش تقریبی است؛ بنابراین اشکال اول دربارۀ ضریب همگرایی بود که در الگوریتم پایه با نام متغیر a شناخته می‌شود. اشکال دوم دربارۀ شیوۀ راهکار تعیین موقعیت جدید یک گرگ است که به‌صورت میانگین حرکت سه گرگ آلفا، بتا و دلتا تعیین می‌شود. از منظر الهام‌گرفتن از طبیعت، مشاهده می‌شود برخی از گرگ‌هایی که در یک شکار مشارکتی واقعی شرکت می‌کنند، نه‌تنها موقعیت شکارچیان پیشگام را در‌نظر می‌گیرند، به احساسات، رفتارها و تغییر تصادفی در آرایش و چینش گرگ‌های دیگر نیز واکنش نشان می‌دهند. پس برای بهبود الگوریتم گرگ خاکستری دو اصلاح در این الگوریتم ضروری است: اول تغییر ضریب همگرایی و دوم تغییر در معادلۀ محاسبۀ جدید موقعیت هر گرگ. با وجود این، این نسخۀ جدید باید مزایای نسخۀ ابتدایی بهینه‌ساز گرگ خاکستری را نیز داشته باشد. ضریب همگرایی a در الگوریتم GWO به‌صورت خطی از 2 تا 0 متغیر است. در این پژوهش و در الگوریتم گرگ خاکستری بهبودیافته[12]، معادله ضریب همگرایی به‌ترتیب زیر برای تعادل بهتر بین اکتشاف و بهره برداری تغییر یافته است (Heidari & Aliabbaspour, 2016)

رابطه (15)

 

در معادلۀ بالا، عامل همگرایی a به‌شکل یک تغییر‌نمایی توصیف شده است؛ همان‌‌طورکه در شکل 3 نشان داده شده است. در الگوریتم اصلی گرگ خاکستری، نیمی از تکرارها برای اکتشاف و نیمی دیگر به بهره برداری اختصاص داده شده است. با استفاده از ضریب همگرایی اصلاح‌شده، تعداد بیشتری از تکرارها برای اکتشاف استفاده می‌شود که برای جلوگیری از گیرافتادن در بهینه‌های محلی مفید است. با استفاده از این نوع ضریب همگرایی غیرخطی، درصد تکرارهای به‌کاررفته برای اکتشاف و بهره‌برداری به‌ترتیب تقریباً 60 و40 درصد است.

 

شکل (3) تأثیر تغییر ضریب همگرایی در اکتشاف و استخراج (Heidari & Aliabbaspour, 2016)

Figure (3) The effect of changing the convergence coefficient in exploration and extraction

 

موقعیت جدید هر گرگ در الگوریتم پایه بر‌اساس موقعیت سه گرگ آلفا، بتا و دلتا مشخص می‌شود. رابطۀ 13 نشان‌دهندۀ موقعیت جدید گرگ آلفا، بتا و دلتا است. موقعیت جدید یک گرگ امگا از میانگین موقعیت سه گرگ دیگر با توجه به رابطه 14 به‌دست می‌آید. اشکال این معادله در نگاه یکسان به موقعیت سه گرگ اصلی یعنی آلفا، بتا و دلتا است؛ چراکه از میانگین موقعیت این سه گرگ موقعیت جدید گرگ امگا به‌دست می‌آید، درحالی‌که این نگرش به دور از موقعیت اجتماعی در گله گرگ‌ها است. در روش بهبودیافته، الگوریتم انتخاب موقعیت گرگ امگا بر‌اساس درصد برتری سه گرگ با توجه به هرم سلسله‌مراتب اعمال می‌شود؛ یعنی موقعیت جدید گرگ امگا بر‌اساس یک وزن منطبق‌بر سلسله مراتب به‌دست می‌آید که درصد بیشتری از گرگ آلفا و درصد کمتری از دو گرگ دیگر داشته باشد. به این ترتیب گرگ امگا درصدهای متفاوتی از سه گرگ با توجه به سلسله مراتب‌شان به‌دست می‌آورد(Heidari & Aliabbaspour, 2016) . بر همین اساس گروه پژوهش برای شناسایی موقعیت جدید گرگ، رابطۀ (16) را پیشنهاد کرده‌اند:

 

رابطه (16)

 

برای ارزیابی عملکرد بهینه‌سازی الگوریتم گرگ خاکستری بهبودیافته نیز از دو تابع تست[13] راست ریجین[14] و تابع قلمرو[15] استفاده شده است. در ریاضیات کاربردی توابع تست ابزارهای سودمندی هستند که برای ارزیابی ویژگی‌هایی مانند نرخ همگرایی[16]، دقت[17]، ثبات[18] و عملکرد کلی الگوریتم‌های بهینه‌سازی استفاده می‌شوند.

تقویت گرادیان یک روش یادگیری ماشین برای مسائل رگرسیون و طبقه‌بندی است. الگوی تقویت گرادیان ترکیبی خطی از یک‌سری الگو‌های ضعیف است که به‌صورت تناوبی برای ایجاد یک الگوی نهایی قوی ساخته شده ‌است. این روش به خانواده الگوریتم‌های یادگیری گروهی تعلق دارد و عملکرد آن همواره از الگوریتم‌های اساسی یا ضعیف مثل درخت تصمیم یا روش‌های براساس کیسه‌گذاری مانند جنگل تصادفی بهتر است، اما درستی این گزاره تا حدی از مشخصات داده‌های ورودی تأثیر می‌پذیرد. مانند روش‌های دیگر تقویتی (بوستینگ)، تقویت گرادیان ترکیبی خطی از یک‌سری از الگو‌های ضعیف برای ایجاد یک الگوی قوی و کارآمد است. تقویت گرادیان از روش ارتقا استفاده می‌کند؛ این روش از روش درخت تصمیم وام‌گرفته است. یادگیرنده‌های ضعیف موجود بعد از دریافت وزن بیشتر، به درخت بعدی منتقل می‌شوند تا پیش‌بینی‌های هر درخت از درخت قبلی بهتر باشد. خروجی، میانگین پیش‌بینی‌های نهایی است. الگوریتم تقویت گرادیان زمانی استفاده می‌شود که داده‌های زیاد با پیش‌بینی‌های زیاد داریم. تفاوت بین ارزش پیش‌بینی‌شده و ارزش واقعی با تابع زیان اندازه‌گیری می‌شود. در‌مجموع، روش‌های بوستینگ برای نزدیک‌شدن به جواب از رویکرد الگو‌سازی مرحله‌ای پیش‌رو استفاده می‌کنند. الگو‌های اساسی جدید بدون تغییر شاخص‌ها یا ضرائب الگو به الگوی ترکیبی قبلی اضافه می‌شوند. این نوع از روش بوستینگ مکانیسم کاهش گرادیان را به‌صورت هدف بهینه‌سازی الگو به‌کار می‌برد. در روش بوستینگ گرادیان، جداسازهای اساسی جدید به‌منظور کاهش گرادیان منفی تابع زیان، ساخته می‌شوند (Liu et al., 2019).

فریدمن با استفاده از یک درخت رگرسیون با اندازۀ ثابت به‌صورت الگوی پایه یک، شکل اصلاح‌یافته از روش افزایش گرادیان را پیشنهاد کرد که روش «درخت تصمیم تقویت گرادیان» نامیده می‌شود (Friedman, 2001). نسخۀ اصلاح‌شده، کیفیت الگو را بهبود بخشید. در این پژوهش نسخۀ اصلاح‌شدۀ الگوی  [19]GBMبرای پیش‌بینی درماندگی مالی استفاده می‌شود. با فرض اینکه تعداد برگ‌های هر درخت S است. هر درخت فضای ورودی را به S منطقه جدا‌شده ، ، ... ،  تقسیم می‌کند و یک مقدار ثابت  را برای منطقه  پیش‌بینی می‌کند. درخت رگرسیون به‌صورت زیر بیان می‌شود (Liu et al., 2019):

رابطه (17)

 

در آن

 

 

 

الگوی به‌روزرسانی معادله و اندازۀ مرحله کاهش شیب به‌صورت زیر نشان داده می‌شود:

 

رابطه (18)

 

 

رابطه (19)

 

با استفاده از یک درخت رگرسیون برای جایگزینی  در روش تقویت گرادیان، دو معادلۀ قبلی به رابطه زیر تبدیل می­شوند:

رابطه (20)

 

رابطه (21)

 

الگوی GBM به‌طور راهبردی هر الگوی پایه را به‌منظور کاهش یک تابع زیان معین اضافه می‌کند. سه شاخص اصلی ارائه‌شده در GBDT عبارتند از: نرخ یادگیری J، عمق درخت D و تعداد درختان N. شاخص اول یعنی نرخ آموزش، سهم هر الگوی درخت را در الگوی ترکیبی تعیین می‌کند. به طور کلی، یک مبادله بین تعداد درختان و میزان یادگیری وجود دارد. مقدار کوچک‌تر J معمولاً نیاز دارد تعداد بیشتری درخت اضافه شود. دومین شاخص، عمق درخت، بیشترین عمق درخت را نشان می‌دهد. به‌صورت یک قاعده کلی، مقدار بیشتر D به آموزش دانش بیشتر دربارۀ مسئله در یک مجموعه داده بزرگ کمک می‌کند، در غیر این صورت، مقدار کوچک‌تر D برای مجموعه داده کوچک ترجیح داده می‌شود. آخرین شاخص، N، تعداد درختانی است که به الگو اضافه می‌شود. در مقایسه با بیشتر رویکردهای هوش مصنوعی، GBM در مواقعی نظیر پیش‌بینی و الگو‌سازی هزینۀ زیان بیمه خودروها (Guelman, 2012)، پیش‌بینی بار (Taieb & Hyndman, 2014) و پیش‌بینی زمان سفر (Zhang & Haghani, 2015) به بهبود عملکرد در شناسایی الگو و برآورد رگرسیون منجر می‌شود (Liu et al., 2019).

 

پیشینۀ تجربی

در این بخش نتایج برخی از پژوهش‏های مرتبط به‌صورت اجمالی بررسی شده است. بیشتر مطالعات داخلی که با نگاه شبکه‌های پیچیده به بازار مالی ایران توجه کرده‌اند بیشتر در حوزه‌های گونه‌شناسی و توپولوژی بازار سهام (Montasheri and Sadeghi, 2021)، سنجش و مدیریت ریسک سیستماتیک و انتخاب پرتفوی سهام (Raei, et al., 2010؛ Fallahpiour and Ghahremani, 2021؛ Sedaghati, et al., 2021) بوده است.

علی‌بابایی و خان محمدی (1402) با هدف پیش‌بینی ورشکستگی شرکت‌ها با استفاده از سازوکار حاکمیت شرکتی و نسبت‌های مالی، داده‌های شرکت‌های فعال در بورس اوراق بهادار تهران را طی دوره ۸۶ تا ۹۵ تحلیل کردند. پژوهش آنها بر‌اساس الگوی بومی‌شدۀ کردستانی - تاتلی مبتنی‌بر الگوی آلتمن است. آنها با استفاده از سه الگوی شبکۀ عصبی، K نزدیک‌ترین همسایه و الگوی ترکیبی الگوریتم ژنتیک و شبکۀ عصبی فرضیه‌های خود را بررسی کردند. نتایج آنها نشان داد اضافه‌شدن متغیرهای حاکمیت شرکتی به شاخص‌های مالی باعث بهبود در نتایج پیش‌بینی ورشکستگی نشده است. الگوی ترکیبی شبکۀ عصبی و الگوریتم ژنتیک بیشترین دقت را در پیش‌بینی ورشکستگی داشته‌اند. الگوی K نزدیک‌ترین همسایه در تمام شاخص‌های ارزیابی الگو نسبت‌به رقبای خود عملکرد ضعیف‌تری داشته است.

رادووانوویچ و هاس با هدف ارزیابی الگو‌های پیش‌بینی ورشکستگی بر‌اساس معیار هزینه‌های اقتصادی و اجتماعی پژوهش خود را انجام دادند. داده‌های آنها واقعی و از پایگاه کامپوستت بوده که دربرگیرندۀ شرکت‌های پذیرفته‌شده در بورس آمریکای شمالی طی سال‌های ۱۹۸۵ تا ۲۰۲۰ و درمجموع ۱۹۰ هزار سال شرکت است. آنها الگو‌های مبتنی‌بر یادگیری ماشین را با الگو‌های پرکاربرد آماری مقایسه کردند. نتایج نشان داد الگو‌های یادگیری ماشین شامل درخت تصمیم تقویتی و دسته‌بندی، جنگل تصادفی، شبکۀ عصبی و ماشین بردار پشتیبان در مقایسه با الگو‌های رگرسیون لجستیک و تحلیل تفکیکی خطی، عملکرد بهتری داشته‌اند (Radovanovic & Haas, 2023).

آیدین و همکاران شرکت‌های فعال در بخش‌های تولید، خدمات و بازرگانی را در بورس استانبول طی سال‌های ۲۰۱۵ تا ۲۰۱۷ طبقه‌بندی کردند. آنها با استفاده از دو روش شبکۀ عصبی مصنوعی و درخت تصمیم و ارائۀ الگو‌های جداگانه برای هر بخش و با استفاده از ۲۵ نسبت مالی و ۲ متغیر غیر مالی فرضیه‌های خود را بررسی کردند. نتایج آنها نشان‌دهندۀ سرعت پردازش زیادتر و دقت بیشتر روش شبکۀ عصبی مصنوعی در مقایسه با روش درخت تصمیم است. الگوی شبکۀ عصبی مصنوعی با خطای نزدیک به صفر، شرکت‌های ورشکسته و غیر‌ورشکسته را از یکدیگر تفکیک کرد (Aydin et al., 2022).

علی‌بابایی و خان‌محمدی با هدف بررسی قدرت پیش‌بینی‌کنندگی الگوریتم‌های فرا‌ابتکاری برای پیش‌بینی ورشکستگی،
۶ الگوریتم فراابتکاری را شامل الگوریتم گرانشی، گرگ خاکستری، ژنتیک، رقابت استعماری، نهنگ و تکامل تدریجی باهم مقایسه کردند. آنها با ترکیب این الگوریتم‌ها با شبکۀ عصبی مصنوعی و استفاده از نسبت‌های نقدشوندگی، سودآوری و ساختار سرمایه، نشان دادند به‌جز الگوی گرانش، تقریباً تمام الگو‌ها، عملکرد مشابهی با یکدیگر داشته‌اند. البته عملکرد الگوی الگوریتم ژنتیک کمی از بقیۀ الگو‌ها بهتر بوده و دقتی حدود ۸۶ درصد داشته است (Alibabaee & Khanmohammadi, 2022).

علی اکبرلو و همکاران (1399) در پژوهشی با عنوان «مقایسۀ معیارهای تشخیص شرکت‌های درمانده مالی با استفاده از رگرسیون لجستیک و هوش‌مصنوعی» با تحلیل داده‌هایی بین سال‌های 2005 تا 2017 به این نتیجه دست یافتند که معیار آسکویت و همکاران (Asquith et al., 1994) در مقایسه با سه معیار ماده 141 قانون تجارت، الگوی آلتمن 1995 و الگو آلتمن 1968 (Altman, 1968; Altman et al., 1995) میانگین پیش‌بینی صحیح‌تری را ارائه می‌دهد.

قلی‌زاده و همکاران (1398) با استفاده از الگوی یادگیری ماشین سریع مبتنی‌بر کرنل بهینه‌شده با الگوریتم گرگ خاکستری، ورشکستگی ۱۳۶ شرکت بورسی را در بازۀ زمانی 2015 تا 2019 پیش‌بینی کردند. آنها ضمن مقایسۀ عملکرد الگوشان با الگوریتم ژنتیک به این نتیجه رسیدند الگوریتم گرگ خاکستری در تمام معیارهای ارزیابی مانند دقت، خطاهای نوع اول و دوم و ناحیۀ زیر منحنی ROC، کارایی بهتری دارد.

ناظمی و همکاران (1397) در پژوهشی به‌دنبال تبیین الگویی بودند که ورشکستگی صنایع خودرو و قطعات، محصولات شیمیایی و محصولات غذایی به‌جز قند و شکر را به‌خوبی پیش‌بینی کند. بر اساس همین با استفاده از الگوی درخت تصمیم و به‌کمک معیار ماده 141 قانون تجارت برای پیش‌بینی ورشکستگی و تحلیل داده‌هایی بین سال‌های 2000 تا 2012  برای هر صنعت الگویی طراحی کردند که به‌ترتیب با دقت 95/95، 83/96 و 83/97 درصد، ورشکستگی شرکت‌های صنایع ذکرشده را پیش‌بینی کرد. نتایج سایر پژوهش‌های داخلی و خارجی که بررسی شده، در جدول شمارۀ (1) ارائه شده است.

 

جدول (1) نتایج برخی از پژوهشهای داخلی و خارجی بررسی‌شده

Table (1) The results of some internal and external researches have been reviewed

پژوهشگران (سال)

موضوع

الگو/ متغیرهای اصلی

جامعه آماری و نمونه

روش گردآوری و تحلیل داده

یافتههای پژوهش

Marso & El Merouani (2020)

پیش‌یینی درماندگی مالی با استفاده از شبکه عصبی پیش خوراند ترکیبی و الگوریتم جست‌وجوی فاخته

اطلاعات مختلفی شامل متغیرهای مالی، سیاسی و اقتصاد کلان

داده‌های بنگاه‌های تولیدی کشور لهستان و بازارهای نوظهور

شبکه عصبی پیشخوراند، الگوریتم جست‌وجوی فاخته، شبکه عصبی پس انتشار و رگرسیون لجستیک

الگوی شبکه عصبی پیش‌خوراند جستوجوی فاخته با دقت 3/90 درصد، درحالی‌که الگوهای شبکه عصبی پس از انتشار و رگرسیون لجستیک در یک‌سال قبل از ورشکستگی دقت 33/88 و 15/82 درصدی داشته‌اند. در سه سال قبل از ورشکستگی نیز دقت الگوی فاخته از دو الگوی دیگر بالاتر بود.

منتشری و صادقی (1399)

گونه‌شناسی شبکه‌های مالی بر‌اساس ویژگی‌های مکان شناختی آنها

بازده قیمتی لگاریتمی/ درجه مرکزیت

اطلاعات مالی مربوط‌به 100 شرکت برتر

(2009-2019)

نظریۀ گراف و الگوریتم پریم و ماتریس همبستگی

سهام مخابرات ایران و بانک آینده بر‌اساس معیار درجه مرکزیت بیشترین تأثیر را بر شبکۀ مالی و بازار سهام دارند.

غضنفری و همکاران (1397)

پیش‌بینی ورشکستگی شرکت‏ها مبتنی‌بر سیستم‌های هوشمند ترکیبی‌

نسبت‌های مالی شامل سود انباشته به کل دارایی، سود عملیاتی به کل دارایی، سود خالص به کل دارایی، کل بدهی به حقوق صاحبان سهام، کل دارایی به حقوق صاحبان سهام، نسبت بدهی، بازده حقوق صاحبان سهام

شرکت‏هایی از صنایع غذایی و نساجی در دوره زمانی

2010-2012

شبکه عصبی، ماشین بردار پشتیبان و یادگیری تشدیدشده[20]در کنار الگوریتم‌های رقابت استعماری، الگوریتم فرهنگی و جست‌وجوی هارمونی

برتری عملکرد ترکیب ماشین بردار پشتیبان با الگوریتم‌های بهینه‌سازی جست‌وجوی هارمونی[21] و رقابت استعماری[22] در شرایط حذف‌نشدن داده‌های پرت

فلاح‌پور و همکاران (1397)

کاربرد روش ترکیبی بردار پشتیبان و روش انتخاب ویژگی پیشرو در پیش‌بینی درماندگی مالی

29 نسبت مالی

180 شرکت تولیدی بورسی درسال‌های 1996 تا 2012

روش ترکیبی ماشین بردار پشتیبان و روش انتخاب ویژگی پیشرو و رگرسیون لجستیک

نتایج نشان داد روش ترکیبی ماشین بردار پشتیبان و روش انتخاب ویژگی پی‌در‌پی پیشرو شناور از عملکرد بهتری نسبت‌به الگوی رگرسیون لجستیک برخوردار است.

Liu et al. (2019)

بهبود پیش‌بینی درماندگی مالی با استفاده از اطلاعات شبکۀ مالی

3 معیار شبکۀ مالی و 16 متغیر مالی

داده‌های شرکت‌های بورس چین

الگوریتم ژنتیک و درخت تصمیم

استفاده از متغیرهای شبکۀ مالی در الگو‌های پیش‌بینی ورشکستگی عملکرد الگوها را بهبود می‌بخشد.

Alaka et al. (2018)

ارزیابی سیستماتیک الگوهای پیش‌بینی ورشکستگی

مقایسه عملکرد 8 الگوی اصلی پرکاربرد در اصول موضوع

مقالات49 ژورنال علمی بین سال‌های 2010 تا 2015

روش سیستماتیک و فراتحلیل

هیچ ابزاری به‌تنهایی تمام معیارهای لازم را برای پیش‌بینی ورشکستگی ندارد. ارائۀچارچوبی برای انتخاب ابزار بر‌اساس اولویت‌های پژوهش

تاج مزینانی و همکاران (1394)

به‌کارگیری روش انتخاب ویژگی هارک در پیش‌بینی درماندگی مالی شرکت‌ها

نسبت‌های مالی

شرکت‌های تولیدی بورسی در بازه 2001 تا 2011

روش هارک، روش رگرسیون لجستیک و الگوی آلتمن

روش پیشنهادی هارک در یک و دو سال پیش از وقوع درماندگی مالی نسبت‌به رگرسیون لجستیک و الگوی آلتمن از عملکرد بهتری برخوردار است.

 

باید خاطرنشان کرد باوجود بررسی فراوان، پژوهشی داخلی مشاهده نشد که از متغیرهای مبتنی‌بر شبکۀ مالی برای پیش‌بینی درماندگی مالی استفاده کرده باشد. این یکی از وجوه تمایز و نوآوری‌های اصلی این پژوهش در قیاس با مطالعات پیشین است. از وجوه تمایز دیگر این پژوهش با مطالعات قبلی در ارتباط با پیش‌بینی درماندگی مالی استفاده‌نکردن از درخت تصمیم تقویتی و همچنین به‌کارنگرفتن الگوریتم گرگ خاکستری بهبودیافته برای تنظیم شاخص‌های درخت تصمیم است.

 

روش پژوهش

این پژوهش بر آن است سنجه‌های مناسبی از شبکۀ مالی را به‌کار‌گیرد تا به‌شیوۀ بهتری بنگاه‌های دارای درماندگی مالی و بنگاه‌های دارای سلامت مالی را از یکدیگر متمایز سازد. به‌منظور پاسخ‌دادن به سؤالات پژوهش از الگوی درخت تصمیم تقویت گرادیان که شاخص‌هایش با الگوریتم گرگ خاکستری بهبودیافته بهینه شده است، در کنار متغیرهای شبکۀ مالی استفاده می‏شود. جامعۀ آماری این پژوهش تمام شرکت‌‌های تولیدی پذیرفته‌شده در بورس و فرابورس ایران طی سال‌های 2015 تا 2021 است. البته از بین این شرکت‌ها تنها شرکت‌هایی انتخاب شده‌اند که شرایط مدنظر گروه پژوهش را داشته باشند: سال مالی منتهی به آخر اسفندماه، متعلق‌نبودن به صنایع واسطه‌گری مالی، بانک، بیمه و سرمایه‌گذاری‌ها، تغییرنکردن سال مالی در دورۀ زمانی مدنظر پژوهش و در دسترس بودن اطلاعاتی که پژوهش به آنها نیاز داشت. در‌نهایت ۱۲۳ شرکت انتخاب شد. در‌مجموع ۸۶۱ سال - شرکت وجود داشته که از بین این تعداد ۱۰۴ سال - شرکت درمانده و ۷۵۷ سال - شرکت غیر‌درمانده است. تعداد سال - شرکت‌هایبا درماندگی مالی از سال 2015 تا 2021 به‌ترتیب برابر با 8، 18، 20، 20، 17، 11 و 10 است. برای ساخت شبکۀ مالی و استخراج متغیرهای شبکۀ مالی به‌صورت پیش‌بینی کننده، اطلاعات مورد‌نیاز برای محاسبۀ بازده سهام تمام شرکت‌های عضو نمونه گردآوری شد. با توجه به اینکه آخرین اطلاعات بازار ویژگی‌های اصلی وضعیت مالی شرکت‌ها را بهتر نشان می‌دهد، برای تشکیل متغیرهای مبتنی‌بر شبکۀ مالی از اطلاعات آخرین ۳۰ روز معاملاتی در هر سال مالی استفاده شده است.

متغیرهای مستقل به دو بخش متغیرهای مالی و متغیرهای مربوط‌به شبکۀ مالی تقسیم می‌شوند. ۸ متغیر مالی بر‌اساس پژوهش ابراهیمی سروعلیا و همکاران (1397) انتخاب شده است: نسبت جاری، نسبت خالص سرمایه در گردش به کل دارایی‌ها، نسبت دارایی جاری به کل دارایی، حاشیۀ سود، بازده دارایی، بازده حقوق صاحبان سهام، نسبت ارزش بازار به ارزش دفتری و اندازۀ شرکت. علاوه‌بر 8 متغیر اشاره‌شده، نسبت بدهی کل نیز که یکی از پرکاربردترین متغیرها در سایر پژوهش‌ها بوده است، نیز به متغیرهای مالی افزوده شد. در‌خصوص متغیرهای شبکۀ مالی نیز چهار متغیر مرکزیت درجه، مرکزیت بینابینی، مرکزیت نزدیکی و مرکزیت بردار ویژه بر‌اساس پژوهش منتشری و صادقی (1399) و لیو و همکاران (Liu et al., 2019) انتخاب شده اند که به شیوۀ اندازه‌گیری آنها در بخش پیشینه نظری اشاره شده است. متغیر وابستۀ این پژوهش نیز درماندگی مالی است که در مطالعات قبلی مربوط‌به پیش‌بینی درماندگی مالی، معیارهای مختلفی برای آن پیشنهاد شده است. بر اساس این، در این پژوهش تنها از یک معیار برای سنجش درماندگی مالی استفاده نشده و هر شرکتی که دست‌کم یکی از این چهار ویژگی‌های را داشته باشد، در آن سال درمانده لحاظ شده است: مشمول مادۀ 141 قانون تجارت باشد؛ سه سال متوالی زیان داشته باشد (Damoori, D., Hozhabrie, 2019)؛ مشمول ماده 412  قانون تجارت باشد که این قانون به حالتی اشاره دارد که نسبت بدهی بزرگ‌تر از یک باشد (Pourheydari and Koopaei, 2010)؛ حقوق صاحبان سهامش منفی باشد (González-Bravo & Mecaj, 2011).

در رابطه با مراحل اجرای پژوهش باید گفت که ابتدا با استفاده از اطلاعات درج‌شده در صورت‌های مالی، نسبت‌های مالی مدنظر محاسبه شده است. همچنین به‌منظور محاسبۀ متغیرهای مربوط به شبکۀ مالی، بازده قیمتی سهام مختلف به‌صورت لگاریتمی و ازروی قیمت تعدیل‌شدۀ سهام و سپس ضریب همبستگی میان بازده سهام مختلف محاسبه شد. آن گاه با کمک رابطۀ 3، ماتریس فاصلۀ میان سهام مختلف تشکیل یافت و از آن به‌صورت ورودی گراف برای تشکیل کمینۀ درخت پویا با کمک الگوی پرایم استفاده شد. همچنین محاسبۀ شاخص‌های مورد نیاز برای ورود به الگوی درخت تصمیم تقویت گرادیان با استفاده از تکنیک بهینه‌ساز گرگ خاکستری بهبود یافت و با کمک نرم‌افزار پایتون[23] نسخه 3.11 و دو نوت‌بوک جوپیتر[24]و اسپایدر[25] انجام شده است. علاوه‌بر کتابخانه‌های پانداس[26]، نامپای[27]، متپلات لیب[28]، سوارم­لیب[29] و نتوورک‌ایکس[30] در پایتون، از کتابخانۀ سایکیت لرن[31] نیز بسیار استفاده شده است. تمام بسته‌ها، ماژول‌ها و توابعی که در این پژوهش استفاده شده، در جدول (2) ارائه شده است.

 

 

 

جدول (2) بستهها و توابع استفاده شده در کتابخانه سایکیت لرن

Table (2) Packages and functions used in the scikit Learn library

هدف

نام بسته فرعی

نام کتابخانه و بسته اصلی

پیش‌پردازش داده‌ها و استانداردکردن آنها

MinMaxScaler

sklearn. preprocessing

انتخاب الگو و تفکیک داده‌های آموزش و تست

train_test_split

sklearn. model_selection

انتخاب ویژگی و محاسبه بهره اطلاعاتی متغیرها

mutual_info_classif

sklearn. feature_selection

الگو‌های خطی و انجام رگرسیون لجستیک

LogisticRegression

sklearn. linear_model

انجام الگوی طبقه‌بندی نزدیک‌ترین همسایه

KNeighborsClassifier

sklearn. neighbors

انتخاب الگوی جمعی و درخت تصمیم تقویت گرادیان

GradientBoostingClassifier

sklearn. ensemble

ارائه معیارهای ارزیابی الگو

roc_auc_score

sklearn. metrics

ارائه و ترسیم ماتریس درهم‌ریختگی

classification_report, confusion_matrix

sklearn. metrics

ترسیم منحنی ROC

roc_curve

sklearn. metrics

انتخاب الگو و انجام اعتبارسنجی طبقه‌ای

cross_val_score

sklearn. Model _selection

انتخاب الگو و تعیین هایپرشاخص‌ها به روش جست‌وجوی شبکه‌ای

GridSearchCV

sklearn. Model _selection

 

در‌نهایت الگوها اجرا و معیارهای ارزیابی عملکرد الگوهای پیش‌بینی درماندگی مالی محاسبه می‌شود. در پژوهش‌هایی که با هدف طبقه‌بندی انجام می‌شود، استفاده از معیارهای مناسب ارزیابی عملکرد بسیار اهمیت دارد و در‌صورتی‌که معیارهای مقایسه عملکرد الگو‌های مختلف به‌خوبی انتخاب نشوند، نتایج و یافته‌های بسیار گمراه‌کننده همراه دارد. این موضوع زمانی بیشتر اهمیت پیدا می‌کند که نسبت میان کلاس‌های نمونۀ پژوهش بسیار متفاوت باشد؛ برای مثال در این پژوهش نمونۀ مربوط‌به شرکت‌های سالم بیش از
۷ برابر نمونۀ مربوط‌به شرکت‌های درمانده است (757 سال شرکت در مقابل 104 سال شرکت). این احتمال وجود دارد که به‌دلیل این تفاوت در تعداد کلاس‌ها، ارزیابی اشتباه صورت گیرد. با توجه به اینکه در این پژوهش شرکت‌های سالم، مثبت در نظر گرفته شده و شرکت‌های درمانده، منفی است و از‌آنجاکه تعداد شرکت‌های سالم بیش از ۷ برابر شرکت‌های درمانده است، بنابراین این احتمال وجود دارد که در ماتریس درهم‌ریختگی[32] تعداد مثبت‌های واقعی (TP) یا مثبت‌های درست (شرکت‌های سالمی که به‌درستی، سالم پیش‌بینی شده‌اند) چندین برابر منفی‌های واقعی (TN) یا منفی‌های درست (شرکت‌های درمانده‌ای که به‌درستی درمانده پیش‌بینی شده‌اند‌) باشد. همین موضوع باعث می‌شود تمام معیارهایی که در صورت آنها از TP استفاده شده است، مقدار زیادی از خود نشان دهند و این باعث ایجاد گمراهی در نتایج خواهد شد. با توجه به مباحث اشاره‌شده، در چنین حالت‌هایی مقدار دقت الگو (ACCURACY) و مقدار سطح زیر منحنی ROC و تمام معیارهایی که در صورت کسر آنها از TP استفاده شده باشد، مقادیر زیادی نشان می‌دهند که در واقعیت می‌توانند گمراه‌کننده باشند. اگرچه امکان دارد دقت الگو در مواقع مذکور گزارش شود، ولی این زیادبودن بیشتر به‌دلیل عملکرد الگو در پیش‌بینی درست شرکت‌های سالم بوده است و نه لزوماً در پیش‌بینی درست شرکت‌های درمانده. بر اساس این، کاملاً ضروری است که میزان خطای الگو‌ها نیز ارزیابی شود. در شرایطی که تعداد نمونه‌های طبقات پژوهش (سالم یا درمانده) همگن نباشد، هر الگویی که با خطای کمتری پیش‌بینی کند، درحقیقت از توان بیشتر و عملکرد بهتری برای پیش‌بینی درماندگی مالی برخوردار است؛ بنابراین با توجه به اینکه خطای نوع اول هزینه بیشتری دارد و درواقع هدف اصلی ما نیز شناسایی درست شرکت‌های ورشکسته است، هر الگویی که با خطای نوع یک کمتری پیش‌بینی کند، مطلوب‌تر و دقیق‌تر است. خطای نوع یک کمتر به این معنی است که الگو در پیش‌بینی شرکت‌های ورشکسته بهتر عمل کرده و شرکت‌های ورشکستۀ کمتری را به‌اشتباه سالم در نظر گرفته است. درمقابل، خطای نوع یک بیشتر به این مفهوم است که الگو، تعداد شرکت‌های درماندۀ بیشتری را به‌اشتباه، شرکت سالم پیش‌بینی کرده است. اما به این دلیل که در محاسبۀ خطای نوع دوم از تعداد TP در مخرج استفاده می‌شود و این مقدار نیز به‌دلیل زیادبودن تعداد شرکت‌های سالم نسبت‌به کل نمونه‌ها زیاد گزارش می‌شود، بر اساس همین مخرج افزایش پیدا کرده و حاصل که خطای نوع دوم است مقدار کمتری را نشان خواهد داد؛ بنابراین فقط تکیه‌بر خطای نوع دوم کمتر نیز در چنین پژوهش‌هایی گمراه‌کننده است. بر اساس همین در این پژوهش از معیارهای مختلف استفاده شده است تا عملکرد الگو‌ها از دیدگاه‌های مختلف سنجیده شود؛ مانند دقت در پیش‌بینی شرکت‌های درمانده، دقت در پیش‌ینی شرکت‌های سالم و میزان خطاهای مربوط‌به این پیش‌بینی‌ها. معیارهای استفاده‌شده برای ارزیابی دقت پیش‌بینی الگو‌ها بر‌اساس پژوهش لیو و همکاران، قلی‌زاده و همکاران (1398) و سانکار و همکاران انتخاب شده که به شرح زیر است (Liu et al., 2019; Sankhwar et al., 2020):

 

رابطه (21) دقت

 

رابطه (22) خطای نوع یک

 

رابطه (23) خطای نوع دو

 

رابطه (24) حساسیت

 

رابطه (25) نرخ مثبت‌های غلط

 

رابطه (26) ویژگی

 

رابطه (27) میانگین هندسی

 

رابطه (28) سطح زیر منحنی ROC

 

 

در روابط مذکور TP، TN،  FPو FN به‌ترتیب نشان‌دهندۀ مثبت درست (شرکت‌های سالمی که به‌درستی در دسته شرکت‌های سالم پیش‌بینی شده‌اند‌)، منفی درست (شرکت‌های درمانده‌ای که به‌درستی در دسته شرکت‌های درمانده پیش‌بینی شده‌اند‌)، مثبت نادرست (شرکت‌های درمانده‌ای که به‌اشتباه سالم پیش‌بینی شده‌اند) و منفی نادرست (شرکت‌های سالمی که به‌اشتباه درمانده پیش‌ینی شده‌اند) است.

ادامۀ فرایند این پژوهش بدین صورت بوده که برای تضمین اعتبار نتایج ارزیابی دقت طبقه‌بندی از روش اعتبارسنجی k طبقه‌ای[33] بهره گرفته شده است. اعتبارسنجی ۱۰ طبقه‌ای برای هر الگو ۱۰ بار اجرا شده، سپس از نتایج حاصل به‌منظور ارائه خروجی نهایی میانگین‌گیری شده است. در ادامه عملکرد الگوی پیشنهادی با دو روش دیگر از روش‌های متداول پیش‌بینی درماندگی مالی مقایسه شد. این مقایسه میان الگو‌ها هم با در‌نظر‌گرفتن متغیرهای شبکۀ مالی و هم بدون آنها انجام و اعتبارسنجی شده است. در پایان به‌منظور ارائه یک ارزیابی جامع از روش پیشنهاد‌شده، نتایج پیش‌بینی‌ها با استفاده از چندین معیار ارزیابی عملکرد شامل دقت، حساسیت، خطای نوع یک، خطای نوع دو و سطح زیر منحنی ROC آزمون شد.

 

یافتهها

این پژوهش به‌دنبال آن است با پیوند‌دادن متغیرهای مبتنی‌بر شبکۀ مالی با الگوی IGWO – GBDT قدرت پیش‌بینی الگو را بهبود بخشد. بر اساس این، یک روش ترکیبی مبتنی‌بر درخت بر‌مبنای اطلاعات شبکه و GBDT که با IGWO بهینه شده است، برای پیش‌بینی درماندگی مالی پیشنهاد شد. این روش به‌طور خلاصه «FNI-IGWO-GBD T » نام‌گذاری شده و رویکرد جدیدی برای مقابله با درماندگی مالی است. به‌طور خاص در این پژوهش در ابتدا متغیرهای مبتنی‌بر شبکه به متغیرهای مالی سنتی به‌صورت پیش‌بینی‌کننده اضافه شد و آنگاه الگوی GBDT که شاخص‌هایش با IGWO بهینه شده است، برای تعیین جداسازهای درخت به‌کار برده می‌شود. در پایان برا یسنجش و شناسایی قابلیت پیش‌بینی متغیرهای مبتنی‌بر شبکه و GBDT در پیش‌بینی درماندگی مالی، تحلیلی مقایسه‌ای نیز انجام شده است. به همین دلیل در این پژوهش الگو‌های نزدیک‌ترین همسایه و رگرسیون لجستیک در کنار الگوی درخت تصمیم تقویت گرادیان به‌صورت ابزارهای پیش‌بینی درماندگی مالی استفاده شده است. برای رگرسیون لجستیک از جریمه[34] l2، تلرانس[35] یک ده هزارم و حداکثر تکرار[36] ۱۰۰ استفاده شده است. برای الگوی k نزدیک‌ترین همسایه نیز از تعداد ۵ همسایه[37]، اندازه برگ[38] ۳۰، وزن یکنواخت[39]، الگوریتم اتو[40] و سنجه‌ی مینکوفسکی[41] استفاده شده است. برای بررسی توانایی متمایز متغیرهای مبتنی‌بر شبکه ابتدا ویژگی‌های آماری این متغیرها تشریح شده است. جدول (3) نشان می‌دهد برای شرکت‌های با درماندگی مالی در هر سال مقدار این متغیرها به چه میزان بوده است. میانگین درجه مرکزیت برای شرکت‌های دارای سلامت مالی 203/0 بوده، درحالی‌که میانگین درجه مرکزیت برای شرکت‌های درمانده 193/0 است. از روند تغییرات درجه مرکزیت برمی‌آید شبکۀ مالی در طول زمان دچار تحول شده است و شرکت‌هایی که در آستانه درماندگی هستند، بیشتر به حاشیه شبکه سوق پیدا می‌کنند. مرکزیت بینابینی، برای شرکت‌های درمانده و غیر‌درمانده برابر 007/0 است. از‌منظر مرکزیت بردار ویژه، میانگین شرکت‌های سالم 083/0 بوده و برای شرکت‌های دارای درماندگی مالی این میانگین 104/0 است. مرکزیت نزدیکی، برای شرکت‌های سالم 525/0 بوده و برای شرکت‌های دارای درماندگی مالی این میانگین 496/0 است. مطابق‌با جدول (3) شرکت‌هایی که مستعد درماندگی مالی هستند، هم‌زمان که شبکۀ مالی دچار تغییر می‌شود، روند تغییرات مشابهی دارند و در‌واقع برای شرکت‌های با مرکزیت کمتر، احتمال بیشتری وجود دارد که دچار درماندگی مالی شوند. نتایج مربوط‌به آمار توصیفی نسبت‌های مالی نیز در جدول (4) و به‌تفکیک شرکت‌های سالم و درمانده ارائه شده است. با توجه به اینکه دربارۀ شرکت‌های درمانده به‌دلیل منفی‌بودن حقوق صاحبان سهام و یا سود و یا صفر‌بودن میزان فروش در بعضی سال‌ها، محاسبۀ برخی نسبت‌ها ممکن است باعث تحلیل‌های اشتباه و گمراه‌کننده شود، به همین دلیل محاسبه نشده است.

 

جدول (3) مقادیر مربوط به متغیرهای شبکۀ مالی

Table (3) Values related to financial network variables

مرکزیت نزدیکی CC

مرکزیت بردار ویژه EC

مرکزیت بینابینی BC

مرکزیت درجه DC

 

525/0

083/0

007/0

203/0

شرکت‌های سالم

467/0

022/0

001/0

073/0

درمانده 1400

539/0

032/0

003/0

172/0

درمانده 1399

661/0

112/0

003/0

495/0

درمانده 1398

528/0

064/0

009/0

165/0

درمانده 1397

451/0

048/0

005/0

09/0

درمانده 1396

542/0

125/0

018/0

198/0

درمانده 1395

446/0

03/0

003/0

081/0

درمانده 1394

496/0

104/0

007/0

193/0

کل شرکت‌های درمانده

جدول (4) مقایسه نسبتهای مالی بین شرکتهای سالم و درمانده

Table (4) Comparison of financial ratios between healthy and distressed companies

نماد

نسبت مالی

شرکتهای سالم

شرکتهای درمانده

ROA

سود خالص به کل دارایی

162/0

164/0-

ROE

سود خالص به حقوق صاحبان سهام

362/0

205/0

ROS

سود خالص به فروش

2/0

-

DR

کل بدهی به کل دارایی

561/0

78/1

CR

دارایی جاری به بدهی جاری

735/1

498/0

NWC/TA

خالص سرمایه درگردش به کل دارایی

176/0

-

CA/TA

دارایی جاری به کل دارایی

68/0

454/0

MV/BV

ارزش بازار به ارزش دفتری

15/7

-

SIZE

لگاریتم کل دارایی­ها

475/6

15/6

 

به‌منظور اعتبارسنجی اینکه آیا متغیرهای مبتنی‌بر شبکه متوان عملکرد پیش‌بینی درماندگی مالی الگو‌ها را بهبود میبخشند یا نه، تمام الگو‌ها در دو حالت اجرا شدند. هر سه الگو هم باوجود متغیرهای شبکۀ مالی و هم بدون آن اجرا شده و دقت پیش‌بینی کننده‌های مختلف مقایسه شده که این مقایسه‌ها در جدول (5) آورده شده است. جدول (5) نشان می‌دهد درخت تصمیم تقویت گرادیان در ترکیب با اطلاعات شبکۀ مالی بهترین عملکرد پیش‌بینی را داشته است و این موضوع نشان‌دهندۀ این نکته است که الگوی پیشنهادی هم از مزایای اطلاعات شبکه و هم انتخاب شاخص‌های بهینه برمبنای الگوریتم گرگ خاکستری بهبودیافته بهره برده است.

 

جدول (5) مقایسه عملکرد سه الگو باوجود متغیرهای شبکۀ مالی و بدون آن

Table (5) Comparing the performance of three models with and without financial network variables

FN-GBDT

GBDT

FN-KNN

KNN

FN-LR

LR

 

982/0

96/0

895/0

906/0

907/0

901/0

Accuracy

05/0

11/0

40/0

31/0

20/0

24/0

Error1

013/0

033/0

065/0

011/0

078/0

086/0

Error2

993/0

989/0

907/0

916/0

959/0

932/0

Auc

968/0

927/0

748/0

826/0

858/0

833/0

G-mean

 

نتایج جدول 5 نشان می‌دهد دو الگوی رگرسیون لجستیک و نزدیک‌ترین همسایه ازنظر دقت، عملکرد مشابهی داشتند و میزان دقت آنها در حدود ۹۰ درصد است. این معیار برای الگوی پیشنهادی پژوهش برابر با ۹۸ درصد است. ازنظر معیار سطح زیر منحنی ROC نیز هر سه الگو وضعیت مشابهی را نشان می‌دهند و مقدار این معیار برای هر سه الگو، بیشتر از ۹۰ درصد است که در شکل 5 نیز مشاهده می‌شود. هر سه الگو درخصوص پیش‌بینی‌های مربوط‌به طبقه شرکت‌های سالم که ۸۸ درصد مشاهدات را نیز تشکیل می‌دهند، بسیار خوب عمل کرده‌اند و خطای زیر ۱۰ درصد دارند، اما هنر اصلی این الگو‌ها زمانی نمایان می‌شود که طبقۀ شرکت‌های درمانده مالی را که تنها ۱۲ درصد مشاهدات را به خود اختصاص داده‌اند، به‌خوبی و دقیق پیش‌بینی کنند. همان‌طورکه مشاهده می‌شود خطای نوع اول در الگوی رگرسیون لجستیک برابر ۲۰ درصد و برای الگوی نزدیک‌ترین همسایه ۴۰ درصد است که این مقدار خطا ممکن است هزینۀ زیادی را همراه داشته باشد؛ یعنی این دو الگو به‌ترتیب در ۲۰ و ۴۰ درصد مواقع شرکت‌های درمانده را به‌اشتباه، سالم پیش‌بینی کرده‌اند. اما خطای نوع اول در الگوی پیشنهادی پژوهش تنها ۵ درصد بوده و این نشان‌دهندۀ دقت زیاد الگو است که در شکل 5 نیز این تفاوت مشهود است. با توجه به اینکه معیار G-mean این توانایی را دارد که حتی در شرایط ناترازبودن نمونه‌های پژوهش نیز، عملکرد برخی از روش‌های طبقه‌بندی را تقویت کند (Faris et al., 2020)، به همین دلیل در این پژوهش از آن استفاده شده و نتایج آن نشان‌دهندۀ برتری الگوی درخت تصمیم تقویت گرادیان است.

 

 

شکل (5) مقایسۀ عملکرد سه الگو

Figure (5) Performance comparison of three models

 

با نگاه به نتایج مربوط‌به جدول (6) مشاهده می‌شود الگوی پیشنهادی پژوهش از تعداد ۱۷۳ پیش‌بینی که انجام داده است،۱۷۰ پیش‌بینی درست و فقط ۳ پیش‌بینی اشتباه داشته است و تنها در یک نمونه از ۲۰ پیش‌بینی درخصوص شرکت‌های ورشکسته خطا داشته است. ولی این خطا برای الگوی رگرسیون لجستیک ۴ خطا در۲۰ پیش‌بینی و برای الگوی نزدیک‌ترین همسایه ۸ خطا در۲۰ پیش‌بینی بوده است. همچنین باید اشاره کرد با اضافه‌شدن متغیرهای مربوط‌به شبکۀ مالی، تمام معیارهای ارزیابی در الگوی درخت تصمیم تقویت گرادیان و رگرسیون لجستیک بهبود می‌یابند، اما دربارۀ الگوی نزدیک‌ترین همسایه نتیجه عکس است. به احتمال زیاد دلیل این موضوع حساسیت الگوی نزدیک‌ترین همسایه به پراکندگی زیاد در طبقات نمونه است. در جدول (6)، خروجی‌های مربوط‌به ماتریس درهم‌ریختگی در هر سه الگوی به‌کار رفته، مقایسه شده است.

 

جدول (6) مقایسۀ ماتریس درهمریختگی روش درخت تصمیم تقویت گرادیان با الگوهای رگرسیون لجستیک و نزدیکترین همسایه

Table (6) Comparison of the confusion matrix in gradient boosting decision tree method with logistic regression and nearest neighbor models

مقادیر پیشبینی‌شده

 

 

خطای پیشبینی

دقت

مجموع

درمانده

سالم

خروجی

الگو

013/0

986/0

153

2

151

سالم

FNI-IGWO-GBDT

مقادیر واقعی

05/0

95/0

20

19

1

درمانده

017/0

982/0

173

21

152

مجموع

078/0

921/0

153

12

141

سالم

FNI-LR

20/0

80/0

20

16

4

درمانده

092/0

907/0

173

28

145

مجموع

065/0

934/0

153

10

143

سالم

FNI-KNN

40/0

60/0

20

12

8

درمانده

105/0

895/0

173

23

150

مجموع

آزمون مقایسۀ میانگین برای چهار معیار ارزیابی عملکرد الگوهای پیش‌بینی‌ انجام شده که نتایج حاصل در جدول (7) ارائه شده است. همان‌طورکه مشاهده می‌شود در سطح اطمینان 95 درصد تفاوت در میانگین خطای نوع اول در الگوی درخت تصمیم معنادار بوده و بدین مفهوم است که با اضافه‌شدن متغیرهای شبکۀ مالی خطای نوع یک الگو کاهش یافته است. این استدلال در سطح اطمینان 90 درصد برای معیار سطح زیر منحنی ROC نیز انجام می‌شود که درنتیجۀ آن با اضافه‌شدن متغیرهای شبکۀ مالی، معیار سطح زیر منحنی ROC افزایش یافته است. نتایج آزمون مقایسه میانگین در الگوی رگرسیون لجستیک نیز مشابه الگوی درخت تصمیم است؛ با این تفاوت که تأیید معناداری اختلاف میانگین برای معیار خطای نوع یک در سطح 90 درصد و برای معیار سطح زیر منحنی ROC در سطح 95 درصد است. برخلاف دو الگوی قبل، در الگوی نزدیک‌ترین همسایه، با اضافه‌شدن متغیرهای شبکۀ مالی خطای نوع یک به‌میزان 9 درصد افزایش یافت که این اختلاف در سطح اطمینان 95 درصد معنادار نیز بوده است. اما در سایر معیارها تفاوت معناداری مشاهده نشد.

جدول (7) آزمون مقایسۀ میانگین برای معیارهای ارزیابی هر سه الگو

Table (7) Mean comparison test for the evaluation criteria of all three models

خطای نوع 2

خطای نوع 1

سطح زیر منحنی ROC

دقت

آماره و سطح معناداری

الگو

598/0-

354/3

495/2-

23/0-

T-value

درخت تصمیم

576/0

02/0

055/0

822/0

Sig.(2-tailed)

678/0-

428/2

733/2-

164/1

T-value

رگرسیون لجستیک

528/0

06/0

041/0

297/0

Sig.(2-tailed)

791/0

312/6-

382/2

659/1

T-value

نزدیکترین همسایه

465/0

001/0

063/0

158/0

Sig.(2-tailed)

 

در‌مجموع ایجاد روش‌های جمعی مبتنی‌بر درخت ساده‌تر و نتایج آنها نیز باثبات‌تر است. برای بررسی ثبات نتایج، الگوی پیشنهاد شده، در 6 حالت مختلف، تحلیل حساسیت روی شاخص‌های ورودی الگو که با استفاده از الگوریتم گرگ خاکستری بهبودیافته انتخاب شده بود، نشان داد نتایج الگو از ثبات برخوردار است. جدول (8) نتایج تحلیل حساسیت روی الگوی پیشنهاد‌شده را نشان می‌دهد. با توجه به اینکه با تغییر شاخص‌های الگوی پیشنهادی همچنان دقت عملکرد پیش‌بینی الگو زیاد است، بنابراین نتایج حاصل از اعتبار و ثبات لازم برخوردار است.

 

جدول (8) نتایج تحلیل حساسیت روی الگوی درخت تصمیم تقویت گرادیان

Table (9) Results of sensitivity analysis on gradient boosting decision tree model

میانگین

6

5

4

3

2

1

 

 

(100، 5، 1/0)

(100، 3، 1/0)

(200، 3، 05/0)

(200، 5، 05/0)

(200، 5، 1/0)

(200، 3، 1/0)

(J, D, N)

965/0

96/0

97/0

95/0

96/0

97/0

97/0

ACC

990/0

990/0

993/0

983/0

991/0

993/0

992/0

AUC

 

در این بخش، اهمیت نسبی هر متغیر برای پیش‌بینی درماندگی مالی با استفاده از معیار بهرۀ اطلاعاتی[42] بررسی شده است. اهمیت نسبی هر متغیر بر‌اساس الگوی درخت تصمیم تقویت گرادیان به دست آمده است. از میان ۱۳ متغیر به‌صورت ورودی‌ها یا پیش‌بینی کننده‌های درماندگی مالی، سه متغیر حاشیۀ سود، بازده دارایی‌ها و نسبت ارزش بازار به ارزش دفتری دارایی‌ها با مقادیر 23/0، 21/0 و 17/0 بیشترین تأثیر نسبی را در خروجی الگو داشته‌اند. مطابق جدول 9 اگرچه معیارهای مرکزیت شبکه درمقایسه با نسبت‌های مالی، اهمیت نسبی کمتری در پیش‌بینی درماندگی مالی داشته‌اند، ولی در هر صورت تأثیر مثبتی نیز روی پیش­بینی درماندگی مالی داشته‌اند. از بین چهار متغیر مربوط‌به شبکۀ مالی، مرکزیت بینابینی بیشترین اهمیت نسبی را داشته و پس از آن مرکزیت درجه با اهمیت‌ترین متغیر شبکۀ مالی در پیش‌بینی درماندگی مالی بوده‌ است.

 

جدول (9) اهمیت نسبی متغیرهای پیشبینی‌کننده

Table (9) Relative importance of predictor variables

مقدار بهره اطلاعاتی

نام متغیر

رتبه

مقدار بهره اطلاعاتی

نام متغیر

رتبه

07/0

اندازه شرکت

8

23/0

حاشیه سود خالص

1

064/0

داراییهای جاری به کل داراییها

9

214/0

بازده داراییها

2

032/0

مرکزیت بینابینی

10

173/0

ارزش بازار به ارزش دفتری

3

023/0

مرکزیت درجه

11

16/0

نسبت بدهی

4

014/0

مرکزیت نزدیکی

12

157/0

خالص سرمایه در گردش به کل داراییها

5

006/0

مرکزیت بردار ویژه

13

147/0

نسبت جاری

6

 

092/0

بازده حقوق صاحبان سهام

7

 

نتیجهگیری

الگوی پیشنهاد‌شده به‌طور اثربخشی شرکت‌های با درماندگی مالی را از شرکت‌های دارای سلامت مالی تفکیک کرده است. با استفاده از نظریۀ شبکۀ پیچیده و به‌کمک بازده سهام شرکت‌های پذیرفته‌شده در بورس و فرابورس تهران، شبکۀ مالی ایجاد شد. سپس با به‌کارگیری معیارهای مرکزیت، موقعیت و ارتباطات هر شرکت در شبکۀ بازار مشخص شد. سرانجام در این پژوهش رابطه بین مرکزیت شبکه و درماندگی مالی بررسی شد. به‌منظور اعتبارسنجی تأثیر متغیرهای شبکۀ مالی در پیش‌بینی درماندگی مالی، شبکۀ مالی ایجاد و متغیرهای مربوط‌به شبکه به‌صورت متغیرهای پیش‌بینی‌کننده محاسبه شد. علاوه‌ بر آن به‌منظور دست‌یافتن به بیشترین عملکرد طبقه‌بندی الگو از الگوریتم گرگ خاکستری بهبودیافته به‌منظور جست‌وجوی بهینۀ ترکیب شاخص‌های الگوی تقویت گرادیان استفاده شد. در‌نهایت الگوی پیشنهادی این نتایج را به‌دنبال داشت: 1) هم‌راستا با نتایج پژوهش لیو و همکاران (Liu et al., 2019) متغیرهای مبتنی‌بر شبکۀ مالی به‌منظور کشف اطلاعات سودمند در شبکۀ مالی به‌کار می‌روند و عملکرد پیش‌بینی طبقه‌بندی‌کننده‌ها را بهبود می‌بخشند؛ 2) مطابق‌با تعریف مرکزیت، شرکت‌های با مقدار مرکزیت زیاد به‌ویژه مرکزیت بینابینی و مرکزیت درجه، کمتر مستعد قرارگرفتن در شرایط درماندگی مالی هستند و برعکس؛ 3) مطابق نتایج پژوهش قلی‌زاده و همکاران (1398)، الگوریتم گرگ خاکستری بهبود‌یافته یک روش کاربردی برای انتخاب شاخص‌های الگوی تقویت گرادیان است؛ 4) در شرایطی که نسبت فراوانی نمونه‌های هر طبقه بسیار متفاوت از طبقات دیگر باشد، استفاده از روش درخت تصمیم تقویت گرادیان بسیار کارآمد خواهد بود. نتایج تجربی نشان داد الگوی پیشنهاد‌شده بهتر از دو الگوی دیگر در پیش‌بینی درماندگی مالی عمل کرده و معیارهای ارزیابی به‌کار‌رفته نیز تأیید‌کنندۀ این موضوع است. از‌طرفی دقت پیش‌بینی الگوی پیشنهاد‌شده با تغییر شاخص‌هایی که در ابتدای مقاله تشریح شده بود، آزمون پایداری نتایج شد؛ بنابراین این الگو به‌صورت یک ابزار سودمند پیش‌بینی درماندگی مالی شرکت‌ها به کار گرفته می‌شود.

بر‌اساس نتایج که شاید و به احتمال بسیار زیاد نخستین پژوهشی باشد که در آن از الگوی ترکیبی FNI-GWO-GBDT برای پیش‌بینی درماندگی مالی شرکت‌ها استفاده شده است، به سایر پژوهشگران علاقه‌مند به حوزه پیش‌بینی درماندگی مالی و به‌طورکلی موضوعات مربوط‌به طبقه‌بندی، پیشنهاد می‌شود این پژوهش را یک کار جدید مبنایی برای پژوهش‌های آتی قرار دهند. ازجمله پیشنهادات کاربردی با توجه به نتایج حاصل از این پژوهش آن است که مدیران شرکت‌ها از متغیرهای حاشیه سود خالص، بازده دارایی‌ها و نسبت ارزش بازار به ارزش دفتری با وزن و اهمیت بیشتری برای پیش‌بینی درماندگی مالی شرکت‌ها استفاده کنند. همچنین توجه‌به موضوعات مربوط‌به بازار سرمایه با رویکرد شبکۀ مالی نیز خالی از فایده نخواهد بود. سایر پژوهشگران الگوی پیشنهادی این پژوهش را در مقایسه با سایر روش‌هایی مانند شبکه عصبی مصنوعی، جنگل تصادفی، ماشین‌های یادگیری سریع و ... در مطالعات بعدی به کار گیرند. همچنین به علاقه‌مندان به مطالعات در حوزۀ روش‌های فراابتکاری پیشنهاد می‌شود شاخص‌های درخت تصمیم را با سایر الگوریتم‌ها مانند ژنتیک، جست‌وجوی فاخته، کاوش باکتری، کلونی مورچگان، کرم شب تاب و ... بهینه و نتایج آن را با سایر روش‌ها مقایسه کنند. به‌جز روش‌های فراابتکاری الهام‌گرفته از طبیعت، شاخص‌های درخت تصمیم با روش‌هایی مانند جست‌وجوی تصادفی[43]و جست‌وجوی شبکه‌ای[44] نیز بهینه می‌شود. همچنین در مطالعات بعدی برای ساخت شبکۀ مالی به‌جای متغیرهای مبتنی‌بر قیمت از متغیرهای مبتنی‌بر حجم معاملات و یا متغیرهای مبتنی‌بر تحلیل‌های تکنیکال استفاده شود. برای اندازه‌گیری ویژگی‌های شبکۀ مالی نیز سایر معیارها مانند SIR[45]، PageRank، Hits[46]، K-shell، H-index و Profit Leader پیشنهاد می‌شود. نتایج این پژوهش به درک بهتری از الگوی ترکیبی FNI-GWO-GBDT برای پیش‌بینی درماندگی مالی شرکت‌ها منجر می‌شود. درخصوص محدودیت‌های این پژوهش باید اشاره کرد اصلی‌ترین محدودیت، موجود‌نبودن برخی اطلاعات مالی مربوط‌به قیمت تعدیل‌شدۀ برخی از سهام است که برای محاسبۀ بازده سهام، ضریب همبستگی میان بازده سهام و در‌نهایت تشکیل شبکۀ مالی ضروری است.

 

[1]. financial network

[2]. Complex financial network

[3]. Centrality

[4]. Ensemble methods

[5]. Gradient Boosting Decision Tree (GBDT)

[6]. Exploitation

[7]. exploration

[8]. q-Gaussian Radial Basis Functional-link nets neural networks

[9]. optimal reactive power dispatch

[10]. LR, KNN

[11]. Complex financial network

[12]. Improved Grey Wolf Optimizer

[13]. Test Function

[14]. Rastrigin Function

[15]. Sphere Function

[16]. Convergence Rate

[17]. Accuracy

[18]. Robustness

[19]. Gradient Boosting Model

[20]. Extreme learning

[21]. Harmony search

[22]. Imperialist Competition

[23]. Python

[24]. Jupyter

[25]. Spyder

[26]. Pandas

[27]. Numpy

[28]. Matplotlib

[29]. Swarmlib

[30]. Networkx

[31]. Scikit learn

[32]. Confusion Matrix

[33]. K-Fold Cross Validation

[34]. penalty

[35]. tolerance

[36]. Max-iteration

[37]. N-neighbors

[38]. Leaf size

[39]. Weight = uniform

[40]. Algorithm = auto

[41]. Metric = minkovski

[42]. Information Gain

[43]. Randomized Search CV

[44]. Grid Search CV

[45]. Susceptible Infected Recovered

[46]. Hyperlink Induced Topic Search

ابراهیمی سروعلیا، محمدحسن، باباجانی، جعفر، آخوند، محمدرضا، و فاخر، اسلام (1397). ارائه الگویی برای پیش‌بینی پویای درماندگی مالی با استفاده از تحلیل بقا. فصلنامه علمی پژوهشی اقتصاد مقداری، 15(4)، 167-198.  https://doi.org/10.22055/jqe.2019.25894.1877
پورحیدری، امید، و کوپایی حاجی، مهدی (1389). پیش‌بینی بحران مالی شرکت ها با استفاده از الگو مبتنی بر تابع تفکیکی خطی. پژوهشهای حسابداری مالی، 2(1)، 33-46.
تاج مزینانی، مائده، فلاح­پور، سعید، و باجلان، سعید (1394). کاربرد روش انتخاب ویژگی هارک (HARC) در پیش­بینی درماندگی مالی شرکت­ها در بورس اوراق بهادار تهران. راهبرد مدیریت مالی، 3(9)، 77-106. https://doi.org/10.22051/jfm.2015.2169
دموری، داریوش، و هژبری، فرحناز (1398). بررسی تأثیر چرخه عمر بر تجدید ساختار شرکت در شرایط درماندگی مالی. دانش حسابداری، 10(2)، 113-135. https://doi.org/10.22103/jak.2019.11201.2614
راعی، رضا، جعفری، غلامرضا، و نمکی، علی (1389). تحلیل بازار بورس اوراق بهادار تهران با استفاده ازشبکه‌های پیچیده مبتنی بر روش حدآستانه. بررسی‏‌های حسابداری و حسابرسی. 17(4)، 33-80.
صداقتی، صمد، فرهادی، روح‌اله، و فلاح شمس لیالستانی، میرفیض (1400). مدیریت پرتفوی براساس توپولوژی شبکه بازار سهام ایران. دو فصلنامه علمی تحقیقات مالی اسلامی، 10(1)، 151-186. https://www.doi.org/10.30497/ifr.2021.240229.1592
علی اکبرلو، علیرضا، منصورفر، غلامرضا، و غیور، فرزاد (1399). مقایسه معیارهای تشخیص شرکت‌های درمانده مالی با استفاده از رگرسیون لجستیک و روش‌های هوش مصنوعی. چشم­انداز مدیریت مالی، 10(29)، 147-166. https://doi.org/10.52547/jfmp.10.29.147
علی بابایی، غزاله، و خان­محمدی، محمد حامد (1402). ارائه الگوی به منظور پیش‌بینی ورشکستگی شرکت‌ها با استفاده از مکانیزم‌های حاکمیت شرکتی و نسبت‌های مالی. دانش سرمایه‌گذاری، 12(48)، 67-98.
فلاح‌پور، سعید، راعی، رضا، و نوروزیان، عیسی (1397). استفاده از روش ترکیبی انتخاب ویژگی پی‌درپی پیشرو شناور و ماشین بـردار پشتیبان در پیش‌بینی درماندگی مالی شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران. تحقیقات مالی، 20(3)، 289-304. https://doi.org/10.22059/frj.2018.113928.1005868
فلاح‌پور، سعید، و قهرمانی، علی (1400). معرفی و بررسی ویژگی‌های مرکزیت به عنوان معیاری نوین برای تحلیل شبکه، سنجش ریسک و انتخاب پرتفوی سهام. تحقیقات مالی، 23(2)، 158-171. https://doi.org/10.22059/jfr.2018.241407.1006515
قلی‌زاده سالطه، توحید، اقبال‌نیا، محمد، و آقابابائی، محمد ابراهیم (1398). پیش‌بینی ورشکستگی با الگو یادگیری ماشین سریع مبتنی بر کرنلِ بهینه شده با الگوریتم گرگ خاکستری. تحقیقات مالی، 21(2)، 187-212. https://doi.org/10.22059/frj.2019.277620.1006839
غضنفری، مهدی، رحیمی‌کیا، اقبال، و عسکری، علی (1397). پیش‌بینی ورشکستگی شرکت‌ها مبتنی بر سیستم‌های هوشمند ترکیبی. پژوهشهای حسابداری مالی و حسابرسی، 10(37)، 159-193.
منتشری، مجید، و صادقی، حجت الله (1400). ایجاد شبکه مالی غیرخطی مبتنی‌بر ویژگی مکان‌شناختی آن برمبنای نظریۀ گراف (مطالعه‌‌ای در بورس اوراق بهادار تهران). مدیریت دارایی و تامین مالی، 9(1)، 1-22. https://doi.org/10.22108/amf.2020.122895.1538
منتشری، مجید، و صادقی، حجت الله (1399). گونه‌شناسی شبکه‌های مالی بر‌اساس ویژگی‌های مکان‌شناختی آن‌ها (مطالعه‌ای در بورس اوراق ‏بهادار تهران)‏. مهندسی مالی و مدیریت اوراق بهادار. 11(45)، 319-342.
ناظمی اردکانی، مهدی، زارع مهرجردی، وحید، و محمدی ندوشن، علیرضا (1397). طراحی و تبیین الگوی پیش‌بینی ورشکستگی شرکت‌ها بر حسب صنایع منتخب با استفاده از الگوی درخت تصمیم. مدیریت دارایی و تامین مالی، 6(2)، 121-138. https://doi.org/10.22108/amf.2017.21355
 
References
Alaka, H. A., Oyedele, L. O., Owolabi, H. A., Kumar, V., Ajayi, S. O., Akinade, O. O., Bilal, M. (2018). Systemati review of bankruptcy prediction models: Towards a framework for tool selection. Expert Systems with Applications, 94, 164-184. https://doi.org/10.1016/j.eswa.2017.10.040
Aliakbarlou, A., Mansourfar, G., & Ghayour, F. (2020). Comparing the identifying criteria for financially distressed companies using logistic regression and artificial intelligence methods. Financial Management Perspective, 10(29), 147-166.  https://doi.org/10.52547/jfmp.10.29.147 [In Persian].
Alibabaee, G., & Khanmohammadi, M. (2022). The Study of the predictive power of meta-heuristic algorithms to provide a model for bankruptcy prediction. International Journal of Finance & Managerial Accounting, 7(26), 33-51. https://doi.org/10.30495/ijfma.2022.19523
Alibabaee, G., & Khanmohammadi, H. (2023). A Model to predict bankruptcy using the mechanisms of corporate governance and financial ratios. Journal of Investment Knowledge, 12(48), 67-98. [In Persian].
Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), 589–609. https://doi.org/10.2307/2978933
Altman, E. I., Eom, Y. H., & Kim, D. W. (1995). Failure prediction: Evidence from Korea. Journal of International Financial Management & Accounting, 6(3), 230-249. https://doi.org/10.1111/j.1467-646X.1995.tb00058.x
Asquith, P., Gertner, R., & Scharfstein, D. (1994). Anatomy of financial distress: An examination of junk-bond issuers. The Quarterly Journal of Economics, 109(3), 625-658.
Aydin, N., Sahin, N., Deveci, M., Pamucar, D. (2022). Prediction of financial distress of companies with artificial neural networks and decision trees models. Machine Learning with Applications, 10, 100432, https://doi.org/10.1016/j.mlwa.2022.100432
Beaver, W. H. (1968). Alternative accounting measures as predictors of failure. The Accounting Review, 43(1), 113-122.
Chaudhuri, A., & De, K. (2011). Fuzzy support vector machine for bankruptcy prediction. Applied Soft Computing, 11(2), 2472–2486. https://doi.org/10.1016/j.asoc.2010.10.003
Chauhan, N., Ravi, V., & Chandra, D. K. (2009). Differential evolution trained wavelet neural networks: Application to bankruptcy prediction in banks. Expert Systems with Applications, 36(4), 7659–7665. https://doi.org/10.1016/j.eswa.2008.09.019
Chen, W. S., & Du, Y. K. (2009). Using neural networks and datamining techniques for the financial distress prediction model. Expert Systems with Applications, 36(2), 4075–4086. https://doi.org/10.1016/j.eswa.2008.03.020
Chen, L. H., & Hsiao, H. D. (2008). Feature selection to diagnose a business crisis by using a real GA-based support vector machine: An empirical study. Expert Systems with Applications, 35(3), 1145–1155. https://doi.org/10.1016/j.eswa.2007.08.010
Chen, H. L., Yang, B., Wang, G., Liu, J., Xu, X., Wang, S. J., & Liu, D. Y.  (2011). A novel bankruptcy prediction model based on an adaptive fuzzy k-nearest neighbor method. Knowledge-Based Systems, 24(8), 1348–1359. https://doi.org/10.1016/j.knosys.2011.06.008
Comin, C. H., Peron, T., Silva, F. N., Amancio, D. R., Rodrigues, F. A., Cost, L. F. (2020). Complex systems: Features, similarity and connectivity. Physics Reports, 861, 1-41. https://doi.org/10.1016/j.physrep.2020.03.002
Damoori, D., Hozhabrie, F. (2019). Impact of life cycle on corporate restructuring while in financial distress. Journal of Accounting Knowledge, 10(2), 113-135. https://doi.org/10.22103/jak.2019.11201.2614 [In Persian].
Ebrahimi S., M. H., Babajani, J., Akhond, M., & Fakher, E. (2019). A Pattern for dynamic prediction of financial distress by using survival analysis. Quarterly Journal of Quantitative Economics, 15(4), 167-198.  https://doi.org/10.22055/jqe.2019.25894.1877 [In Persian].
Fallahpor, S., Ghahramani, A. (2021). An Analysis of centrality’s features as a new measure for network analysis, risk measurement & portfolio selection. Financial Research Journal, 23(2), 158-171. https://doi.org/10.22059/jfr.2018.241407.1006515 [In Persian].
Fallahpor, S., Raei, R., Norouzian L., E. (2018). Applying combined approach of sequential floating forward selection and support vector machine to predict financial distress of listed companies in Tehran Stock Exchange market. Financial Research Journal, 20(3), 289-304. https://doi.org/10.22059/frj.2018.113928.1005868 [In Persian].
Faris, H., Abukhurma, R., Almanaseer, W. (2020). Improving financial bankruptcy prediction in a highly imbalanced class distribution using oversampling and ensemble learning: A case from the Spanish market. Progress in Artificial Intelligence, 9, 31–53 https://doi.org/10.1007/s13748-019-00197-9
Freeman, L. (1977). A set of measures of centrality based on betweenness. sociometry, 40(1), 35–41. https://doi.org/10.2307/3033543
Friedman, J. H. (2001). Greedy function approximation: A gradient boosting machine. Annals of Statistics, 29(5), 1189-1232. https://www.researchgate.net/publication/280687718
Gepp, A., Kumar, K., & Bhattacharya, S. (2010). Business failure prediction using decision trees. Journal of Forecasting, 29(6), 536–555. https://doi.org/10.1002/for.1153
Golizadeh Salteh, T., Eghbalnia, M., & Aghababaei, M. E. (2019). Grey Wolf optimization evolving kernel extreme learning machine: Application to bankruptcy prediction. Financial Research Journal, 21(2), 187-212.  https://doi.org/10.22059/frj.2019.277620.1006839 [In Persian].
Ghazanfari, M., Rahimikiya, E., & Askari, A. (2018). Predicting bankruptcy of companies based on hybrid intelligent systems. Financial Accounting and Auditing Research, 10(37), 159-194. [In Persian].
Guelman, L. (2012). Gradient boosting trees for auto insurance loss cost modeling and prediction. Expert Systems with Applications, 39(3), 3659–3667. https://doi.org/10.1016/j.eswa.2011.09.058
Heidari, A. A., & Ali Abbaspour, R. (2016). Rough set reduction: A novel orthogonal learning-based Grey Wolf optimization strategy. 1st International Conference on Advances Research on Electrical and Computer Engineering, Tehran, Iran.
Heidari, A. A., & Pahlavani, P. (2017). An Efficient modified grey wolf optimizer with Lévy Flight for optimization tasks. Applied Soft Computing, 60, 115–134. https://doi.org/10.1016/j.asoc.2017.06.044
Hsieh, T. J., Hsiao, H. F., & Yeh, W. C. (2012). Mining financial distress trend data using penalty guided support vector machines based on hybrid of particle swarm optimization and artificial bee colony algorithm. Neurocomputing, 82, 196–206. https://doi.org/10.1016/j.neucom.2011.11.020
Iturriaga, F. J. L., & Sanz, I. P. (2015). Bankruptcy visualization and prediction using neural networks:
A study of US commercial banks. Expert Systems with Applications, 42(6), 2857–2869. https://doi.org/10.1016/j.eswa.2014.11.025
Komaki, G. M., & Kayvanfar, V. (2015). Grey Wolf optimizer algorithm for the two-stage assembly flow shop scheduling problem with release time. Journal of Computational Science, 8, 109–120. https://doi.org/10.1016/j.jocs.2015.03.011
Kumar, P. R., & Ravi, V. (2007). Bankruptcy prediction in banks and firms via statistical and intelligent techniques - A review. European Journal of Operational Research, 180(1), 1–28. https://doi.org/10.1016/j.ejor.2006.08.043
Lau, A. H. L. (1987). A five-state financial distress prediction model. Journal of Accounting Research, 25(1), 127–138. https://doi.org/10.2307/2491262
Mantegna, R. N. (1999). Hierarchical structure in financial markets. The European Physical Journal B- Condensed Matter and Complex Systems, 11(1), 193–197. https://doi.org/10.1007/s100510050929
Marso, S. & El Merouani, M. (2020). Predicting financial distress using hybrid feedforward neural network with cuckoo search algorithm. Procedia Computer Science, 170, 1134-1140. https://doi.org/10.1016/j.procs.2020.03.054
González-Bravo, M. I., & Mecaj, A. (2011). Structural and evolutionary patterns of companies in a financial distress situation. Advances in Decision Sciences, 2011. http://dx.doi.org/10.1155/2011/928716
Mirjalili, S. A., Mirjalili, S. M., & Lewis, A. (2014). Grey wolf optimizer. Advances in Engineering Software, 69, 46–61. https://doi.org/10.1016/j.advengsoft.2013.12.007
Montasheri, M., & Sadeqi, H. (2021). Establishment of a non-linear financial network based on its typological characteristics based on Graph theory, A Study in Tehran Stock Exchange. Journal of Asset Management and Financing, 9(1), 1-22. https://doi.org/10.22108/amf.2020.122895.1538 [In Perssian].
Montasheri, M., & Sadeqi, H. (2020). A Typology of financial networks according to their typological ‎characteristics, A study of Tehran Stock Exchange‎. Financial Engineering and Portfolio Management, 11(45), 319-342. [In Persian].
Muangkote, N., Sunat, K., & Chiewchanwattana, S. (2014). An improved grey wolf optimizer for training q-Gaussian Radial Basis Functional-link nets. In 2014 international computer science and engineering conference (ICSEC) (pp. 209-214). IEEE. https://doi.org/10.1109/ICSEC.2014.6978196
Nazemi, A. M., Zare, M. V., & Mohammadi, N, A. (2018). A firms bankruptcy prediction model based on selected industries by using decision trees model. Journal of Asset Management and Financing, 6(2), 121-138. https://doi.org/10.22108/amf.2017.21355  [In Persian].
Niu, M., Wang, Y., Sun, S., & Li, Y. (2016). A novel hybrid decomposition-and-ensemble model based on CEEMD and GWO for short-term PM 2.5 concentration forecasting. Atmospheric Environment, 134,
168–180. https://doi.org/10.1016/j.atmosenv.2016.03.056
Pourheydari, O., & Koopaei, H. M. (2010). Predicting of firm’s financial distress by use of linear discriminant function the model. Financial Accounting Researches, 2(1), 33-46. [In Persian].
Radovanovic, J., & Haas, C. (2023). The evaluation of bankruptcy prediction models based on socio-economic costs, Expert Systems with Applications, 227, 120275. https://doi.org/10.1016/j.eswa.2023.120275
Raei, R., Jafari, G., & Namaki, A. (2010). Analysis of Tehran Stock Exchange by Complex Network based on Threshold method. Accounting and Auditing Review, 17(4), 33-80. https://acctgrev.ut.ac.ir/article_22517.html [In Persian].
Sankhwar, S., Gupta, D., Ramya, K. C. Sheeba Rani, S., Shankar, K., & Lakshmanaprabu, S. K. (2020). Improved grey wolf optimization-based feature subset selection with fuzzy neural classifier for financial crisis prediction. Soft Computing, 24, 101–110. https://doi.org/10.1007/s00500-019-04323-6
Sedaghati, S., Farhadi, R., Fallah S, L, M. (2021). Portfolio management based on the topology of the Iranian stock market network. Bi-Quarterly Scientific Journal of Islamic Finance Researches, 10(1), 151-186. https://www.doi.org/10.30497/ifr.2021.240229.1592 [In Persian].
Sheng, J., Dai, J., Wang, B., Duan, G., Long, J., Zhang, J., ... & Guan, W. (2020). Identifying influential nodes in complex networks based on global and local structure, Physica A: Statistical Mechanics and its Applications, 541, 123262. https://doi.org/10.1016/j.physa.2019.123262
Sulaiman, M. H., Mustaffa, Z., Mohamed, M. R., & Aliman, O. (2015). Using the gray wolf optimizer for solving optimal reactive power dispatch problem. Applied Soft Computing, 32, 286-292. https://doi.org/10.1016/j.asoc.2015.03.041
Sun, J., & Li, H. (2008). Data mining method for listed companies’ financial distress prediction. Knowledge Based Systems, 21(1), 1–5. https://doi.org/10.1016/j.knosys.2006.11.003
Taieb, S. B., & Hyndman, R. J. (2014). A gradient boosting approach to the Kaggle load forecasting competition. International Journal of Forecasting, 30(2), 382–394. https://doi.org/10.1016/j.ijforecast.2013.07.005
Tajmazinani, M., Fallahpour, S., & Bajalan, S. (2015). The Use of Feature Selection Method (HARC) in predicting financial distress in Tehran Stock Exchange. Financial Management Strategy, 3(9), 77-106. https://doi.org/10.22051/jfm.2015.2169 [In Persian].
Yang, B., Li, L. X., Xie, Q., & Xu, J. (2001). Development of a KBS for managing bank loan risk. Knowledge Based Systems, 14(5-6), 299–302. https://doi.org/10.1016/S0950-7051(01)00109-5
Zhang, Y., & Haghani, A. (2015). A gradient boosting method to improve travel time prediction. Transportation Research Part C: Emerging Technologies, 58, 308–324. https://doi.org/10.1016/j.trc.2015.02.019
Zheng, Z., Zha, H., Zhang, T., Chapelle, O., Chen, K., & Sun, G. (2008). A general boosting method and its application to learning ranking functions for web search. Advances in neural Information Processing Systems, 20,1697–1704.
Zhou, Y., Bao, L., & Chen, C. P. (2014). A new 1D chaotic system for image encryption. Signal Processing, 97, 172–182. https://doi.org/10.1016/j.sigpro.2013.10.034