نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشیار، گروه مهندسی مالی، دانشکده حسابداری و علوم مالی، دانشگاه تهران، تهران، ایران
2 دانشجوی دکترا، گروه مدیریت مالی و بیمه، پردیس البرز، دانشگاه تهران، تهران، ایران
3 دانشیار، گروه مدیریت مالی، دانشکده مدیریت، دانشگاه تهران، تهران، ایران
4 استادیار، گروه مدیریت مالی، دانشکده مدیریت، دانشگاه تهران، تهران، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
This study aimed to evaluate the performance of the gradient boosting decision tree model, the parameters of which were optimized with the improved Gray Wolf Algorithm (GWO) by adding financial network-related variables via the selected models of predicting financial distress. The proposed model of this study was implemented on the data of 123 manufacturing companies admitted to the Tehran Stock Exchange and Iran Fara Bourse Co. (IFB) from 2014 to 2021. Initially, the financial network was formed and then, the financial distress of companies was predicted by integrating the network-based variables with financial ratios and using a gradient boosting decision tree model. The model of the gradient boosting decision tree had better performance in terms of precision and Type I error by adding Financial Network Indicators (FNI) compared to the two models of K-Nearest Neighbor (KNN) and Logistic Regression (LR). Companies with betweenness centrality and high degree centrality were found to be less prone to financial distress and vice versa. This is the first study to predict financial distress by using financial network-related variables integrated with financial ratio variables through the novel gradient boosting decision tree method, the parameters of which were optimized with the improved GWO.
Keywords: Financial Distress, Financial Network, Gradient Boosting Decision Tree, Improved Gray Wolf Algorithm (GWO), Centrality Criteria.
Introduction
Previous studies on predicting financial distress have mainly adopted financial variables in financial statements as explanatory variables, while ignoring some other potentially useful information, such as financial network-related information. Disregarding such information for predicting financial distress is one of the significant gaps in the literature. Therefore, the present study aimed to evaluate the performance of the gradient boosting decision tree model, the parameters of which were optimized with the improved Gray Wolf Algorithm (GWO), along with the financial network-related variables, which showed another gap in the literature, and then compare its findings with the two recently widely used models of K-Nearest Neighbor (KNN) and Logistic Regression (LR). The following questions were posed in the present study.
Can the integrated IGWO-GBDT model provide a better prediction of financial distress compared to the widely selected models of LR and KNN?
Does the inclusion of financial network variables improve the performance of the integrated IGWO-GBDT model for predicting financial distress?
Does the inclusion of financial network variables improve the performance of the widely used models of LR and KNN for predicting financial distress?
Materials & Methods
The sample of this study included all the manufacturing companies listed in the Tehran Stock Exchange and Iran Fara Bourse Co. (IFB) from 2014 to 2021, of which 123 companies were selected. The information of the last 30 trading days in each fiscal year was used to form the financial network variables. Finally, 8 financial variables were selected based on those adopted by Ebrahimi Sarvolia et al. (2018), including current ratio, net ratio of working capital to total asset, ratio of current asset to total asset, profit margin, return on assets, return on equity, book to market ratio, and size of company. Furthermore, the total debt ratio, a widely used variable in previous studies, was added to the financial variables. Regarding the financial network variables, the 4 variables of degree centrality, betweenness centrality, eigenvector centrality, and closeness centrality were selected similar to those selected by Montasheri and Sadeqi (2020) and Liu et al. (2019). More than one criterion was applied to measure financial distress in this study. Any companies that met at least one of the four mentioned criteria were considered distressed in that year. These criteria were subject to Article 141 of the Commercial Law, suffering losses for 3 consecutive years (Damoori & Hozhabrie, 2019), subject to Article 412 of the Commercial Law, referring to a debt ratio higher than 1 (Poorheidari & Koopaei, 2011), and had negative equity.
Findings
The findings indicated that the mean degree of centrality for companies with financial health was 0.203, while it was 0.193 for the distressed companies. Betweenness centrality was 0.007 for the distressed and non-distressed companies. Regarding eigenvector centrality, the means of healthy companies and those with financial distress were 0.083 and 0.104, respectively. Also, the values of closeness centrality were 0.525 and 0.496 for the mentioned companies, respectively. Table 5 shows that all the 3 models have performed quite well in terms of prediction of the class of healthy companies, while the error was below 10%. Still, the distinguished performances of these models were revealed when they could accurately and appropriately predict the class of financially distressed companies, which included only 12% of observations. The type I errors in the LR and KNN models were respectively 20 and 40%, bearing huge costs. In other words, these two models mistakenly predicted distressed companies as healthy ones in 20 and 40% of cases. However, the type I error of the proposed research model was only 5%, indicating high accuracy of the model.
Table 5. Comparison of the performances of the 3 studied models with and without financial network variables
FN-GBDT
GBDT
FN-KNN
KNN
FN-LR
LR
0.982
0.96
0.895
0.906
0.907
0.901
Accuracy
0.05
0.11
0.40
0.31
0.20
0.24
Error 1
0.013
0.033
0.065
0.011
0.078
0.086
Error 2
0.933
0.989
0.907
0.916
0.959
0.932
AUC
0.968
0.927
0.748
0.826
0.858
0.833
G-mean
Discussion and Conclusion
(1) Financial network variables can be employed to explore useful information in the financial network and improve the prediction performances of classifiers.
(2) According to the definition of centrality, companies with high centrality, especially betweenness centrality and degree centrality, are less prone to financial distress and vice versa.
(3) The improved GWO is a practical method for selecting the parameters of the gradient boosting model.
(4) The gradient boosting decision tree model is highly efficient when the frequency ratio of the samples of each class is significantly different from those of other classes. The experimental findings revealed that the proposed model outperformed the other two models in predicting financial distress. This was confirmed by the adopted evaluation criteria.
کلیدواژهها [English]
مقدمه
پیشبینی درماندگی مالی که بهعنوان «پیشبینی ورشکستگی و پیشبینی شکست کسب و کار» نیز شناخته میشود، جایگاه حیاتی برای تصمیمگیرندگان مالی مانند سرمایهگذاران، اعتباردهندگان و مدیران شرکتها دارد. از یکسو مدیران به ارزیابی ریسک شرکت در زمان تدوین و طراحی برنامههای توسعه برای شرکت نیازمند هستند و از سوی دیگر اعتباردهندگان و سرمایهگذاران نیز به ارزیابی شاخصهای وضعیت مالی شرکت نظیر نقدشوندگی، کفایت سرمایه و سودآوری نیازمند هستند؛ بنابراین پیش از آنکه آنها در زمینۀ اعتباری یا سرمایهگذاری تصمیم بگیرند باید از این اطلاعات باخبر شوند. با توجه به اینکه بهرهوران شرکت تا حد زیادی از پیشبینی درماندگی مالی شرکت بهره میبرند (Yang et al, 2001)، کاربرد پیشبینی درماندگی مالی مطالعات زیادی را بهدنبال داشته است. براساس مطالعات پیشین در این حوزه، بیشتر مطالعات روی ساخت الگوهای پیشبینی درماندگی مالی با استفاده از رویکردهای آماری یا دادهکاوی با هدف بهبود عملکرد پیشبینی الگو متمرکز بوده است (Gepp et al., 2010; Chen et al., 2011; Kumar & Ravi (2007. اگرچه ایجاد الگوهای پیشبینی مبتنیبر داده است، ولی بسیار ضروری است بهترین استفاده از تمام اطلاعات موجود در ارتباط با شرکت، برای پیشبینی اینکه آیا شرکت در موقعیت نکول یا درماندگی مالی هست یا خیر صورت گیرد؛ درنتیجه عملکرد پیشبینی درماندگی مالی نهتنها با الگوها و روشهایی تعیین میشود که برای پیشبینی بهکار میبرند، براساس بهکارگیری اطلاعات موجود نیز ارزیابی میشود. مطالعات پیشین دربارۀ پیشبینی درماندگی مالی بهطور عمده از متغیرهای مالی موجود در صورتهای مالی بهصورت متغیرهای توضیحی استفاده میکردند؛ به همین دلیل برخی از اطلاعات مفید دیگر بالقوه لحاظ نمیشد. ازجمله این اطلاعات نادیده گرفته شده به اطلاعات موجود در شبکۀ مالی[1] اشاره میشود که استفادهنکردن از آن در پیشبینی درماندگی مالی، یکی از شکافهای اصلی موجود در اصول موضوع پژوهش است. شرکتهای پذیرفتهشده در بورس اوراق بهادار بهعنوان یک «شبکۀ مالی پیچیده[2]» در نظر گرفته میشوند که شرکتها درجایگاه گرهها و همبستگی میان بازده سهام آنها بهصورت روابط میان آنها در نظر گرفته شود. مانتگنا در سال (1999) در ارائۀ بازار مالی بهصورت شبکه پیشقدم شد (Mantegna, 1999)؛ برای مثال ارتباط بین دو شرکت با بازده سهامشان و ازطریق محاسبۀ ضریب همبستگی میان سریهای زمانیشان مرتبط میشوند. درک بازار مالی بهصورت یک شبکۀ پیچیده این امکان را فراهم میسازد تا سازمان و فرایند تکامل شرکتهای پذیرفتهشده در بورس اوراق بهادار تجزیه و تحلیل شوند. علاوهبر این، از دیدگاه تحلیل شرکتها، سنجههای مبتنیبر شبکه مانند مرکزیت[3] تعداد ارتباطات یک شرکت و همینطور تعداد شرکتهای مرتبط با آن را اندازهگیری و پس از آن، نفوذ و مرکزیت یک شرکت در بازار مالی را نیز کشف میکند؛ بدینترتیب احتمال اینکه آن شرکت درمعرض درماندگی مالی قرار میگیرد، مشخص و با سنجههای مبتنیبر شبکه شناسایی میشود. با توجه به شکاف اشارهشده در اصول پیشبینی درماندگی مالی و برمبنای تحلیل شبکه، این پژوهش در تلاش است سنجههای مناسبی از شبکه را بهکار گیرد و با ترکیب آنها با متغیرهای مالی، با دقت بیشتری بنگاههای دارای درماندگی مالی و سلامت مالی را از یکدیگر متمایز سازد. همانطورکه اشاره شد در زمینۀ روشهای کمی پیشبینی درماندگی مالی در ابتدا روشهای آماری شامل تحلیل نسبت تکین (Beaver, 1968)، تحلیل تمایزی چندگانه (Altman, 1968) و رگرسیون لجستیک (Lau, 1987) استفاده شد. پس از آن روشهای دادهکاوی مانند شبکۀ عصبی (Chauhan et al., 2009; Chen & Du, 2009; Iturriaga & Sanz, 2015)، ماشین بردار پشتیبان (Chaudhuri & De, 2011; Hsieh et al., 2012; Chen & Hsiao, 2008) و درخت تصمیم Sun & Li, 2008; Chen et al., 2011)) نیز بهمنظور پیشبینی درماندگی استفاده شد. درمقایسه با جداسازهای تکین، از روشهای ترکیبی[4] این انتظار میرود که واریانس خطای تخمین را کاهش دهند و بهطورکلی عملکرد شناسایی را بهبود بخشند. بنابراین در سالهای اخیر، پیشبینی درماندگی مالی براساس روشهای ترکیبی روند فزایندهای در این زمینه داشته است (Zhang & Haghani, 2015; Zheng et al., 2008; Guelman, 2012).
روش درخت تصمیم تقویت گرادیان[5]یک روش ترکیبی وگونهای از روشهای بوستینگ است. GBDT بهطور هدفمند درختهای جدیدی برای کمینهکردن تابع هزینه که با الگوهای ساختهشدۀ قبلی شکل گرفته است، اضافه میکند. روش GBDT سودمندیاش را در برخی حوزهها مانند پیشبینی زمان سفر، رتبهبندی شبکهها و الگوسازی زیان بیمهها اثبات کرده است؛ بنابراین GBDT توانایی پیشبینی بالقوهای نسبتبه روشهای دیگر ترکیبی برای پیشبینی درماندگی مالی دارد. باید ذکر کرد کارامدی روش GBDT در پیشبینی درماندگی مالی به بهینهسازی شاخصهای آن بستگی دارد (Friedman, 2001). بهینهساز گرگ خاکستری (Mirjalili et al., 2014) بهصورت یک عضو جدید الگوریتمهای الهامگرفته از طبیعت، سلسلهمراتب اجتماعی و رفتارهای شکارکردن گرگهای خاکستری را تقلید میکند. مشخصههای اصلی بهینهساز گرگ خاکستری شامل سلسلهمراتب اجتماعی، محاصرۀ طعمه، شکارکردن، حملهکردن به طعمه (بهرهبرداری[6]) و جستوجوی طعمه (کشف)[7] است. بهدلیل توانایی خوب بهینهساز گرگ خاکستری در جستوجو، از این بهینهساز در حوزههای مختلفی استفاده شده است. موآنگ کوت و همکاران از بهینهساز گرگ خاکستری همراه اصلاحاتی که در آن انجام دادند، برای آموزش شبکههای عصبی شبکههای تابع - پیوندی پایه شعاعی گاوسی-q[8] استفاده کردند. نتایج آزمایش نشان داد الگوریتم پیشنهادی، عملکرد بهتری از روشهای دیگر فراابتکاری داشت (Muangkote et al., 2014). کمکی و کیوانفر با موفقیت از بهینهساز گرگ خاکستری برای مسئلۀ اصلی دو مرحلهای برنامهریزی جریان کار فروشگاه همراه زمان فروش محصولات استفاده کردند تا بهرهوری را بهطور درخور ملاحظهای بهبود بخشند (Komaki & Kayvanfar, 2015). سلیمان و همکاران از بهینهساز گرگ خاکستری استفاده کردند تا مسئلۀ توزیع بهینه توان واکنش[9] را حل کنند (Sulaiman et al., 2015). باوجود کاربردهای مختلف الگوریتم گرگ خاکستری در حوزههای مختلف و عملکرد مقبول آن باید خاطرنشان کرد این الگوریتم کاستیهایی دارد که در بخش روش پژوهش بهتفصیل به آن اشاره شده است. بر اساس همین در این پژوهش از نسخۀ بهبودیافته آن استفاده شده است. همچنین تاجاییکه بررسی شده است و مطالعات نشان میدهد، شایستگی این الگوریتم برای تنظیم بهینه شاخصهای موجود در روش درخت تصمیم تقویت گرادیان آزمایش نشده که خود این موضوع یکی از شکافهای موجود در اصول موضوع پژوهش است؛ بنابراین این پژوهش چند هدف را دنبال میکند: ازجمله اینکه عملکرد الگوی درخت تصمیم تقویت گرادیان را که شاخصهایش با الگوریتم گرگ خاکستری بهبودیافته، بهینه شده است، در ترکیب با متغیرهای مبتنی بر شبکۀ مالی که شکاف دیگری در اصول موضوع پژوهش به حساب میآید، برای پیشبینی درماندگی مالی بررسی میکند؛ نتایج آن را نیز با دو الگوی پرکاربرد و جدید در این حوزه یعنی رگرسیون لجستیک که بهدلیل استفادۀ زیاد آن در این حوزه انتخاب شده و k نزدیکترین همسایه که یکی از جدیدترین روشها در این حوزه است، با توجه به معیارهایی مانند دقت، سطح زیر منحنی ROC، خطای نوع اول و دوم و G-mean مقایسه میکند؛ در پایان بررسی میکند آیا افزودن متغیرهای شبکۀ مالی عملکرد الگوهای پیشبینی درماندگی مالی را بهبود میبخشد یا خیر؟
با ارزیابی و بررسی اصول موضوع مشخص شد چندین بحث در این حوزه به مطالعات بیشتری نیازمند است که در ادامه به آنها اشاره شده است:
۱) بیشتر مطالعات این حوزه تنها متغیرهای مالی سنتی یا متغیرهای بازار را بهصورت ورودی الگو برای پیشبینی درماندگی مالی در نظر گرفتند. برخی از متغیرهای مبتنیبر شبکههای مالی و تأثیرشان در پیشبینی درماندگی مالی بررسی نشده است. براساس دیدگاه لیو و همکاران ازآنجاکه بازده سهام بهطور همزمان انواع مختلفی از ارتباط را در میان شرکتها بیان کرده، بهروزترین اطلاعات در بازار را نیز منتقل میکند، بنابراین با لحاظنکردن اثر اطلاعات شبکۀ مالی، اطلاعات پیشبینیکنندۀ مهم و مؤثری از دست خواهد رفت
(Liu et al., 2019). اینکه آیا متغیرهای مبتنی بر شبکه عملکرد پیشبینی را بهبود میبخشد یا خیر یک پرسش جدید است که بررسی نشده است.
2) براساس یافتههای پژوهش آلاکا و همکاران بخش زیادی از مطالعات در این حوزه از روشهای آماری یا دادهکاوی مانند تحلیل تمایزی چندگانه، لاجیت، شبکۀ عصبی و ماشین بردار پشتیبان بهصورت الگوی طبقهبندی برای پیشبینی درماندگی مالی استفاده کردهاند (Alaka et al., 2018). بااینحال توانایی بالقوۀ الگوهای ترکیبی مانند درخت تصمیم تقویتی برای پیشبینی درماندگی مالی کمتر مطالعه شده است. علاوه بر این با استفاده از بهینهساز گرگ خاکستری بهبودیافته نیز شاخصهای الگوی درخت تصمیم تقویتی بهینه میشود که این نیز یک تلاش بهنسبت جدید است.
۳) الگوی شبکۀ مالی، بهینهساز گرگ خاکستری و درخت تصمیم برای پیشبینی درماندگی مالی براساس مجموعه دادههای شرکتهای پذیرفتهشده در بورس و فرابورس ایران یک کار جدید است و پیشبینی عملکرد الگوی پیشنهادی را اعتبار میبخشد.
4) بهیقین بیشتر پژوهشهای انجامشده درخصوص پیشبینی درماندگی مالی، برای اینکه در انتخاب نهایی نمونه، بین تعداد شرکتهای درمانده و سالم تناسب ایجاد کنند، از روش حذف استفاده کردهاند (برای مثال Liu et al., 2019; Aydin et al., 2022) و بدینترتیب بسیاری از اطلاعات واقعی را نادیده گرفتهاند. این اقدام برای ایجاد نسبت برابر و یا نسبتهای سه به یک و یا کمی بیشتر میان شرکتهای سالم و درمانده صورت گرفته است. درصورتیکه یکی از اهداف این پژوهش آن است که ابزاری شناسایی کند که بدون نیاز به حذف اطلاعات و حتی باوجود نسبتهای بسیار متفاوت میان شرکتهای سالم و درمانده، با دقت زیاد و خطای کم پیشبینی انجام دهد.
براساس ضرورتهایی که به آن اشاره شد، این پژوهش بهدنبال آن است تا عملکرد الگوی درخت تصمیم تقویت گرادیان را که شاخصهایش با الگوریتم گرگ خاکستری بهبودیافته بهینه شده است، در پیوند با متغیرهای مبتنیبر شبکۀ مالی برای پیشبینی درماندگی مالی بررسی کند. نتایج آن را نیز با برخی الگوهای پرکاربرد در حوزۀ پیشبینی درماندگی مالی[10] و با توجه به معیارهای مختلف مقایسه کند. درپایان بررسی کند آیا افزودن متغیرهای شبکۀ مالی عملکرد الگوهای پیشینی درماندگی مالی را بهبود میبخشد یا خیر؟
برای تحقق اهداف پژوهش و رسیدن به نتایج نهایی، سؤالات پژوهش به شرح زیر مطرح شده است تا با پاسخ به آنها پژوهش در مسیر درست هدایت شود.
1) آیا الگوی ترکیبی IGWO – GBDT برای پیشبینی درماندگی مالی در مقایسه با الگوهای پرکاربرد منتخب (LR, KNN) عملکرد بهتری دارد؟
2) آیا استفاده از متغیرهای شبکۀ مالی (FNI) عملکرد الگوی ترکیبی IGWO – GBDT را برای پیشبینی درماندگی مالی بهبود میبخشد؟
3) آیا استفاده از متغیرهای شبکۀ مالی (FNI) عملکرد الگوهای پرکاربرد منتخب (LR, KNN) را برای پیشبینی درماندگی مالی بهبود میبخشد؟
ساختار مقاله: درادامه مبانی نظری و تشریح مفاهیم اصلی پژوهش بیان شده است. پس از آن پیشینۀ تجربی و پژوهشهای داخلی و خارجی بررسی شده است. سپس روش پژوهش و یافتههای حاصل از آن بهتفصیل بیان شده و درپایان نیز نتیجهگیری و پیشنهادات کاربردی و پژوهشی و منابع مقاله ذکر شده است.
مبانی نظری
شبکههای پیچیده ابزارهای توانمندی برای نشاندادن و مطالعۀ تعامل میان پدیدهها در دنیای واقعی هستند. شناسایی و استخراج گرههای اثرگذار در شبکههای پیچیده تبدیلبه یک حوزۀ پژوهشی مهم شده است؛ زیرا اثرات گستردهای در ابعاد مختلف دارند. مبانی نظری شبکههای پیچیده در زمینههای مختلفی شامل علوم طبیعی، اقتصاد، علم مدیریت، علوم زیستشناسی و علوم کامپیوتر مورد توجه شایانی قرارگرفته است؛ بنابراین طراحی روشهای سریع و اثربخش جهت شناسایی گرههای اثرگذار در شبکه پیچیده یک اولویت حیاتی است (Sheng et al., 2019). همانطورکه در مقدمه نیز اشاره شد، شرکتهای پذیرفتهشده در بورس اوراق بهادار بهصورت یک شبکۀ مالی پیچیده[11] درنظر گرفته میشوند که شرکتها درجایگاه گرهها و همبستگی میان بازده سهام آنها درجایگاه روابط میان آنها هستند. مانتگنا در سال 1999 در ارائۀ بازار مالی بهصورت شبکه پیشقدم شد (Mantegna, 1999). برای مثال ارتباط بین دو شرکت با بازده سهامشان و ازطریق محاسبۀ ضریب همبستگی میان سریهای زمانیشان مرتبط میشوند. درک بازار مالی بهصورت یک شبکه پیچیده اجازه میدهد سازمان و فرایند تکامل شرکتهای پذیرفتهشده در بورس اوراق بهادار تجزیه و تحلیل شوند. شبکههای بازار مالی با درنظرگرفتن رویکردی مبتنیبر ماتریسهای همبستگی ساخته شدهاند. این روش ضرایب همبستگی میان سریهای زمانی دو سهم i و j را در نظر گرفته است که با رابطۀ زیر محاسبه میشوند (Liu et al., 2019):
رابطۀ (1) |
|
رابطۀ (2) |
|
در این رابطه بازده سهم i است که ازطریق رابطۀ (2) به دست آمده و قیمت پایانی سهام i در روز t است. فاصله میان دو سهم i و j با رابطۀ (3) محاسبه میشود. این یک معیار واقعی است که از ۳ قاعدۀ کلی فاصله پیروی میکند. درصورتیکه ضریب همبستگی میان بازده سهام دو شرکت مستقیم و کامل باشد، آنگاه فاصله میان آنها صفر خواهد شد؛ اما اگر همبستگی معکوس و کامل باشد، آنگاه فاصله بیشینه و برابر 2 میشود (Comin et.al, 2020).
رابطۀ (3) |
|
در رابطۀ (3)، اگرd (i, j) = 0 و فقط اگر i = jو d (i, j) = d (j, i) و d (i, j) ≤ d (i, k) + d (k, j). ارتباط میان دو بنگاه با شباهت یا تضاد میان رفتار بازده سهامشان در طول زمان منعکس میشود. مسافتهای میان N بنگاه با یک ماتریس مسافت متقارن N*N ارائه میشود که آن را «D» مینامیم. ازطریق ماتریس مسافت، ماتریس موزون w ایجاد شده است که برای نشاندادن توپولوژی شبکۀ پیچیده بهکار میرود. سهم i و سهم j ازطریق یک لینک با وزن به یکدیگر مرتبط هستند؛ بنابراین قویترین لینکها، سهام با بیشترین مشابهت سریهای زمانی را به یکدیگر مرتبط میکنند (Liu et al., 2019).
رابطۀ (4) |
|
در این پژوهش علاوهبر 9 نسبت مالی، از متغیرهای مبتنیبر شبکه نیز بهصورت پیشبینی کنندههای درماندگی مالی استفاده میشود. براساس کارهای ابتدایی در نظریه اقتصادی و اجتماعی، این پژوهش از چهار معیار مرکزیت شبکه، شامل مرکزیت درجه، مرکزیت بینابینی، مرکزیت نزدیکی و مرکزیت بردار ویژه براساس پژوهش منتشری و صادقی (1399) و پژوهش لیو و همکاران بهره میبرد (Liu et al., 2019). براساس دیدگاه شنگ و همکاران این معیارهای مرکزیت بهتنهایی تمام ویژگیهای شبکه را اندازهگیری نمیکنند و باید باهم بهکار روند (Sheng et al., 2019).
یکی از گستردهترین معیارهای مرکزیت، درجه مرکزیت است که بهصورت تعداد روابط مستقیمی که یک گره معین را دربرمیگیرد، تعریف میشود. میزان درجه درجایگاه خطر فوری یک گره برای گرفتن هرچه در جریان شبکه وجود دارد (مانند اطلاعات)، تفسیر می شود. در تحلیل شبکههای موزون، درجۀ مرکزیت به طور کلی به میزان مجموعه اوزان گسترده میشود. این معیار بهصورت زیر رابطهبندی میشود (Montasheri and Sadeghi, 2020؛ Liu et.al., 2019):
|
رابطه (5) |
در این رابطه w ماتریس مجاورت وزنی است که در آن مقدار وزن مسیر بین گره i و گرهj است. براساس درجۀ مرکزیت، گرههای اصلی در بازار مالی، شناسایی و پرارتباطترین و جانبیترین (حاشیهترین) شرکتها در بازار مالی شناخته میشوند.
یک معیار متداول بهمنظور اندازهگیری نفوذ یک گره در شبکه، مرکزیت بردار ویژه است. این معیار، امتیازهای نسبی تمام گرهها در شبکه و ارتباط گرهها با گرههای با امتیاز زیاد را نشان میدهد که در شبکه بیشترین تأثیر را داشتهاند. برای یک شبکۀ معین G := (V,E) با تعداد گرههای مشخص. A = ( ماتریس مجاورتی است؛ جاییکه اگر گره i با گره j ارتباط داشته باشد و در غیر این صورت است. مرکزیت نسبی گره بهصورت زیر تعریف میشود (Montasheri and Sadeghi, 2020؛ Liu et.al., 2019):
رابطۀ (6) |
|
در اینجا M(i) یک مجموعه از همسایههای i و λ یک مقدار ثابت است. با یک بازآرایی مختصر آن رابطه بهصورت معادلۀ بردار ویژه بازنویسی میشود.
رابطۀ (7) |
|
در کل، مقادیر ویژه بسیار متفاوتی وجود خواهد داشت و برای هر مقدار ویژه غیرصفر راه حل وجود دارد. الزامات بیشتری است که تمام ارزشها در مقادیر ویژه باید نامنفی باشد تا تنها بیشترین مقادیر ویژه به اندازهگیری مرکزیت دلخواه منجر شود. با دنبالکردن شیوۀ بالا اندازهگیری میکنند چگونه یک شرکت در شبکۀ مالی پیچیده و بههم مرتبط جای گرفته است. هرچه مرکزیت بردار ویژه بیشتر باشد، شرکت در شبکه در جایگاه مرکزیتری قرار گرفته است. تعامل بین دو گره غیر مجاور به گرههایی که در مسیر بین دو گره قرار گرفته اند، بستگی دارد. قرارگیری بینابینی گرهها بهطور بالقوه کنترل روی تعاملات میان دو گره غیر مجاور را بهدنبال خواهد داشت. بینابینی براساس مفهوم مسیرهای شبکه ایجاد شده است. نیومن در سال 2007 یک مسیر در یک شبکه را بهصورت پیامد پیمودن گرهها با دنبالکردن ارتباطات از یک گره به گره دیگر در طی شبکه تعریف میکند. یک مسیر، کوتاهترین مسیر در شبکه از یک گره به گره دیگر است (کوتاهترین خط ترسیمشده بین دو نقطه). بینابینی یک گره با نسبتی ازکوتاهترین مسیرها بین جفت گرههایی که از این گره عبور کردند، محاسبه میشود. فریمن شاخص مرکزیت بینابینی را ازنظر ریاضی بهصورت زیر تعریف کرده است (Freeman, 1977):
رابطۀ (8) |
|
در این رابطه کل تعداد کوتاهترین مسیرها از گره j به گره l و تعداد کوتاهترین مسیرهایی است که ازطریق گره j عبور کردهاند. مرکزیت بینابینی براساس این مفهوم ساخته شده است که یک گره مرکزی محسوب میشود، اگر نیاز باشد با جفت گرههای دیگر مرتبط باشد. شرکت با مرکزیت بینابینی زیاد تأثیر مهمی بر شرکتهای دیگر دارد؛ زیرا اطلاعاتی را که از آن عبور میکند، متوقف یا تحریف میکند.
مرکزیت نزدیکی نشان میدهد یک گره تا چه اندازه به سایر گرهها نزدیک است؛ به عبارت دیگر، تعداد گامهایی که طول میکشد از یک گره خاص به گره دیگری در شبکه رسید. هرچه مقدار مرکزیت نزدیکی یک گره بیشتر باشد، انتشار اطلاعات از این گره به گرههای دیگر سریعتر خواهد بود. مقدار مرکزیت نزدیکی بیشتر برای یک گره به این معناست که آن گره در کوتاهترین فاصلۀ ممکن برای اتصال به گرههای دیگر قرار گرفته است و بنابراین از قابلیت دسترسی خوبی در شبکه بهره میبرد. برای اندازهگیری مرکزیت نزدیکی از رابطۀ زیر استفاده میشود که در این رابطه کوتاهترین فاصله میان گره i و j است. اگر گره i به طور مستقیم به تمام گرهها وصل باشد، این معیار برابر با 1 خواهد شد (Comin et.al, 2020).
رابطه (9) |
|
بهینهساز گرگ خاکستری، یک الگوریتم فراابتکاری موفق مبتنیبر جمعیت است که برمبنای زندگی اجتماعی گرگها طراحی شده است (Zhou et al., 2014). این سبک زندگی به طور معمول به سلسله مراتب رهبری وابسته است و رفتارهای مشارکتی شکار در واقع اصلیترین عامل الهامبخش این الگوریتم الهامگرفته از طبیعت است (Heidari & Aliabbaspour, 2016). در نسخۀ اصلی بهینهساز گرگ خاکستری، هر گروه یک چینش سلسلهمراتبی دارد و هرکدام از اعضای گروه باید وظیفهای درجایگاه یک عضو گروه داشته باشند (Niu et al., 2016). برای شکارکردن، رهبر یا رهبران خاصی که اعضای رده بالا هستند، هر گرگ را هدایت میکنند. رتبهبندی گرگها برمبنای توانایی ذهنیشان مانند هوشیاری و سرپرستی انجام میشود، نه بر مبنای قابلیتهای جسمانی؛ بنابراین سه گرگی که شناخت بهتری از مکان احتمالی طعمه دارند، بهترتیب با عناوین «آلفا، بتا و دلتا» شناخته میشوند و اعضای دیگر را هدایت میکنند. مراحل شکار شامل محاصره و حملهکردن به طعمه است. سپس هر گرگ باید مکان کنونی خود را با توجه به موقعیت رهبران در تمام مراحل شکار تغییر دهد. همانند بهینهسازهای دیگر الهامگرفته از طبیعت، در مرحلۀ اول بهینهساز گرگ خاکستری برخی از جوابهای احتمالی بهصورت تصادفی در چشم انداز فضایی جستوجو پراکنده میشوند. در تمام تکرارها، سه جواب برتر با عناوین «آلفا، بتا و دلتا» شناخته میشوند. این عاملهای رهبر طراحی شدهاند تا عوامل دیگر را در جهت شناخت مکانهای بهتر در فضای هدف هدایت کنند. بقیۀ جوابها را «امگا» مینامند. این گرگها تلاش میکنند مکانهای خود را با توجه به قانون زیر تغییر دهند.
رابطۀ (10) |
|
رابطۀ (11) |
|
جاییکه t عدد تکرار است و شاخصی است که از دو به صفر کاهش مییابد. XP و X بهترتیب مکانهای طعمه و گرگها و r1 و r2 مقادیر تصادفی در [0,1] هستند. برای اینکه به شناخت روشنی از اثرات معادلات اشارهشده برسیم، بردار موقعیت عاملهای جستجو و مجموعهای از همسایگانشان در شکل (1) نشان داده شده است. این طرحها نشان میدهد گرگها به موقعیتهای گوناگون نزدیک طعمه با تغییردادن مقادیر بردارهای A و C میرسند. علاوه بر این، بردارهای تصادفی r1 و r2 در طول دوره تکرار بهروزرسانی میشوند تا به گرگ کمک کند به هر نقطه در میان نقاط ترسیمشده در شکل(1) برسد.
شکل (1) جایگاههای شکارچیان نزدیک طعمه (Heidari & Aliabbaspour, 2016)
Figure (1) The positions of the hunters near the prey (Heidari & Aliabbaspour, 2016)
گرگهای امگا رهبرانشان را بهصورت زیر دنبال میکنند:
رابطه (12) |
|
|
|
رابطه (13) |
|
|
|
رابطه (14) |
|
|
|
جاییکه Xα Xδ , Xβ بهترتیب موقعیتهای آلفا، بتا و دلتا هستند. C3, C2 ,C1 سه برداری هستند که بهصورت تصادفی ایجاد شدهاند و X (t) جواب کنونی است. بردار حرکت سهبعدی شکارچیان در شکل (2) نشان داده شده است.
شکل (2) بردار حرکت سهبعدی گرگها (Heidari & Aliabbaspour, 2016)
Figure (2) 3D motion vector of wolves (Heidari & Aliabbaspour, 2016)
همانطورکه میرجلیلی و همکاران و حیدری و پهلوانی بیان کردند، دو شاخص A وC به رویکرد بهینۀ گرگ خاکستری کمک میکند تا چشمانداز مسئله را کشف و بهرهبرداری کند (Mirjalili et al., 2014; Heidari & Pahlavani, 2017). با کاهش A، ۵۰ درصد فرآیند بهینهسازی به کشف و ۵۰ درصد به بهرهبرداری اختصاص مییابد. با وجود این، زمانیکه ǀAǀ > 1 باشد، بهینهساز گرگ خاکستری کشف میکند و زمانی که ǀAǀ<1 باشد، فضای عینی را بهره برداری میکند. بردار C در مقایسه با A موقتی نیست و وزندهیهای تصادفی انتخابشده را در [1و0] دارد. این بردار به بهینهساز گرگ خاکستری کمک میکند تا رفتارهای تصادفی سازی شدۀ بیشتری را در سراسر جستوجو نشان دهد و برای مشکل توقف در بهینۀ محلی مفید است. کارآمدی بهینهساز گرگ خاکستری در مواجهه با شرایط مختلف ثابت شده است. با وجود این، حیدری و علی عباسپور بیان کردهاند بهینهساز ابتدایی گرگ خاکستری ممکن است در زمانی که با برخی از موقیعتهای پیچیدۀ دنیای واقعی مواجه میشود، در تلۀ بهینۀ محلی گیر بیفتد. این نقطهضعف بهدلیل اکتشافنکردن گسترده در مقابله با برخی از چشماندازهای برازش تقریبی است؛ بنابراین اشکال اول دربارۀ ضریب همگرایی بود که در الگوریتم پایه با نام متغیر a شناخته میشود. اشکال دوم دربارۀ شیوۀ راهکار تعیین موقعیت جدید یک گرگ است که بهصورت میانگین حرکت سه گرگ آلفا، بتا و دلتا تعیین میشود. از منظر الهامگرفتن از طبیعت، مشاهده میشود برخی از گرگهایی که در یک شکار مشارکتی واقعی شرکت میکنند، نهتنها موقعیت شکارچیان پیشگام را درنظر میگیرند، به احساسات، رفتارها و تغییر تصادفی در آرایش و چینش گرگهای دیگر نیز واکنش نشان میدهند. پس برای بهبود الگوریتم گرگ خاکستری دو اصلاح در این الگوریتم ضروری است: اول تغییر ضریب همگرایی و دوم تغییر در معادلۀ محاسبۀ جدید موقعیت هر گرگ. با وجود این، این نسخۀ جدید باید مزایای نسخۀ ابتدایی بهینهساز گرگ خاکستری را نیز داشته باشد. ضریب همگرایی a در الگوریتم GWO بهصورت خطی از 2 تا 0 متغیر است. در این پژوهش و در الگوریتم گرگ خاکستری بهبودیافته[12]، معادله ضریب همگرایی بهترتیب زیر برای تعادل بهتر بین اکتشاف و بهره برداری تغییر یافته است (Heidari & Aliabbaspour, 2016)
رابطه (15) |
|
در معادلۀ بالا، عامل همگرایی a بهشکل یک تغییرنمایی توصیف شده است؛ همانطورکه در شکل 3 نشان داده شده است. در الگوریتم اصلی گرگ خاکستری، نیمی از تکرارها برای اکتشاف و نیمی دیگر به بهره برداری اختصاص داده شده است. با استفاده از ضریب همگرایی اصلاحشده، تعداد بیشتری از تکرارها برای اکتشاف استفاده میشود که برای جلوگیری از گیرافتادن در بهینههای محلی مفید است. با استفاده از این نوع ضریب همگرایی غیرخطی، درصد تکرارهای بهکاررفته برای اکتشاف و بهرهبرداری بهترتیب تقریباً 60 و40 درصد است.
شکل (3) تأثیر تغییر ضریب همگرایی در اکتشاف و استخراج (Heidari & Aliabbaspour, 2016)
Figure (3) The effect of changing the convergence coefficient in exploration and extraction
موقعیت جدید هر گرگ در الگوریتم پایه براساس موقعیت سه گرگ آلفا، بتا و دلتا مشخص میشود. رابطۀ 13 نشاندهندۀ موقعیت جدید گرگ آلفا، بتا و دلتا است. موقعیت جدید یک گرگ امگا از میانگین موقعیت سه گرگ دیگر با توجه به رابطه 14 بهدست میآید. اشکال این معادله در نگاه یکسان به موقعیت سه گرگ اصلی یعنی آلفا، بتا و دلتا است؛ چراکه از میانگین موقعیت این سه گرگ موقعیت جدید گرگ امگا بهدست میآید، درحالیکه این نگرش به دور از موقعیت اجتماعی در گله گرگها است. در روش بهبودیافته، الگوریتم انتخاب موقعیت گرگ امگا براساس درصد برتری سه گرگ با توجه به هرم سلسلهمراتب اعمال میشود؛ یعنی موقعیت جدید گرگ امگا براساس یک وزن منطبقبر سلسله مراتب بهدست میآید که درصد بیشتری از گرگ آلفا و درصد کمتری از دو گرگ دیگر داشته باشد. به این ترتیب گرگ امگا درصدهای متفاوتی از سه گرگ با توجه به سلسله مراتبشان بهدست میآورد(Heidari & Aliabbaspour, 2016) . بر همین اساس گروه پژوهش برای شناسایی موقعیت جدید گرگ، رابطۀ (16) را پیشنهاد کردهاند:
رابطه (16) |
|
برای ارزیابی عملکرد بهینهسازی الگوریتم گرگ خاکستری بهبودیافته نیز از دو تابع تست[13] راست ریجین[14] و تابع قلمرو[15] استفاده شده است. در ریاضیات کاربردی توابع تست ابزارهای سودمندی هستند که برای ارزیابی ویژگیهایی مانند نرخ همگرایی[16]، دقت[17]، ثبات[18] و عملکرد کلی الگوریتمهای بهینهسازی استفاده میشوند.
تقویت گرادیان یک روش یادگیری ماشین برای مسائل رگرسیون و طبقهبندی است. الگوی تقویت گرادیان ترکیبی خطی از یکسری الگوهای ضعیف است که بهصورت تناوبی برای ایجاد یک الگوی نهایی قوی ساخته شده است. این روش به خانواده الگوریتمهای یادگیری گروهی تعلق دارد و عملکرد آن همواره از الگوریتمهای اساسی یا ضعیف مثل درخت تصمیم یا روشهای براساس کیسهگذاری مانند جنگل تصادفی بهتر است، اما درستی این گزاره تا حدی از مشخصات دادههای ورودی تأثیر میپذیرد. مانند روشهای دیگر تقویتی (بوستینگ)، تقویت گرادیان ترکیبی خطی از یکسری از الگوهای ضعیف برای ایجاد یک الگوی قوی و کارآمد است. تقویت گرادیان از روش ارتقا استفاده میکند؛ این روش از روش درخت تصمیم وامگرفته است. یادگیرندههای ضعیف موجود بعد از دریافت وزن بیشتر، به درخت بعدی منتقل میشوند تا پیشبینیهای هر درخت از درخت قبلی بهتر باشد. خروجی، میانگین پیشبینیهای نهایی است. الگوریتم تقویت گرادیان زمانی استفاده میشود که دادههای زیاد با پیشبینیهای زیاد داریم. تفاوت بین ارزش پیشبینیشده و ارزش واقعی با تابع زیان اندازهگیری میشود. درمجموع، روشهای بوستینگ برای نزدیکشدن به جواب از رویکرد الگوسازی مرحلهای پیشرو استفاده میکنند. الگوهای اساسی جدید بدون تغییر شاخصها یا ضرائب الگو به الگوی ترکیبی قبلی اضافه میشوند. این نوع از روش بوستینگ مکانیسم کاهش گرادیان را بهصورت هدف بهینهسازی الگو بهکار میبرد. در روش بوستینگ گرادیان، جداسازهای اساسی جدید بهمنظور کاهش گرادیان منفی تابع زیان، ساخته میشوند (Liu et al., 2019).
فریدمن با استفاده از یک درخت رگرسیون با اندازۀ ثابت بهصورت الگوی پایه یک، شکل اصلاحیافته از روش افزایش گرادیان را پیشنهاد کرد که روش «درخت تصمیم تقویت گرادیان» نامیده میشود (Friedman, 2001). نسخۀ اصلاحشده، کیفیت الگو را بهبود بخشید. در این پژوهش نسخۀ اصلاحشدۀ الگوی [19]GBMبرای پیشبینی درماندگی مالی استفاده میشود. با فرض اینکه تعداد برگهای هر درخت S است. هر درخت فضای ورودی را به S منطقه جداشده ، ، ... ، تقسیم میکند و یک مقدار ثابت را برای منطقه پیشبینی میکند. درخت رگرسیون بهصورت زیر بیان میشود (Liu et al., 2019):
رابطه (17)
در آن |
|
الگوی بهروزرسانی معادله و اندازۀ مرحله کاهش شیب بهصورت زیر نشان داده میشود:
|
رابطه (18) |
|
رابطه (19) |
با استفاده از یک درخت رگرسیون برای جایگزینی در روش تقویت گرادیان، دو معادلۀ قبلی به رابطه زیر تبدیل میشوند:
رابطه (20) |
|
رابطه (21) |
|
الگوی GBM بهطور راهبردی هر الگوی پایه را بهمنظور کاهش یک تابع زیان معین اضافه میکند. سه شاخص اصلی ارائهشده در GBDT عبارتند از: نرخ یادگیری J، عمق درخت D و تعداد درختان N. شاخص اول یعنی نرخ آموزش، سهم هر الگوی درخت را در الگوی ترکیبی تعیین میکند. به طور کلی، یک مبادله بین تعداد درختان و میزان یادگیری وجود دارد. مقدار کوچکتر J معمولاً نیاز دارد تعداد بیشتری درخت اضافه شود. دومین شاخص، عمق درخت، بیشترین عمق درخت را نشان میدهد. بهصورت یک قاعده کلی، مقدار بیشتر D به آموزش دانش بیشتر دربارۀ مسئله در یک مجموعه داده بزرگ کمک میکند، در غیر این صورت، مقدار کوچکتر D برای مجموعه داده کوچک ترجیح داده میشود. آخرین شاخص، N، تعداد درختانی است که به الگو اضافه میشود. در مقایسه با بیشتر رویکردهای هوش مصنوعی، GBM در مواقعی نظیر پیشبینی و الگوسازی هزینۀ زیان بیمه خودروها (Guelman, 2012)، پیشبینی بار (Taieb & Hyndman, 2014) و پیشبینی زمان سفر (Zhang & Haghani, 2015) به بهبود عملکرد در شناسایی الگو و برآورد رگرسیون منجر میشود (Liu et al., 2019).
پیشینۀ تجربی
در این بخش نتایج برخی از پژوهشهای مرتبط بهصورت اجمالی بررسی شده است. بیشتر مطالعات داخلی که با نگاه شبکههای پیچیده به بازار مالی ایران توجه کردهاند بیشتر در حوزههای گونهشناسی و توپولوژی بازار سهام (Montasheri and Sadeghi, 2021)، سنجش و مدیریت ریسک سیستماتیک و انتخاب پرتفوی سهام (Raei, et al., 2010؛ Fallahpiour and Ghahremani, 2021؛ Sedaghati, et al., 2021) بوده است.
علیبابایی و خان محمدی (1402) با هدف پیشبینی ورشکستگی شرکتها با استفاده از سازوکار حاکمیت شرکتی و نسبتهای مالی، دادههای شرکتهای فعال در بورس اوراق بهادار تهران را طی دوره ۸۶ تا ۹۵ تحلیل کردند. پژوهش آنها براساس الگوی بومیشدۀ کردستانی - تاتلی مبتنیبر الگوی آلتمن است. آنها با استفاده از سه الگوی شبکۀ عصبی، K نزدیکترین همسایه و الگوی ترکیبی الگوریتم ژنتیک و شبکۀ عصبی فرضیههای خود را بررسی کردند. نتایج آنها نشان داد اضافهشدن متغیرهای حاکمیت شرکتی به شاخصهای مالی باعث بهبود در نتایج پیشبینی ورشکستگی نشده است. الگوی ترکیبی شبکۀ عصبی و الگوریتم ژنتیک بیشترین دقت را در پیشبینی ورشکستگی داشتهاند. الگوی K نزدیکترین همسایه در تمام شاخصهای ارزیابی الگو نسبتبه رقبای خود عملکرد ضعیفتری داشته است.
رادووانوویچ و هاس با هدف ارزیابی الگوهای پیشبینی ورشکستگی براساس معیار هزینههای اقتصادی و اجتماعی پژوهش خود را انجام دادند. دادههای آنها واقعی و از پایگاه کامپوستت بوده که دربرگیرندۀ شرکتهای پذیرفتهشده در بورس آمریکای شمالی طی سالهای ۱۹۸۵ تا ۲۰۲۰ و درمجموع ۱۹۰ هزار سال شرکت است. آنها الگوهای مبتنیبر یادگیری ماشین را با الگوهای پرکاربرد آماری مقایسه کردند. نتایج نشان داد الگوهای یادگیری ماشین شامل درخت تصمیم تقویتی و دستهبندی، جنگل تصادفی، شبکۀ عصبی و ماشین بردار پشتیبان در مقایسه با الگوهای رگرسیون لجستیک و تحلیل تفکیکی خطی، عملکرد بهتری داشتهاند (Radovanovic & Haas, 2023).
آیدین و همکاران شرکتهای فعال در بخشهای تولید، خدمات و بازرگانی را در بورس استانبول طی سالهای ۲۰۱۵ تا ۲۰۱۷ طبقهبندی کردند. آنها با استفاده از دو روش شبکۀ عصبی مصنوعی و درخت تصمیم و ارائۀ الگوهای جداگانه برای هر بخش و با استفاده از ۲۵ نسبت مالی و ۲ متغیر غیر مالی فرضیههای خود را بررسی کردند. نتایج آنها نشاندهندۀ سرعت پردازش زیادتر و دقت بیشتر روش شبکۀ عصبی مصنوعی در مقایسه با روش درخت تصمیم است. الگوی شبکۀ عصبی مصنوعی با خطای نزدیک به صفر، شرکتهای ورشکسته و غیرورشکسته را از یکدیگر تفکیک کرد (Aydin et al., 2022).
علیبابایی و خانمحمدی با هدف بررسی قدرت پیشبینیکنندگی الگوریتمهای فراابتکاری برای پیشبینی ورشکستگی،
۶ الگوریتم فراابتکاری را شامل الگوریتم گرانشی، گرگ خاکستری، ژنتیک، رقابت استعماری، نهنگ و تکامل تدریجی باهم مقایسه کردند. آنها با ترکیب این الگوریتمها با شبکۀ عصبی مصنوعی و استفاده از نسبتهای نقدشوندگی، سودآوری و ساختار سرمایه، نشان دادند بهجز الگوی گرانش، تقریباً تمام الگوها، عملکرد مشابهی با یکدیگر داشتهاند. البته عملکرد الگوی الگوریتم ژنتیک کمی از بقیۀ الگوها بهتر بوده و دقتی حدود ۸۶ درصد داشته است (Alibabaee & Khanmohammadi, 2022).
علی اکبرلو و همکاران (1399) در پژوهشی با عنوان «مقایسۀ معیارهای تشخیص شرکتهای درمانده مالی با استفاده از رگرسیون لجستیک و هوشمصنوعی» با تحلیل دادههایی بین سالهای 2005 تا 2017 به این نتیجه دست یافتند که معیار آسکویت و همکاران (Asquith et al., 1994) در مقایسه با سه معیار ماده 141 قانون تجارت، الگوی آلتمن 1995 و الگو آلتمن 1968 (Altman, 1968; Altman et al., 1995) میانگین پیشبینی صحیحتری را ارائه میدهد.
قلیزاده و همکاران (1398) با استفاده از الگوی یادگیری ماشین سریع مبتنیبر کرنل بهینهشده با الگوریتم گرگ خاکستری، ورشکستگی ۱۳۶ شرکت بورسی را در بازۀ زمانی 2015 تا 2019 پیشبینی کردند. آنها ضمن مقایسۀ عملکرد الگوشان با الگوریتم ژنتیک به این نتیجه رسیدند الگوریتم گرگ خاکستری در تمام معیارهای ارزیابی مانند دقت، خطاهای نوع اول و دوم و ناحیۀ زیر منحنی ROC، کارایی بهتری دارد.
ناظمی و همکاران (1397) در پژوهشی بهدنبال تبیین الگویی بودند که ورشکستگی صنایع خودرو و قطعات، محصولات شیمیایی و محصولات غذایی بهجز قند و شکر را بهخوبی پیشبینی کند. بر اساس همین با استفاده از الگوی درخت تصمیم و بهکمک معیار ماده 141 قانون تجارت برای پیشبینی ورشکستگی و تحلیل دادههایی بین سالهای 2000 تا 2012 برای هر صنعت الگویی طراحی کردند که بهترتیب با دقت 95/95، 83/96 و 83/97 درصد، ورشکستگی شرکتهای صنایع ذکرشده را پیشبینی کرد. نتایج سایر پژوهشهای داخلی و خارجی که بررسی شده، در جدول شمارۀ (1) ارائه شده است.
جدول (1) نتایج برخی از پژوهشهای داخلی و خارجی بررسیشده
Table (1) The results of some internal and external researches have been reviewed
پژوهشگران (سال) |
موضوع |
الگو/ متغیرهای اصلی |
جامعه آماری و نمونه |
روش گردآوری و تحلیل داده |
یافتههای پژوهش |
پیشیینی درماندگی مالی با استفاده از شبکه عصبی پیش خوراند ترکیبی و الگوریتم جستوجوی فاخته |
اطلاعات مختلفی شامل متغیرهای مالی، سیاسی و اقتصاد کلان |
دادههای بنگاههای تولیدی کشور لهستان و بازارهای نوظهور |
شبکه عصبی پیشخوراند، الگوریتم جستوجوی فاخته، شبکه عصبی پس انتشار و رگرسیون لجستیک |
الگوی شبکه عصبی پیشخوراند جستوجوی فاخته با دقت 3/90 درصد، درحالیکه الگوهای شبکه عصبی پس از انتشار و رگرسیون لجستیک در یکسال قبل از ورشکستگی دقت 33/88 و 15/82 درصدی داشتهاند. در سه سال قبل از ورشکستگی نیز دقت الگوی فاخته از دو الگوی دیگر بالاتر بود. |
|
گونهشناسی شبکههای مالی براساس ویژگیهای مکان شناختی آنها |
بازده قیمتی لگاریتمی/ درجه مرکزیت |
اطلاعات مالی مربوطبه 100 شرکت برتر (2009-2019) |
نظریۀ گراف و الگوریتم پریم و ماتریس همبستگی |
سهام مخابرات ایران و بانک آینده براساس معیار درجه مرکزیت بیشترین تأثیر را بر شبکۀ مالی و بازار سهام دارند. |
|
پیشبینی ورشکستگی شرکتها مبتنیبر سیستمهای هوشمند ترکیبی |
نسبتهای مالی شامل سود انباشته به کل دارایی، سود عملیاتی به کل دارایی، سود خالص به کل دارایی، کل بدهی به حقوق صاحبان سهام، کل دارایی به حقوق صاحبان سهام، نسبت بدهی، بازده حقوق صاحبان سهام |
شرکتهایی از صنایع غذایی و نساجی در دوره زمانی 2010-2012 |
شبکه عصبی، ماشین بردار پشتیبان و یادگیری تشدیدشده[20]در کنار الگوریتمهای رقابت استعماری، الگوریتم فرهنگی و جستوجوی هارمونی |
برتری عملکرد ترکیب ماشین بردار پشتیبان با الگوریتمهای بهینهسازی جستوجوی هارمونی[21] و رقابت استعماری[22] در شرایط حذفنشدن دادههای پرت |
|
کاربرد روش ترکیبی بردار پشتیبان و روش انتخاب ویژگی پیشرو در پیشبینی درماندگی مالی |
29 نسبت مالی |
180 شرکت تولیدی بورسی درسالهای 1996 تا 2012 |
روش ترکیبی ماشین بردار پشتیبان و روش انتخاب ویژگی پیشرو و رگرسیون لجستیک |
نتایج نشان داد روش ترکیبی ماشین بردار پشتیبان و روش انتخاب ویژگی پیدرپی پیشرو شناور از عملکرد بهتری نسبتبه الگوی رگرسیون لجستیک برخوردار است. |
|
بهبود پیشبینی درماندگی مالی با استفاده از اطلاعات شبکۀ مالی |
3 معیار شبکۀ مالی و 16 متغیر مالی |
دادههای شرکتهای بورس چین |
الگوریتم ژنتیک و درخت تصمیم |
استفاده از متغیرهای شبکۀ مالی در الگوهای پیشبینی ورشکستگی عملکرد الگوها را بهبود میبخشد. |
|
ارزیابی سیستماتیک الگوهای پیشبینی ورشکستگی |
مقایسه عملکرد 8 الگوی اصلی پرکاربرد در اصول موضوع |
مقالات49 ژورنال علمی بین سالهای 2010 تا 2015 |
روش سیستماتیک و فراتحلیل |
هیچ ابزاری بهتنهایی تمام معیارهای لازم را برای پیشبینی ورشکستگی ندارد. ارائۀچارچوبی برای انتخاب ابزار براساس اولویتهای پژوهش |
|
بهکارگیری روش انتخاب ویژگی هارک در پیشبینی درماندگی مالی شرکتها |
نسبتهای مالی |
شرکتهای تولیدی بورسی در بازه 2001 تا 2011 |
روش هارک، روش رگرسیون لجستیک و الگوی آلتمن |
روش پیشنهادی هارک در یک و دو سال پیش از وقوع درماندگی مالی نسبتبه رگرسیون لجستیک و الگوی آلتمن از عملکرد بهتری برخوردار است. |
باید خاطرنشان کرد باوجود بررسی فراوان، پژوهشی داخلی مشاهده نشد که از متغیرهای مبتنیبر شبکۀ مالی برای پیشبینی درماندگی مالی استفاده کرده باشد. این یکی از وجوه تمایز و نوآوریهای اصلی این پژوهش در قیاس با مطالعات پیشین است. از وجوه تمایز دیگر این پژوهش با مطالعات قبلی در ارتباط با پیشبینی درماندگی مالی استفادهنکردن از درخت تصمیم تقویتی و همچنین بهکارنگرفتن الگوریتم گرگ خاکستری بهبودیافته برای تنظیم شاخصهای درخت تصمیم است.
روش پژوهش
این پژوهش بر آن است سنجههای مناسبی از شبکۀ مالی را بهکارگیرد تا بهشیوۀ بهتری بنگاههای دارای درماندگی مالی و بنگاههای دارای سلامت مالی را از یکدیگر متمایز سازد. بهمنظور پاسخدادن به سؤالات پژوهش از الگوی درخت تصمیم تقویت گرادیان که شاخصهایش با الگوریتم گرگ خاکستری بهبودیافته بهینه شده است، در کنار متغیرهای شبکۀ مالی استفاده میشود. جامعۀ آماری این پژوهش تمام شرکتهای تولیدی پذیرفتهشده در بورس و فرابورس ایران طی سالهای 2015 تا 2021 است. البته از بین این شرکتها تنها شرکتهایی انتخاب شدهاند که شرایط مدنظر گروه پژوهش را داشته باشند: سال مالی منتهی به آخر اسفندماه، متعلقنبودن به صنایع واسطهگری مالی، بانک، بیمه و سرمایهگذاریها، تغییرنکردن سال مالی در دورۀ زمانی مدنظر پژوهش و در دسترس بودن اطلاعاتی که پژوهش به آنها نیاز داشت. درنهایت ۱۲۳ شرکت انتخاب شد. درمجموع ۸۶۱ سال - شرکت وجود داشته که از بین این تعداد ۱۰۴ سال - شرکت درمانده و ۷۵۷ سال - شرکت غیردرمانده است. تعداد سال - شرکتهایبا درماندگی مالی از سال 2015 تا 2021 بهترتیب برابر با 8، 18، 20، 20، 17، 11 و 10 است. برای ساخت شبکۀ مالی و استخراج متغیرهای شبکۀ مالی بهصورت پیشبینی کننده، اطلاعات موردنیاز برای محاسبۀ بازده سهام تمام شرکتهای عضو نمونه گردآوری شد. با توجه به اینکه آخرین اطلاعات بازار ویژگیهای اصلی وضعیت مالی شرکتها را بهتر نشان میدهد، برای تشکیل متغیرهای مبتنیبر شبکۀ مالی از اطلاعات آخرین ۳۰ روز معاملاتی در هر سال مالی استفاده شده است.
متغیرهای مستقل به دو بخش متغیرهای مالی و متغیرهای مربوطبه شبکۀ مالی تقسیم میشوند. ۸ متغیر مالی براساس پژوهش ابراهیمی سروعلیا و همکاران (1397) انتخاب شده است: نسبت جاری، نسبت خالص سرمایه در گردش به کل داراییها، نسبت دارایی جاری به کل دارایی، حاشیۀ سود، بازده دارایی، بازده حقوق صاحبان سهام، نسبت ارزش بازار به ارزش دفتری و اندازۀ شرکت. علاوهبر 8 متغیر اشارهشده، نسبت بدهی کل نیز که یکی از پرکاربردترین متغیرها در سایر پژوهشها بوده است، نیز به متغیرهای مالی افزوده شد. درخصوص متغیرهای شبکۀ مالی نیز چهار متغیر مرکزیت درجه، مرکزیت بینابینی، مرکزیت نزدیکی و مرکزیت بردار ویژه براساس پژوهش منتشری و صادقی (1399) و لیو و همکاران (Liu et al., 2019) انتخاب شده اند که به شیوۀ اندازهگیری آنها در بخش پیشینه نظری اشاره شده است. متغیر وابستۀ این پژوهش نیز درماندگی مالی است که در مطالعات قبلی مربوطبه پیشبینی درماندگی مالی، معیارهای مختلفی برای آن پیشنهاد شده است. بر اساس این، در این پژوهش تنها از یک معیار برای سنجش درماندگی مالی استفاده نشده و هر شرکتی که دستکم یکی از این چهار ویژگیهای را داشته باشد، در آن سال درمانده لحاظ شده است: مشمول مادۀ 141 قانون تجارت باشد؛ سه سال متوالی زیان داشته باشد (Damoori, D., Hozhabrie, 2019)؛ مشمول ماده 412 قانون تجارت باشد که این قانون به حالتی اشاره دارد که نسبت بدهی بزرگتر از یک باشد (Pourheydari and Koopaei, 2010)؛ حقوق صاحبان سهامش منفی باشد (González-Bravo & Mecaj, 2011).
در رابطه با مراحل اجرای پژوهش باید گفت که ابتدا با استفاده از اطلاعات درجشده در صورتهای مالی، نسبتهای مالی مدنظر محاسبه شده است. همچنین بهمنظور محاسبۀ متغیرهای مربوط به شبکۀ مالی، بازده قیمتی سهام مختلف بهصورت لگاریتمی و ازروی قیمت تعدیلشدۀ سهام و سپس ضریب همبستگی میان بازده سهام مختلف محاسبه شد. آن گاه با کمک رابطۀ 3، ماتریس فاصلۀ میان سهام مختلف تشکیل یافت و از آن بهصورت ورودی گراف برای تشکیل کمینۀ درخت پویا با کمک الگوی پرایم استفاده شد. همچنین محاسبۀ شاخصهای مورد نیاز برای ورود به الگوی درخت تصمیم تقویت گرادیان با استفاده از تکنیک بهینهساز گرگ خاکستری بهبود یافت و با کمک نرمافزار پایتون[23] نسخه 3.11 و دو نوتبوک جوپیتر[24]و اسپایدر[25] انجام شده است. علاوهبر کتابخانههای پانداس[26]، نامپای[27]، متپلات لیب[28]، سوارملیب[29] و نتوورکایکس[30] در پایتون، از کتابخانۀ سایکیت لرن[31] نیز بسیار استفاده شده است. تمام بستهها، ماژولها و توابعی که در این پژوهش استفاده شده، در جدول (2) ارائه شده است.
جدول (2) بستهها و توابع استفاده شده در کتابخانه سایکیت لرن
Table (2) Packages and functions used in the scikit Learn library
هدف |
نام بسته فرعی |
نام کتابخانه و بسته اصلی |
پیشپردازش دادهها و استانداردکردن آنها |
MinMaxScaler |
sklearn. preprocessing |
انتخاب الگو و تفکیک دادههای آموزش و تست |
train_test_split |
sklearn. model_selection |
انتخاب ویژگی و محاسبه بهره اطلاعاتی متغیرها |
mutual_info_classif |
sklearn. feature_selection |
الگوهای خطی و انجام رگرسیون لجستیک |
LogisticRegression |
sklearn. linear_model |
انجام الگوی طبقهبندی نزدیکترین همسایه |
KNeighborsClassifier |
sklearn. neighbors |
انتخاب الگوی جمعی و درخت تصمیم تقویت گرادیان |
GradientBoostingClassifier |
sklearn. ensemble |
ارائه معیارهای ارزیابی الگو |
roc_auc_score |
sklearn. metrics |
ارائه و ترسیم ماتریس درهمریختگی |
classification_report, confusion_matrix |
sklearn. metrics |
ترسیم منحنی ROC |
roc_curve |
sklearn. metrics |
انتخاب الگو و انجام اعتبارسنجی طبقهای |
cross_val_score |
sklearn. Model _selection |
انتخاب الگو و تعیین هایپرشاخصها به روش جستوجوی شبکهای |
GridSearchCV |
sklearn. Model _selection |
درنهایت الگوها اجرا و معیارهای ارزیابی عملکرد الگوهای پیشبینی درماندگی مالی محاسبه میشود. در پژوهشهایی که با هدف طبقهبندی انجام میشود، استفاده از معیارهای مناسب ارزیابی عملکرد بسیار اهمیت دارد و درصورتیکه معیارهای مقایسه عملکرد الگوهای مختلف بهخوبی انتخاب نشوند، نتایج و یافتههای بسیار گمراهکننده همراه دارد. این موضوع زمانی بیشتر اهمیت پیدا میکند که نسبت میان کلاسهای نمونۀ پژوهش بسیار متفاوت باشد؛ برای مثال در این پژوهش نمونۀ مربوطبه شرکتهای سالم بیش از
۷ برابر نمونۀ مربوطبه شرکتهای درمانده است (757 سال شرکت در مقابل 104 سال شرکت). این احتمال وجود دارد که بهدلیل این تفاوت در تعداد کلاسها، ارزیابی اشتباه صورت گیرد. با توجه به اینکه در این پژوهش شرکتهای سالم، مثبت در نظر گرفته شده و شرکتهای درمانده، منفی است و ازآنجاکه تعداد شرکتهای سالم بیش از ۷ برابر شرکتهای درمانده است، بنابراین این احتمال وجود دارد که در ماتریس درهمریختگی[32] تعداد مثبتهای واقعی (TP) یا مثبتهای درست (شرکتهای سالمی که بهدرستی، سالم پیشبینی شدهاند) چندین برابر منفیهای واقعی (TN) یا منفیهای درست (شرکتهای درماندهای که بهدرستی درمانده پیشبینی شدهاند) باشد. همین موضوع باعث میشود تمام معیارهایی که در صورت آنها از TP استفاده شده است، مقدار زیادی از خود نشان دهند و این باعث ایجاد گمراهی در نتایج خواهد شد. با توجه به مباحث اشارهشده، در چنین حالتهایی مقدار دقت الگو (ACCURACY) و مقدار سطح زیر منحنی ROC و تمام معیارهایی که در صورت کسر آنها از TP استفاده شده باشد، مقادیر زیادی نشان میدهند که در واقعیت میتوانند گمراهکننده باشند. اگرچه امکان دارد دقت الگو در مواقع مذکور گزارش شود، ولی این زیادبودن بیشتر بهدلیل عملکرد الگو در پیشبینی درست شرکتهای سالم بوده است و نه لزوماً در پیشبینی درست شرکتهای درمانده. بر اساس این، کاملاً ضروری است که میزان خطای الگوها نیز ارزیابی شود. در شرایطی که تعداد نمونههای طبقات پژوهش (سالم یا درمانده) همگن نباشد، هر الگویی که با خطای کمتری پیشبینی کند، درحقیقت از توان بیشتر و عملکرد بهتری برای پیشبینی درماندگی مالی برخوردار است؛ بنابراین با توجه به اینکه خطای نوع اول هزینه بیشتری دارد و درواقع هدف اصلی ما نیز شناسایی درست شرکتهای ورشکسته است، هر الگویی که با خطای نوع یک کمتری پیشبینی کند، مطلوبتر و دقیقتر است. خطای نوع یک کمتر به این معنی است که الگو در پیشبینی شرکتهای ورشکسته بهتر عمل کرده و شرکتهای ورشکستۀ کمتری را بهاشتباه سالم در نظر گرفته است. درمقابل، خطای نوع یک بیشتر به این مفهوم است که الگو، تعداد شرکتهای درماندۀ بیشتری را بهاشتباه، شرکت سالم پیشبینی کرده است. اما به این دلیل که در محاسبۀ خطای نوع دوم از تعداد TP در مخرج استفاده میشود و این مقدار نیز بهدلیل زیادبودن تعداد شرکتهای سالم نسبتبه کل نمونهها زیاد گزارش میشود، بر اساس همین مخرج افزایش پیدا کرده و حاصل که خطای نوع دوم است مقدار کمتری را نشان خواهد داد؛ بنابراین فقط تکیهبر خطای نوع دوم کمتر نیز در چنین پژوهشهایی گمراهکننده است. بر اساس همین در این پژوهش از معیارهای مختلف استفاده شده است تا عملکرد الگوها از دیدگاههای مختلف سنجیده شود؛ مانند دقت در پیشبینی شرکتهای درمانده، دقت در پیشینی شرکتهای سالم و میزان خطاهای مربوطبه این پیشبینیها. معیارهای استفادهشده برای ارزیابی دقت پیشبینی الگوها براساس پژوهش لیو و همکاران، قلیزاده و همکاران (1398) و سانکار و همکاران انتخاب شده که به شرح زیر است (Liu et al., 2019; Sankhwar et al., 2020):
رابطه (21) دقت |
|
رابطه (22) خطای نوع یک |
|
رابطه (23) خطای نوع دو |
|
رابطه (24) حساسیت |
|
رابطه (25) نرخ مثبتهای غلط |
|
رابطه (26) ویژگی |
|
رابطه (27) میانگین هندسی |
|
رابطه (28) سطح زیر منحنی ROC |
|
در روابط مذکور TP، TN، FPو FN بهترتیب نشاندهندۀ مثبت درست (شرکتهای سالمی که بهدرستی در دسته شرکتهای سالم پیشبینی شدهاند)، منفی درست (شرکتهای درماندهای که بهدرستی در دسته شرکتهای درمانده پیشبینی شدهاند)، مثبت نادرست (شرکتهای درماندهای که بهاشتباه سالم پیشبینی شدهاند) و منفی نادرست (شرکتهای سالمی که بهاشتباه درمانده پیشینی شدهاند) است.
ادامۀ فرایند این پژوهش بدین صورت بوده که برای تضمین اعتبار نتایج ارزیابی دقت طبقهبندی از روش اعتبارسنجی k طبقهای[33] بهره گرفته شده است. اعتبارسنجی ۱۰ طبقهای برای هر الگو ۱۰ بار اجرا شده، سپس از نتایج حاصل بهمنظور ارائه خروجی نهایی میانگینگیری شده است. در ادامه عملکرد الگوی پیشنهادی با دو روش دیگر از روشهای متداول پیشبینی درماندگی مالی مقایسه شد. این مقایسه میان الگوها هم با درنظرگرفتن متغیرهای شبکۀ مالی و هم بدون آنها انجام و اعتبارسنجی شده است. در پایان بهمنظور ارائه یک ارزیابی جامع از روش پیشنهادشده، نتایج پیشبینیها با استفاده از چندین معیار ارزیابی عملکرد شامل دقت، حساسیت، خطای نوع یک، خطای نوع دو و سطح زیر منحنی ROC آزمون شد.
یافتهها
این پژوهش بهدنبال آن است با پیونددادن متغیرهای مبتنیبر شبکۀ مالی با الگوی IGWO – GBDT قدرت پیشبینی الگو را بهبود بخشد. بر اساس این، یک روش ترکیبی مبتنیبر درخت برمبنای اطلاعات شبکه و GBDT که با IGWO بهینه شده است، برای پیشبینی درماندگی مالی پیشنهاد شد. این روش بهطور خلاصه «FNI-IGWO-GBD T » نامگذاری شده و رویکرد جدیدی برای مقابله با درماندگی مالی است. بهطور خاص در این پژوهش در ابتدا متغیرهای مبتنیبر شبکه به متغیرهای مالی سنتی بهصورت پیشبینیکننده اضافه شد و آنگاه الگوی GBDT که شاخصهایش با IGWO بهینه شده است، برای تعیین جداسازهای درخت بهکار برده میشود. در پایان برا یسنجش و شناسایی قابلیت پیشبینی متغیرهای مبتنیبر شبکه و GBDT در پیشبینی درماندگی مالی، تحلیلی مقایسهای نیز انجام شده است. به همین دلیل در این پژوهش الگوهای نزدیکترین همسایه و رگرسیون لجستیک در کنار الگوی درخت تصمیم تقویت گرادیان بهصورت ابزارهای پیشبینی درماندگی مالی استفاده شده است. برای رگرسیون لجستیک از جریمه[34] l2، تلرانس[35] یک ده هزارم و حداکثر تکرار[36] ۱۰۰ استفاده شده است. برای الگوی k نزدیکترین همسایه نیز از تعداد ۵ همسایه[37]، اندازه برگ[38] ۳۰، وزن یکنواخت[39]، الگوریتم اتو[40] و سنجهی مینکوفسکی[41] استفاده شده است. برای بررسی توانایی متمایز متغیرهای مبتنیبر شبکه ابتدا ویژگیهای آماری این متغیرها تشریح شده است. جدول (3) نشان میدهد برای شرکتهای با درماندگی مالی در هر سال مقدار این متغیرها به چه میزان بوده است. میانگین درجه مرکزیت برای شرکتهای دارای سلامت مالی 203/0 بوده، درحالیکه میانگین درجه مرکزیت برای شرکتهای درمانده 193/0 است. از روند تغییرات درجه مرکزیت برمیآید شبکۀ مالی در طول زمان دچار تحول شده است و شرکتهایی که در آستانه درماندگی هستند، بیشتر به حاشیه شبکه سوق پیدا میکنند. مرکزیت بینابینی، برای شرکتهای درمانده و غیردرمانده برابر 007/0 است. ازمنظر مرکزیت بردار ویژه، میانگین شرکتهای سالم 083/0 بوده و برای شرکتهای دارای درماندگی مالی این میانگین 104/0 است. مرکزیت نزدیکی، برای شرکتهای سالم 525/0 بوده و برای شرکتهای دارای درماندگی مالی این میانگین 496/0 است. مطابقبا جدول (3) شرکتهایی که مستعد درماندگی مالی هستند، همزمان که شبکۀ مالی دچار تغییر میشود، روند تغییرات مشابهی دارند و درواقع برای شرکتهای با مرکزیت کمتر، احتمال بیشتری وجود دارد که دچار درماندگی مالی شوند. نتایج مربوطبه آمار توصیفی نسبتهای مالی نیز در جدول (4) و بهتفکیک شرکتهای سالم و درمانده ارائه شده است. با توجه به اینکه دربارۀ شرکتهای درمانده بهدلیل منفیبودن حقوق صاحبان سهام و یا سود و یا صفربودن میزان فروش در بعضی سالها، محاسبۀ برخی نسبتها ممکن است باعث تحلیلهای اشتباه و گمراهکننده شود، به همین دلیل محاسبه نشده است.
جدول (3) مقادیر مربوط به متغیرهای شبکۀ مالی
Table (3) Values related to financial network variables
مرکزیت نزدیکی CC |
مرکزیت بردار ویژه EC |
مرکزیت بینابینی BC |
مرکزیت درجه DC |
|
525/0 |
083/0 |
007/0 |
203/0 |
شرکتهای سالم |
467/0 |
022/0 |
001/0 |
073/0 |
درمانده 1400 |
539/0 |
032/0 |
003/0 |
172/0 |
درمانده 1399 |
661/0 |
112/0 |
003/0 |
495/0 |
درمانده 1398 |
528/0 |
064/0 |
009/0 |
165/0 |
درمانده 1397 |
451/0 |
048/0 |
005/0 |
09/0 |
درمانده 1396 |
542/0 |
125/0 |
018/0 |
198/0 |
درمانده 1395 |
446/0 |
03/0 |
003/0 |
081/0 |
درمانده 1394 |
496/0 |
104/0 |
007/0 |
193/0 |
کل شرکتهای درمانده |
جدول (4) مقایسه نسبتهای مالی بین شرکتهای سالم و درمانده
Table (4) Comparison of financial ratios between healthy and distressed companies
نماد |
نسبت مالی |
شرکتهای سالم |
شرکتهای درمانده |
ROA |
سود خالص به کل دارایی |
162/0 |
164/0- |
ROE |
سود خالص به حقوق صاحبان سهام |
362/0 |
205/0 |
ROS |
سود خالص به فروش |
2/0 |
- |
DR |
کل بدهی به کل دارایی |
561/0 |
78/1 |
CR |
دارایی جاری به بدهی جاری |
735/1 |
498/0 |
NWC/TA |
خالص سرمایه درگردش به کل دارایی |
176/0 |
- |
CA/TA |
دارایی جاری به کل دارایی |
68/0 |
454/0 |
MV/BV |
ارزش بازار به ارزش دفتری |
15/7 |
- |
SIZE |
لگاریتم کل داراییها |
475/6 |
15/6 |
بهمنظور اعتبارسنجی اینکه آیا متغیرهای مبتنیبر شبکه متوان عملکرد پیشبینی درماندگی مالی الگوها را بهبود میبخشند یا نه، تمام الگوها در دو حالت اجرا شدند. هر سه الگو هم باوجود متغیرهای شبکۀ مالی و هم بدون آن اجرا شده و دقت پیشبینی کنندههای مختلف مقایسه شده که این مقایسهها در جدول (5) آورده شده است. جدول (5) نشان میدهد درخت تصمیم تقویت گرادیان در ترکیب با اطلاعات شبکۀ مالی بهترین عملکرد پیشبینی را داشته است و این موضوع نشاندهندۀ این نکته است که الگوی پیشنهادی هم از مزایای اطلاعات شبکه و هم انتخاب شاخصهای بهینه برمبنای الگوریتم گرگ خاکستری بهبودیافته بهره برده است.
جدول (5) مقایسه عملکرد سه الگو باوجود متغیرهای شبکۀ مالی و بدون آن
Table (5) Comparing the performance of three models with and without financial network variables
FN-GBDT |
GBDT |
FN-KNN |
KNN |
FN-LR |
LR |
|
982/0 |
96/0 |
895/0 |
906/0 |
907/0 |
901/0 |
Accuracy |
05/0 |
11/0 |
40/0 |
31/0 |
20/0 |
24/0 |
Error1 |
013/0 |
033/0 |
065/0 |
011/0 |
078/0 |
086/0 |
Error2 |
993/0 |
989/0 |
907/0 |
916/0 |
959/0 |
932/0 |
Auc |
968/0 |
927/0 |
748/0 |
826/0 |
858/0 |
833/0 |
G-mean |
نتایج جدول 5 نشان میدهد دو الگوی رگرسیون لجستیک و نزدیکترین همسایه ازنظر دقت، عملکرد مشابهی داشتند و میزان دقت آنها در حدود ۹۰ درصد است. این معیار برای الگوی پیشنهادی پژوهش برابر با ۹۸ درصد است. ازنظر معیار سطح زیر منحنی ROC نیز هر سه الگو وضعیت مشابهی را نشان میدهند و مقدار این معیار برای هر سه الگو، بیشتر از ۹۰ درصد است که در شکل 5 نیز مشاهده میشود. هر سه الگو درخصوص پیشبینیهای مربوطبه طبقه شرکتهای سالم که ۸۸ درصد مشاهدات را نیز تشکیل میدهند، بسیار خوب عمل کردهاند و خطای زیر ۱۰ درصد دارند، اما هنر اصلی این الگوها زمانی نمایان میشود که طبقۀ شرکتهای درمانده مالی را که تنها ۱۲ درصد مشاهدات را به خود اختصاص دادهاند، بهخوبی و دقیق پیشبینی کنند. همانطورکه مشاهده میشود خطای نوع اول در الگوی رگرسیون لجستیک برابر ۲۰ درصد و برای الگوی نزدیکترین همسایه ۴۰ درصد است که این مقدار خطا ممکن است هزینۀ زیادی را همراه داشته باشد؛ یعنی این دو الگو بهترتیب در ۲۰ و ۴۰ درصد مواقع شرکتهای درمانده را بهاشتباه، سالم پیشبینی کردهاند. اما خطای نوع اول در الگوی پیشنهادی پژوهش تنها ۵ درصد بوده و این نشاندهندۀ دقت زیاد الگو است که در شکل 5 نیز این تفاوت مشهود است. با توجه به اینکه معیار G-mean این توانایی را دارد که حتی در شرایط ناترازبودن نمونههای پژوهش نیز، عملکرد برخی از روشهای طبقهبندی را تقویت کند (Faris et al., 2020)، به همین دلیل در این پژوهش از آن استفاده شده و نتایج آن نشاندهندۀ برتری الگوی درخت تصمیم تقویت گرادیان است.
شکل (5) مقایسۀ عملکرد سه الگو
Figure (5) Performance comparison of three models
با نگاه به نتایج مربوطبه جدول (6) مشاهده میشود الگوی پیشنهادی پژوهش از تعداد ۱۷۳ پیشبینی که انجام داده است،۱۷۰ پیشبینی درست و فقط ۳ پیشبینی اشتباه داشته است و تنها در یک نمونه از ۲۰ پیشبینی درخصوص شرکتهای ورشکسته خطا داشته است. ولی این خطا برای الگوی رگرسیون لجستیک ۴ خطا در۲۰ پیشبینی و برای الگوی نزدیکترین همسایه ۸ خطا در۲۰ پیشبینی بوده است. همچنین باید اشاره کرد با اضافهشدن متغیرهای مربوطبه شبکۀ مالی، تمام معیارهای ارزیابی در الگوی درخت تصمیم تقویت گرادیان و رگرسیون لجستیک بهبود مییابند، اما دربارۀ الگوی نزدیکترین همسایه نتیجه عکس است. به احتمال زیاد دلیل این موضوع حساسیت الگوی نزدیکترین همسایه به پراکندگی زیاد در طبقات نمونه است. در جدول (6)، خروجیهای مربوطبه ماتریس درهمریختگی در هر سه الگوی بهکار رفته، مقایسه شده است.
جدول (6) مقایسۀ ماتریس درهمریختگی روش درخت تصمیم تقویت گرادیان با الگوهای رگرسیون لجستیک و نزدیکترین همسایه
Table (6) Comparison of the confusion matrix in gradient boosting decision tree method with logistic regression and nearest neighbor models
مقادیر پیشبینیشده |
|
|
|||||
خطای پیشبینی |
دقت |
مجموع |
درمانده |
سالم |
خروجی |
الگو |
|
013/0 |
986/0 |
153 |
2 |
151 |
سالم |
FNI-IGWO-GBDT |
مقادیر واقعی |
05/0 |
95/0 |
20 |
19 |
1 |
درمانده |
||
017/0 |
982/0 |
173 |
21 |
152 |
مجموع |
||
078/0 |
921/0 |
153 |
12 |
141 |
سالم |
FNI-LR |
|
20/0 |
80/0 |
20 |
16 |
4 |
درمانده |
||
092/0 |
907/0 |
173 |
28 |
145 |
مجموع |
||
065/0 |
934/0 |
153 |
10 |
143 |
سالم |
FNI-KNN |
|
40/0 |
60/0 |
20 |
12 |
8 |
درمانده |
||
105/0 |
895/0 |
173 |
23 |
150 |
مجموع |
آزمون مقایسۀ میانگین برای چهار معیار ارزیابی عملکرد الگوهای پیشبینی انجام شده که نتایج حاصل در جدول (7) ارائه شده است. همانطورکه مشاهده میشود در سطح اطمینان 95 درصد تفاوت در میانگین خطای نوع اول در الگوی درخت تصمیم معنادار بوده و بدین مفهوم است که با اضافهشدن متغیرهای شبکۀ مالی خطای نوع یک الگو کاهش یافته است. این استدلال در سطح اطمینان 90 درصد برای معیار سطح زیر منحنی ROC نیز انجام میشود که درنتیجۀ آن با اضافهشدن متغیرهای شبکۀ مالی، معیار سطح زیر منحنی ROC افزایش یافته است. نتایج آزمون مقایسه میانگین در الگوی رگرسیون لجستیک نیز مشابه الگوی درخت تصمیم است؛ با این تفاوت که تأیید معناداری اختلاف میانگین برای معیار خطای نوع یک در سطح 90 درصد و برای معیار سطح زیر منحنی ROC در سطح 95 درصد است. برخلاف دو الگوی قبل، در الگوی نزدیکترین همسایه، با اضافهشدن متغیرهای شبکۀ مالی خطای نوع یک بهمیزان 9 درصد افزایش یافت که این اختلاف در سطح اطمینان 95 درصد معنادار نیز بوده است. اما در سایر معیارها تفاوت معناداری مشاهده نشد.
جدول (7) آزمون مقایسۀ میانگین برای معیارهای ارزیابی هر سه الگو
Table (7) Mean comparison test for the evaluation criteria of all three models
خطای نوع 2 |
خطای نوع 1 |
سطح زیر منحنی ROC |
دقت |
آماره و سطح معناداری |
الگو |
598/0- |
354/3 |
495/2- |
23/0- |
T-value |
درخت تصمیم |
576/0 |
02/0 |
055/0 |
822/0 |
Sig.(2-tailed) |
|
678/0- |
428/2 |
733/2- |
164/1 |
T-value |
رگرسیون لجستیک |
528/0 |
06/0 |
041/0 |
297/0 |
Sig.(2-tailed) |
|
791/0 |
312/6- |
382/2 |
659/1 |
T-value |
نزدیکترین همسایه |
465/0 |
001/0 |
063/0 |
158/0 |
Sig.(2-tailed) |
درمجموع ایجاد روشهای جمعی مبتنیبر درخت سادهتر و نتایج آنها نیز باثباتتر است. برای بررسی ثبات نتایج، الگوی پیشنهاد شده، در 6 حالت مختلف، تحلیل حساسیت روی شاخصهای ورودی الگو که با استفاده از الگوریتم گرگ خاکستری بهبودیافته انتخاب شده بود، نشان داد نتایج الگو از ثبات برخوردار است. جدول (8) نتایج تحلیل حساسیت روی الگوی پیشنهادشده را نشان میدهد. با توجه به اینکه با تغییر شاخصهای الگوی پیشنهادی همچنان دقت عملکرد پیشبینی الگو زیاد است، بنابراین نتایج حاصل از اعتبار و ثبات لازم برخوردار است.
جدول (8) نتایج تحلیل حساسیت روی الگوی درخت تصمیم تقویت گرادیان
Table (9) Results of sensitivity analysis on gradient boosting decision tree model
میانگین |
6 |
5 |
4 |
3 |
2 |
1 |
|
|
(100، 5، 1/0) |
(100، 3، 1/0) |
(200، 3، 05/0) |
(200، 5، 05/0) |
(200، 5، 1/0) |
(200، 3، 1/0) |
(J, D, N) |
965/0 |
96/0 |
97/0 |
95/0 |
96/0 |
97/0 |
97/0 |
ACC |
990/0 |
990/0 |
993/0 |
983/0 |
991/0 |
993/0 |
992/0 |
AUC |
در این بخش، اهمیت نسبی هر متغیر برای پیشبینی درماندگی مالی با استفاده از معیار بهرۀ اطلاعاتی[42] بررسی شده است. اهمیت نسبی هر متغیر براساس الگوی درخت تصمیم تقویت گرادیان به دست آمده است. از میان ۱۳ متغیر بهصورت ورودیها یا پیشبینی کنندههای درماندگی مالی، سه متغیر حاشیۀ سود، بازده داراییها و نسبت ارزش بازار به ارزش دفتری داراییها با مقادیر 23/0، 21/0 و 17/0 بیشترین تأثیر نسبی را در خروجی الگو داشتهاند. مطابق جدول 9 اگرچه معیارهای مرکزیت شبکه درمقایسه با نسبتهای مالی، اهمیت نسبی کمتری در پیشبینی درماندگی مالی داشتهاند، ولی در هر صورت تأثیر مثبتی نیز روی پیشبینی درماندگی مالی داشتهاند. از بین چهار متغیر مربوطبه شبکۀ مالی، مرکزیت بینابینی بیشترین اهمیت نسبی را داشته و پس از آن مرکزیت درجه با اهمیتترین متغیر شبکۀ مالی در پیشبینی درماندگی مالی بوده است.
جدول (9) اهمیت نسبی متغیرهای پیشبینیکننده
Table (9) Relative importance of predictor variables
مقدار بهره اطلاعاتی |
نام متغیر |
رتبه |
مقدار بهره اطلاعاتی |
نام متغیر |
رتبه |
07/0 |
اندازه شرکت |
8 |
23/0 |
حاشیه سود خالص |
1 |
064/0 |
داراییهای جاری به کل داراییها |
9 |
214/0 |
بازده داراییها |
2 |
032/0 |
مرکزیت بینابینی |
10 |
173/0 |
ارزش بازار به ارزش دفتری |
3 |
023/0 |
مرکزیت درجه |
11 |
16/0 |
نسبت بدهی |
4 |
014/0 |
مرکزیت نزدیکی |
12 |
157/0 |
خالص سرمایه در گردش به کل داراییها |
5 |
006/0 |
مرکزیت بردار ویژه |
13 |
147/0 |
نسبت جاری |
6 |
|
092/0 |
بازده حقوق صاحبان سهام |
7 |
نتیجهگیری
الگوی پیشنهادشده بهطور اثربخشی شرکتهای با درماندگی مالی را از شرکتهای دارای سلامت مالی تفکیک کرده است. با استفاده از نظریۀ شبکۀ پیچیده و بهکمک بازده سهام شرکتهای پذیرفتهشده در بورس و فرابورس تهران، شبکۀ مالی ایجاد شد. سپس با بهکارگیری معیارهای مرکزیت، موقعیت و ارتباطات هر شرکت در شبکۀ بازار مشخص شد. سرانجام در این پژوهش رابطه بین مرکزیت شبکه و درماندگی مالی بررسی شد. بهمنظور اعتبارسنجی تأثیر متغیرهای شبکۀ مالی در پیشبینی درماندگی مالی، شبکۀ مالی ایجاد و متغیرهای مربوطبه شبکه بهصورت متغیرهای پیشبینیکننده محاسبه شد. علاوه بر آن بهمنظور دستیافتن به بیشترین عملکرد طبقهبندی الگو از الگوریتم گرگ خاکستری بهبودیافته بهمنظور جستوجوی بهینۀ ترکیب شاخصهای الگوی تقویت گرادیان استفاده شد. درنهایت الگوی پیشنهادی این نتایج را بهدنبال داشت: 1) همراستا با نتایج پژوهش لیو و همکاران (Liu et al., 2019) متغیرهای مبتنیبر شبکۀ مالی بهمنظور کشف اطلاعات سودمند در شبکۀ مالی بهکار میروند و عملکرد پیشبینی طبقهبندیکنندهها را بهبود میبخشند؛ 2) مطابقبا تعریف مرکزیت، شرکتهای با مقدار مرکزیت زیاد بهویژه مرکزیت بینابینی و مرکزیت درجه، کمتر مستعد قرارگرفتن در شرایط درماندگی مالی هستند و برعکس؛ 3) مطابق نتایج پژوهش قلیزاده و همکاران (1398)، الگوریتم گرگ خاکستری بهبودیافته یک روش کاربردی برای انتخاب شاخصهای الگوی تقویت گرادیان است؛ 4) در شرایطی که نسبت فراوانی نمونههای هر طبقه بسیار متفاوت از طبقات دیگر باشد، استفاده از روش درخت تصمیم تقویت گرادیان بسیار کارآمد خواهد بود. نتایج تجربی نشان داد الگوی پیشنهادشده بهتر از دو الگوی دیگر در پیشبینی درماندگی مالی عمل کرده و معیارهای ارزیابی بهکاررفته نیز تأییدکنندۀ این موضوع است. ازطرفی دقت پیشبینی الگوی پیشنهادشده با تغییر شاخصهایی که در ابتدای مقاله تشریح شده بود، آزمون پایداری نتایج شد؛ بنابراین این الگو بهصورت یک ابزار سودمند پیشبینی درماندگی مالی شرکتها به کار گرفته میشود.
براساس نتایج که شاید و به احتمال بسیار زیاد نخستین پژوهشی باشد که در آن از الگوی ترکیبی FNI-GWO-GBDT برای پیشبینی درماندگی مالی شرکتها استفاده شده است، به سایر پژوهشگران علاقهمند به حوزه پیشبینی درماندگی مالی و بهطورکلی موضوعات مربوطبه طبقهبندی، پیشنهاد میشود این پژوهش را یک کار جدید مبنایی برای پژوهشهای آتی قرار دهند. ازجمله پیشنهادات کاربردی با توجه به نتایج حاصل از این پژوهش آن است که مدیران شرکتها از متغیرهای حاشیه سود خالص، بازده داراییها و نسبت ارزش بازار به ارزش دفتری با وزن و اهمیت بیشتری برای پیشبینی درماندگی مالی شرکتها استفاده کنند. همچنین توجهبه موضوعات مربوطبه بازار سرمایه با رویکرد شبکۀ مالی نیز خالی از فایده نخواهد بود. سایر پژوهشگران الگوی پیشنهادی این پژوهش را در مقایسه با سایر روشهایی مانند شبکه عصبی مصنوعی، جنگل تصادفی، ماشینهای یادگیری سریع و ... در مطالعات بعدی به کار گیرند. همچنین به علاقهمندان به مطالعات در حوزۀ روشهای فراابتکاری پیشنهاد میشود شاخصهای درخت تصمیم را با سایر الگوریتمها مانند ژنتیک، جستوجوی فاخته، کاوش باکتری، کلونی مورچگان، کرم شب تاب و ... بهینه و نتایج آن را با سایر روشها مقایسه کنند. بهجز روشهای فراابتکاری الهامگرفته از طبیعت، شاخصهای درخت تصمیم با روشهایی مانند جستوجوی تصادفی[43]و جستوجوی شبکهای[44] نیز بهینه میشود. همچنین در مطالعات بعدی برای ساخت شبکۀ مالی بهجای متغیرهای مبتنیبر قیمت از متغیرهای مبتنیبر حجم معاملات و یا متغیرهای مبتنیبر تحلیلهای تکنیکال استفاده شود. برای اندازهگیری ویژگیهای شبکۀ مالی نیز سایر معیارها مانند SIR[45]، PageRank، Hits[46]، K-shell، H-index و Profit Leader پیشنهاد میشود. نتایج این پژوهش به درک بهتری از الگوی ترکیبی FNI-GWO-GBDT برای پیشبینی درماندگی مالی شرکتها منجر میشود. درخصوص محدودیتهای این پژوهش باید اشاره کرد اصلیترین محدودیت، موجودنبودن برخی اطلاعات مالی مربوطبه قیمت تعدیلشدۀ برخی از سهام است که برای محاسبۀ بازده سهام، ضریب همبستگی میان بازده سهام و درنهایت تشکیل شبکۀ مالی ضروری است.
[1]. financial network
[2]. Complex financial network
[3]. Centrality
[4]. Ensemble methods
[5]. Gradient Boosting Decision Tree (GBDT)
[6]. Exploitation
[7]. exploration
[8]. q-Gaussian Radial Basis Functional-link nets neural networks
[9]. optimal reactive power dispatch
[10]. LR, KNN
[11]. Complex financial network
[12]. Improved Grey Wolf Optimizer
[13]. Test Function
[14]. Rastrigin Function
[15]. Sphere Function
[16]. Convergence Rate
[17]. Accuracy
[18]. Robustness
[19]. Gradient Boosting Model
[20]. Extreme learning
[21]. Harmony search
[22]. Imperialist Competition
[23]. Python
[24]. Jupyter
[25]. Spyder
[26]. Pandas
[27]. Numpy
[28]. Matplotlib
[29]. Swarmlib
[30]. Networkx
[31]. Scikit learn
[32]. Confusion Matrix
[33]. K-Fold Cross Validation
[34]. penalty
[35]. tolerance
[36]. Max-iteration
[37]. N-neighbors
[38]. Leaf size
[39]. Weight = uniform
[40]. Algorithm = auto
[41]. Metric = minkovski
[42]. Information Gain
[43]. Randomized Search CV
[44]. Grid Search CV
[45]. Susceptible Infected Recovered
[46]. Hyperlink Induced Topic Search