نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری، گروه مدیریت مالی، حسابداری و مهندسی مالی، دانشکده مدیریت و اقتصاد، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران
2 استادیار، گروه مدیریت مالی، دانشکده بازار و کسب وکار، واحد یزد، دانشگاه آزاد اسلامی، یزد، ایران
3 استادیار، گروه مدیریت، دانشکده صنایع و مدیریت، دانشگاه صنعتی شاهرود، شاهرود، ایران
4 استادیار، گروه اقتصاد، دانشکده علوم انسانی، واحد بوشهر، دانشگاه آزاد اسلامی، بوشهر، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
This study aims to optimize the settings of the nonlinear autoregressive network with exogenous inputs (NARX) model for predicting the next-day Tehran Exchange Dividend and Price Index (TEDPIX), compare its performance with the nonlinear autoregressive (NAR) and nonlinear input-output (NIO) models, extend the prediction horizon using the NAR model, and validate the NARX model through sensitivity analysis and performance comparison with the traditional autoregressive integrated moving average (ARIMA) model. This study uses TEDPIX data from 2009 to 2023. The NARX model was employed to predict the next day's index, and the NAR model was used to extend the forecasting horizon. The performance of the NARX model was compared to the NAR, NIO, and ARIMA models, using the percentage of absolute error as the evaluation metric. The mean squared error was used to determine the optimal settings for the NARX model and compare the performance of the NAR model with ARIMA. The findings indicate that the proposed NARX model, when combined with open, close, high, and low prices, trading volume, simple moving average, and exponential moving average, delivers the best prediction performance. Additionally, the Levenberg-Marquardt training algorithm achieves the highest accuracy. The model validation results confirm the superiority of the NARX algorithm over the NAR and NIO models and the traditional ARIMA model.
Keywords: NARX Neural Network, Machine Learning, Price Prediction, Stock Index
JEL Codes: C45, C53, G12, G17
Introduction
With the advancement of computational technologies and the growth of electronic trading, capital markets have expanded considerably, generating large volumes of financial data (Zeng et al., 2025). Analyzing this data is vital for improved decision-making and effective risk management (Rashid & Ismail, 2024). In Iran, the Tehran Exchange Dividend and Price Index (TEDPIX) is a key economic indicator, yet accurately forecasting its movements remains a challenge for market analysts (Chavoshi et al., 2022). Due to its nonlinear and dynamic nature (Osoolian et al., 2025), advanced techniques such as artificial neural networks have been proposed to enhance forecasting performance (Rafi et al., 2023). Traditional models like ARIMA (Autoregressive Integrated Moving Average) often fall short in volatile environments (Dhafer et al., 2022), whereas neural networks are better equipped to capture complex, nonlinear patterns (Shariffar et al., 2023). Among artificial neural network models, the Nonlinear Autoregressive model with eXogenous inputs (NARX) demonstrates higher accuracy in time series forecasting by considering the relationship between exogenous inputs and the target variable (Alcalde et al., 2024). It also exhibits greater efficiency by converging more rapidly to optimal weights (Jaiswal et al., 2025). Despite its advantages, the NARX model has not yet been applied to forecast TEDPIX specifically. This study develops a NARX-based forecasting model for TEDPIX, compares its performance with the NAR (Nonlinear Autoregressive) and NIO (Nonlinear Input-Output) models, evaluates different forecasting horizons, conducts sensitivity analysis, and benchmarks its results against ARIMA. The central question is whether NARX can provide more accurate forecasts for TEDPIX.
Materials & Methods
This study utilizes TEDPIX data from 2009 to 2023, obtained from the official website of the Tehran Securities Technology Management Company. The NARX model is employed to forecast the next day's index value, while the NAR model extends the prediction to longer horizons. The research follows a four-stage methodology: data collection and preparation, preprocessing, model configuration and execution, and performance evaluation. In addition to price and trading volume, several technical indicators—including Simple Moving Average (SMA), Exponential Moving Average (EMA), Moving Average Convergence Divergence (MACD), and Relative Strength Index (RSI)—were computed to define the model's input variables. During model configuration, the optimal number of neurons, the best input combinations, and the most effective training algorithm were identified. Model optimization was guided by the Mean Squared Error (MSE), while the Mean Absolute Error (MAE) was used to compare prediction accuracy across models. Following model execution, a sensitivity analysis was conducted to evaluate the impact of neuron count on forecasting accuracy. Finally, the predictive performance of the NARX model was benchmarked against the NAR, NIO, and ARIMA models to assess its relative forecasting effectiveness.
Findings
The results indicate that the optimal input set for the NARX model includes opening, closing, highest, and lowest prices, trading volume, SMA (10), EMA (10), SMA (50), and EMA (50). The model showed its best performance when the number of neurons was set according to the formulation proposed by Dhafer et al. (2022). Among training algorithms, Levenberg-Marquardt, Bayesian Regularization, and Scaled Conjugate Gradient produced the most accurate outcomes, respectively. Model validation through sensitivity analysis confirmed its robustness: as shown in Figure 4, changes in the number of neurons resulted in controlled variations in accuracy, indicating model stability.
Figure (4) Sensitivity analysis of the NARX model to the number of neurons
Furthermore, a one-day-ahead forecasting comparison between NARX and ARIMA indicated the superior predictive capability of the proposed model. Over a 15-year period, the absolute percentage error for NARX was 0.32, compared to 0.55 for ARIMA (see Table 6).
Table (6) Comparison results of the ARIMA model with the NARX model
Time Horizon
Forecasted Value (NARX)
Forecasted Value (ARIMA)
MAE – NARX (%)
MAE – ARIMA (%)
15 Years
1,412,700
1,415,891
0.32
0.55
10 Years
1,414,200
1,416,041
0.43
0.56
5 Years
1,414,100
1,416,497
0.42
0.59
3 Years
1,413,300
1,416,040
0.36
0.56
Discussion and Conclusion
To enhance TEDPIX forecasting accuracy, this study proposes a model based on the optimized design and configuration of the NARX network, achieving a notably low error rate of 0.00052. Addressing the second objective, the NARX model was benchmarked against its predecessors—NIO and NAR—demonstrating superior performance consistent with findings by Alcalde et al. (2024). Moreover, by leveraging the predictive capacity of the NAR model, the forecasting horizon was extended to 21 days. Sensitivity analysis regarding the number of neurons, aligned with the study's fourth objective, confirmed the model's robustness. Additionally, a performance comparison with the ARIMA model showed that NARX outperformed ARIMA, in line with previous research by Alshater et al. (2022), Devyatkin and Otmakhova (2021), and Badshah et al. (2023). Despite these contributions, the study faces several limitations, including a constrained time frame, reliance solely on price and technical indicators, sensitivity to model configuration, and limited generalizability to other contexts. Future research may improve model performance by developing more efficient training algorithms, integrating hybrid approaches, expanding applications to diverse markets, and optimizing the network architecture.
کلیدواژهها [English]
مقدمه
از اواخر قرن بیستم با پیشرفت فناوریهای محاسباتی و توسعۀ سیستمهای معاملات الکترونیکی، بازارهای سرمایه رشد چشمگیری داشته و حجم عظیمی از دادههای معاملاتی تولید شده است (Zeng et al., 2025). در این شرایط، سرمایهگذاران برای تصمیمگیری بهینه و مدیریت ریسک، نیازمند تحلیل و پیشبینی دقیق روندهای بازار هستند (Rashid & Ismail, 2024). در کشورهایی با بازار سرمایۀ توسعهیافته که نسبت بالایی از شرکتها در بورس حضور دارند، شاخص بورس نهتنها معیار عملکرد بازار، بلکه یک شاخص اقتصاد کلان محسوب میشود. روند صعودی پایدار آن موجب جذب سرمایه و افزایش سرمایهگذاریهای بلندمدت میشود، درحالیکه افت مداوم شاخص، خروج نقدینگی و گرایش به سرمایهگذاریهای کوتاهمدت را در پی دارد (Raei et al., 2015). در ایران نیز بورس اوراق بهادار تهران[1] یک بازار مالی مهم محسوب میشود و شاخص کل این بازار را با عنوان شاخص قیمت و بازدۀ نقدی[2] میشناسند. پیشبینی دقیق شاخص کل برای سرمایهگذاران، سیاستگذاران و تحلیلگران مالی برای اتخاذ تصمیمات آگاهانه بسیار حیاتی است (Amerishahrabi & Tayebisani, 2025; Chavoshi et al., 2022)؛ بااینحال، پیشبینی این شاخص به دلیل وابستگی آن به عوامل درهمتنیدهای از عملکرد مالی شرکتها گرفته تا متغیرهای کلان اقتصادی، سیاستگذاریها و حتی اخبار رسانهای مسئلهای پویا و غیرخطی است (Osoolian et al., 2025; Zeng et al., 2025). این امر لزوم استفاده از رویکردهای نوین مدلسازی و پیشبینی شاخص با حداقل خطا را برجسته میسازد (Mahmoudiazar & Raei, 2014; Usefzadeh et al., 2023).
روشهای سنتی پیشبینی قیمت در بازار سهام مانند مدل خودرگرسیون[3]، مدل میانگین متحرک[4]، مدل ترکیبی خودرگرسیون - میانگین متحرک[5] و مدل خودرگرسیون - میانگین متحرک انباشته[6] (آریما) در مدلسازی رفتارهای پیچیده و غیرخطی بازارهای مالی ناکام میمانند (Rashid & Ismail, 2024; Asadi et al., 2022). این روشها در شرایطی که دادهها دارای الگوهای پنهان باشد، نوسان بالایی داشته باشد، دارای نویز باشد یا غیرایستا و غیرخطی باشد، دقت کافی فراهم نمیکند. بهمنظور رفع این محدودیتها، الگوریتم یادگیری ماشین[7] طی سالهای اخیر توسعه یافته است (Mtiraoui et al., 2023; Rafi et al., 2023).
یکی از مهمترین مدلهای یادگیری ماشین، شبکۀ عصبی مصنوعی[8] است که در مدلسازی و پیشبینی رفتار بازار سهام عملکرد موفقیتآمیزی از خود نشان داده است (Shariffar et al., 2022; Dhafer et al., 2022). شبکۀ عصبی مصنوعی با شبیهسازی مغز انسان ازطریق مجموعهای از عناصر حافظه و توپولوژیکی بههمپیوسته، تاکنون بهطور گستردهای برای مدلسازی سیستمهای پیچیده غیرخطی استفاده شده است و در پیشبینی قیمت سهام مزایای مهمی در مقایسه با دیگر رویکردها دارد (Amerishahrabi & Tayebisani, 2025; Mirzaei et al., 2023). شبکۀ عصبی مصنوعی در شناسایی و یادگیری الگوهای پیچیده و غیرخطی دادههای تاریخی بازار سهام بسیار مؤثر است (Selvamuthu et al., 2022)؛ زیرا با دادههای جدید تطبیق یافته و دقت پیشبینی خود را بهبود میدهد (Bhowmick et al., 2023)، توانایی پردازش دادههای دارای نویز بالا و ناکامل را دارد (Cao & Wang, 2020) و از قابلیت مقیاسپذیری و ترکیب دادههای مختلف برخوردار است (Asadi et al., 2022; Pawar et al., 2023).
شبکۀ عصبی مصنوعی به دو دسته ایستا و پویا تقسیم میشود. شبکۀ ایستا مانند پرسپترون چندلایه[9] فاقد بازخورد یا تأخیر زمانی است و خروجی آن مستقیماً از ورودیها دریافت میشود (Malekian & Chitsaz, 2021). درمقابل، شبکۀ پویا با بهرهگیری از ورودیهای دارای تأخیر زمانی، قابلیت پردازش دادههای گذشته را دارد. خروجی شبکۀ پویا به مقادیر کنونی، پیشین و آینده وابسته است که به این شبکه حافظه بخشیده و امکان تحلیل وابستگیهای زمانی را فراهم میکند (Rashid & Ismail, 2024). سه مدل اصلی در تحلیل سریهای زمانی پویا عبارتاند از: خودرگرسیون غیرخطی[10] (نار)، ورودی - خروجی غیرخطی[11] (نایو) و مدل خودرگرسیون غیرخطی با ورودیهای برونزا[12] (نارکس).
در میان انواع مدلهای شبکۀ عصبی مصنوعی، مدل نارکس به دلیل توانایی بالا در مدیریت عوامل غیرخطی و گنجاندن عوامل خارجی مؤثر بر بازار در مدل پیشبینی، توجهات زیادی را به خود جلب کرده است (Alcalde et al., 2024). در مدل نارکس، اطلاعات گذشته سری زمانی و عوامل خارجی بهعنوان ورودیهای شبکۀ عصبی استفاده میشود. برای مدلسازی روابط پیچیده بین متغیرها و الگوهای زمانی غیرخطی نیز از لایههای مخفی با واحدهای غیرخطی استفاده میشود (Zhang & Qi, 2005). ساختار بازگشتی مدل نارکس به آن اجازه میدهد تا حافظهای از مقادیر گذشته را حفظ کند که برای پیشبینی سری زمانی بسیار مهم است. مدل نارکس بهخوبی شاخصهای تکنیکال را در نظر میگیرد و دقت پیشبینیهای کوتاهمدت را افزایش میدهد (Dhafer et al., 2022; Benyaala & Henchiri, 2024). در مقایسه با سایر شبکههای عصبی نیز این مدل، با درنظرگرفتن رابطۀ بین ورودیهای برونزا و متغیر هدف، تفسیر سادهتری ارائه میدهد و دقت بالاتری در پیشبینی سریهای زمانی کوتاه دارد (Jaiswal et al., 2025)؛ بهعلاوه، این شبکه به دلیل یافتن سریعتر اوزان و پارامترهای بهینه، کارآمدتر از سایر مدلهای شبکۀ عصبی مصنوعی است (Dhafer et al., 2022; Zhang et al., 2023; Rahman et al., 2023).
باوجود این مزایا کاربرد مدل نارکس در پیشبینی بازارهای مالی بدون چالش نیست. یکی از چالشهای اصلی انتخاب متغیرهای ورودی مناسب و تعیین معماری بهینۀ شبکه بهمنظور عدم مواجه با مشکل بیشبرازش است (Gündoğdu, 2020). دستیابی به عملکرد بهینه در این مدل مستلزم تنظیم پارامترها و آزمونهای مکرر است (Xie et al., 2009). در راستای غلبه بر این چالشها پژوهشگرانی که به کاربرد مدل نارکس پرداختهاند (Alcalde et al., 2024; Badshah et al., 2023; Alshater et al., 2022; Devyatkin & Otmakhova, 2021)، با تنظیم مجموعۀ ورودی و معماری شبکۀ نارکس متناسب با اهداف خاص پژوهش خود موفق به بهرهمندی از مزایای این مدل شدهاند؛ بااینحال، در بین ادبیات، تاکنون مطالعهای مشاهده نشده است که کاربرد شبکۀ عصبی نارکس را در پیشبینی شاخص کل بورس تهران بررسی کند. در پاسخ به خلأ موجود در زمینۀ بهکارگیری مدلهای پویا برای پیشبینی بازار سرمایه، این پژوهش در پی دستیابی به چند هدف اصلی است: 1) تعیین تنظیمات بهینۀ مدل نارکس برای پیشبینی شاخص کل بورس تهران در روز آینده؛ 2) مقایسۀ عملکرد این مدل با دو مدل دیگر از شبکۀهای عصبی مصنوعی پویا، یعنی مدل نار و مدل نایو؛ 3) توسعۀ بازۀ زمانی پیشبینی با بهرهگیری از قابلیت مدل نار؛ 4) تحلیل حساسیت مدل نارکس پیشنهادی و 5) مقایسۀ عملکرد مدل نارکس با مدل سنتی آریما.
بنابراین، این مقاله با بررسی جامع قابلیت مدل شبکۀ عصبی نارکس در پیشبینی شاخص کل بورس، علاوهبر پیشبرد جبهۀ دانش در حوزۀ الگوریتمهای پیشبینی قیمت سهام یا شاخص بورس میتواند ابزار مناسبی را بهمنظور مدیریت بهتر ریسک سرمایهگذاری در بازار بورس تهران در اختیار متخصصان مالی و فعالان این بازار قرار دهد. پس از این بخش، پژوهش حاضر در چهار بخش دیگر سازماندهی شده است: در بخش مبانی نظری، مفاهیم نظری مرتبط با اهداف پژوهش تشریح و ادبیات موجود در این زمینه بررسی شده است؛ در بخش روششناسی، جزئیات فرایند چهارمرحلهای پژوهش بهطور کامل و دقیق توضیح داده شده است؛ در بخش یافتهها، نتایج بهدستآمده از اجرای مدلها و ارزیابی دقت مدل پیشنهادی ارائه شده است؛ در بخش بحث و نتیجهگیری نیز نتایج بهدستآمده جمعبندی و تحلیل شده و پیشنهادهایی برای پژوهشگران آتی مطرح شده است.
روشهای پیشبینی در بازارهای مالی به دو دستۀ ساختاری و سری زمانی تقسیم میشود. در روشهای ساختاری، مقدار متغیر وابسته براساس متغیرهای مستقل تعیین میشود، درحالیکه در مدلهای سری زمانی از دادههای گذشتۀ یک متغیر برای پیشبینی مقدار آیندۀ آن استفاده میشود (Raei et al., 2015). در تحلیلهای مالی و اقتصادی، روش سری زمانی در مقایسه با روش ساختاری به دلیل سادگی بیشتر، کابرد بیشتری دارد. روش پیشبینی سریهای زمانی نیز خود به دو دستۀ خطی و غیرخطی تقسیم میشود (Rashid & Ismail, 2024). در بین مدلهای سری زمانی خطی، مدل آریما بهعنوان یکی از دستاوردهای مهم در پیشبینی سریهای زمانی شناخته میشود؛ اما تمام این مدلهای خطی در شناسایی روندهای غیرخطی ناتوان هستند. برای رفع این مشکل، مدلهای غیرخطی مانند ناهمسان واریانس خودرگرسیون تعمیمیافته (گارچ[13]) پیشنهاد شدهاند ( Han et al., 2024)؛ بااینحال، مدلهای آماری آریما و گارچ نیز به روابط خطی و توزیع نرمال متکیاند که این شرایط معمولاً در بازارهای مالی برقرار نیست (Raei et al., 2015).
در این راستا، پیشرفتهای اخیر در حوزۀ هوش مصنوعی موجب بهبود چشمگیر عملکرد مدلهای پیشبینی در بازار سهام شده است (Chen et al., 2021; Zhang et al., 2023). این مدلها بهویژه برای پیشبینی روندهای زمانی، قابلیت بهتری در مدیریت الگوهای نامطمئن، دارای نویز بالا و غیرخطی دارند و به دلیل دقت بیشتر در پیشبینی، محبوبیت روزافزونی پیدا کردهاند (Kumar et al., 2022). یادگیری ماشین[14] بهعنوان یکی از زیرمجموعههای اصلی هوش مصنوعی با بهرهمندی از الگوریتمهایی که میتوانند از تجربه بیاموزند و بدون برنامهریزی صریح بهبود یابند، دقت پیشبینی در محیطهای پرتلاطم مالی را افزایش داده است (Amerishahrabi & Tayebisani, 2025). فراتر از یادگیری ماشین، یادگیری عمیق[15] با استفاده از ساختارهای شبکۀ عصبی چندلایه، قابلیت مدلسازی روابط غیرخطی و پیچیده را به میزان زیادی افزایش داده و به دلیل ظرفیت بالای پردازش دادههای مالی در زمینۀ پیشبینی قیمت سهام یا تحلیل سریهای زمانی، بسیار کارآمد است (Mirzaei et al., 2023). یادگیری عمیق برای نخستینبار در سال ۲۰۰۵ معرفی شد و از سال ۲۰۱۲ بهشدت در کانون توجه پژوهشگران قرار گرفت. درواقع، این مفهوم به بررسی نوآوریها در طراحی شبکههای عصبی مصنوعی اختصاص دارد (Beheshtimasalegou et al., 2023). شبکۀ عصبی مصنوعی بهعنوان یکی از مدلهای محوری در یادگیری عمیق، با الهام از ساختار مغز انسان توسعه یافته و ازطریق ایجاد اتصالات بین نورونهای مصنوعی قادر به یادگیری و پیشبینی الگوهای پیچیده مالی است (Dhafer et al., 2022). به بیان دقیقتر، شبکۀ عصبی از لایههایی متشکل از گرههای بههمپیوسته یا نورونها تشکیل میشود که وظیفۀ پردازش و انتقال اطلاعات را بر عهده دارند. هر نورون ورودی خود را از سایر نورونها دریافت میکند و با اعمال یک تابع ریاضی بر این ورودیها، خروجی تولید میکند که سپس به نورونهای موجود در لایۀ بعدی منتقل میشود (Gülmez & Kulluk, 2019). ساختار و عملکرد شبکۀ عصبی مصنوعی ازطریق فرایند آموزش تنظیمپذیر است. در طی این فرایند، شبکه با مجموعهای از ورودیها و خروجیهای متناظر مواجه میشود و با تنظیم وزنها و بایاسها میکوشد تا اختلاف میان خروجی پیشبینیشده و خروجی واقعی را به حداقل برساند. این روند به شبکه امکان میدهد تا قابلیت یادگیری و عملکرد خود را بهبود بخشد (Gülmez, 2023; Gülcü, 2022).
ساختار شبکههای عصبی براساس تعداد لایهها و موقعیت نورونها به دستههای مختلفی تقسیم میشود (Dhafer et al., 2022). انتخاب مدل مناسب شبکۀ عصبی بستگی به ویژگیهای مسئلۀ پژوهش دارد. انواع شبکۀ عصبی عمیق شامل شبکههای عصبی خودرمزگذار[16]، شبکههای باور عمیق[17]، شبکههای پیچشی[18] و شبکههای بازگشتی[19] است (Beheshtimasalegou et al., 2023). در این میان، شبکۀ عصبی بازگشتی با بهرهگیری از حافظۀ داخلی، قابلیت درک وابستگیهای زمانی را دارد و بهویژه در پیشبینی سریهای زمانی مالی نظیر قیمت سهام عملکرد موفق داشته است (Zheng et al., 2022; Gülmez & Kulluk, 2019). شبکۀ عصبی بازگشتی دارای ساختار بازخوردی است که در آن خروجی شبکه به همراه ورودی بعدی به شبکه بازگردانده میشود. این ویژگی امکان حفظ اطلاعات مربوط به ورودیهای قبلی و استفاده از آن را در پردازش دنبالهای از دادهها فراهم میکند (Selvin et al., 2017). مفهوم شبکۀ بازگشتی در دهۀ ۱۹۸۰ معرفی شد و بهطور خاص برای پردازش دادههای سری یا دنبالهای توسعه یافت. در این نوع شبکه، هر نورون میتواند حالت داخلی یا حافظهای برای نگهداری اطلاعات مرتبط با ورودیهای قبلی داشته باشد که این ویژگی در کاربردهای مبتنیبر دادههای سری اهمیت زیادی دارد (Amerishahrabi & Tayebisani, 2025).
یکی از مدلهای پیشرفتۀ شبکۀ عصبی بازگشتی، مدل نارکس است که در آن نورونها بهطور غیرخطی به ورودیها و خروجیهای گذشته متصل میشوند. این ویژگی به مدل کمک میکند تا پیشبینیهای دقیقتری ارائه دهد و آن را به ابزاری قدرتمند برای تحلیل دادههای مالی تبدیل میکند (Dhafer et al., 2022). مدلهای پویای نار و نایو، مدلهای شبکۀ عصبی مشابهی هستند که پیشبینیهایی دربارۀ یک سری زمانی (درونزا) با استفاده از دادههای ورودی مختلف انجام میدهند؛ با این تفاوت که مدل نار یک مدل خودرگرسیون است؛ یعنی از دادههایی که قرار است پیشبینی شوند، بهعنوان دادههای ورودی استفاده میکند و فقط از این دادهها بهره میبرد. برعکس، مدل نایو تنها از دادههای منبع برونزا استفاده میکند؛ یعنی دادههایی که قرار است پیشبینی شوند، برای پیشبینی استفاده نمیشوند؛ بهاینترتیب، مدل نارکس این دو رویکرد را ترکیب میکند و از هر دو منبع دادۀ درونزا و برونزا استفاده میکند؛ یعنی هم از سری زمانی که قرار است پیشبینی شود و هم از سایر منابع داده (Alcalde et al., 2024). برای ارائۀ درک بهتر از عملکرد نسبی شبکۀ عصبی نارکس، این پژوهش همراستا با مطالعات رشید و اسماعیل (Rashid & Ismail, 2024) و آلکالده و همکاران (Alcalde et al., 2024) آن را با دو مدل دیگر شبکههای عصبی پویا یعنی نار و نایو نیز مقایسه کرده است که زمینهساز توسعۀ مدل نارکس بودهاند.
مدل شبکۀ عصبی نار به دلیل سادگی و کارایی بالا در شناسایی روابط غیرخطی در دادههای سری زمانی تکمتغیره توجه پژوهشگران بسیاری را به خود جلب کرده است. فرمول ریاضی این مدل بهصورت زیر بیان میشود:
(t) =f (y(t−1),..., y (t−ny)) رابطه 1
که در آن خروجی در زمان t است و n تعداد تأخیرها است؛ بدین معنی که این مدل از ny تا مقدار قبلی از منبع داده درونزای y را برای تعیین مقدار پیشبینی استفاده میکند (Alcalde et al., 2024).
این مدل به دلیل توانایی در مدلسازی پویاییهای غیرخطی، در محیطهای ناپایدار عملکرد بهتری در مقایسه با مدلهای خطی سنتی ارائه میدهد (Xu & Hu, 2023)؛ با اینحال، ناتوانی در بهکارگیری متغیرهای برونزا یکی از محدودیتهای اساسی آن به شمار میرود و میتواند دقت پیشبینی را در مسائل مالی پیچیده کاهش دهد؛ به همین دلیل، مدل نار عمدتاً در مسائلی استفاده میشود که تنها مقادیر گذشتۀ متغیر هدف در دسترس باشد (Ma et al., 2020). از سوی دیگر، افزایش تعداد پارامترها در مدل نار میتواند به بیشبرازش منجر شود و دقت تعمیمپذیری را کاهش دهد (Borrero & Mariscal, 2023). افزون بر این موارد، فرایند آموزش این مدل بهویژه در شرایط مجموعهدادههای بزرگ نیازمند منابع محاسباتی درخور توجهی است (Ahmad et al., 2025).
شبکۀ عصبی نایو برای پیشبینی مقدار متغیر وابسته y(t) از مقادیر گذشته متغیر مستقل x(t) استفاده میکند. مدل نایو طبق رابطۀ زیر عمل میکند:
(t) =f (x(t−1),..., x (t−nx)) رابطه 2
که در آن خروجی وابسته در زمان t است و n تعداد تأخیرها است؛ بدین معنی که این مدل از nx تا مقدار قبلی از منبع داده برونزای x را برای تعیین مقدار پیشبینی استفاده میکند (Alcalde et al., 2024). این مدل میتواند سیستمهایی را که مفروضات خطی در آنها صادق نیست، بهطور مؤثرتری نسبتبه مدلهای سنتی مدلسازی کند و در محیطهای پیچیده، عملکرد پیشبینی بهتری ارائه دهد؛ بهاینترتیب، این مدل بیشتر در شرایطی به کار میرود که درک پویایی غیرخطی میان ورودیها و خروجیها اهمیت دارد (, 2023.Kong et al). مدل نایو ازنظر ساختاری مشابه نارکس است؛ زیرا شامل دو مجموعه ورودی و خروجی است؛ بااینحال، پیشبینی مقدار y(t) بدون لحاظ مقادیر قبلی آن مهمترین محدودیت این مدل در مقایسه با نارکس محسوب میشود (Rashid & Ismail, 2024).
شبکۀ عصبی نارکس با توانایی مدلسازی روابط غیرخطی و گنجاندن ورودیهای برونزا که عوامل خارجی مؤثر بر سیستم مدلسازی شده هستند، شناخته میشود. مدل نارکس با معادلۀ زیر تعریف میشود:
(t) =f (y(t−1),..., y (t−ny),x(t−1),..., x (t−nx)) رابطه 3
که در آن خروجی در زمان t است، x(t) ورودیهای برونزا را نشان میدهد و n تعداد تأخیرها است؛ بدین معنی که این مدل از ny تا مقدار قبلی از منبع دادۀ درونزای y وnx تا مقدار قبلی از منبع دادۀ برونزای x برای تعیین مقدار پیشبینی استفاده میکند (Baffour et al., 2019). تابع f معمولاً یک تابع غیرخطی است که توسط یک شبکۀ عصبی تقریب زده میشود.
شبکۀ عصبی نارکس در مقایسه باروشهای سنتی پیشبینی و سایر ساختارهای شبکۀ عصبی، از چند منظر برتری دارد. توانایی این مدل در بازنمایی روابط غیرخطی، آن را برای تحلیل رفتارهای پیچیدۀ بازارهای مالی به گزینهای مناسب تبدیل کرده است. ویژگی دیگر این مدل، قابلیت دریافت دادههای برونزاست که امکان در نظر گرفتن تأثیر عوامل خارجی مانند شاخصهای اقتصادی، رویدادهای سیاسی و جریانهای جهانی را فراهم میسازد (Dhafer et al., 2022). ساختار بازگشتی این شبکه نیز سبب میشود وابستگیها و الگوهای زمانی نهفته در دادههای مالی بهدرستی شناسایی شود. بر پایۀ پژوهشهای انجامشده، مدل نارکس در بسیاری از وظایف پیشبینی ازجمله پیشبینی بازار سهام، عملکردی بهتر از شبکههای عصبی پیشخور و دیگر انواع شبکههای بازگشتی دارد (Zhang et al., 2023). بر مبنای این مزایا، پژوهشگران بسیاری عملکرد این مدل را در زمینههای مختلف بررسی کردهاند. هن و همکاران (Han et al., 2020) با ترکیب الگوریتم ژنتیک و شبکۀ عصبی نارکس، مدلی برای پیشبینی قیمت روزانۀ بیتکوین ارائه کردند. نتایج مطالعۀ آنان نشان داد که الگوریتم ژنتیک در تعیین ساختار بهینۀ شبکۀ عصبی در مقایسه با معیارهای اطلاعاتی همچون آکایکه و شوارتز عملکرد مؤثرتری دارد. بفور و همکاران (Baffour et al., 2019) از الگوریتم نارکس برای بهبود عملکرد مدل نامتقارن جی. جی. آر[20] در پیشبینی نوسانات نرخ ارز بهره گرفتند. این ترکیب توانست خطای پیشبینی را تا ۹۰درصد کاهش دهد و با شناسایی نوسانات نامتقارن و خوشههای نوسانی، دقت بالاتری در مقایسه با مدلهای سنتی نظیر گارچ و اپگارچ[21] به دست آورد. الجوجو و همکاران (Aljojo et al., 2021) با استفاده از مدل نارکس، نقش زمانبندی معاملات را در تغییرات ارزش بیتکوین بررسی کردند. این مطالعه نشان داد که دقت پیشبینی به ۹۶درصد رسیده و الگوهای زمانی مشخصی در رفتار قیمتی بیتکوین وجود دارد که توسط مدل قابلشناسایی است. الشاطر و همکاران (Alshater et al., 2022) مدل نارکس را با استفاده از شاخصهای عدم قطعیت برای پیشبینی قیمت سهام انرژی به کار گرفتند. نتایج نشان داد که این مدل در مقایسه با ۲۵ روش یادگیری ماشین و سنتی، بهمراتب دقت پیشبینی بالاتری را فراهم میکند. دویاتکین و اتماخوا (Devyatkin & Otmakhova, 2021) عملکرد مدل نارکس را در مقایسه با مدل ترنسفرمر برای پیشبینی میانمدت تولید و صادرات محصولات کشاورزی ارزیابی کردند. آنها دریافتند که مدل نارکس به دلیل توانایی در تحلیل وابستگیهای بلندمدت و ویژگیهای غیرخطی، عملکرد برتری در مقایسه با مدلهای سنتی دارد. دفر و همکاران (Dhafer et al., 2022) با هدف پیشبینی قیمتهای روزانۀ سهام بانک سی. آی. ام. بی در مالزی، شاخصهای تحلیل تکنیکال را در ترکیب با مدل شبکۀ عصبی نارکس به کار بردند. شش متغیر تکنیکال شامل مومنتوم[22]، میانگین متحرک همگرایی و واگرایی[23]، شاخص قدرت نسبی[24]، اسیلاتور[25]، دامنۀ درصد ویلیامز[26] و حجم تغییرات[27] بهعنوان مجموعههای برونزای این مدل شبکۀ عصبی در نظر گرفته شدند. آنها پی بردند که با این مدل شبکۀ عصبی، نرخ دقت پیشبینی[28] به بیش از ۸۱درصد رسیده است. بادشاه و همکاران (Badshah et al., 2023) در مقایسۀ مدلهای نارکس، گارچ و مدل خودرگرسیون میانگین متحرک انباشته با متغیرهای برونزا (آریمکس[29]) در زمینۀ پیشبینی قیمت طلا در ترکیه، دریافتند که مدل نارکس بیشترین میزان دقت را دارد. آلکالده و همکاران (Alcalde et al., 2024) برای نخستین بار مدلهای نار، نایو و نارکس را برای پیشبینی قیمت فولاد در اسپانیا مقایسه کردند. یافتههای آنان نشان داد که مدل نارکس در مقایسه با سایر شبکههای عصبی عملکرد بهتری ارائه میدهد که این یافته، الهامبخش انتخاب الگوریتمهای مقایسهای در پژوهش حاضر است.
درمجموع، مرور مطالعات پیشین حاکیازآن است که مدل شبکۀ عصبی نارکس به دلیل توانایی در مدلسازی ویژگیهای غیرخطی و وابستگیهای زمانی بلندمدت، در زمینههای مختلف پیشبینی مالی کارایی درخور توجهی دارد. هرچند پژوهش حاضر بر شبکۀ عصبی نارکس تمرکز دارد، مرور گستردهتر ادبیات مرتبط حاکیازآن است که سایر مدلهای شبکۀ عصبی نیز بهویژه در مقایسه با رویکردهای سنتی از عملکرد مطلوبی برخوردارند. شریفمقدم و هاشمی (Sharifmoghaddam & Hashemi, 2018) با ترکیب تحلیل تکنیکال و یک شبکۀ عصبی مصنوعی چهارلایه شامل تابع فعالیت سیگموئید و الگوریتم پسانتشار خطا[30] توانستند نرخ ارز یورو به دلار در روز آتی را با دقت 73% پیشبینی کنند. اسدی و همکاران (Asadi et al., 2022) کارایی شبکۀ عصبی مصنوعی را در پیشبینی سود شرکتهای بورس تهران بررسی کردند و نشان دادند که این الگوریتم در مقایسه با مدل میانگین متحرک خودرگرسیونی و روش هموارسازی نمایی روند هولت - دمپ[31] از دقت پیشبینی بالاتری برخوردار است. با گسترش کاربرد شبکههای عصبی، پژوهشگران به سوی توسعۀ مدلهای ترکیبی پیش رفتند. صفری دهنوی و شفیعی (Safaridehnavy & Shafiei, 2021) ترکیب شبکۀ عصبی فازی[32]، تابع سینک[33]، الگوریتم بهینهسازی ملخ بهبودیافته[34] و الگوریتم بهینهسازی گرگ خاکستری[35] را بهمنظور پیشبینی قیمت سهام در بورس تهران به کار بردند که با بهبود سرعت و دقت پیشبینی مدل شبکۀ عصبی معمولی همراه بود. ظفر و حسین (Zaffar & Hussain, 2022) با لحاظ احساسات خبری برای تحلیل بهتر دادهها، مدلی مبتنیبر شبکۀ عصبی مصنوعی حافظۀ طولانی-کوتاهمدت و مدل میانگین متحرک خودرگرسیون (آرما)[36] ارائه دادند که در پیشبینی چرخههای شاخص بورس کراچی دقت بالایی نشان داد. وزیری کردستانی و همکاران (Vazirikordestani et al., 2022) با استفاده از شبکههای عصبی بازگشتی و بازگشتی دوطرفۀ بهینهشده با الگوریتم ازدحام ذرات[37] موفق شدند تا عملکرد پیشبینی قیمت سهام در بازارهای بورس و فرابورس تهران را در مقایسه با مدلهای شبکۀ عصبی پرسپترون چندلایه، درخت رگرسیون و طبقهبندی[38] و ماشین بردار پشتیبان[39] بهبود دهند. بهشتی مسئلهگو و همکاران (Beheshtimasalegou et al., 2023) دادههای عددی شاخص داوجونز[40] و اطلاعات متنی شبکۀ اجتماعی ردیت[41] را برای مدلسازی شبکۀ عصبی مصنوعی حافظۀ طولانی-کوتاهمدت[42] به کار بردند. آنها دریافتند که الگوریتم بهکاررفته با دقت ۶۹.۱۹٪ بهترین عملکرد را در پیشبینی با ترکیب اخبار و دادههای مالی داشته است؛ درحالیکه دقت پیشبینی اخبار بهتنهایی ۶۵.۶۲٪ و دادههای عددی ۵۱.۸۹٪ بوده است. گولمز (Gülmez, 2023) بهمنظور پیشبینی شاخص صنعتی داوجونز، الگوریتمهای شبکۀ عصبی مصنوعی معمولی، یادگیری طولانی-کوتاهمدت، یادگیری طولانی کوتاهمدت دوبُعدی، یادگیری طولانی-کوتاهمدت سهبُعدی، یادگیری طولانی-کوتاهمدت بهینهشده با الگوریتم ژنتیک و یادگیری طولانی-کوتاهمدت بهینهشده با الگوریتم خرگوشهای مصنوعی[43] را به کار برد و دریافت که مدل یادگیری طولانی-کوتاهمدت بهینهشده با الگوریتم خرگوشهای مصنوعی و به دنبال آن شبکۀ عصبی مصنوعی بالاترین میزان دقت و کارایی را داشته است. اشرفیجو و همکاران (Ashrafijoo et al., 2023) با استفاده از شبکۀ عصبی مصنوعی مبتنیبر دادههای کمترین قیمت، شاخص بورس تهران را پیشبینی کردند. آنها دریافتند که آموزش به شبکه با هریک سه الگوریتم پسانتشار خطا[44]، لونبرگ-مارکوارت[45] و گرادیان مزدوج مقیاسشده[46] دقت ۹۹.۹٪ را ارائه میدهد. پاتانایاک و همکاران (Pattanayak et al., 2024) عملکرد ۱۰ مدل مختلف یادگیری ماشین هند را بهمنظور پیشبینی قیمت روز بعد سهام 50 شرکت برتر در بورس ملی هند بررسی کردند. یافتههای آنها نشان داد که مدل تکمرحلهای حافظۀ طولانی-کوتاهمدت[47] بهترین عملکرد را دارد؛ درنهایت، عامری شهرابی و طیبی ثانی (Amerishahrabi & Tayebisani, 2025) شبکۀ عصبی بازگشتی حافظۀ طولانی-کوتاهمدت را برای پیشبینی قیمت سهام شرکتهای برتر بورس تهران به کار بردند و معناداری آماری مدل پیشنهادی را نشان دادند.
همانطور که مرور ادبیات فوق نشان میدهد، باوجود مزایای کاربرد شبکۀ عصبی نارکس، تاکنون پژوهشی به چشم نمیخورد که بهمنظور رفع چالش پیشبینی شاخص کل بورس اوراق بهادار تهران از این رویکرد استفاده کرده باشد؛ بنابراین، با هدف رفع خلأ پژوهشی شناساییشده، مطالعۀ حاضر در نظر دارد با بهبود عملکرد این الگوریتم به سرمایهگذاران فعال در این بازار بهمنظور کاهش ریسکهای مرتبط یاری رساند.
در این پژوهش دادههای شاخص بورس اوراق بهادار تهران در بازۀ زمانی پانزده سال اخیر شامل سالهای 1388 تا 1402 از وبسایت شرکت مدیریت فناوری بورس تهران[48] اقتباسشدهاند؛ بنابراین، شیوۀ نمونهگیری در این پژوهش از نوع هدفمند است و معیار انتخاب شاخص، همبستگی بالای آن با صندوقهای فعال در بورس است. علت انتخاب این بازۀ زمانی این است که سال 1392 بورس تهران در سقف تاریخی خود قرار داشته است؛ درنتیجه نمونۀ مناسبی شامل فرازونشیبهای تاریخی قیمت سهام خواهد بود.
وظیفۀ پیشبینی قیمت سهام با استفاده از شبکههای عصبی مصنوعی اساساً با تنظیم پارامترهای مدل برای دستیابی به حداقل خطای آزمون پیادهسازی میشود. این معیار بهطور گستردهای بهعنوان معیاری برای مقایسۀ مدلها استفاده میشود و به یک شاخص مهم برای عملکرد مدل در پیشبینی قیمت سهام تبدیل شده است (Chong et al., 2017). در ادامه، معماری شبکۀ عصبی نارکس و نیز فرایند پژوهش مطرح شده است. بهمنظور دستیابی به اهداف پژوهش، فرایندی چهارمرحلهای شامل گردآوری و آمادهسازی دادهها، پیشپردازش دادهها، انجام تنظیمات مدل و اجرا و اعتبارسنجی مدل، مطابق شکل 1 اجرا شده است.
|
مرحله 1: گردآوری و آمادهسازی دادهها |
|
گام 1-1: گردآوری دادهها |
|
گام 1-2: آمادهسازی دادهها |
|
مرحله 2: پیشپردازش دادهها |
|
گام 2-1: محاسبه شاخصهای تکنیکال |
|
مرحله 3: انجام تنظیمات مدل |
|
گام 3-2: تعیین تعداد نورونها
|
|
گام 3-1: تعیین مجموعههای ورودی |
|
گام 3-3: تعیین الگوریتم آموزش
|
|
مرحله 4: اجرا و اعتبارسنجی مدل |
|
گام 4-2: مقایسه عملکرد با مدلهای نار و نایو
|
|
گام 4-1: ساخت و اجرای مدل |
|
گام 4-3: توسعه پیشبینی با الگوریتم نار
|
|
گام 4-5: مقایسه عملکرد مدل نارکس با مدل آریما
|
|
گام 4-4: تحلیل حساسیت مدل نارکس
|
شکل (1): فرایند پژوهش
Figure (1) Research process
در مرحلۀ 1 بهمنظور پیشبینی شاخص کل بورس تهران شامل دادههای روزانۀ پایینترین و بالاترین قیمت، قیمتهای باز و بستهشدن و نیز حجم معاملات[49] برای یک دورۀ 15ساله (فروردین 1388 تا اسفند 1402) از وبسایت شرکت مدیریت فناوری بورس تهران گردآوری شد. مشابه با رویکرد پژوهشگرانی نظیر الجوجو و همکاران (Aljojo et al., 2021) و ظفر و حسین (Zaffar & Hussain, 2022) دادههای پایینترین قیمت (کف)، بالاترین قیمت (سقف)، قیمتهای بازشدن (باز)، بهعنوان متغیرهای برونزا و قیمت بستهشدن (بسته) بهعنوان متغیر درونزا بهمنظور پیشبینی قیمت بسته در روز بعد انتخاب شد. سپس چهار زیرمجموعه از این دادهها شامل دادههای سهساله، پنجساله، دهساله و پانزدهساله تشکیل شد.
در مرحلۀ 2 بهمنظور تشکیل مجموعههای ورودی به مدل شبکۀ عصبی نارکس، علاوهبر دادههای قیمتی و حجم معاملات از برخی شاخصهای تکنیکال مطابق با رویکرد رایج در بین ادبیات استفاده شده است (Dhafer et al., 2022). شبکههای عصبی با ترکیب دادههای تاریخی و شاخصهای تکنیکال، قابلیت یادگیری الگوهای پیچیده را پیدا میکنند؛ بنابراین، تحلیل تکنیکال نقش کلیدی در تقویت الگوریتمهای شبکۀ عصبی دارد و آن را قادر میسازد تا به شکل بهینهتری تغییرات قیمتی شاخص بورس را پیشبینی کند (Ashrafijoo et al., 2023). شاخصهای تکنیکال لازم برای تقویت مدل شبکۀ عصبی نارکس، در ادامه تعریف شدهاند. میانگین متحرک ساده[50] با محاسبۀ میانگین قیمتها در یک دورۀ مشخص به دست میآید. این شاخص دادههای قیمتی را هموار کرده و به شناسایی روندها در طول زمان کمک میکند. بهطور معمول برای تعیین سطوح حمایت و مقاومت در معاملات سهام استفاده میشود. میانگین متحرک نمایی[51] به قیمتهای اخیر وزن بیشتری داده و در مقایسه با میانگین متحرک ساده به تغییرات جدید سریعتر واکنش نشان میدهد. این شاخص بیشتر برای تشخیص جهت روند و شناسایی نقاط احتمالی بازگشت به کار میرود. همگرایی-واگرایی میانگین متحرک[52]، یک شاخص شتابیِ دنبالهرو روند است که رابطۀ بین دو میانگین متحرک قیمت یک دارایی را نشان میدهد. این شاخص برای شناسایی سیگنالهای خریدوفروش احتمالی براساس تقاطعها و واگراییها استفاده میشود. شاخص قدرت نسبی[53]، یک نوسانگر شتابی است که سرعت و تغییرات حرکات قیمتی را اندازهگیری میکند. این شاخص بین 0 تا 100 متغیر است و معمولاً برای شناسایی شرایط اشباع خرید یا اشباع فروش در بازار به کار میرود. هریک از این شاخصهایی که معرفی شدهاند، با نرمافزار اکسل محاسبه و زیرمجموعههای مذکور از آنها تهیه شد.
در مرحلۀ 3 تنظیمات مدل انجام شد. مدل نارکس در حالت کلی شامل یک لایۀ ورودی، یک یا چند لایۀ مخفی و یک لایۀ خروجی است که با نرمافزار متلب ساخته شده است. ورودیهای مدل شامل متغیرهای تکنیکال و قیمتی بازار هستند که با یک مقدار تاخیر[54] به شبکۀ وارد میشوند. شکل 2 معماری استاندارد شبکۀ نارکس را نشان میدهد.
شکل (2): معماری استاندارد شبکۀ نارکس
Figure (2) Standard architecture of the NARX network
همانطور که در شکل 2 مشاهده میشود، شبیهسازی با استفاده از تابع(های) مستقل x(t) و تابع هدفy(t) ، همراه با یک تأخیر زمانی دو واحدی و ایجاد ۱۰ لایۀ مخفی آغاز میشود. در مرحلۀ اولیه، مقادیر اولیۀ وزنها w که براساس تابع تعریفشدۀ مسئله محاسبه شدهاند، به همراه مجموعهای از وزنهای تصادفی b به لایههای مربوطه تخصیص مییابد. سپس، با بهینهسازی مدل براساس بهترین انطباق آن با دادههای ورودی، وزنها اصلاح و تنظیم میشود؛ درنهایت، وزنهای بهینهشده به لایۀ خروجی منتقل شده و با ترکیب آنها در مدل، مقدار y(t+1)پیشبینی میشود. شایان ذکر است که تعداد لایههای خروجی در این شبکه ثابت است و امکان تغییر آن توسط کاربر وجود ندارد (Aljojo et al., 2021). روش تنظیم پارامترهای اصلی مدل شامل مجموعههای ورودی، تعداد نورونها و الگوریتمهای آموزش در ادامه توضیح داده شده است. در گام نخست از این مرحله، ترکیبهای مختلفی از هر دو نوع دادههای اولیه و پردازششده، بهعنوان کاندیدای مجموعۀ ورودی به مدل پژوهش تشکیل شده است. روشن است در این مرحله هیچ دانش پیشینی دربارۀ این وجود نداشته است که کدام ترکیب عملکرد بهتری خواهد داشت (Dhafer et al., 2022)؛ بهاینترتیب مجموعههای داده با منابع برونزا و درونزا و ترکیبات مختلف آنها بهعنوان ورودیهای مدل پیشنهادی مطابق جدول 1 تعریف شده است.
جدول (1): مجموعههای ورودی به مدل پژوهش
Table (1) Input sets of the research model
|
زیرمجموعههای مشمول |
نام مجموعه ورودی مدل |
|
}قیمت سقف، قیمت کف، قیمت باز{ |
ورودی 1 |
|
}قیمت سقف، قیمت کف، قیمت باز{ |
ورودی 2 |
|
{قیمت باز، قیمت سقف، قیمت کف، حجم، میانگین متحرک ساده ۱۰ دوره، میانگین متحرک نمایی ۱۰ دوره، میانگین متحرک ساده ۵۰ دوره، میانگین متحرک نمایی ۵۰ دوره} |
ورودی 3 |
|
{قیمت باز، قیمت سقف، قیمت کف، حجم، قدرت نسبی} |
ورودی 4 |
|
{قیمت باز، قیمت سقف، قیمت کف، حجم، همگرایی-واگرایی میانگین متحرک} |
ورودی 5 |
|
{قیمت باز، قیمت سقف، قیمت کف، حجم، میانگین متحرک ساده ۱۰ دوره، میانگین متحرک نمایی ۱۰ دوره، میانگین متحرک ساده ۵۰ دوره، میانگین متحرک نمایی ۵۰ دوره، قدرت نسبی، همگرایی-واگرایی میانگین متحرک} |
ورودی 6 |
مطابق با رویکرد پیشفرض در بیشتر مدلهای نارکس بهکاررفته توسط پژوهشگران این حوزه، کل دادهها بهصورت تصادفی به سه زیرمجموعه تقسیم شده است: اولین مجموعه با اندازۀ ۷۰درصد از دادهها برای آموزش[55] مدلهای عصبی، ۱۵درصد از دادهها برای اعتبارسنجی[56] که به کنترل فرایند آموزش با توقف زودهنگام برای جلوگیری از بروز مشکلات بیشبرازش اشاره دارد و 15درصد باقیمانده برای آزمایش[57] عملکرد مدل آموزشدیده با محاسبۀ شاخص عملکرد در نمونههای جدید و دیدهنشده درنظر گرفته شده است. در این مطالعه تعداد کل دادهها برابر با 3588 داده است که به ترتیب 2512 داده به قسمت اول و 538 داده به دو قسمت دیگر اختصاص داده شده است. در گام دوم از این مرحله، پس از مشخصشدن مجموعههای ورودی، بهمنظور تعیین تعداد نورونها از رابطۀ پیشنهادی دفر و همکاران (Dhafer et al., 2022) استفاده شده است:
Number of neurons=2 Number of inputs +1 رابطه 4
در گام پایانی این مرحله نیز سه الگوریتم آموزشی مناسب برای دو مجموعهدادههای آموزش و آزمایش تعیین شده که در ادامه به تشریح آنها و بیان دلیل انتخاب آنها پرداخته شده است. بهطورکلی، الگوریتمهای گوناگونی برای آموزش شبکههای عصبی مصنوعی موجود است که هریک مزایای خاص خود را دارند. الگوریتمهای لونبرگ-مارکوارت، تنظیم بیزی[58] و گرادیان مزدوج مقیاسشده ازجمله الگوریتمهایی هستند که در پژوهشهای پیشین (Dhafer et al., 2022; Louzazni et al., 2021; Ledhem, 2022; Ashrafijoo et al., 2023) بهطور موفقیتآمیزی برای پیشبینی دادههای بازار سهام به کار رفتهاند؛ ازاینرو، در پژوهش حاضر نیز عملکرد این سه الگوریتم برای آموزش شبکۀ عصبی نارکس بررسی شده و در ادامه جزئیات بیشتری دربارۀ آنها مطرح شده است. الگوریتم لونبرگ-مارکوارت یک تکنیک بهینهسازی پرکاربرد برای آموزش شبکۀهای عصبی است که با ترکیب مزایای روشهای گرادیان نزولی و گاوس-نیوتن، قابلیت بالایی در مسائل غیرخطی دارد (Sonkavde et al., 2023). این الگوریتم به دلیل سرعت بالای همگرایی و کارایی در کاهش توابع خطا، در پیشبینی قیمت سهام بهطور گستردهای استفاده شده است و در مقایسه با گرادیان مزدوج مقیاسشده و تنظیم بیزی، دقت بهتری در بهبود پیشبینی روزانۀ شاخصهای مالی ارائه داده است (Louzazni et al. 2021; Ledhem, 2022). الگوریتم لونبرگ_مارکوارت وزنهای شبکۀ عصبی را بهصورت تکراری بهروزرسانی میکند تا اختلاف بین خروجیهای پیشبینیشده و واقعی را به حداقل برساند. این روش از گرادیان سطح خطا و ماتریس هسین[59] برای بهرهگیری از اطلاعات مرتبۀ دوم استفاده میکند. قاعدۀ بهروزرسانی در این الگوریتم بهصورت زیر بیان میشود:
wnew = wold – (JTJ + 𝜇I) -1 JTe رابطه 5
که در آن 𝑤 وزنهای شبکۀ عصبی، 𝐽 ماتریس ژاکوبی[60] خروجیهای شبکه نسبتبه وزنها، 𝑒بردار خطا، μضریب میرایی و 𝐼 ماتریس همانی را نشان میدهد (Louzazni et al., 2021). الگوریتم گرادیان مزدوج مقیاسشده یک روش بهینهسازی مرتبۀ دوم است که مزایای گرادیان نزولی و روش گرادیان مزدوج را ترکیب میکند و در مقایسه با روشهای سنتی مانند پسانتشار خطا باعث همگرایی سریعتر و کاهش هزینههای محاسباتی میشود (Ledhem, 2022). این الگوریتم باوجود مصرف کمتر حافظه و مناسببودن برای مجموعهدادههای بزرگ، معمولاً سرعت همگرایی پایینتری در مقایسه با لونبرگ_مارکوارت دارد. مطالعات تطبیقی نشان دادهاند که این الگوریتم اگرچه عملکرد قابلقبولی در پیشبینی مالی دارد، ازلحاظ دقت معمولاً لونبرگ-مارکوارت بر آن اولویت دارد (Çolak, 2022). در این الگوریتم، وزنها طبق فرمول زیر بهروزرسانی میشوند:
wnew = wold – 𝛼 . 𝑔 رابطه 6
که در آن، 𝑤 وزنها را نشان میدهد، 𝛼 نرخ یادگیری و 𝑔 گرادیان تابع خطا است. گرادیان بهصورت زیر محاسبه میشود:
𝑔 = رابطه 7
در این رابطه E بیانگر تابع خطاست. از مزایای این الگوریتم سرعت بالای همگرایی و کاهش مصرف حافظه است که آن را برای حل مسائل پیچیده و مدلهای با ابعاد بالا مناسب میسازد (Ledhem, 2022)؛ بااینحال، این روش ممکن است در کمینههای محلی گیر بیفتد و پیادهسازی آن در مقایسه با روشهای سادهتر پیچیدهتر باشد (Amelot et al., 2021). الگوریتم تنظیم بیزی تکنیک دیگری برای بهینهسازی شبکۀ عصبی است که با افزودن یک جمله جریمه به تابع هزینه، از بیشبرازش جلوگیری میکند و قابلیت تعمیم مدل را بهبود میبخشد. تابع هزینه بهصورت زیر تعریف میشود:
L(w) = رابطه 8
که در آن خروجی واقعی، خروجی پیشبینیشده، وزنهای مدل، پارامتر تنظیم و N و M بهترتیب تعداد دادهها و وزنها هستند (Chen & Pan, 2023). این روش مزایایی همچون کاهش بیشبرازش و بهبود دقت پیشبینی، افزایش عملکرد در شرایط دارای نویز و انعطافپذیری در سازگاری با مجموعهدادههای مختلف دارد (Dhafer et al., 2022)؛ بااینحال، تنظیم بیزی دارای محدودیتهایی ازجمله افزایش زمان آموزش به دلیل پیچیدگی محاسباتی، نیاز به تنظیم دقیق پارامتر و کاهش تفسیرپذیری مدل است (Chen & Pan, 2023).
در مرحلۀ 4 پس از برنامهنویسی الگوریتم شبکۀ عصبی نارکس در محیط نرمافزار متلب به آزمون پارامترهای مدل پرداخته شده است که طیف اولیۀ آنها در مرحلۀ قبل مشخص شد. بهمنظور تعیین پارامترهای بهینۀ مدل و دستیابی به بالاترین دقت در پیشبینی، مشابه با رویکرد بیشتر پژوهشگران ازجمله گولمز (Gülmez, 2023)، پاتانایاک و همکاران (Pattanayak et al., 2024)، تو و همکاران (Tu et al., 2024) و آلکالده و همکاران (Alcalde et al., 2024)، روش میانگین مربع خطا به کار میرود. این معیار طبق رابطۀ زیر تعیین و در محیط نرمافزار اکسل محاسبه شده است.
MSE = رابطه 9
که در اینجا N بیانگر تعداد پیشبینیها، مقدار واقعی و مقدار پیشبینی است؛ علاوهبراین، باتوجهبه هدف پیشبینی شاخص در روز بعد، درصد خطای مطلق پیشبینی[61] طبق رابطۀ زیر محاسبه میشود:
APE = رابطه 10
که در این رابطه نیز مقدار واقعی و مقدار پیشبینی را نشان میدهد. در گام دوم از مرحلۀ آخر، بهمنظور ارائۀ بینش کافی از دقت و عملکرد نسبی مدل نارکس پیشنهادی، الگوریتمهای نار و نایو نیز با نرمافزار متلب شبیهسازی و اجراشده است. همانطور که در بخش 2 مطرح شد، مدل نارکس با بهرهمندی از هر دو منبع دادۀ درونزا و برونزا برای پیشبینی سری زمانی، ترکیبی از هر دو مدل محسوب میشود و طبق یافتههای پژوهشگران این حوزه عملکرد بهتری در پیشبینی سریهای زمانی پویای غیرخطی از خود نشان میدهد. به دنبال آزمون این یافته، مشابه با رویکرد بسیاری از پژوهشگران ازجمله لوزازنی و همکاران (Louzazni et al., 2021)، لدهم و همکاران (Ledhem, 2022)، آلکالده و همکاران (Alcalde et al., 2024) و نیز رشید و اسماعیل (Rashid & Ismail, 2024)، در پژوهش حاضر این دو مدل دیگر شبکۀ عصبی پویا نیز علاوهبر مدل نارکس در پیشبینی شاخص کل به کار رفته است. در گام سوم به دلیل قابلیت مدل نار در پیشبینی روزهایی فراتر از روز بعد، از این مدل بهمنظور توسعۀ بازۀ پیشبینی شاخص کل بورس استفاده شده است. مدل نار به دلیل وابستگی صرف به دادۀ هدف y(t)، قادر است پس از پیشبینی y(t+1)، این مقدار را به مجموعهدادههای ورودی اضافه کرده و مقدار y(t+2) را محاسبه کند. این فرایند میتواند تا y(t+n) ادامه یابد و به کاربر امکان پیشبینی چندین گام آینده را بدهد. درمقابل، در مدلهای نارکس و نایو علاوهبر دادۀ هدف، مجموعهای از متغیرهای مستقل x(t) نیز بهعنوان ورودی لازم است. در این روشها، تنها مقدار y(t+1) پیشبینیپذیر است؛ زیرا برای پیشبینی y(t+2)، به مقدار x(t+1)نیاز است که در دسترس نیست؛ ازاینرو، پیشبینی مقادیر فراتر از y(t+1) بدون اطلاعات جدید از متغیرهای مستقل امکانپذیر نیست؛ بهاینترتیب هرچند برتری عملکرد نارکس در مقایسه با نار در پیشبینی روز آتی در بین ادبیات مطرح است، این یافتۀ بیانگر نمیتواند مانعی برای برخورداری از قابلیت الگوریتم نار در پیشبینی روزهای بیشتر باشد. در گام چهارم، حساسیت مدل نارکس با تغییر پارامتر تعداد نورون تحلیل شده است. درواقع، تحلیل حساسیت با هدف شناسایی معماری بهینۀ شبکۀ عصبی و بهبود عملکرد مدل، بخش جداییناپذیری از فرایند مدلسازی نارکس است که در همان گام نخست از این مرحلۀ پایانی اجرا شده است؛ بااینحال، ازآنجاکه پارامتر تعداد نورونها تأثیر مستقیمی بر دقت پیشبینی، قابلیت تعمیم و پایداری مدل دارد (Mohammad & Al-Shohani, 2024)، در این مرحله حساسیتپذیری مدل نسبتبه این پارامتر با جزئیات بیشتری تشریح شده است. در گام آخر از فرایند پژوهش، نتایج مدل نارکس در پیشبینی روز بعد و مدل نار در پیشبینی روزهای بعدی با مدل سنتی آریما مقایسه شده است تا درک ملموستری از قابلیتهای نسبی مدلهای بهکاررفته در پژوهش ایجاد شود.
جدول (2): مقایسۀ عملکرد الگوریتم بهازای مجموعههای ورودی مختلف
Table (2) Comparison of algorithm performance for different input sets
|
مجموعه ورودی |
میانگین مربعات خطا |
رتبه |
مقدار واقعی |
مقدار پیشبینی |
درصد خطا |
|
ورودی ۱ |
۵۶۸۲۷۰۰۰ |
۵ |
۱۴۰۸۲۰۰ |
۱۴۱۲۵۰۰ |
۳۰۷/0 |
|
ورودی ۲ |
۵۴۷۴۴۰۰۰ |
۴ |
۱۴۰۸۲۰۰ |
۱۴۱۲۷۰۰ |
۳۲۱/0 |
|
ورودی ۳ |
۴۸۵۹۴۰۰۰ |
۱ |
۱۴۰۸۲۰۰ |
۱۴۱۴۸۰۰ |
۴۷۱/0 |
|
ورودی ۴ |
۵۰۵۲۴۰۰۰ |
۳ |
۱۴۰۸۲۰۰ |
۱۴۱۶۶۰۰ |
۵۹۸/0 |
|
ورودی ۵ |
۶۷۳۵۹۰۰۰ |
۶ |
۱۴۰۸۲۰۰ |
۱۴۰۸۹۰۰ |
0۵۲/0 |
|
ورودی ۶ |
۵۰۲۲۰۰۰۰ |
۲ |
۱۴۰۸۲۰۰ |
۱۴۱۵۴۰۰ |
۵۱۳/0 |
همانطور که در جدول 2 مشاهده میشود، الگوریتم نارکس برحسب مقادیر میانگین مربعات خطای حاصل از اجرای مدل بهازای مجموعه ورودی شمارۀ 3 شامل دادههای قیمت باز، سقف، کف، حجم معامله، میانگین متحرک ساده و میانگین متحرک نمایی بهترین عملکرد را با میزان خطای 48.594.000 داشته است. پسازآن، مجموعه ورودی شمارۀ 6 شامل تمام شاخصها و متغیرهای مدنظر یعنی دادههای قیمت باز، سقف، کف، حجم معامله، میانگین متحرک ساده، میانگین متحرک نمایی، شاخص قدرت نسبی و میانگین متحرک همگرایی و واگرایی با میزان خطای 50.220.000 از عملکرد بهتری در مقایسه با چهار مجموعه ورودی دیگر برخوردار بوده است. البته بنابر صلاحدید استفادهکنندگان از نتیجۀ پژوهش و مشابه با پژوهش پاتایاک و همکاران (Pattanayak et al., 2024)، معیار درصد خطای پیشبینی روز بعد نیز میتواند مبنای ارزیابی عملکرد قرار گیرد که در این صورت الگوریتم نارکس بهبودیافته با اطلاعات مجموعه ورودی پنجم شامل دادههای قیمتی باز، سقف، کف، حجم معامله و میانگین متحرک همگرایی و واگرایی با میزان خطای 00052/0 بهخوبی شاخص روز بعد را پیشبینی کرده است؛ بااینحال، به دلیل ثبات رفتار بالاتر خطای مجذورات خطا در تکرار اجرای مدل نسبتبه خطای پیشبینی روز بعد، در میان ادبیات این پژوهش بر معیار میانگین مجذورات خطا تأکید بیشتری شده است. بهمنظور انتخاب الگوریتم بهینه برای آموزش مدلهای شبکۀ عصبی، میزان خطای متوسط تعیین و نتیجه در جدول 3 گزارش شده است.
جدول (3): مقایسۀ عملکرد الگوریتمهای آموزش به شبکۀ عصبی نارکس
Table (3) Comparison of the performance of training algorithms for the NARX neural network
|
روش |
ورودی ۱ |
ورودی ۲ |
ورودی ۳ |
ورودی ۴ |
ورودی ۵ |
ورودی ۶ |
|
لونبرگ مارکوارت |
۵۶۸۲۷۰۰۰ |
۵۲۸۵۷۰۰۰ |
۵۴۶۰۰۰۰۰ |
۴۸۵۹۴۰۰۰ |
۶۷۳۵۹۰۰۰ |
۵۳۶۰۰۰۰۰ |
|
تنظیم بیزی |
۸۱۵۰۰۰۰۰ |
۸۸۴۰۰۰۰۰ |
۹۲۷۰۰۰۰۰ |
۹۰۸۰۰۰۰۰ |
۱۰۹۴۰۰۰۰۰ |
۹۷۳۰۰۰۰۰ |
|
گرادیان مزدوج مقیاسشده |
۳۶۶۰۰۰۰۰۰ |
۱۵۶۰۰۰۰۰۰۰۰۰۰ |
۵۱۷۸۰۰۰۰۰ |
۷۳۵۸۰۰۰۰۰ |
۱۲۴۸۶۰۰۰۰۰ |
۴۸۸۱۰۰۰۰۰ |
همانطور که در جدول 3 نشان داده شده است، بهازای ورودیهای مختلف الگوریتم لونبرگ-مارکوارت در مقایسه با دو الگوریتم دیگر، مقادیر خطای پیشبینی کمتری از خود نشان داده و درنتیجه از عملکرد بهتری در پیشبینی برخودار بوده است.
مطابق با گام 4-2، بهمنظور مقایسۀ عملکرد الگوریتم نارکس پیشنهادی با دو الگوریتم دیگر نار و نایو که به ترتیب طبق روابط 3 و 5 مدلسازی شدهاند، چهار بازۀ زمانی مختلف شامل دادههای 15 سال، 10 سال، 5 سال و 3 سال اخیر از شاخص بورس تهران در نظر گرفته شد. مقادیر میانگین مربعات خطای پیشبینی بهازای هریک از این بازهها محاسبه شد که در جدول 4 گزارش شده است. لازم به ذکر است باتوجهبه عدم امکان لحاظ متغیرهای برونزا در مدل نار، بهترین عملکرد مربوط به هریک از دو الگوریتم نارکس و نایو در نظر گرفته شده است.
جدول (4): مقایسۀ عملکرد الگوریتم نارکس با الگوریتمهای نار و نایو (میانگین مربعات خطا)
Table (4) Comparison of the performance of the NARX with the NAR and NIO algorithms (MSE)
|
حجم دادههای استفادهشده |
الگوریتم نارکس |
مجموعه ورودی نارکس |
الگوریتم نایو |
مجموعه ورودی نایو |
الگوریتم نار |
|
۱۵ سال اخیر |
۴۸۵۹۴۰۰۰ |
ورودی ۳ |
۵۳۷۸۲۰۰۰ |
ورودی ۳ |
۷۵۱۳۹۰۰۰ |
|
۱۰ سال اخیر |
۶۵۶۳۶۰۰۰ |
ورودی ۶ |
۶۸۵۳۶۰۰۰ |
ورودی ۳ |
۱۰۲۷۴۰۰۰۰ |
|
۵ سال اخیر |
۱۴۴۶۳۰۰۰۰ |
ورودی ۳ |
۱۵۵۷۷۰۰۰۰ |
ورودی ۳ |
۲۱۴۲۳۰۰۰۰ |
|
۳ سال اخیر |
۲۱۹۴۸۰۰۰۰ |
ورودی ۶ |
۲۳۲۱۰۰۰۰۰ |
ورودی ۳ |
۳۵۹۶۰۰۰۰۰ |
همانطور که نتیجۀ این تحلیل نشان میدهد، عملکرد الگوریتم نارکس در حالت بهبودیافته با بهترین مجموعههای ورودی یعنی مجموعههای ورودی شمارههای 3 و 6، در مقایسه با دو الگوریتم دیگر از خطای پیشبینی کمتری برخوردار است. تأثیر در نظر گرفتن حجم بیشتر داده بر بهبود عملکرد هر سه مدل شبکۀ عصبی نیز قابلدرک است. بهعنوان یک یافتۀ جانبی، بار دیگر بهازای در نظر گرفتن چهار حجم متفاوت از دادههای بررسیشده دربارۀ الگوریتم نایو نیز ورودی شمارۀ 3 بهترین عملکرد را داشته و انتخاب آن بهعنوان بهترین ابزار بهبود مدل شبکههای عصبی نارکس و نایو، مجدد تأیید شده است.
مطابق گام 4-3 علاوهبر یافتههای فوق که بینش مناسبی از کاربرد موفق شبکۀ عصبی نارکس بهمنظور پیشبینی شاخص بورس اوراق بهادار تهران نشان میدهد، با رویکردی نوآورانه به پیشبینی شاخص بورس در روزهایی فراتر از روز بعد نیز پرداخته شد. ازآنجاکه برتری عملکرد نارکس در مقایسه با دو الگوریتم دیگر بیانگر عملکرد ضعیف آن دو و بلااستفاده بودن آنها در کمک به فعالان بازار نیست؛ بهمنظور پیشبینی قیمت در روزهای آتی از مزیت الگوریتم نار استفاده شد. نتایج این تحلیل شامل مقادیر واقعی و پیشبینیشده به همراه درصد خطا در جدول 5 گزارش شده است.
جدول (5): پیشبینی شاخص بورس در روزهای آتی با مدل شبکۀ عصبی نار
Table (5) Stock index prediction for upcoming days using the NAR neural network model
|
درصد خطای پیشبینی |
مقدار پیشبینی |
مقدار واقعی شاخص |
روزهای آتی |
درصد خطای پیشبینی |
مقدار پیشبینی |
مقدار واقعی شاخص |
روزهای آتی |
|
69/2 |
۱,۴۱۵,۳۰۰ |
۱,۴۵۴,۵۰۰ |
۲۰ |
70/0 |
۱,۴۱۸,۰۰۰ |
۱,۴۰۸,۲۰۰ |
۱ |
|
95/3 |
۱,۴۱۴,۷۰۰ |
۱,۴۷۲,۸۰۰ |
۲۱ |
48/0 |
۱,۴۱۷,۲۰۰ |
۱,۴۱۰,۴۰۰ |
۲ |
|
46/3 |
۱,۴۱۹,۱۰۰ |
۱,۴۶۹,۹۰۰ |
۲۲ |
19/0 |
۱,۴۱۶,۲۰۰ |
۱,۴۱۳,۶۰۰ |
۳ |
|
18/5 |
۱,۴۲۲,۵۰۰ |
۱,۵۰۰,۲۰۰ |
۲۳ |
69/1 |
۱,۴۱۶,۶۰۰ |
۱,۳۹۳,۱۰۰ |
۴ |
|
01/5 |
۱,۴۲۵,۷۰۰ |
۱,۵۰۰,۹۰۰ |
۲۴ |
83/0 |
۱,۴۱۶,۳۰۰ |
۱,۴۰۴,۶۰۰ |
۵ |
|
33/4 |
۱,۴۲۷,۵۰۰ |
۱,۴۹۲,۱۰۰ |
۲۵ |
75/0 |
۱,۴۱۹,۲۰۰ |
۱,۴۰۸,۶۰۰ |
۶ |
|
53/4 |
۱,۴۲۸,۴۰۰ |
۱,۴۹۶,۲۰۰ |
۲۶ |
94/0 |
۱,۴۲۰,۸۰۰ |
۱,۴۰۷,۷۰۰ |
۷ |
|
33/7 |
۱,۴۲۵,۳۰۰ |
۱,۵۳۸,۰۰۰ |
۲۷ |
92/0 |
۱,۴۲۳,۲۰۰ |
۱,۴۱۰,۲۰۰ |
۸ |
|
99/8 |
۱,۴۲۳,۱۰۰ |
۱,۵۶۳,۶۰۰ |
۲۸ |
08/1 |
۱,۴۲۳,۴۰۰ |
۱,۴۰۸,۲۰۰ |
۹ |
|
79/9 |
۱,۴۲۲,۰۰۰ |
۱,۵۷۶,۴۰۰ |
۲۹ |
00/1 |
۱,۴۲۰,۳۰۰ |
۱,۴۰۶,۲۰۰ |
۱۰ |
|
72/13 |
۱,۴۲۱,۲۰۰ |
۱,۶۴۷,۳۰۰ |
۳۰ |
38/0 |
۱,۴۱۹,۶۰۰ |
۱,۴۱۴,۲۰۰ |
۱۱ |
|
54/10 |
۱,۴۲۲,۹۰۰ |
۱,۵۹۰,۵۰۰ |
۳۱ |
08/0 |
۱,۴۱۶,۳۰۰ |
۱,۴۱۷,۴۰۰ |
۱۲ |
|
95/8 |
۱,۴۲۴,۴۰۰ |
۱,۵۶۴,۴۰۰ |
۳۲ |
16/0 |
۱,۴۱۵,۵۰۰ |
۱,۴۱۷,۷۰۰ |
۱۳ |
|
58/10 |
۱,۴۲۴,۸۰۰ |
۱,۵۹۳,۳۰۰ |
۳۳ |
15/0 |
۱,۴۱۵,۷۰۰ |
۱,۴۱۷,۸۰۰ |
۱۴ |
|
39/10 |
۱,۴۲۶,۰۰۰ |
۱,۵۹۱,۴۰۰ |
۳۴ |
18/0 |
۱,۴۱۶,۱۰۰ |
۱,۴۱۳,۶۰۰ |
۱۵ |
|
61/9 |
۱,۴۲۷,۴۰۰ |
۱,۵۷۹,۱۰۰ |
۳۵ |
43/0 |
۱,۴۱۵,۵۰۰ |
۱,۴۰۹,۴۰۰ |
۱۶ |
|
57/10 |
۱,۴۲۹,۱۰۰ |
۱,۵۹۸,۱۰۰ |
۳۶ |
26/2 |
۱,۴۱۵,۰۰۰ |
۱,۳۸۳,۷۰۰ |
۱۷ |
|
73/12 |
۱,۴۲۷,۰۰۰ |
۱,۶۳۵,۲۰۰ |
۳۷ |
82/1 |
۱,۴۱۴,۷۰۰ |
۱,۳۸۹,۴۰۰ |
۱۸ |
|
|
۳۸ |
40/0 |
۱,۴۱۴,۹۰۰ |
۱,۴۰۹,۴۰۰ |
۱۹ |
طبق این تحلیل، مدل نار بعد از روز 37ام دچار واگرایی / بیشبرازش شدید شد؛ بنابراین، از ادامۀ پیشبینی و گزارش آن صرفنظر شد. بهمنظور درک بهتر توان پیشبینی این الگوریتم در روزهای آتی، نمودار مربوط به دادههای جدول 5 در شکل 3 ترسیم شده است.
شکل (3): مقایسۀ مقادیر پیشبینی شاخص در روزهای آتی (آبیرنگ) با دادههای واقعی (نارنجی رنگ)
Figure (3) Comparison of predicted index values for upcoming days (blue) with real data (orange)
همانطور که از شکل 3 استنباط می شود، مدل شبکۀ عصبی نار عملکرد موفقی در پیشبینی شاخص بورس اوراق بهادار تهران تا 37 روز پس از آخرین دادۀ ورودی به شبیهسازی نشان میدهد. از روز 21ام، انحراف مدل از واقعیت روبهافزایش بوده است؛ بااینحال قبل از آن بهویژه در دو بازۀ زمانی شامل روزهای اول تا ششم و نیز روزهای یازدهم تا شانزدهم پیشبینی با دقت بالای 99درصد از عملکرد بسیار خوبی برخوردار بوده است، بهنحویکه در روز دوازدهم میزان خطا تنها 0008/0 بوده است؛ بهاینترتیب علاوهبر عملکرد برتر نارکس در پیشبینی شاخص روز بعد، میتوان از مزیت الگوریتم نار در پیشبینی روزهای بعد شاخص کل بورس تهران بهره برد.
مطابق با گام 4-4، بهمنظور تحلیل حساسیت مدل با تغییر تعداد نورونها، علاوهبر سه عدد 5، 10 و 15 نورون که تعداد 10 نورون بهعنوان پیشفرض شبکۀ عصبی نارکس درنظر گرفته میشود، مطابق رابطۀ 4 تعداد نورونها بهازای هریک از مجموعههای ورودی محاسبه شد.
شکل (4): تحلیل میزان حساسیت مدل نارکس به تعداد نورونها
Figure (4) Sensitivity analysis of the NARX model to the number of neurons
همانطور که شکل 4 نشان میدهد، دقت مدل پژوهش تغییرات کنترلشدهای با تغییر تعداد نورونها پیدا میکند که این امر استواری مدل را تأیید میکند؛ علاوهبراین، میزان دقت مدل زمانی بالاترین میزان است که تعداد نورونها طبق رابطۀ پیشنهادی دفر و همکاران (Dhafer et al., 2022)، بهازای هریک از شش مجموعه ورودی به ترتیب روی اعداد ترتیب 7، 9، 17، 11، 11 و 21 تنظیم شود.
در گام پایانی (4-5) بهمنظور ایجاد درک بهتر از برتری مدلهای شبکۀ عصبی اتخاذشده، عملکرد این مدلها با مدل آریما مقایسه شد. مدل آریما یک مدل خطی-تصادفی و یکی از روشهای سنتی پیشبینی سریهای زمانی در اقتصادسنجی است. این مدل برای سریهای زمانی غیرمانا به کار میرود و ازطریق تفاضلگیری با مرتبۀ صحیح، آنها را به حالت مانا تبدیل میکند. در مدلسازی آریما با استفاده از شبیهساز سه پارامتر p، d و q تعریف و به مدل[62] وارد میشود. بهمنظور مطالعۀ جزئیات مربوط به این روش به پژوهشهای یاکوبو و ساپوترا (Yakubu & Saputra, 2022) و تو و همکاران (Tu et al., 2024) مراجعه شود. در بررسی انجامشده مقدار پارامتر d برای دادههای اصلی برابر با یک قرار داده شد؛ زیرا دادههای اصلی حالت ایستایی را نداشتند و پس از یک مرتبه مشتقگیری، دادههای مشتق گرفتهشده شرایط ایستایی را ظاهر کردند. پس از ایستاسازی دادهها بهمنظور محاسبۀ پارامتر p و q، رویکرد رسم نمودارهای تابع خودهمبستگی[63] و تابع خودهمبستگی جزئی[64] (Suleiman et al., 2023) اتخاذ شده است. با بررسی تابع خودهمبستگی مطابق شکل 5، مشاهده شد که پس از تأخیر شمارۀ 1 کاهش در نمودار اتفاق افتاده، اما باعث کمشدن مقدار تأخیر تا محدودۀ خطوط اطمینان نشده و پس از تأخیر شمارۀ 5 به یکباره به سمت محدوده خطوط اطمینان حرکت میکند. پس از آن دوباره در تأخیر شمارۀ 13 به مقدار درخورتوجهی رسیده و پس از آن در مقادیر محدوده خطوط اطمینان نوسان میکند؛ بنابراین، مقادیر q برابر با 1، 5 و 13 قابلبررسی است.
شکل (5): نمودار خودهمبستگی دادههای تفاضلی
Figure (5) Autocorrelation Function (ACF) plot of differenced data
بررسی تابع خودهمبستگی جزئی مطابق شکل 6 نیز نشان داد که بعد از پس از تأخیر شمارۀ 1، مقدار تابع از 43/0 به 08/0- افت ناگهانی داشته و یک حالت شکست در این نمودار مشاهده میشود.
شکل (6): نمودار خودهمبستگی جزئی دادههای تفاضلی
Figure (6) Partial Autocorrelation Function (PACF) plot of differenced data
ازآنجاکه مقادیر تأخیر هم در بین خطوط اطمینان (دو خط موازی آبیرنگ) یا نزدیک به آن نوسان میکند، مقدار p برابر با عدد یک قرار داده شد. بهاینترتیب، تابع آریما در این مطالعه با ورودیهای (1،1،1) و (1،1،5) و (1،1،13) برای دادههای 3، 5، 10 و 15 سال اخیر از شاخص کل بورس تهران شبیهسازی و اجرا شد. بهمنظور مقایسۀ عملکرد شبکۀ نارکس با مدل آریما از معیار درصد خطای مطلق و سنجش دقت این دو مدل در پیشبینی شاخص روز بعد استفاده شد که نتیجه در جدول 6 نشان داده شده است.
جدول (6): مقایسۀ نتایج مدل آریما با مدل نارکس
Table (6) Comparison results of the ARIMA model with the NARX model
|
درصد خطای مدل آریما |
درصد خطای مدل نارکس |
مقدار پیشبینیشده با مدل آریما |
مقدار پیشبینیشده با مدل نارکس |
بازه زمانی |
|
55/0 |
32/0 |
۱,۴۱۵,۸۹۱ |
۱,۴۱۲,۷۰۰ |
۱۵ سال |
|
56/0 |
43/0 |
۱,۴۱۶,۰۴۱ |
۱,۴۱۴,۲۰۰ |
۱۰ سال |
|
59/0 |
42/0 |
۱,۴۱۶,۴۹۷ |
۱,۴۱۴,۱۰۰ |
۵ سال |
|
56/0 |
36/0 |
۱,۴۱۶,۰۴۰ |
۱,۴۱۳,۳۰۰ |
۳ سال |
باوجودآنکه بهترین عملکرد آریما در این مقایسه لحاظ شده است، بهازای هریک از بازههای زمانی، مدل نارکس خطای کمتری داشته و در مقایسه با این مدل سنتی از عملکرد بالاتری برخوردار است. نتایج پیشبینی شاخص در روزهای بیشتر با مدل نار نیز طبق معیار میانگین مربعات خطا با نتایج مدل آریما مقایسه و در جدول 7 گزارش شد. در این جدول، پیشبینی برای تمامی سالهای بررسیشده تا زمانی ادامه یافت که یکی از روشها به خطای مطلق ۵درصد یا بیشتر برسد. ازآنجاکه مدل آریما در روز 17ام پیشبینی، به خطای بیش از ۵درصد رسید، مقدار خطای مجموع مربعات برای هر دو روش بهازای این دادهها محاسبه و با یکدیگر مقایسه شد.
جدول (7): مقایسۀ نتایج مدل آریما با مدل نار
Table (7) Comparison results of the ARIMA model with the NAR model
|
میانگین مربعات خطا با مدل نار |
میانگین مربعات خطا با مدل آریما |
بازه زمانی |
|
۱۶۳,۶۳۱,۸۵۲ |
827,485,499 |
۱۵ سال |
|
۲۱۰,۸۵۳,۱۵۵ |
۸۵۰,۰۶۴,۲۱۴ |
۱۰ سال |
|
۱۹۸,۸۴۸,۶۳۷ |
۱,۵۱۷,۷۳۶,۸۶۶ |
۵ سال |
|
۲۷۸,۶۴۷,۹۲۱ |
۱,۲۱۴,۷۳۱,۳۷۹ |
۳ سال |
همانطور که مشاهده میشود، روش نار در مقایسه با آریما مقادیر خطای بسیار کمتری نشان داده است. بهطور خاص، روش آریما در ۱۷ روز نخست پیشبینی، انحراف بیشتری از مقادیر واقعی داشته است. این تفاوت بهوضوح در شکل 7 قابلمشاهده است. بهعلاوه، مدل خطی آریما در مقایسه با مدل نار در شبیهسازی نوسان شاخص، عملکرد ضعیفتری دارد.
شکل (7): مقایسۀ نتایج پیشبینی مدل آریما با مدل نار و دادههای واقعی
Figure (7) Comparison of ARIMA model results with NAR model results and actual data
بهاینترتیب، مقایسۀ مدلهای شبکۀ عصبی پژوهش با مدل سنتی آریما حاکیاز برتری مدل نارکس در پیشبینی روز بعد و برتری مدل نار در پیشبینی روزهای بعدتر در مقایسه با آریماست.
برای این منظور، یک فرایند پژوهش چهارمرحلهای طراحی شد. با اجرای این فرایند، تنظیمات بهینۀ شبکۀ عصبی نارکس برای دستیابی به هدف پیشبینی شاخص کل بورس تهران در روز آتی برای سه پارامتر اصلی شامل مجموعه ورودی، تعداد نورونها و الگوریتمهای آموزش تعیین شد. نتایج نشان داد که مجموعه ورودی بهینه به مدل نارکس را ترکیب دادههای قیمتی، حجم معامله و متغیرهای تکنیکالی میانگین متحرک ساده و نمایی میسازد. این مدل بهازای تعداد نورونهایی که طبق رابطۀ پیشنهادی دفر و همکاران (Dhafer et al., 2022) تعیین شدهاند، بهترین عملکرد را داشته است؛ علاوهبراین، الگوریتمهای لونبرگ-مارکوارت، تنظیم بیزی و گرادیان مزدوج مقیاسشده، به ترتیبب بهترین عملکرد را در آموزش شبکۀ نارکس داشتهاند. این تنظیمات موجب شد تا مدل نارکس با خطای ناچیز 00052/0 و دقت 948/99 درصد، در پیشبینی شاخص کل بورس تهران موفق عمل کند. بهطورمشابه، اشرفیجو و همکاران (Ashrafijoo et al., 2023) با استفاده از یک مدل شبکۀ عصبی مبتنیبر الگوریتمهای لونبرگ-مارکوارت، تنظیم بیزی و گرادیان مزدوج مقیاسشده بر روی دادههای شاخص کل بورس تهران در بازۀ سالهای 1396 تا 1399 پرداخته و در بهترین حالت طبق دادههای محدودۀ کمترین قیمت بهدقت پیشبینی 983/99درصد با دو الگوریتم آموزش اول دستیافتهاند. از منظر اولویت الگوریتمهای اتخاذشده، علاوهبر آنها، دفر و همکاران (Dhafer et al., 2022) نیز به برتری الگوریتمهای لونبرگ-مارکوارت و تنظیم بیزی در مقایسه با گرادیان مزدوج مقیاسشده اشاره کردهاند؛ بااینحال، در پژوهش حاضر، تفاوت ملموستری بین عملکرد این سه الگوریتم مشاهده شد و الگوریتم لونبرگ-مارکوارت از برتری خاصی در مقایسه با تنظیم بیزی و تنظیم بیزی نیز از برتری محسوسی در مقایسه با گرادیان مزدوج مقیاسشده برخوردار بوده است. این یافته رویکرد پژوهشگرانی نظیر رشید و اسماعیل (Rashid & Ismail, 2024) در قرار دادن الگوریتم لونبرگ–مارکوارت بهعنوان تنها الگوریتم آموزش به شبکۀ عصبی نارکس را تأیید میکند. پس از تعیین تنظیمات بهینۀ مدل نارکس، نتایج مقایسۀ این مدل با دو مدل شبکۀ عصبی پویای دیگر نشان داد که مدل نارکس از قابلیت پیشبینی دقیقتری در مقایسه با دو الگوریتم نایو و نار برخوردار است. این یافته نیز همراستا با نتایج پژوهش آلکالده و همکاران (Alcalde et al., 2024) است و مهر تأیید دیگری بر نتیجهگیری برخی دیگر از پژوهشها (Badshah et al., 2023; Alshater et al., 2022; Devyatkin & Otmakhova, 2021) مبنی بر مزیت الگوریتم نارکس در حل مسائل غیرخطی نظیر پیشبینی قیمت در شرایط پیچیدۀ بازار است. علاوهبر کاربرد مدل نارکس در پیشبینی روز آتی، از قابلیت مدل نار در توسعۀ بازۀ پیشبینی استفاده شد. بهمنظور اعتبارسنجی مدل نیز علاوهبر تحلیل حساسیت، مدلهای پژوهش با مدل سنتی آریما مقایسه شد که نتایج این بررسیها حاکیاز برتری مدل نارکس در پیشبینی شاخص روز آتی و برتری مدل نار در پیشبینی روزهای بعدی است. ازلحاظ نظری، این یافتهها میتواند درک فعلی پژوهشگران این حوزۀ موضوعی را از قابلیتهای این مدل ارتقا بخشد و به اثربخشی تلاشهای آنها جهت تنظیم پارامترهای این شبکۀ عصبی منجر شود. از بُعد عملی نیز مدل پیشنهادی پژوهش با فراهمکردن امکان پیشبینی دقیق شاخص بورس اوراق بهادار تهران در روزهای آتی بهعنوان افق زمانی کوتاهمدت میتواند به سرمایهگذاران کمک کند تا در شرایطی که بازار دچار صفهای خرید و فروش میشود، تصمیمات مالی هوشمندانهتری اتخاذ کنند (Ghosh et al., 2025). این پیشبینیها علاوهبر کاهش ریسکهای ناشی از نوسانات شدید، امکان تنظیم بهموقع پرتفوی سرمایهگذاران را فراهم کرده و به آنها کمک میکند تا از تلههای هیجانی بازار دوری کنند (Zaffar & Hussain, 2022)؛ بنابراین، مدلهای معرفیشده در این پژوهش و یافتههای حاصل نهتنها میتواند الهامبخش دانشگاهیان و پژوهشگران حوزۀ کاربرد شبکۀ عصبی باشد، بلکه میتواند ابزار مناسبی در راستای مدیریت بهتر سرمایهگذاری در بازار بورس اوراق بهادار تهران بهمنظور کمک به فعالان بازار تلقی شود.
باوجود این دستاوردهای نظری و عملی، پژوهش حاضر با محدودیتهایی مواجه است که تلاش برای رفع آنها میتواند مسیر پژوهشهای آتی را هموار سازد: نخست، دورۀ زمانی بررسیشده (1388 تا 1402) است که اگرچه بازهای نسبتاً طولانی را شامل میشود، ممکن است تغییرات ساختاری و روندهای جدید بازار را بهطور کامل منعکس نکند؛ دوم، مدل پیشنهادی بر مجموعهای از متغیرهای قیمتی و تکنیکال متکی است و سایر عوامل بنیادی، روانشناختی یا کلان اقتصادی که میتوانند بر شاخص بورس تأثیرگذار باشند، در نظر گرفته نشدهاند؛ سوم، عملکرد مدل به انتخاب متغیرهای ورودی، تعداد نورونها و پیکربندی شبکۀ وابسته است و تنظیم این پارامترها نیازمند آزمایشهای گسترده برای دستیابی به بهترین کارایی است؛ چهارم، پیچیدگی محاسباتی مدلهای نارکس چالشی دیگر است که اجرای آنها را برای مجموعهدادههای بزرگ زمانبر و نیازمند منابع محاسباتی قوی میکند. باوجودآنکه در این پژوهش تلاش شده است با تنظیم دقیق پارامترهای مدل و استفاده از مجموعهدادههای گسترده، این چالشها تا حد امکان برطرف شود، اما این تنظیمات بهطور مستقیم برای سایر پژوهشها تعمیمپذیر نیست و باید متناسب با هر مسئله تحقیقاتی تنظیم شود.
پژوهشهای آتی میتوانند بر توسعۀ الگوریتمهای آموزشی کارآمدتر و بررسی مدلهای ترکیبی تمرکز کنند که نارکس را با سایر تکنیکهای یادگیری ماشین ادغام میکنند؛ برای مثال، ترکیب نارکس با الگوریتمهای فراابتکاری مانند الگوریتم ژنتیک، روشهای مبتنیبر منطق فازی یا شبکههای یادگیری عمیق میتواند به بهبود دقت پیشبینی و افزایش استحکام مدل منجر شود؛ علاوهبراین، ارزیابی عملکرد مدلهای نارکس در بازارهای مالی مختلف، ازجمله بازارهای نوظهور یا داراییهای با نوسان بالا میتواند درک بهتری از قابلیت تعمیم این روش فراهم کند. پژوهشهای آینده میتوانند تأثیر متغیرهای بنیادی، عوامل رفتاری و شاخصهای کلان اقتصادی را نیز در کنار متغیرهای قیمتی و تکنیکال بررسی کنند و چارچوبی جامعتر برای پیشبینی روندهای بازار ارائه دهند؛ درنهایت، کاهش پیچیدگی محاسباتی مدلهای نارکس ازطریق بهینهسازی معماری شبکه و بهکارگیری روشهای کاهش ابعاد داده، میتواند مسیر بهکارگیری عملی این مدلها را در محیطهای واقعی هموارتر سازد.
[1] Tehran Stock Exchange (TSE)
[2] Tehran Exchange Dividend Price Index (TEDPIX)
[3] Autoregressive Model (AR)
[4] Moving Average Model (MA)
[5] Autoregressive Moving Average Model (ARMA)
[6] Autoregressive Integrated Moving Average Model (ARIMA)
[7] Machine Learning (ML)
[8] Artificial neural networks (ANN)
[9] Multi-Layer Perceptron (MLP)
[10] Non-linear Autoregressive (NAR)
[11] Non-linear Input-Output (NIO)
[12] Nonlinear Autoregressive with Exogenous Inputs (NARX)
[13] Generalized Autoregressive Conditional Heteroscedasticity (GARCH)
[14] Machine Learning
[15] Deep Learning (DL)
[16] Autoencoder (AE)
[17] Deep Belief Networks (DBN)
[18] Convolutional Neural Networks (CNN)
[19] Recurrent Neural Networks (RNN)
[20] Glosten, Jagannathan, and Runkle (GJR)
[21] Asymmetric Power Generalised Autoregressive Conditional Heteroskedasticity (APGARCH)
[22] Momentum
[23] Moving Average Convergence Divergence (MACD)
[24] Relative Strength Index (RSI)
[25] Oscillator
[26] Williams Percent Range (WPCTR)
[27] Change in Volume (CHVOL)
[28] hit rate
[29] Autoregressive Integrated Moving Average with Exogenous Variables (ARIMAX)
[30] Backpropagation Neural Network - BPNN
[31] Holt-Damped Trend Exponential Smoothing (HDZ)
[32] Fuzzy Neural Network
[33] Sinc Function
[34] Improved Grasshopper Optimization Algorithm
[35] Grey Wolf Optimization (GWO)
[36] Autoregressive Moving Average (ARMA)
[37] Particle Swarm Optimization (PSO)
[38] Classification and Regression Tree (CART)
[39] Support Vector Machine (SVM)
[40] Dow Jones Industrial Average (DJIA)
[41] Reddit
[42] Long Short-Term Memory (LSTM)
[43] Artificial Rabbits Optimization (ARO)
[44] Backpropagation Neural Network - BPNN
[45] Levenberg-Marquardt - LM
[46] Scaled Conjugate Gradient - SCG
[47] LSTM Single-Step
[48] https://tsetmc.com/
[49] Trading Volume
[50] Simple Moving Average (SMA)
[51] Exponential Moving Average (EMA)
[52] Moving Average Convergence Divergence (MACD)
[53] Relative Strength Index (RSI)
[54] lag
[55] training
[56] validation
[57] Testing
[58] Bayesian Regularization
[59] Hessian matrix
[60] Jacobin matrix
[61] Absolute Percentage Error
[62] ARIMA(p,d,q)
[63] Autocorrelation Function (ACF)
[64] Partial Autocorrelation Function (PACF)