Prediction of Stock Market Returns with out of Sample Data: Evaluating out of Sample Methods (Regression Method and Wavelet Neural Network)

Authors

University of tehran

Abstract

Understanding stock price behavior and price forecasting are one of the most challenging issues that speculators, traders and brokers are faced with. Since stock market was established in the nineteenth century, many researchers have focused on investigating the stock price forecasting model. At the outset some of the models such as Autoregressive, ARMA, ARIMA, ARCH and GARCH were widely applied. Although some of these models were better than others in performance, but none of them had satisfactory result. Recently a number of researchers have been considering the stock market as a dynamic nonlinear system. On the other hand, artificial intelligence techniques including neural networks, genetic algorithms and fuzzy logic have produced successful results in solving complex problems. In this study we tried to use wavelet transform and neural network to present a model that more accurately predict the return on stock market index. In this hybrid model, the smoothing property of wavelet transform is used to reduce the noise level of data then a neural network model is used for forecasting. Comparison of forecast error in ARIMA models, neural network and wavelet neural network indicates that noise reduction improves forecasting of the index returns.

Keywords

Main Subjects


مقدمه

پیش‌بینی، پیش شرط تصمیم است. بدون پیش‌بینی علمی، مدیریت علمی نیز وجود نخواهد داشت. به منظور اتخاذ تصمیم‌های سرمایه‌گذاری و به کارگیری مدیریت ریسک کاراتر، تصمیم‌گیرنده (سرمایه گذار) باید به موقع تغییرات بازار سهام را که تحت سیستم اقتصادی بازار قرار دارد، شناسایی کند. نوسان‌های قیمت بازار سهام تنها به رابطه بین عرضه و تقاضا وابسته نیست، بلکه توسط عوامل خارجی، نظیر: سیاست‌گذاری‌ها، خط‌مشی‌ها و نوسان­های بازار سهام خارجی که باعث دشوار شدن شبیه‌سازی و پیش‌بینی سیگنال مالی می‌شود، تحت تأثیر قرار می‌گیرد. پرسشی که در اینجا مطرح می‌شود، این است که چگونه باید دقت پیش‌بینی سیگنال‌های مالی را که موضوع مهمی در زمینه مالی است، بهبود بخشید؟

 

بیان مسأله

موضوع شناخت و بررسی رفتار قیمت سهام و ارزشیابی دارایی‌های مالی، همواره یکی از موضوع‌های مهم و مورد توجه محافل علمی و سرمایه‌گذاری بوده ‌است. ناشناخته بودن عواملی که بر تغییرات قیمت سهام (بازده) تأثیر می‌گذارند، دلیلی برای روی آوردن به پیش‌بینی تغییرات قیمت سهام شرکت‌هاست. در صورتی که ‌این پیش‌بینی‌ها با اریب‌ها و خطاهای زیادی همراه باشند، نتایج حاصل از این پیش‌بینی‌ها نیز شدیداً تحت تأثیر قرار می‌گیرند.

مقاله‌های متعددی درخصوص توان پیش‌بینی بازده سهام با استفاده ‌از اطلاعات گذشته وجود دارد. پژوهشگران تعداد زیادی از متغیرهای مالی را شناسایی کرده‌اند که بازده آتی سهام را پیش‌بینی می‌کنند. بعضی از این متغیرها شامل: درصد تغییرات قیمت، ارزش بازار شرکت، نسبت سود تقسیمی به قیمت[1]، نسبت قیمت به عایدی‌ها[2]، نسبت قیمت دفتری به عایدی‌ها، نسبت قیمت دفتری به قیمت بازار، نسبت قیمت بازار به‌ارزش خالص، درصد سود پرداختی، نرخ بهره کوتاه‌مدت، نسبت مصرف به ثروت و ... است. اساسی‌ترین و عمومی‌ترین مدل برای پیش‌بینی با استفاده ‌از نسبت‌های فوق مدل‌های رگرسیونی است. در کنار روش‌های برآورد و پیش‌بینی داده‌های مدل‌ها، آزمون اعتبار و قابلیت پیش‌بینی این روش‌ها نیز توسعه یافته ‌است] 2[.

از زمانی که بازار سهام در قرن نوزدهم ایجاد شد، بسیاری از پژوهشگران به پژوهش بر روی مدل پیش‌بینی قیمت سهام تمرکز کرده‌اند. مدل‌های پیش‌بینی آماری، نظیر: آرما[3]، آریما[4] وآرچ[5] به طور گسترده به کار برده شده‌اند، اما هیچ کدام نتیجه مطلوب نداشته‌اند. اخیراً تعداد زیادی از پژوهشگران در پژوهش‌های خود بازار سهام را به عنوان یک سیستم پویای غیرخطی در نظر گرفته‌اند. شینکمن و لوبارون[6] (1989) دریافتند که یک پدیده بی‌نظم در سری‌های روزانه و هفتگی بازده سهام وجود دارد. پوکاتابوچرا[7] (1997) تغییر نرخ بهره بازار را با استفاده‌ از شبکه عصبی مصنوعی[8] پیش‌بینی کرد. آلگیس گارلیاسکاس[9] (1999) یک الگوریتم پیش‌بینی سیگنال‌های مالی بی‌نظم را بر اساس شبکه عصبی پیشنهاد داد. ژانگ کیان و ژائو لیکان[10] (2002) از تکنیک فیلترینگ اختلال موجک[11] و روش حداقل مربعات[12] برای پیش‌بینی قیمت سهام در چین استفاده کردند]14[.

دانشمندان و پژوهشگران در دهه آخر قرن بیستم عمدتاً به ‌این اصل معتقد شدند که فرض منطقی بودن سرمایه‌گذاری که ‌اصل غیرقابل اغماض در سرمایه‌گذاری مدرن مالی است و یکی از مفروضات اصلی در بازار کارا و یا مدل بازار است، با توجه به عوامل پیچیده‌ای که در بازارهای سهام دخیل ‌هستند، واقعی نیست. آنها به ‌این نتیجه رسیده‌اند که بازار سرمایه دارای نظم مشخصی نیست و استفاده ‌از ریاضیات پیچیده در سیستم‌های غیرخطی و پویا می‌تواند مدل‌هایی را ایجاد کند که نظریه‌های گذشته را باطل نماید. در سال‌های اخیر در پی پیشرفت‌هایی که در زمینه رایانه و هوش مصنوعی[13] و همچنین، کشف روابط آشوبی در سری‌های زمانی غیرخطی پدید آمد، فعالیت‌هایی در جهت پیش‌بینی قیمت در بورس اوراق بهادار در کشورهای مختلف انجام شد. تکنیک‌های هوش مصنوعی که شامل شبکه‌های عصبی[14]، الگوریتم ژنتیک[15] و منطق فازی است، نتایج موفقیت‌آمیزی در زمینه حل مسایل پیچیده به دست آورده‌اند ]3[.

از طرف دیگر، پیش‌بینی درون‌نمونه‌ای[16] از اعتبار چندانی برخوردار نیست، زیرا پیش‌بینی فرآیندی آینده نگر است؛ یعنی ما باید بتوانیم با داده‌های امروز مقادیر مربوط به آینده را پیش‌بینی کنیم. مسلماً با وجود داده‌های درون نمونه‌ای، چیزی را که ‌از پیش‌بینی انتظار داریم، به دست نخواهیم آورد. همان طور که در بالا اشاره شد پژوهش‌های متعددی در دنیا در زمینه پیش‌بینی درون‌نمونه‌ای انجام شده که در این پژوهش‌ها هم از روش‌های رگرسیونی و هم از روش‌های شبکه عصبی استفاده شده‌ است، اما پژوهش‌های نسبتاً کمی در ارتباط با پیش‌بینی برون‌نمونه‌ای[17] انجام شده ‌است. در ایران نیز چندین مقاله مشاهده شده است که برای پیش‌بینی از روش‌های رگرسیونی و شبکه عصبی استفاده کرده‌اند، اما تنها تعدادی از آنها از پیش‌بینی برون‌نمونه‌ای استفاده کرده‌اند.

 

ادبیات پژوهش

موجک‌ها توابع ریاضی هستند که برای تجزیه و تحلیل سری‌های زمانی که شامل متغیرها و غیرثابت‌هاست، شکل مقیاس- زمان سری‌های زمانی و روابط آنها را ارایه می‌دهند. تحلیل موجکی برای اطلاعات دارای فرکانس پایین، استفاده ‌از فاصله‌های زمانی طولانی‌مدت و برای اطلاعات دارای فرکانس بالا تناوب‌های کوتاهتر را ارایه می‌دهد. تحلیل موجکی قادر به نمایش جنبه‌های گوناگون داده‌های متفاوت، نقاط شکست و ناپیوستگی‌هاست که ممکن است دیگر روش‌های تجزیه و تحلیل سیگنال آن را نشان ندهد]5[.

تبدیل موجک پیوسته تابعی از دو متغیر  است که به روش طرح‌ریزی تابع  در یک موجک خاص و به وسیله معادله زیر به دست می‌آید:

 

نسخه‌ اصلی تابع موجک به وسیله  برگردانده و به وسیله  انتقال داده شده ‌است. در نتیجه، ضرایب موجک تابعی از این دو پارامتر؛ یعنی مکان و اسکیل ‌هستند، درحالی که تابع اصلی تنها تابعی از یک پارامتر بود. ضرایب بزرگ موجک هنگامی روی می‌دهند که موجک خاص  و تابع از نظر شکل مشابه باشند.

در عمل، تبدیل موجک گسسته ‌از طریق الگوریتم هرمی مالات پیاده‌سازی می‌شود]18[. این فرآیند با داده‌های  شروع می شود و سپس سری‌ها با استفاده ‌از  فیلتر می‌شوند. زیرنمونه‌های حاصل از خروجی این فیلتر نصف طول اصلی‌شان هستند. خروجی حاصل از فیلتر  به عنوان ضرایب موجک حفظ می‌شود و سپس فرآیند فیلترینگ بالا بر روی خروجی‌های حاصل از فیلتر  تکرار می‌گردد. نماد  بدین معنی است که ‌هر مقدار دیگری از بردار ورودی حذف شده ‌است.

یک سیگنال می‌تواند به وسیله ‌الگوریتم آبشاری که در معادله 2- نشان داده شده ‌است، بیشتر تجزیه شود.

 

 

 و  به ترتیب ضرایب تفصیل و ضرایب تقریب در سطح  هستند.

یک مشکل در رابطه با تبدیل موجک گسسته ‌این است که تبدیل موجک گسسته دارای وردایی[18] تبدیل است. وردایی تبدیل عبارت است از عدم تطابق تبدیل موجک گسسته یک سطح، با تبدیل موجک گسسته یک سطح دیگر با همان تغییر در یک توالی داده]7[. در رابطه با وردایی تبدیل می‌توان گفت تغییرهای کوچک در شکل موج‌های ورودی، به تغییرات بزرگ در ضرایب موجک منجر می‌شود و این باعث می‌شود انتقال گسسته موجک برای این پژوهش نامناسب باشد، زیرا ما نمی‌توانیم این اطلاعات را به نقطه‌ زمانی معین در مقیاس‌های مختلف نسبت دهیم]6.[ بنابراین، ما به یک تبدیل موجک ناوردا و یا حداقل ناوردای زمانی برای مدل پیش‌بینی نیاز داریم] 8.[

تبدیل موجک ایستا، یکی از تبدیل‌های موجک است که مهمترین خاصیت آن ناوردا بودن زمانی آن است. این روش مشابه تبدیل موجک گسسته ‌است؛ با این تفاوت که عمل زیرنمونه‌گیری[19] از سیگنال در این روش انجام نمی‌شود و در عوض فیلترها بالانمونه‌گیری[20] می‌شوند]16[. پژوهش‌های قبلی نشان داده‌اند که وردایی تبدیل نتیجه عمل کاهش نمونه در تبدیل موجک گسسته ‌است]8[. بنابراین، ساده‌ترین راه برای اجتناب از وردایی تبدیل حذف کردن عملیات زیر نمونه‌گیری است و این درحقیقت، تفاوت اصلی بین تبدیل موجک ایستا و تبدیل موجک گسسته است. شکل 2-1 بانک فیلتر تبدیل موجک ایستا را نمایش می‌دهد. در این شکل می‌توان مشاهده کرد که تبدیل موجک ایستا همانند تبدیل موجک گسسته‌ است؛ غیر از اینکه در تبدیل موجک ایستا سیگنال‌ هرگز دچار زیرنمونه‌گیری نمی‌شود و در عوض، در هر سطحی از تجزیه سیگنال با بالا نمونه‌گیری مواجه خواهد شد. بنابراین، تبدیل موجک ایستا ناوردایی تبدیل دارد و این دقیقاً همان چیزی است که ما می‌خواهیم.

 

 

 

 

 

 

 

 

 

 

 

 

 

شکل (1) بانک فیلتر برای تبدیل موجک ایستا

 

 

نویززدایی عبارت است از حذف نویز؛ به طوری که تا حد امکان اطلاعات مفید حفظ شود. مدل اصلی سیگنال نویزدار به شکل زیر است:

(3)

 سیگنال مشاهده شده،  سیگنال اصلی و  نویز سفید گوسی با میانگین صفر و واریانس σ2است. هدف نویززدایی حذف این قسمت از نویز سیگنال  و به دست آوردن  است.

 

پژوهش‌های صورت گرفته پیرامون پیش‌بینی شبکه عصبی موجکی

پاول‌هاجتو (2002) در مقاله خود با استفاده ‌از شبکه‌های عصبی مصنوعی و موجکی به پیش‌بینی نرخ متوسط تبادل دلار و زلوتی (واحد پول لهستان) می‌پردازد. شبکه عصبی مورد استفاده وی، پرسپترون چندلایه با سه لایه و شش نورون و یک تابع تانژانتی است. نتایج وی نشان می‌دهد که‌ الگوریتم پیش‌بینی برای دوره‌های کوتاه‌مدت عملکرد خوبی دارد، امّا زمانی که دوره‌های پیش‌بینی بیشتر می‌شود، میزان خطا افزایش می‌یابد]10[.

یوسفی و همکارانش (2003) از موجک‌ها به عنوان ابزاری برای بررسی مسأله کارایی بازار در بازارهای آتی نفت استفاده کردند. آنها قیمت نفت را در افق‌های زمانی مختلف پیش‌بینی و سپس نتایج آن را با داده‌های بازار آتی نفت مقایسه کردند. آنها دریافتند که قدرت پیش‌بینی روش مبتنی بر موجک تا حد زیادی به اندازه نمونه حساس روش برای اندازه‌های نمونه 100 یا بیشتر، بهترین عملکرد را دارد]11[.

وای[21] (2004) به بررسی استفاده ‌از روش‌های موجکی در مسائل تجزیه و تحلیل بازار سهام، مانند: طبقه‌بندی سهام و پیش‌بینی قیمت سهام می پردازد. وی با پیاده سازی شبکه عصبی موجکی دریافت که پیش‌بینی قیمت سهام روز بعد دارای میانگین نرمال مربعات خطا[22] پایین در حد 20% است. نتایج پژوهش وی نشان می‌دهد که با استفاده ‌از یک استراتژی معاملاتی ساده، شبکه عصبی موجکی ممکن است باعث عملکرد بهتر استراتژی خرید و نگهداری شود]12[.

سیه[23] و همکاران (2010) برای پیش‌بینی قیمت سهام، یک سیستم ترکیبی شامل تبدیل‌های موجک و شبکه عصبی بازگشتی مبتنی بر الگوریتم کُلُنی زنبور عسل[24] را به کار بردند. نتایج نشان می‌دهد که ‌این سیستم تا حد زیادی امید بخش بوده، می توان آن را در سیستم‌های تجاری واقعی برای پیش‌بینی قیمت سهام و حداکثرسازی سود پیاده‌سازی نمود]13[.

وانگ و گوپتا[25] (2013) به پیش‏بینی قیمت آتی سهام (اس‏اند‏پی 500) با استفاده از شبکه‏های عصبی و نویززدایی موجک اقدام نمودند. تجزیه و تحلیل موجک به منظور نویززدایی استفاده و با پیش‏بینی‏های بدون نویززدایی مقایسه شد. در این مقاله، بر اساس قیمت‏های پیش‏بینی شده و به منظور محاسبه کارایی نرخ بازده برای دوره‏های مختلف، یک استراتژی معاملاتی روزانه برای خرید و فروش به کار گرفته شد. صندوق‏های قابل معامله در بورس[26] متعددی وجود دارند که از عملکرد اس‏اند‏پی 500 تبعیت می‏کنند و سهام را با همان نسبت در شاخص نگه می‏دارند و در نتیجه بازده مشابهی را نیز ارایه می نمایند. بنابراین، این پژوهش می‏تواند برای کمک به سرمایه‏گذاری در این صندوق‏ها بهره‏برداری شود. نتایج این پژوهش نشان می‏دهد که شبکه‏های عصبی در صورتی که همراه با آموزش و داده‏های ورودی مناسب باشند، می‏توانند برای دستیابی به سودآوری بالا در صندوق‏های قابل معامله در بورس (مبتنی بر اس‏اند‏پی 500) استفاده شوند.

بهرادمهر (1387) تلاش نموده با استفاده ‌از تبدیل موجک و شبکة عصبی مدلی ارایه کند که پیش‌بینی دقیق‌تر و با خطای کمتری از قیمت نفت خام داشته باشد. در این مدل ترکیبی، از خاصیت هموارسازی تبدیل موجک برای کاهش سطح نویز داده‌ها استفاده و سپس به وسیله شبکة عصبی مصنوعی و با داده‌های هموارسازی شده، قیمت نفت پیش‌بینی شده ‌است. نتایج حاصل از مقایسة ریشه میانگین مربعات خطای مدل‌های رقیب با مدل ترکیبی مورد اشاره، دلالت بر آن دارد که کاهش نویز و هموارسازی داده‌ها، عملکرد پیش‌بینی قیمت نفت را بهبود می‌بخشد]1[.

عباسی‌نژاد و محمدی (1386) در پژوهش خود روش پیش‌بینی‌ای ارایه می‌نمایند تا قدرت شبکه‌های عصبی و تبدیل موجک را با هم ترکیب کند. در این روش نرخ‌های ارز اصلی که باید پیش‌بینی شوند، در ابتدا با استفاده ‌از تکنیک موجک به مؤلفه‌های مقیاسی متفاوتی تجزیه می‌شوند. در مرحله بعد تکنیک شبکه‌های عصبی برای مدل‌بندی هر کدام از مؤلفه‌های سری‌های زمانی به کار گرفته می‌شود و پیش‌بینی نهایی سری‌های زمانی اصلی با ترکیب پیش‌بینی این مؤلفه‌ها به دست می‌آید. این روش برای پیش‌بینی یک و ده گام به جلوی نرخ‌های ارز روزانه به کار گرفته می‌شود. نتایج نشان می‌دهد که عملکرد این روش پیشنهادی در مقایسه با مدل شبکه عصبی و مدل آریما در پیش‌بینی‌ها از یک گام تا پنج گام به جلو بهتر است ]4[.

 

فرضیه‌های پژوهش

فرضیه‌های این پژوهش به صورت زیر است:

1- مقادیر حاصل از پیش‌بینی برون‌نمونه‌ای بازده شاخص با استفاده ‌از روش رگرسیونی (آریما) به شکل معنی‌داری با مقادیر حاصل از روش شبکه عصبی تفاوت دارد.

2- مقادیر حاصل از پیش‌بینی برون‌نمونه‌ای بازده با استفاده ‌از روش رگرسیونی (آریما) به شکل معنی‌داری با مقادیر حاصل از روش شبکه عصبی موجکی تفاوت دارد.

3- مقادیر حاصل از پیش‌بینی برون‌نمونه‌ای بازده با استفاده‌ از روش شبکه عصبی به شکل معنی‌داری با مقادیر حاصل از روش شبکه عصبی موجکی تفاوت دارد.

 

 

روش پژوهش

مدل پیش‌بینی

در این پژوهش، سه مدل پیش‌بینی مختلف شامل: مدل پیش‌بینی سری زمانی آریما، شبکه عصبی، مدل‌های مبتنی بر موجک و نویززدایی بسته موجک را اجرا نمودیم.

 

مدل آریما

برای تعیین و برآورد مدل آریما توجه به چند نکته ضروری است: اولین و مهمترین نکته توجه به ‌این موضوع است که آیا سری زمانی ماناست یا خیر؟ مانا بودن یا نبودن یک سری زمانی تأثیر بسیار مهمی بر رفتار و ویژگی‌های یک سری زمانی دارد. به منظور تعیین مانا بودن سری زمانی می‌توان از آزمون دیکی‌فولر استفاده نمود. هدف اصلی این آزمون بررسی این فرضیه ‌است که‌ آیا در مدل زیر خواهد بود؟

(4)

 

 

 

نتایج این آزمون در جدول زیر آورده شده ‌است. مقدار آماره آزمون نشان می‌دهد که فرضیه صفر با 99% اطمینان رد می‌شود و سری زمانی مربوط به بازده شاخص ماناست و ریشه واحد ندارد.

 

 

جدول (1) نتایج آزمون آماره t

احتمال

آماره t

 

 

0000/0

769/9-

433/3-

863/2-

567/2-

 

سطح 1%

سطح 5%

سطح 10%

آماره آزمون دیکی فولر:

مقادیر بحرانی آزمون:

 

 

برای تشکیل یک مدل آریما، اولین گام بررسی نمودار همبستگی پسماندهاست. بدین منظور، می‌توانیم از همبستگی‌نگار[27] استفاده نماییم. این مرحله ‌از تشکیل مدل آریما، مرحله تشخیص نامیده می‌شود. ماهیت همبستگی بین مقادیر فعلی و گذشته‌ پسماندها به ‌انتخاب مشخصات مدل آریما کمک می‌نماید. تفسیر خود همبستگی‌ها ساده ‌است، هر یک از آنها ضریب همبستگی مقادیر فعلی سری با وقفه‌های آن است، اما خودهمبستگیِ بخشی کمی پیچیده‌تر است. آنها همبستگی مقادیر فعلی با وقفه‌های آن را پس از در نظر گرفتن قدرت پیش‌بینی سری با همه وقفه‌های کوچکتر اندازه می‌گیرد. برای مثال، خودهمبستگیِ بخشی برای وقفه ششم قدرت پیش‌بینی اضافی  را هنگامی که  از قبل در مدل پیش‌بینی باشند، محاسبه می‌نماید. در حقیقت، خودهمبستگیِ بخشی دقیقاً ضریب رگرسیون  در رگرسیونی است که وقفه‌های قبل‌تر برای پیش‌بینی  استفاده شده باشند. اقدام بعدی تعیین نوع مدلی است که می‌خواهیم به کار ببریم. اگر تابع خودهمبستگی به آرامی و با یک نرخ هندسی کاهش یابد و تابع خودهمبستگیِ بخشی بعد از وقفه ‌اول صفر باشد، مدل خود رگرسیو مرتبه ‌اول مناسب خواهد بود. اگر تابع خودهمبستگی بعد از وقفه‌ اول صفر باشد و تابع خودهمبستگیِ بخشی به شکل‌ هندسی کاهش یابد، به نظر می‌رسد فرآیند میانگین متحرک مرتبه اول مناسب خواهد بود. اگر خودهمبستگی‌ها دارای الگوی فصلی باشند، بیانگر وجود ساختار آرمای فصلی در سری زمانی است]15[.

هدف تجزیه و تحلیل آریما نمایش صرفه جویانه ‌از فرآیند کنترل پسماندهاست. بنابراین، باید از جمله‌های خود رگرسیو و میانگین متحرک کافی (تعداد وقفه‌های مناسب) برای برازش ویژگی‌های پسماند استفاده کنیم. معیار اطلاعاتی آکائیک[28] و معیار شوآرتز[29] برای به دست آوردن میزان وقفه‌های مناسب در مدل استفاده می‌شوند. برای داده‌های مربوط به بازده شاخص معیار آکائیک تعداد 8 وقفه برای فرآیند خود رگرسیو و 7 وقفه برای فرآیند میانگین متحرک پیشنهاد می‌دهد. بنابراین، ما از معادله 5 مدل آریما را تخمین می­زنیم:

 

، داده‌های سری زمانی (بازده شاخص) است. وقفه‌های  اُم سری زمانی و  وقفه‌های  اُم عبارت اخلال است.

به منظور پیش‏بینی با مدل‏های آریما از نرم‌افزار ای‌ویوز[30]، بهره گرفته شد.

 

 

مدل شبکه عصبی

مدل پیش‌بینی شبکه عصبی، سری‌های زمانی خام را به عنوان سیگنال ورودی دریافت و آینده را پیش‌بینی می‌نماید. پیاده‌سازی چنین مدلی آسان است. به ‌هر حال، نویز موجود در داده‌های سری زمانی به طور جدی بر روی صحت پیش‌بینی اثر خواهد گذاشت. برای حل این مشکل، مدل‌های مبتنی بر نویززدایی موجک پیشنهاد می‌شود. شکل 1- مدل پیش‌بینی مبتنی بر نویززدایی موجک را نشان می‌دهد که در آن داده‌های خام سری زمانی ابتدا با استفاده‌ از تکنیک‌های نویززدایی موجک پیش پردازش می‌شوند و سپس با استفاده ‌از شبکه عصبی پیش‌بینی انجام می‌پذیرد.

شبکه عصبی دارای دو مدل مستقل است: یکی برای آموزش و دیگری برای پیش‌بینی. در این سیستم داده‌های سری زمانی به سه قسمت تقسیم می‌شود: مجموعه ‌آموزش، مجموعه ‌اعتبارسنجی و مجموعه ‌آزمون.

با داشتن سری زمانی  می­توان  گام جلوتر؛ یعنی را پیش‌بینی نمود. در مرحله پیش پردازش، مجموعه داده‌های سری زمانی برای به دست آوردن چهار تفصیل[31] با فرکانس بالا و یک تقریب[32] با فرکانس پایین با استفاده‌ از تجزیه و تحلیل موجک ایستا از سطح یک تا چهار تجزیه می‌شوند.

 

 

 

 

 

 

 

 

شکل (2) مدل پیش‌بینی مبتنی بر نویززدایی موجک

 

 

در مرحله دوم، نتایج تجزیه موجک به پیش‌بینی‌کننده شبکه عصبی داده می‌شود. در این مرحله شبکه‌های عصبی به منظور پیش‌بینی مقادیر  برای هرکدام از مقیاس تجزیه به طور مجزا و در یک زمان آموزش داده می‌شوند. در مرحله سوم، به منظور پیدا کردن شبکه‌ای که بهترین پیش‌بینی را برای مجموعه داده‌های اعتبارسنجی (یعنی کمترین ریشه میانگین مربعات خطا) فراهم می‌نماید، شبکه‌ها را آموزش می‌دهیم و آن را ذخیره می‌نماییم. این مدل از شبکه‌های عصبی آموزش داده شده را به طور مستقیم برای پیش‌بینی  استفاده می­کنیم. انتخاب لایه‌های پنهان و واحدهای پنهان در بخش بعدی توضیح داده خواهد شد.

برای پیش‌بینی برون‌نمونه‌ای از فرآیند نشان داده شده در شکل زیر استفاده می‌نماییم. شکل 2 پیش‌بینی برون‌نمونه‌ای یک گام به جلو1 را به تصویر می‌کشد.

 

 

 

شکل (3) پیش‌بینی برون‌نمونه‌ای یک گام به جلو

 

 

با استفاده ‌از جعبه ‌ابزار موجک در نرم افزار مطلب 2010 سری زمانی را با موجک‌هار و دابیشز در سطح دو تا چهار تجزیه و سپس ضرایب تفصیل و جزئیات را برای پیش‌بینی وارد شبکه عصبی نمودیم و در پایان پیش‌بینی‌های حاصل از شبکه عصبی را با یکدیگر جمع کردیم. شبکه‌های عصبی در این سیستم با استفاده ‌از تابع نوشته شده ‌ایجاد و آموزش داده شدند. شبکه‌های عصبی با استفاده ‌از الگوریتم مارکوآرد لونبرگ آموزش داده شدند و تابع فعالیت لایه خروجی خطی است. همه داده‌های ورودی قبل از وارد کردن به شبکه عصبی در محدوده (1- و 1) نرمال شدند.

برای تعیین معماری شبکه باید تصمیم بگیریم چه تعداد لایه پنهانی و چه تعداد نورون در یک لایه پنهان استفاده کنیم. در این بخش طرح خود را توضیح خواهیم داد. [33]

انتخاب تعداد لایه‌های پنهانی مسأله بسیار مهمی است، زیرا تعداد زیاد این لایه‌ها عملکرد شبکه را کاهش می‌دهد. از نظر تئوریک یک شبکه عصبی با دو لایه پنهان قادر است هر تابع غیرخطی را با یک درجه دلخواه دقت تخمین بزند. بنابراین، دلیلی وجود ندارد که ‌از شبکه‌های عصبی با بیش از دو لایه پنهان استفاده نماییم. گذشته ‌از این، اثبات شده ‌است که برای اکثر مشکلات عملی به ‌استفاده بیشتر از یک لایه پنهان نیازی نیست. در نتیجه، شبکه عصبی در مدل ما تنها یک لایه پنهان دارد.

موضوع مهم دیگر انتخاب تعداد بهینه نورون‌های پنهان در شبکه‌های عصبی است. اگر تعداد نورون‌ها خیلی کم باشد، سیستم دچار خطای بالای آموزش می‌شود و خطای بالای تعمیم‌سازی در رابطه با کم‌ برازشی روی خواهد داد. در مقابل، اگر تعداد نورون‌های پنهان خیلی زیاد باشد، مدل ممکن است خطای آموزش کمی داشته باشد، ولی خطای تعمیم‌سازی بالایی در رابطه با بیش ‌برازشی خواهد داشت. در این طرح، ما از 10 نورون در لایه پنهان استفاده کردیم.

 

مدل مبتنی بر نویززدایی موجک

در این مدل پیشنهادی، از تبدیل موجک ایستا برای تجزیه و استخراج مشخصات موجک استفاده می‌نماییم. علت اینکه چرا ما این کار را انجام دادیم، این است که وردا بودن تبدیل[34] یک عیب شناخته شده برای تبدیل موجک گسسته ‌است؛ هرچند بعضی از پژوهش­ها این مشکل را نادیده گرفتند. بنابراین، فکر می‌کنیم نشان دادن تأثیر استفاده از تبدیل موجک گسسسته‌ ناوردای تبدیل روی عملکرد پیش‌بینی ضروری است. در این پژوهش سطوح تجزیه موجک و توابع موجک را براساس تجربه تعیین نمودیم. ما دریافتیم که تجزیه موجک در سطح دو برای روش‌های مبتنی بر نویززدایی موجک مناسب تر است و بهترین نتایج پیش‌بینی را برای مدل پیشنهادی فراهم می‌کند. موجک‌هار و موجک دابیشز را به عنوان تابع موجک انتخاب نمودیم، زیرا بهترین عملکرد پیش‌بینی را از خود نشان می‌دهند ]9[.

هنگامی که ما تابع موجک را برای مدل مبتنی بر نویززدایی موجک و مدل پیشنهادی انتخاب نمودیم، متوجه شدیم که عملکرد پیش‌بینی مدل‌ها متناسب با مرتبه موجک است و موجک دابیشز بهترین عملکرد را دارد. بنابراین، در مدل‌ها از این موجک استفاده نمودیم. پژوهش‌های گذشته نشان می‌دهد که در بخش‌های کم نوسان سری زمانی تفاوت عملکرد بین موجک و نویززدایی موجک قابل ملاحظه نیست. به‌ هر حال، در بخش‌های پرنوسان داده‌ها، نویززدایی بسته موجک گاهی ‌اوقات می‌تواند اثر بهتری از نویززدایی فراهم کند ]9[.

 

نتایج آزمون فرضیه‌ها

برای پیش‌بینی 20 روزه، مدل‌های فوق 20 بار تخمین زده و با هربار تخمین داده‌های روز بعد پیش‌بینی شده ‌است.

برای بررسی اختلاف میانگین بین مقادیر و مقادیر پیش‌بینی شده، ‌از آزمون مقایسه زوجی بین مقادیر استفاده نمودیم. نتایج این آزمون‌ها در جدول زیر قابل مشاهده ‌است. مقدار آماره آزمون برای مدل آریما
 (553/0-t=) بیانگر این است که بین میانگین مقادیر پیش‌بینی شده و مقادیر واقعی اختلاف معنی‌داری مشاهده نمی‌شود.

 

 

 

 

 

جدول (2) مقدار آماره آزموننمونه‌های زوجی برای مدل آریما

آزمون نمونه‌های زوجی

 

فاصله 95% اطمینان

آماره

درجه ‌آزادی

معنی‌داری

پایین تر

بالاتر

 

218/0-

127/0

553/0-

19

587/0

 

238/0-

076/0

076/1-

19

296/0

 

178/0

072/0

889/0

19

385/0

 

 

همانند مدل آریما برای پیش‌بینی 20 روزه با استفاده ‌از شبکه عصبی مدل فوق را 20 بار آموزش داده و در هر بار شبکه بهینه را به دست آوردیم. سپس با هرکدام از شبکه‌های بهینه مقدار بازده روز بعد پیش‌بینی شده ‌است. نتایج آزمون مقایسه زوجی برای پیش‌بینی شبکه عصبی (076/1-t=) بیانگر این است که بین میانگین مقادیر پیش‌بینی‌شده و مقادیر واقعی اختلاف معنی‌داری مشاهده نمی‌شود.

شکل 3- سیگنال اصلی به ‌همراه سیگنال نویززدایی شده و باقیمانده‌ها را برای نویززدایی موجک به وسیله موجک دابیشز 40 در سطح 4 نشان می‌دهد. باقیمانده‌ها از تفاضل سیگنال نویززدایی‌شده‌ از سیگنال اصلی به دست می‌آید.

 

 

 

شکل (4) سیگنال اصلی به ‌همراه سیگنال نویززدایی شده و باقیمانده‌ها

 

 

نتایج آزمون مقایسه زوجی برای پیش‌بینی شبکه عصبی موجکی (889/0-t=) بیانگر این است که بین میانگین مقادیر پیش‌بینی شده و مقادیر واقعی اختلاف معنی‌داری مشاهده نمی‌شود.

 

 

 

نتایج مقایسه مدل‌ها

به منظور بررسی معنی‌داری میزان اختلاف بین عملکرد پیش‌بینی روش‌های مختلف، از آزمون مقایسه زوجی بین خطای روش‌های مختلف استفاده می‌کنیم. آزمون زیر نشان می‌دهد که در سطح 95% اطمینان میان روش‌های پیش‌بینی آریما و شبکه عصبی تفاوت معنی‌داری وجود ندارد (198/1t=).

 

 

 

 

 

جدول (3) بررسی معنی‌داری میزان اختلاف بین عملکرد پیش‌بینی و سایر روش‌ها

آزمون نمونه‌های زوجی

 

فاصله 95% اطمینان

آماره

درجه‌ آزادی

معنی داری

پایین تر

بالاتر

 

-028/0

103/0

198/1

19

246/0

 

060/0

171/0

391/4

19

0/000

 

026/0

130/0

128/3

19

006/0

 

 

همچنین، در سطح 95% اطمینان میان روش‌های پیش‌بینی آریما و شبکه عصبی موجکی تفاوت معنی‌داری وجود دارد و میزان خطاهای پیش‌بینی آریما به شکل معنی‌داری از خطاهای پیش‌بینی شبکه عصبی موجکی بزرگتر است. بنابراین، شبکه عصبی موجکی پیش‌بینی بهتری ارایه می‌دهد. ردیف آخر نشان می‌دهد که در سطح 95% اطمینان میان روش‌های پیش‌بینی شبکه عصبی و شبکه عصبی موجکی تفاوت معنی‌داری وجود دارد و میزان خطاهای پیش‌بینی شبکه عصبی به شکل معنی‌داری از خطاهای پیش‌بینی شبکه عصبی موجکی بزرگتر است. بنابراین، شبکه عصبی موجکی پیش‌بینی بهتری نسبت به شبکه عصبی ارایه می‌دهد.

 

مقایسه صحت پیش‌بینی

برای مقایسه صحت پیش‌بینی از آزمون دایبولد – ماریانو[35] استفاده می‌کنیم. با در نظر گرفتن  به عنوان سری زمانی می‌توانیم با استفاده ‌از روش‌های گوناگون (آرما، شبکه عصبی و غیره) آن را پیش‌بینی نماییم. اگر ، پیش‌بینی سری زمانی با روش آرما و ، پیش‌بینی سری زمانی با استفاده از روش شبکه عصبی باشد، خطای پیش‌بینی به صورت زیر به دست می‌آید:

 

آماره دایبولد – ماریانو به صورت زیر به دست می‌آید:

 

 ، تخمین واریانس مجانب  است. دایبولد و ماریانو (1995) نشان می‌دهند که تحت فرضیه قدرت پیش‌بینی‌کنندگی یکسان داریم:

 

بنابراین، فرضیه قدرت پیش‌بینی یکسان را در سطح 95% زمانی رد می‌کنیم که داشته باشیم:

 

آزمون DM را برای خطای پیش‌بینی با روش‌های آریما، شبکه عصبی و شبکه عصبی موجکی دو به دو به کار بردیم:

آماره آزمون برای روش‌های آریما و شبکه عصبی:

3448/2-S=

آماره ‌آزمون برای روش‌های آریما و شبکه عصبی موجکی:

5666/2-S=

آماره آزمون برای روش‌های شبکه عصبی و شبکه عصبی موجکی:

9838/1-S=

همان طور که نتایج آزمون نشان می‌دهد، در سطح اطمینان 95% قدرت پیش‌بینی شبکه عصبی بیشتر از آریما و قدرت شبکه عصبی موجکی بهتر از آریما و شبکه عصبی است.

 

نتیجه‌گیری

در فصول پیشین به تشریح موضوع و بیان مساله پژوهش پرداختیم. سپس با تکیه بر ادبیات پژوهش، روش پژوهش مناسب و شیوه‌های تجزیه و تحلیل داده‌ها را برگزیدیم. در ادامه، نتایج آزمون هر یک از فرضیه‌های پژوهش آورده می‌شود.

فرضیه ‌اول پژوهش حاضر مبنی بر اینکه مقادیر حاصل از پیش‌بینی برون‌نمونه‌ای بازده شاخص بورس اوراق بهادار تهران، با استفاده ‌از روش رگرسیونی (آریما) به شکل معنی‌داری متفاوت ‌از روش شبکه عصبی است، با استفاده ‌از مقایسه زوجی مورد آزمون قرار گرفت. نتایج نشان می‌دهد که در سطح 95% اطمینان میان روش‌های پیش‌بینی آریما و شبکه عصبی تفاوت معنی‌داری وجود ندارد (198/1t=). با توجه به ‌همبستگی سریالی که می‌تواند بین پیش‌بینی‌های حاصل از مدل‌های مختلف به وجود آید (به علت وجود نمونه‌های همپوشان) از آزمون دایبولد – ماریانو نیز استفاده شد که نتایج حاصل از آن بیانگر بهتر بودن قدرت پیش‌بینی شبکه عصبی نسبت به مدل آریماست (3448/2-dm=).

آزمون‌های فوق را برای فرضیه دوم نیز انجام دادیم. نتایج آزمون مقایسه زوجی نشان می‌دهد که در سطح 95% اطمینان میان روش‌های پیش‌بینی آریما و شبکه عصبی موجکی تفاوت معنی‌داری وجود دارد (391/4t=).  نتایج آزمون دایبولد – ماریانو نیز نشان می‌دهد که قدرت پیش‌بینی شبکه عصبی موجکی نسبت به مدل آریما بیشتر است (5666/2-dm=).

فرضیه سوم پژوهش حاضر مبنی بر اینکه «مقادیر حاصل از پیش‌بینی برون‌نمونه‌ای بازده شاخص بورس اوراق بهادار تهران با استفاده‌ از روش شبکه عصبی به شکل معنی‌داری با مقادیر حاصل از پیش‌بینی با استفاده ‌از روش شبکه عصبی موجکی تفاوت دارد» نیز آزمون شد. نتایج آزمون مقایسه زوجی نشان می‌دهد که در سطح 95% اطمینان میان روش‌های پیش‌بینی شبکه عصبی و شبکه عصبی موجکی تفاوت معنی‌داری وجود دارد (128/3t=). نتایج آزمون دایبولد – ماریانو نیز بیانگر بهتر بودن قدرت پیش‌بینی شبکه عصبی موجکی نسبت به شبکه عصبی است (9838/1-t=).

این یافته‌ها با نتایج پژوهش‌های مشابه یکسان است. بدین ترتیب، می‌توان چنین نتیجه گرفت که برای پیش‌بینی بازده شاخص بورس اوراق بهادار تهران، مدل شبکه عصبی موجکی (نویززدایی سیگنال) عملکردی بهتر از مدل‌های آریما و شبکه عصبی دارد. همچنین، مدل‌های شبکه عصبی قدرت پیش‌بینی‌کنندگی بهتری را نسبت به مدل‌های آریما نشان می‌دهد.

 

پیشنهادهای پژوهش

با توجه به ‌اینکه پژوهش حاضر برای پیش‌بینی بازده شاخص بورس اوراق بهادار تهران انجام شد، می‌توان در پژوهش‌های دیگر قدرت پیش‌بینی مدل‌ها را برای قیمت نفت، ارز و سایر شاخص‌های جهانی انجام داد و نتایج آن را با یکدیگر مقایسه کرد.

در این پژوهش، تنها از وقفه‌های سری زمانی برای پیش‌بینی استفاده شد. می‌توان برای پژوهش‌های بعدی از ویژگی‌های آماری سری زمانی نظیر: میانگین، واریانس، چولگی، کشیدگی و آنتروپی شانون استفاده نمود.

پیش‌بینی‌های این پژهش به صورت یک گام رو به جلو (کوتاه مدت) انجام شده ‌است. برای کارهای آتی پیشنهاد می‌شود که‌ از پیش‌بینی‌های میان‌مدت و بلند‌مدت نیز استفاده شود تا بتوان مدلی طراحی کرد که پیش‌بینی‌های دقیق‌تری در میان‌مدت و بلندمدت ارایه نماید.

در این مطالعه، تنها از شبکه عصبی برای پیش‌بینی‌های غیرخطی استفاده شد. بنابراین، بهتر است در کارهای آینده ‌از منطق فازی و سایر الگوریتم‌ها برای پیش‌بینی‌های بهتر استفاده شود.

نتایج به دست آمده برای دوره زمانی مورد بررسی؛ یعنی بازه زمانی ده ساله 1381 تا 1391 صادق است، لذا به منظور بررسی این مساله که ‌آیا مدل مزبور برای همه بازه‌های زمانی کاربرد دارد یا خیر، می‌توان دوره‌های زمانی طولانی‌تر و انجام تقسیم‌بندی‌های جزئی‌تر را به کار برد. برای مثال، می‌توان دوره زمانی ده ساله را به دو دوره پنج‌ساله و یا پنج دوره دوساله تقسیم و در هر دوره ‌اقدام به پیش‌بینی نمود و سپس نتایج را مقایسه کرد.



[1]. D/P

[2]. P/E

[3]. Autoregressive

[4]. Autoregressive Integration Moving Average

[5]. Autoregressive Conditional Heteroskedasticity

[6]. Schinkman and LeBaron

[7]. Bouqata Bouchra

[8]. Artificial Neural Network

[9]. Algis Garliauskas

[10]. Zhang Qian and Gao Liqun

[11]. Wavelet Noise Filtering

[12]. Least Square Method

[13]. Artificial Intelligence

[14]. Neural Network

[15]. Genetic Algorithm

[16]. In-Sample

[17]. Out-of-Sample

[18]. Invariance

[19]. Downsampling

[20]. Upsampling

[21]. Wai

[22]. Normal Mean Square Error

[23]. Tsieh

[24]. Artificial Bee Colony

[25]. Wang and Gupta

[26]. Exchange Traded Funds (ETF’s)

[27]. Correlogram

[28]. Akaike Information Criterion

[29]. Schwarz

[30]. Eviews 7.1

[31]. Detail

[32]. Approximation

[33]. One-Step Ahead

[34]. Shift Variant

[35]. Diebold-Mariano

منابع
[1]     بهرادمهر، نفیسه. (1388). «پیش بینی قیمت نفت خام با استفاده ‌از هموارسازی موجک و شبکة عصبی مصنوعی»، فصلنامة مطالعات اقتصاد انرژی، ش 18، پاییز 1388.
[2]     مجیری، محمدحسن. (1386). ارزیابی درجه‌اعتبار پیش بینی بازده سهام شرکت‌های پذیرفتهشده در بورس با استفاده‌از روش داده کاوی طی سال‌های 1384-1380 (درون نمونه‌ای - برون نمونه‌ای)، پایان‌نامه کارشناسی ارشد.
[3]     سینایی، حسنعلی؛ مرتضوی، سعیدا... و تیموری اصل، یاسر. (١٣٨٤). «پیش بینی شاخص بورس اوراق بهادار تهران با استفاده ‌از شبکه‌های عصبی مصنوعی»، مجله بررسی‌های حسابداری و حسابرسی، سال دوازدهم، ش ٤١، پاییز، صص5 -٨٣.
[4]     عباسی‌نژاد، حسین و محمدی، احمد. (1386). «پیش بینی نرخ ارز با استفاده ‌از شبکه‌های عصبی و تبدیل موجک»، نامه مفید، ش 60، تیر 1386.
[5]     مساعدی، ابوالفضل. (2010). «پیش‌بینی بارش‌های ماهانه با استفاده ‌از تئوری موجک و سری‌های زمانی»، اولین همایش ملی توسعه منابع آب، اهواز.
[6]   Renaud, L. S. O., Murtagh, F. (2002). Wavelet-Based Fore Casting of Short and Long Memory Time Series. Cahiers du Department d'Econometrie, 4.
[7]   Chui, C., Wavelets, K., (1987). A Mathematical Tool for Signal Analysis. Society for Industrial Mathematics.
[8]   Bradley, A. P., (2003). Shift-Invariance in the Discrete Wavelet Transform. Proceedings of the Seventh International Conference on Digital Image Computing: Techniques and Applications, 1, pp.29-38,.
[9]   Tan, C., (2009). Financial Time Series Forecasting Using Improved Wavelet Neural Network. Master's Thesis, 31,
[10]            Hajto, P., (2002). A Neural Economic Time Series Prediction with the Use of a Wavelet Analysis. Institute of Computer Science, Jagiellonian University, Schedae informaticae, vol. 11.
[11]            Yousefi, S., Weinreich, I., Reinarz, D., (2005). Wavelet-Based Prediction of Oil Prices. Chaos, Solitons and Fractals 25, pp. 265–275.
[12]            Wai Cheong, C., (2004). Clustering and Predicting Stock Prices Using Advanced Wavelet Methods and Neural Networks – a study on KLSE, Malaysian University of Science and Technology, Master's Thesis, July.
[13]            Hsieh, T., Hsiao, H., and Yeh, W. (2011). Forecasting Stock Markets Using Wavelet Transforms and Recurrent Neural Networks: An integrated System Based on Artificial Bee Colony Algorithm. In Proceedings of Appl. Soft Comput., pp. 2510-2525.
[14]            Zhao, Y., Zhang, Y., Qi, C. (2008). Prediction Model of Stock Market Returns Based on Wavelet Neural Network. Pacific-Asia Workshop on Computational Intelligence and Industrial Application, IEEE. Volume 1, Pages, pp.31-36. 15- EViews 7 User's Guide II.
[15]            Pesquef, J.C., Krim, H. and Carfantan, H. (1994). Time-Invariant Orthonormal Wavelet Representations. IEEE Trans on Signal Processing. Vo1.44. No.8.
[16]            Gupta, S., Wang, L.P. (2013). Neural Networks and Wavelet De-Noising for Stock Trading and Prediction. Time Series Analysis, Modeling and Applications. Volume 47, pp 229-247.
[17]            Mallat, S.g. A. (1989). Theory for Multiresolution Signal Decomposition: The Wavelet Representation. IEEE transactions on pattern analysis and machine intelligence. Volume 11, no 7, July.