Authors
University of tehran
Abstract
Keywords
Main Subjects
مقدمه
پیشبینی، پیش شرط تصمیم است. بدون پیشبینی علمی، مدیریت علمی نیز وجود نخواهد داشت. به منظور اتخاذ تصمیمهای سرمایهگذاری و به کارگیری مدیریت ریسک کاراتر، تصمیمگیرنده (سرمایه گذار) باید به موقع تغییرات بازار سهام را که تحت سیستم اقتصادی بازار قرار دارد، شناسایی کند. نوسانهای قیمت بازار سهام تنها به رابطه بین عرضه و تقاضا وابسته نیست، بلکه توسط عوامل خارجی، نظیر: سیاستگذاریها، خطمشیها و نوسانهای بازار سهام خارجی که باعث دشوار شدن شبیهسازی و پیشبینی سیگنال مالی میشود، تحت تأثیر قرار میگیرد. پرسشی که در اینجا مطرح میشود، این است که چگونه باید دقت پیشبینی سیگنالهای مالی را که موضوع مهمی در زمینه مالی است، بهبود بخشید؟
بیان مسأله
موضوع شناخت و بررسی رفتار قیمت سهام و ارزشیابی داراییهای مالی، همواره یکی از موضوعهای مهم و مورد توجه محافل علمی و سرمایهگذاری بوده است. ناشناخته بودن عواملی که بر تغییرات قیمت سهام (بازده) تأثیر میگذارند، دلیلی برای روی آوردن به پیشبینی تغییرات قیمت سهام شرکتهاست. در صورتی که این پیشبینیها با اریبها و خطاهای زیادی همراه باشند، نتایج حاصل از این پیشبینیها نیز شدیداً تحت تأثیر قرار میگیرند.
مقالههای متعددی درخصوص توان پیشبینی بازده سهام با استفاده از اطلاعات گذشته وجود دارد. پژوهشگران تعداد زیادی از متغیرهای مالی را شناسایی کردهاند که بازده آتی سهام را پیشبینی میکنند. بعضی از این متغیرها شامل: درصد تغییرات قیمت، ارزش بازار شرکت، نسبت سود تقسیمی به قیمت[1]، نسبت قیمت به عایدیها[2]، نسبت قیمت دفتری به عایدیها، نسبت قیمت دفتری به قیمت بازار، نسبت قیمت بازار بهارزش خالص، درصد سود پرداختی، نرخ بهره کوتاهمدت، نسبت مصرف به ثروت و ... است. اساسیترین و عمومیترین مدل برای پیشبینی با استفاده از نسبتهای فوق مدلهای رگرسیونی است. در کنار روشهای برآورد و پیشبینی دادههای مدلها، آزمون اعتبار و قابلیت پیشبینی این روشها نیز توسعه یافته است] 2[.
از زمانی که بازار سهام در قرن نوزدهم ایجاد شد، بسیاری از پژوهشگران به پژوهش بر روی مدل پیشبینی قیمت سهام تمرکز کردهاند. مدلهای پیشبینی آماری، نظیر: آرما[3]، آریما[4] وآرچ[5] به طور گسترده به کار برده شدهاند، اما هیچ کدام نتیجه مطلوب نداشتهاند. اخیراً تعداد زیادی از پژوهشگران در پژوهشهای خود بازار سهام را به عنوان یک سیستم پویای غیرخطی در نظر گرفتهاند. شینکمن و لوبارون[6] (1989) دریافتند که یک پدیده بینظم در سریهای روزانه و هفتگی بازده سهام وجود دارد. پوکاتابوچرا[7] (1997) تغییر نرخ بهره بازار را با استفاده از شبکه عصبی مصنوعی[8] پیشبینی کرد. آلگیس گارلیاسکاس[9] (1999) یک الگوریتم پیشبینی سیگنالهای مالی بینظم را بر اساس شبکه عصبی پیشنهاد داد. ژانگ کیان و ژائو لیکان[10] (2002) از تکنیک فیلترینگ اختلال موجک[11] و روش حداقل مربعات[12] برای پیشبینی قیمت سهام در چین استفاده کردند]14[.
دانشمندان و پژوهشگران در دهه آخر قرن بیستم عمدتاً به این اصل معتقد شدند که فرض منطقی بودن سرمایهگذاری که اصل غیرقابل اغماض در سرمایهگذاری مدرن مالی است و یکی از مفروضات اصلی در بازار کارا و یا مدل بازار است، با توجه به عوامل پیچیدهای که در بازارهای سهام دخیل هستند، واقعی نیست. آنها به این نتیجه رسیدهاند که بازار سرمایه دارای نظم مشخصی نیست و استفاده از ریاضیات پیچیده در سیستمهای غیرخطی و پویا میتواند مدلهایی را ایجاد کند که نظریههای گذشته را باطل نماید. در سالهای اخیر در پی پیشرفتهایی که در زمینه رایانه و هوش مصنوعی[13] و همچنین، کشف روابط آشوبی در سریهای زمانی غیرخطی پدید آمد، فعالیتهایی در جهت پیشبینی قیمت در بورس اوراق بهادار در کشورهای مختلف انجام شد. تکنیکهای هوش مصنوعی که شامل شبکههای عصبی[14]، الگوریتم ژنتیک[15] و منطق فازی است، نتایج موفقیتآمیزی در زمینه حل مسایل پیچیده به دست آوردهاند ]3[.
از طرف دیگر، پیشبینی دروننمونهای[16] از اعتبار چندانی برخوردار نیست، زیرا پیشبینی فرآیندی آینده نگر است؛ یعنی ما باید بتوانیم با دادههای امروز مقادیر مربوط به آینده را پیشبینی کنیم. مسلماً با وجود دادههای درون نمونهای، چیزی را که از پیشبینی انتظار داریم، به دست نخواهیم آورد. همان طور که در بالا اشاره شد پژوهشهای متعددی در دنیا در زمینه پیشبینی دروننمونهای انجام شده که در این پژوهشها هم از روشهای رگرسیونی و هم از روشهای شبکه عصبی استفاده شده است، اما پژوهشهای نسبتاً کمی در ارتباط با پیشبینی بروننمونهای[17] انجام شده است. در ایران نیز چندین مقاله مشاهده شده است که برای پیشبینی از روشهای رگرسیونی و شبکه عصبی استفاده کردهاند، اما تنها تعدادی از آنها از پیشبینی بروننمونهای استفاده کردهاند.
ادبیات پژوهش
موجکها توابع ریاضی هستند که برای تجزیه و تحلیل سریهای زمانی که شامل متغیرها و غیرثابتهاست، شکل مقیاس- زمان سریهای زمانی و روابط آنها را ارایه میدهند. تحلیل موجکی برای اطلاعات دارای فرکانس پایین، استفاده از فاصلههای زمانی طولانیمدت و برای اطلاعات دارای فرکانس بالا تناوبهای کوتاهتر را ارایه میدهد. تحلیل موجکی قادر به نمایش جنبههای گوناگون دادههای متفاوت، نقاط شکست و ناپیوستگیهاست که ممکن است دیگر روشهای تجزیه و تحلیل سیگنال آن را نشان ندهد]5[.
تبدیل موجک پیوسته تابعی از دو متغیر است که به روش طرحریزی تابع در یک موجک خاص و به وسیله معادله زیر به دست میآید:
نسخه اصلی تابع موجک به وسیله برگردانده و به وسیله انتقال داده شده است. در نتیجه، ضرایب موجک تابعی از این دو پارامتر؛ یعنی مکان و اسکیل هستند، درحالی که تابع اصلی تنها تابعی از یک پارامتر بود. ضرایب بزرگ موجک هنگامی روی میدهند که موجک خاص و تابع از نظر شکل مشابه باشند.
در عمل، تبدیل موجک گسسته از طریق الگوریتم هرمی مالات پیادهسازی میشود]18[. این فرآیند با دادههای شروع می شود و سپس سریها با استفاده از فیلتر میشوند. زیرنمونههای حاصل از خروجی این فیلتر نصف طول اصلیشان هستند. خروجی حاصل از فیلتر به عنوان ضرایب موجک حفظ میشود و سپس فرآیند فیلترینگ بالا بر روی خروجیهای حاصل از فیلتر تکرار میگردد. نماد بدین معنی است که هر مقدار دیگری از بردار ورودی حذف شده است.
یک سیگنال میتواند به وسیله الگوریتم آبشاری که در معادله 2- نشان داده شده است، بیشتر تجزیه شود.
و به ترتیب ضرایب تفصیل و ضرایب تقریب در سطح هستند.
یک مشکل در رابطه با تبدیل موجک گسسته این است که تبدیل موجک گسسته دارای وردایی[18] تبدیل است. وردایی تبدیل عبارت است از عدم تطابق تبدیل موجک گسسته یک سطح، با تبدیل موجک گسسته یک سطح دیگر با همان تغییر در یک توالی داده]7[. در رابطه با وردایی تبدیل میتوان گفت تغییرهای کوچک در شکل موجهای ورودی، به تغییرات بزرگ در ضرایب موجک منجر میشود و این باعث میشود انتقال گسسته موجک برای این پژوهش نامناسب باشد، زیرا ما نمیتوانیم این اطلاعات را به نقطه زمانی معین در مقیاسهای مختلف نسبت دهیم]6.[ بنابراین، ما به یک تبدیل موجک ناوردا و یا حداقل ناوردای زمانی برای مدل پیشبینی نیاز داریم] 8.[
تبدیل موجک ایستا، یکی از تبدیلهای موجک است که مهمترین خاصیت آن ناوردا بودن زمانی آن است. این روش مشابه تبدیل موجک گسسته است؛ با این تفاوت که عمل زیرنمونهگیری[19] از سیگنال در این روش انجام نمیشود و در عوض فیلترها بالانمونهگیری[20] میشوند]16[. پژوهشهای قبلی نشان دادهاند که وردایی تبدیل نتیجه عمل کاهش نمونه در تبدیل موجک گسسته است]8[. بنابراین، سادهترین راه برای اجتناب از وردایی تبدیل حذف کردن عملیات زیر نمونهگیری است و این درحقیقت، تفاوت اصلی بین تبدیل موجک ایستا و تبدیل موجک گسسته است. شکل 2-1 بانک فیلتر تبدیل موجک ایستا را نمایش میدهد. در این شکل میتوان مشاهده کرد که تبدیل موجک ایستا همانند تبدیل موجک گسسته است؛ غیر از اینکه در تبدیل موجک ایستا سیگنال هرگز دچار زیرنمونهگیری نمیشود و در عوض، در هر سطحی از تجزیه سیگنال با بالا نمونهگیری مواجه خواهد شد. بنابراین، تبدیل موجک ایستا ناوردایی تبدیل دارد و این دقیقاً همان چیزی است که ما میخواهیم.
شکل (1) بانک فیلتر برای تبدیل موجک ایستا
نویززدایی عبارت است از حذف نویز؛ به طوری که تا حد امکان اطلاعات مفید حفظ شود. مدل اصلی سیگنال نویزدار به شکل زیر است:
(3)
سیگنال مشاهده شده، سیگنال اصلی و نویز سفید گوسی با میانگین صفر و واریانس σ2است. هدف نویززدایی حذف این قسمت از نویز سیگنال و به دست آوردن است.
پژوهشهای صورت گرفته پیرامون پیشبینی شبکه عصبی موجکی
پاولهاجتو (2002) در مقاله خود با استفاده از شبکههای عصبی مصنوعی و موجکی به پیشبینی نرخ متوسط تبادل دلار و زلوتی (واحد پول لهستان) میپردازد. شبکه عصبی مورد استفاده وی، پرسپترون چندلایه با سه لایه و شش نورون و یک تابع تانژانتی است. نتایج وی نشان میدهد که الگوریتم پیشبینی برای دورههای کوتاهمدت عملکرد خوبی دارد، امّا زمانی که دورههای پیشبینی بیشتر میشود، میزان خطا افزایش مییابد]10[.
یوسفی و همکارانش (2003) از موجکها به عنوان ابزاری برای بررسی مسأله کارایی بازار در بازارهای آتی نفت استفاده کردند. آنها قیمت نفت را در افقهای زمانی مختلف پیشبینی و سپس نتایج آن را با دادههای بازار آتی نفت مقایسه کردند. آنها دریافتند که قدرت پیشبینی روش مبتنی بر موجک تا حد زیادی به اندازه نمونه حساس روش برای اندازههای نمونه 100 یا بیشتر، بهترین عملکرد را دارد]11[.
وای[21] (2004) به بررسی استفاده از روشهای موجکی در مسائل تجزیه و تحلیل بازار سهام، مانند: طبقهبندی سهام و پیشبینی قیمت سهام می پردازد. وی با پیاده سازی شبکه عصبی موجکی دریافت که پیشبینی قیمت سهام روز بعد دارای میانگین نرمال مربعات خطا[22] پایین در حد 20% است. نتایج پژوهش وی نشان میدهد که با استفاده از یک استراتژی معاملاتی ساده، شبکه عصبی موجکی ممکن است باعث عملکرد بهتر استراتژی خرید و نگهداری شود]12[.
سیه[23] و همکاران (2010) برای پیشبینی قیمت سهام، یک سیستم ترکیبی شامل تبدیلهای موجک و شبکه عصبی بازگشتی مبتنی بر الگوریتم کُلُنی زنبور عسل[24] را به کار بردند. نتایج نشان میدهد که این سیستم تا حد زیادی امید بخش بوده، می توان آن را در سیستمهای تجاری واقعی برای پیشبینی قیمت سهام و حداکثرسازی سود پیادهسازی نمود]13[.
وانگ و گوپتا[25] (2013) به پیشبینی قیمت آتی سهام (اساندپی 500) با استفاده از شبکههای عصبی و نویززدایی موجک اقدام نمودند. تجزیه و تحلیل موجک به منظور نویززدایی استفاده و با پیشبینیهای بدون نویززدایی مقایسه شد. در این مقاله، بر اساس قیمتهای پیشبینی شده و به منظور محاسبه کارایی نرخ بازده برای دورههای مختلف، یک استراتژی معاملاتی روزانه برای خرید و فروش به کار گرفته شد. صندوقهای قابل معامله در بورس[26] متعددی وجود دارند که از عملکرد اساندپی 500 تبعیت میکنند و سهام را با همان نسبت در شاخص نگه میدارند و در نتیجه بازده مشابهی را نیز ارایه می نمایند. بنابراین، این پژوهش میتواند برای کمک به سرمایهگذاری در این صندوقها بهرهبرداری شود. نتایج این پژوهش نشان میدهد که شبکههای عصبی در صورتی که همراه با آموزش و دادههای ورودی مناسب باشند، میتوانند برای دستیابی به سودآوری بالا در صندوقهای قابل معامله در بورس (مبتنی بر اساندپی 500) استفاده شوند.
بهرادمهر (1387) تلاش نموده با استفاده از تبدیل موجک و شبکة عصبی مدلی ارایه کند که پیشبینی دقیقتر و با خطای کمتری از قیمت نفت خام داشته باشد. در این مدل ترکیبی، از خاصیت هموارسازی تبدیل موجک برای کاهش سطح نویز دادهها استفاده و سپس به وسیله شبکة عصبی مصنوعی و با دادههای هموارسازی شده، قیمت نفت پیشبینی شده است. نتایج حاصل از مقایسة ریشه میانگین مربعات خطای مدلهای رقیب با مدل ترکیبی مورد اشاره، دلالت بر آن دارد که کاهش نویز و هموارسازی دادهها، عملکرد پیشبینی قیمت نفت را بهبود میبخشد]1[.
عباسینژاد و محمدی (1386) در پژوهش خود روش پیشبینیای ارایه مینمایند تا قدرت شبکههای عصبی و تبدیل موجک را با هم ترکیب کند. در این روش نرخهای ارز اصلی که باید پیشبینی شوند، در ابتدا با استفاده از تکنیک موجک به مؤلفههای مقیاسی متفاوتی تجزیه میشوند. در مرحله بعد تکنیک شبکههای عصبی برای مدلبندی هر کدام از مؤلفههای سریهای زمانی به کار گرفته میشود و پیشبینی نهایی سریهای زمانی اصلی با ترکیب پیشبینی این مؤلفهها به دست میآید. این روش برای پیشبینی یک و ده گام به جلوی نرخهای ارز روزانه به کار گرفته میشود. نتایج نشان میدهد که عملکرد این روش پیشنهادی در مقایسه با مدل شبکه عصبی و مدل آریما در پیشبینیها از یک گام تا پنج گام به جلو بهتر است ]4[.
فرضیههای پژوهش
فرضیههای این پژوهش به صورت زیر است:
1- مقادیر حاصل از پیشبینی بروننمونهای بازده شاخص با استفاده از روش رگرسیونی (آریما) به شکل معنیداری با مقادیر حاصل از روش شبکه عصبی تفاوت دارد.
2- مقادیر حاصل از پیشبینی بروننمونهای بازده با استفاده از روش رگرسیونی (آریما) به شکل معنیداری با مقادیر حاصل از روش شبکه عصبی موجکی تفاوت دارد.
3- مقادیر حاصل از پیشبینی بروننمونهای بازده با استفاده از روش شبکه عصبی به شکل معنیداری با مقادیر حاصل از روش شبکه عصبی موجکی تفاوت دارد.
روش پژوهش
مدل پیشبینی
در این پژوهش، سه مدل پیشبینی مختلف شامل: مدل پیشبینی سری زمانی آریما، شبکه عصبی، مدلهای مبتنی بر موجک و نویززدایی بسته موجک را اجرا نمودیم.
مدل آریما
برای تعیین و برآورد مدل آریما توجه به چند نکته ضروری است: اولین و مهمترین نکته توجه به این موضوع است که آیا سری زمانی ماناست یا خیر؟ مانا بودن یا نبودن یک سری زمانی تأثیر بسیار مهمی بر رفتار و ویژگیهای یک سری زمانی دارد. به منظور تعیین مانا بودن سری زمانی میتوان از آزمون دیکیفولر استفاده نمود. هدف اصلی این آزمون بررسی این فرضیه است که آیا در مدل زیر خواهد بود؟
(4)
نتایج این آزمون در جدول زیر آورده شده است. مقدار آماره آزمون نشان میدهد که فرضیه صفر با 99% اطمینان رد میشود و سری زمانی مربوط به بازده شاخص ماناست و ریشه واحد ندارد.
جدول (1) نتایج آزمون آماره t
احتمال |
آماره t |
|
|
0000/0 |
769/9- 433/3- 863/2- 567/2- |
سطح 1% سطح 5% سطح 10% |
آماره آزمون دیکی فولر: مقادیر بحرانی آزمون: |
برای تشکیل یک مدل آریما، اولین گام بررسی نمودار همبستگی پسماندهاست. بدین منظور، میتوانیم از همبستگینگار[27] استفاده نماییم. این مرحله از تشکیل مدل آریما، مرحله تشخیص نامیده میشود. ماهیت همبستگی بین مقادیر فعلی و گذشته پسماندها به انتخاب مشخصات مدل آریما کمک مینماید. تفسیر خود همبستگیها ساده است، هر یک از آنها ضریب همبستگی مقادیر فعلی سری با وقفههای آن است، اما خودهمبستگیِ بخشی کمی پیچیدهتر است. آنها همبستگی مقادیر فعلی با وقفههای آن را پس از در نظر گرفتن قدرت پیشبینی سری با همه وقفههای کوچکتر اندازه میگیرد. برای مثال، خودهمبستگیِ بخشی برای وقفه ششم قدرت پیشبینی اضافی را هنگامی که از قبل در مدل پیشبینی باشند، محاسبه مینماید. در حقیقت، خودهمبستگیِ بخشی دقیقاً ضریب رگرسیون در رگرسیونی است که وقفههای قبلتر برای پیشبینی استفاده شده باشند. اقدام بعدی تعیین نوع مدلی است که میخواهیم به کار ببریم. اگر تابع خودهمبستگی به آرامی و با یک نرخ هندسی کاهش یابد و تابع خودهمبستگیِ بخشی بعد از وقفه اول صفر باشد، مدل خود رگرسیو مرتبه اول مناسب خواهد بود. اگر تابع خودهمبستگی بعد از وقفه اول صفر باشد و تابع خودهمبستگیِ بخشی به شکل هندسی کاهش یابد، به نظر میرسد فرآیند میانگین متحرک مرتبه اول مناسب خواهد بود. اگر خودهمبستگیها دارای الگوی فصلی باشند، بیانگر وجود ساختار آرمای فصلی در سری زمانی است]15[.
هدف تجزیه و تحلیل آریما نمایش صرفه جویانه از فرآیند کنترل پسماندهاست. بنابراین، باید از جملههای خود رگرسیو و میانگین متحرک کافی (تعداد وقفههای مناسب) برای برازش ویژگیهای پسماند استفاده کنیم. معیار اطلاعاتی آکائیک[28] و معیار شوآرتز[29] برای به دست آوردن میزان وقفههای مناسب در مدل استفاده میشوند. برای دادههای مربوط به بازده شاخص معیار آکائیک تعداد 8 وقفه برای فرآیند خود رگرسیو و 7 وقفه برای فرآیند میانگین متحرک پیشنهاد میدهد. بنابراین، ما از معادله 5 مدل آریما را تخمین میزنیم:
، دادههای سری زمانی (بازده شاخص) است. وقفههای اُم سری زمانی و وقفههای اُم عبارت اخلال است.
به منظور پیشبینی با مدلهای آریما از نرمافزار ایویوز[30]، بهره گرفته شد.
مدل شبکه عصبی
مدل پیشبینی شبکه عصبی، سریهای زمانی خام را به عنوان سیگنال ورودی دریافت و آینده را پیشبینی مینماید. پیادهسازی چنین مدلی آسان است. به هر حال، نویز موجود در دادههای سری زمانی به طور جدی بر روی صحت پیشبینی اثر خواهد گذاشت. برای حل این مشکل، مدلهای مبتنی بر نویززدایی موجک پیشنهاد میشود. شکل 1- مدل پیشبینی مبتنی بر نویززدایی موجک را نشان میدهد که در آن دادههای خام سری زمانی ابتدا با استفاده از تکنیکهای نویززدایی موجک پیش پردازش میشوند و سپس با استفاده از شبکه عصبی پیشبینی انجام میپذیرد.
شبکه عصبی دارای دو مدل مستقل است: یکی برای آموزش و دیگری برای پیشبینی. در این سیستم دادههای سری زمانی به سه قسمت تقسیم میشود: مجموعه آموزش، مجموعه اعتبارسنجی و مجموعه آزمون.
با داشتن سری زمانی میتوان گام جلوتر؛ یعنی را پیشبینی نمود. در مرحله پیش پردازش، مجموعه دادههای سری زمانی برای به دست آوردن چهار تفصیل[31] با فرکانس بالا و یک تقریب[32] با فرکانس پایین با استفاده از تجزیه و تحلیل موجک ایستا از سطح یک تا چهار تجزیه میشوند.
شکل (2) مدل پیشبینی مبتنی بر نویززدایی موجک
در مرحله دوم، نتایج تجزیه موجک به پیشبینیکننده شبکه عصبی داده میشود. در این مرحله شبکههای عصبی به منظور پیشبینی مقادیر برای هرکدام از مقیاس تجزیه به طور مجزا و در یک زمان آموزش داده میشوند. در مرحله سوم، به منظور پیدا کردن شبکهای که بهترین پیشبینی را برای مجموعه دادههای اعتبارسنجی (یعنی کمترین ریشه میانگین مربعات خطا) فراهم مینماید، شبکهها را آموزش میدهیم و آن را ذخیره مینماییم. این مدل از شبکههای عصبی آموزش داده شده را به طور مستقیم برای پیشبینی استفاده میکنیم. انتخاب لایههای پنهان و واحدهای پنهان در بخش بعدی توضیح داده خواهد شد.
برای پیشبینی بروننمونهای از فرآیند نشان داده شده در شکل زیر استفاده مینماییم. شکل 2 پیشبینی بروننمونهای یک گام به جلو1 را به تصویر میکشد.
شکل (3) پیشبینی بروننمونهای یک گام به جلو
با استفاده از جعبه ابزار موجک در نرم افزار مطلب 2010 سری زمانی را با موجکهار و دابیشز در سطح دو تا چهار تجزیه و سپس ضرایب تفصیل و جزئیات را برای پیشبینی وارد شبکه عصبی نمودیم و در پایان پیشبینیهای حاصل از شبکه عصبی را با یکدیگر جمع کردیم. شبکههای عصبی در این سیستم با استفاده از تابع نوشته شده ایجاد و آموزش داده شدند. شبکههای عصبی با استفاده از الگوریتم مارکوآرد لونبرگ آموزش داده شدند و تابع فعالیت لایه خروجی خطی است. همه دادههای ورودی قبل از وارد کردن به شبکه عصبی در محدوده (1- و 1) نرمال شدند.
برای تعیین معماری شبکه باید تصمیم بگیریم چه تعداد لایه پنهانی و چه تعداد نورون در یک لایه پنهان استفاده کنیم. در این بخش طرح خود را توضیح خواهیم داد. [33]
انتخاب تعداد لایههای پنهانی مسأله بسیار مهمی است، زیرا تعداد زیاد این لایهها عملکرد شبکه را کاهش میدهد. از نظر تئوریک یک شبکه عصبی با دو لایه پنهان قادر است هر تابع غیرخطی را با یک درجه دلخواه دقت تخمین بزند. بنابراین، دلیلی وجود ندارد که از شبکههای عصبی با بیش از دو لایه پنهان استفاده نماییم. گذشته از این، اثبات شده است که برای اکثر مشکلات عملی به استفاده بیشتر از یک لایه پنهان نیازی نیست. در نتیجه، شبکه عصبی در مدل ما تنها یک لایه پنهان دارد.
موضوع مهم دیگر انتخاب تعداد بهینه نورونهای پنهان در شبکههای عصبی است. اگر تعداد نورونها خیلی کم باشد، سیستم دچار خطای بالای آموزش میشود و خطای بالای تعمیمسازی در رابطه با کم برازشی روی خواهد داد. در مقابل، اگر تعداد نورونهای پنهان خیلی زیاد باشد، مدل ممکن است خطای آموزش کمی داشته باشد، ولی خطای تعمیمسازی بالایی در رابطه با بیش برازشی خواهد داشت. در این طرح، ما از 10 نورون در لایه پنهان استفاده کردیم.
مدل مبتنی بر نویززدایی موجک
در این مدل پیشنهادی، از تبدیل موجک ایستا برای تجزیه و استخراج مشخصات موجک استفاده مینماییم. علت اینکه چرا ما این کار را انجام دادیم، این است که وردا بودن تبدیل[34] یک عیب شناخته شده برای تبدیل موجک گسسته است؛ هرچند بعضی از پژوهشها این مشکل را نادیده گرفتند. بنابراین، فکر میکنیم نشان دادن تأثیر استفاده از تبدیل موجک گسسسته ناوردای تبدیل روی عملکرد پیشبینی ضروری است. در این پژوهش سطوح تجزیه موجک و توابع موجک را براساس تجربه تعیین نمودیم. ما دریافتیم که تجزیه موجک در سطح دو برای روشهای مبتنی بر نویززدایی موجک مناسب تر است و بهترین نتایج پیشبینی را برای مدل پیشنهادی فراهم میکند. موجکهار و موجک دابیشز را به عنوان تابع موجک انتخاب نمودیم، زیرا بهترین عملکرد پیشبینی را از خود نشان میدهند ]9[.
هنگامی که ما تابع موجک را برای مدل مبتنی بر نویززدایی موجک و مدل پیشنهادی انتخاب نمودیم، متوجه شدیم که عملکرد پیشبینی مدلها متناسب با مرتبه موجک است و موجک دابیشز بهترین عملکرد را دارد. بنابراین، در مدلها از این موجک استفاده نمودیم. پژوهشهای گذشته نشان میدهد که در بخشهای کم نوسان سری زمانی تفاوت عملکرد بین موجک و نویززدایی موجک قابل ملاحظه نیست. به هر حال، در بخشهای پرنوسان دادهها، نویززدایی بسته موجک گاهی اوقات میتواند اثر بهتری از نویززدایی فراهم کند ]9[.
نتایج آزمون فرضیهها
برای پیشبینی 20 روزه، مدلهای فوق 20 بار تخمین زده و با هربار تخمین دادههای روز بعد پیشبینی شده است.
برای بررسی اختلاف میانگین بین مقادیر و مقادیر پیشبینی شده، از آزمون مقایسه زوجی بین مقادیر استفاده نمودیم. نتایج این آزمونها در جدول زیر قابل مشاهده است. مقدار آماره آزمون برای مدل آریما
(553/0-t=) بیانگر این است که بین میانگین مقادیر پیشبینی شده و مقادیر واقعی اختلاف معنیداری مشاهده نمیشود.
جدول (2) مقدار آماره آزموننمونههای زوجی برای مدل آریما
آزمون نمونههای زوجی |
|||||
|
فاصله 95% اطمینان |
آماره |
درجه آزادی |
معنیداری |
|
پایین تر |
بالاتر |
||||
218/0- |
127/0 |
553/0- |
19 |
587/0 |
|
238/0- |
076/0 |
076/1- |
19 |
296/0 |
|
178/0 |
072/0 |
889/0 |
19 |
385/0 |
همانند مدل آریما برای پیشبینی 20 روزه با استفاده از شبکه عصبی مدل فوق را 20 بار آموزش داده و در هر بار شبکه بهینه را به دست آوردیم. سپس با هرکدام از شبکههای بهینه مقدار بازده روز بعد پیشبینی شده است. نتایج آزمون مقایسه زوجی برای پیشبینی شبکه عصبی (076/1-t=) بیانگر این است که بین میانگین مقادیر پیشبینیشده و مقادیر واقعی اختلاف معنیداری مشاهده نمیشود.
شکل 3- سیگنال اصلی به همراه سیگنال نویززدایی شده و باقیماندهها را برای نویززدایی موجک به وسیله موجک دابیشز 40 در سطح 4 نشان میدهد. باقیماندهها از تفاضل سیگنال نویززداییشده از سیگنال اصلی به دست میآید.
شکل (4) سیگنال اصلی به همراه سیگنال نویززدایی شده و باقیماندهها
نتایج آزمون مقایسه زوجی برای پیشبینی شبکه عصبی موجکی (889/0-t=) بیانگر این است که بین میانگین مقادیر پیشبینی شده و مقادیر واقعی اختلاف معنیداری مشاهده نمیشود.
نتایج مقایسه مدلها
به منظور بررسی معنیداری میزان اختلاف بین عملکرد پیشبینی روشهای مختلف، از آزمون مقایسه زوجی بین خطای روشهای مختلف استفاده میکنیم. آزمون زیر نشان میدهد که در سطح 95% اطمینان میان روشهای پیشبینی آریما و شبکه عصبی تفاوت معنیداری وجود ندارد (198/1t=).
جدول (3) بررسی معنیداری میزان اختلاف بین عملکرد پیشبینی و سایر روشها
آزمون نمونههای زوجی |
|||||
|
فاصله 95% اطمینان |
آماره |
درجه آزادی |
معنی داری |
|
پایین تر |
بالاتر |
||||
-028/0 |
103/0 |
198/1 |
19 |
246/0 |
|
060/0 |
171/0 |
391/4 |
19 |
0/000 |
|
026/0 |
130/0 |
128/3 |
19 |
006/0 |
همچنین، در سطح 95% اطمینان میان روشهای پیشبینی آریما و شبکه عصبی موجکی تفاوت معنیداری وجود دارد و میزان خطاهای پیشبینی آریما به شکل معنیداری از خطاهای پیشبینی شبکه عصبی موجکی بزرگتر است. بنابراین، شبکه عصبی موجکی پیشبینی بهتری ارایه میدهد. ردیف آخر نشان میدهد که در سطح 95% اطمینان میان روشهای پیشبینی شبکه عصبی و شبکه عصبی موجکی تفاوت معنیداری وجود دارد و میزان خطاهای پیشبینی شبکه عصبی به شکل معنیداری از خطاهای پیشبینی شبکه عصبی موجکی بزرگتر است. بنابراین، شبکه عصبی موجکی پیشبینی بهتری نسبت به شبکه عصبی ارایه میدهد.
مقایسه صحت پیشبینی
برای مقایسه صحت پیشبینی از آزمون دایبولد – ماریانو[35] استفاده میکنیم. با در نظر گرفتن به عنوان سری زمانی میتوانیم با استفاده از روشهای گوناگون (آرما، شبکه عصبی و غیره) آن را پیشبینی نماییم. اگر ، پیشبینی سری زمانی با روش آرما و ، پیشبینی سری زمانی با استفاده از روش شبکه عصبی باشد، خطای پیشبینی به صورت زیر به دست میآید:
آماره دایبولد – ماریانو به صورت زیر به دست میآید:
، تخمین واریانس مجانب است. دایبولد و ماریانو (1995) نشان میدهند که تحت فرضیه قدرت پیشبینیکنندگی یکسان داریم:
بنابراین، فرضیه قدرت پیشبینی یکسان را در سطح 95% زمانی رد میکنیم که داشته باشیم:
آزمون DM را برای خطای پیشبینی با روشهای آریما، شبکه عصبی و شبکه عصبی موجکی دو به دو به کار بردیم:
آماره آزمون برای روشهای آریما و شبکه عصبی:
3448/2-S=
آماره آزمون برای روشهای آریما و شبکه عصبی موجکی:
5666/2-S=
آماره آزمون برای روشهای شبکه عصبی و شبکه عصبی موجکی:
9838/1-S=
همان طور که نتایج آزمون نشان میدهد، در سطح اطمینان 95% قدرت پیشبینی شبکه عصبی بیشتر از آریما و قدرت شبکه عصبی موجکی بهتر از آریما و شبکه عصبی است.
نتیجهگیری
در فصول پیشین به تشریح موضوع و بیان مساله پژوهش پرداختیم. سپس با تکیه بر ادبیات پژوهش، روش پژوهش مناسب و شیوههای تجزیه و تحلیل دادهها را برگزیدیم. در ادامه، نتایج آزمون هر یک از فرضیههای پژوهش آورده میشود.
فرضیه اول پژوهش حاضر مبنی بر اینکه مقادیر حاصل از پیشبینی بروننمونهای بازده شاخص بورس اوراق بهادار تهران، با استفاده از روش رگرسیونی (آریما) به شکل معنیداری متفاوت از روش شبکه عصبی است، با استفاده از مقایسه زوجی مورد آزمون قرار گرفت. نتایج نشان میدهد که در سطح 95% اطمینان میان روشهای پیشبینی آریما و شبکه عصبی تفاوت معنیداری وجود ندارد (198/1t=). با توجه به همبستگی سریالی که میتواند بین پیشبینیهای حاصل از مدلهای مختلف به وجود آید (به علت وجود نمونههای همپوشان) از آزمون دایبولد – ماریانو نیز استفاده شد که نتایج حاصل از آن بیانگر بهتر بودن قدرت پیشبینی شبکه عصبی نسبت به مدل آریماست (3448/2-dm=).
آزمونهای فوق را برای فرضیه دوم نیز انجام دادیم. نتایج آزمون مقایسه زوجی نشان میدهد که در سطح 95% اطمینان میان روشهای پیشبینی آریما و شبکه عصبی موجکی تفاوت معنیداری وجود دارد (391/4t=). نتایج آزمون دایبولد – ماریانو نیز نشان میدهد که قدرت پیشبینی شبکه عصبی موجکی نسبت به مدل آریما بیشتر است (5666/2-dm=).
فرضیه سوم پژوهش حاضر مبنی بر اینکه «مقادیر حاصل از پیشبینی بروننمونهای بازده شاخص بورس اوراق بهادار تهران با استفاده از روش شبکه عصبی به شکل معنیداری با مقادیر حاصل از پیشبینی با استفاده از روش شبکه عصبی موجکی تفاوت دارد» نیز آزمون شد. نتایج آزمون مقایسه زوجی نشان میدهد که در سطح 95% اطمینان میان روشهای پیشبینی شبکه عصبی و شبکه عصبی موجکی تفاوت معنیداری وجود دارد (128/3t=). نتایج آزمون دایبولد – ماریانو نیز بیانگر بهتر بودن قدرت پیشبینی شبکه عصبی موجکی نسبت به شبکه عصبی است (9838/1-t=).
این یافتهها با نتایج پژوهشهای مشابه یکسان است. بدین ترتیب، میتوان چنین نتیجه گرفت که برای پیشبینی بازده شاخص بورس اوراق بهادار تهران، مدل شبکه عصبی موجکی (نویززدایی سیگنال) عملکردی بهتر از مدلهای آریما و شبکه عصبی دارد. همچنین، مدلهای شبکه عصبی قدرت پیشبینیکنندگی بهتری را نسبت به مدلهای آریما نشان میدهد.
پیشنهادهای پژوهش
با توجه به اینکه پژوهش حاضر برای پیشبینی بازده شاخص بورس اوراق بهادار تهران انجام شد، میتوان در پژوهشهای دیگر قدرت پیشبینی مدلها را برای قیمت نفت، ارز و سایر شاخصهای جهانی انجام داد و نتایج آن را با یکدیگر مقایسه کرد.
در این پژوهش، تنها از وقفههای سری زمانی برای پیشبینی استفاده شد. میتوان برای پژوهشهای بعدی از ویژگیهای آماری سری زمانی نظیر: میانگین، واریانس، چولگی، کشیدگی و آنتروپی شانون استفاده نمود.
پیشبینیهای این پژهش به صورت یک گام رو به جلو (کوتاه مدت) انجام شده است. برای کارهای آتی پیشنهاد میشود که از پیشبینیهای میانمدت و بلندمدت نیز استفاده شود تا بتوان مدلی طراحی کرد که پیشبینیهای دقیقتری در میانمدت و بلندمدت ارایه نماید.
در این مطالعه، تنها از شبکه عصبی برای پیشبینیهای غیرخطی استفاده شد. بنابراین، بهتر است در کارهای آینده از منطق فازی و سایر الگوریتمها برای پیشبینیهای بهتر استفاده شود.
نتایج به دست آمده برای دوره زمانی مورد بررسی؛ یعنی بازه زمانی ده ساله 1381 تا 1391 صادق است، لذا به منظور بررسی این مساله که آیا مدل مزبور برای همه بازههای زمانی کاربرد دارد یا خیر، میتوان دورههای زمانی طولانیتر و انجام تقسیمبندیهای جزئیتر را به کار برد. برای مثال، میتوان دوره زمانی ده ساله را به دو دوره پنجساله و یا پنج دوره دوساله تقسیم و در هر دوره اقدام به پیشبینی نمود و سپس نتایج را مقایسه کرد.
[1]. D/P
[2]. P/E
[3]. Autoregressive
[4]. Autoregressive Integration Moving Average
[5]. Autoregressive Conditional Heteroskedasticity
[6]. Schinkman and LeBaron
[7]. Bouqata Bouchra
[8]. Artificial Neural Network
[9]. Algis Garliauskas
[10]. Zhang Qian and Gao Liqun
[11]. Wavelet Noise Filtering
[12]. Least Square Method
[13]. Artificial Intelligence
[14]. Neural Network
[15]. Genetic Algorithm
[16]. In-Sample
[17]. Out-of-Sample
[18]. Invariance
[19]. Downsampling
[20]. Upsampling
[21]. Wai
[22]. Normal Mean Square Error
[23]. Tsieh
[24]. Artificial Bee Colony
[25]. Wang and Gupta
[26]. Exchange Traded Funds (ETF’s)
[27]. Correlogram
[28]. Akaike Information Criterion
[29]. Schwarz
[30]. Eviews 7.1
[31]. Detail
[32]. Approximation
[33]. One-Step Ahead
[34]. Shift Variant
[35]. Diebold-Mariano