Portfolio Optimization with Clustering Methods

Document Type : Research Paper

Authors

Dept., Faculty of Management and Accounting Shahid Beheshti University, Tehran, Iran.

Abstract

The portfolio selection problem and optimizing it is an important issue in investment field. This process aims to create A portfolio that incur the minimum amount of risk to the investor in different levels of return. The existence of statistical uncertainty and noise in information, which is used in the process of optimization, would hamper the performance of optimized portfolios. The purpose of this article is to eliminate the noise of correlation coefficient matrix by using clustering method. In order to do so, two clustering methods, Single Linkage and Average Linkage, are applied, and the optimized portfolio based on the Tehran Stock Exchange information from March 2007 to March 2013 is obtained. The results show that such portfolio is more reliable and provides less risk to the capital owner. For analyzing the robustness of the results in a wide range of different investment horizons and numbers of assets, a Bootstrap analysis with resampling is performed and in most cases a significant improvement was observed.

Keywords

Main Subjects


مقدمه

یکی از مسائل مهم در سرمایه‌گذاری، انتخاب سبد سرمایه‌گذاری به‌صورت بهینه و به حداقل‌ رساندن ریسک در سطوح مختلف بازده است. مارکوویتز (1953) در الگوی کلاسیک خود نشان داد چگونه با توجه به دو عامل ریسک و بازده، یک سبد سرمایه‌گذاری بهینه می‌توان تشکیل داد. سرمایه‌گذاران برای استفاده از روش مارکوویتز درعمل از اطلاعات تاریخی برای تخمین پارامترهای الگو ازجمله ماتریس ضرایب همبستگی استفاده می‌کنند.  یکی از مسائل مهم، وجود عدم قطعیت در این تخمین‌ها است. با توجه به داده‌های سری زمانی محدود، پیش‌بینی ماتریس ضرایب همبستگی در افق زمانی سرمایه‌گذاری، همواره با عدم قطعیت آماری همراه است. یکی از روش‌های کاهش عدم قطعیت، حذف نویز از اطلاعاتی است که براساس آن‌ها ماتریس ضرایب همبستگی تخمین زده می‌شود.

در مبانی نظری اکونوفیزیک،[1] روش‌های متعددی برای کاهش نویز مذکور معرفی‌ شده است. یکی از این روش‌ها، استفاده از نظریۀ ماتریس تصادفی[2] است. ماتریس همبستگی فیلترشدۀ حاصل از این روش، در مطالعات متعددی برای بهینه‌سازی سبد سرمایه‌گذاری به کار رفته است و شواهد به‌دست‌آمده نشان می‌دهد در صورت دسترسی به پیش‌بینی کامل بازده و نوسان‌های آینده، سبد سرمایه‌گذاری بهینۀ حاصل از این ماتریس به سبد سرمایه‌گذاری بهینۀ واقعی نزدیک‌تر است ]7[. همچنین در سال‌های اخیر، روش‌های جدیدی برای فیلترکردن ماتریس ضرایب همبستگی مبتنی بر روش‌های خوشه‌بندی[3] در ادبیات اکونوفیزیک مطرح شده است. در این روش‌ها برای بخشی از اطلاعات که کمتر در معرض نویز قرار دارند، ماتریس ضرایب همبستگی استخراج می‌شود. این اطلاعات به‌گونه‌ای انتخاب می‌شوندکه بتوانند کل ماتریس را نمایندگی کنند و بقیۀ اطلاعات حذف ‌شوند. روش‌های خوشه‌بندی متعددی در دسترس است؛ اما بسیاری از آن‌ها با قیود لازم در بهینه‌سازی سبد سرمایه‌گذاری براساس ماتریس همبستگی، سازگاری ندارند. در این مقاله از دو روش متداول -که در صورت استفاده از آن‌ها، در ماتریس همبستگی فیلترشده همچنان قیود لازم برقرار باشد- بهره گرفته شده است؛ سپس سبد سرمایه‌گذاری بهینه تعیین می‌شود.

 

مبانی نظری پژوهش

در مدل مارکوویتز اگر  دارایی ریسک‌پذیر در اختیار باشد و ماتریس کوواریانس بازده این دارایی‌ها  و بردار ، بازده دارایی‌ها باشد، با ترکیب این دارایی‌ها  یک سبد سرمایه‌گذاری با اوزان  می‌توان به دست آورد که در بردار  قرار دارد. براین‌اساس، مسألۀ بهینه‌سازی مارکوویتز، یافتن بردار اوزان  به‌گونه‌ای است که بازای بازده ، کمترین مقدار  برای سبد سرمایه‌گذاری ایجاد شود. درصورتی‌ که  و  به‌ترتیب، به‌صورت روابط (1) و (2) تعریف شوند:

(1)

 

 

(2)

 

 

تابع هدف و قید بهینه‌سازی به شرح رابطۀ (3) خواهد بود:

(3)

 

 

 

روش مارکوویتز برای یافتن سبد سرمایه‌گذاری بهینه، فرض‌های متعددی دارد. نخست اینکه بازده دارایی‌ها، توزیع نرمال دارند. دوم، فرض می‌شود بردار بازدۀ  و ماتریس کوواریانس  در افق سرمایه‌گذاری، ثابت باقی می‌ماند. هر دو فرض فوق درعمل چندان دقیق نیستند. حتی با قبول این فرض‌ها و با فرض دراختیارداشتن اطلاعات دورۀ زمانی ، برای محاسبۀ ماتریس کوواریانس به   داده نیاز است و این مقادیر فقط براساس  دادۀ در دسترس، تخمین زده می‌شوند. برای جلوگیری از پدیدۀ «نفرین چندبعدی بودن[4]» به سری زمانی با طول  نیاز است تا خطای موجود در ماتریس کوواریانس کوچک باشد. هرچه ابعاد ماتریسی که قرار است با استفاده از داده‌های تاریخی تخمین زده شود بیشتر باشد، به‌طور تصاعدی تعداد مشاهدات بیشتری لازم خواهد بود. این پدیده  را اولین بار بلمن (1961) شناسایی و تحت عنوان نفرین چندبعدی‌بودن معرفی کرد ]1[. با این حال برای ‌ های بزرگ، اطلاعات در معرض نویز و عدم قطعیت‌های آماری قرار می‌گیرند. به این دلیل بخشی از ماتریس کوواریانس که نویز کمتری دارد، با روش‌های خوشه‌بندی اتصال واحد و اتصال میانگین جدا می‌شود و از آن برای تشکیل سبد سرمایه‌گذاری استفاده می‌شود.

 

 

 

پیشینۀ تجربی پژوهش

در ادبیات اکونوفیزیک، استفاده از نظریۀ ماتریس تصادفی برای کاربردهای متنوع از جمله فیلترکردن ماتریس همبستگی، سابقۀ زیادی دارد و تاکنون از این روش در پژوهش‌های بسیاری برای حذف نویز اطلاعات مالی استفاده شده است. ازجملۀ این مطالعات به گالوچیو و همکاران (1998)، لالوکس و همکاران (2000)، دورزدز و همکاران (2001)، پلرو و همکاران (2002)، پافکا و همکاران (2003) و شریفی و همکاران (2004) می‌توان اشاره کرد. پلرو و همکاران (2001) برای سه دورۀ زمانی متفاوت و سه مجموعۀ متفاوت از سهام شرکت‌های امریکایی، ماتریس همبستگی را محاسبه کردند و ویژگی‌های مقادیر ویژۀ این ماتریس‌ها را بررسی کردند. آن‌ها با تعیین ماتریس تصادفی متناظر با ماتریس‌های همبستگی به این نتیجه رسیدند که برخی بردارهای ویژه، داخل و برخی خارج از محدودۀ ماتریس تصادفی قرار می‌گیرند. درادامه با بررسی بیشتر بردارهای ویژۀ خارج از محدوده نشان دادند این انحرافات یا مربوط به یک اثر مشترک در سهام همۀ شرکت‌ها و یا مربوط به یک بخش اقتصادی خاص است. این پژوهشگران درنهایت نتیجه گرفتند این روش برای تشکیل یک سبد سرمایه‌گذاری می‌تواند استفاده شود که از نسبت ریسک به بازده پایداری برخودار باشد ]13[. شریفی و همکاران (2004) با استفاده از نظریۀ ماتریس تصادفی نشان دادند در ماتریس همبستگی سهام شرکت‌های اس اند پی 500[5]، حجم زیادی از نویز اطلاعاتی را می‌توان مشاهده کرد. آن‌ها با شبیه‌سازی یک مجموعه دادۀ مجزا و اضافه‌کردن مقداری نویز تصادفی به آن، میزان حساسیت به نویز مشخصات طیفی ماتریس تصادفی را نیز بررسی کردند؛ سپس با روش‌های معرفی‌شده مبتنی بر ماتریس تصادفی در پیشنیۀ پژوهش، بخش نویزی اطلاعات را جدا کردند و نشان دادند این روش پیشنهادی برای فیلترکردن ماتریس همبستگی مزیت بیشتری دارد ]16[.

اما در کنار روش‌های مبتنی بر ماتریس تصادفی، در سال‌های اخیر مطالعاتی در زمینۀ فیلترکردن ماتریس ضرایب همبستگی براساس روش‌های خوشه‌بندی نیز انجام شده است که ازآن جمله  به اونلا و همکاران (2002)، بونانو و همکاران (2003)، تولا و همکاران (2008) و ساندوال و همکاران (2014) می‌توان اشاره کرد. اونلا و همکاران (2002) برای 116 شرکت از مجموعۀ اس اند پی 500، با روش‌های خوشه‌بندی، درخت پوششی کمینه را بر ماتریس همبستگی تشکیل دادند و یک بخش‌بندی اقتصادی معنادار از آن استخراج کردند. یک درخت پوششی کمینه، ارتباط میان شرکت‌هایی را که با یکدیگر همبستگی بیشتری دارند با ترسیم یک یال میان آن‌ها مشخص می‌کند. هرچه شرکت‌ها بر درخت به یکدیگر نزدیک‌تر باشند، نشان‌دهندۀ تعلق آن‌ها به یک بخش اقتصادی مشترک است. با تعیین مرکز درخت پوششی کمینه و بررسی حرکت و ساختار آن در طول زمان،  رفتار همبستگی میان شرکت‌ها را می‌توان بررسی کرد. اونلا و همکاران نشان دادند سبد سرمایه‌گذاری بهینۀ مارکوویتز دعمل همواره در حاشیۀ درخت قرار دارد. این یافتۀ آنان نشان می‌دهد یافتن سبد سرمایه‌گذاری بهینه درصورت استفاده از یک روش خوشه‌بندی مناسب امکان‌پذیر است ]11[. بونانو و همکاران (2003) نیز با تشکیل درخت پوششی کمینه برای سهام 1071 شرکت در بورس اوراق بهادار نیویورک در بازه‌ای 12 ساله و مقایسۀ آن با درخت حاصل از یک بازار شبیه‌سازی‌شده براساس الگو‌های تک‌عاملی، نشان دادند مشخصات درخت تجربی، بیشتر با یک شبکۀ پیچیده منطبق است و الگو‌های تک‌عاملی برای توصیف تمامی مشخصات بازار، کارایی مناسبی ندارند ]2[. تولا و همکاران (2008) از سه روش نظریۀ ماتریس تصادفی، خوشه‌بندی اتصال میانگین و خوشه‌بندی اتصال واحد برای فیلترکردن ماتریس همبستگی استفاده کردند و نتایج بهینه‌سازی سبد سرمایه‌گذاری براساس هرکدام از روش‌ها را با هم مقایسه کردند. آن‌ها این‌گونه نتیجه گرفتند که روش‌های خوشه‌بندی، عملکرد بهتری نسبت به روش نظریۀ ماتریس تصادفی داشته ‌است. همچنین به‌‌دلیل تحلیل حساسیت نتایج برای مجموعه‌های مختلفی از سهام و افق‌های زمانی متفاوت، بهینه‌سازی سبد سرمایه‌گذاری تکرار شده است و نتایج مشابهی به دست آمده است ]17[. ساندوال و همکاران (2014) در بازار کشور برزیل، با استفاده از نظریۀ ماتریس تصادفی، به پالایش و حذف نویز از ماتریس همبستگی اقدام کردند و براساس آن سبد سرمایه‌گذاری بهینۀ سهام را تشکیل دادند. همچنین برای محاسبۀ ماتریس همبستگی نیز از رگرسیون استفاده کردند و این کار را برای دو بازه زمانی با نوسان‌های کم و زیاد تکرار کردند. نتایج آن‌ها نشان می‌دهد استفاده از رگرسیون و روش ماتریس تصادفی، قدرت پیش‌بینی ریسک را افزایش می‌دهد؛ اما در زمان‌هایی‌که بازار، نوسان‌های شدید دارد، این روش کارایی چندانی از خود نشان نمی‌دهد ]15[.

پژوهش‌های اکونوفیزیک در ایران، همچنان نوپا و محدود است. راعی و همکاران (1389) در پژوهشی با عنوان «تحلیل بازار بورس اوراق بهادار تهران با استفاده از شبکه‌های پیچیده مبتنی بر روش حد آستانه»، شبکۀ سهام موجود در بورس اوراق بهادار تهران و کمیت‌های مرتبط با آن را بررسی کرده‌اند. آن‌ها با محاسبۀ بازده لگاریتمی و همبستگی 325 سهم بازار، ماتریس همبستگی را تعیین کردند و سپس با اعمال حد آستانه برای قبول یا رد همبستگی میان دو سهم، شبکه‌ای را تشکیل دادند که هر گره آن، یک سهم و هر یال، نشان‌دهندۀ وجود همبستگی میان آن دو سهم است. آن‌ها در ادامه با تغییر حد آستانه، سه موضوع «توزیع درجات شبکۀ سهام»، «عناصر مستقل» و «ضریب خوشگی» را در این شبکه بررسی کردند. آن‌ها بیان کردند ریسک نظام‌مند بازار که دو معیار تعداد عناصر مستقل و ضریب خوشگی، سنجه‌ای از آن است، در حد آستانه‌ای در حدود میانگین ضرایب همبستگی، رفتار کاهندۀ شدیدی دارد ]14[. محمدی و خجسته (1388) در پژوهشی با عنوان «بهینه‌سازی سبد سرمایه‌گذاری سهام براساس ماتریس کوواریانس نوفه‌زدایی‌شده»، با توجه به مسألۀ وجود نویز در اطلاعات، برای فیلترکردن ماتریس کوواریانس بازده قیمت سهام، از روشی مبتنی بر نظریۀ ماتریس تصادفی استفاده کردند و آن را در بهینه‌سازی سبد سرمایه‌گذاری به کار بردند. آن‌ها برای 70 شرکت پذیرفته‌شده در بورس اوراق بهادار تهران، ماتریس همبستگی را محاسبه کردند؛ سپس با استفاده از یک ماتریس تصادفی در بازه زمانی مشابه، ماتریس همبستگی را فیلتر کرده و از آن در بهینه‌سازی سبد سرمایه‌گذاری بازار در بازه فروردین 1383 تا خرداد 1387 استفاده کردند. آن‌ها برای بررسی عملکرد این روش، بهینه‌سازی را هم با ماتریس همبستگی فیلترنشده و هم با ماتریس همبستگی فیلترشده، فقط در یک افق زمانی انجام دادند و با آزمون فیشر برای مقایسۀ واریانس‌ها به این نتیجه رسیدند که در سطح اطمینان 95 درصد، ریسک مجموعه سبد‌های سرمایه‌گذاری به‌دست‌آمده براساس ماتریس همبستگی فیلترشده نسبت به ماتریس همبستگی فیلترنشده، کمتر است. آن‌ها در پژوهش خود، حساسیت نتایج این روش را در افق‌های زمانی و تعداد سهام متفاوت بررسی نکردند و فقط برای یک پنجرۀ زمانی خاص ادعا کردند که نتایج آزمون در سطح 99 درصد تأیید می‌شود ]10[.

 

روش پژوهش

محور اصلی پژوهش حاضر، بر تخمین ماتریس ضرایب همبستگی مبتنی است. ماتریس ضرایب همبستگی، ماتریسی است که درایۀ  در آن، ضریب همبستگی بین بازده دارایی  ام و بازده دارایی  ام است. از این ماتریس در بهینه‌سازی سبد سرمایه‌گذاری استفاده می‌شود. اگر با روش‌های فیلترکردن، از نویز اطلاعات این ماتریس‌ها کاسته شود، بهینه‌سازی نتایج بهتری را به بار می‌آورد. در این پژوهش برای فیلترکردن ماتریس ضرایب همبستگی از دو روش خوشه‌بندی اتصال میانگین و اتصال واحد استفاده می‌شود. ماتریس فیلترشده در بهینه‌سازی سبد سرمایه‌گذاری به کار برده می‌شود و عملکرد سبد سرمایه‌گذاری با دو معیار ارزیابی می‌شود. برای پاسخ به این پرسش که آیا روش‌های فیلترکردن از نظر معیارهای معرفی‌شده، سبدهای سرمایه‌گذاری موفق‌تری نسبت به روش بدون فیلترکردن تشکیل می‌دهند، یک‌بار در فضای داده‌ها و نمونه، هر سه روش اتصال واحد، اتصال میانگین و بدون فیلترکردن اعمال می‌شود و مقادیر به‌دست‌آمدۀ هریک از دو معیار در این روش‌ها با همدیگر مقایسه می‌شوند؛ سپس برای تحلیل حساسیت این نتایج نسبت به شرایط مختلف (از نظر تعداد سهام و افق‌های سرمایه‌گذاری) یک مطالعۀ بوت استرپینگ[6] با نمونه‌برداری داخلی[7] انجام خواهد شد.

هدف، خوشه‌بندی تفکیک  متغیر و قراردادن آن‌ها در بخش‌های جداگانه‌ای است که براساس مشخصات هر متغیر و شباهت‌های آن‌ها، معنادار باشند؛ برای مثال در خوشه‌بندی مبتنی بر ضرایب همبستگی که در پژوهش حاضر استفاده می‌شود، ضریب همبستگی دو سری زمانی، نشان‌دهندۀ میزان شباهت آن‌ها به یکدیگر است. خوشه‌بندی مبتنی بر همبستگی در مطالعات متعددی برای یافتن ساختار سلسله‌مراتبی سهام موجود در سبد سرمایه‌گذاری استفاده شده است ]2و3[. این خوشه‌بندی به‌عنوان روشی برای فیلترکردن ماتریس همبستگی نیز می‌تواند استفاده شود؛ به این معنا که پس از اجرای این روش، درایه‌های با احتمال نویزی‌بودن، حذف می‌شوند و تعداد درایه‌های منحصربه‌فرد ماتریس مذکور، کاهش می‌یابد؛ برای مثال در روش خوشه‌بندی، اتصال واحد تعداد درایه‌های منحصربه‌فرد ماتریس فیلترشده  است، در حالی‌ که تعداد درایه‌های منحصربه‌فرد ماتریس اصلی  است ]6[. تاکنون روش‌های خوشه‌بندی متنوعی معرفی شده‌اند؛ اما ازآنجا که لازم است در بهینه‌سازی سبد سرمایه‌گذاری، ماتریس همبستگی فیلترشده مثبت معیّن باشد[8]، بسیاری از این روش‌ها قابل استفاده نخواهند بود. تامینلو و همکاران (2010) نشان داده‌اند در هر دو روش خوشه‌بندی اتصال واحد و اتصال میانگین، ماتریس فیلترشده، مثبت معیّن باقی می‌ماند و به همین علت از این دو روش برای فیلترکردن ماتریس ضرایب همبستگی استفاده می‌شود.

در روش اتصال واحد، ابتدا لازم است معیار شباهت میان اعضا،  تعیین ‌شود. این معیار در اینجا ضریب همبستگی میان هر زوج از اعضای بازده سهام است. پس از محاسبۀ شباهت میان هر دو عضو،  ها به‌صورت نزولی مرتب می‌شوند. در فرایند خوشه‌بندی با شروع از دو عضو با بیشترین شباهت و تکرار مراحلی که توضیح داده خواهند شد، اعضا در خوشه‌های مختلف قرار می‌گیرند. در هر مرحله وقتی دو عضو، یا یک عضو و یک خوشه یا دو خوشۀ  و  در یک خوشۀ جدید قرار می‌گیرند، شباهت میان سایر اعضا با خوشۀ جدید باید دوباره محاسبه شود. شباهت میان خوشه‌های  و  با استفاده از معیار ضریب همبستگی و با رابطۀ (4) محاسبه می‌شود:

(4)

 

 

 

با تکرار این روند  عضو منحصربه‌فرد از  عضو اولیه انتخاب می‌شوند. روش اتصال میانگین نیز مشابه روش اتصال واحد است؛ با این تفاوت‌ که شباهت بین یک عضو و نزدیک‌ترین خوشه با محاسبۀ میانگین شباهت‌های میان آن عضو و هر یک اعضای آن خوشه به دست می‌آید؛ به بیان دیگر،  بین دو خوشۀ  و  از میانگین شباهت هریک از اعضای این دو خوشه به دست می‌آید. اگر ماتریس ورودی  و ماتریس فیلترشده، روش اتصال واحد  و روش اتصال میانگین  باشد، مراحل اجرای روش اتصال میانگین و اتصال واحد با جزئیات بیشتر به‌صورت زیر خواهد بود ]9[:

1- ماتریس  را برابر با ماتریس  در نظر بگیرید.

2- بیشترین همبستگی  را در ماتریس  پیدا کنید. یادآوری می‌شود که  و  می‌توانند عضوی ساده (یعنی خوشه‌ای با یک عضو) و یا خوشه (مجموعه‌ای از اعضا) باشند. حال برای  و  درایه‌های ماتریس  یا ، یعنی  برابر خواهند بود با:

3- خوشۀ  و خوشۀ  را در یک خوشۀ  ادغام کنید. درنتیجۀ این ادغام، یک گره در درخت سلسله‌مراتبی تعریف می‌شود که دو خوشۀ  و  را با همبستگی  به یکدیگر متصل می‌کند.

4- ماتریس  را برای روش اتصال واحد با استفاده از رابطۀ (5) و برای روش اتصال میانگین با استفاده از رابطۀ (6) بازتعریف کنید.

(5)

 

(6)

 

در روابط (5) و (6)  و  به‌ترتیب، تعداد اعضای خوشه‌های  و  پیش از ادغام است. باید دقت داشت اگر اندازۀ ماتریس ، برابر با  باشد، پس از بازتعریف، این اندازه معادل  خواهد بود؛ زیرا خوشه‌های  و  در هم ادغام می‌شوند و خوشۀ  را می‌سازند.

5- اگر اندازۀ ماتریس  بزرگ‌تر از 1 باشد، مراحل بالا باید از گام 2 دوباره تکرار شوند و در غیر این‌صورت مراحل در همین گام به پایان می‌رسد.

برای مثال، ماتریس ضرایب همبستگی را که در شکل (1) نشان داده شده است، در نظر بگیرید.

 

 

 

 

شکل (1) ماتریس ضرایب همبستگی

 

 

پس از انجام مراحل فوق،  درخت سلسله‌مراتبی را براساس خوشه‌بندی انجام‌شده می‌توان ترسیم کرد. در شکل (2) درخت مربوط به روش اتصال واحد، با نمودار دندروگرام[9][10] نشان داده شده است و خوشه‌های تشکیل‌شده را می‌توان مشاهده کرد.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

شکل (2) نمودار دندروگرام درخت خوشه‌ای سلسله‌مراتبی

 

 

 

برای مثال، سهام شمارۀ 4، 5، 2 و 3 یک خوشه و سهام شمارۀ 7، 10 و9 نیز یک خوشۀ دیگر را تشکیل داده‌اند. ماتریس فیلترشده حاصل از روش اتصال واحد و اتصال میانگین به‌ترتیب در شکل (3) و شکل (4) آمده است.

 

 

 

 

شکل (3) ماتریس ضرایب همبستگی فیلترشده با روش اتصال واحد

 

 

 

شکل (4) ماتریس ضرایب همبستگی فیلترشده با روش اتصال میانگین

 

 

 

 

 

 

همان‌طور که ملاحظه می‌شود در هر دو ماتریس فیلترشده، تعداد درایه‌های منحصربه‌فرد  است که در مقایسه با ماتریس اصلی کمتر است.

برای اندازه‌گیری کیفیت عملکرد روش‌های خوشه‌بندی، بازه زمانی مورد بررسی به دو قسمت تقسیم می‌شود. به این منظور ماتریس همبستگی براساس اطلاعات  روز پیش از  تخمین زده می‌شود؛ اما میانگین بازده‌‌ها،  و انحراف معیار آن‌ها،  در  روز پس از  محاسبه خواهد شد. با این داده‌ها، ماتریس کوواریانس  و سبد سرمایه‌گذاری بهینه متشکل از  دارایی در زمان  تعیین ‌شود. با این کار درحقیقت مسألۀ تخمین ماتریس همبستگی، از مسألۀ تخمین میانگین بازده و انحراف معیار بازده جدا می‌شود؛ به بیان دیگر، فرض می‌شود سرمایه‌گذار از میانگین بازده و انحراف معیار بازده، پیش‌بینی کاملی دارد و عدم قطعیت فقط به ماتریس همبستگی مربوط است. با داشتن وزن دارایی‌ها در سبد سرمایه‌گذاری بهینه  و ماتریس کوواریانس تحقق‌یافته  که براساس مشاهدات زمان  تا  به دست آمده است، ریسک تحقق‌یافتۀ سبد سرمایه‌گذاری را بازای بازده‌های متفاوت با استفاده از رابطۀ (7) می‌توان محاسبه کرد.

(7)

 

 

 

برای مقایسۀ عملکرد روش‌های فیلترکردن، از دو معیار ارزیابی استفاده می‌شود. معیار نخست، قابل ‌اعتماد بودن سبد سرمایه‌گذاری تشکیل‌شده را می‌سنجد. هرچه ریسک پیش‌بینی‌شدۀ سبد سرمایه‌گذاری براساس ماتریس همبستگی ، به ریسک تحقق‌یافتۀ سبد سرمایه‌گذاری ، نزدیک‌تر باشد، سبد سرمایه‌گذاری حاصل‌شده،  قابل اعتمادتر است. با حذف اثر اندازۀ ، سبد سرمایه‌گذاری، زمانی قابل اعتمادتر است که از  کوچک‌تری برخوردار باشد:

(8)

 

 

 

معیار دوم ارزیابی عملکرد روش‌های فیلترکردن، ریسک تحقق‌یافتۀ سبد سرمایه‌گذاری،  است که میزان ریسک‌پذیر‌بودن سبد سرمایه‌گذاری را نشان می‌دهد. هرچه ریسک تحقق‌یافتۀ سبد سرمایه‌گذاری کمتر باشد، نشان‌دهندۀ این است که سبد سرمایه‌گذاری معرفی‌شده در ابتدای افق سرمایه‌گذاری، در پایان، ریسک کمتری را متحمل شده و عملکرد بهتری داشته است.

 

یافته‌ها

در این مطالعه 80 شرکت پر معاملۀ بورس اوراق بهادار تهران در بازه زمانی فروردین 1385 تا اسفند 1392 انتخاب شده‌اند. انتخاب شرکت‌های پرمعامله به این دلیل است که بسیاری از شرکت‌ها در طول سال، تعداد روزهای معاملاتی کمی دارند و یا به‌علت ‌قرارگرفتن در صف‌های خرید و فروش و به‌وجودآمدن پدیدۀ گرۀ معاملاتی، قیمت پایانی آن‌ها به‌طور مصنوعی تغییری نمی‌کند و بازده برای چندین روز صفر است. استفاده از این داده‌ها خود به نویز اطلاعات موجود می‌افزاید؛ بنابراین، در این پژوهش از داده‌های شرکت‌هایی استفاده شده است که از بیشترین تعداد روزهای معاملاتی برخوردار باشند و در این میان، کمتر دچار گرۀ معاملاتی شده باشند. برای جمع‌آوری اطلاعات از نرم‌افزار TSE Client شرکت مدیریت فناوری بورس تهران و برای پردازش و انجام محاسبات از نرم‌افزار MATLAB استفاده شده است.

برای استفاده از ماتریس فیلترشده با روش‌های خوشه‌بندی باید قید مهم مثبت معیّن (یا مثبت نیمه‌معیّن) بودن این ماتریس برقرار باشد. با حل مسألۀ بهینه‌سازی سبد سرمایه‌گذاری با روش مارکوویتز بازای هر بازده سبد سرمایه‌گذاری،  یک مقدار برای ریسک سبد سرمایه‌گذاری محاسبه خواهد شد که ریسک پیش‌بینی‌شده،  شناخته می‌شود و با داشتن اوزان دارایی‌ها در هر سبد سرمایه‌گذاری سهام، با استفاده از رابطۀ (7)، ریسک تحقق‌یافته،  به دست می‌آید. پس از محاسبۀ بازده روزانۀ لگاریتمی، انحراف معیار بازده‌ها وکوواریانس میان آن‌ها محاسبه می‌شود. ازآنجا که سهام برخی شرکت‌ها در بعضی از روزهای بازه زمانی مدّنظر معامله نشده‌اند، برای هر زوج سهام، کل مشاهدات آن بازه زمانی را نمی‌توان به کار برد؛ درنتیجه کوواریانس بازده سهام دوبه‌دو و با حذف روزهای بدون معامله محاسبه شده‌اند. منحنی ریسک- بازده بهینه پیش‌بینی‌شده با استفاده از ماتریس ضرایب همبستگی عادی (بدون فیلترکردن) و ماتریس ضرایب همبستگی فیلترشده و نیز منحنی ریسک- بازده محقق‌شدۀ هر کدام محاسبه شده است. نتایج دو روش اتصال واحد و اتصال میانگین در شکل (5) ملاحظه می‌شود.

 

 

 

 

شکل (5) منحنی‌های ریسک- بازده بدون فیلترینگ (خطوط نازک)، روش اتصال واحد (خطوط ضخیم نمودار بالا) و روش اتصال میانگین (خطوط ضخیم نمودار پایین)

 

 

خطوط ممتد در شکل (5) به سبدهای سرمایه‌گذاری محقق‌شده و خطوط ناپیوستۀ مربوط به سبدهای سرمایه‌گذاری پیش‌بینی‌شده مربوط است. همان‌طورکه ملاحظه می‌شود منحنی‌های مبتنی بر ماتریس همبستگی فیلترشده به یکدیگر نزدیک‌تر هستند و در 100 درصد سبدهای سرمایه‌گذاری تشکیل‌شده قابل اعتمادتر از منحنی‌های عادی هستند. از لحاظ میزان ریسک‌پذیر‌بودن سبد سرمایه‌گذاری نیز در بازده‌های پایین به‌ترتیب، روش‌های اتصال واحد و اتصال میانگین، عملکرد بهتری داشته‌اند؛ اما در سطوح بالای بازده، هر سه روش تقریباً به نتایج مشابهی رسیده‌اند. درمجموع از این نظر، روش اتصال واحد در 6/75 درصد و روش اتصال میانگین در1/73 درصد سبدهای سرمایه‌گذاری تشکیل‌شده، عملکرد بهتری داشته‌اند.

برای تحلیل حساسیت این نتایج در حالات و شرایط مختلف، مطالعۀ بوت استرپینگ با نمونه‌برداری داخلی انجام می‌شود. برای هر زوج مرتب  که  نشان‌دهندۀ تعداد دارایی‌ها و  نشان‌دهندۀ افق سرمایه‌گذاری است، 50 مجموعه متشکل از   دارایی و 50 زمان  انتخاب می‌شود. برای هر مجموعه، 10 مقدار برای بازده مورد انتظار سبد سرمایه‌گذاری بهینه،  انتخاب می‌شود. بدین‌منظور بالاترین بازده دارایی‌های مجموعه و بازده کم ریسک‌ترین دارایی مجموعه پیدا می‌شود و با فواصل مساوی، از میان این دو حد بالا و پایین، 10 مقدار استخراج می‌شود. با توجه به روند توضیح داده‌شده، درمجموع برای هر زوج مرتب ، 500 حالت و در کل با احتساب مقادیر 550،450،350،250،150،50 و 650 برای  و 70،60،50،40،30،20،10و 80 برای ، 2800 مجموعه و 28 هزار سبد سرمایه‌گذاری بهینه بررسی می‌شود.

برای مطالعۀ میزان قابل ‌اعتماد بودن سبدهای سرمایه‌گذاری تشکیل‌شده، در هرکدام از مجموعه‌های گزینش‌شده، روش فیلترکردن اتصال واحد و اتصال میانگین، پیاده می‌شود و ماتریس همبستگی فیلترشده محاسبه می‌شود. سبد سرمایه‌گذاری بهینه با ماتریس همبستگی فیلترشدۀ حاصل از این دو روش و نیز با ماتریس همبستگی فیلترنشده، برای هرکدام از بازده‌های مورد انتظار، محاسبه و مقدار  برای آن‌ها تعیین می‌شود؛ سپس تعداد دفعاتی که در آن  یعنی شاخص قابل ‌اعتماد بودن روش عادی کمتر از روش اتصال واحد بوده است و نیز به‌طورمشابه تعداد دفعاتی‌ که  یعنی شاخص قابل ‌اعتماد بودن روش عادی کمتر از روش اتصال میانگین بوده است، شمرده می‌شود. شکل (3) یک نمودار تراکمی[11] است که براساس درصد پیروزی روش اتصال واحد بر روش عادی از نظر معیار قابل ‌اعتماد بودن در حالات مختلف ترسیم شده است. نمودار تراکمی، یک نوع نمودار سه بعدی است که به هر زوج مرتب حاصل از عناصر محورهای افقی و عمودی، یک رنگ منتسب می‌کند. هر رنگ در یک نمودار میله‌ای جداگانه به عددی مشخص نسبت داده شده است. برای مثال، شکل (6) نشان می‌دهد در سبدهای سرمایه‌گذاری بهینه با 20 دارایی و افق زمانی 100 روز، روش اتصال واحد بیش از 80 درصد از روش عادی قابل اعتمادتر است. شکل (4) نیز همین موارد را برای روش اتصال میانگین به تصویر کشیده است.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

شکل (6) درصد پیروزی روش اتصال واحد بر روش عادی به صورت تابعی از  و ، از لحاظ قابل ‌اعتماد بودن

 

 

نرخ پیروزی بیش از 50 درصد، نشان‌دهندۀ عملکرد بهتر هر کدام از روش‌ها نسبت به روش عادی (که از ماتریس فیلترنشده استفاده می‌کند) است. همان‌طورکه در شکل (7) مشخص است، در روش اتصال میانگین، در تمامی حالات مختلف ، این روش از لحاظ قابل ‌اعتماد بودن بر روش عادی برتر است. این موضوع برای آن دسته از سبدهای سرمایه‌گذاری که افق سرمایه‌گذاری در آن‌ها کمتر از 400 روز باشد، در خور توجه است. درصد پیروزی این روش در بهترین حالت، 83 درصد است و در 100 درصد کل حالات، عملکرد بهتری را نسبت به روش بدون فیلترکردن نشان می‌دهد. نتایج شکل (4) نشان می‌دهد عملکرد روش اتصال میانگین از لحاظ قابل‌ اعتماد بودن، ضعیف‌تر است و بیشتر برای سبدهای سرمایه‌گذاری با اندازۀ کوچک‌تر از 30 کارایی دارد. درصد پیروزی این روش در بهترین حالت، 85 درصد است و در 73 درصد کل حالات، عملکرد بهتری را نسبت به روش بدون فیلترکردن نشان می‌دهد.

 

 

 

 

شکل (7) درصد پیروزی روش اتصال میانگین بر روش عادی به‌صورت تابعی از  و  از لحاظ قابل ‌اعتماد بودن

 

 

برای مطالعۀ ریسک تحقق‌یافته در سبدهای سرمایه‌گذاری تشکیل‌شده برای هر مجموعه در سطوح بازده مختلف، میان روش‌های اتصال واحد، اتصال میانگین و روش بدون فیلترکردن مقدار ریسک تحقق‌یافتۀ سبد سرمایه‌گذاری، ، با یکدیگر مقایسه می‌شود. تعداد دفعاتی که ریسک تحقق‌یافتۀ روش اتصال واحد، کمتر از روش عادی بوده است و نیز تعداد دفعاتی که ریسک تحقق‌یافتۀ روش اتصال میانگین، کمتر از روش عادی بوده است، شمرده می‌شود. از نظر ریسک‌پذیر‌بودن، هر دو روش اتصال واحد و اتصال میانگین، عملکردی به نسبت مشابه دارند. آن دسته از سبدهای سرمایه‌گذاری که با افق سرمایه‌گذاری بیش از 400 روز تشکیل می‌شوند، بدون توجه به تعداد دارایی‌های داخل سبد سرمایه‌گذاری نسبت به روش بدون فیلترکردن، ریسک تحقق‌یافتۀ کمتری دارند و سبدهای سرمایه‌گذاری با تعداد دارایی کمتر از 30 نیز بدون توجه به افق سرمایه‌گذاری، ریسک تحقق‌یافتۀ کمتری نشان می‌دهند. به‌طورکلی روش اتصال واحد در 69 درصد و روش اتصال میانگین در 67 درصد موارد عملکرد بهتری را نشان می‌دهد.

برای بررسی دقیق‌تر گسترۀ بازده‌های مورد انتظار،  دو گروه برای بازده زیاد و بازده‌های کم در نظر گرفته می‌شود. برای این کار بیشترین بازده دارایی‌های مجموعه و بازده کم ریسک‌ترین دارایی مجموعه پیدا می‌شود و با فواصل مساوی از میان این دو حد بالا و پایین، 10 مقدار استخراج می‌شود. 5 مقدار بزرگ‌تر در در گروه بازده‌های زیاد و 5 مقدار کوچک‌تر در گروه بازده‌های کم قرار داده می‌شوند و سپس رفتار روش‌های اتصال واحد و اتصال میانگین در هریک از این گروه‌ها بررسی می‌شود. در بازده‌های مورد انتظار پایین، عملکرد دو روش از نظر ریسک تحقق‌یافته بسیار بهبود می‌یابد، به‌گونه‌ایکه هر دو روش در 73 درصد موارد، عملکرد بهتری نسبت به روش بدون فیلترکردن نشان می‌دهند. این در حالی است که در همین نرخ بازده‌ها، از نظر قابل ‌اعتماد بودن، عملکرد روش اتصال واحد همچنان با 75 درصد پیروزی قابل قبول است؛ اما عملکرد روش اتصال میانگین، افت شدیدی کرده است و عملکرد بهتری از روش بدون فیلترکردن نمی‌تواند نشان دهد. در بازده‌های مورد انتظار بالا، عملکرد دو روش از نظر ریسک تحقق‌یافته، ضعیف‌تر از روش بدون فیلترکردن است؛ به بیان دیگر، در سبدهای سرمایه‌گذاری با بازده مورد انتظار زیاد، استفاده از روش‌های فیلترینگ ماتریس ضرایب همبستگی به ریسک کمتری نمی‌انجامد؛ اما از نظر قابل ‌اعتماد بودن سبدهای سرمایه‌گذاری، هر دو روش، عملکرد مناسبی دارند، به‌گونه‌ای‌ که روش اتصال واحد در 89 درصد و روش اتصال میانگین در 100 درصد موارد بر روش عادی غلبه دارد.

 

نتیجه‌گیری و پیشنهادها

پژوهش حاضر با استفاده از ماتریس ضرایب همبستگی فیلترشده، بهینه‌سازی سبد سرمایه‌گذاری را بررسی می‌کند. بدین‌منظور، دو روش مبتنی بر خوشه‌بندی اتصال واحد و اتصال میانگین برای فیلترکردن استفاده شد و عملکرد سبدهای سرمایه‌گذاری بهینه‌شده حاصل از اعمال روش‌های مذکور در مقایسه با روش بدون فیلترکردن تحلیل و بررسی شد. برای تحلیل حساسیت نتایج با استفاده از تکنیک بوت استرپینگ و بازنمونه‌گیری، تعداد زیادی سبد سرمایه‌گذاری با ابعاد و ویژگی‌های متنوع تشکیل و روش‌های ذکرشده در آن‌ها پیاده شد. نتایج به‌دست‌آمده نشان می‌دهد روش‌های فیلترکردن ارائه‌شده از نظر قابل ‌اعتماد بودن و از نظر ریسک تحقق‌یافته، درمجموع عملکرد بهتری نسبت به روش‌های بدون فیلترکردن از خود نشان می‌دهند. این نتایج که براساس اطلاعات برداشت‌شده از بورس اوراق بهادار تهران به دست آمده‌ است، با نتایج پژوهش‌های مشابه در بورس نیویورک مطابقت دارد ]14[.

با توجه به نتایج حاصل از این پژوهش پیشنهاد می‌شود از تلفیق هر دو روش اتصال میانگین و اتصال واحد، یک سیستم بهینه‌سازی پویا طراحی شود. همان‌طورکه در نتایج مشاهده می‌شود در هر ترکیب مختلف از تعداد سهام و افق سرمایه‌گذاری، یکی از این روش‌ها بر دیگری برتری دارد. با در نظرگرفتن ملاحظات ریسک‌گریزی سرمایه‌گذار نیز معیارهای انتخاب روش فیلترکردن گسترده‌تر می‌شود و انتظار می‌رود این سیستم با درنظرگرفتن همۀ آن‌ها، بهترین روش را در شرایط مختلف انتخاب کند. سیستم بهینه‌سازی پویا باید بتواند در طول زمان با رصدکردن بازار و ماتریس‌های همبستگی فیلترشده، به‌طور مستمر سبد سرمایه‌گذاری مناسب سرمایه‌گذار را انتخاب کند و آن را در معرض کمترین ریسک ممکن قرار دهد.

 

 

[1] Bellman, R. (1961). Adaptive control processes—A guided tour. Naval Research Logistics Quarterly, 8(3): 315–316.
[2] Bonanno, G., Caldarelli, G., Lillo, F., & Mantegna, and R. N. (2003). Topology of correlation based minimal spanning trees in real and model markets. Physical Review E, 68(4), 4.
[3] Bonanno, G., Lillo, F., & Mantegna, R. N. (2000). High-frequency Cross-correlation in a Set of Stocks. Quantitative Finance, 1(1), 96–104.
[4] Drozdz, S., Kwapien, J., Gruemmer, F., Ruf, F., & Speth, J. (2001). Quantifying dynamics of the financial correlations, Physica A: Statistical Mechanics and its Applications, 299(1): 144-153.
[5] Galluccio, S., Bouchaud, J., & Potters, M. (1998). Rational Decisions, Random Matrices and Spin Glasses, Physica A: Statistical Mechanics and its Applications, 259(3): 449-456.
[6] Gower, J., & Ross, G. (1969). Minimum spanning trees and single linkage cluster analysis. Applied Statistics, 18(1), 54–64.
[7] Laloux, L., Cizeau, P., Bouchaud, J., & Potters, M. (1998). Noise Dressing of Financial Correlation Matrices, Physical Review Letters, 83(7), 1467-1470.
[8] LaLoux, L., Cizeau, P., Potters, M., & Bouchaud, J. (2000). Random Matrix Theory and Financial Correlations. International Journal of Theoretical and Applied Finance, 3(03): 391–397.
[9] Mantegna, R. N., Stanley, H. E., & Chriss, N. A. (2000). An Introduction to Econophysics: Correlations and Complexity in Finance. Cambridge: Cambridge University Press.
[10]           Mohammadi, S., Khojasteh, M. (2009). Portfolio optimization based on filtered covariance matrix. Economics Letters, 72(5): 33-48. (in Persian)
[11]           Onnela, J.-P., Chakraborti, a., Kaski, K., & Kertiész, J. (2002). Dynamic asset trees and portfolio analysis. The European Physical Journal B - Condensed Matter, 30(3), 285–288.
[12]           Pafka, S., & Kondor, I. (2003). Noisy Covariance Matrices and Portfolio Optimization. Physica A: Statistical Mechanics and Its Applications, 319, 487–494. Statistical Mechanics; Portfolio Management.
[13]           Plerou, V., Gopikrishnan, P., Rosenow, B., Amaral, L. A. N., Guhr, T., & Stanley, H. E. (2001). A Random Matrix Approach to Cross-Correlations in Financial Data. Physical Review E, 65(6): 20-38.
[14]           Raei, R., Jafari, G., Namaki, A. (2010). Analysis of Tehran Stock Exchange using complex network based on threshold method. Journal of the Accounting and Auditing Review, 17(62): 33-48. (in Persian)
[15]           Sandoval Jr., L., Bortoluzzo, A., & Venezuela, M. (2014). Not all that glitters is RMT in the forecasting of risk of portfolios in the Brazilian stock market. Physica A: Statistical Mechanics, 410: 94-109.
[16]           Sharifi, S., Crane, M., Shamaie, A., & Ruskin, H. (2004). Random matrix theory for portfolio optimization: a stability approach. Physica A: Statistical Mechanics, 335: 629–643.
[17]           Tola, V., Lillo, F., Gallegati, M., & Mantegna, R. N. (2008). Cluster analysis for portfolio optimization. Journal of Economic Dynamics and Control, 32(1): 235–258.