نقش مدیریت سود در شناسایی صورت‌های مالی متقلبانه در شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی دکترا، گروه حسابداری، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران

2 دانشیار گروه حسابداری، دانشکده علوم اداری و اقتصاد دانشگاه اصفهان، ایران

3 استادیار گروه اقتصاد، دانشکده علوم اداری و اقتصاد، دانشگاه اصفهان، ایران

چکیده

هدف: ارائۀ گزارش‌های سالانه منبع باارزشی برای سرمایه‌گذاران، اعتباردهندگان و سایر استفاده‌کنندگان اطلاعات حسابداری است؛ با این حال، بخشی از گزارش‌ها به دلایل مختلف به‌صورت واقعی ارائه نشده است و این موضوع سبب کاهش سودمندی گزارش‌ها می‌شود. مسئلۀ مهم در حسابداری، پیش‎‌بینی و کشف صورت‌های مالی متقلبانه است.
روش: این پژوهش برای کمک به شناسایی این صورت‌های مالی، رابطۀ مدیریت سود و صورت‌های مالی متقلبانه را در شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران بررسی کرده است. برای سنجش توانایی الگو‌های مدیریت سود در شناسایی صورت‌های مالی متقلبانه، داده‌های 1303 سال – شرکت (شامل 21 شرکت متقلب و 168 شرکت غیرمتقلب) طی سال‌های 1388 تا 1394 انتخاب و تجزیه و تحلیل با استفاده از روش‌های داده‌کاوی شامل درخت تصمیم، شبکه‌های عصبی و روش بیزین انجام شده است؛ بدین منظور 7 معیار مشهور مدیریت سود استفاده‌شده در پژوهش‌های قبلی بررسی شده است.
نتایج: نتایج پژوهش نشان می‌دهد از بین الگو‌های پژوهش، الگوی درخت تصمیم و از بین الگو‌های اقلام تعهدی، الگوی اقلام تعهدی تعدیل‌شدۀ جونز1 (1991) با نسبت ارزش دفتری، بیشترین ارتباط را با صورت‌های مالی متقلبانه دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluating the Role of Earnings Management in Identifying Fraudulent Financial Statements in Companies Listed in Tehran Stock Exchange

نویسندگان [English]

  • Hossein Alikhani Dehaghi 1
  • Naser Izadinia 2
  • Gholam Hosein Kiani 3
1 Ph.D Student, Department of Accounting,College of Economic and Management,Khorasgan(Isfahan) Branch, Islamic Azad University,Isfahan,Iran
2 Associate Professor in Accounting, Administrative Sciences and Economics Faculty, University of Isfahan, Isfahan, Iran
3 Assistant Professor in Economics, Administrative Sciences and Economics Faculty, University of Isfahan, Isfahan, Iran
چکیده [English]

Objective: Financial statements are of substantial significance to investors and other players in financial markets. Yet, these statements are sometimes misinforming and misleading. Thus, a potentially intricate issue for financial decision-makers is the prediction and detection of fraudulent financial statements.
Method: This research investigates the relationship between earnings management and fraudulent financial statements in Firms, listed in Tehran Stock Exchange in order to help identify fraudulent financial statements in the time interval from 2009 to 2016. In other words, the objective of this study is to evaluate the ability of the popular discretionary accrual models to detect fraudulent financial statements. For this mission, 189 companies (21 fraudulent companies and 168 non-fraudulent) are selected as the research sample. The data mining methods employed in this research are Decision Trees (REPTree), Artificial Neural Networks (ANNs), and Bayesian Networks. We evaluate the ability of 7 measures derived from the extant discretionary accruals models to detect the existence of fraudulence.
Results: The obtained results indicate that among all data mining methods, the Decision Trees method and among all accruals models, the Modified Jones model with book-to-market ratio have the greatest relationship with fraudulent financial statements.

کلیدواژه‌ها [English]

  • Fraudulent financial statement
  • Earnings management
  • data mining methods

مقدمه

آثار زیان‌بار ایجادشده به‌وسیلۀ رسوایی‌های مالی در سال‌های اخیر، توجه به بحث تقلب و به‌ویژه تقلب در صورت‌های مالی را اجتناب‌ناپذیر کرده است. رسوایی‌های مالی علاوه بر داشتن زیان‌های اقتصادی مانند متضررکردن اعتباردهندگان، سرمایه‌گذاران و سهامداران، هزینه‌های سیاسی، قضایی و اجتماعی نیز به بار آورده‌ است. گزارشگری مالی متقلبانه علاوه بر تأثیر مستقیم بر شرکت، بر کارکنان، اعتباردهندگان و سرمایه‌گذاران نیز تأثیر داشته و موجب تضعیف قابلیت اعتماد صورت‌های مالی و بازارهای سرمایه شده است (پرولز[1] و لوجی[2]، 2011)؛ بنابراین، از موضوع‌هایی که پژوهشگران به آن توجه کرده‌اند، پیش‌بینی و شناسایی شرکت‌های متقلب است. پژوهش دربارۀ پیش‌‎بینی تقلب و تشخیص آن از این نظر اهمیت دارد که موجب افزایش توانایی حسابرسان و قانون‌گذاران و نهادهای نظارتی برای شناسایی تقلب یا به‌منزلۀ پایه‌ای برای پژوهش‌های تقلب در آینده است (کویین‌لان[3]، 1987). اعتمادی و زلقی (2013) و صفرزاده (2010) معتقدند توجه به مسئلۀ گزارشگری مالی متقلبانه در ایران با توجه به افزایش تعداد شرکت‌های پذیرفته‌‎شده در بورس اوراق بهادار تهران ضروری است؛ بنابراین، نتایج این پژوهش علاوه بر گسترش ادبیات پژوهش‌ دربارۀ تقلب و مدیریت سود، سبب افزایش اعتماد استفاده‌‎کنندگان گزارش‌های مالی و درنتیجه، افزایش کارآیی عملیاتی بازار سرمایه می‌شود. حمایت از منافع ذینفعان واحدهای تجاری و کمک به بهبود سازوکار‌های درونی حاکمیت شرکتی و نهادهای نظارتی بر بازار اوراق بهادار در شناسایی و پیش‌بینی احتمال وقوع تقلب در صورت‌های مالی قبل از رخداد آن ازجمله دلایل اهمیت موضوع پژوهش است؛ بنابراین، حسابرسان و سایر نهادهای نظارتی قادرند قبل از وقوع تقلب، اقدام به پیش‌‎بینی و جلوگیری از رویداد آن کنند. شرکت‌ها ازطریق مدیریت سود یا تقلب، صورت‌های مالی را دستکاری می‌کنند؛ اما با توجه به اینکه اقلام تعهدی با گذشت زمان معکوس می‌شوند (هلی[4]، 1985)، شرکت‌هایی که اقدام به مدیریت سود می‌کنند، در آینده باید پیامدهای عکس اقلام تعهدی را بپذیرند یا اقدام به تقلب کنند (بنیش[5]، 1999؛ دچو[6]، لارسون[7] و اسلوان[8]، 2011)؛ بنابراین، پیش‌بینی می‌شود بین مدیریت سود و تقلب ارتباطی وجود داشته باشد. پژوهش‌های اخیر نیز نشان می‌دهند یکی از روش‌های شناسایی شرکت‌های متقلب، استفاده از الگو‌های اقلام تعهدی استفاده‌شده در اندازه‌گیری مدیریت سود است. در این زمینه، پژوهش‌های نصیر[9]، جهانگیر[10]، رشدی[11]، رزاق[12] و احمد[13] (2018) و رامیرز ارلانا[14]، ماریا[15]، مارتینز–رومرو[16] و ترسا-ماری[17] (2017) و پرولز و لوجی (2011) بیان‌کنندۀ انجام مدیریت سود در شرکت‌های متقلب نسبت به سایر شرکت‌ها قبل از وقوع تقلب است. نتایج حاصل از پژوهش جونز، کریشنان[18] و ملندرز[19] (2008) نیز بیان‌کنندۀ توانایی الگو‌های دچو و دیچو[20] (2002) و مک‌نیکولز[21] (2002) برای شناسایی صورت‌های مالی متقلبانه است. نتایج پژوهش خلیفه‌سلطانی، حسینی و مددی‌ورزقانی (2013)، فرقاندوست‌حقیقی، هاشمی و فروغی‌دهکردی (2014) و قیداری (2019) نیز نشان می‌دهد در شرکت‌هایِ دارای سابقۀ مدیریت سود، احتمال ارتکاب تقلب وجود دارد. یافته‌های پژوهش مشایخی و حسین‌پور (2016) نشان می‌دهد در شرکت‌های بورسی مشکوک به تقلب، مدیریت سود واقعی بر مدیریت سود تعهدی در سطح اطمینان 95‌درصد، تأثیر منفی و معنی‎‌داری دارد. نتایج پژوهش زادمهر، موسوی و جنانی (2018) نیز نشان‌دهندۀ تأثیرگذاری انگیزۀ تقلب بر مدیریت سود است. تفاوت پژوهش حاضر با پژوهش‌های قبلی انجام‌شده در این حوزه، در تعداد الگو‌های بررسی‌شده، روش آماری و نحوۀ شناسایی شرکت‌های متقلب است؛ بنابراین، هدف از انجام این پژوهش، ارزیابی توانایی الگو‌های اقلام تعهدی استفاده‌شده در کشف مدیریت سود، در کشف صورت‌های مالی متقلبانه است و این مسئله بررسی می‌شود که آیا در شرکت‌های دارای سابقۀ مدیریت سود، احتمال ارتکاب تقلب در صورت‌های مالی بیشتر است یا خیر.

 

مبانی نظری

طبق استانداردهای حسابرسی ایران (استاندارد حسابرسی شمارۀ 240)، (کمیتۀ تدوین استانداردهای حسابرسی، 1396) تقلب عبارت از هرگونه اقدام عمدی به‌وسیلۀ یک یا چند نفر از مدیران اجرایی، ارکان راهبری، کارکنان یا اشخاص ثالث است که فریبکاری برای برخورداری از مزیتی ناروا یا غیرقانونی را شامل می‌شود. مبنای نظری دستکاری در اطلاعات و تقلب، بر امکان انتقال ثروت از یک ذینفع به سایر ذینفعان مبتنی است که از عدم تقارن اطلاعاتی نشئت می‌گیرد (ذاکری، 2010). تقلب و مدیریت سود هرچند مشابهت‌هایی دارند، لزوماً یکسان نیستند؛ زیرا تقلب خارج از اصول پذیرفته‎شدۀ حسابداری قرار دارد. در صورتی که مدیریت سود در چهارچوب این اصول انجام می‌شود. با توجه به اینکه دستکاری صورت‌های مالی ممکن است در چهارچوب اصول پذیرفته‌شدۀ حسابداری یا خارج از آن باشد، دستکاری صورت‌های مالی برابر با اقدام مدیران در مدیریت سود یا تقلب است (فرقاندوست‌حقیقی و همکاران، 2014). شرکت‌ها ازطریق روش‌های منطبق با اصول پذیرفته‎شدۀ حسابداری یا روش‌های دیگری صورت‌های مالی را دستکاری می‌کنند. نقض اصول پذیرفته‌شدۀ حسابداری عامل مهمی از گزارشگری متقلبانه است و در مقابل مدیریت سود در چهارچوب اصول پذیرفته‌شدۀ حسابداری انجام می‌شود؛ به عبارت دیگر، دستکاری و تحریف صورت‌های مالی با استفاده از تقلب یا مدیریت سود انجام می‌گیرد (پرولز و لوجی، 2011) و این دو موضوع سبب شکست‌های شرکتی در سال‌های اخیر شده‌اند (خواجوی و ابراهیمی، 2018) و هر دو عامل بر قیمت و بازده سهام تأثیرگذارند. نتایج پژوهش اینس[22] (2017) نشان می‌دهد تقلب تأثیر معنی‌دار و بااهمیت‌تری نسبت به اقلام تعهدی اختیاری بر قیمت و بازده سهام دارد؛ ولی با توجه به اینکه اقلام تعهدی با گذشت زمان معکوس می‌شوند، شرکت‌هایی که اقدام به مدیریت سود می‌کنند، باید در آینده پیامدهای عکس اقلام تعهدی را بپذیرند یا اقدام به تقلب کنند (بنیش، 1997؛ دچو، اسلوان و سویینی[23]، 1995؛ مشایخی و حسین‌پور، 2016)؛ به عبارت دیگر، هرچند شرکت‌ها ممکن است لزوماً سابقۀ مدیریت سود نداشته باشند، شرکت‌هایی که مرتکب تقلب می‌شوند، شرکت‌هایی هستند که هم سابقۀ مدیریت سود دارند و هم ممکن است جزء شرکت‌هایی باشند که سابقۀ مدیریت سود نداشته‌اند؛ ولی می‌توان پیش‌بینی کرد زمانی که شرکت اقدام به انجام مدیریت سود می‌کند، احتمال بیشتری برای انجام تقلب وجود دارد؛ بنابراین، گزارشگری مالی متقلبانه ممکن است با مدیریت سود آغاز و با گذشت زمان به تقلب تبدیل شود (لندسیتل[24]، 2000). براساس پژوهش هو[25] (1999) نیز شرکت‌ها زمانی که از اصول پذیرفته‌شدۀ حسابداری بیشترین بهره را می‌گیرند، به تقلب متوسل می‌شوند؛ یعنی ابتدا مدیریت سود انجام و با افزایش آن تقلب انجام می‌شود (پوول[26]، جاب[27]، لانگ[28] و اسمیت[29]، 2005). دچو و همکاران (1995) شواهدی ارائه می‌کنند که شرکت‌ها زمانی به تقلب روی می‌آورند که استفاده از مدیریت سود برای آنها محدود می‌شود. نتایج پژوهش نصیر و همکاران (2018)، هسنان[30]، عبدالرحمان[31] و ماهنثیران[32] (2013) و آسار[33] (2019) نیز استفادۀ شرکت‌های متقلب از اقلام تعهدی برای دستکاری صورت‌های مالی را نشان می‌دهد؛ به عبارت دیگر، می‌توان پیش‌‎بینی کرد زمانی که شرکت اقدام به انجام مدیریت سود می‌کند، احتمال بیشتری برای انجام تقلب وجود دارد. الگو‌هایی که مدیریت سود را اندازه‌گیری می‌کنند، به‌طور کلی به دو دستۀ الگوهای مبتنی بر اقلام تعهدی اختیاری و کل اقلام تعهدی تفکیک می‌شوند. مهم‌ترین الگو‌های مبتنی بر اقلام تعهدی اختیاری عبارت‌اند از: الگوی جونز (جونز، 1991)، الگوی تعدیل‌شدۀ جونز (دچو و همکاران، 1995)، الگوی تعدیل‌شدۀ جونز با نسبت ارزش دفتری به ارزش بازار و جریان‌های نقدی (لارکر[34] و ریچاردسون[35]، 2004)، الگوی تعدیل‌شدۀ جونز با نسبت بازده دارایی‌های سال جاری و سال قبل (کوتاری[36]، لئون[37] و چارلز[38]، 2005). دچو و دیچو (2002) و مک‌نیکولز (2002) نیز دو الگوی معروف مبتنی بر کل اقلام تعهدی را ارائه می‌کنند که کیفیت اقلام تعهدی را اندازه‌گیری می‌‌کنند.

1- الگوی جونز

براساس الگوی جونز (1991) مقدار باقی‌مانده در الگو، معیار اقلام تعهدی در نظر گرفته می‌شود. جونز تفاوت سود عملیاتی و وجوه نقد حاصل از عملیات را اقلام تعهدی شناسایی و در الگوی خود فرض کرد اقلام تعهدی غیراختیاری در طول زمان ثابت‌اند و درآمد فروش به‌صورت کامل غیراختیاری است؛ بنابراین، برای محاسبۀ اقلام تعهدی اختیاری باید اقلام تعهدی غیراختیاری از مجموع اقلام تعهدی کسر شود. در این الگو، اقلام تعهدی به شرح زیر برآورد می‌شود:

 

TACCt= B0+B1 1(1/Ait-1)+B2( REVit/Ait-1)+B3(PPEit/Ait-1)+ it

 

که TACCt کل اقلام تعهدی، Ait-1 کل دارایی‌های ابتدای سال، REVit تغییرات کل درآمد فروش سال جاری نسبت به سال قبل و PPEit اموال، ماشین‌آلات و تجهیزات را بیان می‎‌کنند. it نیز نشان‌دهندۀ خطای الگو و اقلام تعهدی اختیاری و معیاری از میزان اعمال مدیریت سود است.

2- الگوی تعدیل‌شدۀ جونز

دچو و همکاران (1995) بیان می‌کنند که الگوی جونز به‌صورت ضمنی فرض کرده است درآمدها غیراختیاری‌اند؛ در صورتی ‌که در الگوی تعدیل‌شدۀ جونز فرض می‌شود همۀ تغییرات در فروش‌های نسیه در سال رخداد به‌دلیل مدیریت سود است؛ بنابراین، برای اندازه‌‎گیری بهتر اقلام تعهدی الگوی زیر ارائه شد:

 

TACCt= B0+B1 1(1/Ait-1)+B2(( REVit- ARit)/Ait-1))+B3(PPEit/Ait-1)+ it

 

که ARit عبارت از تغییر در حساب‌های دریافتنی نسبت به سال قبل است. سایر متغیرها مشابه الگوی جونز است.

3- الگوی تعدیل‌شدۀ جونز با نسبت ارزش دفتری به ارزش بازار و جریان‌های نقدی

لارکر و ریچاردسون (2004) دو نسبت ارزش دفتری به ارزش بازار و جریان‌های نقدی عملیاتی را به الگوی جونز افزودند. نسبت ارزش دفتری به ارزش بازار رشد موردانتظار در عملیات را کنترل می‌کند؛ زیرا در غیر این صورت رشد شرکت، اقلام تعهدی اختیاری در نظر گرفته می‌شود. جریان‌های نقدی عملیاتی نیز عملکرد عملیاتی جاری را کنترل می‌کنند؛ زیرا پژوهش‌ها نشان داد در شرکت‌های دارای عملکرد غیرعادی، اقلام تعهدی اختیاری به احتمال زیاد به‌درستی نشان داده نمی‌شوند.

 

TACCt=B0+B11(1/Ait-1)+B2( REVit/Ait-1)+B3(PPEit/Ait-1)+B4BMit+B5(CFOit/Ait-1)+ it

 

که BMit عبارت از ارزش دفتری سهام عادی به ارزش بازار سهام عادی و CFOit عبارت از جریان‌های نقدی عملیاتی است. سایر متغیرها مشابه الگوی جونز است.

4 و 5- الگوی تعدیل‌شدۀ جونز با ROA

کوتاری و همکاران (2005) استدلال می‌کنند که اقلام تعهدی شرکت‌هایی که عملکرد غیرعادی را تجربه کرده‌اند، به‌صورت سیستماتیک صفر نیست؛ بنابراین، اقلام تعهدی با عملکرد شرکت همبستگی دارد و برای بهبود اندازه‌‎گیری اقلام تعهدی معیار بازده دارایی‌ها در سال جاری و سال قبل را به الگوی تعدیل‌شدۀ جونز اضافه کردند.

 

TACCt= B0+B1 1(1/Ait-1)+B2( REVit/Ait-1)+B3(PPEit/Ait-1)+B4ROAit+ it

 

TACCt= B0+B1 1(1/Ait-1)+B2( REVit/Ait-1)+B3(PPEit/Ait-1)+B4ROAit-1+ it

 

6- الگوی دچو و دیچو

دچو و دیچو (2002) معتقدند اقلام تعهدی در هر سال با جریان‌های نقدی سال قبل، سال جاری و سال بعدی ارتباط دارد و بر وجه نقد این سه دوره تأثیر می‌گذارد یا خواهد گذاشت. در این الگو مقدار خطای حاصل از تخمین الگو، شاخص کیفیت سود در نظر گرفته می‌شود. این الگو به شرح زیر است:

 

WCit=B0+B1CFOit-1+B2CFOit+B3CFOit+1+ it

 

که WCit تغییرات سرمایه در گردش در سال جاری نسبت به سال قبل، CFOit-1جریان نقد عملیاتی در سال قبل، CFOitجریان نقد عملیاتی در سال جاری و  CFOit+1جریان نقد عملیاتی در سال بعد است.

7- الگوی مک‌‎نیکولز

ازنظر دچو و دیچو (2002)، اقلام تعهدی تعدیل‌های موقتی‌اند که جریان‌های نقدی را میان دوره‌های زمانی مختلف جابه‌جا می‌کنند؛ بنابراین، الگوی خود را بر پایۀ اقلام تعهدی سرمایه در گردش قرار دادند. نتایج آزمون الگوی ترکیبی که در آن از اقلام تعهدی و جریان‌های نقدی استفاده شده است، نشان می‌دهد به‎‌کارگیری جریان‌های نقدی در الگوی ترکیبی جونز در کنترل عملکرد مالی شرکت‌ها و تبیین رفتارهای مدیریت، توانمندی بهتری دارد (کردستانی و مدافعی، 2012). در ادامۀ پژوهش‌های قبلی، مک‌نیکولز (2002) شواهدی ارائه کرد که در صورت اضافه‌‎کردن دو متغیر تغییرات فروش در سال جاری نسبت به سال قبل و اموال، ماشین‌آلات و تجهیرات به الگوی دچو و دیچو (2002)، قدرت الگو افزایش می‌یابد.

 

WCit=B0+B1CFOit-1+B2CFOit+B3CFOit+1+ B4( REVit/Ait-1)+B5(PPEit/Ait-1)+ it

 

روش پژوهش

اﯾــﻦ پژوهش ازﻟﺤــﺎظ ﻫــﺪف، ﮐــﺎرﺑﺮدی و از ﻧــﻮع پژوهش‌های ﺗﺠﺮﺑــﯽ و پس‌رویدادی است که بر اطلاعات واقعی صورت‌های مالی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران مبتنی است. برای مبانی نظری از روش کتابخانه‌ای استفاده و اطلاعات لازم برای محاسبه و پردازش متغیرها به روش اسنادکاوی از بانک‌های اطلاعاتی و صورت‌های مالی و نرم‎‌افزار ره‌آورد نوین و بانک اطلاعاتی جامعۀ حسابداران رسمی جمع‌آوری شده است. جامعۀ آماری از همۀ شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران در بازۀ زمانی 1388 تا 1394 تشکیل شده است که صورت‌های مالی و یادداشت‌های همراه آن در دورۀ زمانی اشاره‌شده موجود باشد و جزء بانک‌ها و مؤسسه‌های مالی (شرکت‌های سرمایه‌گذاری، واسطه‎‌گری مالی، شرکت‌های هلدینگ و لیزینگ‌ها) نباشد؛ درنهایت، با اعمال شرایط تعداد 189 شرکت (شامل 21 شرکت متقلب و 168 شرکت غیرمتقلب) انتخاب شده است. روش آﻣــﺎری اﻧﺘﺨــﺎب‌ﺷــﺪه ﺑــﺮای ﺗــﺪوﯾﻦ الگوی پژوهش، روش داده‌کاوی شامل روش‌های درخت تصمیم، شبکه‌های عصبی و یادگیری بیزین است. دلیل اصلی استفاده از این روش‌ها شناخته‌شده بودن آنها در حوزۀ داده‌کاوی و مزایای استفاده از آنهاست. نتایج پژوهش لین[39]، چیو[40]، هوانگ[41] و ین[42] (2015) نشان می‌دهد شبکۀ عصبی و درخت تصمیم نسبت به روش رگرسیون دقت بیشتری برای شناسایی شرکت‌های متقلب دارند. نتایج پژوهش راویسانکار[43]، راوی[44]، راجاوا رائو[45] و باس[46] (2011) نیز نشان‌دهندۀ دقت بالای شبکه‌های عصبی برای کشف تقلب است. شبکۀ عصبی، روشی است که توانایی الگوسازی روابط پیچیدۀ غیرخطی را دارد؛ ازاین‌‍‌رو، برای الگو‌سازی مسائل واقعی که به‌طور معمول ماهیت غیرخطی دارند، استفاده می‌شود. از مزایای دیگر شبکه‌های عصبی قدرت بالای تعمیم‌دهی آنهاست که قادرند با تعداد محدودی نمونه، قانونی کلی از آن به دست آورند (جهانپور و صادقی، 2016). از مزایای درخت تصمیم نیز ایجاد الگویی است که بتوان آن را فهمید و شبکه‌های عصبی آن را ندارند (خلیلی و پاشازاده، 2014). روش بیزین نیز الگویی بدون پارامتر است که به‌طور معمول برای طبقه‌بندی کردن مسائل واقعی استفاده می‌شود؛ درواقع، مسئلۀ پژوهش به‌صورت مسئله‌ای طبقه‌بندی[47] در حوزۀ داده‌‎کاوی در نظر گرفته و از الگوریتم‌های موفق برای طبقه‌بندی استفاده شده است.

یادگیری درخت تصمیم[48] روشی برای تخمین مقادیر هدف‌گسسته است که یک درخت، الگوی ساخته‌شده در آن را نمایش می‌دهد و الگوی به‌دست‌آمده برای انسان خوانا و فهمیدنی است. این روش یادگیری از رایج‌ترین الگوریتم‌های استنتاج قیاسی است که روی حیطۀ وسیعی از کاربردها از تشخیص‌های پزشکی تا ارزیابی ریسک اعتباردهی وام، به‌صورت موفقیت‌آمیز اعمال شده است. یک درخت براساس مجموعۀ آموزشی ایجاد می‌شود. در این درخت هر گره داخلی، یک آزمون را روی یک ویژگی و هر شاخه، نتیجه‌ای از آزمایش را نشان می‌دهد و هر برگ برچسب یک طبقه را نگهداری می‌کند. برای هر نمونۀ جدید از داده، ویژگی‌های این نمونه در درخت آزمون و یک مسیر از ریشه به‌سمت یک برگِ دارای برچسب یک طبقه ایجاد و برچسب نمونۀ جدید مشخص می‌شود. برای انتخاب ویژگی‌ها در هر گره درخت، از معیارهای آماری متفاوتی چون بهرۀ اطلاعاتی[49]، نسبت بهره[50] و شاخص جی نی[51] استفاده می‌شود. این معیارها برای هر گره وظیفۀ انتخاب ویژگی را دارند که مقادیر مختلف آن، بیشترین خلوص را ازنظر طبقه در داده‌های تقسیم‌شده در شاخه‌های آن گره ایجاد کند. برای جلوگیری از تطابق بیش از حد[52] درخت با داده‌های آموزشی، از روش‌هایی برای کنترل عمق درخت استفاده می‌شود. اندازۀ درخت‌ها با قوانین توقف، کنترل می‌شود یا پس از پایان ساخت، درخت هرس می‌شود. الگوریتم REPTree[53] از الگوریتم‌های شناخته‌شدۀ یادگیری درخت تصمیم است که در این مقاله نتایج خوبی را برای الگوسازی داده‌های مسئله در بر داشته است. الگوریتمREPTree  الگوریتم طبقه‌‎بندی سریعی است که بر مبنای محاسبۀ بهرۀ اطلاعاتی و آنتروپی عمل می‌کند و خطای حاصل از واریانس را به حداقل می‌رساند (ویتن[54] و فرانک[55]، 2005). این روش که ابتدا کوئین‌لان (1987) آن را پیشنهاد داد، از درخت‌های رگرسیونی بهره می‌برد و چندین درخت در تناوب‌های مختلف الگوریتم ایجاد می‌کند؛ درنهایت، بهترین درخت از میان درختان تولیدشده به‌منزلۀ الگو انتخاب می‌شود؛ سپس درخت مدنظر با استفاده از روش هرس کاهش خطا[56] هرس می‌شود. این روش قادر است داده‌های پیوسته و داده‌های مفقود[57] را مدیریت کند (جایانتی[58] و سسیکالا[59]، 2013).

شبکه‌های عصبی، فن پردازش اطلاعات‌اند که به‌طور چشمگیر در زمینه‌هایی چون تعیین الگو، طبقه‌بندی و پیش‌بینی سری‌های زمانی (راعی و بستان‌آرا، 2016) و برای مسائل طبقه‌بندی (که خروجی یک کلاس است) یا مسائل رگرسیون (که خروجی مقدار عددی است) استفاده می‌شوند. یک شبکۀ عصبی[60] به این صورت تعریف می‌شود: «سیستم انطباقی که تعدادی عناصر پردازش ساده را شامل می‌شود و از شبکۀ اعصاب مغز الگوبرداری شده است. عناصر پردازش که درواقع همان نرون‌ها هستند، به هم می‌پیوندند تا یک مسیر پردازش را کامل کنند» (عالم‌تبریز، زندیه و محمدرحیمی،2011). در روش شبکۀ ﻋﺼﺒﯽ ﻓﺮض ﻏﯿﺮﺧﻄﯽ ﺑﻮدن و اﺳﺘﻘﻼل ﻣﺘﻐﯿﺮﻫﺎی ﺗﻮﺿﯿﺤﯽ ﺣﺬف ﺷﺪه اﺳﺖ و در آن رواﺑﻂ ﭘﻨﻬﺎن ﺑﯿﻦ ﻣﺘﻐﯿﺮﻫﺎی ﺗﻮﺿﯿﺤﯽ ﺑﻪ‌منزلۀ ﻣﺘﻐﯿﺮی اﺿﺎﻓﯽ وارد ﺗﺎﺑﻊ می‌شود. شبکۀ ﻋﺼﺒﯽ ﻫﻤﺎﻧﻨﺪ ﻣﻐﺰ اﻧﺴﺎن از گرهﻫﺎﯾﯽ ﺗﺸﮑﯿﻞ ﺷﺪه اﺳﺖ ﮐﻪ ﻋﻤﻞ ﭘﺮدازش ﻋﻨﺎﺻﺮ را اﻧﺠﺎم ﻣﯽدﻫﻨﺪ و همانند ﻧﺮون‌های واقعی ازطریق اﺗﺼﺎل‌های داﺧﻠﯽ ﻣﻮزوﻧﯽ ﺑﻪ ﻫﻤﺪﯾﮕﺮ ﻣﺮﺗﺒﻂ ﺷﺪه‌اﻧﺪ. ﻫﺮ ﮔﺮه ﻋﻼئم ورودی را درﯾﺎﻓﺖ و ﺑﻪ ﺧﺮوﺟﯽ ﺗﺒﺪﯾﻞ ﻣﯽ‌کند ﮐﻪ اﮔﺮ ﻣﻔﻬﻮم و ﻋﻼﻣﺖ ﻗﺎﻧﻊ‌کننده‌ای ﻧﺒﺎﺷﺪ، دوباره به‌منزلۀ علامت ورودی ﺑﻪ ﮔﺮه‌های دیگر وارد و ارﺳﺎل می‌شود. منظور از یادگیری شبکه‌های عصبی، یافتن مقادیر وزن‌های اتصالات است؛ به‎‌طوری که تابع ایجادشده به‌وسیلۀ شبکه، به بهترین وجه ورودی را به خروجی تبدیل کند. شبکه‌های عصبی، معماری‌های متفاوتی دارند. از معروف‌ترین معماری‌های آنها، پرسپترون ﭼﻨﺪﻻیه[61] است؛ زیرا این معماری ﻫﺮ دو ﻣﺰﯾﺖ ﻏﯿﺮﺧﻄﯽ ﺑﻮدن و در ﻧﻈﺮ ﮔﺮﻓﺘﻦ اﺛﺮات ﻣﺘﻘﺎﺑﻞ ﻣﺘﻐﯿﺮﻫﺎ را فراهم می‌کند. به‌علاوه اﯾﻦ روش «طبقه‌بندی ﺟﺎﻣﻊ[62]» ﺷﻨﺎﺧﺘﻪ می‌شود؛ ﺑﻪ اﯾﻦ دﻟﯿﻞ ﮐﻪ ازﻟﺤﺎظ نظری در صورت داشتن تعداد گره و لایۀ نهان کافی، ﻗﺎدر ﺑﻪ طبقه‌بندی ﻫﺮ ﻓﺮاﯾﻨﺪ ﺗﺼﻤﯿﻢ‌ﮔﯿﺮی اﺳﺖ (رحمانی و اسماعیلی، 2011). هدف از یادگیری بیزین، تخمین احتمال طبقۀ یک نمونه از داده‌هاست. استفاده از این روش برای طبقه‌بندی داده‌های زیاد به‌دلیل دقت بالای آن است (قادرزاده، کردستانی و حقیقت، 2017).

به‌دلیل نامتعادل‌بودن داده‌ها و اهمیت شناسایی شرکت‌های متقلب به‌وسیلۀ الگو از روش یادگیری حساس به هزینه استفاده شده است. مجموعه داده‌های نامتعادل[63]، داده‌هایی هستند که در آنها توزیع نمونه‌ها میان طبقه‌های مختلف نامتعادل است. در این نوع مسائل تعداد نمونه‌ها در طبقه‌های خاصی بسیار کمتر از سایر طبقه‌هاست. برای مثال در مسئلۀ بررسی‌شده در این مقاله تعداد داده‌های طبقۀ تقلب بسیار کمتر از داده‌های طبقۀ نرمال است. در بسیاری از کاربردهای واقعی، توزیع داده‌ها نامتعادل است؛ مانند تشخیص بیماری‌ها، تشخیص تقلب، تشخیص حمله به شبکه‌های کامپیوتری و غیره. اصولاً از الگوریتم‌های طبقه‌بندی انتظار می‌رود نتایج یادگیری را روی نمونه‌های مشاهده‌نشدۀ متعلق به طبقه‌های مختلف، با دقت برابری تعمیم دهند؛ اما در عمل الگوریتم‌های یادگیری ماشین به‌طور معمول روی داده‌های نامتعادل ضعیف عمل می‌کنند؛ زیرا به‌راحتی قادرند الگویی ارائه دهند که تمام نمونه‌ها را متعلق به طبقۀ بزرگ‌تر پیش‌بینی کند (زجاجی، 2008). در این حالت پیش‌بینی نمونه‌های طبقۀ بزرگ‌تر 100 درصد درست است؛ اما دقت پیش‌بینی روی طبقۀ کوچک‌تر کاملاً غلط و صفر خواهد بود و با توجه به تعداد کم نمونه‌های این طبقه در مجموعه داده‌ها، دقت کلی پیش‌بینی هم نزدیک به 100 خواهد شد که ازنظر الگوریتم کافی است. حال آنکه در بیشتر کاربردها هدف از الگوسازی غالباً تشخیص نمونه‌های طبقۀ کوچک‌تر است؛ بنابراین، اصلاح داده‌ها یا روش یادگیری برای این نوع مسائل ضروری به نظر می‌رسد. فن‌‌های برخورد با این نوع داده‌ها، به دو دستۀ اصلی تقسیم می‌شوند: فن‌‌های سطح داده و فن‌‌های سطح الگوریتم. در روش‌های سطح دادۀ هدف، متعادل‌‎سازی توزیع طبقه‌ها با استفاده از نمونه‌گیری دوباره[64] از داده‌هاست. ازسوی دیگر، روش‌های سطح الگوریتم می‌کوشند الگوریتم‌های طبقه‌بندی‌کنندۀ موجود را با داده‌های نامتعادل مطالعه‌شده وفق دهند و توجه و توانایی آنها را در یادگیری طبقۀ کوچک‌تر تقویت کنند. یادگیری حساس به هزینه[65] یکی از انواع این روش‌هاست که در این مقاله به آن توجه شده است. طبقه‌بندی حساس به هزینه برای خطاهای طبقه‌بندی مختلف، هزینه‌های متفاوتی در نظر می‌گیرد.

ﻣﺘﻐﯿﺮ واﺑﺴـﺘﻪ در اﯾﻦ پژوهش، ﺻـﻮرت‌های ﻣـﺎﻟﯽ متقلبانه اﺳـﺖ ﮐـﻪ ﻣﺎﻫﯿﺖ ﮐﯿﻔـﯽ و ﻣﻘﯿـﺎس ﺳـﻨﺠﺶ اﺳـﻤﯽ دارد. در اﻧـﺪازهﮔﯿـﺮی اﯾـﻦ ﻣﺘﻐﯿـﺮ، ﺑـﻪ شرکت‌های متقلب ﻋـﺪد ﯾـﮏ و ﺑـﻪ سایر شرکت‌ها ﻋﺪد ﺻـﻔﺮ ﺗﺨﺼــﯿﺺ داده می‌شود. ﺑﺮای ﺗﺸﺨﯿﺺ و ﻃﺒﻘﻪﺑﻨﺪی واﺣﺪﻫﺎی اﻗﺘﺼﺎدی متقلب از بانک اطلاعاتی جامعۀ حسابداران رسمی استفاده شده است. با مدیران و حسابرسانِ شرکت‌های پذیرفته‌‎شده در بورس اوراق بهادار که اقدام به ارائۀ صورت‌های مالی متقلبانه می‌‌کنند، برخورد شده است. این موضوع به‌وسیلۀ کمیتۀ نظارت بر شرکت‌های بورسی محرز می‌گردد و به جامعۀ حسابداران رسمی نیز منعکس می‌شود. جامعۀ حسابداران رسمی نیز به‌صورت سالانه مؤسسه‌های حسابرسی را ازنظر کیفی بررسی کرده یا اگر شکایتی ازطرف هر ذینفعی (مانند سهامداران یا اعتباردهندگان) ارائه شود، موضوع را بررسی می‌‌کند و در صورت قطعی‌شدن تخلف حسابرس با آن برخورد می‌شود؛ بنابراین، با استفاده از بانک اطلاعاتی موجود در جامعۀ حسابداران رسمی، می‌توان اطلاعات شرکت‌های ارائه‌‎کنندۀ صورت‌های مالی متقلبانه را به دست آورد. براساس پژوهش جونز و همکاران (2008) علاوه بر خطای برآورد اقلام تعهدی، از متغیرهای زیر به‌منزلۀ متغیرهای کنترلی استفاده شده است: کل دارایی‌ها (TA) که عبارت از مجموع دارایی‌ها در پایان هر سال، بازده دارایی‌ها (ROA) که عبارت از نسبت سود خالص به مجموع دارایی‌ها در پایان هر سال، اهرم مالی (LEVERAGE) که عبارت از کل بدهی‌ها به کل دارایی‌ها در پایان هر سال، بهره‌وری سرمایه (CP) که عبارت از تقسیم دارایی‌ها به فروش و کل فروش (TS) که عبارت از مجموع فروش در پایان هر سال است.

 

یافته‌ها

براساس نتایج آمار توصیفی و مقایسۀ دو گروه شرکت‌های متقلب و شرکت‌های کنترل، تفاوت میانگین اهرم مالی بین دو گروه شرکت‌ها ازنظر آماری در سطح 5٪ معنی‌‎دار است. به‌صورت متوسط در شرکت‌های متقلب اهرم مالی بزرگ‌تری گزارش شده است. نتایج پژوهش جونز و همکاران (2008) نشان می‌دهد شرکت‌های متقلب اهرم مالی کوچک‌تری گزارش کرده‌اند که تفاوت نتایج احتمالاً به‌دلیل تفاوت چگونگی تأمین مالی در شرکت‌های خارجی نسبت به شرکت‌های ایرانی است. اختلاف میانگین پسماند اقلام تعهدی در همۀ الگوها که به‌وسیلۀ دارایی‌های اول دوره همگن شده است، در سطح 5٪ معنی‎‌دار است که با پژوهش جونز و همکاران (2008) هماهنگ است. به‌علاوه دربارۀ سایر متغیرها تفاوت معنی‌داری بین شرکت‌های دو گروه ملاحظه نشد و معیار اقلام تعهدی اختیاری محاسبه‌شده در همۀ الگوها قدرت کشف تقلب را دارد و بیشترین تفاوت بین نمونه‌های متقلب و کنترل برای معیارهای دچو و دیچو و مک‌نیکولز است.

الگوی درخت تصمیم با استفاده از نرم‌افزار وکا[66] ساخته شده است. این الگو با به‌کارگیری یادگیری حساس به هزینه آموزش داده شده است. نمونه‌ها با روش ارزیابی متقابل به 10 قسمت تقسیم شده و آموزش و آزمون انجام شده است. ماتریس هزینۀ استفاده‌شده برای الگو‌سازی با درخت تصمیم به کمک یادگیری حساس به هزینه به‌صورت زیر در نظر گرفته شده است:

 

 

همان طور که در ماتریس مشخص شده است، هزینۀ تشخیص نمونه‌های تقلب به‌صورت طبیعی، 70 برابر خطای تشخیص طبیعی به‌منزلۀ متقلب در نظر گرفته شده است تا سیستم به‌سمت کشف نمونه‌های متقلب متمایل شود. این مقدار هزینه با آزمایش و خطا به دست آمده است. برای جلوگیری از فراتطابق[67] در الگوریتم REPTree نیز از هرس استفاده شده است.

همان گونه که در جدول 1 ملاحظه می‌شود، دقت کلی درخت تصمیم بین 60 تا 70 درصد برای الگوهای مختلف اقلام تعهدی است و سطح زیر منحنی راک نیز بین 53 تا 65 درصد است و الگوی اقلام تعهدی تعدیل‌شدۀ جونز با نسبت ارزش دفتری بیشترین ارتباط با تقلب را نشان می‌دهد (با دقت کلی 70 درصد و سطح زیر منحنی 65 درصد و خطای نوع اول 30 درصد).

برای الگوسازی شبکه‌های عصبی از روش پرسپترون چندلایه با یک لایۀ نهان استفاده شد که در
نرم‎‌افزار وکا پیاده‎‌سازی شده است. به‌علاوه از یادگیری حساس به هزینه برای افزایش حساسیت شبکۀ عصبی به طبقۀ تقلب استفاده شده است. در یادگیری حساس به هزینه با شبکۀ عصبی، بهترین ماتریس هزینه به شکل زیر یافت شد:

 

 

به‌علاوه معماری پرسپترون چندلایه با یک لایۀ نهان و 4 نود نهان تنظیم شده است. میزان یادگیری و ممنتم به ترتیب برابر 3/0 و 2/0 در نظر گرفته شدند. تعداد تکرارها در فرایند یادگیری شبکه 500 بار تنظیم شده است. همان گونه که در جدول 2 ملاحظه می‌شود، دقت کلی عملکرد شبکۀ عصبی بین 42 تا 71 درصد برای الگو‌های مختلف اقلام تعهدی نوسان می‌کند که الگوی دچو و دیچو با دقت 71 درصد و کمترین میزان خطای نوع اول (28 درصد) بیشترین ارتباط با تقلب را نشان می‌دهد.

در  قسمت بعدی از روش بیز ساده[68] برای الگو‌سازی داده‌های در حال بررسی استفاده شد. این الگوریتم نیز با روش یادگیری حساس به هزینه اعمال شده است تا قادر به نمونه‌‎سازی داده‌های نامتعادل در حال بررسی باشد. دقت کلی شبکۀ بیزین برای الگو‌های مختلف بین 49 تا 56 درصد نوسان می‌کند.

 

 

جدول (1) دقت هر الگو براساس خروجی درخت تصمیم

الگو

تقلب

کنترل

 

AUR

F- measure

Precision

FP Rate

TP Rate

AUR

F- measure

Precision

FP Rate

TP Rate

جونز

53/0

046/0

024/0

34/0

52/0

53/0

78/0

99/0

48/0

65/0

تعدیل‎‌شدۀ جونز

64/0

051/0

027/0

34/0

57/0

64/0

79/0

99/0

43/0

65/0

تعدیل‌شدۀ جونز با نسبت ارزش دفتری

65/0

059/0

03/0

30/0

57/0

65/0

82/.

99/0

43/0

70/0

تعدیل‌شدۀ جونز با بازده دارایی سال جاری

59/0

048/0

02/0

36/0

57/0

59/0

77/0

99/0

43/0

63/0

تعدیل‌شدۀ جونز با بازده دارایی سال قبل

63/0

052/0

03/0

30/0

52/0

64/0

81/0

99/0

48/0

69/0

دچو و دیچو

56/0

046/0

02/0

40/0

57/0

56/0

75/0

99/0

43/0

61/0

مک‌نیکولز

60/0

045/0

02/0

39/0

57/0

60/0

75/0

98/0

42/0

60/0

 

جدول (2) دقت هر الگو براساس خروجی شبکه‌های عصبی

الگو

تقلب

کنترل

 

AUR

F- measure

Precision

FP Rate

TP Rate

AUR

F- measure

Precision

FP Rate

TP Rate

جونز

61/0

04/0

02/0

42/0

52/0

61/0

73/0

98/0

47/0

58/0

تعدیل‌شدۀ جونز

50/0

03/0

015/0

57/0

52/0

50/0

59/0

98/0

48/0

43/0

تعدیل‌‎شدۀ جونز با نسبت ارزش دفتری

59/0

04/0

02/0

47/0

57/0

59/0

69/0

99/0

43/0

53/0

تعدیل‌شدۀ جونز با بازده دارایی سال جاری

53/0

03/0

016/0

53/0

52/0

53/0

63/0

98/0

48/0

47/0

تعدیل‌شدۀ جونز با بازده دارایی سال قبل

60/0

04/0

02/0

44/0

57/0

60/0

71/0

99/0

43/0

56/0

دچو و دیچو

60/0

053/0

028/0

28/0

48/0

60/0

83/0

99/0

52/0

72/0

مک‌نیکولز

59/0

04/0

02/0

43/0

52/0

59/0

72/0

99/0

48/0

57/0

 

 

 

 

جدول (3) دقت هر الگو براساس خروجی بیزین

الگو

تقلب

کنترل

 

AUR

F- measure

Precision

FP Rate

TP Rate

AUR

F- measure

Precision

FP Rate

TP Rate

جونز

53/0

035/0

018/0

50/0

57/0

53/0

49/0

99/0

42/0

49/0

تعدیل‌شدۀ جونز

47/0

035/0

018/0

46/0

52/0

46/0

69/0

99/0

47/0

53/0

تعدیل‌‎شدۀ جونز با نسبت ارزش دفتری

47/0

036/0

019/0

49/0

57/0

47/0

67/0

98/0

43/0

51/0

تعدیل‌شدۀ جونز با بازده دارایی سال جاری

48/0

035/0

018/0

47/0

52/0

48/0

69/0

99/0

47/0

53/0

تعدیل‌شدۀ جونز با بازده دارایی سال قبل

47/0

035/0

018/0

46/0

52/0

47/0

70/0

99/0

47/0

54/0

دچو و دیچو

50/0

038/0

02/0

43/0

52/0

50/0

71/0

99/0

47/0

56/0

مک‌نیکولز

41/0

034/0

018/0

45/0

47/0

42/0

70/0

99/0

52/0

55/0

 

 

برای ارزیابی الگو‌های ارائه‌شده از سه معیار مطرح در حوزۀ الگو‌سازی استفاده شده است. ابتدا از اعتبارسنجی متقابل[69] استفاده شد. برای ارزیابی یک الگو به‌طور معمول داده‌ها به دو دستۀ آموزش و آزمون تقسیم می‌شوند: داده‌های آموزش برای ساخت الگو و داده‌های آزمون که هنگام ساخت الگو دیده نشده‌اند، برای ارزیابی به کار می‌روند. از آنجا که در مسئلۀ بررسی‌شده تعداد داده‌های تقلب بسیار کم است، تقسیم این داده‌ها به آموزش و آزمون موجب می‌شود تعداد بسیار کمی از داده‌های تقلب در زمان ارزیابی حضور داشته باشند و به نتایج به‌دست‌آمده به اندازۀ کافی اعتماد نمی‌شود. در روش ارزیابی متقابل، تک‌تک داده‌ها هم در زمان آموزش و هم در زمان ارزیابی استفاده می‌شوند؛ بنابرین، نتایج نشان می‌دهد الگوی مرتبط تا چه اندازه تعمیم‌پذیر و مستقل از داده‌های آموزشی است. روش کار بدین صورت است که داده‌های دردسترس به k قسمت مساوی تقسیم می‌شوند و هر مرتبه یک قسمت برای آزمون و سایر قسمت‌‎ها برای آموزش استفاده می‌شوند؛ درنتیجه، K مجموعه دادۀ آموزش و آزمون به وجود می‌آید و برای هر یک الگویی جداگانه ساخته می‌شود و معیارهای ارزیابی محاسبه می‌شوند؛ درنهایت، میانگین نتیجۀ ارزیابی به‌منزلۀ تخمین نهایی برای کارآیی الگوی بررسی‌شده گزارش می‌شود. در این پژوهش داده‌ها به 10 قسمت تقسیم شدند و در گام اول، یک قسمت برای آزمون و 9 قسمت دیگر برای آزمایش استفاده و الگوسازی انجام شده است و به همین ترتیب 10 الگوی ارائه‌شده و درنهایت، میانگین الگو‌ها در نظر گرفته شده است. نکتۀ جالب‌‌توجه دیگر در هنگام سنجش عملکرد یک الگو، میزان خطای نوع اول[70] و خطای نوع دوم[71] است. خطای نوع اول زمانی رخ می‌دهد که یک شرکت متقلب، شرکتی بدون تقلب معرفی شود و خطای نوع دوم هنگامی به وقوع می‌پیوندد که شرکتی بدون تقلب در طبقۀ شرکت‌های متقلب قرار گیرد. طبقه‌بندی یک شرکت متقلب به‌منزلۀ شرکتی بدون تقلب سبب گرفتن تصمیمات اشتباهی می‌شود که ممکن است خسارت مالی شدیدی را به‎‌دنبال داشته باشد. طبقه‌بندی اشتباه یک شرکت بدون تقلب به‌منزلۀ متقلب ممکن است با هدردادن زمان موردنیاز، به بررسی‌های بیشتر احتیاج پیدا کند و هزینه‌های حسابرسی را افزایش دهد. اگرچه هدف همۀ الگو‌ها کاهش هر دو نوع این خطاهاست، الگویی برتری دارد که در آن میزان خطای نوع اول کمتر از نوع دوم باشد. به‌علاوه سطح زیر منحنی مشخصۀ عملکرد سیستم (ROC) نموداری است که برای ارزیابی یک الگوریتم طبقه‌بندی دودویی به کار می‌رود. این منحنی میزان TPR براساس FPR در رابطۀ زیر نشان داده شده است. در این روابط، TP و TN به ترتیب نشان‌دهندۀ تعداد شرکت‌های متقلب و غیرمتقلب است که به‌درستی تشخیص داده شده‌اند. مقادیر FP و FN نیز به ترتیب، تعداد شرکت غیرمتقلب و متقلبی را نشان می‌دهد که اشتباه تشخیص داده شده‌اند.

 

 

 

نقاط روی این نمودار مقادیر FPR و TPR را به ازای پیکربندی‌های مختلف الگوریتم نشان می‌دهد. سطح زیر منحنی مشخصۀ سیستم (AUR)، از معیارهای ارزیابی عملکرد سیستم است و هرچه مقدار آن بیشتر باشد، الگوریتم بررسی‌شده بهتر ارزیابی می‌شود.

 

نتایج و پیشنهادها

پیش‌بینی شرکت‌های متقلب، از مطالعه‌های بااهمیت در حوزۀ مالی است. با پیش‌بینی تقلب و جلوگیری از آن، نتایج بسیار رضایت‌بخشی به دست می‌آید. در این پژوهش از الگوی درخت تصمیم، شبکه‌های عصبی و روش بیزین که از روش‌های داد‌ه‌کاوی‌اند، برای پیش‌بینی تقلب و بررسی آن با مدیریت سود استفاده شده است.

نتایج به‌دست‌آمده از پژوهش نشان داد اطلاعات صورت‌های مالی، قدرت پیش‌بینی‌‎کنندۀ بالایی دارند و همۀ الگو‌های اقلام تعهدی با تقلب ارتباط دارند و الگوی درخت تصمیم نسبت به شبکه‌های عصبی و روش بیزین ارتباط بیشتری را نشان می‌دهد. از بین الگوهای اقلام تعهدی نیز الگوی اقلام تعهدی تعدیل‌شدۀ جونز با نسبت ارزش دفتری بیشترین دقت و بالاترین ارتباط با تقلب را نشان می‌دهد. نتایج این پژوهش با نتایج پژوهش مشایخی و حسین‌پور (2016) مبنی بر استفادۀ مدیریت شرکت‌های مشکوک به تقلب از یکی از روش‌های مدیریت سود و نیز پژوهش هسنان و همکاران (2013) مبنی بر افزایش اقلام تعهدی در سال‌های منتهی به ارائۀ صورت‌های مالی متقلبانه مطابقت دارد. به‌علاوه با نتایج پژوهش آسار (2019) مبنی بر اینکه افزایش غیرعادی اقلام تعهدی ممکن است نشانه‌ای از وجود تقلب باشد، هماهنگی دارد. هرچند نتایج پژوهش جونز و همکاران (2008) نشان‌دهندۀ وجود ارتباط بین مدیریت سود و صورت‌های مالی متقلبانه است، نتایج نشان می‌دهد الگوهای دچو و دیچو (2002) و مک‌نیکولز (2002) قدرت پیش‌بینی‌کنندگی بیشتری برای تقلب دارند که شاید به‎دلیل تفاوت در نوع جامعۀ آماری باشد. یافته‌های این پژوهش برای استفاده‌کنندگان از صورت‌های مالی و پژوهشگرانی کاربرد دارد که در زمینۀ مدیریت سود و تقلب پژوهش انجام می‌دهند؛ به عبارت دیگر، ﺳﺎزﻣﺎن ﺑﻮرس اوراق ﺑﻬﺎدار ﺗﻬﺮان ﻣﯽﺗﻮاﻧﺪ ﺑﺎ ﺗﻮﻟﯿﺪ نرم‌افزاری کاربردی، ﺷﺮﮐﺖﻫﺎی دارای مدیریت سود را شناسایی و با بررسی آنها از وقوع تقلب جلوگیری کند و از اﯾﻦ ﻃﺮﯾﻖ اﻋﺘﻤﺎد ﺳﻬﺎﻣﺪاران را افزایش دهد. به‌علاوه ﺳﻬﺎﻣﺪاران و اﻋﺘﺒﺎردﻫﻨﺪﮔﺎن - به‌منزلۀ اﺷﺨﺎﺻﯽ ﮐﻪ از تقلب ﺿﺮر و زﯾﺎن ﺟﺒﺮانﻧﺎﭘﺬﯾﺮی ﺑﺮ آﻧﻬﺎ وارد می‌شود - از اﯾﻦ ﻃﺮﯾﻖ قادرند ضرر و زیان خود را کاهش دهند. ﺣﺴﺎﺑﺮﺳﺎن و سایر ناظران بر بازار سرمایه نیز قادرند بدین وسیله قدرت کشف تقلب خود را افزایش دهند؛ البته باید در نظر داشت که به‌دلیل ماهیت شرکت‌های واسطه‌گری، این شرکت‌ها از نمونۀ انتخابی حذف شده‌اند که سبب می‌شود امکان تعمیم یافته‌های پژوهش به همۀ شرکت‌ها وجود نداشته باشد و بررسی موضوع در اینگونه شرکت‌ها باید به‌صورت جداگانه بررسی شود. دسترسی‌نداشتن به اطلاعات شرکت‌های غیربورسی از محدودیت‌های دیگر این پژوهش است که سبب می‌شود امکان تعمیم نتایج پژوهش به همۀ شرکت‌ها وجود نداشته نباشد. متأسفانه از بزرگ‌ترین محدودیت‌های پژوهش دسترسی‌نداشتن به همۀ شرکت‌های متقلب به‌دلیل انتشارنیافتن به‌وسیلۀ بورس اوراق بهادار و جامعۀ حسابداران رسمی یا دسترسی‌‎نداشتن به اطلاعات آنها در سال‌هایی است که تقلب آنها محرز شده است. از محدودیت‌های دیگر این پژوهش وجودنداشتن معیاری برای اندازه‎‌گیری میزان اهمیت تقلب انجام‌شده است. در پژوهش‌های بعدی می‌توان نتایج را ازطریق اضافه‌کردن ویژگی‌های حاکمیت شرکتی بهبود بخشید. در نظر گرفتن سایر روش‌های انجام تقلب مانند ارائۀ کمتر یا بیشتر از واقع سود یا تفکیک مدیریت سود واقعی از مدیریت سود تعهدی نیز ممکن است سبب بهبود نتایج در پژوهش‌های بعدی شود. در ضمن بررسی اقلام صورت‌های مالیِ دستکاری‌شده به‌وسیلۀ مدیریت و میزان فراوانی نحوۀ انجام تقلب نیز ممکن است به پیش‌بینی و کشف تقلب کمک شایانی کند. به‌علاوه باید تغییرات اقلام تعهدی در شرکت‌های متقلب قبل از انجام تقلب و بعد از کشف تقلب بررسی شود.



[1]. Perols

[2]. Lougee

[3]. Quinlan

[4] . Healy

[5] .Beneish

[6]. Dechow

[7]. Larson

[8]. Sloan

[9]. Nasir

[10]. Jahangir

[11]. Rushdi

[12]. Razzaque

[13]. Ahmed

[14]. Ramírez-Orellana

[15]. María

[16]. Martínez-Romero

[17]. Teresa Mari˜

[18]. Krishnan

[19]. Melendrez

[20]. Dechow & Dichev

[21]. Mcnichols

[22]. Ines

[23]. Dechow & Sloan & Sweeney

[24]. Landsittel

[25]. Howe

[26]. Powell

[27]. Jubb

[28]. Lange

[29]. Smith

[30]. Hasnan

[31]. Abdul Rahman

[32]. Mahenthiran

[33]. Asare

[34]. Larcker

[35]. Richardson

[36]. Kothari

[37]. Leone

[38]. Charles

[39]. Lin

[40]. Chiu

[41]. Huang

[42]. Yen

[43]. Ravisankar

[44]. Ravi

[45]. Raghava Rao

[46]. Bose

[47] .Classification

[48] .Decision Trees

[49]. Information Gain

[50]. Gain Ratio

[51]. Gini Index

[52]. Overfitting

[53]. Reduces error pruning (REP) tree

[54]. Witten

[55]. Frank

[56]. Reduced error pruning

[57]. Missing value

[58]. Jayanthi

[59]. Sasikala

[60] .Neural networks

[62]. Universal classifier

[63]. Imbalanced data set

[64]. Re-sampling

[65]. Cost-sensitive learning

[66]. https://www.cs.waikato.ac.nz/ml/weka/

[67]. Overfitting

[68]. Naive bayes

[69]. Cross validation

[70] .False negative (FN)

[71] .False positive (FP)

 

اعتمادی، ح.، و زلقی، ح. (1392). کاربرد رگرسیون لجستیک در شناسایی گزارشگری مالی متقلبانه. مجلۀ دانش حسابرسی، 13، 163-145.
جهانپور، ک.، و صادقی، ح. (1394). انواع شبکه‌های عصبی، ساختار و مزایای آنها. دومین کنفرانس بین‌المللی آینده‌پژوهی، مدیریت و توسعۀ اقتصادی. دانشگاه تربت حیدریه.
خلیفه‎‌سلطانی، الف.، حسینی، ع.، و مددی‌ورزقانی، ب. (1392). بررسی رابطۀ بین مدیریت سود و تقلب در صورت‎‌های مالی (پایان‌نامۀ کارشناسی‌ارشد). دانشگاه الزهرا. تهران.
خلیلی، ش.، و پاشازاده، س. (1393). طبقه‌بندی داده‌های حساب‌های جاری بانک با استفاده ازدرخت تصمیم.دومینکنفرانس دانش‌پژوهان کامپیوتر و فناوری اطلاعات. دانشگاه تبریز.
خواجوی، ش.، و ابراهیمی، م. (1397). بررسی تأثیر سازوکارهای حاکمیت شرکتی در تقلب در صورت‌های مالی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. مجلۀ مدیریت دارایی و تأمین مالی، 6 (2)، 84-71.
ذاکری، ح. (1389). چارچوب نظری دستکاری در حساب‌ها. دانش و پژوهش حسابداری، 21، 44-36.
راعی، ر.، و بستان‎آرا، م. (1395). مقایسۀ کارآیی مدل‏های رگرسیون با رویکرد تحلیل مؤلفه‏های اصلی (PCA) و شبکه‏های عصبی مصنوعی در پیش‏‌‎بینی بازده غیرعادی. مجلۀ مدیریت دارایی و تأمین مالی، 4 (1)، 18-1.
زادمهر، الف.، موسوی، ن.، و جنانی، م (1397). بررسی تأثیر انگیزۀ تقلب بر مدیریت سود شرکت‌‎های پذیرفته‌شده در بورس اوراق بهادار تهران. هفتمین کنفرانس ملی کاربردهای حسابداری و مدیریت. تهران.
زجاجی، ز (1387). تشخیص نفود در شبکه‌های کامپیوتری با استفاده از یادگیری حساس به هزینه (پایان‌نامۀکارشناسی). دانشگاه اصفهان.
صفرزاده، م. (1389). توانایی نسبت‌های مالی در کشف تقلب در گزارشگری مالی: تحلیل لاجیت. مجلۀ دانش حسابداری، 1، 163-137.
عالم‌تبریز، الف.، زندیه، م.، و محمدرحیمی، ع. (1387). الگوریتم‌‎های فراابتکاری در بهینه‌سازی ترکیبی: شبکۀ عصبی، آنیل شبیه‌سازی‌شده. تهران: صفار-اشراقی.
فرقاندوست‌حقیقی، ک.، هاشمی، ع.، و فروغی‌دهکردی، الف. (1393). مطالعۀ رابطۀ مدیریت سود و امکان تقلب در صورت‌های مالی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران .مجلۀ دانش حسابرسی، 14 (56)، 68-47.
قادرزاده، ک.، کردستانی، غ.، و حقیقت، ح. (1396). شناسایی و رتبه‌بندی عوامل مؤثر بر سطح افشای مسئولیت اجتماعی شرکت‎‌ها با رویکرد داده‌کاوی، مجلۀ پژوهش‌های کاربردی در گزارشگری مالی، 11، 46-7.
قیداری، ع. (1398). تأثیر مدیریت سود بر تقلب مالی و بحران مالی. سومین کنفرانس ملی پژوهش‌های نوین حسابداری و مدیریت در هزارۀ سوم. تهران.
کردستانی، غ.، و مدافعی، پ. (1391). بررسی توانایی مدل مبتنی بر درآمد اختیاری در مقایسه با مدل مبتنی بر اقلام تعهدی برای ارزیابی مدیریت سود. همایش ملی حسابداری و حسابرسی. دانشگاه سیستان و بلوچستان، 930- 916.
کمیتۀ تدوین استانداردهای حسابرسی. (1396). استانداردهای حسابرسی. استاندارد حسابرسی 240. سازمان حسابرسی.
مشایخی، ب.، و حسین‌پور، الف. (1395). بررسی رابطۀ بین مدیریت سود واقعی و مدیریت سود تعهدی در شرکت‌های مشکوک به تقلب بورس اوراق بهادار تهران. فصلنامۀ علمی ـ پژوهشی مطالعات تجربی حسابداری مالی، 49، 52-29.
 
References
Alamtabriz, A., Zandiye, M., & Mohammadrahimi, A. R. (2011). Meta-Heuristic Algorithms in Combinatorial Optimization, Neural Networks, Simulated Annealing, Genetic Algorithms, Eta. Tehran: Safar - Eshraghi press. (In Persian).
Asare, K. (2019). How informative are fraud and non-fraud firms' earnings? Journal of Forensic and Investigative Accounting, 11, 309-331.
Audit Standards Committee. (2017). Audit standards, audit standard 240. Audit org. (In Persian).
Beneish, M. D. (1997). Detecting GAAP violation: Implications for assessing earnings management among firms with extreme financial performance. Journal of Accounting and Public Policy, 16 (3), 271-309. Doi: 10.1016/S0278-4254(97)00023-9.
Beneish, M. D. (1999). The detection of earnings manipulation. Financial Analysts Journal, 55 (5), 24-36. Doi: 10.2469/faj.v55.n5.2296.
Dechow, P., & Dichev, I. (2002). The quality of a accruals and earnings: The role of accrual estimation errors. The Accounting Review, 77 (1), 35-59. Doi: 10.2308/accr.2002.77.s-1.35.
Dechow, P., Larson, C., & Sloan, R. (2011). Predicting material accounting misstatements. Contempory Accounting Research, 28 (1), 17-82. Doi: 10.1111/j.1911-3846.2010.01041.x
Dechow, P., Sloan, R., & Sweeney, A. (1995). Detecting earnings management. The Accounting Review, 70 (2), 193-225. Doi: stable/248303.
Etemadi, H., & Zalaghi, H. (2013). Logistic regression in detecting of fraudmental financial statements with using financial ratios. Journal of Audit Science, 13 (51), 5-23. (In Persian).
Forghandost Haghighi, K., Hashemi, S. A., & Foroghi Dehkordi, A. (2014). Study of the relationship between earnings management and fraudulent financial statements of companies listed in Tehran Stock Exchange. Audit Science, 56, 47-68. (In Persian).
Ghaderzadeh, S. K., Kordestani, G., & Haghighat, H. (2017). Identifying and ranking factors influencing levels of corporate social responsibility disclosure using data mining. Journal Management System, 6 (2), 7-46. (In Persian).
[30]Gheidari, A. (2019). The impact of earnings management on financial fraud and financial crisis. Third national conference on accounting and management research in the third millennium.Tehran. (In Persian).
Hasnan, S., Abdul Rahman, R., & Mahenthiran, S. (2013). Management motive, weak governance, earnings management and fraudulent financial reporting malaysian evidence. Journal of International Accounting Reserch, 12, 1-27. Doi: 10.2308/jiar-50353
Healy, P. (1985). The effect of bonus schemes on accounting decisions. Journal of Accounting and Economics, 7, 85–107.
Howe, M. A. (1999). Management fraud and earnings management: Fraud versus GAAP as a means to increase reported income (Ph.D. Dissertation). University of Connecticut.
Ines, A. (2017). The value relevance of accounting fraud and discretionary accruals. International Research Journal of Finance and Economics, 163, 73-89.
Jahanpur, K., & Sadeghi, H. (2016). Types of neural networks, their structure and their benefits. 2nd International conference on futures study, management and economical development. University of Torbat Heydarieh. (In Persian).
Jayanthi, S. K., & Sasikala, S. (2013). REPtree classifier for indentifying spam in web search earnings. IJSC, 3 (2), 498–505. Doi: 10.21917/ijsc.2013.0075.
Jones, J. (1991). Earnings management during import relief investigations. Journal of Accounting Research, 29, 193-228. Doi: 10.2307/2491047.
Jones, K. L., Krishnan, G. V., & Melendrez, K. D. (2008). Do models of discretionary accruals detect actual cases of fraudulent and restated earnings? An empirical analysis. Contemporary Accounting Research, 25 (2), 499-531. Doi: 10.1506/car.25.2.8.
Khajavi, S., & Ebrahimi, M. (2018). Investigating the impact of corporate governance mechanisms on financial statements fraud of the listed companies in Tehran Stock Exchange. Asset Management & Financing, 6 (2), 71-84. (In Persian).
Khalifeh Soltani, S. A., Hosseini, A., & Madadi Varzeghani, B. (2013). Investigate the relationship between earnings management and fraud in financial statements. (MA Thesis). Tehran, Alzahra University. (In Persian).
Khalili, Sh., & Pashazade, S. (2014). Classification of current bank accounts data using decision tree. Second Computer science conference on computer and information technology. Tabriz University. (In Persian).
Kordestani, G. & Modafei, P. (2012). Investigating the ability of optional income model in comparison with accrual based model for earning management. Conference on Accounting and Auditing. University Sistan and Baluchestan. (In Persian).
Kothari, S., Leone, A., & Charles, W. (2005). Performance matched discretionary accrual measures. Journal of Accounting and Economics, 39 (1), 163-97. Doi: 10.1016/j.jacceco.2004.11.002.
Landsittel, D. L. (2000). Auditing: Some current challenges. Paper presented at the plenary session of the AAA Auditing Section Mid-Year Conference, Newport Beach, CA.
Larcker, D. F., & Richardson, S. A. (2004). Fees paid to audit firms, accrual choices and corporate governance. Journal of Accounting Research, 42 (3), 625–56. Doi: 10.1111/j.1475-679X.2004.t01-1-00143.x.
Lin, C., Chiu, A., Huang, S., & Yen, D. (2015). Detecting the financial statement fraud: The analysis of the differences between data mining techniques and experts’ judgments. Knowledge-Based Systems, 89, 459-470. Doi: 10.1016/j.knosys.2015.08.011.
Mashayekhi, B., & Hosseinpour, A. H. (2016). The relationship between real earnings management and accrual earnings management in companies suspected of fraud listed in Tehran Stock Exchange. Emprical Studies in Financial Accounting Quarterly, 13 (49), 29-52. (In Persian).
Mcnichols, M. F. (2002). Discussion of the quality of accruals and earnings: The role of accrual estimation errors. The Accounting Review, 77, 61-69. Doi: 10.2308/accr.2002.77.s-1.61.
Nasir, A., Jahangir, A., Rushdi, M., Razzaque, R. M. R., & Ahmed, K. (2018). Real earnings management and financial statement fraud: Evidence from Malaysia. International Journal of Accounting and Information Management, 26 (2), 508-526.
Perols, J. L., & Lougee, B. A. (2011). The relation between earnings management and financial statement fraud. Advances in Accounting, 27 (1), 39-53. Doi: 10.1016/j.adiac.2010.10.004.
Powell, L., Jubb, C., Lange, P., & Smith, K. L. (2005). The distinction between aggressive accounting and financial reporting fraud: Perception of auditors. Afaanz Conference, July 3–5, Auckland, New Zealand.
Quinlan, J. (1987). Simplifying decision trees. International Journal of Man Machine Studies, 27 (3), 221–234. Doi: 1721.1/6453.
Raei, R., & Bostanara, M. (2016). Artificial neural networks versus old regression models using principal components analysis in forecasting unexpected returns. Asset Management & Financing, 4 (1), 1-18. (In Persian).
Rahmani, A., & Esmaili, Gh. (2011). The efficiency of neural networks, logistic regression & discriminant analysis in defaults prediction. Quantitative Economics, 7 (4), 151-172. (In Persian).
Ramírez-Orellana, A., María, J., Martínez-Romero, A., & Teresa Mari˜, N. (2017). Measuring fraud and earnings management by a case of study: Evidence from an international family business. European Journal of Family Business, 7, 41-53. Doi: 10.1016/j.ejfb.2017.10.001.
Ravisankar, P., Ravi, V., Raghava Rao, R., & Bose, I. (2011). Detection of financial statement fraud and feature selection using data mining techniques. Decision Support Systems, 50, 491-500. Doi: 10.1016/j.dss.2010.11.006.
Safarzadeh, M. H. (2010). The ability of financial ratios in detecting fradulent financial reporting: Logit analysis. Journal of Accounting Knowledge, 1 (1), 137-163. (In Persian).
Witten, I. H., & Frank, E. (2005). Data mining: Practical Machine Learning Tools and Techniques. The United States of America, Morgan Kaufmann Series in Data Management Systems. America: Morgan.
Zadmehr, E., Mousavi, S. N., & Jenani, M. H. (2018). The effect of fraud motivation on earnings management of companies listed in Tehran Stock Exchange. 7th national conference on accounting and management applications. (In Persian).
Zakeri, H. (2010). Theoretical framework for manipulating accounts. Accounting Research and Science, 21, 36-44. (In Persian).
Zojaji, Z. (2008). Detect penetration in computer networks using cost-conscious learning. Faculty of computer engineering. (Master's Thesis). University of Isfahan. (In Persian).