نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناس ارشد، گروه اقتصاد، دانشکده اقتصاد، دانشگاه تهران، تهران، ایران

2 استادیار، دانشگاه پیام نور، تهران، ایران

چکیده

این پژوهش به‌دنبال بررسی اثر متغیر‌ها و داده‌‌های مرتبط با شبکه اجتماعی افراد، بر امتیاز اعتباری آن‌هاست. در این پژوهش، دو هدف اصلی دنبال می‏شود: اول، کاهش عدم تقارن اطلاعاتی و دوم، افزایش شمول مالی. دستیابی به اهداف یادشده با یافتن اطلاعات معنا‌دار در زمینه داده‌‌های اجتماعی افراد انجام می‌شود تا چگونگی اثر چنین داده‌هایی بر امتیاز اعتباری آن‌ها اندازه‌گیری شود. فرضیه اساسی پژوهش این است که افراد با امتیاز اعتباری بالا با افراد مشابه و هم سنخ خود ارتباط اجتماعی دارند. در این پژوهش از یک مجموعه داده، برای تأیید و توضیح اثر متغیرهای شبکه اجتماعی بر امتیاز اعتباری استفاده شد که مشتمل بر وام‏هایی بود (بیش از 300 هزار) که یکی از بانک‌های ایرانی به افراد حقیقی پرداخت کرده بود. برای تعیین متغیرهای پژوهش با تعدادی از متخصصان بانکی و افراد خبره در حوزه اعتبارسنجی، مصاحبه عمیق صورت گرفت و در انتها، متغیرها در سه طبقه مالی، رفتاری و اجتماعی تعیین و طبقه‌بندی شد. برای آزمایش فرضیه پژوهش، ابتدا از روش‌های آمار توصیفی و در ادامه، از روش رگرسیون لجستیک و در نهایت، از انواع مدل‏های رگرسیون مبتنی بر یادگیری عمیق ماشین، از جمله گرادیان استفاده شد. نتیجه بررسی‌های روش رگرسیون لجستیک نشان داد که از نظر آماری، متغیر‌‌های اجتماعی افراد، قابلیت پیش‌بینی احتمال نکول وام آنان را دارد. نتایج الگوریتم‌‌های یادگیری ماشین نیز نشان داد که اطلاعات شبکه اجتماعی، می‌تواند عملکرد پیش‌بینی نکول وام را به‌طور چشمگیری بهبود بخشد.

کلیدواژه‌ها

عنوان مقاله [English]

Evaluating the Effect of People's Social Network on the Credit Score of Banks and Credit Institutions with Deep Machine Learning and Gradient Methods

نویسندگان [English]

  • Reza Heydari 1
  • Sayyed mousa Khademi 2

1 MSc., Department of Economics, Faculty of Economics, University of Tehran, Tehran, Iran

2 Assistant Prof., Payam Noor University, Tehran, Iran

چکیده [English]

This study seeks to investigate the effect of variables and data related to people's social network on their credit score. In this study, two main goals are pursued: reducing information asymmetry and increasing financial inclusion. Achieving the above goals is done by finding meaningful information about people's social data to measure how such data affects their credit score. The basic hypothesis of this study is that people with a high credit score have social relationships with people who are similar and of the same age. A data set of more than 300,000 loans that have been paid by an Iranian bank to real people has been used to confirm and explain the effect of social network variables on credit score. In order to determine the variables of the study, an in-depth interview was conducted with a number of banking experts and people actively involved in the field of credit scoring, and at the end, the variables were determined and classified into three categories: financial, behavioral, and social. The study continued with the logistic regression method and finally with various regression models based on deep machine learning, including gradient. The results of the analyses conducted using the logistic regression method show that, statistically, people's social variables can predict the probability of their loan default. The results of machine learning algorithms also indicate that social network information can significantly improve the performance of loan default prediction.

کلیدواژه‌ها [English]

  • Credit scoring
  • Default risk
  • Financial inclusion
  • Information asymmetry
  • Social network
  • Bad social ties