D 2016

Credit Risk Assessment Using Decision and Exploration Trees

BERKA, Petr

Basic information

Original name

Credit Risk Assessment Using Decision and Exploration Trees

Name in Czech

Hodnocení úvěrového rizika pomocí rozhodovacích a exploračních stromů

Authors

BERKA, Petr

Edition

Banská Štiavnica, 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016, p. 21-29, 9 pp. 2016

Publisher

Matej Bel University in Banská Bystrica

Other information

Language

English

Type of outcome

Proceedings paper

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Slovakia

Confidentiality degree

is not subject to a state or trade secret

Publication form

storage medium (CD, DVD, flash disk)

Marked to be transferred to RIV

No

Organization unit

University of Finance and Administration

ISBN

978-80-89438-04-4

ISSN

Keywords (in Czech)

data mining, rozhodovací stromy, explorační stromy, data z oblasti úvěrů

Keywords in English

data mining; decision trees; exploration trees; loan application data.

Tags

International impact, Reviewed
Changed: 6/3/2018 09:32, Bc. Jan Peterec

Abstract

In the original language

Credit risk assessment, credit scoring or loan applications approval are one of the typical classification tasks, in which the final decision can be either a crisp yes/no decision about the loan or a numeric score expressing the financial standing of the applicant. A corresponding classifier can be created from data about past decisions. Beside a logistic regression, that constitutes a de-facto banking industry standard and a benchmark algorithm, a number of data mining and machine learning algorithms can be used as well. In the paper we focus on tree building algorithms. Due to their understandability, the trees can be used not only for classification but also for concept description. Another advantage is that trees can be created also from data with missing values. We present the basic concept of learning trees from data, describe our method for creating exploration trees and discuss its difference with algorithms for creating decision trees. We also compare our method with a standard tree learning algorithms C4.5 and CART on some data from the loan application domain.

In Czech

Posouzení úvěrového rizika, hodnocení kreditů nebo schválení žádostí o úvěr jsou jednou z typických úkolů klasifikace, kdy konečným rozhodnutím může být buď jasné rozhodnutí ano / ne o půjčce, nebo číselné skóre vyjadřující finanční postavení žadatele. Z údajů o minulých rozhodnutích lze vytvořit odpovídající klasifikátor. Vedle logistické regrese, která představuje de facto bankovní standard a algoritmus benchmarkingu, lze také využít řadu algoritmů pro dolování dat a strojové učení. V příspěvku se zaměřujeme na algoritmy budování stromů. Vzhledem k jejich srozumitelnosti lze stromy použít nejen pro klasifikaci, ale i pro koncepční popis. Další výhodou je, že stromy lze vytvářet také z dat s chybějícími hodnotami. Představujeme základní pojetí učení stromů z dat, popište metodu vytváření průzkumných stromů a diskutujte o jejich rozdílech s algoritmy pro vytváření rozhodovacích stromů. Rovněž porovnáváme naši metodu se standardními stromovými učebními algoritmy C4.5 a CART na některých datech z oblasti aplikačního úvěru.

Files attached