2016
Credit Risk Assessment Using Decision and Exploration Trees
BERKA, PetrBasic information
Original name
Credit Risk Assessment Using Decision and Exploration Trees
Name in Czech
Hodnocení úvěrového rizika pomocí rozhodovacích a exploračních stromů
Authors
BERKA, Petr
Edition
Banská Štiavnica, 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016, p. 21-29, 9 pp. 2016
Publisher
Matej Bel University in Banská Bystrica
Other information
Language
English
Type of outcome
Proceedings paper
Field of Study
10201 Computer sciences, information science, bioinformatics
Country of publisher
Slovakia
Confidentiality degree
is not subject to a state or trade secret
Publication form
storage medium (CD, DVD, flash disk)
Marked to be transferred to RIV
No
Organization unit
University of Finance and Administration
ISBN
978-80-89438-04-4
ISSN
UT WoS
Keywords (in Czech)
data mining, rozhodovací stromy, explorační stromy, data z oblasti úvěrů
Keywords in English
data mining; decision trees; exploration trees; loan application data.
Tags
Tags
International impact, Reviewed
Changed: 6/3/2018 09:32, Bc. Jan Peterec
In the original language
Credit risk assessment, credit scoring or loan applications approval are one of the typical classification tasks, in which the final decision can be either a crisp yes/no decision about the loan or a numeric score expressing the financial standing of the applicant. A corresponding classifier can be created from data about past decisions. Beside a logistic regression, that constitutes a de-facto banking industry standard and a benchmark algorithm, a number of data mining and machine learning algorithms can be used as well. In the paper we focus on tree building algorithms. Due to their understandability, the trees can be used not only for classification but also for concept description. Another advantage is that trees can be created also from data with missing values. We present the basic concept of learning trees from data, describe our method for creating exploration trees and discuss its difference with algorithms for creating decision trees. We also compare our method with a standard tree learning algorithms C4.5 and CART on some data from the loan application domain.
In Czech
Posouzení úvěrového rizika, hodnocení kreditů nebo schválení žádostí o úvěr jsou jednou z typických úkolů klasifikace, kdy konečným rozhodnutím může být buď jasné rozhodnutí ano / ne o půjčce, nebo číselné skóre vyjadřující finanční postavení žadatele. Z údajů o minulých rozhodnutích lze vytvořit odpovídající klasifikátor. Vedle logistické regrese, která představuje de facto bankovní standard a algoritmus benchmarkingu, lze také využít řadu algoritmů pro dolování dat a strojové učení. V příspěvku se zaměřujeme na algoritmy budování stromů. Vzhledem k jejich srozumitelnosti lze stromy použít nejen pro klasifikaci, ale i pro koncepční popis. Další výhodou je, že stromy lze vytvářet také z dat s chybějícími hodnotami. Představujeme základní pojetí učení stromů z dat, popište metodu vytváření průzkumných stromů a diskutujte o jejich rozdílech s algoritmy pro vytváření rozhodovacích stromů. Rovněž porovnáváme naši metodu se standardními stromovými učebními algoritmy C4.5 a CART na některých datech z oblasti aplikačního úvěru.