2016
Credit Risk Assessment Using Decision and Exploration Trees
BERKA, PetrZákladní údaje
Originální název
Credit Risk Assessment Using Decision and Exploration Trees
Název česky
Hodnocení úvěrového rizika pomocí rozhodovacích a exploračních stromů
Autoři
BERKA, Petr
Vydání
Banská Štiavnica, 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016, od s. 21-29, 9 s. 2016
Nakladatel
Matej Bel University in Banská Bystrica
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Slovensko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
paměťový nosič (CD, DVD, flash disk)
Označené pro přenos do RIV
Ne
Organizační jednotka
Vysoká škola finanční a správní
ISBN
978-80-89438-04-4
ISSN
UT WoS
Klíčová slova česky
data mining, rozhodovací stromy, explorační stromy, data z oblasti úvěrů
Klíčová slova anglicky
data mining; decision trees; exploration trees; loan application data.
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 6. 3. 2018 09:32, Bc. Jan Peterec
V originále
Credit risk assessment, credit scoring or loan applications approval are one of the typical classification tasks, in which the final decision can be either a crisp yes/no decision about the loan or a numeric score expressing the financial standing of the applicant. A corresponding classifier can be created from data about past decisions. Beside a logistic regression, that constitutes a de-facto banking industry standard and a benchmark algorithm, a number of data mining and machine learning algorithms can be used as well. In the paper we focus on tree building algorithms. Due to their understandability, the trees can be used not only for classification but also for concept description. Another advantage is that trees can be created also from data with missing values. We present the basic concept of learning trees from data, describe our method for creating exploration trees and discuss its difference with algorithms for creating decision trees. We also compare our method with a standard tree learning algorithms C4.5 and CART on some data from the loan application domain.
Česky
Posouzení úvěrového rizika, hodnocení kreditů nebo schválení žádostí o úvěr jsou jednou z typických úkolů klasifikace, kdy konečným rozhodnutím může být buď jasné rozhodnutí ano / ne o půjčce, nebo číselné skóre vyjadřující finanční postavení žadatele. Z údajů o minulých rozhodnutích lze vytvořit odpovídající klasifikátor. Vedle logistické regrese, která představuje de facto bankovní standard a algoritmus benchmarkingu, lze také využít řadu algoritmů pro dolování dat a strojové učení. V příspěvku se zaměřujeme na algoritmy budování stromů. Vzhledem k jejich srozumitelnosti lze stromy použít nejen pro klasifikaci, ale i pro koncepční popis. Další výhodou je, že stromy lze vytvářet také z dat s chybějícími hodnotami. Představujeme základní pojetí učení stromů z dat, popište metodu vytváření průzkumných stromů a diskutujte o jejich rozdílech s algoritmy pro vytváření rozhodovacích stromů. Rovněž porovnáváme naši metodu se standardními stromovými učebními algoritmy C4.5 a CART na některých datech z oblasti aplikačního úvěru.