D 2016

Credit Risk Assessment Using Decision and Exploration Trees

BERKA, Petr

Základní údaje

Originální název

Credit Risk Assessment Using Decision and Exploration Trees

Název česky

Hodnocení úvěrového rizika pomocí rozhodovacích a exploračních stromů

Autoři

BERKA, Petr

Vydání

Banská Štiavnica, 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016, od s. 21-29, 9 s. 2016

Nakladatel

Matej Bel University in Banská Bystrica

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Slovensko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

paměťový nosič (CD, DVD, flash disk)

Označené pro přenos do RIV

Ne

Organizační jednotka

Vysoká škola finanční a správní

ISBN

978-80-89438-04-4

ISSN

Klíčová slova česky

data mining, rozhodovací stromy, explorační stromy, data z oblasti úvěrů

Klíčová slova anglicky

data mining; decision trees; exploration trees; loan application data.

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 6. 3. 2018 09:32, Bc. Jan Peterec

Anotace

V originále

Credit risk assessment, credit scoring or loan applications approval are one of the typical classification tasks, in which the final decision can be either a crisp yes/no decision about the loan or a numeric score expressing the financial standing of the applicant. A corresponding classifier can be created from data about past decisions. Beside a logistic regression, that constitutes a de-facto banking industry standard and a benchmark algorithm, a number of data mining and machine learning algorithms can be used as well. In the paper we focus on tree building algorithms. Due to their understandability, the trees can be used not only for classification but also for concept description. Another advantage is that trees can be created also from data with missing values. We present the basic concept of learning trees from data, describe our method for creating exploration trees and discuss its difference with algorithms for creating decision trees. We also compare our method with a standard tree learning algorithms C4.5 and CART on some data from the loan application domain.

Česky

Posouzení úvěrového rizika, hodnocení kreditů nebo schválení žádostí o úvěr jsou jednou z typických úkolů klasifikace, kdy konečným rozhodnutím může být buď jasné rozhodnutí ano / ne o půjčce, nebo číselné skóre vyjadřující finanční postavení žadatele. Z údajů o minulých rozhodnutích lze vytvořit odpovídající klasifikátor. Vedle logistické regrese, která představuje de facto bankovní standard a algoritmus benchmarkingu, lze také využít řadu algoritmů pro dolování dat a strojové učení. V příspěvku se zaměřujeme na algoritmy budování stromů. Vzhledem k jejich srozumitelnosti lze stromy použít nejen pro klasifikaci, ale i pro koncepční popis. Další výhodou je, že stromy lze vytvářet také z dat s chybějícími hodnotami. Představujeme základní pojetí učení stromů z dat, popište metodu vytváření průzkumných stromů a diskutujte o jejich rozdílech s algoritmy pro vytváření rozhodovacích stromů. Rovněž porovnáváme naši metodu se standardními stromovými učebními algoritmy C4.5 a CART na některých datech z oblasti aplikačního úvěru.

Přiložené soubory

Berka-AMSE2016-04.pdf
Požádat o autorskou verzi souboru