BERKA, Petr. Credit Risk Assessment Using Decision and Exploration Trees. In Martin Boďa, Viera Mendelová. 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016. Banská Štiavnica: Matej Bel University in Banská Bystrica. p. 21-29. ISBN 978-80-89438-04-4. 2016.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Credit Risk Assessment Using Decision and Exploration Trees
Name in Czech Hodnocení úvěrového rizika pomocí rozhodovacích a exploračních stromů
Authors BERKA, Petr.
Edition Banská Štiavnica, 19th Conf. Applications of Mathematics and Statistics in Economics AMSE 2016, p. 21-29, 9 pp. 2016.
Publisher Matej Bel University in Banská Bystrica
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Slovakia
Confidentiality degree is not subject to a state or trade secret
Publication form storage medium (CD, DVD, flash disk)
Organization unit University of Finance and Administration
ISBN 978-80-89438-04-4
ISSN 2453-9902
UT WoS 000399024100003
Keywords (in Czech) data mining, rozhodovací stromy, explorační stromy, data z oblasti úvěrů
Keywords in English data mining; decision trees; exploration trees; loan application data.
Tags AR 2016-2017, D3, WOS, xD1
Tags International impact, Reviewed
Changed by Changed by: Bc. Jan Peterec, učo 24999. Changed: 6/3/2018 09:32.
Abstract
Credit risk assessment, credit scoring or loan applications approval are one of the typical classification tasks, in which the final decision can be either a crisp yes/no decision about the loan or a numeric score expressing the financial standing of the applicant. A corresponding classifier can be created from data about past decisions. Beside a logistic regression, that constitutes a de-facto banking industry standard and a benchmark algorithm, a number of data mining and machine learning algorithms can be used as well. In the paper we focus on tree building algorithms. Due to their understandability, the trees can be used not only for classification but also for concept description. Another advantage is that trees can be created also from data with missing values. We present the basic concept of learning trees from data, describe our method for creating exploration trees and discuss its difference with algorithms for creating decision trees. We also compare our method with a standard tree learning algorithms C4.5 and CART on some data from the loan application domain.
Abstract (in Czech)
Posouzení úvěrového rizika, hodnocení kreditů nebo schválení žádostí o úvěr jsou jednou z typických úkolů klasifikace, kdy konečným rozhodnutím může být buď jasné rozhodnutí ano / ne o půjčce, nebo číselné skóre vyjadřující finanční postavení žadatele. Z údajů o minulých rozhodnutích lze vytvořit odpovídající klasifikátor. Vedle logistické regrese, která představuje de facto bankovní standard a algoritmus benchmarkingu, lze také využít řadu algoritmů pro dolování dat a strojové učení. V příspěvku se zaměřujeme na algoritmy budování stromů. Vzhledem k jejich srozumitelnosti lze stromy použít nejen pro klasifikaci, ale i pro koncepční popis. Další výhodou je, že stromy lze vytvářet také z dat s chybějícími hodnotami. Představujeme základní pojetí učení stromů z dat, popište metodu vytváření průzkumných stromů a diskutujte o jejich rozdílech s algoritmy pro vytváření rozhodovacích stromů. Rovněž porovnáváme naši metodu se standardními stromovými učebními algoritmy C4.5 a CART na některých datech z oblasti aplikačního úvěru.
PrintDisplayed: 28/3/2024 12:37