D 2019

On stability and interpretability of mixture models of wage distributions.

BERKA, Petr, Michal VRABEC and Luboš MAREK

Basic information

Original name

On stability and interpretability of mixture models of wage distributions.

Name in Czech

O stabilitě a interpretovatelnosti modelů směsí mzdových rozdělení.

Authors

BERKA, Petr, Michal VRABEC and Luboš MAREK

Edition

1. vyd. Prague, Proceedings of the 22nd Czech-Japan Seminar on Data Analysis and Decision Making, p. 1-12, 12 pp. 2019

Publisher

MatFyzPress

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10200 1.2 Computer and information sciences

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

Organization unit

University of Finance and Administration

ISBN

978-80-7378-400-3

Keywords (in Czech)

mzdová rozdělení, modely směsí

Keywords in English

wage distributions; mixture models
Změněno: 30/3/2021 09:27, Bc. Jan Peterec

Abstract

V originále

When considering a mixture model, the key question is what should be the components of the model. A mixture model can be created using two different approaches. In the first approach, the model is created manually, based on user-specified components, their weights and parameters of the components. In the second approach, the model is created completely from data. The partitioning will be done automatically, we need not even to specify the number of components.We will compare both approaches addressing the issues of stability and interpretability of the created models. Data concerning the wages of Czech employees collected for more than twenty years will be used in our study.

In Czech

Při tvorbě modelů založených na směsi rozdělení je klíčovou otázkou, co jsou jednotlivé komponenty modelu. Směs může být vytvořena dvěma způsoby: komponenty a jejich váhy mohou být zadány uživatelem nebo může být model vytvořen jen z dat. Ve druhém případě ani nemusí být zadán počet komponent. Porovnáme oba přístupy z hlediska stability a interpretability vytvořených modelů. Pro porovnání budou využita mzdová rozdělení českých zaměstnanců za období více než 20 let.