Expertní analýza | Greenometer Help Center

Sekce Expertní analýza je nejhlubší vrstva reportu — místo, kde se z agregátu sestoupí do detailu konkrétních pozic a konkrétních zaměstnanců. Cílí na analytika nebo statistika, který potřebuje porozumět struktuře mezery: kde konkrétně vzniká, kdo ji způsobuje, a co je třeba opravit, vysvětlit nebo přepočítat.

Tato sekce zároveň naplňuje písmeno g zákonné reportovací povinnosti (rozdíly mezi kategoriemi pracovníků v členění podle základní a variabilní složky) a poskytuje povinný pohled na úrovni specifického gradu a konkrétního ID zaměstnance.

Graf 1: Genderová mzdová mezera podle pracovní pozice

Ovládání nad grafem

V pravé části hlavičky jsou tři přepínače:

Přepínač	Hodnoty	Funkce
Zobrazení	PODLE POZICE (default) / PODLE SKUPIN PRÁCE	Agregace na pozice nebo na grade skupiny
Detail	Vypnuto (default) / Zapnuto	Přepne graf na tabulku jednotlivých zaměstnanců
Info ⓘ	tooltip	Vysvětlení metodiky

Scatter plot (výchozí stav)

Osa Y: Průměrná mzda (CZK), škála 0 – 20 000.
Osa X: Pracovní pozice (popisky nakloněné pod úhlem), např. Service Fitter 5, Managing Director 1, Technical Clerk 5, Team Leader 4, Head of Department 2, Assistant Fitter, Chief Fitter 5, Commercial Clerk 5, Junior Project Manager 4, Engineer 4, Site Foreman/forewoman, Senior Project Manager, Professional Project Manager, Fitter/Installer 5, Software Engineer 5, Apprentice 0, Logistician 5, Technician 5, Head of Division/Board member, Buyer 4, Technical Facility Manager, Trainee 0, Receptionist 5, Executive Assistant.
Body: Pro každou pozici jsou dva body — modrý pro muže a růžový pro ženy (průměr pro skupinu na dané pozici).

Jak číst scatter

V tomto grafu nelze vidět konkrétního zaměstnance — vidíme jen agregát na úrovni pozice. To, na co se klient v této vrstvě dívá, jsou velké rozdíly na dané pozici mezi muži a ženami na úrovni průměrné mzdy. Typický pohled je: kde se modrý a růžový bod na stejné svislici výrazně rozcházejí, je problém.

Některé pozice budou mít jen jeden bod (čistě mužská nebo čistě ženská pozice — u technických rolí jako Fitter/Installer obvykle nejsou žádné ženy v datech, takže růžový bod chybí, a takové pozice se v tomto pohledu vůbec nehodnotí).

Vertikální rozptyl bodů ukazuje vnitřní rozpětí odměňování — pozice na seniorních rolích (Managing Director, Senior Project Manager) leží vysoko, juniorní (Apprentice, Trainee) nízko.

Detail mode — identifikace konkrétních zaměstnanců

Po zapnutí přepínače Detail graf zmizí a zobrazí se informační pruh: „Grafy podle pozic a stupňů jsou skryté, pokud je zapnutý režim Detail. Vypněte Detail pro opětovné zobrazení grafů.“ Místo grafu se ukáže vyhledávací pole a tabulka:

Sloupec	Popis
Pozice a ID zaměstnance	Spojení názvu pozice a interního ID (např. Logistician - 5-223)
Příspěvek k mzdové mezeře	Konkrétní vliv tohoto zaměstnance na celkovou mezeru, v procentech

Příklad pracovního použití

Klient ve scatter plotu vidí, že pozice Logistician nebo Commercial Clerk mají velký rozdíl mezi muži a ženami a chce zjistit, kteří konkrétní zaměstnanci tento rozdíl způsobují. Zapne Detail a do vyhledávače napíše Logistician. Tabulka vypíše všechny logistiky s jejich ID a procentním příspěvkem k mezeře:

Pozice a ID	Příspěvek k mzdové mezeře
Logistician - 5-080	−35,09
Logistician - 5-223	19,13
Logistician - 5-206	13,11
Logistician - 5-169	6,75
Logistician - 5-286	−4,96

Konkrétní ID zaměstnanců (např. 18, 23, 16, 46 z pozice Logistician) jsou ti, kteří způsobují hlavní rozdíl. Detail mode je tak přímý kanál ke konkrétní akci — analytik dostane seznam jmen, jejichž platy je třeba auditovat nebo vysvětlit.

Graf 2: Platová mezera podle skupin práce — jádro debuggovacího workflow

Druhý velký graf v sekci, ale funkčně nejdůležitější. Po přepnutí ovládacího prvku z PODLE POZICE na PODLE SKUPIN PRÁCE se ukáže graf agregovaný podle grading mechanismu. Zde se odehrává hlavní iterativní debuggovací workflow.

Sub-ovládání nad grafem

V levé části nad osou jsou tři další ovládací prvky:

Ovládací prvek	Hodnoty	Význam
REGRESE / PRŮMĚR	přepínač	Metoda výpočtu mezery: regresí očištěná nebo prostý průměr
Scénář systému hodnocení skupin práce	rozbalovací	Všechny scénáře (default) nebo jednotlivý systém 1, 2, 3
Složka mzdy	rozbalovací	Všechny typy mezd / Základní mzda/plat / Variabilní mzda/plat (bonusy, příspěvky, mimořádné platby)

Sloupcový graf

Osa Y: Platová mezera (%), škála −20 % až +20 %.
Osa X: Stupně skupin práce I-0, I-1, I-2, I-3, I-4, I-5, I-6, I-7.
Sloupce: V režimu Všechny typy mezd tři barvy vedle sebe na každý stupeň:
- Modrá plná — Celková mzda/plat (základ + variabilní)
- Zelená šrafovaná — Základní mzda/plat
- Oranžová plná — Variabilní mzda/plat

Stupnice směru

Pod grafem je vodorovný posuvník s popisky ↓ Ženy vydělávají méně vlevo a Ženy vydělávají více ↑ vpravo.

Příklad hodnot (ukázkový dataset)

Stupeň	Celková	Základní	Variabilní
I-0	0,0 %	0,0 %	0,0 %
I-1	−1,6 %	−2,4 %	1,3 %
I-2	0,0 %	0,0 %	0,0 %
I-3	−1,3 %	−5,8 %	12,1 %
I-4	−3,0 %	−3,6 %	−1,4 %
I-5	−2,8 %	−3,0 %	−0,7 %
I-6	1,6 %	0,9 %	1,6 %
I-7	−4,6 %	−3,8 %	−13,8 %

Iterativní debugging — krok za krokem

Tohle je hlavní pracovní postup analytika v Expertní analýze. Postup je cyklický: identifikuj problém, oprav, přepočítej, znovu zkontroluj.

Krok 1: Pohled na celkovou mzdu

Začínáme v režimu REGRESE, Všechny scénáře, Všechny typy mezd. Z pohledu rozdílu na základě lineární regrese se podíváme na celkovou mzdu — modré sloupce. Pokud jsme na každém grade do definovaných 5 %, jsme v compliance pásmu a všechno je v pořádku.

Krok 2: Detail na základní složku

Pokud celková mzda vypadá dobře, zkusíme pohled na Základní mzdu. V ukázkovém datasetu vidíme, že stupeň I-3 má v základní složce −5,8 %, což je nad definovaným 5% prahem. To znamená, že na grade 3 vzniká problém v základním platu.

Krok 3: Návrat do Spravovat data, filtrování problémového gradu

Skočíme zpátky do sekce Vstupní data → Spravovat data. Vyfiltrujeme záznamy na grade 3 (filtr přes sloupec Úroveň 1/2/3 podle aktivního systému gradingu) a podíváme se na sloupec Základní mzda.

Krok 4: Seřazení a hledání extrémů

Seřadíme záznamy od největší základní mzdy po nejmenší. V extrémních hodnotách objevíme anomálie — například zaměstnanec ID 2 má v grade 3 výrazně vyšší základní mzdu než zbytek skupiny. To je signál, že buď je zaměstnanec nesprávně klasifikován (měl by být v jiném gradu), nebo má vysvětlitelnou výjimku.

Krok 5: Oprava a přepočet

Pokud je klasifikace špatná, opravíme grade přímo v tabulce (v sloupci Úroveň 1, 2 nebo 3 podle toho, který systém debugujeme). Klikneme Aktualizovat databázi, vrátíme se do Vstupní data a klikneme Spustit analýzu (nebo Restartovat analýzu). Po přepočtu se vrátíme do Expertní analýzy a zkontrolujeme, zda se výsledek pro grade 3 zlepšil.

Krok 6: Stejný postup pro variabilní složku

Stejnou logiku aplikujeme na Variabilní složku. Filtr nastavíme na Variabilní mzda/plat. V ukázkovém datasetu vidíme:

Stupeň I-3 má variabilní složku +12,1 % (ženy vydělávají více variabilní).
Stupeň I-7 má variabilní složku −13,8 % (ženy vydělávají výrazně méně variabilní).

Vrátíme se do Spravovat data, vyfiltrujeme grade 7 (a tentokrát bez grade 3 — Úroveň 1 = 7, ne 3), seřadíme podle variabilní složky od nejvyšších hodnot a najdeme top 3 extrémy — to jsou zaměstnanci, kteří způsobují velkou mezeru. U nich je třeba ověřit, zda extrémní variabilní složka je vysvětlitelná (např. mimořádný roční bonus za projekt) nebo zda představuje skutečnou nerovnost.

Krok 7: Vysvětlení nebo oprava

U každého problémového zaměstnance má klient dvě možnosti:

Vysvětlit — doplnit do sloupce Poznámky ve Spravovat data odůvodnění (např. „mimořádný bonus za uzavřený kontrakt“, „nedostatkový skill — viz Nedostatek zaměstnanců = 1“). Toto vysvětlení slouží pro audit a pro regulátora.
Opravit — pokud je v datech chyba (špatný grade, chybějící příspěvek zaměstnance, nesprávně vyplněná hodnota), opravit a přepočítat.

Tento cyklus se opakuje, dokud nejsou všechny stupně buď v compliance pásmu, nebo jsou nad-prahové hodnoty vysvětlené v poznámkách.

Alternativní pohled: PRŮMĚR místo REGRESE

Vedle regresí očištěné mezery aplikace nabízí druhý pohled přes přepínač PRŮMĚR. V tomto režimu se výpočet neprovádí přes lineární regresi, ale jako prostý průměr napříč všemi mzdovými složkami pro danou pozici nebo grade.

Kdy použít PRŮMĚR

Pro vysvětlení vedení nebo zaměstnancům, kteří nerozumí regresi — prostý průměr je intuitivní.
Pro kontrolu — pokud regrese a průměr ukazují stejný směr a podobnou velikost, výsledek je robustní. Pokud se výrazně liší, regresní očištění vysvětluje hodně rozdílu (struktura společnosti je nerovnoměrná).
Pro filtrování nejhrubších extrémů stejným postupem jako u regrese — i tady lze hledat top zaměstnance pomocí Detail mode.

Graf 3: Blinder-Oaxaca rozklad

Princip

Blinder-Oaxaca dekompozice je statistická metoda, která rozdělí pozorovanou mzdovou mezeru na dvě složky:

Vysvětlenou (Explained) — část, kterou lze připsat rozdílům v charakteristikách (vzdělání, praxe, pozice, atd.).
Nevysvětlenou (Unexplained) — část, která zůstává po kontrole charakteristik a běžně se interpretuje jako možná diskriminace.

Ovládání

Vpravo nahoře v kartě je rozbalovací Specifikace hodnocení s defaultem Všechny scénáře systému hodnocení skupin práce. Umožňuje pustit rozklad pro každý grade scénář zvlášť a porovnat citlivost dekompozice.

Sloupcový graf

Sloupce ukazují velikost jednotlivých komponent rozkladu. V ukázce jsou hodnoty kolem 4-5 % (3,4 %, 4,1 %, 4,5 %, 5,1 %), kombinace modré a oranžové barvy:

Modrá obvykle = vysvětlená složka
Oranžová obvykle = nevysvětlená (potenciálně diskriminační) složka

Doplňující pohledy na Blinder-Oaxaca

Tato sekce zobrazuje různé řezy stejného rozkladu:

Pohled na různé úrovně seniority.
Podíl mužů a žen v každé skupině.
Mzdové rozdíly podle proměnných.
Vliv jednotlivých proměnných, se kterými regrese pracuje, na výsledný rozdíl.
Kvartilová distribuce.
Celkové rozdělení na úrovni společnosti.

Co z toho plyne pro klienta

Pokud je oranžová (nevysvětlená) složka výrazná, znamená to, že po kontrole vzdělání, praxe a pozic zbývá rozdíl, který data nevysvětlí. To je signál pro hlubší audit konkrétních platových rozhodnutí.

Tabulka 4: Porovnání mezd z regrese (čistá, základní, variabilní) — pohled na konkrétního zaměstnance

V této sekci se dostáváme na úroveň konkrétního zaměstnance a jeho výsledku v regresi.

Filtry nad tabulkou

Scénář systému hodnocení skupin práce — Všechny scénáře (default) nebo konkrétní systém.
Složka mzdy — Všechny typy mezd / Základní / Variabilní.
Filter chip — např. ID zaměstnance: 80, klikatelné s křížkem pro odstranění; vedle něj Vymazat filtry.

Sloupce tabulky

Sloupec	Popis
ID zaměstnance	Interní ID
Stupeň (I)	Skupina práce v daném systému
Celková mzda/plat — Systém hodnocení skupin práce I	Procentní odchylka od regresního průměru
Základní mzda/plat — Systém hodnocení skupin práce I	Odchylka v základní složce
Variabilní mzda/plat (Systém hodnocení skupin práce I)	Odchylka ve variabilní složce

Ukázková data (pohled na grade)

ID	Stupeň	Celková	Základní	Variabilní
80	6	−20,2 %	5,3 %	−22,2 %
180	3	−19,3 %	−12,4 %	−50,4 %
280	6	−29,2 %	−6,6 %	−30,9 %

Záporné hodnoty znamenají, že daný zaměstnanec vydělává méně, než by podle regresního modelu měl vzhledem ke své kvalifikaci, seniorit, pozici.

Klíčový rozdíl: POZICE vs. GRADE

Pro téhož zaměstnance se výsledná mezera liší podle toho, na jaké úrovni se počítá:

Na úrovni pozice (Logistician konkrétně) je rozdíl pro ID 80 typicky mnohem větší — řádově desítky procent — protože v rámci jedné pozice je málo dalších zaměstnanců, kteří by individuální výchylku „rozředili“.
Na úrovni gradu (všichni zaměstnanci na grade 6) je rozdíl pro téhož zaměstnance ID 80 menší, např. 20 %, protože se průměruje přes mnohem širší skupinu.

To je důležité při interpretaci: stejný zaměstnanec může vypadat jako extrémní anomálie na úrovni své pozice, ale být v rámci svého gradu zcela v normě. Regulatorní povinnost přitom vyžaduje reportovat rozdíl jak na úrovni specifického gradu, tak na úrovni konkrétního ID zaměstnance — proto má tabulka filtry pro obě úrovně.

Příklad workflow

Klient hledá vysvětlení rozdílu u zaměstnance ID 80 (Logistician s gradem 6):

Vyfiltruje ID zaměstnance: 80.
Vidí celkový rozdíl, rozpad na základ a variabilní.
Variabilní složka má výraznou negativní odchylku — to může být vysvětlitelné (např. zaměstnanec letos výjimečně neperformoval) nebo problematické (systematicky vyřazován z bonusových schémat).
Přepne na pohled podle pozice (Logistician) — vidí, že na úrovni pozice je rozdíl ještě výraznější (méně lidí, větší vliv jednoho).
Přepne na pohled podle skupin práce (grade 6) — rozdíl se zmírní, protože průměr přes celý grade je vyšší a pokrývá výchylku.
Pro vedení a regulátora si přitom zapíše obě hodnoty — i pozice, i grade.

Tabulka 5: Přehled — statistická diagnostika

Souhrnná statistická tabulka pod grafem 4. Dvousloupcová struktura: Ukazatel | Hodnota.

Diagnostické ukazatele regrese

Ukazatel	Hodnota (ukázka)	Význam
Koeficient diskriminace	−0,0352	Bodový odhad očištěné mezery (v log-bodech, ≈ −3,5 %)
Standardní chyba koeficientu diskriminace	0,0480	Nepřesnost odhadu — vyšší než koeficient → statisticky nevýznamné
Stupně volnosti	0	Pro test významnosti

Poměr |koeficient| / standardní chyba dává t-statistiku. V ukázce je |−0,0352| / 0,0480 ≈ 0,73 — daleko od kritické hodnoty 1,96. To je důvod, proč Jednoduchý přehled hlásí Statisticky nevýznamné.

R-squared a T-score — jak interpretovat

Dole pod tabulkou (nebo v rozšířeném pohledu) jsou další statistické ukazatele, které říkají, zda je dataset statisticky významný:

R-squared (koeficient determinace) — kolik variability v mzdě model vysvětlí (mezi 0 a 1). Čím vyšší, tím lépe regrese sedí na data.
T-score (t-statistika) — testuje, zda koeficient diskriminace je významně odlišný od nuly.

Pravidlo pro interpretaci:

Vysoké R² a vysoké absolutní hodnoty t-score → dataset je statisticky významný, model funguje, výsledku lze věřit.
R² nebo t-score blízké nule → dataset je statisticky nevýznamný. Buď je třeba přepočítat s jinou variantou regresních parametrů, nebo rozšířit počet zaměstnanců v analýze (přidat data, opravit vyloučené záznamy).

Popisné ukazatele datasetu

Ukazatel	Hodnota (ukázka)	Komentář
Celkový počet datových záznamů	285	Vše, co bylo v databázi
Zaměstnanci zahrnutí do analýzy (standardní pracovní smlouvy)	285	Po prvním filtru
Nezahrnuto do analýzy	0	Vyloučeno před výpočtem
Zaměstnanci zahrnutí do analýzy (platné datové záznamy)	285	Po druhém filtru (validní data)
Ženy	53	Počet záznamů žen
Muži	232	Počet záznamů mužů
Vyloučeno z analýzy (ve výcviku atd.)	5	Zaměstnanci, kteří se vylučují podle pravidel (učni, dlouhodobá nemoc)
Datové záznamy s nulovým příjmem	0	Záznamy s mzdou = 0
Neplatné / neúplné datové záznamy	5	Záznamy, které chybí klíčové sloupce

Poznámka k číselnému vztahu: 285 zahrnutých + 5 vyloučených = 290 záznamů v databázi celkem. Někdy se může mírně lišit ve zobrazení (např. 284 vs. 285) podle toho, zda se počítá poslední neúplný záznam.

Surová data — finální auditní vrstva

Spodní rozbalitelná sekce Surová data dává přístup ke zdrojovým hodnotám regrese. Slouží jako poslední útočiště pro analytika, který pomocí předchozích grafů a tabulek nemohl problém najít.

Akční tlačítka

Stáhnout data — CSV nebo Excel se všemi zaměstnanci a derivovanými proměnnými.
Nastavení — konfigurace, které sloupce se zobrazují, jak se zaokrouhlují atd.

Pomocný text: „Klikněte na buňku Poznámky pro úpravu textu. Změny se uloží po opuštění pole.“

Funkce a smysl

V této tabulce má klient na jednom místě veškeré informace o každém zaměstnanci v auditovatelném formátu. Filtrováním na konkrétní ID (např. ID 80) lze zobrazit:

Celkovou sumu mzdy a její složek.
Průměrnou mzdu (Average Salary).
Časovanou mzdu — beroucí v potaz počet odpracovaných hodin a úvazek, který zaměstnanec měl v roce.
Pohlaví.
Alokaci (např. typ úvazku).
Rozdíly vůči základu (regresnímu průměru).
Rozdíly vůči grade 1, grade 2, grade 3 (pro každý z paralelních grading systémů).

Všechny tyto informace jsou viditelné a stáhnutelné — společně s automatickým e-mailem, který se odesílá po každém běhu výpočtu, představují kompletní auditní stopu.

Sloupce (interní anglické názvy)

Tabulka surových dat používá interní anglické názvy proměnných regresního modelu. Mapování na zobrazené české sloupce ze Správy dat zaměstnanců je v článku Sloupce vstupních dat.

Sloupec	Příklad
Id	80
Age	(počítaný z dat narození)
Year Of Service	(např. 16.00)
Years In Education	(např. 8)
Years Of Experience	(např. 14)
Years Of Experience Squared	(kvadrát pro nelineární vliv)
Employee Scarcity	0.00
Employee Evaluation	0.00
Sex	m / ž
Skill	(Úroveň 1)
Skill2	(Úroveň 2)
Skill3	(Úroveň 3)
Seniority	(Seniorita)
Usual Weekly Working Hours In Company For Full Time Employees Activity Rate 100 Percentage	40
Usual Annual Working Hours In The Reference Year For Full Time Employees Activity Rate 100 Percentage	2088
Employee Contribution	0
Log Adjusted Net Income	8.6789
Log Adjusted Basic Income	8.5988
Log Adjusted Variable Income	6.1143
Average Salary	5877,39
Basic Income Average Adjusted	5425,13
Bonuses Average	0
Personal Bonuses Average	452,26

Logaritmické proměnné

Klíčem k pochopení modelu jsou tři Log Adjusted proměnné. Regrese pracuje s logaritmem mezd, ne s nominálními hodnotami, protože:

Log linearizuje vztah mezi mzdou a vysvětlujícími proměnnými (vzdělání, praxe).
Koeficient u Sex v log-regresi přímo představuje procentní rozdíl mezi pohlavími (po vynásobení 100).
Reziduály log-modelu jsou lépe normálně rozdělené.

Hodnota Log Adjusted Net Income = 8,6789 odpovídá exp(8,6789) ≈ 5 877 CZK, což je Average Salary. Cíl regrese je vysvětlit rozptyl této log-mzdy a izolovat koeficient u Sex jako Koeficient diskriminace.

Doporučený workflow pro auditora

Sestavený podle skutečného postupu z představení Paygapmeteru. Při auditu nebo prezentaci výsledků klientovi následuje analytik pohyb od souhrnu k detailu:

Začít v Jednoduchém přehledu — jedno číslo, jedna hláška pro vedení.
Pokračovat v Podrobném přehledu — bloky podle písmen a–f zákonných ukazatelů.
V Expertní analýze otevřít Graf 2 (Platová mezera podle skupin práce), pohled REGRESE, Všechny typy mezd → vidět, zda jsme všude do 5 %.
Pokud něco nesedí, přepnout filtr Složka mzdy na Základní a najít problémový grade (např. I-3 nad 5 %).
Vrátit se do Spravovat data, vyfiltrovat ten grade, podívat se na Základní mzda, seřadit od největší — hledat extrémy.
Opravit nebo vysvětlit nalezené extrémy (sloupec Poznámky).
Spustit analýzu znovu, ověřit zlepšení.
Stejný postup s Variabilní složkou — typický scénář: grade I-7 nad 5 %, top 3 extrémy z variabilní složky.
Pro identifikaci konkrétních zaměstnanců s velkým příspěvkem k mezeře použít Detail mode v Grafu 1 (vyhledávání po názvu pozice).
Pro každého problémového zaměstnance otevřít Tabulku 4 a podívat se na rozpad jeho odchylky podle základní/variabilní — diagnostika konkrétního případu, navíc s porovnáním pozice vs. grade.
Blinder-Oaxaca je shrnující argument do dokumentu k vedení — kvantifikuje nevysvětlenou část mezery, kterou regrese nedokáže přiřadit struktuře.
Surová data jsou poslední záchrana — kompletní pohled na jednoho zaměstnance v jedné tabulce, se všemi rozdíly vůči základu i vůči gradům.
E-mail po výpočtu uchová celý výsledek pro audit — všechny iterace lze zpětně dohledat v poště uživatele.

Tento postup vede od metriky k akčním krokům: konkrétní seznam zaměstnanců a konkrétní složka odměňování k revizi, vysvětlení nebo opravě.

Související články

Správa dat zaměstnanců — sloupce a práce s tabulkou

Odhadovač skupin práce

Parametry analýzy

Jednoduchý přehled a reporty

Podrobný přehled