Sekce Expertní analýza je nejhlubší vrstva reportu — místo, kde se z agregátu sestoupí do detailu konkrétních pozic a konkrétních zaměstnanců. Cílí na analytika nebo statistika, který potřebuje porozumět struktuře mezery: kde konkrétně vzniká, kdo ji způsobuje, a co je třeba opravit, vysvětlit nebo přepočítat.
Tato sekce zároveň naplňuje písmeno g zákonné reportovací povinnosti (rozdíly mezi kategoriemi pracovníků v členění podle základní a variabilní složky) a poskytuje povinný pohled na úrovni specifického gradu a konkrétního ID zaměstnance.
Graf 1: Genderová mzdová mezera podle pracovní pozice
Ovládání nad grafem
V pravé části hlavičky jsou tři přepínače:
Přepínač | Hodnoty | Funkce |
Zobrazení | PODLE POZICE (default) / PODLE SKUPIN PRÁCE | Agregace na pozice nebo na grade skupiny |
Detail | Vypnuto (default) / Zapnuto | Přepne graf na tabulku jednotlivých zaměstnanců |
Info ⓘ | tooltip | Vysvětlení metodiky |
Scatter plot (výchozí stav)
Osa Y: Průměrná mzda (CZK), škála 0 – 20 000.
Osa X: Pracovní pozice (popisky nakloněné pod úhlem), např. Service Fitter 5, Managing Director 1, Technical Clerk 5, Team Leader 4, Head of Department 2, Assistant Fitter, Chief Fitter 5, Commercial Clerk 5, Junior Project Manager 4, Engineer 4, Site Foreman/forewoman, Senior Project Manager, Professional Project Manager, Fitter/Installer 5, Software Engineer 5, Apprentice 0, Logistician 5, Technician 5, Head of Division/Board member, Buyer 4, Technical Facility Manager, Trainee 0, Receptionist 5, Executive Assistant.
Body: Pro každou pozici jsou dva body — modrý pro muže a růžový pro ženy (průměr pro skupinu na dané pozici).
Jak číst scatter
V tomto grafu nelze vidět konkrétního zaměstnance — vidíme jen agregát na úrovni pozice. To, na co se klient v této vrstvě dívá, jsou velké rozdíly na dané pozici mezi muži a ženami na úrovni průměrné mzdy. Typický pohled je: kde se modrý a růžový bod na stejné svislici výrazně rozcházejí, je problém.
Některé pozice budou mít jen jeden bod (čistě mužská nebo čistě ženská pozice — u technických rolí jako Fitter/Installer obvykle nejsou žádné ženy v datech, takže růžový bod chybí, a takové pozice se v tomto pohledu vůbec nehodnotí).
Vertikální rozptyl bodů ukazuje vnitřní rozpětí odměňování — pozice na seniorních rolích (Managing Director, Senior Project Manager) leží vysoko, juniorní (Apprentice, Trainee) nízko.
Detail mode — identifikace konkrétních zaměstnanců
Po zapnutí přepínače Detail graf zmizí a zobrazí se informační pruh: „Grafy podle pozic a stupňů jsou skryté, pokud je zapnutý režim Detail. Vypněte Detail pro opětovné zobrazení grafů.“ Místo grafu se ukáže vyhledávací pole a tabulka:
Sloupec | Popis |
Pozice a ID zaměstnance | Spojení názvu pozice a interního ID (např. Logistician - 5-223) |
Příspěvek k mzdové mezeře | Konkrétní vliv tohoto zaměstnance na celkovou mezeru, v procentech |
Příklad pracovního použití
Klient ve scatter plotu vidí, že pozice Logistician nebo Commercial Clerk mají velký rozdíl mezi muži a ženami a chce zjistit, kteří konkrétní zaměstnanci tento rozdíl způsobují. Zapne Detail a do vyhledávače napíše Logistician. Tabulka vypíše všechny logistiky s jejich ID a procentním příspěvkem k mezeře:
Pozice a ID | Příspěvek k mzdové mezeře |
Logistician - 5-080 | −35,09 |
Logistician - 5-223 | 19,13 |
Logistician - 5-206 | 13,11 |
Logistician - 5-169 | 6,75 |
Logistician - 5-286 | −4,96 |
Konkrétní ID zaměstnanců (např. 18, 23, 16, 46 z pozice Logistician) jsou ti, kteří způsobují hlavní rozdíl. Detail mode je tak přímý kanál ke konkrétní akci — analytik dostane seznam jmen, jejichž platy je třeba auditovat nebo vysvětlit.
Graf 2: Platová mezera podle skupin práce — jádro debuggovacího workflow
Druhý velký graf v sekci, ale funkčně nejdůležitější. Po přepnutí ovládacího prvku z PODLE POZICE na PODLE SKUPIN PRÁCE se ukáže graf agregovaný podle grading mechanismu. Zde se odehrává hlavní iterativní debuggovací workflow.
Sub-ovládání nad grafem
V levé části nad osou jsou tři další ovládací prvky:
Ovládací prvek | Hodnoty | Význam |
REGRESE / PRŮMĚR | přepínač | Metoda výpočtu mezery: regresí očištěná nebo prostý průměr |
Scénář systému hodnocení skupin práce | rozbalovací | Všechny scénáře (default) nebo jednotlivý systém 1, 2, 3 |
Složka mzdy | rozbalovací | Všechny typy mezd / Základní mzda/plat / Variabilní mzda/plat (bonusy, příspěvky, mimořádné platby) |
Sloupcový graf
Osa Y: Platová mezera (%), škála −20 % až +20 %.
Osa X: Stupně skupin práce I-0, I-1, I-2, I-3, I-4, I-5, I-6, I-7.
Sloupce: V režimu Všechny typy mezd tři barvy vedle sebe na každý stupeň:
Modrá plná — Celková mzda/plat (základ + variabilní)
Zelená šrafovaná — Základní mzda/plat
Oranžová plná — Variabilní mzda/plat
Stupnice směru
Pod grafem je vodorovný posuvník s popisky ↓ Ženy vydělávají méně vlevo a Ženy vydělávají více ↑ vpravo.
Příklad hodnot (ukázkový dataset)
Stupeň | Celková | Základní | Variabilní |
I-0 | 0,0 % | 0,0 % | 0,0 % |
I-1 | −1,6 % | −2,4 % | 1,3 % |
I-2 | 0,0 % | 0,0 % | 0,0 % |
I-3 | −1,3 % | −5,8 % | 12,1 % |
I-4 | −3,0 % | −3,6 % | −1,4 % |
I-5 | −2,8 % | −3,0 % | −0,7 % |
I-6 | 1,6 % | 0,9 % | 1,6 % |
I-7 | −4,6 % | −3,8 % | −13,8 % |
Iterativní debugging — krok za krokem
Tohle je hlavní pracovní postup analytika v Expertní analýze. Postup je cyklický: identifikuj problém, oprav, přepočítej, znovu zkontroluj.
Krok 1: Pohled na celkovou mzdu
Začínáme v režimu REGRESE, Všechny scénáře, Všechny typy mezd. Z pohledu rozdílu na základě lineární regrese se podíváme na celkovou mzdu — modré sloupce. Pokud jsme na každém grade do definovaných 5 %, jsme v compliance pásmu a všechno je v pořádku.
Krok 2: Detail na základní složku
Pokud celková mzda vypadá dobře, zkusíme pohled na Základní mzdu. V ukázkovém datasetu vidíme, že stupeň I-3 má v základní složce −5,8 %, což je nad definovaným 5% prahem. To znamená, že na grade 3 vzniká problém v základním platu.
Krok 3: Návrat do Spravovat data, filtrování problémového gradu
Skočíme zpátky do sekce Vstupní data → Spravovat data. Vyfiltrujeme záznamy na grade 3 (filtr přes sloupec Úroveň 1/2/3 podle aktivního systému gradingu) a podíváme se na sloupec Základní mzda.
Krok 4: Seřazení a hledání extrémů
Seřadíme záznamy od největší základní mzdy po nejmenší. V extrémních hodnotách objevíme anomálie — například zaměstnanec ID 2 má v grade 3 výrazně vyšší základní mzdu než zbytek skupiny. To je signál, že buď je zaměstnanec nesprávně klasifikován (měl by být v jiném gradu), nebo má vysvětlitelnou výjimku.
Krok 5: Oprava a přepočet
Pokud je klasifikace špatná, opravíme grade přímo v tabulce (v sloupci Úroveň 1, 2 nebo 3 podle toho, který systém debugujeme). Klikneme Aktualizovat databázi, vrátíme se do Vstupní data a klikneme Spustit analýzu (nebo Restartovat analýzu). Po přepočtu se vrátíme do Expertní analýzy a zkontrolujeme, zda se výsledek pro grade 3 zlepšil.
Krok 6: Stejný postup pro variabilní složku
Stejnou logiku aplikujeme na Variabilní složku. Filtr nastavíme na Variabilní mzda/plat. V ukázkovém datasetu vidíme:
Stupeň I-3 má variabilní složku +12,1 % (ženy vydělávají více variabilní).
Stupeň I-7 má variabilní složku −13,8 % (ženy vydělávají výrazně méně variabilní).
Vrátíme se do Spravovat data, vyfiltrujeme grade 7 (a tentokrát bez grade 3 — Úroveň 1 = 7, ne 3), seřadíme podle variabilní složky od nejvyšších hodnot a najdeme top 3 extrémy — to jsou zaměstnanci, kteří způsobují velkou mezeru. U nich je třeba ověřit, zda extrémní variabilní složka je vysvětlitelná (např. mimořádný roční bonus za projekt) nebo zda představuje skutečnou nerovnost.
Krok 7: Vysvětlení nebo oprava
U každého problémového zaměstnance má klient dvě možnosti:
Vysvětlit — doplnit do sloupce Poznámky ve Spravovat data odůvodnění (např. „mimořádný bonus za uzavřený kontrakt“, „nedostatkový skill — viz Nedostatek zaměstnanců = 1“). Toto vysvětlení slouží pro audit a pro regulátora.
Opravit — pokud je v datech chyba (špatný grade, chybějící příspěvek zaměstnance, nesprávně vyplněná hodnota), opravit a přepočítat.
Tento cyklus se opakuje, dokud nejsou všechny stupně buď v compliance pásmu, nebo jsou nad-prahové hodnoty vysvětlené v poznámkách.
Alternativní pohled: PRŮMĚR místo REGRESE
Vedle regresí očištěné mezery aplikace nabízí druhý pohled přes přepínač PRŮMĚR. V tomto režimu se výpočet neprovádí přes lineární regresi, ale jako prostý průměr napříč všemi mzdovými složkami pro danou pozici nebo grade.
Kdy použít PRŮMĚR
Pro vysvětlení vedení nebo zaměstnancům, kteří nerozumí regresi — prostý průměr je intuitivní.
Pro kontrolu — pokud regrese a průměr ukazují stejný směr a podobnou velikost, výsledek je robustní. Pokud se výrazně liší, regresní očištění vysvětluje hodně rozdílu (struktura společnosti je nerovnoměrná).
Pro filtrování nejhrubších extrémů stejným postupem jako u regrese — i tady lze hledat top zaměstnance pomocí Detail mode.
Graf 3: Blinder-Oaxaca rozklad
Princip
Blinder-Oaxaca dekompozice je statistická metoda, která rozdělí pozorovanou mzdovou mezeru na dvě složky:
Vysvětlenou (Explained) — část, kterou lze připsat rozdílům v charakteristikách (vzdělání, praxe, pozice, atd.).
Nevysvětlenou (Unexplained) — část, která zůstává po kontrole charakteristik a běžně se interpretuje jako možná diskriminace.
Ovládání
Vpravo nahoře v kartě je rozbalovací Specifikace hodnocení s defaultem Všechny scénáře systému hodnocení skupin práce. Umožňuje pustit rozklad pro každý grade scénář zvlášť a porovnat citlivost dekompozice.
Sloupcový graf
Sloupce ukazují velikost jednotlivých komponent rozkladu. V ukázce jsou hodnoty kolem 4-5 % (3,4 %, 4,1 %, 4,5 %, 5,1 %), kombinace modré a oranžové barvy:
Modrá obvykle = vysvětlená složka
Oranžová obvykle = nevysvětlená (potenciálně diskriminační) složka
Doplňující pohledy na Blinder-Oaxaca
Tato sekce zobrazuje různé řezy stejného rozkladu:
Pohled na různé úrovně seniority.
Podíl mužů a žen v každé skupině.
Mzdové rozdíly podle proměnných.
Vliv jednotlivých proměnných, se kterými regrese pracuje, na výsledný rozdíl.
Kvartilová distribuce.
Celkové rozdělení na úrovni společnosti.
Co z toho plyne pro klienta
Pokud je oranžová (nevysvětlená) složka výrazná, znamená to, že po kontrole vzdělání, praxe a pozic zbývá rozdíl, který data nevysvětlí. To je signál pro hlubší audit konkrétních platových rozhodnutí.
Tabulka 4: Porovnání mezd z regrese (čistá, základní, variabilní) — pohled na konkrétního zaměstnance
V této sekci se dostáváme na úroveň konkrétního zaměstnance a jeho výsledku v regresi.
Filtry nad tabulkou
Scénář systému hodnocení skupin práce — Všechny scénáře (default) nebo konkrétní systém.
Složka mzdy — Všechny typy mezd / Základní / Variabilní.
Filter chip — např. ID zaměstnance: 80, klikatelné s křížkem pro odstranění; vedle něj Vymazat filtry.
Sloupce tabulky
Sloupec | Popis |
ID zaměstnance | Interní ID |
Stupeň (I) | Skupina práce v daném systému |
Celková mzda/plat — Systém hodnocení skupin práce I | Procentní odchylka od regresního průměru |
Základní mzda/plat — Systém hodnocení skupin práce I | Odchylka v základní složce |
Variabilní mzda/plat (Systém hodnocení skupin práce I) | Odchylka ve variabilní složce |
Ukázková data (pohled na grade)
ID | Stupeň | Celková | Základní | Variabilní |
80 | 6 | −20,2 % | 5,3 % | −22,2 % |
180 | 3 | −19,3 % | −12,4 % | −50,4 % |
280 | 6 | −29,2 % | −6,6 % | −30,9 % |
Záporné hodnoty znamenají, že daný zaměstnanec vydělává méně, než by podle regresního modelu měl vzhledem ke své kvalifikaci, seniorit, pozici.
Klíčový rozdíl: POZICE vs. GRADE
Pro téhož zaměstnance se výsledná mezera liší podle toho, na jaké úrovni se počítá:
Na úrovni pozice (Logistician konkrétně) je rozdíl pro ID 80 typicky mnohem větší — řádově desítky procent — protože v rámci jedné pozice je málo dalších zaměstnanců, kteří by individuální výchylku „rozředili“.
Na úrovni gradu (všichni zaměstnanci na grade 6) je rozdíl pro téhož zaměstnance ID 80 menší, např. 20 %, protože se průměruje přes mnohem širší skupinu.
To je důležité při interpretaci: stejný zaměstnanec může vypadat jako extrémní anomálie na úrovni své pozice, ale být v rámci svého gradu zcela v normě. Regulatorní povinnost přitom vyžaduje reportovat rozdíl jak na úrovni specifického gradu, tak na úrovni konkrétního ID zaměstnance — proto má tabulka filtry pro obě úrovně.
Příklad workflow
Klient hledá vysvětlení rozdílu u zaměstnance ID 80 (Logistician s gradem 6):
Vyfiltruje ID zaměstnance: 80.
Vidí celkový rozdíl, rozpad na základ a variabilní.
Variabilní složka má výraznou negativní odchylku — to může být vysvětlitelné (např. zaměstnanec letos výjimečně neperformoval) nebo problematické (systematicky vyřazován z bonusových schémat).
Přepne na pohled podle pozice (Logistician) — vidí, že na úrovni pozice je rozdíl ještě výraznější (méně lidí, větší vliv jednoho).
Přepne na pohled podle skupin práce (grade 6) — rozdíl se zmírní, protože průměr přes celý grade je vyšší a pokrývá výchylku.
Pro vedení a regulátora si přitom zapíše obě hodnoty — i pozice, i grade.
Tabulka 5: Přehled — statistická diagnostika
Souhrnná statistická tabulka pod grafem 4. Dvousloupcová struktura: Ukazatel | Hodnota.
Diagnostické ukazatele regrese
Ukazatel | Hodnota (ukázka) | Význam |
Koeficient diskriminace | −0,0352 | Bodový odhad očištěné mezery (v log-bodech, ≈ −3,5 %) |
Standardní chyba koeficientu diskriminace | 0,0480 | Nepřesnost odhadu — vyšší než koeficient → statisticky nevýznamné |
Stupně volnosti | 0 | Pro test významnosti |
Poměr |koeficient| / standardní chyba dává t-statistiku. V ukázce je |−0,0352| / 0,0480 ≈ 0,73 — daleko od kritické hodnoty 1,96. To je důvod, proč Jednoduchý přehled hlásí Statisticky nevýznamné.
R-squared a T-score — jak interpretovat
Dole pod tabulkou (nebo v rozšířeném pohledu) jsou další statistické ukazatele, které říkají, zda je dataset statisticky významný:
R-squared (koeficient determinace) — kolik variability v mzdě model vysvětlí (mezi 0 a 1). Čím vyšší, tím lépe regrese sedí na data.
T-score (t-statistika) — testuje, zda koeficient diskriminace je významně odlišný od nuly.
Pravidlo pro interpretaci:
Vysoké R² a vysoké absolutní hodnoty t-score → dataset je statisticky významný, model funguje, výsledku lze věřit.
R² nebo t-score blízké nule → dataset je statisticky nevýznamný. Buď je třeba přepočítat s jinou variantou regresních parametrů, nebo rozšířit počet zaměstnanců v analýze (přidat data, opravit vyloučené záznamy).
Popisné ukazatele datasetu
Ukazatel | Hodnota (ukázka) | Komentář |
Celkový počet datových záznamů | 285 | Vše, co bylo v databázi |
Zaměstnanci zahrnutí do analýzy (standardní pracovní smlouvy) | 285 | Po prvním filtru |
Nezahrnuto do analýzy | 0 | Vyloučeno před výpočtem |
Zaměstnanci zahrnutí do analýzy (platné datové záznamy) | 285 | Po druhém filtru (validní data) |
Ženy | 53 | Počet záznamů žen |
Muži | 232 | Počet záznamů mužů |
Vyloučeno z analýzy (ve výcviku atd.) | 5 | Zaměstnanci, kteří se vylučují podle pravidel (učni, dlouhodobá nemoc) |
Datové záznamy s nulovým příjmem | 0 | Záznamy s mzdou = 0 |
Neplatné / neúplné datové záznamy | 5 | Záznamy, které chybí klíčové sloupce |
Poznámka k číselnému vztahu: 285 zahrnutých + 5 vyloučených = 290 záznamů v databázi celkem. Někdy se může mírně lišit ve zobrazení (např. 284 vs. 285) podle toho, zda se počítá poslední neúplný záznam.
Surová data — finální auditní vrstva
Spodní rozbalitelná sekce Surová data dává přístup ke zdrojovým hodnotám regrese. Slouží jako poslední útočiště pro analytika, který pomocí předchozích grafů a tabulek nemohl problém najít.
Akční tlačítka
Stáhnout data — CSV nebo Excel se všemi zaměstnanci a derivovanými proměnnými.
Nastavení — konfigurace, které sloupce se zobrazují, jak se zaokrouhlují atd.
Pomocný text: „Klikněte na buňku Poznámky pro úpravu textu. Změny se uloží po opuštění pole.“
Funkce a smysl
V této tabulce má klient na jednom místě veškeré informace o každém zaměstnanci v auditovatelném formátu. Filtrováním na konkrétní ID (např. ID 80) lze zobrazit:
Celkovou sumu mzdy a její složek.
Průměrnou mzdu (Average Salary).
Časovanou mzdu — beroucí v potaz počet odpracovaných hodin a úvazek, který zaměstnanec měl v roce.
Pohlaví.
Alokaci (např. typ úvazku).
Rozdíly vůči základu (regresnímu průměru).
Rozdíly vůči grade 1, grade 2, grade 3 (pro každý z paralelních grading systémů).
Všechny tyto informace jsou viditelné a stáhnutelné — společně s automatickým e-mailem, který se odesílá po každém běhu výpočtu, představují kompletní auditní stopu.
Sloupce (interní anglické názvy)
Tabulka surových dat používá interní anglické názvy proměnných regresního modelu. Mapování na zobrazené české sloupce ze Správy dat zaměstnanců je v článku Sloupce vstupních dat.
Sloupec | Příklad |
Id | 80 |
Age | (počítaný z dat narození) |
Year Of Service | (např. 16.00) |
Years In Education | (např. 8) |
Years Of Experience | (např. 14) |
Years Of Experience Squared | (kvadrát pro nelineární vliv) |
Employee Scarcity | 0.00 |
Employee Evaluation | 0.00 |
Sex | m / ž |
Skill | (Úroveň 1) |
Skill2 | (Úroveň 2) |
Skill3 | (Úroveň 3) |
Seniority | (Seniorita) |
Usual Weekly Working Hours In Company For Full Time Employees Activity Rate 100 Percentage | 40 |
Usual Annual Working Hours In The Reference Year For Full Time Employees Activity Rate 100 Percentage | 2088 |
Employee Contribution | 0 |
Log Adjusted Net Income | 8.6789 |
Log Adjusted Basic Income | 8.5988 |
Log Adjusted Variable Income | 6.1143 |
Average Salary | 5877,39 |
Basic Income Average Adjusted | 5425,13 |
Bonuses Average | 0 |
Personal Bonuses Average | 452,26 |
Logaritmické proměnné
Klíčem k pochopení modelu jsou tři Log Adjusted proměnné. Regrese pracuje s logaritmem mezd, ne s nominálními hodnotami, protože:
Log linearizuje vztah mezi mzdou a vysvětlujícími proměnnými (vzdělání, praxe).
Koeficient u Sex v log-regresi přímo představuje procentní rozdíl mezi pohlavími (po vynásobení 100).
Reziduály log-modelu jsou lépe normálně rozdělené.
Hodnota Log Adjusted Net Income = 8,6789 odpovídá exp(8,6789) ≈ 5 877 CZK, což je Average Salary. Cíl regrese je vysvětlit rozptyl této log-mzdy a izolovat koeficient u Sex jako Koeficient diskriminace.
Doporučený workflow pro auditora
Sestavený podle skutečného postupu z představení Paygapmeteru. Při auditu nebo prezentaci výsledků klientovi následuje analytik pohyb od souhrnu k detailu:
Začít v Jednoduchém přehledu — jedno číslo, jedna hláška pro vedení.
Pokračovat v Podrobném přehledu — bloky podle písmen a–f zákonných ukazatelů.
V Expertní analýze otevřít Graf 2 (Platová mezera podle skupin práce), pohled REGRESE, Všechny typy mezd → vidět, zda jsme všude do 5 %.
Pokud něco nesedí, přepnout filtr Složka mzdy na Základní a najít problémový grade (např. I-3 nad 5 %).
Vrátit se do Spravovat data, vyfiltrovat ten grade, podívat se na Základní mzda, seřadit od největší — hledat extrémy.
Opravit nebo vysvětlit nalezené extrémy (sloupec Poznámky).
Spustit analýzu znovu, ověřit zlepšení.
Stejný postup s Variabilní složkou — typický scénář: grade I-7 nad 5 %, top 3 extrémy z variabilní složky.
Pro identifikaci konkrétních zaměstnanců s velkým příspěvkem k mezeře použít Detail mode v Grafu 1 (vyhledávání po názvu pozice).
Pro každého problémového zaměstnance otevřít Tabulku 4 a podívat se na rozpad jeho odchylky podle základní/variabilní — diagnostika konkrétního případu, navíc s porovnáním pozice vs. grade.
Blinder-Oaxaca je shrnující argument do dokumentu k vedení — kvantifikuje nevysvětlenou část mezery, kterou regrese nedokáže přiřadit struktuře.
Surová data jsou poslední záchrana — kompletní pohled na jednoho zaměstnance v jedné tabulce, se všemi rozdíly vůči základu i vůči gradům.
E-mail po výpočtu uchová celý výsledek pro audit — všechny iterace lze zpětně dohledat v poště uživatele.
Tento postup vede od metriky k akčním krokům: konkrétní seznam zaměstnanců a konkrétní složka odměňování k revizi, vysvětlení nebo opravě.
