Statistika věda je, má však skryté údaje

Čekají nás brzy velké předvolební přehlídky grafů, a statistik, jak co kdo zavinil ať už v dobrém nebo špatném. I já si trochu přihřeji polívčičku na budoucí předvolební bouři a trochu se zamyslím nad statistikami obecně. Použiji k tomu hned dva příklady, jeden zcela imaginární, druhý už o něco konkrétnější z IT prostředí.

Číslům věřit můžete, zbytek je fikce

Na internetu se v diskuzích pod mnohými grafy často objevuje údajný výrok Winston Churchilla: "Nevěřím žádné statistice, kterou jsem sám nezfalšoval.". Problém ale často není ve statistice, tedy v číslech, ale ve výkladu. Jako ukázkový příklad nám dobře poslouží statistika o prodeji a následných opravách dvou modelů aut. Mějme tedy tato data:

Model
prodánoopraveno
cyhbovost
Hibrid XGL 100090090
10%
Hinrid Energy +
100
20
20%

Sloupeček chybovost je čistě fiktivní údaj i když je matematicky správně, proč by tedy měl být fiktivní? Skutečnost je totiž taková, že čísla o prodeji a následných opravách o chybovosti vůbec nic neříkají. Jediné čemu odpovídají že modelu XGL 1000 se prodalo 1000 kusů a z toho 200 jich následně bylo opraveno. Ovšem o jaké opravy šlo nikde uvedené není!

Možná už tušíte kam mířím. Fakt je takový, že čísla mohou znamenat cokoli, např. že XGL model si oblíbili zkušení řidiči, a pod jejich řízením auta méně trpí. Také to může znamenat, že s Energy + jezdí řidiči v těžkých podmínkách a proto auto více trpí. Nikde není napsáno za jaké období jsou tyto čísla nasbírána. Může to tedy také znamenat to, že model XGL je prostě novější model, a tedy všechny poruchy se ještě neprojevili. Dokonce to může znamenat, že došlo k nějakému hromadnému neštěstí a čistě náhodou to častěji odnesl model Energy.

Poku se tedy již koukáte na nějakou zaručeně pravou statistiku, ideálně v nějakém krásném grafu, je třeba si uvědomit, co ona čísla ve skutečnosti znamenají. Samozřejmě že z čísel se dá ledacos vysledovat, a mohou řadu věcí napovědět, je ale důležité je nepřeceňovat!

Chyba měření

Jako druhou statistiku uvedu smyšlené zastoupení prohlížečů, kterým však rozumím o mnoho více a i tady ukážu na některé chybné a urychlené závěry. Mějme tedy data za jeden rok, z nějakého velké části internetového trhu. Tedy dejme tomu že vzorek je dostatečně vypovídající a opravdu odpovídá skutečnosti:

ProhlížečFirefoxMS IE
Chrome
Opera
Ostatní
Zastoupení
36%
48%
4%
2%
10%

Otázka tedy zní jaké se dají z takové statistiky vyvodit závěry ? Odpověď zní že pouze to, že internet si lidé prohlížejí ve 36 % Firefoxem, v 48 % Explorerem atd.

Z této statistky totiž nepoznáme ani to, zda jde o unikátní návštěvníky. Teď možná mnoho "kovaných" odborníků namítne, že statistiky se počítají běžně na unikátní návštěvníky a nabídne i mnoho definic unikátního návštěvníka. Otázka ale je jak ho změřit ? :D Ve skutečnosti se jako unikátní návštěvník počítá každá nová veřejná IP adresa ze které byl odeslán požadavek na server v jeden den. Při dnešním nedostatku IPv4 adres je to ale docela směšný způsob. Mnoho takových návštěvníků totiž chodí na internet skrze různé routery a proxy servery. Za jednou IP adresou se tedy skrývá daleko více reálných návštěvníků.

Někteří měří unikátnost podle cookie, nebo podle párování IP a prohlížeče, to ale také není zcela správné, prohlížeče mohou automaticky cookie mazat, nehledě na to, že při použití jiného prohlížeče si uživatel cookie opravdu nepřesouvá. Na druhou stranu, co když takový reálný uživatel navštíví stránku v práci a pak následně doma v jeden den, jsou to snad 2 reální uživatelé ? Pravda je tedy taková, že o "reálných" uživatelích můžeme jen polemizovat.

U prohlížečů se ovšem objevují i jiné záludnosti, například někteří uživatelé mají z různých důvodů povinně nainstalované konkrétní prohlížeče v konkrétní verzi, ale běžně by takový prohlížeč již dávno nepoužili. Co se detekce prohlížeče týče, dala by se o tom napsat celá kniha, a žádná z běžně používaných metod není stoprocentní!

Například takový Chrome a jiné prohlížeče postavené na jádru Webkit, se často hlásí pod jedním stejným řetězcem. A i když si nedělám iluze o zastoupení dalších alternativních prohlížečů, i interní webový prohlížeč v mém mobilním telefonu se hlásí dosti podobně. Některé prohlížeče se dokonce schválně hlásí jako jiné prohlížeče, aby oklamali detekci na straně serveru a nepřišli o nějakou funkčnost. Je tedy celkem častým jevem že prohlížeče si navzájem "ukrádají" z onoho koláče i přístupy, které jim ve skutečnosti nepatří.

Pravda v těch číslech někde je, jen jí najít

Jak je tedy zřejmé u uvedených dvou příkladů, čísla ve statistice mohou mít velmi malou vypovídající hodnotu. A jakékoli související závěry, které mohou být ovlivněny dalšími jevy jsou fikce a přání prezentujícího. To všechno ale neznamená, že takové statistiky jsou zcela nepotřebné. Statistiky uvádí nějaká konkrétní, nebo přibližná čísla, které mohou pomoci k zisku, úspoře či čemukoli jinému. Jde jen o to jak ta čísla správně využít, aniž by se člověk odkláněl k nějaké teorii, která je jen teorií.
Autor:

Diskuze

cialis canadian drug store Isolype
Cialis Necesita Receta https://bbuycialisss.com/ - Buy Cialis Priligy Generico Prezzo <a href=https://bbuycialisss.com/#>Buy Cialis</a> Propecia User Feedback
tadalafil vidalista
tadacip 20 mg <a href=https://tadalisxs.com/#>what is tadalafil</a> tadalafil tablets 40mg
facts about cialis sedia
Men'S Meds Online Hemojeon https://acialisd.com/# - Cialis eretry Existe Cialis Generico Zeloslalag <a href=https://acialisd.com/#>when will cialis go generic</a> nonargotrove Cost Of Cialis Vs Viagra
name brand cialis sedia
Sinus Infection Zithromax Hemojeon https://acialisd.com/# - cialis online ordering eretry cialis 26 norvasc Zeloslalag <a href=https://acialisd.com/#>Cialis</a> nonargotrove Cialis Lilly Nebenwirkungen
generac cialis JEFEJAKS
Want To Buy Amoxicilina Antibiotic Over Night Tennessee Ideado https://apcialisz.com/ - cheapest cialis LayerryBeade Riconia LodledoJotte <a href=https://apcialisz.com/#>best price cialis</a> Shughvop Buy Merck Propecia
buy generic cialis softtabs cheap enurf
Triamterene Hctz 375 25 Mg Ideado https://asocialiser.com/ - cheapest cialis generic online LayerryBeade Dapoxetina Se Puede Tomar Con Alcohol LodledoJotte <a href=https://asocialiser.com/#>buy cialis professional</a> Shughvop Online Pharmacy Usa Prozac
cialis vardenafil JEFEJAKS
Viagra Effets Immediats Ideado https://cialisse.com/ - Cialis LayerryBeade Buy Generic Kamagra LodledoJotte <a href=https://cialisse.com/#>buying cheap cialis online</a> Shughvop Propecia Prueba
cialis erectile dysfunction Duelp
Low Cost Levrita Ideado <a href=https://bansocialism.com/>buy cialis online safely</a> LayerryBeade Comprar Levitra Cialis
Actual information about drugs.
Medicines information leaflet. Drug Class. <a href="https://viagra4u.top">order generic viagra without prescription</a> in USA. Everything about medicament. Read here.
<a href=https://review2tech.com/single/fantech-gs203-speaker-price-and-specifications>Some news about medicament.</a> <a href=http://nursing.alsafwa.edu.iq/blog/2019/03/12/5383/#comment-51276>All trends of drugs.</a> <a href=http://www.gazionlineschool.com/grammar>All about drug.</a> 9a0c85f
plaquenil sulfate 200 mg
hydroxychloroquone https://hydroxychloroquinex.com/ hsq medical abbreviation
Váš komentář:

© 2023 Ondřej Tůma McBig. Ondřej Tůma | Based on: Morias | Twitter: mcbig_cz | RSS: články, twitter