Průzkumy se nepletou. Jejich vykladači ano.

Michal Škop Fri, Dec 23, 2016
Kategorie: Průzkumy
Tagy: průzkumy, volby, statistika

Esej pro Neovlivní (originál)

Slyšeli jsme to po referendu o Brexitu, slyšeli jsme to i po amerických prezidentských volbách. Průzkumy veřejného mínění zklamaly na celé čáře, vždyť přeci předpovědět Trumpovo vítězství nedokázal nikdo. Nedejte se zmást. Kvalitní průzkumy fungují, fungují dokonce velmi dobře. Ale musíme vědět, co od nich lze a co nelze očekávat.

Sám Donald Trump je toho důkazem. V kampani sice prohlašoval, aby lidé průzkumům nevěřili, nicméně i to bylo jen součástí divadla pro jeho voliče – podobně třeba tvrdil, že volby budou zfalšované. Ve skutečnosti však Trump číslům plně důvěřoval. Stačí se podívat, ve kterých státech měl předvolební mítinky těsně před úterními volbami: Michigan v neděli, Florida a Severní Karolína v sobotu a v pondělí, Pensylvánie v pátek a v neděli, New Hampshire v pondělí, Nevada v sobotu… V posledních dnech zkrátka vystupoval přesně v těch státech, kde se nakonec rozhodlo; ať již tam, kde těsně vyhrál, což byla většina z nich, nebo kde prohrál, ale také jen těsně. Jak jeho tým věděl, které státy to budou? No přeci z průzkumů!

Průměrná chyba zveřejněných šetření v jednotlivých státech byla pod 4 %, za celé USA potom někde kolem 2 %. Pokud se nad tím člověk zamyslí, tak je to docela úžasná přesnost. Ze 100 lidí průzkumy správně předpověděly hlasování až 98 z nich, pouze dvěma z té stovky předpovídaly opačnou stranu. Přitom na poslední chvíli, až v den voleb, se rozhoduje něco mezi 5 až 10 voliči z oné stovky a o těch průzkumy nevědí vlastně vůbec nic předem. Přesto jejich chování dokážou v průměru dobře odhadnout. Proč se tedy teď ozývá, že „průzkumy nefungují“?

Nejprve zapomeňme na chvíli na politiku a volební průzkumy a koukněme se na jiné populární předpovědi, na předpovědi počasí. Některé také neuvádějí pouze to, jestli bude pršet, ale rovnou pravděpodobnost srážek. Pokud byste v takové předpovědi slyšeli, že bude pršet s pravděpodobností třeba 25 %, a skutečně by zapršelo, mysleli byste si, že se meteorologové spletli? Nejspíše ne.

Nebo úplně jiný příklad. Fotbal (nakonec mu přeci rozumí také každý). Podobný kurz, jako byl těsně před volbami na výhru Trumpa, je dnes vypsán na vítězství Hradce Králové nad Spartou. Takový kurz je směsí znalostí bookmakerů a sázkařů na velikost šancí obou týmů na vítězství. Pokud ale Hradec vyhraje, nikdo nebude říkat, že se spletli. Přestože je Sparta favoritem – a experti k tomu mají naprosto rozumné důvody jako formu obou týmů, sledují zranění hráčů, atd. –, ve hře je příliš mnoho faktorů nad rámec těch známých, které mohou zápas rozhodnout pro Hradec. Bylo by to možná překvapení, ale nikoliv selhání bookmakerů a sázkařů.

Proč u předpovědi počasí nebo sázek na fotbal lidé obecně nejistotu berou, ale u průzkumů před volbami nikoliv? Selhává zde dle mého názoru rozumně kritický pohled na průzkumy. A to z mnoha stran. Až příliš mnoho médií reportuje o výsledcích průzkumů spíše jako o výsledcích fotbalu než jako o tom, jaké má který tým šance do zápasu. Odtud se to potom opět nekriticky přelévá dále mezi lidmi, ať už na sociálních sítích, nebo třeba u hospodského stolu.

Stejně tak často některá média i mnozí lidé nerozlišují mezi jednotlivými firmami, které průzkumy dělají. Pokud to vezmeme za ČR, pokud třeba někdo přikládá stejnou váhu průzkumům CVVM nebo třeba Medianu na jedné straně a „průzkumům“ Sanepu nebo Phoenixu na straně druhé, musí to být blázen. Přesto to vidíme dnes a denně.

Stejně tak ovšem selhávají i firmy pro výzkum veřejného mínění, a to v osvětě. Hodně lidí už ví, že existuje cosi se jménem „statistická chyba“. To je chyba průzkumů daná tím, že se tazatelé ptají jen třeba tisíce lidí, nikoli všech voličů. Někdy holt náhodou vyzpovídají více voličů jedné strany, než je její průměr za všechny – a to je ta statistická chyba. Ano, statistickou chybu už dnes většina průzkumů uvádí a je to jen správně. Tato chyba je u většiny šetření něco kolem (plus minus) 2 až 3 % a z principu se jí nelze vyhnout, i když se průzkum jinak provede naprosto perfektně.

Pak je tu ještě další chyba. O té se skoro nemluví, alespoň ne s veřejností. Je to chyba průzkumů jako praktické metody, jako konkrétního nástroje pro zjišťování postojů veřejnosti. Nikdo, žádná firma pro výzkum veřejného mínění, totiž není schopná udělat průzkum naprosto perfektně. Někomu zavolají a on se s nimi nechce bavit, protože má práci. Nebo dotazovaný nechce přiznat, že bude volit Trumpa (nebo v ČR komunisty). Nebo na něj dotazující firma nemá telefon. Nebo jim neotevře při osobním dotazování, protože už je starší a cizím lidem neotevírá. Nebo se na poslední chvíli rozhodne, že nakonec k těm volbám přeci jen půjde, i když předtím tazatelům řekl, že ne. Těch důvodů je plno a vlastně nikdo neví, jak se které z nich kdy přesně projevují. Protože kdyby to v těch firmách na výzkum veřejného mínění věděli, tak by si svoje modely opravili i na takovýto problém, opravují si je totiž průběžně.

Tato druhá chyba, která je směsí různých nedokonalostí, je ovšem u dobrých průzkumů – můj soukromý velmi hrubý odhad – obdobně velká jako chyba statistická. Takže reálná chyba dobrých průzkumů je spíše někde kolem plus minus 5 % (a nebudu se hádat, pokud řeknete třeba 8 %).

Slyšeli jste o takovém problému mluvit firmy, které dělají průzkumy veřejného mínění? Já sice ano, ale jen tak mimochodem, jen v odborné debatě. Těžko říci, proč o tom více nemluví, zda si myslí, že by větší odkrytí karet šlo proti jejich byznysu? Proč potom ale svoje data z průzkumů utajuje i veřejnoprávní Česká televize, která tu finanční motivaci nemá? To nevím, ale podle mě to působí kontraproduktivně a vede to spíše k oné většinové skepsi ohledně průzkumů.

Pokud to shrnu: stejné jako předpovídat počasí nebo výsledek fotbalu je i předpovídat výsledky voleb. Průzkumy nejsou zjevená pravda. Pokud experti na průzkumy odhadli šance Trumpa na vítězství třeba na 25 %, tak může být překvapením, že vyhrál, ale selhání průzkumů nebo expertů je nanejvýš v tom, že nejistou situaci nedokázali pořádně vysvětlit.

Za rohem jsou prezidentské volby v Rakousku. Průzkumy zatím doslova o pár procent preferují kandidáta Svobodných Norberta Hofera. Co z toho plyne? Přesně to, že dnes nikdo neví, jak to dopadne. Pokud vyhraje Alexander Van der Bellen, nebude za tím žádné „selhání průzkumů“. Nanejvýš – opět – selhání jejich interpretace. Průzkumy umí předpovídat velmi dobře, ale ne dokonale. Pokud dojdou k odhadu typu 51:49 jako nyní v Rakousku, tak je nejlepší předpovědí prostě „nevíme, jak to dopadne“. S tím se smiřte.