Reklama
 
Blog | Daniel Prokop

Americký Den D: Romneyho šancí je systematické vychýlení průzkumů

Amerika vstupuje do jedné z vyrovnanějších prezidentských bitev. Z podrobnější analýzy ovšem vyplývá, že Barack Obama je silnějším favoritem, než většina médií připouští. Při zprůměrování 11 nejvýznamnějších a nejdůvěryhodnějších amerických predikčních modelů a datových serverů agregujících volební průzkumy se ukazuje, že současný prezident má zhruba 85% šanci porazit vyzyvatele Mitta Romneyho a nejpravděpodobněji dostane 292 – 306 volitelů (minimum na vítězství je 270). Romneyho šancí je dnes už především to, že desítky předvolebních výzkumů v USA jsou systematicky vychýleny pro Obamu. 

 

U sledování amerických voleb je základní jedna věc – zapomeňte na jednotlivé výzkumy. V USA dělá v současnosti předvolební výzkumy celostátně přes 15 agentur a denně přibývá okolo 10 výzkumů z jednotlivých „battleground states“ (bitevních států). Při takovém množství je velmi pravděpodobné, že několik výzkumů je vychýleno k hranici či i za hranici proklamované náhodné statistické odchylky. Sledování historie výsledků rovněž ukazuje, že některé agentury jsou oproti průměru odchýleny směrem k republikánům (Rasmussen, Gallup) a jiné k demokratům (PPP a další). Pro seriózní odhady šancí Baracka Obamy a Mitta Romneyho je třeba sledovat, co říkají výzkumy jako celek.

Lze vycházet ze tří zdrojů. Prvním jsou čisté agregátory výzkumů, mezi nejsystematičtější patří: Real Clear Politics[1], Huffpost Pollster[2] a Electoral-Vote[3]. Tyto agregátory slučují výsledky výzkumů v jednotlivých státech USA, buď jednoduchým průměrem nebo přiřazováním rozdílných vah výzkumům podle toho, jak jsou aktuální, nakolik jsou výsledky dané agentury historicky úspěšné a vychýlené pro jednu čidruhou stranu.

Za druhé tu jsou predikční modely amerických statistiků. Nejznámějším je asi model FiveThirtyEight[4] Natea Silvera, který si udělal jméno předpovědmi v baseballu, načež přesedlal na politiku a v roce 2008 svým modelem odhadl správně výsledky voleb ve 49 z 50 států USA. Silverův model kombinuje výše popsaný přístup propracovanějších volebních agregátorů a zařazuje do modelu několik dalších proměnných jako výši nezaměstnanosti či posuny v demografii států. Silver model zkalibroval na prezidentských volbách druhé poloviny 20. století a dokáže kriticky komentovat jeho omezení a předpoklady. S postupem času k volbám Silverův model automaticky přidává větší význam předvolebním výzkumům, které v sobě zahrnují vliv jevů jako nezaměstnanost na veřejné mínění. V současné chvíli odhaduje, že pravděpodobnost Baracka Obamy na vítězství ve volbách je přes 92% a nejpravěpobněji získá okolo 313 volitelů.

Reklama

Mezi další predikční modely konstruované analogickým, ale odlišným způsobem lze zařadit také – model Sama Wanga z Univerzity v Princtonu[5], DeSartův/Holbrookův[6] model z Utah University, Votomatic Davida Linzera, odhady Simona Jackmana (spolupracovník Huffipost Pollster ze Stanfordu). Všechny předvídají vítězství Obamy se ziskem nad 300 volitelů. Metodologicky a výsledkově se vymykají se jen predikce modelů University Of Colorado[7] a Douglese Hibbse, které předvídají vítězství Mitta Romneyho.[8]

Třetím zdrojem jsou privátní společnosti pohybující se na predikčních a sazkových trzích a věnující se politickým předpovědím[9], tedy zejména Betfair, IEM či Intrade.Všechny dávají podstatně vyšší šance na výhru Obamovi.

Stejně jako má smysl průměrovat výzkumy, má smysl zprůměrovat dostupné informace agregačních serverů a predikční modely, protože tím omezujeme šanci, že vsadíme na systematicky vychýlenou metodologii. Ukazuje se, že průměrný odhad je, že Barack Obama má zhruba 85% šanci na výhru a nejpravděpobněji získá něco přes 292 volitelů (nejčastější je však odhad přes 300 volitelů).

Volební odhady k 6.11.2012 11:00

  Pravděpodobnost výhry Nejpravděpodobnější počet volitelů
  Obama Romney Obama x Romney
FiveThirtyEight 90,9 9,1 313 0 225
Princton Uni (Sam Wang) 98,2 1,8 309 0 229
Utah University (DeSart, Holbrook) 87,7 12,3 290 0 248
Votomatic (Linzer)     326 0 212
Electoral Vote     294 24 220
HuffPost Pollster / Simon Jackman 90,0 10,0 303 0 235
Real clear Politics     303 0 235
Betfair 78,4 21,6      
Intrade 68,3 31,7      
IEM 78,3 21,7      
University Of Colorado     208 0 330
Průměr 84,5 15,5 293,3 3,0 241,8

Pozn: Některé zdroje uvádí jen některý typ výsledků. Dougles Hibbs uvádí jen přibližný odhad celostátního zisku, z kterého nelze na výsledek voleb přesně poukazovat.

 

Evidence je masivní. Z jedenácti států, které se dají označit za zatím nerozhodnuté (Ohio, Florida, Virginie, New Hampshire, Severní Karolína, Michigan, Wisconsin, Pennsylvánia, Iowa, Colorado, Nevada) vede v devíti Obama (ve všech kromě Floridy a Severní Karolíny), z toho v sedmi případech s náskokem min. 2 procentní body.

Jen v posledním týdnu bylo v devíti k Obamovi se klonících bitevních státech, které mu bohatě stačí na výrazné vítězství, provedeno 41 výzkumů. Z nich Obama vyhrál 33, Romney 4 a zbylé 4 skončily remízou. Ve většině států je předpoklad Obamovy výhry postaven min. na 3 průzkumech (v Ohiu dokonce na 10 průzkumech) z jednoho týdne.

Přitom platí, že v rámci náhodné statistické chyby mají průzkumy stejnou pravděpodobnost mírně nadhodnotit Romneyho i Obamu. Je vysoce nepravděpodobné, že by Obamu náhodně nadhodnotila tak drtivá většina ze 41 výzkumů. Jak již v sobotu poznamenal Nate Silver, Romneyho šance na vítězství ve volbách se redukovala na možnost, že výzkumy systematicky nadhodnocují Obamu díky nějaké aspektu jejich metodologie. Právě to je ona dnes 15% šance Romneyho na vítězství.

Jak se mohou americké výzkumy mýlit

Vždyť se také průzkumy často mýlí, řekne si skeptický Čech zvyklý na odchylky voleb od volebních průzkumů. V USA jsou ale výzkumy historicky výrazně častěji odpovídají výsledku voleb[10] a zejména nejsou v průměru systematicky vychýleny pro republikány ani pro demokraty[11]. Důvodem rozdílu oproti ČR není lepší metodologie, ale výrazně jednodušší politické podmínky.

Přesto nelze systematické zkreslení v USA roku 2012 zcela vyloučit. Teoreticky může mít tyto příčiny:

a)     Neodhadnutí specifik volební účasti

Zřejmě nejpravděpodobnější možnost a riziko pro Obamu je, že k volbám nepřijde část demokratických voličů, kteří v průzkumech avizují účast. Poslední 4 roky polarizovaly Ameriku a řada republikánských voličů se ztotožnila s politickým aktivismem typu Tea Party. Naopak demokraté mohou mít problém s účastí nízkopříjmových skupin, které by sice nikdy nevolily republikánského kandidáta, ale v letech Obamovy vlády se jejich příjmová situace nezlepšila.

Riziko snížené účasti demokratických voličů ale může být i přeceňované – poslední výzkumy ukazují, že 80 % demokratů chce jít k volbám „volit Obamu“ a jen 20 % „volit proti Romneymu“. U republikánů je ztotožnění s kandidátem menší (poměr výše uvedených odpovědí zde 60 : 40). Na rozdíl od českých volebních kampaní, které často „přemlouvají voliče k volbě strany“, se také americké kampaně na úrovni měst a okrsků výrazně soustředí na „přemlouvání svých voličů k účasti“. Tyto vlivy mohou riziko neúčasti demokratů omezit.

b)    Neodhadnutí nálady nerozhodnutých voličů

Republikánský stratég a bývalý poradce G.W.Bushe, Karl Rove, a někteří další analytici, kteří fandí Romneymu, předpovídají, že nerozhodnutí voliči se rozhodnou pro něj, protože mají historickou tendenci na poslední chvíli volit spíše vyzyvatele než obhajujícího prezidenta. Při bližším pohledu to však zejména v poslední době neplatí – například v roce 2004 se nerozhodnutí zhruba rovnoměrně rozdělili mezi obhajujícího G.W.Bushe a vyzyvatele Johna Kerryho.

Aktuální výzkumy také ukazují, že s úbytkem nerozhodnutých ve většině států spíše posiluje pozice Baracka Obamy. Nerozhodnutých je navíc ve státech USA v posledním týdnu jen okolo 5 procent. Oproti Česku, kde v posledním týdnu není rozhodnuta zhruba pětina voličů, je tedy vliv neodhadnutí nerozhodnutých na konečné výsledky mnohem nižší.

c)     Vychýlení telefonickým sběrem a oporou výběru

Takřka všechny výzkumy v USA probíhají telefonicky – většinou na mobilní telefony a pevné linky, jejichž čísla jsou náhodně vybírány ze seznamů či generovány. Opora a systém výběru může výzkum teoreticky vychylovat – lidé určitého věku a určitých socioekonomických vlastností mají např. vyšší šanci, že vlastní mobilní telefon i pevnou linku. Mají tedy zvýšenou šanci na zahrnutí do výzkumu. Tyto socioekonomické skupiny přitom mohou inklinovat k jedné či druhé straně, což výzkum vychýlí.

Správně konstruovaný výzkum však toto riziko dokáže redukovat – a to buď přiřazováním rozdílných vah respondentům podle toho, jaká byla šance jejich zahrnutí do výzkumu (zda mají mobil i pevnou linku), či vážením vzorku, aby odpovídal populaci podle kritérií, které ovlivňují volby (v USA např. i barva pleti či vyznání).

d)    Vychýlení malou návratností

Sociolog se zděsí, ale volební výzkumy mají v USA návratnost jen mezi 2,5 až 10 %. Drtivá většina respondentů účast odmítá, což je oproti ČR posíleno i faktem, že některé firmy provádějí dotazování automatem (nahraný hlas jako v call-centrech), který se lidi nebojí zavěsit.  Návratnost přitom může mít zásadní vliv. Pokud muž osloví 20 dívek s nabídkou sňatku a 19 jej odmítne, lze předpokládat, že ta 1 ochotná se oproti zbytku nějak liší. Může jen doufat, že to nebude v oblastech, kde by preferoval, aby byla průměrná.  Výzkumníci jsou v podobné situaci – předpokládají ovšem, že odmítavost není specifická (systematicky více odmítají voliči jedné strany) a pokud ano, tak že lze redukovat vážením vzorku, aby byl reprezentativní podle znaků, o nichž je známo, že v USA ovlivňují volební chování.

Nemusí to být ovšem samozřejmost – lze si například představit, že voliči strany, kteří jsou před volbami více politicky „nažhaveni“ (v současnosti zřejmě republikáni), mají rovněž vyšší ochotu odpovídat na volební výzkum. Vzorek pak může reprezentativní ze všech sociodemografických hledisek a přesto specifickou návratností vychylovat výsledky. V případě současných USA by tento hypotetický ovšem ovšem mohl působít proti prvnímu zmíněnému riziku (přecenění účasti demokratických voličů). Existují i jiné možné vlivy návratnosti. Například v ČR mají na telefonický výzkum větší sklon oproti osobnímu dotazování odpovídat aktivní lidé, což způsobuje silnější postavení pravice při telefonickém dotazování.

Pro bod c) i d) ovšem platí, že pokud by takovéto systematické riziko v amerických výzkumech existovalo a výzkumníci by jej ignorovali, zřejmě by se více projevovalo v historii amerických výzkumů. To se však neděje.   

e)     Vývoj politické situace do voleb

Velká část zdánlivé nekorespondence českých volebních výzkumů s volbami je dána jejich časovým odstupem od voleb. Například některé výzkumy pro ČRo a ČT před krajskými volbami byly sbírány v srpnu – tedy až 2 měsíce před volbami. Pokud bychom usuzovali na výsledek amerických voleb z 2 měsíce starých výzkumů, také bychom došli k zjištění, že „nekorespondují“. V Americe však bylo jen 11 bitevních nerozhodnutých státech provedeno přes 50 výzkumů v posledních 10 dnech. Šance, že se mezi dobou jejich sběru a volbami, stalo něco politicky zásadního s dopadem na veřejné mínění je tedy nesrovnatelně menší než v ČR. Reálně přitom byly dvě nejvýznamnější události hurikán Sandy a pozitivní zpráva o stavu nezaměstnanosti z minulého týdne – ani jedna přitom Obamovy zřejmě neuškodí.

 

Závěr? Možnosti systematického vychýlení volebních výzkumů v USA, díky nimž by se stal Mitt Romney oproti předpokladům prezidentem, existují. Nelze však předem očekávat, že by toto vychýlení mělo být v jeho prospěch Mitta Romneyho a nikoli v prospěch Obamy. Pokud tedy chcete sázet, je nejlepší se spolehnout na průměry prediktorů a agregačních serverů. Obama nejpravděpodobněji získá přes 292 volitelů a má cca 85% šanci výhru ve volbách. Samozřejmě může i prohrát, ale jeho šance na výhru je nyní zhruba stejná jako u fotbalového klubu, který v domácím zápase v 70. minutě vyhrává o jeden gól.[12] Pokud vyhraje Romney, bude to z hlediska prezidentských volebních výzkumů v USA jedno z největších překvapení posledních dekád a můžeme čekat přehodnocování metodologie, aby více bránila výše zmíněným vlivům (a-d). 


[1] http://www.realclearpolitics.com

[2] http://www.huffingtonpost.com/2012/11/05/polls-2012_n_2038645.html

[3] www.electoral-vote.com

[4] http://fivethirtyeight.blogs.nytimes.com/

[5] http://election.princeton.edu/history-of-electoral-votes-for-obama/

[6] http://research.uvu.edu/DeSart/forecasting/october.html

[7] http://www.colorado.edu/news/releases/2012/10/04/updated-election-forecasting-model-still-points-romney-win-university

[8] Jejich specifikum ovšem je, že staví jen na ekonomických a jiných statistikách, nikoli na výzkumech veřejného mínění – nemohou tedy zachytit vliv věcí jako byly prezidentské debaty, vliv reklamy a kampaně, či třeba hurikánu Sandy. Hibbsův model například predikuje vítěze jen z reálných příjmů a počtu mrtvých vojáků v mandátu obhajují strany.

[9] http://www.predictwise.com/politics/2012presidentindividual