Reklama
 
Blog | Daniel Prokop

Kdo vyhrál EP volby? Ilustrace tří experimentálních metod odhadu

Malá účast v eurovolbách je problémem evropské demokracie, ale i pro výzkumníky. Reprezentativní šetření relevantně odhadující výsledek voleb musí mít tisíce respondentů, aby zahrnulo dostatek voličů. Díky tomu a neexistenci klasického exit-pollu můžeme až do neděle 23:00 výsledky hádat. V rámci tohoto "hádání" existují i experimentální metody, které za jistých okolností mohou být vodítkem. Použití a výsledky tří z nich (agregovaný volební model adjustovaný odhadovanou účastí, moudrost davu a model referenčních okolí) lze ilustrovat i na těchto volbách. 

Vytvoření exit-pollu (tedy dotazování většinou cca 20 000 voličů u volebních místností v celé republice) stojí miliony korun a minulost v ČR i v zahraničí ukázala, že ani velké vzorky nejsou zárukou vždy přesnosti (zejm. díky neznalosti struktury populace voličů). Alternativou ja klasické výběrové šetření. Při volební účasti 20-30 % ale musí mít pro zahrnutí dostatku voličů celkově 3-5 tisíc respondetů. Opět tedy drahý koníček. Jedinou předpovědí volebního výsledku je tak v současnosti anketa MF DNES, která předpokládá vítězství TOP 09, ale jak přiznává deník, jde o experimentální design s některými úskalími.

Existuje ale i několik experimentálních metod využívaných k odhadu výsledku voleb. Nemohou být sice náhradou výzkumné práce ve volebních dnech, ale jsou jistou „hrou zadarmo“, která zvyšuje orientaci v síle stran a možnostech, které ve volbách měly.   

1. Agregovaný předvolební model adjustovaný na sníženou volební účast

Reklama

Typickým rysem volebních modelů před volbami do Evropského parlamentu byl velmi velký rozptyl odhadu výsledků stran – odhadovaný aktuální zisk ČSSD se liší u modelů ze stejné doby o 14 % (26,4 % v modelu CVVM, 12,5 % v modelu Herzmann), u Úsvitu o zhruba 5 % (1,1 % v modelu CVVM, 7,7 % v modelu Herzmann). Ten je dán právě malou deklarovanou účastí (při vzorku N=1000 byly modely konstruovány z 280-350 lidí) či využitím nových alternativních metod (viz metodika Herzmann).

Pro sledování trendů v podpoře a neutralizaci systematických vychýlení lze využít agregaci předvolebních modelů (výrazně využíváno v USA). Agregovaný model ze všech výzkumů publikovaných měsíc před volbami, z nichž lze vyčíst volební model, vypadal zhruba takto – viz TAB1.1.

TAB 1.1 Agregovaný předvolební model – Evropské volby 2014

 

Agregovaný předvolební model

ANO

24,6

CSSD

19,5

TOP09

11,5

KSCM

13,4

ODS

7,1

USVIT

4,2

KDU-CSL

6,3

Zelení

3,3

Piráti

3,2

Svobodní

3,0

OSTATNÍ

3,9

Pozn.: Agregace zahrnuje všechny dostupné výzkumy agentur se středním dnem sběru mezi 17.4.-11.5.  Nevychází z prostého průměrování, ale zohledňuje časovou vzdálenost modelů od voleb a trendy v jejich vývoji.

Jedinou proměnnou, o níž lze dnes agregovaný model v případě EP voleb relevantně aktualizovat je znalost volební účasti. Předvolební modely průměrně vycházely z účasti cca 31 %. Reálná účast se dle odhadů pohybuje okolo 20 %. Závislost zisku stran na účasti je přitom rozdílná. Při jinak neznámých podmínkách lze říci, že stranám s identifikovaným jádrem voličů pokles účasti pomáhá. Modelování závislosti nejpravděpobnějšího zisku stran na účasti na datech sbíraných společností MEDIAN měsíc před volbami naznačuje při poklesu účasti z 31 na 20 procent nejpravděpodobnější nárůst preferencí KSČM o cca 7 procent (nikoli procentních bodů!) a Svobodných o cca 11 % (nikoli procentních bodů!) a naopak pokles podpory Úsvitu či Pirátů. Na základě tohoto modelování lze vytvořit agregovaný předvolební model adjustovaný na očekávanou účast okolo 20 %.

TAB 1.2 Agregovaný předvolební model adjustovaný na sníženou účast

 

Agregovaný předvolební model

Ovlivnění propadem účasti
(31 % -> 20 %)

Agregovaný předvolební model (adjustovaný na účast 20 %)

ANO

24,6

96,8%

23,8

CSSD

19,5

99,1%

19,3

TOP09

11,5

100,8%

11,6

KSCM

13,4

107,0%

14,4

ODS

7,1

104,7%

7,4

USVIT

4,2

93,1%

3,9

KDU-CSL

6,3

103,5%

6,6

Zelení

3,3

97,6%

3,2

Piráti

3,2

93,7%

3,0

Svobodní

3,0

111,4%

3,3

OSTATNÍ

3,9

 

3,5

Je nutno poznamenat, že ani po adjustaci volební účastí, nebývá na rozdíl od USA agregovaný model v ČR příliš dobrou predikcí voleb. Za prvé je zde málo agentur (tedy zdrojů dat) a krátká a proměnlivá volební historie (ztížená možnost optimalizovat způsob agregace). V našem případě se střední je navíc den doby sběru posledního výzkumu 14 dní před volbami. V tu dobu je v ČR tradičně i podle dat uveřejněných k EP volbám okolo 40-50 % pravděpodobných voličů nepevně rozhodnutých o svém volebním chování. Na rozdíl např. od USA tak dochází k velkému posunu v preferencích a motivacích voličů, které se mohou uskutečňovat např. i po poslední volební debatě. 


2. Odhad moudrostí davu (Wisdom of Crowds)

Mezi populární experimentální techniky odhadu patří tzv. moudrost davu provozovaná v ČR například společností Perfect Crowd. Metoda funguje zjednodušeně řečeno dotázáním vzorku lidí (expertů) na odhad výsledku voleb a vytvoření agregovaného odhadu – volební modelu.

V poslaneckých volbách 2010 se volební model z projektu 100 chytrých vzdaloval od skutečného výsledku voleb zhruba stejně jako lepší volební modely z výběrových šetření se středním bodem sběru 2-3 týdny před volbami. Kritici mimo jiné namítají, že úspěšnost byla dána zkrátka tím, že většina lidí vědomě či nevědomě vychází z výzkumů, které aktualizuje o kauzy a další informace, které ještě modely nezachytily apod.

Vyzkoušeli jsme moudrost davu na těchto EP volbách. Dotazování proběhlo ve volebních dnech on-line panelu MEDIAN. Při konstrukci výstupů jsme zohlednili informovanost respondentů o politice (předpoklad přesnějšího odhadu informovaným respondentem) a udrželi jsme hrubou sociodemografickou reprezentativitu. Tu metodika moudrosti davu ne vždy vyžaduje. Ukázalo se však, že v případě EP voleb lidé často avizují neznalost volebních výzkumů a spíše ovlivnění sociálním okolím – reprezentativní zahrnutí voličů různých skupin je tak v tomto případě dle mého názoru více žádoucí než např. u voleb do PSP ČR. Výsledky vypadají takto.  

TAB 2. Moudrost davu – EP volební model

 

Odhad pomocí moudrosti davu

ANO

25,4

CSSD

19,0

TOP09

8,5

KSCM

12,3

ODS

7,5

USVIT

5,5

KDU-CSL

5,7

Zelení

3,2

Piráti

4,2

Svobodní

2,8

OSTATNÍ

5,9

Zdroj: On-line výzkum (CAWI panel MEDIAN), 23.-24.5.2014, n=270 odhadujících

Na první pohled je zřejmá korespondence s agregovaným volebním modelem. Oproti němu jsou nižší hodnoty odhadovány u TOP 09, KSČM či Svobodných a vyšší u ANO a Úsvitu. Zda se jedná o „správné“ zohlednění faktorů z posledních 14 dnů, které se do modelů nedostaly, nebo např. přílišnou váhu přisuzovanou kampani (ANO) či mobilizační on-line rétorice (Úsvit), ukáží až výsledky voleb.

3. Výzkum sekundárních voličů / referenčního okolí respondenta

Méně používanou experimentální metodou výzkumu je dotazování, které bychom mohli nazývat výzkumem sekundárních respondentů či referenčního okolí respondenta. Probíhá podobně jako moudrost davu. Respondent ovšem není dotazován na celkový odhadovaný výsledek voleb. Uvádí pravděpodobné rozložení podpory stran, k níž by ve volbách došlo, pokud by volili jen lidé z jeho blízkého sociálního okolí, u kterých si je a) jist účastí A b) dokáže odhadnout jejich volenou stranu.

Její ideou je, že každý respondent zahrnuje do výzkumu další „sekundární“ respondenty (v našem výzkumu dle deklarací průměrně cca 15-20). Tím rozšiřuje počet lidí, za který výzkum referuje, částečně neutralizuje ovlivnění výzkumnou metodou (oslovení online sběrem) a v kvótním výzkumu případnou výraznou odchylnost preferencí primárního respondenta od skupiny obyvatel (např. VŠ vzdělaní), kterou ve výzkumu reprezentuje. Hypoteticky také zahrnuje do výzkumu sekundární respondenty, kteří jsou neoslovitelní klasickým výzkumem (odmítači, nezastižitelní) a z dat agentur tak systematicky vypadávají. Jejím slabinou může být omezená relevance odhadu volebního chování vlastního sociálního okolí – která má vliv zejména při systematickém vychýlení některým směrem (např. ke stranám se silnou kampaní), a stejně jako u moudrosti davu také komplikovanost/nemožnost vyčíslit předpokládanou chybovost modelu.

Metoda byla aplikována ve stejném výzkumu jako test moudrosti davu (CAWI, N=270, dotazování ve volební dny evropských voleb). U dotázaného vzorku byla zajištěna reprezentativita z hlediska sociodemografických znaků a hrubá reprezentativita dle vlastních politických preferencí. Výsledný model je agregátem odhadů respondentů, jak bude hlasovat jejich sociální okolí. Viz TAB 3.

Respondenti (podobně jako modely agentur) přitom odhadovali, že se voleb zúčastní okolo 30 % jejich blízkých. Jedinou aditivní informací, kterou můžeme odhady adjustovat, je tedy stejně jako u agregovaného modelu předpoklad poklesu účasti na nyní odhadovaných cca 20 %.

TAB 3. Model referenčních okolí – Evropské volby 2014

 

Model referenčních okolí

Ovlivnění propadem účasti
(31 % -> 20 %)

Model referenčních okolí (s adjustací účasti)

ANO

21,1

96,8%

20,4

CSSD

18,0

99,1%

17,9

TOP09

10,4

100,8%

10,5

KSCM

13,8

107,0%

14,8

ODS

7,2

104,7%

7,5

USVIT

6,2

93,1%

5,8

KDU-CSL

6,1

103,5%

6,3

Zelení

3,6

97,6%

3,5

Piráti

4,3

93,7%

4,0

Svobodní

3,7

111,4%

4,2

OSTATNÍ

5,5

 

5,1

I výsledky modelu referenčních okolí svojí strukturou odpovídají agregovanému modelu (viz TAB 1). Redukuje ovšem předpokládaný zisk hlavních stran (ČSSD, ANO) a přisuzuje menším stranám (Úsvit, Svobodní, Piráti) vyšší šanci překonat či přiblížit se kýžené 5% hranici.

Závěrem  

Mezi zmíněným odhadem MF DNES a výsledky našich experimentů jsou viditelé rozdíly. Může to být systematickým posunem v podpoře stran a mobilizaci jejich voličů ve volební dny, které jsou v ČR běžné a žádná technika nezahrnující rozsáhlé dotazování ve volební dny nemá šanci zachytit.

Metodami odhadu volebních výsledků, u níž lze předpokládat či předem vyčíslit jistou spolehlivost, zůstává klasický exit-poll a reprezentativní výběrové šetření ve volební dny, jejichž náročnost je v EP volbách značná (viz úvod). 

Zmíněné alternativní metody jsou „hrou zadarmo“ a experimentem, který nemůže klasickou výzkumnou práci ve volební dny nikdy nahradit a těžko lze předem odhadnout jejich chybovost. Jejich obecnou relevanci a optimální nastavení konstrukce vzorků a modelů je tak nutné testovat v čase na různých volbách. Poté se mohou stát příspěvkem, který doplňuje klasická šetření.

  Agregovaný převolební model (adjustovaný na účast 20 %) Moudrost davu (CAWI, n=270) Model referečního okolí  (adjustovaný na účast 20 %)
ANO 23,8 25,4 20,4
CSSD 19,3 19,0 17,9
TOP09 11,6 8,5 10,5
KSCM 14,4 12,3 14,8
ODS 7,4 7,5 7,5
USVIT 3,9 5,5 5,8
KDU-CSL 6,6 5,7 6,3
Zelení 3,2 3,2 3,5
Piráti 3,0 4,2 4,0
Svobodní 3,3 2,8 4,2
OSTATNÍ 3,5 5,9 5,1