Pokud by kontroloři ministerstva vnitra procentuální chyby ze dvou kontrolních vzorků průměrovali, dospěli by u Jany Bobošíkové k odhadu chybovosti 9,6 %, u Vladimíra Dlouhého k 17,3 % a u Tomia Okamury k 21,2 %. Jak spočítal například iDNES.cz[1], Bobošíkové by tato chybovost stačila k překonání 50 000 hlasů. Okamura a Dlouhý by skončili těsně pod hranicí 49 000 podpisů. To ale neznamená, že správní či ústavní soud mohou s klidným svědomím rozhodnout, aby se použil průměr a Bobošíkovou na rozdíl od Okamury a Dlouhého do prezidentské volby pustit.
Vliv statistické chyby
Za prvé si je nutno uvědomit, že se bavíme o statistickém usuzování ze vzorku (kontrolované podpisy). To je vždy zatíženo tzv. náhodnou statistickou odchylkou. Pokud činil celkový vzorek 17 000 podpisů, Okamura jich celkem dodal 62 tisíc a chybovost ve vzorku měl 21,2 procenta, činí statistická odchylka zhruba plus minus polovinu procentního bodu. A to v případě, když chceme mít jistotu, že naše usuzování je na 95 % správné.
Takový usuzující výrok ze vzorku totiž vypadá nějak takto: Pakliže měl Tomio Okamura ve vzorku chybu 21,2 procent, lze s 95% jistotou říct, že v celkově má mezi podpisy chybovost 20,7 až 21,7 procenta. Neříkáme tedy, že Okamura má reálně 48 829 podpisů, ale že na 95% spolehlivostí získal mezi 48 520 a 49 140 podpisy. Jinak řečeno, i při tomto úsudku se v jednom z dvaceti případů (oněch 5 % nejistoty) pletu.
Pokud chceme mít větší jistotu, musíme dále rozšiřovat interval, do něhož kandidátův zisk odhadujeme. Například s 99,9% jistotou by šlo usuzovat, že Okamura má ve skutečnosti něco mezi 48 300 a až 49 350 hlasy. Pointa je, že naprosto spolehlivě nejde statisticky vyloučit ani to, že Okamura a Dlouhý hranici 50 000 překonali, ačkoli tomu kontrolní vzorek nenapovídá.
V ideálním případě by měl zákon popisující kontroly stanovit i to, jakou musí mít stát na základě vzorků jistotu, aby mohli kandidáta vyřadit. Či z druhé strany – jak velké riziko, že kandidáta vyřadím neoprávněně, je ještě ústavně přijatelné.
Nyní se i touto úvahou bude muset zabývat soud. V našem případě jde spíš o principiální problém. Lehce si lze ale představit případ z dalších let, kdy úsudek s 95% spolehlivostí kandidáta vyřazuje, zatímco úsudek s 99% spolehlivostí mu přiznává, že 50 000 podpisů mít může.
Náhodný, nebo nenáhodný výběr?
Ještě závažnější problém jsou ale v našem případě konkrétní metody ministerských kontrol. Se statistickou chybou, jak jsem ji popsal výše, totiž lze operovat, kdyby podpisy ke kontrole byly vybrány opravdu náhodným výběrem.
Statistik Michal Škop z hnutí Kohovolit.eu už upozornil[2], že pokud by podpisy byly náhodně vybrány a kontrolovány shodnou metodou, bylo by krajně nepravděpodobné, aby v jednom vzorku u Jany Bobošíkové činila chybovost 7,7 % a v druhém 11,5 %. Na první pohled to možná není velký rozdíl. Pravda ovšem je, že při skutečně náhodném výběru tak velkého vzorku bychom při drtivé většině dvojtestů měli dospět k odchylce o velikosti maximálně 1 %. Podle Škopova propočtu je pravděpodobnost, že bychom se dostali k rozdílu jako u Bobošíkové, menší než jedna ku miliardě.
Je tedy zřejmé, že postup ministerstva obsahuje vlivy, kvůli nimž se nejedná o zcela náhodný výběr podpisů a shodný postup kontrol. Nemusí se přitom jednat o záměrné ovlivnění. Od naprosté regulérnosti vzdalují kontroly podle všeho tyto dvě věci:
Kontrola archů místo podpisů
Ministerstvo ke kontrole náhodně vybíralo celé archy podpisů a nikoli podpisy jednotlivě. Tím se ale právě zmenšuje síla, s jakou kontrola na vzorku vypovídá o celkové skutečné chybovosti. Lze vysvětlit na příkladu.
Dejme tomu, že kandidát by odevzdal podpisy na 100 arších. Na 98 z nich by byly podpisy kompletně v pořádku a na dvou arších od podvodných sběračů byly všechny vymyšlené. Pokud jsou archy stejně velké, má kandidát přesně 2 % chybných podpisů. Náhodný výběr jednotlivých podpisů a jejich kontrola by směřovala k tomuto číslo a náhodně se od něj odchylovala.
A teď si představme, že úředníci ke kontrole nevyberou jednotlivé podpisy, ale celé archy. Otestují třeba 10 ze stovky archů. S odlišnou pravděpodobností se dostanou ke třem výslekům:
a) do kontroly se nedostane ani jeden ze špatných archů – budou odhadovat chybovost 0 %
b) do kontroly se dostane jeden ze špatných archů – budou odhadovat chybovost 10 %
c) do kontroly se dostanou oba špatné archy – budou odhadovat chybovost 20 %
V žádném případě se ale nebudou přibližovat ke skutečné chybovosti 2 %.
Ve skutečnosti vliv není tak extrémní, protože kandidáti měli více než 100 archů a mírou chybovosti se mezi sebou nelišily jako v našem příkladu. Pořád ale platí, že výpovědní síla kontroly je silně omezena tím, že k ní jsou vybírány celé úseky podpisů, které mají něco společného (dělal je jeden sběrač, byly sbírány v jednu dobu, na jednom místě, apod.). To je zřejmě jeden z důvodů, proč se u některých kandidátů výsledky prvního testu a druhého testu natolik liší.
Chybná metoda kontroly duplicit
Druhý a velmi zásadní problém je způsob kontroly duplicit rozhovorů – tedy zda daný člověk nepodepsal petici dvakrát. Hodně duplicitních rozhovorů měla hlavně Jana Bobošíková (celkem 418 v obou vzorcích).
Ministerstvo ve svých reportech píše, že „U ztotožněných záznamů bylo dále ověřováno, zda neexistují duplicitnízáznamy. Pokud ano, byly všechny záznamy s výjimkou jednoho označenyza duplicitní a neověřené.“ Podle všeho tedy byly zkoumány jen duplicity napříč podpisy, které byly vybrány pro kontrolu a nebyly předtím vyřazeny z jiného důvody (např. protože daný člověk neexistuje).
Výpis výsledků u Jany Bobošíkové přitom ukazuje, že při kontrole druhého vzorku kontroloři navíc testovali i duplicitu podpisů oproti již zkontrolovaným podpisům ze vzorku prvního. To vysvětluje, proč například Bobošíková měla v prvním vzorku 81 duplicit a v druhém 337 duplicit. U Okamury to bylo 25 a 55 duplicit, u Dlouhého 21 a 46 duplicit, u Fischera 12 a 32 duplicit, u Zemana 24 a 60 duplicit. Zkrátka – v druhé kontrole bylo duplicit logicky více, protože podpisy byly podle všeho kontrolovány proti zhruba dvojnásobku ostatních podpisů než v první kontrole.
Pokud se někdo zamýšlel, proč je u většiny kandidátů chybovost v druhém vzorku obecně vyšší než v prvním, odpověď musí hledat i zde. Například u Jany Bobošíkové rozdíl v počtu duplicit vysvětluje 3 % z celkových 3,8 %, kterým se lišila chybovost v prvním a druhém vzorku.
Není to přitom nic, z čeho by se kandidáti měli radovat. Pokud by totiž ministerstvo zkontrolovalo podpisy všechny, bylo by pravděpodobně procento duplicit mnohem vyšší – každý podpis by totiž byl porovnáván s mnohem vyšším počtem „konkurenčních“ podpisů. Zejména pro Janu Bobošíkovou to znamená problém. Duplicit má totiž už v kontrolních vzorcích tolik, že při kontrole všech podpisů by ji mohly stát kandidaturu.
Férové řešení: Celková kontrola tří kandidátů
Možných vlivů je samozřejmě více než tyto dva. Už teď je ale jasné, že systematické vychýlení způsobem výběru a metodou kontrol duplicit je takové, že v kombinaci s náhodnou statistickou chybou nelze přinejmenším u Tomia Okamuru, Vladimíra Dlouhého a Jany Bobošíkové seriózně odhadovat, zda ve skutečnosti 50 000 podpisů mají či ne.
Je pravděpodobné, že reálně sebrali něco mezi 45 000 a 52 000 platnými podpisy. Kolik přesně to je, by ale před kontrolou všech podpisů neodhadl ani americký genius volebních predikcí Nate Silver.[3]
Proto si myslím, že pokud správní či ústavní soud nebudou zkoumat jen formální naplnění prováděcího zákona (průměrovat místo sčítat), logika věci a spravedlnost velí, že minimálně u třech hraničních a vyloučených kandidátů (Bobošíková, Dlouhý, Okamura) by měl soud nařídit přezkum všech dodaných podpisů.
[1] http://zpravy.idnes.cz/reakce-vyrazenych-kandidatu-na-funkci-prezidenta-f7k-/domaci.aspx?c=A121123_150530_domaci_kop
[2] http://blog.aktualne.centrum.cz/blogy/michal-skop.php?itemid=18241
[3] http://zpravy.idnes.cz/volba-americkeho-prezidenta-obama-a-romney-fj7-/zahranicni.aspx?c=A121107_121914_zahranicni_jav