Reklama
 
Blog | Daniel Prokop

Ministerské kontroly podpisů mají více problémů. Řešením je přepočet

Fakt, že ministerští kontroloři prezidentských podpisů sčítali procenta chyb ze dvou kontrolních vzorků místo průměrování, není jediný problém jejich postupu. Slabých míst metody kontrol je tolik, že dnes nelze s větší jistotou odhadnout, zda Jana Bobošíková, Tomio Okamura a Vladimír Dlouhý dosáhli či nedosáhli 50 tisíc podpisů. Jediným férovým řešením je zřejmě jen kontrola všech jejich podpisů.

Pokud by kontroloři ministerstva vnitra procentuální chyby ze dvou kontrolních vzorků průměrovali, dospěli by u Jany Bobošíkové k odhadu chybovosti 9,6 %, u Vladimíra Dlouhého k 17,3 % a u Tomia Okamury k 21,2 %. Jak spočítal například iDNES.cz[1], Bobošíkové by tato chybovost stačila k překonání 50 000 hlasů. Okamura a Dlouhý by skončili těsně pod hranicí 49 000 podpisů. To ale neznamená, že správní či ústavní soud mohou s klidným svědomím rozhodnout, aby se použil průměr a Bobošíkovou na rozdíl od Okamury a Dlouhého do prezidentské volby pustit.

Vliv statistické chyby

Za prvé si je nutno uvědomit, že se bavíme o statistickém usuzování ze vzorku (kontrolované podpisy). To je vždy zatíženo tzv. náhodnou statistickou odchylkou. Pokud činil celkový vzorek 17 000 podpisů, Okamura jich celkem dodal 62 tisíc a chybovost ve vzorku měl 21,2 procenta, činí statistická odchylka zhruba plus minus polovinu procentního bodu. A to v případě, když chceme mít jistotu, že naše usuzování je na 95 % správné.

Reklama

Takový usuzující výrok ze vzorku totiž vypadá nějak takto: Pakliže měl Tomio Okamura ve vzorku chybu 21,2 procent, lze s 95% jistotou říct, že v celkově má mezi podpisy chybovost 20,7 až 21,7 procenta. Neříkáme tedy, že Okamura má reálně 48 829 podpisů, ale že na 95% spolehlivostí získal mezi 48 520 a 49 140 podpisy.  Jinak řečeno, i při tomto úsudku se v jednom z dvaceti případů (oněch 5 % nejistoty) pletu.

Pokud chceme mít větší jistotu, musíme dále rozšiřovat interval, do něhož kandidátův zisk odhadujeme. Například s 99,9% jistotou by šlo usuzovat, že Okamura má ve skutečnosti něco mezi 48 300 a až 49 350 hlasy. Pointa je, že naprosto spolehlivě nejde statisticky vyloučit ani to, že Okamura a Dlouhý hranici 50 000 překonali, ačkoli tomu kontrolní vzorek nenapovídá.

V ideálním případě by měl zákon popisující kontroly stanovit i to, jakou musí mít stát na základě vzorků jistotu, aby mohli kandidáta vyřadit. Či z druhé strany – jak velké riziko, že kandidáta vyřadím neoprávněně, je ještě ústavně přijatelné.

Nyní se i touto úvahou bude muset zabývat soud. V našem případě jde spíš o principiální problém. Lehce si lze ale představit případ z dalších let, kdy úsudek s 95% spolehlivostí kandidáta vyřazuje, zatímco úsudek s 99% spolehlivostí mu přiznává, že 50 000 podpisů mít může.

Náhodný, nebo nenáhodný výběr?

Ještě závažnější problém jsou ale v našem případě konkrétní metody ministerských kontrol. Se statistickou chybou, jak jsem ji popsal výše, totiž lze operovat, kdyby podpisy ke kontrole byly vybrány opravdu náhodným výběrem. 

Statistik Michal Škop z hnutí Kohovolit.eu upozornil[2], že pokud by podpisy byly náhodně vybrány a kontrolovány shodnou metodou, bylo by krajně nepravděpodobné, aby v jednom vzorku u Jany Bobošíkové činila chybovost 7,7 % a v druhém 11,5 %. Na první pohled to možná není velký rozdíl. Pravda ovšem je, že při skutečně náhodném výběru tak velkého vzorku bychom při drtivé většině dvojtestů měli dospět k odchylce o velikosti maximálně 1 %. Podle Škopova propočtu je pravděpodobnost, že bychom se dostali k rozdílu jako u Bobošíkové, menší než jedna ku miliardě.

Je tedy zřejmé, že postup ministerstva obsahuje vlivy, kvůli nimž se nejedná o zcela náhodný výběr podpisů a shodný postup kontrol. Nemusí se přitom jednat o záměrné ovlivnění. Od naprosté regulérnosti vzdalují kontroly podle všeho tyto dvě věci:

Kontrola archů místo podpisů

Ministerstvo ke kontrole náhodně vybíralo celé archy podpisů a nikoli podpisy jednotlivě. Tím se ale právě zmenšuje síla, s jakou kontrola na vzorku vypovídá o celkové skutečné chybovosti. Lze vysvětlit na příkladu.

Dejme tomu, že kandidát by odevzdal podpisy na 100 arších. Na 98 z nich by byly podpisy kompletně v pořádku a na dvou arších od podvodných sběračů byly všechny vymyšlené. Pokud jsou archy stejně velké, má kandidát přesně 2 % chybných podpisů. Náhodný výběr jednotlivých podpisů a jejich kontrola by směřovala k tomuto číslo a náhodně se od něj odchylovala.

A teď si představme, že úředníci ke kontrole nevyberou jednotlivé podpisy, ale celé archy. Otestují třeba 10 ze stovky archů. S odlišnou pravděpodobností se dostanou ke třem výslekům:

a) do kontroly se nedostane ani jeden ze špatných archů – budou odhadovat chybovost 0 %
b) do kontroly se dostane jeden ze špatných archů – budou odhadovat chybovost 10 %
c) do kontroly se dostanou oba špatné archy – budou odhadovat chybovost 20 %

V žádném případě se ale nebudou přibližovat ke skutečné chybovosti 2 %.

Ve skutečnosti vliv není tak extrémní, protože kandidáti měli více než 100 archů a mírou chybovosti se mezi sebou nelišily jako v našem příkladu. Pořád ale platí, že výpovědní síla kontroly je silně omezena tím, že k ní jsou vybírány celé úseky podpisů, které mají něco společného (dělal je jeden sběrač, byly sbírány v jednu dobu, na jednom místě, apod.). To je zřejmě jeden z důvodů, proč se u některých kandidátů výsledky prvního testu a druhého testu natolik liší.

Chybná metoda kontroly duplicit

Druhý a velmi zásadní problém je způsob kontroly duplicit rozhovorů – tedy zda daný člověk nepodepsal petici dvakrát. Hodně duplicitních rozhovorů měla hlavně Jana Bobošíková (celkem 418 v obou vzorcích).

Ministerstvo ve svých reportech píše, že „U ztotožněných záznamů bylo dále ověřováno, zda neexistují duplicitnízáznamy. Pokud ano, byly všechny záznamy s výjimkou jednoho označenyza duplicitní a neověřené.“ Podle všeho tedy byly zkoumány jen duplicity napříč podpisy, které byly vybrány pro kontrolu a nebyly předtím vyřazeny z jiného důvody (např. protože daný člověk neexistuje).

Výpis výsledků u Jany Bobošíkové přitom ukazuje, že při kontrole druhého vzorku kontroloři navíc testovali i duplicitu podpisů oproti již zkontrolovaným podpisům ze vzorku prvního. To vysvětluje, proč například Bobošíková měla v prvním vzorku 81 duplicit a v druhém 337 duplicit. U Okamury to bylo 25 a 55 duplicit, u Dlouhého 21 a 46 duplicit, u Fischera 12 a 32 duplicit, u Zemana 24 a 60 duplicit. Zkrátka – v druhé kontrole bylo duplicit logicky více, protože podpisy byly podle všeho kontrolovány proti zhruba dvojnásobku ostatních podpisů než v první kontrole.

Pokud se někdo zamýšlel, proč je u většiny kandidátů chybovost v druhém vzorku obecně vyšší než v prvním, odpověď musí hledat i zde. Například u Jany Bobošíkové rozdíl v počtu duplicit vysvětluje 3 % z celkových 3,8 %, kterým se lišila chybovost v prvním a druhém vzorku.

Není to přitom nic, z čeho by se kandidáti měli radovat. Pokud by totiž ministerstvo zkontrolovalo podpisy všechny, bylo by pravděpodobně procento duplicit mnohem vyšší – každý podpis by totiž byl porovnáván s mnohem vyšším počtem „konkurenčních“ podpisů. Zejména pro Janu Bobošíkovou to znamená problém. Duplicit má totiž už v kontrolních vzorcích tolik, že při kontrole všech podpisů by ji mohly stát kandidaturu.

Férové řešení: Celková kontrola tří kandidátů

Možných vlivů je samozřejmě více než tyto dva. Už teď je ale jasné, že systematické vychýlení způsobem výběru a metodou kontrol duplicit je takové, že v kombinaci s náhodnou statistickou chybou nelze přinejmenším u Tomia Okamuru, Vladimíra Dlouhého a Jany Bobošíkové seriózně odhadovat, zda ve skutečnosti 50 000 podpisů mají či ne.

Je pravděpodobné, že reálně sebrali něco mezi 45 000 a 52 000 platnými podpisy. Kolik přesně to je, by ale před kontrolou všech podpisů neodhadl ani americký genius volebních predikcí Nate Silver.[3]

Proto si myslím, že pokud správní či ústavní soud nebudou zkoumat jen formální naplnění prováděcího zákona (průměrovat místo sčítat), logika věci a spravedlnost velí, že minimálně u třech hraničních a vyloučených kandidátů (Bobošíková, Dlouhý, Okamura) by měl soud nařídit přezkum všech dodaných podpisů.

Komentář vyšel také na serveru iDNES.cz

[1] http://zpravy.idnes.cz/reakce-vyrazenych-kandidatu-na-funkci-prezidenta-f7k-/domaci.aspx?c=A121123_150530_domaci_kop

[2] http://blog.aktualne.centrum.cz/blogy/michal-skop.php?itemid=18241

[3] http://zpravy.idnes.cz/volba-americkeho-prezidenta-obama-a-romney-fj7-/zahranicni.aspx?c=A121107_121914_zahranicni_jav