Más anomalí­as estadí­sticas de los resultados oficiales

Traduzco y reproduzco a continuación un artí­culo escrito por Miguel de Icaza en su blog personal, titulado simplemente Mexican elections.

México sigue sin tener un presidente electo. En los últimos dí­as, varios problemas se han hecho evidentes respecto a la elección.
Mi amigo Raymond hizo primero unas pruebas básicas de integridad sobre de los resultados publicados. La idea fue sumar el total de votos en cada casilla (válidos e inválidos) y contar para verificar si estos cuadraban con el total de votos que podí­an haber sido emitidos.
Encontró que los resultados no cuadraban. Esto es malo, puede ser porque alguien hizo trampa, o porque el total de nuestro paí­s no sabe contar. Hay errores aritméticos de este tipo en cerca de la mitad de las casillas electorales del paí­s.
Esta manipulación, creemos, ocurre cuando los votos registrados en las actas oficiales no concuerda con los votos que fueron contados en cada una de las casillas.
Ahora bien, sin ser un testigo de los recuentos, hay bastantes anomalí­as estadí­sticas que apuntan hacia este tipo de manipulación.
En algunos de los distritos impugnados (del total de 300), la participación en las votaciones no sólamente llegaba al 70%, sino que subí­a hasta un 142% (Chihuahua), 147% (Durango), 139% (Chiapas), 167% (Coahuila), 177% (Tamaulipas), etcétera.
Aquí­ tenemos disponible una lista. La democracia en México es muy inclusiva.
La gráfica a continuación muestra en el eje horizontal el número de votos emitidos por localidad. El eje vertical muestra el número de casillas que obtuvo ese resultado para cada uno de los partidos. Suavicé los resultados, mostrando 10 votos por incremento. Aquí­ están los resultados de la Ciudad de México:

Cada lí­nea de color representa los votos emitidos para cada partido. Estas curvas siguen una distribución normal para la población votante. Este patrón se repite en las ciudades o localidades donde la competencia fue bien monitoreada.
Pero trazando los resultados de algunos de los estados con más impugnaciones, los estados problemáticos, encontramos que hubo algún tipo de fraude. No es visible al ojo desnudo, pero a través de SQL, awk, un script en Perl y Gnuplot:

Esto es para el Estado de Durango. La manipulación es realmente obvia, hay una importante cantidad de votos artificialmente desinflados o anulados. Esa es la razón por la que la lí­nea roja, que representa al PRD, presenta este comportamiento increí­ble para una distribución normal.
En la elección de 1988, en vez de desinflar votos, los inflaron, por lo que la distribución normal era prácticamente un espejo de esta (pero para el partido ganador).
El problema con estas curvas es que, sin abrir los paquetes electorales, no es posible determinar el número real de votos emitidos. Sabemos únicamente que hubo una modificación, pero los resultados reales podrí­an alterar significativamente las curvas.
El resultado de estas gráficas está respaldado por el resultado de los paquetes que fueron abiertos. Todos los paquetes que fueron abiertos de manera aleatoria en estos distritos muestran que hay votos faltantes para el PRD. 4,000 aquí­, 20,000 allá, y de repente la diferencia de 250,000 votos (el 0.5%) entre los candidatos comienza a reducirse.
La apertura de paquetes y los eventos que fueron reportados en la prensa la semana pasada (apertura ilegal, puesto que no hay aún una resolución permitiendo realizarla, o material electoral que ha sido encontrado en basureros) confirma lo que puede ser identificado a través de un par de comandos de SQL. Estos han sido documentados en otros lugares.
Ahora, esta manipulación no sólo afecta a un partido, los afecta a todos. Sin un conteo centralizado y monitoreado, va a ser difí­cil determinar los verdaderos resultados de la elección.
Aquí­ están los datos en crudo.
Este sitio Web es un wiki con algunos otros estudios sobre los estudios oficiales. Las gráficas resultantes completas (suavizadas y sin suavizar), así­ como los datos para generarlas, están disponibles aquí­.
Violaciones a la ley
Además de modificar los resultados, hay otros puntos por los que se han presentado impugnaciones. Por un lado, al presidente Fox le está prohibido por ley apoyar al candidato de su partido, pero ignoró este requisito y siguió utilizando su cargo de presidente para impulsarlo.
Una buena cantidad de anuncios fantasma aparecieron durante el periodo de silencio que precede a la elección, contratados por organizaciones fantasmas para infundir miedo a la población. Estos tuvieron el efecto que documenté en mi nota anterior.
Aunque la campaña de odio/miedo a fin de cuentas fue calificada como ilegal, fue demasiado poco y demasiado tarde. Para cuando los tribunales fallaron en su contra, los anuncions habí­an ya estado al aire por cinco semanas. Y fueron prontamente reemplazados por otros anuncios que impulsaban el odio y el miedo que tuvieron que pasar por el mismo proceso judicial antes de que fueran retirados.

Varias personas hemos hecho pequeños análisis estadí­sticos sobre la base de datos buscando irregularidades que reportar. Sin mayor conocimiento en la materia, me asomé a ve la distribución de votos nulos sobre del total de casillas - Y me encontré con otro resultado que difí­cilmente verí­amos si no es a través de una gráfica: En el eje horizontal, todas las casillas que tuvieron votos nulos (elimino las que tuvieron 0, obviamente, para impedir divisiones sobre cero). En el eje vertical, el porcentaje de nulos con respecto a la votación total. Corté esta gráfica al 20%, pues arriba de esta cifra la densidad baja fuertemente y nos impedirí­a ver información importante. Deberí­a registrar un bonito ruido blanco - pero hay lí­neas verticales muy claras:

Claro, antes de nada más, toca averiguar qué significa esta distribución, a qué regiones geográficas corresponde, y a qué hechos puede esto apuntar... Pero puede también apuntar en el sentido correcto.