Regular (de una buena vez) a los encuestadores

8 de marzo de 2011

Falta poco más de un año para la primera vuelta de las elecciones presidenciales. Primero todas las semanas y después todos los días, nos van a saturar con encuestas sobre las intenciones de voto. Cada hecho o gesto de los candidatos será interpretado con esa vara. El problema es que, a pesar del tremendo error de 2002 (nadie predijo que el Frente Nacional pasaría a la segunda vuelta en lugar de Jospin), las encuestas siguen sin ser reguladas como deberían serlo. En términos generales, todo el mundo puede publicar las cifras que quiere, sin exhibir los márgenes de error y aún menos los «secretos de fabricación».

Si los legisladores asumen el desafío, la buena noticia sería que llegó la hora de reforzar la ley sobre las encuestas y la comisión parlamentaria que se ocupa de este tema. La primera modificación que se impone es la de obligar a las encuestadoras y a los medios a publicar los intervalos de confianza y ya no una única cifra por candidato.

Tomemos como ejemplo un caso típico de una encuesta basada en una muestra inicial de 1000 personas, con un porcentaje de respuesta del 70% a la pregunta sobre las intenciones de voto (es decir, 700 respuestas utilizables). Imaginemos el caso más favorable para los encuestadores, y lamentablemente demasiado optimista, de una muestra perfectamente representativa de la población francesa, sin ninguna complicación en las respuestas. Un cálculo de estadística elemental muestra que el intervalo de confianza asociado a tal encuesta es del orden del 4%.

Dicho de otro modo, si el candidato A obtiene un resultado del 51% en la segunda vuelta, entonces el intervalo de confianza es igual a [49-53%]. Esto significa que existe un 90% de posibilidades de que el «verdadero» resultado (es decir, el resultado obtenido si se hubiera sondeado al conjunto de la población) esté comprendido en el intervalo [49-53%], y 10% de posibilidades de que esté por fuera de este intervalo. Inversamente, para el candidato B, que obtiene un resultado del 49% en la encuesta, el intervalo de confianza es igual a [47-51%].

Con la nueva ley, los institutos y los medios estarían obligados a publicar los dos intervalos [49-53%] y [47-51%] para los candidatos A y B (y ya no las cifras 51%, 49%). Se puede constatar así que los intervalos se entremezclan, y que la encuesta finalmente no nos dice casi nada que sea confiable. Esto va mucho más allá del reproche habitual según el cual los sondeos son solo una «fotografía» de la opinión en un instante dado. El hecho es que incluso si los electores no cambiaran de opinión, la encuesta no sería creíble.

Publicar un intervalo de confianza para cada candidato tendría un doble interés. Primero, uno se daría cuenta de que la mayoría de las distancias entre candidatos no son estadísticamente significativas. En particular, en el caso de la encuesta publicada el fin de semana pasado que ubicaba a Marine Le Pen con el 23%, delante de Martine Aubry y Nicolas Sarkozy —igualados, ambos con el 21%—, es probable que todos los intervalos de confianza se solapen (¡para estos candidatos como para cualquiera de los candidatos socialistas!). Dicho de otro modo, todo es posible y es hora de concentrarse en las ideas y los programas, más que en esperar las encuestas que reemplazan el debate democrático.

El segundo interés de una ley como esta es que obligaría por fin a las encuestadoras a divulgar los métodos estadísticos que utilizan para obtener los datos brutos. Las técnicas de obtención no son ilegítimas en sí: si se observa que las personas que anuncian un voto al Frente Nacional (FN) a los encuestadores son sistemáticamente dos veces menos numerosas que los electores del FN el día del voto, entonces se justifica multiplicar por dos el resultado del FN en el sondeo. El problema es que estos coeficientes de obtención varían enormemente a lo largo del tiempo y según las encuestas, y los institutos se obstinan en negarse a hacer público lo que consideran su «secreto de fábrica».

Una charlatanería como esta no puede continuar. Podemos aceptar el argumento de que publicar las cifras brutas en los medios al mismo tiempo que las cifras promedio podría generar confusión y que la exposición completa de los métodos de obtención no puede hacerse en pocas líneas. Pero es necesario, como mínimo, obligar a los encuestadores a subir a la web todos los detalles de las cifras brutas y los métodos estadísticos utilizados. Por otra parte, es indispensable que el cálculo de los intervalos de confianza tome correctamente en cuenta todos los márgenes de error, y que sea posible verificarlo públicamente. Y es aún más importante porque las diferentes técnicas de obtención pueden modificar mucho los intervalos de confianza señalados más arriba.

Para terminar, el efecto de una ley de este tipo sería incitar a los encuestadores y a los medios a publicar menos encuestas y a argumentar su fiabilidad. Por ejemplo, al dividir por 5 la cantidad de encuestas, y si multiplicamos por 5 el tamaño de las muestras utilizadas (de 1000 a 5000 personas), los márgenes de error serían 3 veces menores. El debate público ganaría así en calidad y los encuestadores serían más creíbles.