LA COURSE A LA MAISON BLANCHE

Les concurrents

Barack Obama

Joe Biden

John McCain

Sarah Palin

Bob Barr

Ralph Nader

Hillary Clinton

Bush & Co.


Les commentateurs

En un coup d'oeil

Les méthodes

Les sondeurs

Les moyenneurs

Electoral-vote.com

538.com

Les marchés prédictifs

    Les écarts

Utiliser des sondages correctement lors d'une élection semble être hors de portée d'un journaliste lambda.  Si certains détails demandent des connaissances mathématiques assez poussés, en général un peu de bon sens suffit à comprendre beaucoup de choses.

Je présente en page d'accueil trois sites de prédiction de résultats, basés plus ou moins directement sur les sondages. Je vais ici expliquer brièvement la méthodologie que ceux-ci, ou d'autres utilisent. Il est en général préférable de comprendre le fonctionnement de l'élection générale, et ce que sont les grands électeurs. Voyons les méthodologies des plus simples aux plus complexes.

Les sondeurs

Régulièrement, les instituts de sondage (Gallup, Rasmussen, Zogby, SurveyUSA, ...), indépendamment ou pour des grands médias, donnent des sondages nationaux, comme en France ou ailleurs. Ces sondages sont ceux réellement commentés par la presse nationale. Ils ont l'avantage d'être simples et globaux, mais c'est aussi leurs inconvénients : ils sont trop variables et ne peuvent pas représenter la complexité du scrutin américain. 

La variabilité est intrinsèque à la notion de sondage : quand on contacte un groupe de gens, on n'a aucune garantie qu'ils pensent comme la population dans son ensemble. Plus l'échantillon interrogé est grand, plus c'est vraisemblable, mais sans être jamais certain. Il y a beaucoup de chance pour que le vrai chiffre soit proche de l'estimation, et très peu qu'il en soit éloigné, sans être jamais nul. Prenons l'exemple de l'image suivante.

Bell

Si d'après un sondage 50 % d'un échantillon (trait vertical fin) a une opinion, cette valeur est différente pour la population totale. La courbe bleue représente la probabilité qu'un certain pourcentage de la population ait cette opinion. Elle est maximale pour 50 %, la valeur donnée pour l'échantillon, mais reste très importante, dans ce cas, entre 48 et 52 %.  Le sondeur pourra dire qu'il y a une très forte probabilité (souvent 95 %) que le résultat soit compris entre 48 et 52 %, ou plus simplement que c'est 50 %, avec un intervalle de confiance, ou une marge d'erreur, de plus ou moins 2 %. 

En France, l'intervalle est en général ignoré, et on traite un écart de 0,5 % comme s'il était absolu et significatif d'un mouvement de l'opinion publique. En Amérique, on surestime souvent son importance, en affirmant que chaque écart ente deux candidats inférieur à l'intervalle de confiance représente un match nul. En règle générale, les résultats des élections montrent que ces intervalles de confiance sont sous-estimés par les sondeurs (et je ne rentrerai même pas ici sur les problèmes d'échantillonnage ou de redressement).

Les sondages sur les élections ont donc tendance en général à se promener un peu. L'avance d'Obama en juin est estimée entre 0 et 15 % par exemple. Encore une fois, il est tout à fait normal que les sondages se baladent. Il faut juste les évaluer les uns par rapport aux autres, et voir comment ils évoluent dans le temps. C'est en gros le but des sites moyennant les sondages. 

Les moyenneurs de sondages

Certains sites, en particulier realclearpolitics et pollster, ou CNN et son "poll of polls", accumulent les sondages et établissent une moyenne. Bien que cela réponde en partie au problème de la dispersion, les différences de traitement, de taille d'échantillons, de méthode, etc., rendent malades certains sondeurs, pour qui cela revient à ajouter torchons, chiffons, serviettes, et diviser par le nombre de femmes de ménage. Ils n'aident pas non plus à différencier l'opinion nationale et  le nombre de grands électeurs.

Electoral-vote.com

Ce site est le premier qui m'ait vraiment permis, il a des années de cela, de suivre et comprendre ce qui se passait lors d'élections présidentielles américaines. En dehors de ses informations, il présente en page d'accueil une carte des USA. Plutôt que de s'intéresser aux sondages nationaux, il relève les plus récents sondages effectués dans chaque état et calcule le nombre de grands électeurs qu'ils représentent. Il effectue la même chose pour les autres élections de cet automne, celles du Sénat et de la chambre des représentants.

Voici la carte actualisée, cliquez-la pour aller sur le site. Les chiffres sont en bleu ceux des démocrates, en rouge ceux des républicains. EV signifie electoral votes ou grands électeurs, Sen et HR représentent le nombre de sièges au Sénat et à la chambre des représentants.

Click for www.electoral-vote.com

D'autres sites que je connais beaucoup moins offrent le même genre de cartes, comme electionprojection.com, un site très pro-républicain, 270towin.com ou federalreview.com. Contrairement à electoral-vote.com que je recommande vivement, je ne les connais pas assez pour donner un avis dans un sens ou dans un autre.

fivethirtyeight.com

Le principe de base de Nate Silver, le créateur du site, est le même que le précédent, mais il a ajouté des sophistications assez phénoménales. A tout point de vue, c'est une nouvelle manière d'envisager les sondages pour un usage politique. Il a été lors des primaires assez couramment meilleur que les instituts de sondage classiques pour prédire les résultats.

Nate a ajouté plusieurs développements considérables à la carte d'electoral-vote. Voici les plus importants, du moins ce que j'en ai compris...

- Il établit dans chaque état une moyenne des sondages, assez similaire à ce que font les moyenneurs nationaux.

- Il relie les résultats des sondages à la composition politique, démographie et socio-économique de chaque état, ce qui lui permet par la suite de prédire un résultat même lorsqu'aucun sondage récent n'est disponible. Par exemple, après un sondage en Dakota du Nord est paru, il en déduit également de nouvelles données pour le Dakota du Sud, ou d'autres états de population similaire. L'ensemble des sondages et de sa corrélation personnelle  lui permet d'estimer un pourcentage de chance de victoire pour Obama et McCain dans chaque état.

- 51 votes le même jour, chacun représentant un nombre différent de grands électeurs, avec un probabilité donnée de tourner à l'avantage de chaque candidat : quel est le résultat final ? Nate fait chaque jour 10000 élections théoriques aléatoires, de manière à ce que le nombre de victoires dans chaque état corresponde à la probabilité estimée, lui donnent 10000 vainqueurs, avec 10000 caractéristiques différentes, ce qui lui permet de donner une probabilité de victoire pour chaque candidat, et d'apprendre un grand nombre d'éléments importants. Quels sont les états les plus critiques, ceux où les ressources financières devraient se porter, ceux où l'un des candidats n'a aucune chance, ...

Au fait, 538, c'est le nombre total de grands électeurs.

Les marchés prédictifs

Les marchés prédictifs sont très différents des sondages classiques, mais peuvent prédire aussi bien les résultats. Plutôt que demander aux gens pour qui ils vont voter, on leur demande qui ils pensent qu'ils vont gagner, en l'organisant à la manière de la bourse. On peut ainsi acheter une action "Obama sera président", ou une action "Bob Barr va être président". L'une comme l'autre sera vendue à un prix arbitraire de 100 si l'événement se réalise, 0 sinon. Plus on est sûr que l'événement va se réaliser, plus on peut se permettre d'acheter l'action à un prix élevé. Une action Obama pour un prix de 30 serait donc aujourd'hui une très bonne affaire, une Barr à 30 une très mauvaise.  C'est la "sagesse populaire" qui va ainsi fixer le prix d'une action, qui correspond à la probabilité estimée par le marché que l'événement se réalise.

On peut remarquer, au moment où j'écris ces lignes (15/07), que les probabilités estimées par ces marchés et par 538.com sont très proches, entre 60 et 70 %.

Voici les probabilités estimées par deux marchés prédictifs (deux candidats ou partis seulement), Intrade et Newsfuture, mis à jour quotidiennement.