Voici comment le « Do Not Track » peut nuire aux statistiques de votre site

Comme plusieurs de mes confrères, je suis avec attention l’évolution des nombreux débats entourant la protection de la vie privée des internautes, pour la simple et bonne raison que ceux-ci ont le potentiel d’impacter notre travail à titre de spécialistes du web. L’un des exemples les plus discutés dans les communautés est sans contredit le fameux « not provided », alors que les mots-clés utilisés sur les moteurs de recherche sont maintenant dissimulés. Le « Do Not Track » (DNT) est un autre projet relatif à la confidentialité en ligne qui mérite d’être suivi, puisqu’il touche directement l’analyse comportementale des internautes. En effet, le « Do Not Track  a le pouvoir d’aller bien plus loin que l’obstruction des mots-clés, par exemple en empêchant les visiteurs d’être comptabilisés dans les statistiques analytiques d’un site internet. Chez Absolunet, j’ai récemment vécu une situation impliquant le DNT ainsi que l’un des sites de nos clients, et j’ai été estomaqué de constater la puissance du « Do Not Track » dans un cas réel, et surtout son impact potentiel sur la collecte des données analytiques. Aujourd’hui sur ce blogue, je vous partagerai mon expérience vis-à-vis le « Do Not Track », afin de vous aider à diagnostiquer rapidement cette situation si jamais vous la viviez à votre tour.

Le Do Not Track : Un projet ambitieux, encore loin d’être réalisé

Le projet « Do Not Track » remonte à 2009, à l’origine lancée par trois chercheurs, soit  Christopher Soghoian, Sid Stamm et Dan Kaminsky. Le DNT est en fait un « opt out » soit un dispositif anti-suivi qui est transmis via les requêtes HTTP échangées entre le fureteur web d’un internaute et le serveur du site internet qu’il visite. Lors du transfert HTTP entre le fureteur et le serveur, le « do not track » lorsqu’activé transmet la valeur « 1 », ce qui signifie que l’utilisateur ne désire pas être suivi lors de sa visite sur le site.  Même si les internautes désirant l’anonymat en ligne seront intéressés à la lecture de ces lignes, il faut malheureusement comprendre que le DNT est encore loin de faire l’unanimité. En effet, pour que le DNT fonctionne, soit empêche le suivi et/ou collecte de données des utilisateurs, il faut impérativement que le serveur à l’autre bout de la connexion accepte votre requête de ne pas être suivie. Et à ce sujet, peu nombreux sont les sites web qui respectent le DNT, ce qui fait en sorte que le projet du « Do Not Track » reste justement… un beau projet. L’objectif pour les trois fondateurs du DNT, est de faire en sorte que celui-ci devienne un jour un standard du web. À ce jour, parmi les sites respectant le DNT, on y retrouve Twitter, Piwik, et comme on le verra tantôt, Drupal.

Une drôle de variation

Cette présentation du « Do Not Track » maintenant faite, revenons à nos moutons. Donc il y a deux semaines, nous mettions en ligne le site d’une entreprise multinationale offrant un produit destiné aux professionnels des technologies de l’information. Si chaque refonte et mise ligne d’un site internet peut réserver son lot de surprises, celle-ci s’est bien déroulée, et après quelques journées de suivi très serré des statistiques du site, je suis très près de dire mission accomplie, cependant à une exception près. Bizarrement, la proportion de visiteurs utilisant Internet Explorer (oui, cela existe encore), a chuté de près de 50%, passant de 33,5% à 18%, et cela d’une semaine à l’autre suivant la mise en ligne du site. Avant : do not track 1 Après : do not track 2 La surprise n’est pas de constater qu’une aussi forte proportion des internautes utilise Internet Explorer, mais combien celle-ci a changé en l’espace d’une refonte du même site, avec les mêmes produits. Et encore plus surprenant, en analysant les différentes versions de IE utilisées par les visiteurs, je remarque que la version 10 d’Explorer n’apparaît presque plus dans les statistiques du site. De plus, pour tous les visiteurs utilisant IE, uniquement 2,32% ont la version 10, pourtant l’une des plus répandues. do not track 32 Évidemment, il est facile de constater que quelque chose cloche, et je me dois d’enquêter sur la situation. Mes deux points de départ sont les deux facteurs à l’origine du mystère : la plateforme du site, Drupal, qui demeure l’unique changement technologique dans la mise en ligne du site, ainsi que la version de IE qui apparaît fautive, soit IE10.

Une configuration extra-agressive de Drupal

Alors que mon collègue développeur scrutait la configuration du site Drupal, et particulièrement les modules installés pour le site du client, j’effectue mes recherches concernant Internet Explorer 10. Rapidement, je découvre qu’Internet Explorer 10 est le premier fureteur à forcer le « Do Not Track » par défaut, dès son installation. Cela veut dire que les internautes, dès qu’ils lancent Internet Explorer 10 pour la première fois, sont automatiquement en mode « Do Not Track ». Il est bien sûr possible de désactiver ce paramètre, mais encore faut-il que les utilisateurs soient au courant, ce dont je doute fortement. Comme je mentionnais plus haut, pour que le DNT soit appliqué, il faut que le site web visité respecte et honore votre demande de ne pas être suivi. Dans tous les cas, j’avais au minimum une piste solide pour la suite de mon enquête. Ayant rapporté ma trouvaille à mon développeur, nous trouvons conséquemment très rapidement la réponse à notre problème de mesure des utilisateurs sur IE. Dans Drupal, suite à l’installation du module de Google Analytics, nous remarquons un paramètre activé indiquant « Universal web tracking opt-out » : do not track 4   Ainsi, ce paramètre, lorsqu’activé, signifie que le site Drupal de mon client respectera la demande « Do Not Track » d’un visiteur, et n’affichera pas le code Google Analytics dans la source du site. Le calcul est donc fort simple : avec ce paramètre activé, tout visiteur DNT ne sera pas comptabilisé dans Google Analytics, par exemple les visiteurs sous IE10, comme l’indiquent mes rapports de statistiques ici haut. Voici un exemple du fichier source du site de mon client, avec un autre fureteur que IE 10 : do not track 5 On voit sans problème la puce Google Analytics à la ligne 67 et 68, qui vient comptabiliser ce visiteur. On refait maintenant le même exercice avec IE10 et le fameux « Do Not Track », et je rafraîchis la page. Surprise : do not track 6 Et oui, le code Google Analytics est disparu, puisque le site a honoré ma demande de ne pas être suivi, via le « Do Not Track ». Il fallait quand même le savoir, n’est-ce pas ;-) Maintenant la question est de savoir si cette même situation peut affecter d’autres sites.

Problèmes à venir pour l’analyse en ligne ?

À travers mes recherches en ligne, je n’ai pas réussi à trouver beaucoup d’information sur les autres plateformes CMS qui respectent le DNT. Je n’ai pas réussi à déterminer si WordPress le respecte, même chose pour Magento. On dirait que la plupart des entreprises du web ne souhaitent tout simplement pas participer au débat, et demeure silencieux sur la question. Du côté des fureteurs, ceux-ci sont nettement plus actifs sur le volet du « Do Not Track ». Mozilla fut d’ailleurs le premier à mettre l’option disponible sous le fureteur Firefox, un an avant qu’Internet Explorer force l’option par défaut sous sa version 10. Chrome et Safari ont depuis rejoint la dance, à contrecoeur. Bien sûr, le « Do Not Track » a le potentiel de jouer un impact majeur sur l’analyse des mesures en ligne, que ce soit avec Google Analytics ou autres. En effet, si la plupart des fureteurs activent l’option par défaut, et que la majorité des plateformes web décident de respecter le paramètre, les webmestres qui analysent le comportent de leurs visiteurs en ligne seront dans de beaux draps, alors que de nombreux visiteurs disparaîtront des rapports analytiques. Il s’agit possiblement d’un rêve pour la plupart des défendeurs de l’anonymat en ligne et du respect de la vie privée sur internet. Cependant, pour nous, spécialistes du marketing en ligne, une généralisation du « Do Not Track » a  de quoi hanter les rêves de plusieurs d’entre nous. PS : Pour les intéressés, voici deux excellents articles sur le sujet : http://assiste.free.fr/Assiste/Do_Not_Track.html (article en FR qui explique le DNT) http://donottrack.us/ (site du projet DNT, qui explique le fonctionnement ainsi qu’un test de votre fureteur.)

Vous avez apprécié cet article ?

Inscrivez­-vous à l’infolettre DCHQ afin de recevoir en primeur les derniers articles de ce blogue.

5 Comments

  1. Bel exemple d’article qui sort du lot ! Ça fait tout à fait parti des sujets auxquels on a pensé un jour et qu’on s’est empressé d’oublier, avec l’espoir qu’il ne fut qu’un mauvais rêve… Sans doute le genre de sujet auquel on doit de temps en temps un réveil inopiné et incompréhensible en plein milieu de la nuit ?
    En tout cas, merci de cette largesse et de toutes ces précisions. Si le DNT devait prendre de l’ampleur, j’imagine qu’il ne resterait que la lecture et l’analyse des logs… Et les sondages en ligne… Mais je suis presque sûr que des spécialistes sauront partager leur alternatives. A moins que… ;o)

    Répondre
  2. Un constat très intéressant, cependant alarmant. Nous utilisons également Drupal pour notre propose site et nous avions remarqué une perturbation des statistiques avec le module Google Analytics de Drupal (nous en avions même désactivé ce module au profit du code en dur), cependant votre analyse est consternante, nous n’avions pas poussé l’analyse jusque là. Je relaie l’information sur notre blog d’ici peu. Joshua

    Répondre
  3. J’aime beaucoup Dan Kaminsky. Merci pour ces précisions sur le DNT. Bien écrit ! Cordialement, un ardent défenseur.

    Répondre

Laissez un commentaire