Analyse de l’audience d’un site ou application web

Connaître ses visiteurs est la clé du succès. Voici quelques alternatives open source aux célèbres Google Analytics et Urchin.

Que ce soit pour obtenir des indicateurs marketing sur un site Internet ou pour collecter les habitudes d’utilisation d’une application intranet, il est indispensable de connaître ses visiteurs. Le fait de savoir quelles sont les pages les plus visitées n’est pas suffisant. Il existe différents outils Internet pour analyser l’audience d’un site web (Google Analytics est le plus célèbre), mais nous nous intéresserons à des outils que vous pourrez exploiter même en restant confinés dans le réseau de votre entreprise.

Dans le cadre de mes prestations de conseil en performance applicative, je demande toujours à mes interlocuteurs beaucoup de détails sur les habitudes d’utilisation de l’application (durée moyenne d’une visite, parcours typiques, nombre de pages vues,…).

Voici trois outils pour vous aider à mieux connaître vos utilisateurs. Bien sûr, la liste n’est pas exhaustive. On les classera en trois catégories (nous n’aborderons pas la troisième, cette technologie étant trop liée à la filière technologique de l’application supervisée et, à mon avis, en voie de disparition) :

  1. Les analyseurs de logs.
  2. Les espions Javascript.
  3. Les outils intégrés. C’était auparavant le cas de Piwik dans ses versions précédentes (lorsqu’il s’appelait phpMyVisites). Il s’agissait de faire appel à l’outil d’analyse par des appels dans le code de l’application à superviser.

Les analyseurs de logs

Le principe est simple : lorsque les fichiers de log dits « d’accès » sont activés, les serveurs Web (Apache, IIS, …) produisent une ligne à chaque accès. Par exemple, lorsqu’un visiteur demande une page quelconque, le serveur pourra inscrire dans le fichier de log des informations telles que l’adresse IP, l’heure d’accès, un identifiant de session, le référant (le site qui contenait un lien vers votre site sur lequel le visiteur aurait cliqué).

Ces fichiers sont traités par les outils d’analyse de log afin de produire graphiques et tableaux statistiques sur les accès et les habitudes de vos utilisateurs.

Avantages et Inconvénients

Ces outils ne nécessitent pas de modification du code de l’application à superviser. Et l’installation est facile.

L’inconvénient d’un outil tel qu’AWStats est qu’il est statique. On regrette l’impossibilité de filtrer et trier dynamiquement les informations comme on peut le faire avec les deux autres outils présentés dans la suite de cet article. Il n’y a pas de possibilité de créer un dashboard comme avec Piwik et ses Widgets.

L’autre inconvénient est qu’il n’est pas possible de faire remonter des informations dynamiques issues du client comme peuvent le faire Google Analytics ou Piwik avec le mécanisme des variables personnalisées.

Outil AWStats

AWStats est le concurrent de l’utilitaire payant Sawmill Analytics. Il est plus complet que les logiciels open source Analog (dernière version en 2005) et Webalizer qui sont tous les deux en très nette perte de vitesse.

Divers formats de log sont supportés : Apache (NCSA +/XLF/ELF ou format CLF), WebStar, IIS (log au format W3C), … ainsi que d’autres types de serveur (proxy, wap, streaming, mail et certains serveurs ftp).

Des plug-ins existent comme ceux permettant d’ajouter des informations sur la géolocalisation.

awstats_page_exemple

Exemple de rapport AWStats

Page Officielle : http://awstats.sourceforge.net/

Démo : http://www.nltechno.com/awstats/awstats.pl?config=destailleur.fr

Le cas Tomcat (et log4j)

Une application Tomcat pourrait faire l’objet d’analyse avec un outil tel que AWStats. On m’a dit un jour que log4j pourrait être utilisé à cet effet, quitte à enrichir les logs de manière à avoir plus d’information. Cependant, il y a deux objections qui peuvent y être opposées :

  • Log4j est implémenté à la discrétion des développeurs et donc pas forcément systématique. La mise en oeuvre sur une application existante peut être longue et risque d’avoir des impacts sur le code.
  • La partie logicielle de consultation des statistiques reste à construire (à comparer objectivement avec ce que permettent de faire les outils présentés dans ce billet).

Les espions Javascript

Le principe est d’insérer quelques lignes de code dans votre application. À chaque appel de page, ce bout de code enverra un message vers le serveur de statistique Piwik afin de comptabiliser la visite et de collecter des informations supplémentaires. Si le serveur de statistique est une machine autre que celle qui héberge votre application supervisée, l’impact sur ses performances sera nul puisque l’appel au serveur Piwik se fait à l’initiative du client. Bien sûr, si le but est de surveiller une application intranet, il ne faut pas que vos collaborateurs aient installé une application de type protection de la vie privée sur Internet, car ces applications bloquent le fonctionnement d’un tel code Javascript et elles fausseront vos statistiques.

schema_principe_fonctionnement_piwik

Principe de fonctionnement de Piwik

Avantages et Inconvénients

L’inconvénient est qu’il faut modifier les pages web afin d’y coller un petit bout de code JavaScript. Cependant cette difficulté est facilement surmontable si vous avez un fichier include commun à toutes les pages Web de votre application.

Outil Piwik

Piwik est une version majeure de phpMyVisit, mais qui a tellement remanié l’outil que les développeurs ont décidé de changer le nom du projet. Le projet bénéficie d’une importante communauté qui fournit plug-ins et assistance. On aime la possibilité de créer un tableau de bord avec des Widgets en tant que page d’accueil. Ainsi que les possibilités avancées de configuration (filtres, tri et personnalisation).

Sachez qu’il existe un outil qui permettrait de migrer les données de son compte Google Analytics vers Piwik par l’intermédiaire de l’API Google.

piwik_page_exemple

Exemple de dashboard Piwik

Page Officielle : http://fr.piwik.org/

Démo : http://demo.piwik.org/

Outil Open Web Analytics (OWA)

OWA se pose en concurrent de Piwik et Google Analytics dont il essaye de calquer les fonctionnalités. L’auteur maintient une page de comparaison avec ces deux autres projets.

Un projet encore en cours de développement qui me semble avoir un très fort potentiel. J’espère que la communauté autour de ce projet grandira afin d’épauler l’auteur.

owa_open_web_analytics_page_exemple

Exemple de dashboard avec OWA

Page Officielle : http://www.openwebanalytics.com/

Démo : http://demo.openwebanalytics.com/

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *