Le datajournalisme ou comment raconter une histoire avec des chiffres

163

Vendredi 19 novembre, le club a organisé dans les locaux de l’ESA une formation autour du datajournalisme animée par Pierre Girardeau, mathématicien et data scientist. Une première approche de deux heures qui pourrait en appeler une autre plus approfondie.

Depuis quelques années, on entend beaucoup parler de datajournalisme ou journalisme de données. Mais concrètement, qu’est-ce que cela signifie ? « Le journalisme de données c’est finalement raconter une histoire avec des chiffres. Toutes sortes de données sont désormais accessibles librement sur internet. En France, la loi Lemaire du 7 octobre 2016 pour une République numérique a été un tournant puisqu’elle a obligé l’Etat à rendre toutes ses données publiques. De plus, on a désormais les outils informatiques pour les exploiter et les diffuser très facilement », explique Pierre Girardeau, data scientist au sein de la startup angevine Cross Data.

Les grands journaux américains comme le New York Times, le Washington Post ou encore le quotidien britannique The Guardian ont été des pionniers du datajournalisme. Ils ont créé il y a déjà plusieurs années des départements dédiés. En France, Mediapart s’est récemment associé à WeDoData pour recenser le nombre et la nature des blessures causées par les violences policières pendant les manifestations des gilets jaunes (« Allô place Beauvau ? »).

Data.gouv.fr, data.angers.fr: des mines d’informations

Parmi les sources les plus connues et les plus utiles, il y a le site les données ouvertes de la Banque mondiale, qui offre un accès libre et gratuit à une multitude de statistiques sur le développement dans le monde. En France, data.gouv.fr rassemble l’ensemble des données publiques françaises (finances, santé, logement, emploi…), soit près de 40 000 jeux de données avec par exemple les résultats de toutes les élections locales et nationales, des cartes du développement de la fibre, l’évolution des prix de l’immobilier… On peut télécharger toutes ces données sans restriction de droits. Au niveau local, data.angers.fr est également une mine d’informations avec par exemple la position des bus en temps réel.

Une fois qu’on a récupéré les données qui nous intéressent, qui constitueront la matière première de notre article, encore faut-il avoir les bon logiciel pour les exploiter. Outre l’incontournable Excel, on peut citer Power BI Desktop (Microsoft) ou encore Tableau (plus joli et simple d’utilisation mais l’abonnement coûte 70 euros par mois). Il existe des dizaines de tutoriels sur YouTube (Microsoft a même sa propre chaîne) pour apprendre à apprivoiser puis maîtriser ces outils. « On peut être vite happés par la masse de données que l’on a devant soi. Mais comme lorsqu’on prépare un article « classique », il faut toujours bien vérifier les sources des données, qu’elles soient privées ou publiques. Il faut aussi faire attention aux éventuels biais et aux conclusions hâtives », résume Pierre Girardeau.

Article précédentRadio Campus Angers diffuse des ondes positives
Article suivantInfoscope, un média d’investigation engagé