Skip to main content
Fallback image

Un accro de l'ITIE parle de données ouvertes

Au cours des six derniers mois, ma tâche a consisté principalement à travailler sur des données de l'ITIE. Je suppose qu'on peut me considérer comme un accro de l'ITIE. J'ai prêté assistance au Secrétariat sur le long chemin versl'usage généralisé des données ouvertes, et je vais vous faire part brièvement de mon expérience.

Les données ouvertes....

Il faut premièrement que je vous explique ceIqu'on entend par cette expression. Comme je m'en suis rendu compte, on lui donne plusieurs interprétations différentes.

Pour les décrire brièvement, je dirais que les données ouvertes sont de l'information qui a été rendue publiquement disponible et accessible.

Que de l'information soit publiquement disponible, cela se comprend facilement. Mais il faut reconnaître que de l'information peut être publiquement disponible sans être disponible sur l'Internet. De telles données peuvent donc être considérées comme publiques, même s'il faut se mettre en rapport avec quelqu'un pour les obtenir.

Pour que des données publiques deviennentdes données ouvertes, il faut les rendre aisément accessibles. Il faut que les démarches requises pour obtenir ces données soient aussi peu nombreuses que possible. Bien entendu, le diffuseur de ces données souhaite souvent obtenir des renseignements sur les visiteurs de son site, mais il appartient à ceux qui l'utilisent de décider de l'information personnelle qu'ils sont disposés à y laisser. L'accessibilité implique aussi que les données soient présentées dans des formats faciles à manipuler et compatibles avec la plupart des outils d'analyse.

Les Nations Unies ont récemment publié un rapport [1] assimilant les données à 'l'aliment vital de la prise de décisions et à la matière première de la redevabilité.' La 'Databank' du Groupe de la Banque mondiale [2] constitue l'une des nombreuses et vastes bases de données qui existent depuis longtemps déjà. De nombreuses autres institutions internationales suivent aujourd'hui l'exemple de la Banque mondiale, mettant un volume croissant de données à la disposition du public.

L'Institut pour la gouvernance des ressources naturelles (NRGI) a récemment publié un ensemble de données contenant de l'information puisée dans 223 rapports ITIE. Cette organisation a utilisé des données ITIE publiquement disponibles et les a rendu accessibles en supprimant l'obstacle occasionné par l'emploi de fichiers pdf. Le NRGI a déjà commencé à utiliser cette information, explorant les aperçus qui peuvent en être tirés et les moyens de visualiser les données sous-jacentes [3].

... au Secrétariat de l'ITIE.

Au Secrétariat, des travaux sont en cours pour améliorer l'ouverture des données ITIE. Une amélioration conséquente a été la mise au point du modèle de présentation sommaire de données [4]. Ce modèle permet de collecter un large éventail de données fiscales, juridiques et contextuelles intéressant le secteur extractif par pays, y compris des chiffres désagrégés de revenus des entreprises extractives, catégorisés en utilisant des définitions applicables à tous les pays.

Le but visé est de créer un jeu de données contenant les informations les plus courantes et importantes, sans que l'on soit obligé de lire des centaines de pages de rapports.

La compilation de ce jeu de donnéesconstitue l'essentiel du travailde l'équipe 'Données ouvertes' du Secrétariat international.

Selon ma manière de voir les choses, le rôle dessecrétariats nationauxest de recueillir, analyser et diffuser de l'information dans un contexte national et de proposer cette information sous une forme que la population concernée peut comprendre. Ils doivent aussi s'assurer que cette information demeure comparable au fil du temps.

En s'appuyant sur les travaux réalisés au niveau national dans les pays individuels, le Secrétariat international pourra élargir la perspective des informations et les rendre comparables entre les différents pays.

Bien que l'emploi de ces modèles de présentation sommaire constitue un progrès significatif, cette information résumée n'est pas sans présenter des inconvénients parce qu'elle pourrait ne pas capter des données spécifiques et contextuelles. Elle pourrait omettre des particularités nationales, voire même les fausser. Mais par définition, des données résumées n'ont pas pour but de rendre compte de tous les aspects de la réalité et vont inévitablement omettre certaines informations. L'important est d'y inclure les données les plus pertinentes, afin que soit proposée une information susceptible de trouver l'utilisation la plus large possible.

Gratter en-dessous de la surface

Les besoins diffèrent en fonction des utilisateurs. Les besoins d'un universitaire diffèrent de ceux d'un journaliste ou d'un parlementaire. Il n'est pas facile de satisfaire tous ces besoins en adoptant une seule approche. Nous devons donc reconnaître que le Secrétariat international, les secrétariats nationaux et d'autres parties utiliseront les 'données brutes' de l'ITIE de nombreuses façons. Il importe aussi de noter que, même s'ils offrent de belles perspectives pour le partage d'informations, les ensembles de données ne peuvent remplacer les rapports ITIE. Pendant mon service au Secrétariat, j'ai étudié des rapports couvrant près de 70 exercices de rapportage en provenance d'une dizaine de pays. Il est impossible de bien décrire les contextes de ces dix pays par une présentation sommaire de leurs données.

Fouiller les données se trouvant dans 70 rapports pour y trouver des bribes de données spécifiques pourrait ne pas paraître intéressant aux yeux de certains, mais l'expérience m'a plu (en général). Ainsi, en parcourant un rapport pour y trouver la définition de l'expressionenlèvement de pétroleafin d'obtenir des volumes exacts de production et d'exportation, on ne manquera pas de dénicher d'autres informations intéressantes, sans parler des divergences d'approches et de systèmes gouvernementaux. Avant d'entreprendre ce stage, je dois avouer que le cours en économie des ressources naturelles que j'ai suivi à l'université ne m'a pas préparé à affronter les difficultés rencontrées dans la compilation de données ITIE. Il ne m'a pas préparé à maîtriser les difficultés du recensement de revenus perçus par différents organismes publics et transférés par ceux-ci, et pas d'avantage à découvrir combien compliqués peuvent être certains régimes fiscaux.

Une autre chose dont je me suis rendu compte en fouillant des données concernait la nette amélioration des rapports ITIE, particulièrement en termes de qualité et de quantité de l'information, au cours des années. Ne portant initialement que sur la divulgation de revenus et sur la résolution des écarts, ces documents en sont venus à comporter une information toujours plus ample et pertinente sur les secteurs, les licences, les contrats et la propriété des entreprises extractives. Il est intéressant de noter que les rapports les plus récents (couvrant 2012 & 2013) contiennent de l'information rivalisant avec celle de la plupart des analyses de marché que j'ai pu examiner et qui sont commercialement disponibles. On me dira que tel est précisément le but des rapports ITIE ; il demeure qu'avant l'adoption de la Norme ITIE, la quantité et la qualité des informations contenues dans les rapports étaient nettement moins exhaustives que celles qui sont présentées dans les rapports plus récents.

Les problèmes pour extraire l'information

Il est bien sûr souvent difficile de rassembler ces données, car certains documents pdf sont 'verrouillés', ce qui empêche même d'en copier du texte ou des chiffres. D'autres documents pdf contiennent des tables d'information interminables qu'il est impossible de répliquer sans taperchaque chiffre méticuleusement.. Pour les rapports de ce type, il est encore plus important de surmonter l'obstacle de l'inaccessibilité et de créer des fichiers dans lesquels les calculs sont disponibles. Cela permet alors de vérifier également les chiffres récapitulatifs de ces tables.

Une autre difficulté tient au fait que certaines informations spécifiques sont parfois entièrement absentes du rapport. Les chiffres du produit intérieur brut (PIB) et de part du secteur extractif dans le PIB sont cruciaux pour comprendre l'importance de ce secteur pour un pays. Et pourtant, dans plusieurs rapports, ces chiffres ne sont même pas mentionnés.

Il se présente aussi des difficultés à caractère plus technique, telles que la valorisation incorrecte de revenus ou de paiements en nature, en raison de la non-inclusion de statistiques de prix dans les rapports ITIE. La présentation sommaire des données est censée refléter le rapport ITIE, et la plupart des rapports donnent en fait les niveaux moyens des cours de référence, tels que ceux du Brent et du WTI [5]. Cependant, l'inclusion desniveaux de prix effectivement utiliséspour ces transactions, notamment en ce qui concerne les différentes qualités de brut, fait le plus souvent défaut. Lorsque la valorisation de ces revenus n'est pas disponible, les chiffres de l'ITIE relatifs aux recettes gouvernementales faussent le tableau de la situation réelle. Parallèlement, l'estimation de revenus en nature en recourant aux cours de référence faussera également le tableau, parce qu'elle fera appel à des approximations erronées. Comme l'a expliqué mon collègue Alexe Gordy au cours d'une discussions sur ce thème, 'nous avons pour métier la résolution des écarts,et non pas leur création'. La meilleure façon de résoudre ce dilemme serait d'inviter l'entité publique ou l'entreprise en cause à préciserles prix effectivement retenusdans les transactions déclarées (et non seulement les volumes).

Ensuite: passer la manette de commande

Enfin, selon moi, la diffusion de données ouvertes ne concerne pas uniquement la fourniture d'informations, mais également la transmission à l'utilisateur d'un maximum de contrôle sur les données.

J'appartiens à une génération informatisée, et si Wikipedia, Linux et les autres innovations collectives nous ont appris quelque chose, c'est que les gens en général souhaitentbénéficierd'une information améliorée, non de son démantèlement. Disposer de données ouvertes est susceptible de l'améliorer. Cela ne s'applique pas seulement à nos ensembles de données, mais également à notreprésentationde ces données (en particulier leur visualisation). Au lieu d'écrouer des données uniquement dans des graphiques, les graphiques eux-mêmes devraient également pouvoir être l'objet de manipulations.

C'est ce que je veux dire par des données véritablement ouvertes

 

Christoffer Claussen a fait un stage au Secrétariat international de février à juillet 2015. Il poursuivra ses études de maîtrise en économie des ressources environnementales et du développement à l'université d'Oslo. 

L'ITIE a lancé une consultation sur les données ouvertes -vous pouvez en savoir plusici. Les soumissions seront acceptées jusqu'au 31 août 2015. 

[1] IEAG (2015). A World That Counts: Mobilising the data revolution for sustainable development.Groupe consultatif d'experts indépendants sur la révolution des données pour le développement durable (IEAG),http://www.undatarevolution.org/.

[2] World Bank Group : World DataBank,http://databank.worldbank.org/.

[4] ITIE : Modèle de présentation sommaire de donnéeshttps://eiti.org/document/eiti-summary-data-template

[5] WTI – West Texas Intermediate