Je profite de l’avoir enfin lu pour mettre un lien vers l’Avis n° 12 du Conseil national du numérique relatif à l’ouverture des données publiques (« Open data ») :
http://www.cnnumerique.fr/wp-content/uploads/2012/06/2012-06-05_AvisCNNum_12_OpenData.pdf.
Je retiens bien entendu le fort message du CNN en faveur de l’open data et deux propositions juridiques.
« Elargir le périmètre des informations publiques - Proposition n° 2 : Ne prévoir à la définition du périmètre des informations publiques d’autres exceptions que celles découlant de l’application d’autres lois (données à caractère personnel, propriété intellectuelle et industrielle, secret défense etc.).
Etendre le droit de la réutilisation aux données brutes des SPIC – Proposition n° 5 : Promouvoir l’émergence d’une licence unique, ou d’une famille de licences compatibles, au niveau européen. »
Il est toujours étonnant de voir comme ces propositions exprimées en des termes simples et porteuses d’idées nobles, sont en réalité affreusement complexes à mettre en oeuvre. Concrètement, savoir si une donnée sera « libérable » va nécessiter un audit juridique poussé surtout si l’on applique un tel système de « Oui sauf ». Les cas interdisant une libération de la donnée publique sont tellement nombreux qu’il va falloir être particulièrement attentif à la force du véhicule législatif utilisé. Cela risque de soulever des conflits de normes importants dans lesquels la force hiérarchique du texte autorisant la libération aura une importance capitale pour la cohérence et l’efficience du mécanisme. Un simple décret, par exemple, risque de souvent courber l’échine face à des textes constitutionnels ou organiques. A l’inverse donner au principe une trop grande force dans la hiérarchie des normes risque de le rendre dangereux car lui conférant une autorité supérieure à des principes plus fondamentaux ou tout aussi légitimes.
Sur le fait de tendre vers une licence ou une famille de licences commune, c’est un fait, la licence ouverte actuelle est réellement perfectible. Mais ces licences doivent prendre en compte les contraintes légales citées supra. Or ces contraintes vont varier en fonction du pays.
L’ennui est que la problématique me semble devoir s’enrichir d’un niveau supplémentaire. En effet, le fait de s’interroger sur la « libérabilité » d’un jeu de données ainsi que sur la licence qui doit lui être appliqué doit nous amener à poser la question du « Pourquoi ? ». Pourquoi veut-on libérer ces données ? Car en fonction de l’usage et des traitements appliqués, les intérêts lésés et les dispositifs légaux impactés peuvent largement varier. Par exemple un risque lié à la protection des données à caractère personnel portant sur un jeu de données, n’a plus lieu d’être si l’usage qui en est fait est purement statistique. Or, ce paramètre de la finalité n’a pas à rentrer en ligne de compte car l’on ne peut prendre le risque d’autoriser à qui veut l’exploitation d’un jeu de données à la condition d’en faire tel ou tel usage. Donc la question du « Pourquoi ? » devient une question du « Comment ? ». C’est à dire sous quelle forme la donnée doit-elle être libérée pour ne plus être délétère même si cette forme l’ampute, l’appauvrie ou en réduit les usages.
Ceci implique que l’audit juridique dont nous parlions risque d’aboutir à 3 solutions pour chaque jeu de données : libération possible, libération impossible, libération possible sous condition de retraitement de la données. A noter au passage que cette dernière hypothèse peut avoir un coût important pour l’organisme libérant la donnée. Une image s’éloigne donc de mon esprit. Naïf, j’y voyais des cohortes de start-up en quête de services à haute valeur ajoutée se jetant sur des données publiques en friches soudainement offertes à leur appétit « datavore », comme une journée d’ouverture d’un nouveau brocanteur dans le 10ème arrondissement de Paris (bon d’accord à Croix-rousse pour les lyonnais ).
Mon avis à ce stade est que le processus de production de la donnée doit intégrer dès le départ l’hypothèse de leur libération à venir ou en temps réel. Il s’agit certes d’une contrainte supplémentaire mais qui rend l’hypothèse d’une diffusion des données en temps réel beaucoup plus crédible : une sorte d’ « Open Data by Design ». La donnée publique doit être juridiquement constituée en vue d’être ouverte et partagée (et certainement techniquement aussi).
Gérald SADDE – Avocat / lawyer by design
PS : ce billet vient compléter le petit dossier OPEN DATA.