Avec l’explosion de la quantité de données disponible dans les exploitations et leur captation à la source, la question de l’accès aux données agricoles devient une question importante (voir l’accès aux données pour la recherche et l’innovation en agriculture. Position des Instituts Techniques Agricole, paru en 2016 ou encore La valeur des données en agriculture par Renaissance Numérique paru en 2018).

Le projet MULTIPASS, lancé en 2018, visait à mettre à disposition des producteurs et valorisateurs de données agricoles un écosystème de gestion des consentements des agriculteurs protégeant les échanges de données issues des exploitations. En renforçant la confiance des producteurs, nécessaire au partage de leurs données, le projet vise l’émergence de nouveaux services innovants.

Contexte :  

Les données des exploitations agricoles sont en majorité numériques et enregistrées dans les bases de données (BDD) de leurs partenaires, qui offrent des services de gestion/pilotage appropriés (gestionnaires de parcelles, outils d’aide à la décision). Une fois enregistrées dans les BDD, l’extraction et la réutilisation de ces données sont encadrées par les contrats d’utilisation (CGU) ou de vente (CGV) de ces services. Ces contrats sont pour la plupart des contrats d’adhésion dans lesquels une partie (le fournisseur de service) impose ses conditions à l’autre (les agriculteurs). Les agriculteurs n’ont alors plus la possibilité de décider de la façon de valoriser leurs données.

Pour pallier ce déséquilibre des rapports de force dans les contrats, le législateur et la profession se sont organisés :

Ce consentement (une des bases légales dans le cas des données personnelles, recommandé par la profession dans le cas des données agricoles) permet à l’agriculteur d’exprimer son adhésion à toute nouvelle valorisation des données de son exploitation.  

Rappel de la proposition

Les partenaires du projet MULTIPASS ont souhaité proposer un écosystème interopérable permettant la gestion de ces consentements, qui apportent confiance, simplification et sécurité aux producteurs et valorisateurs de données.

La gestion des consentements a pour buts de :

  • Clarifier les usages des données des exploitations ;
  • Rendre aux agriculteurs la maitrise de l’usage fait de leurs données ;
  • Protéger le partage des informations collectées ou produites sur les exploitations.

Ce climat de confiance est la condition nécessaire à la circulation des données agricoles et à la libération de leur potentiel pour :

  • Améliorer l’interopérabilité entre les outils de l’agriculteur ;
  • Favoriser l’innovation ouverte, c’est-à-dire l’émergence d’applications agronomiques couplées aux données des agriculteurs provenant de n’importe quelle source de données ou objet connecté, pour éviter le risque de concentration de l’innovation ;
  • Favoriser la création de connaissances par l’analyse de données massives d’exploitations, dans une chaine de confiance.

Résultats

Les résultats obtenus ont permis de définir des conditions d’établissement de la confiance dans les échanges de données agricoles et de démontrer l’intérêt et la faisabilité d’un écosystème de gestion des consentements.

Facteurs de confiance

Afin de construire cet écosystème de gestion des consentements, nous avons souhaité définir avec les différents acteurs, dont les agriculteurs, les conditions d’établissement de la confiance dans le cadre du partage de données en agriculture.

La question de l’anonymisation des données a été particulièrement étudiée au travers d’une étude bibliographique et comparative des méthodes d’anonymisation existantes et de leurs cas d’utilisation. Pour évaluer les risques de réidentification des personnes après anonymisation, des techniques se basant sur la notion de k-anonymisation ont été utilisées – l’idée de base est de vérifier que les données sont suffisamment diversifiées pour éviter une réidentification ; si ce n’est pas le cas, il faut pratiquer une agrégation des données (sur un critère spatial, temporel ou autre). Les résultats de cette action ont permis de rédiger un article de synthèse (voir aussi le replay d’un webinaire sur les facteurs de confiance dans le partage des données).

D’autres études ont été menées pour alimenter la réflexion, voir :

Finalement, après une première année de veille et d’animation sur le sujet, les partenaires ont formalisé, à l’occasion du SIMA 2019, leurs réflexions et recommandations dans un support « 4 pages », portant 12 recommandations pour :

  • Renforcer la transparence des usages des données ;
  • Responsabiliser les partenaires de l’agriculteur et établir une chaine de confiance ;
  • Aller plus loin dans l’amélioration des contrats.

Ces recommandations ont été prises en compte dans la proposition d’écosystème de gestion des consentements faite par les partenaires.

Faisabilité

Les différentes briques composant l’écosystème MULTIPASS ont été développées sous forme de prototypes pleinement fonctionnels.

L’outil au cœur de l’écosystème MULTIPASS est un routeur qui garantit l’interopérabilité des différents gestionnaires de consentement. Il permet un accès unifié aux outils/systèmes de gestion des consentements (SGC), que ce soit pour faire la liste des consentements (par ayant droit, par bénéficiaire, etc.) ou pour en vérifier la présence avant un échange de données. Pour cela, le routeur connait et peut interroger les différents SGC qui devront exposer des interfaces (API) similaires à celles du routeur MULTIPASS.

Dans le cadre du projet, deux SGC ont été adaptés : le SGC Blockchain d’Orange et l’outil SGC de France Génétique Elevage.

  • Concernant le premier cas, une Blockchain mise à disposition par Orange a été adaptée au projet Multipass. Cette adaptation a été facilitée par la concomitance de son développement avec celui du routeur. La recette simultanée du routeur et du SGC Blockchain ont permis de rapidement voir les points de blocage.
  • Dans le deuxième cas, l’adaptation de l’outil SGC de France Génétique Elevage (FGE / outil centralisé) a été plus délicat et a mis en évidence le caractère indispensable d’une documentation technique extrêmement détaillée des interfaces, disponible et maintenue à jour (les développeurs du routeur n’étaient plus disponibles à ce moment-là). Cette opération a été également l’occasion d’un changement de protocole d’API (passage d’une API SOAP à une API REST), conforme à l’évolution de l’état de l’art depuis sa réalisation initiale.

Le concept principal, la garantie d’interopérabilité, est le concept de consentement qui permet de standardiser les échanges de données entre le routeur et les SGC. Sur la base des travaux préexistants chez France Génétique Elevage et des attentes des agriculteurs, ce concept (décrit dans les interfaces du routeur) est composé de propriétés permettant de définir :

  • QUI : acteurs de l’échange de données ;
  • QUOI : sur quoi porte l’échange ;
  • La portée du consentement ;
  • Et d’éventuelles restrictions.

Les cas d’usage travaillés dans le cadre du projet ont permis de valider le périmètre fonctionnel du routeur.  Ce périmètre n’a pas été remis en cause par les ateliers d’approfondissement conduits par Agdatahub au printemps 2020 dans la perspective de la reprise des résultats MULTIPASS, en particulier de l’industrialisation du routeur (voir plus bas la section « Perspectives »). Un audit du code commandité par Agdatahub a enfin souligné la qualité de l’architecture et du code informatique mis en place.

Les prototypes développés méritent toutefois des améliorations en vue d’une industrialisation. Certains éléments informatiques devraient être revus car ils ont été développés à des fins de preuves de concept. Ils peuvent donc présenter en l’état un risque quant à la sécurité, l’évolutivité, l’exploitabilité, la robustesse et la maintenance de l’application. L’audit commandité par Agcatahub a par exemple relevé des améliorations nécessaires sur :

  • L’authentification des utilisateurs (librairies et algorithmes utilisés) ;
  • La gestion incomplète des erreurs ;
  • L’absence de tests d’intégration ;
  • La gestion des traces ;
  • Le déploiement de l’application.

Parmi les travaux à finaliser, nous avons identifié :

  • Des travaux sur les typologies des usages et des données qui caractérisent les consentements. Ces travaux d’envergure n’ont pas pu être réalisés dans le cadre du projet, qui a adopté une approche pragmatique.
  • Des outils pour permettre de s’assurer que la personne qui enregistre un consentement est bien celle pour qui le consentement est donné. Il est donc recommandé de bien identifier les utilisateurs. En cela, la création en agriculture de fournisseurs d’identités comme il en existe par ailleurs (avec l’Etat, Google ou Facebook) est recommandée.
  • La question d’un possible double consentement (exploitant agricole + fournisseur de données) qui n’a pas été tranchée. Il semble que dans certaines situations, un double consentement soit requis, le fournisseur de données exigeant d’être consulté au même titre que l’agriculteur avant de transmettre les données à un organisme tiers. Les conditions de la compatibilité de cette exigence (en particulier selon la nature des données concernées) avec la charte Data Agri est à expertiser.

Par ailleurs, si la faisabilité technique est démontrée, les partenaires attirent l’attention sur l’enjeu de l’adhésion à l’écosystème de toutes les parties prenantes. Tous les acteurs doivent s’être enregistrés au préalable sur le routeur. Il serait intéressant qu’ils aient signé une charte définissant les bonnes pratiques qu’ils doivent respecter. Cependant, une charte n’est pas contraignante. Il semble indispensable dans ce cas que les engagements correspondants figurent explicitement dans les contrats qui lient les acteurs aux agriculteurs. Une autre solution consisterait à leur faire signer un contrat d’adhésion à l’écosystème.

La valeur ajoutée pour les éditeurs (fournisseurs de services ou de données) est assez faible, comparée à la valeur ajoutée pour les agriculteurs, au regard du coût informatique induit de l’intégration à l’écosystème. Cela peut représenter un frein supplémentaire.

Enfin, la gestion des consentements ne lèvera pas pour autant les stratégies individuelles de non-circulation des données mais elle permet à l’agriculteur de s’exprimer sur les possibilités de mise en circulation qui lui sont offertes.

Intérêt

“Aujourd’hui, on ne nous demande pas grand-chose avant de valoriser nos données”

“On a besoin d’un organigramme de ce qu’il se passe : où vont les données ?”

Ces citations d’agriculteurs rencontrés à l’occasion d’ateliers dédiés au projet résument bien leurs attentes en termes de maitrise et de transparence des usages de leurs données. Ces ateliers ont mis en avant la bonne connaissance des agriculteurs de la diversité des données et des opportunités qu’elles offrent en termes d’interopérabilité, de pilotage et de contribution à la création des futurs outils qui leurs seront destinés. Cette circulation des données doit rester soumise au consentement de l’exploitant agricole, pour respecter la transparence des échanges et protéger le fournisseur de service ou de données – qui ouvre les données qu’il héberge pour le compte de l’agriculteur à un tiers.

Ils ont aussi exprimé des craintes de mésusages de ces données. L’intérêt pour la gestion des consentements est dans ce cas plus marquée afin de permettre aux agriculteurs de s’opposer à des usages non souhaités de leurs données.

Un écosystème de gestion des consentements assure ces propriétés : 

  • Maitrise et pérennité des consentements par leur enregistrement dans un outil dédié (SGC)
  • Transparence et exhaustivité par la fédération assurée par le routeur
  • Sécurité et confiance par l’auditabilité des systèmes de consentements

Au-delà des agriculteurs, l’intérêt pour un écosystème de gestion des consentements a été marqué par leurs représentants professionnels. La charte DATA AGRI portée par FNSEA et JA a mis en avant dès 2018 la nécessité de collecter un consentement préalable à tout usage des données agricoles, comme la plupart des chartes agricoles dans le monde.

Parmi les acteurs du monde agricole, API-AGRO, avec le projet Agdatahub, a validé dès 2019 l’objectif de « doter l’agriculture française et européenne d’une infrastructure technologique souveraine et mutualisée de consentement, d’hébergement et d’échanges de données » et « d’assurer une vision éclairée de l’usage des données collectées sur l’exploitation agricole, en participant à l’expression du consentement éclairé des producteurs », s’inspirant de la démarche MULTIPASS.

L’intérêt est donc partagé dans le paysage agricole mais les travaux MULTIPASS permettent de préciser 3 limites à l’usage de cet écosystème de gestion des consentements :

  • Intérêt pour l’interopérabilité : le consentement ne suffira pas toujours pour initier un échange de données (en particulier dans le monde végétal, moins vrai en élevage). L’accès aux données peut en effet être limité par l’absence de formats standardisés (de nombreuses thématiques ne font pas l’objet de modélisation) ou par des choix divergents chez les éditeurs sur les formats de données choisis (modèles conceptuels choisis) ou simplement être limité par les stratégies d’entreprises (degrés variables d’ouverture et d’accessibilité à la donnée). Il convient cependant de préciser que la facilitation des partages de consentement par un système homogène et accessible (ie. sans coût pour l’utilisateur final) n’annule pas l’existence éventuelle d’un modèle économique propre à chaque échange (ces modèles sont à la charge des opérateurs qui opèrent l’échange (émetteur ou récepteur),
  • Intérêt pour la recherche / innovation : la pratique met en avant la difficulté d’obtenir suffisamment de consentements pour alimenter un projet de recherche en données (cf. taux de réponse courants à des enquêtes mails (15%)). Il est difficile de susciter l’intérêt et la mobilisation de agriculteurs (disponibilité pour répondre, périodes de disponibilité, explications du sujet de recherche). La mobilisation des données des agriculteurs est probablement à travailler par une approche globale (via les organismes stockeurs par exemple ou par des processus globaux basés sur les Conditions Générales d’Utilisation (CGU)) que par la collecte de consentements individuels.
  • Un fournisseur de données doit accepter de donner l’accès aux données qu’il gère sur la base d’un consentement géré dans un système qui n’est pas le sien.  Ce préalable ne s’est pas toujours confirmé  à l’occasion de la construction des cas d’usage du projet, car les modalités de collecte des consentements sur le terrain ne sont pas toujours informatisables, et surtout ne peuvent pas être complètement contrôlées. Cela est vrai pour le texte du document (ou de l’écran du portail) que l’on fait signer à l’agriculteur qui n’est pas repris dans le consentement géré par le routeur, ni plus généralement par les gestionnaires de consentements. Cela l’est encore plus pour l’éventuel accompagnement oral fait à la remise de ce texte. Dans un contexte de défaut de confiance entre acteurs, certains fournisseurs de données n’accepteront de donner accès à leurs données que lorsqu’ils ont la maitrise de la collecte du consentement soit en le recueillant via un outil informatique qui leur est propre (cas de Normabev), soit en signant des contrats avec l’organisme collecteur l’engageant entre autres à accepter des contrôles (cas de SPIE). Ainsi, leur utilisation du routeur ne pourrait être envisagée que pour l’interrogation de leur propre gestionnaire, ce qui lui enlève partiellement sa valeur ajoutée. L’adhésion de ces acteurs au routeur apporte néanmoins un plus à l’agriculteur en lui permettant de bénéficier du service de visualisation globale de tous ses consentements via un seul outil qui interroge le routeur.

En outre, la banalisation du recueil des consentements, et la sensibilisation croissante des agriculteurs, leur donnant les armes pour mieux les maîtriser d’une part et pour exprimer leur demande d’outils de gestion efficients, sont de nature à rassurer ces acteurs et à les motiver dans l’avenir pour accepter de prendre en compte des consentements obtenus via le routeur.

Blockchain VS Tiers de confiance

La comparaison faisait partie des attendus du projet dans le contexte de 2017 où un outil de gestion des consentements s’appuyant sur une base de données était déjà mis en œuvre par France Génétique Elevage qui assumait le rôle de tiers de confiance sur ce système. En parallèle, les acteurs du monde végétal voulaient tester un système basé sur une Blockchain. 

4 ans plus tard, la blockchain est une avancée technologique dans l’état de l’art des systèmes d’information et non plus une révolution organisationnelle : les acteurs historiques s’en sont emparé. La technologie a aussi beaucoup mûri avec l’émergence d’outils commençant à s’imposer largement comme « Hyperledger » pour la gestion de blockchains de consortium, avec des coûts acceptables.

Une blockchain apporte la garantie de non-falsification des données (par création de blocs successifs en lieu et place de modifications), d’indestructibilité (les données sont décentralisées), de confidentialité (par les algorithmes d’encryptage) et de portabilité du système chez tout nouvel acteur accepté par le consortium (notion de nœud duplicable à l’infini). Cependant, ce système doit être complété par des fonctionnalités « traditionnelles » de gestion de l’authentification (identité des acteurs) et des interfaces pour permettre une ergonomie acceptable pour les utilisateurs.

Le choix fait en 2020 par la CNE (Confédération Nationale de l’Elevage) de se doter d’un nouveau SGC basé sur une blockchain de consortium illustre le consensus des acteurs agricoles pour l’utilisation de cette nouvelle technologie qui se pose finalement non plus en alternative aux systèmes traditionnels mais plutôt en complément.

Dans ce nouvel environnement, la complémentarité entre des SGC basés sur une blockchain et un routeur centralisé porté par un tiers de confiance trouve toute sa cohérence dans la mesure où le routeur permet une vision exhaustive des consentements (en lecture ou en vérification) et une interopérabilité des SGC existants ou à venir.

Recommandations pour la suite

Au vu des résultats du projet et des éléments discutés plus haut, il nous apparait important de poursuivre sur les axes suivants :

  • Interopérabilité : La définition des consentements est associée à des listes de familles de données et de catégories d’usages qui restent à définir. Il reste un énorme travail pour proposer un vocabulaire spécifique et adapté permettant d’organiser ces listes (hiérarchies de catégories) et de les partager sur le Web.
  • Intégrité : Il convient de vérifier que la personne qui enregistre un consentement est bien celle pour qui le consentement est donné. Il est donc recommandé de bien identifier les utilisateurs. En cela la création en agriculture de fournisseurs d’identités comme il en existe par ailleurs (avec l’Etat, Google ou Facebook) est recommandée. Le routeur pourra également procéder à la validation des tiers intégrant l’écosystème (par une charte ou un contrat) assurant la confiance des utilisateurs dans leur intégrité.
  • Simplicité : Les agriculteurs appréhendent la complexité potentielle d’un tel système. Il faut éviter la multiplication des portails qui leurs sont destinés. Pour assurer l’adhésion large des éditeurs de logiciels, il faudra veiller à limiter le coût de l’implémentation des interfaces d’accès au routeur. Pour cela, la documentation technique devra être irréprochable.

Perspectives

L’objectif du projet MULTIPASS étant de développer un « pilote » démontrant l’intérêt et la faisabilité du concept afin que des investisseurs puissent développer une offre opérationnelle, les conditions d’accès aux résultats du projet pour les candidats à la reprise du routeur MULTIPASS ont été définies par les membres du consortium, et API-AGRO a été retenu comme repreneur. API-AGRO a créé la société Agdatahub pour industrialiser le routeur MULTIPASS au travers du service Agri-consent .

Finalement, l’écosystème agricole s’organise pour déployer des solutions d’échange de données sécurisées au service de toutes les filières et des producteurs agricoles, prenant en compte les complémentarités de projets existants et futurs :

L’écosystème agricole s’organise pour déployer des solutions d’échange de données sécurisées au service de toutes les filières et des producteurs agricoles, prenant en compte les complémentarités de projets existants et futurs :

  • Volet échange de données avec la plateforme API-AGRO et le service CNE (lien flyer)
  • Volet standardisation : NumAgri ambitionne de coordonner la standardisation des données agricoles qui sera menée par GS1 France. GS1 France animera les travaux de standardisation pour créer, avec les acteurs du secteur agricole, le langage commun qui leur permettra de structurer et d’échanger les données dans l’ensemble des filières agricoles.
  • Volet gestion des consentements :
    • Une version industrialisée du routeur MULTIPASS par Agdatahub au travers du service Agri-consent.
    • Pour alimenter le routeur, un premier SGC appelé Agata développé par FAST – FIEA Agri Services Technologies – sera disponible cet été pour les domaines Identification, Génétique et Harmony dans le cadre du programme de rénovation du Système d’Information du Dispositif Génétique Français de la CNE. Ce SGC est mis en production en 1er sur le domaine de l’élevage mais n’y est pas limité, il pourra être utilisé plus largement en agriculture
  • Volet sécurisation et gestion des identités :
    • Le Projet européen GAIA-X a été lancé pour permettre une utilisation sécurisée, ouverte et souveraine des données. Au-delà des infrastructures de stockage et de traitement des données en Europe, il ambitionne la mise en place d’un espace de confiance et de gestion sécurisée des identifications (Federated Identity Management). Au sein du groupe de travail “ Agriculture” du Hub France de GAIA-X, les partenaires du projet Multipass porteront les acquis du projet pour aider à la définition d’une feuille de route communautaire d’un “data space agricole” où la France a pris de l’avance par rapport à ses partenaires européens.

Il convient désormais d’appliquer à des cas d’usage plus nombreux les acquis du projet pilote MULTIPASS. D’autres expérimentations, à plus large échelle, d’échange de données agricoles sécurisées sont en cours ou vont se mettre en place dans les prochaines années, à l’image par exemple de ce qui sera réalisé dans le living Lab Occitanum. De nombreuses initiatives de ce type peuvent parfois échouer car “le verrou” de l’échange de données est difficile à lever. Il nous parait donc utile de construire ces projets en tenant compte de l’expérience MULTIPASS.

Le projet MULTIPASS

MULTIPASS “Faire émerger de nouveaux services pour l’agriculteur dans une chaîne de confiance gérant les gestions des consentements d’accès aux données des exploitations” est mené par ARVALIS, ACTA, FIEA, IDELE, IRSTEA (INRAE), ORANGE et SMAG et ses réflexions impliquent d’autres acteurs incontournables du secteur agricole. Lauréat de l’AAP Recherche Technologique 2017, il est financé par le compte d’affectation spéciale « développement agricole et rural » (CASDAR).

Comments are closed