Accueil Nos publications Blog Retour sur le Breizh Data Day 2024

Retour sur le Breizh Data Day 2024

  1. Construire un avenir inclusif et durable, l’IA au Service du Bien Commun
  2. Réduction des coûts d’étiquetage en intelligence artificielle
  3. La transformation Data du groupe Roullier

Le 28 mars dernier s’est tenu le rendez-vous des passionnés de la data du grand ouest, le Breizh Data Day édition 2024. Notre practice Data était présente pour tenir une conférence autour de la Data Responsable et pour participer aux nombreuses conférences proposées. Voici notre retour sur cet évènement.

breizh dat day

Après une session 2023 enrichissante, c’était l’occasion de découvrir cette nouvelle édition qui a changé de lieu mais également de dimension avec 400 visiteurs cette année. C’est le technopole Innozh qui était en charge de l’évènement et qui a fait un travail remarquable !

Avec plus de 20 conférences au total sur la journée, c’était l’occasion de découvrir des témoignages clients sur leur transformation, des retours d’expériences sur des thèmes techniques mais aussi quelques sessions axées sur le conseil et les meilleures pratiques dans le domaine.

Construire un avenir inclusif et durable, l’IA au Service du Bien Commun

Retour d’expérience par Zinnya DEL VILLAR, Co-fondatrice du Breizh Data Day & Directrice Data & technologie chez Data-Pop.

Lors de cette conférence, nous explorerons comment l’intelligence artificielle peut être un catalyseur puissant pour le progrès social, économique et environnemental, en mettant l’accent sur son utilisation responsable et éthique au service du bien-être collectif.

Data-Pop Alliance est une ONG dont le but est d’exploiter les données au service du développement humain. Pour ce faire, l’organisation a structuré son activité en 3 volets :

  • Diagnostiquer
  • Mobiliser
  • Transformer

Les causes soutenues par l’organisation sont en lien notamment avec les Objectifs de développement durable (ODD) adoptés par l’ONU. A ce titre, l’association soutien une transformation digitale juste au travers de différents programmes qui orientent leurs travaux :

  • Moyens de subsistance
  • Ecosystèmes résilients
  • Féminisme des données
  • Géographie des inégalités
  • Technologies et démocratie

L’avancement des projets

Les projets menés vont permettre de progresser sur des thèmes d’importance comme l’intelligence artificielle au service de l’humanité (IA for good).

Afin de mesurer et guider leurs travaux, l’ONG évalue ses travaux par rapport à la couverture des 17 ODD. Pour cela elle s’appuie sur les 784 mesures qui permettent d’évaluer l’atteinte des objectifs (cf. définition des 784 mesures des ODD).

ODD - REX breizh Data Day
ODD – REX breizh Data Day

Parmi les difficultés rencontrées, l’ONG précise que le manque de donnée et la manque de fiabilité de celles-ci freinent certaines initiatives. En exemple actuel, Zinnya DEL VILLAR mentionne la situation d’Haïti qui nécessiterait des données permettant l’analyse de la situation comme la répartition des populations sur le territoire. Malheureusement ces données font défaut aujourd’hui.

Pour en savoir plus

Réduction des coûts d’étiquetage en intelligence artificielle

Conférence animée par Arthur HOARAU, Doctorant à l’IRISA

Dans l’écosystème du Machine Learning, la classification est la capacité d’un modèle à pouvoir attribuer une classe à un individu selon des caractéristiques que le modèle identifie par lui-même. Très utilisé pour la détection d’entité, la classification nécessite toutefois un grand nombre d’individus étiquetées pour que le modèle puisse faire l’association entre caractéristiques et classe. Un tel jeu de données est de l’envergure de celui du fameux ImageNet qui répertorie plus d’1 million d’images, catégorisées chacune dans 1 000 classes d’objets.

Or, cette classification, pour construire un jeu de données destiné à entrainer le modèle d’IA, pose des problèmes. En effet, une telle quantité d’individus à classifier représente un coût économique, écologique, mais également sociétal, qui ne sont pas à négliger dans ce contexte. Il est alors cité, le scandale d’Open AI qui a payé 2$ de l’heure des travailleurs Kenyan pour classifier du texte dit « toxique » pour rendre ChatGPT moins toxique. En complément de la conférence, France Info publiait début avril un article détaillé sur le sujet.

Ces travaux ont alors pour objectif de réduire le nombre de données étiquetées pour atténuer ces coûts.

Présentation des travaux

Pour cela, il présente l’étiquetage par incertitude : un cycle qui commence avec la tentative de classification par le modèle. Parmi les données classifiées, certaines le sont avec une très faible certitude (probabilité d’association de l’individus à la catégorie). On étiquète ces données et relance un nouveau cycle. L’arrêt du cycle est prononcé dès que le nombre d’individus avec une forte incertitude est faible.

Notre conférencier présente ensuite, deux types d’incertitudes. L’incertitude aléatoire est liée au caractère aléatoire de la classification, comme avec un lancé de pièce. L’incertitude épistémique est liée à un manque de connaissance par le modèle, comme avec un mot d’une langue inconnue, qui sera facilement traduit si les connaissances sont acquises.

Pour agir sur ces incertitudes, il nous est présenté les stratégies d’exploration et d’exploitation. Dans la première, la décision d’attribuée une classe est supposée optimale au regard des données observées jusque-là. Dans la seconde, la décision sur ces mêmes critères n’est pas prise, puisque l’on va juger que les données ne permettent pas de se prononcer. Ces travaux ont alors permis d’introduire un nouveau paramètre dans l’entrainement du modèle, λ, qui permet d’orienter le modèle vers la stratégie à adopter. Ce paramètre va de 0, pour insister sur l’exploration, à 1, pour l’exploitation.

conférences Breizh Data Day
conférences Breizh Data Day

La notion de Rich Label

Dans un dernier temps, Arthur HOARAU présente la notion de « rich labels », qui sont des jeux de données dont les différentes classes sont associées avec un degré d’incertitude. On passe alors d’une image avec une classe “chat” à la même image avec des classes “cela est surement un chat”, “cela semble être un chat”, “cela peut être un chat”. En s’appuyant sur ces rich labels, il serait possible d’apporter plus de nuance dans la classification par le modèle durant l’entrainement.

Pour en savoir plus

La transformation Data du groupe Roullier

Retour d’expérience par Vincent ROCCHISANI, Head of Data du Groupe Roullier

La conférence retrace les 2 ans de mise en place de la transformation Data du Groupe Roullier et du défi de transformer les holdings du groupe, chacune attachée à une activité. Il est expliqué que le Groupe Roullier dispose d’une Direction des Systèmes d’Information au niveau groupe, et également au niveau local, dans les holdings. La complexité du groupe défini la taille du défi à relever. 

Une transformation qui commence en 2022

Après une digitalisation de leurs activités, la DSI du Groupe Roullier s’est posée comme objectif de structurer sa stratégie Data. Pour cela, il recrute Vincent ROCCHISANI en tant que Head of Data. L’ambition est de taille puisque rien n’était cadré au niveau Data. La transformation va alors suivre les deux principes fondamentaux du Head of Data. 

La notion de valeur ajoutée doit entrer dans chaque décision prise au cours de cette transformation. En effet, Vincent R. nous incite alors à nous poser cette question à chaque fois qu’une proposition est faite : « Quel est le bénéfice que l’on tire de cette proposition ? ». 

Ensuite vient le principe de la simplicité, qui est l’accord entre la proposition et la réponse au problème. Ainsi, le Head of Data se doit d’avoir du recul quant à une proposition et s’assurer qu’elle réponde au problème visé. Cela évite alors les effets de bords qui viendraient créer d’autres problèmes. Ces deux principes ne sont alors pas basés sur un dogme technologique, mais purement sur la résolution de problèmes.

Faire un Système d’Information simple et durable

Le cap de la mission définie pour l’équipe Data détermine 2 critères essentiels pour le système d’information :

  • simple en s’assurant qu’il soit facilement compris par toute l’équipe et reprenable par un autre membre de l’équipe. 
  • durable en s’assurant que le système ne dépende pas de l’équipe.

Cette mission s’appuie néanmoins sur l’ambition d’avoir une forte expertise Data, tout en étant une plateforme accessible. La mission étant définie, l’organisation de l’équipe va rapidement évoluer. 

breizh data day 2024

Les prochaines étapes

Mais le Head Of Data attire notre attention sur un point : en intervenant au cas par cas, cela ne laisse pas de place à une feuille de route sur le long terme. En effet, sa vision du SI du Groupe Roullier est plutôt claire sur un an, mais se dégrade très vite après cette année.

Ainsi, il nous fait part des prochaines étapes pour cette transformation qui comprendra : la structuration de l’équipe, le gouvernance Data, de l’Intelligence Artificielle, et la mise en place d’une plateforme de données moderne (Modern Data Platform)

Les enseignements de cette transformation

Le retour d’expérience se termine par trois conseils que nous transmet le Head of Data du Groupe Roullier :

  • Tout d’abord, il faut garder à l’esprit que, quand une transformation est faite, des personnes ne suivront pas cette transformation. 
  • Ensuite, faire le contraire de ce que disait Clint Eastwood « Tout le monde cherche une raison pour ne pas assumer la responsabilité de ses propres actions. ». Des erreurs seront faites, il faut les assumer. 
  • Enfin, cette transformation Data est mise en place par l’équipe Data, et ce fait, une transformation est un travail d’équipe. 

On peut noter que ces conseils s’appliquent à n’importe quelle transformation.

Pour en savoir plus sur la Data Responsable

En complément de ce retour très détaillé, retrouvez également le livre Blanc sur la Data Responsable de notre practice leader Data, Nicolas Huche. Livre Blanc qui es attendu très prochainement, restez connectés.

Vous souhaitez en savoir plus ? Contactez-nous !