Le traitement des centaines de milliers d’images issues des pièges photo mobilise l’expertise des chercheurs, le machine learning et les observateurs bénévoles. Tout l’été, un travail de fond a permis d’optimiser la méthode. La prochaine saison du programme de science participative « Wild Mont-Blanc » s’annonce prometteuse !
S’agit-t-il bien d’un chamois ? La réponse est loin d’être évidente lorsque l’on observe les nombreuses images, prises sous des angles différents ou très furtivement, par les 40 pièges photo disposés dans le Massif du Mont-Blanc par le CREA. Comment, alors, être sûr d’identifier correctement cette espèce présente à tous les étages du massif alpin, sans que cela soit trop chronophage ?
Un modèle à la main des chercheurs
L’enjeu de traitement puis d’analyse des centaines de milliers d’images obtenues chaque année est grand. Depuis 3 ans, les chercheurs du CREA Mont-Blanc expérimentent le potentiel du machine learning pour les aider dans leur action. L’entreprise Devoteam Revolve fournit ici un mécénat de compétences précieux.
L’an dernier, la solution expérimentée a permis de faire un tri sur les images sans animaux. Soit 2/3 des images capturées. « Notre solution logicielle apprenante est open source. Mise en place à partir de la solution Megadetector, elle permet aux chercheurs d’avoir une relecture simple des phases de détection et d’apprentissage. Ils peuvent aussi critiquer le modèle pour le faire progresser » rappelle Michaël Thibon, consultant en charge du projet chez Devoteam Revolve.
L’automatisation a progressé
Tout l’été, un travail important a été mené sur l’automatisation du machine learning (ML). Devoteam a comparé ses avancées avec le modèle DeepFaune du CNRS, déjà utilisé par le CREA Mont-Blanc. « DeepFaune est généraliste et basé sur la faune française, il est donc très complet. Nous sommes de notre côté spécifiques au massif alpin, notre périmètre est plus limité. Techniquement, on ne fait pas « sur-apprendre » le modèle et on essaie de minimiser le « bruit » autour des animaux, pour affiner au maximum sa fiabilité » détaille Michaël Thibon.
Les résultats sont prometteurs. « Notre modèle donne des réponses très satisfaisantes sur les grands herbivores. Nous devons nous améliorer encore et faire apprendre notre machine sur les petites espèces. Nous restons complémentaires de DeepFaune. »
L’outil de Devoteam Revolve a une autre singularité, qui concerne son déploiement : il permet de louer le temps d’usage strictement nécessaire pour le traitement et l’analyse photo, auprès d’AWS (cloud public d’Amazon). Il ne nécessite pas que le CREA Mont-Blanc s’équipe en serveurs, un véritable avantage pour maîtriser le coût du projet.
Le nombre d’observateurs optimisé
En parallèle, le volet science participative a également progressé. Matthieu Vercaemer a consacré les 6 mois de son stage de fin d’étude d’ingénieur en environnement (AgroParisTech) au sujet. « J’ai étudié les performances de la science participative dans l’identification des images via le portail Zooniverse. Il s’agissait d’objectiver le ratio d’observateurs nécessaires sur le programme Wild Mont-Blanc » explique-t-il.
Sur les 2 premières saisons, l’observation de chaque séquence capturée par les pièges mobilisait 50 personnes. Grâce à l’analyse statistique de Matthieu Vercaemer, il est possible de limiter ce groupe à 30 personnes, sans perte de qualité : la fiabilité des réponses dans l’identification des espèces passe de 97,8 %… à 97,5 % !
Matthieu Vercaemer a ensuite comparé ses résultats avec ceux issus du machine learning. Conclusion ? « L’identification des espèces par un humain est clairement meilleure, mais la solution de machine learning est déjà fiable à 90 %. Elle va progresser encore et sera une véritable aide sur les espèces « discrètes », l’hermine par exemple, d’autant plus si on lui fait continuer à apprendre en ce sens » estime Matthieu Vercaemer.
Wild Mont-Blanc saison 3, c’est pour bientôt
Dans le cadre du programme de science participative Wild Mont-Blanc, une nouvelle période d’identification débute à compter de mi-octobre, avec les milliers de bénévoles réunis sur la plateforme Zooniverse. « Cette année, nous passons en configuration production, avec le versement sur la plateforme de toutes les séquences (avec ou sans animal, NDLR), sans observation préalable par le CREA Mont-Blanc. Grâce au travail de Matthieu et de Devoteam Revolve, nous changeons totalement d’envergure : toutes les séquences passent au crible du machine learning, obtiennent un score puis sont confiées aux observateurs bénévoles. A eux de déterminer de quel animal il s’agit, parmi la vingtaine d’espèces suivies » explique Colin Van Reeth, responsable de la science participative au CREA Mont-Blanc.
Les chercheurs et experts naturalistes ne viendront épauler la démarche qu’en deuxième rideau, en cas d’espèce à fort enjeu (loup, lagopède, etc.) ou d’absence de consensus chez les observateurs bénévoles.
Cette année, une nouvelle espèce sera à identifier (le chat sauvage d’Europe) et deux autres ont été rassemblées (lièvre variable et lièvre d’Europe).
Laisser un commentaire