Semer l'Avenir : Le Rôle Pionnier de l'IA dans l'Agriculture Moderne
Au menu aujourd’hui :
🚜 Un retour sur l'industrie agricole
⚙️ Le rôle clé du matériel pour collecter des données précises dans les champs
💎 La stratégie d'un produit centré sur l'IA porte ses fruits
💡 Un seul modèle d'apprentissage automatique pour détecter toutes les espèces
👀 Quelques sources recommandées par Seb
🍰 MF : Quels sont les principaux problèmes auxquels l'industrie agricole est confrontée aujourd'hui ? Pourquoi penses-tu que l'IA peut avoir un impact positif majeur sur cette industrie ?
👉 Sébastien :
Les agriculteurs du monde entier sont confrontés à trois grands défis. D'abord, la pénurie de main-d'œuvre, car les personnes moins qualifiées ont de plus en plus d'opportunités dans des industries moins difficiles. Ensuite, l'impact des produits chimiques sur la santé et l'environnement : l'utilisation excessive de produits chimiques qui a commencé dans les années 1970 a maintenant un effet négatif significatif sur la santé des travailleurs agricoles et des consommateurs, ainsi que sur la biodiversité autour des champs et dans les régions agricoles en général. Enfin, le changement climatique mondial impose des conditions météorologiques plus volatiles et difficiles aux agriculteurs qui doivent donc s'adapter plus rapidement qu'auparavant. Ces tendances affectent concrètement les agriculteurs aujourd'hui dans la plupart des régions du monde (de l'Amérique du Nord et de l'Europe à l'Asie).
Beaucoup de gens ne le réalisent pas, mais l'agriculture est la première grande industrie technologique. Au cours des 100 dernières années, les nouvelles technologies ont considérablement amélioré la manière dont nous produisons de la nourriture. En 1900, chaque travailleur agricole se nourrissait lui-même et 1,5 autre personne en moyenne (40% de la population travaillait donc dans les fermes et les usines de transformation alimentaire). En 2020, chaque travailleur agricole se nourrit lui-même et 50 autres personnes (et donc moins de 2% de la population doit travailler dans l'industrie de la production alimentaire). Il en va de même pour la plupart des autres mesures de productivité (le rendement des champs de maïs a été multiplié par 6 de 1900 à 2020, l'eau utilisée pour l'irrigation a été réduite de 40% pour le même rendement, la production de lait par vache a été multipliée par 4).
Cela a été rendu possible par quatre grandes révolutions technologiques : d'abord l'automatisation de la “traction” des chevaux et du bétail aux "tracteurs" dans les premières décennies du XXe siècle. Puis, peu après, vers le milieu du XXe siècle, le procédé Haber-Bosch a permis de créer de l'ammoniac (l'engrais principal dont les plantes ont besoin pour grandir) littéralement à partir de l'air, au lieu de l'extraire du Chili et de l'expédier dans le monde entier. Ensuite, dans les années 1970, les OGM ont été inventés et sont devenus populaires lorsqu'ils ont été utilisés avec des herbicides plus puissants. Cela a considérablement augmenté les rendements presque du jour au lendemain et a permis à la production de céréales de croître et de devenir plus rentable. Dans les années 1990 et 2000, le GPS a été popularisé et a facilité la plantation avec un espacement égal et la cohérence dans toutes les autres tâches requises sur chaque champ.
L'intelligence artificielle, combinée à la robotique, offre la possibilité d'automatiser des tâches qui étaient difficiles à automatiser auparavant (aidant à pallier la pénurie de main-d'œuvre), offre la possibilité de "personnaliser" le traitement que chaque plante reçoit (en mesurant exactement ce dont chacune d'elles a besoin de manière rentable), et offre la possibilité aux agriculteurs de mieux comprendre et donc de prédire quelles actions seront les plus performantes dans quelles conditions (les aidant à s'adapter à des conditions météorologiques volatiles). Ce sont des raisons théoriques pour lesquelles je suis enthousiaste de voir de plus en plus d'IA et de robotique dans les fermes. Très concrètement, je l'ai vu être déployé avec succès puis utilisé à grande échelle par les agriculteurs et j'ai trouvé cela très excitant.
🍰 MF : Chez Farmwise, vous utilisez à la fois des logiciels d'IA et de la robotique. Pourquoi devez-vous utiliser les deux ? Quelle est la partie la plus précieuse ? La plus difficile ?
👉 Sébastien :
Lorsque nous avons commencé Farmwise, mon co-fondateur et moi avions une forte préférence pour essayer de construire des solutions "uniquement logicielles". Aucun de nous deux n'avait construit de matériel auparavant (nous sommes tous deux des ingénieurs en mathématiques-physique-informatique formés entre l'École Polytechnique en France et MIT-Stanford aux États-Unis). C'est donc naturellement par là que nous avons commencé. Nous avons construit des applications prototypes pour capturer des informations sur le terrain et mieux les organiser pour les agriculteurs. Nous avons évidemment pensé à utiliser des drones pour obtenir des images précises des plantes, espérant que si les agriculteurs avaient accès à plus d'informations, ils seraient en mesure de prendre de meilleures décisions et de résoudre ainsi certains des problèmes auxquels ils sont confrontés.
Nous avons rapidement réalisé que le goulot d'étranglement empêchant ces agriculteurs d'atteindre une efficacité supérieure (coût, main-d'œuvre et efficacité chimique) n'était ni l'information ni l'analyse. C'était l'infrastructure physique sur le terrain. Lorsque vous allez sur un terrain aujourd'hui, il ne faut pas longtemps pour remarquer qu'aucun des équipements n'a la précision mécanique pour différencier ce qu'ils font. Ainsi, quel que soit le niveau d'information que vous pouvez leur fournir, ils seront limités par les outils qu'ils ont pour agir sur cette information. C'est pourquoi nous avons décidé d'avoir une approche combinée, exploitant à la fois des modèles d'IA en logiciel et de la robotique de précision en matériel. Cela nous a permis de construire une solution complète pour eux.
Le matériel est incroyablement difficile, mais parfois il est nécessaire. La plupart des entreprises uniquement logicielles dans l'AgTech ont échoué ou sont en difficulté. Le matériel est difficile parce que les cycles d'itération sont beaucoup plus longs et plus coûteux. Les erreurs coûtent cher. La mise à l'échelle est coûteuse et lente. Je dirais que dans l'exemple de Farmwise au moins, cela fait partie de notre barrière à l'entrée, rendant ce que nous avons construit, et l'apprentissage que nous avons obtenu en cours de route, très précieux.
🍰 MF : Peux-tu partager les enseignements tirés de la vie réelle lorsque vous déployez un produit centré sur l'IA à grande échelle ? Qu'est-ce qui vous a surpris ? Comment vous assurez-vous d'atteindre la fiabilité et la prévisibilité que tant de systèmes d'IA ont du mal à atteindre ?
👉 Sébastien :
L'une des premières choses que nous avons dû faire concernait les données. Parce qu'il n'y a pas de jeux de données disponibles au public sur les plantes. Et parce que la qualité des données est si importante pour notre cas d'utilisation. Nous avons dû construire notre propre jeu de données. Pour ce faire, nous avons construit un pod à 4 roues et nous l'avons utilisé sur autant de champs que possible pour accumuler suffisamment de données (avec la bonne quantité, qualité et diversité) pour que nos ingénieurs et scientifiques en apprentissage profond puissent construire des modèles prédictifs qui correspondent aux exigences de qualité du client sur le terrain. Une des surprises que nous avons eues était de savoir combien peu d'images d'un seul champ sont nécessaires pour obtenir la plupart des apprentissages que ce champ peut fournir (en mesurant la précision incrémentielle que vous obtenez en ajoutant plus d'images du même champ, vous pouvez décider combien sont suffisantes par champ). C'est plus petit que je ne le pensais. Ce qui compte le plus, c'est le nombre de champs différents (différentes cultures, étapes, lumières, sol, espèces de mauvaises herbes, type de débris) que vous pouvez ajouter à votre jeu de données.
Un autre apprentissage, ces produits basés sur l'IA ne sont jamais "terminés". Ils évoluent toujours. Les pratiques agricoles changent régulièrement, les espèces de mauvaises herbes prédominantes changent régulièrement, pour ne nommer que deux variables. Cela implique que les jeux de données et les modèles doivent évoluer en continu. L'un des atouts critiques que nous avons chez Farmwise est notre infrastructure logicielle. Après des années d'investissement et d'amélioration continue, elle nous permet d'itérer plus rapidement et de manière plus rentable sur de nouvelles données pour améliorer les modèles. L'amélioration de notre pipeline ML (de la capture des données au déploiement du modèle) est plus critique à mon avis que n'importe lequel de nos modèles ML. Se concentrer sur la résolution de ce problème "méta" (construire un système qui résout efficacement le problème du client) est une stratégie dont je suis très fier que nous ayons choisi de l'avoir. Cela nous permet non seulement d'itérer sur de nouvelles données, mais aussi sur de nouvelles idées provenant des idées de pointe issues de la recherche académique en apprentissage profond.
🍰 MF : Pour les lecteurs les plus avertis en tech, as-tu des enseignements clés à partager sur les modèles ML, les données ou les systèmes qui pourraient être utiles à d'autres personnes essayant de mettre en œuvre des solutions dans le monde réel ?
👉 Sébastien :
Bien sûr. J'ai parlé du compromis entre la quantité et la qualité / diversité dans la construction de vos jeux de données. Cela semble assez évident, je pense, pour les personnes construisant des systèmes ML en production. Une autre remarque sur la construction de jeux de données réels est que la cohérence du matériel compte beaucoup. Vous voulez vous assurer que vous avez la conception de votre matériel d'acquisition de données proche de la finalisation avant de dépenser beaucoup d'argent pour construire un grand jeu de données. De petits biais dans les données provenant du matériel d'acquisition de données peuvent réduire considérablement la valeur des données. Nous avons dû reconstruire nos jeux de données il y a quelques années parce que nous avions apporté un changement trop drastique au système de caméra que nous utilisions pour acquérir les données.
Une autre découverte intéressante est que nous avons pu augmenter la précision de nos modèles de vision par ordinateur (qui détectent les espèces de plantes en temps réel sur nos machines) en utilisant des données simulées (dans notre cas semi-simulées). En patchant des images les unes sur les autres, nous avons pu créer de fausses instances de champs et augmenter la diversité de nos jeux de données. Par exemple, nous avons patché des espèces de mauvaises herbes spécifiques sur des images de champs qui ne les avaient pas pour "simuler" les futurs champs qui pourraient les contenir. Cela nous a permis d'augmenter la robustesse de nos algorithmes dans le monde réel où la diversité peut souvent vous surprendre.
Une autre découverte a été qu'au fil du temps, nous avons décidé de mettre en œuvre un seul modèle pour détecter toutes les espèces au lieu d'un modèle par espèce de culture. Cela est moins évident qu'il n'y paraît parce que dans notre cas d'utilisation, nous savons à l'avance quel type de culture est sur le terrain (les agriculteurs savent ce qu'ils ont planté, ils ne connaissent tout simplement pas les espèces de mauvaises herbes qui poussent à côté d'eux). Nous avons donc commencé par construire un modèle de détection spécifique aux cultures contre les mauvaises herbes pour chaque type de culture. En éliminant l'incertitude sur le type de culture, nous avons pu obtenir de meilleurs résultats avec des modèles de détection spécifiques aux cultures. Au fil du temps, à mesure que nous accumulions plus de données et que nous itérions sur la structure des réseaux neuronaux eux-mêmes, nous avons trouvé un moyen de construire un modèle hybride qui est essentiellement formé pour détecter d'abord quel type de culture est présent sur le terrain et ensuite travailler sous cette hypothèse pour discriminer entre ce type de culture et les mauvaises herbes. Cela a augmenté la précision de notre détection.
Il reste de nombreux défis devant nous. En particulier, nous travaillons pour mieux gérer les cas d'utilisation où les plantes sont plus occultées, pour exécuter notre inférence encore plus rapidement et pour continuer à nous adapter à la diversité que nous rencontrons lorsque nous nous étendons géographiquement à plus de régions du monde. Il y a une tonne de défis à résoudre et cela, avec l'impact réel de voir nos algorithmes ML et nos systèmes robotiques aider les agriculteurs tous les jours, c'est ce qui rend le travail sur ces problèmes excitant.
🍰 MF : Merci Sébastien, peux-tu nous laisser les sources que tu recommandes si nous voulons approfondir le sujet ?
👉 Sébastien :
- The Alchemy of Air de Thomas Hager. Sur l'invention du procédé Haber-Bosch et comment cela a sauvé le monde. C'est un excellent mélange d'aventure, de science, de guerre et de découverte scientifique. L'un de mes livres préférés.
- Seeds of Science de Mark Lynas. Sur les OGM sans les émotions.
- Creativity Inc : Par le fondateur de PIXAR. Sur la façon de construire et de gérer des équipes créatives qui innovent en continu.
Très belle semaine à tous !
— l’équipe millefeuille.ai
La meilleure façon de prendre goût à l'IA.
Applications concrètes. Actualités. Analyses d'experts.
Si comme près de 5'000 personnes tu veux tout comprendre à l'IA, abonne-toi.