L'IA pourrait être l'arme secrète pour prévenir la prochaine pandémie mondiale
En 2016, quatre ans avant qu'une pandémie n'arrête le monde, le Programme des Nations Unies pour l'environnement (PNUE) tirait la sonnette d'alarme sur les maladies zoonotiques, les identifiant comme un problème émergent clé de préoccupation mondiale.
Aujourd'hui, selon l'Organisation mondiale de la santé, environ un milliard de cas et des millions de décès chaque année sont le résultat de zoonoses, dans lesquelles les agents pathogènes passent des animaux vertébrés aux humains. Et sur les 30 nouveaux virus humains qui ont été identifiés au cours des trois dernières décennies, 75 % d'entre eux proviennent d'autres animaux.
Mais les scientifiques de l'Université de Montréal pensent que leur nouvelle modélisation de l'intelligence artificielle a la capacité de mettre en évidence et de prédire les «points chauds» viraux émergents à surveiller, ce qui pourrait faire le saut sur les infections probables d'animal à humain et, idéalement, prévenir quelque chose comme COVID -19 de se reproduire.
L'algorithme, qui a demandé aux chercheurs trois ans et 10 000 heures de calcul, a pu identifier 80 000 nouvelles interactions potentielles entre les virus et les hôtes, et où dans le monde elles sont les plus préoccupantes.
"Nous travaillions sur ce projet depuis les premiers mois de 2020, avant que la pandémie ne décolle", a déclaré Timothée Poisot, professeur au Département des sciences biologiques de l'Université de Montréal.
Grâce à l'apprentissage automatique, plutôt que de créer manuellement des liens dans les données, l'algorithme a pu évaluer des milliers d'espèces de mammifères et des milliers de virus et trouver toutes les combinaisons viables.
"Le problème fondamental est que nous ne connaissons qu'entre un et deux pour cent des interactions entre les virus et les mammifères", a déclaré Poisot. "Les réseaux sont dispersés et il y a peu d'interactions, qui sont concentrées sur quelques espèces seulement. Nous voulons savoir quelle espèce de virus est susceptible d'infecter quelle espèce de mammifère, afin que nous puissions établir quelles interactions sont les plus susceptibles de se produire."
L'équipe a utilisé le plus grand ensemble de données ouvertes, CLOVER, qui décrit 5 494 interactions entre 829 virus et 1 081 hôtes mammifères, dont la majorité se concentre sur les animaux sauvages, ainsi que plusieurs autres ensembles de données, y compris le Host-Pathogen Phylogeny Project (HP3), Enhanced Base de données sur les maladies infectieuses (EID2) et Base de données mondiale sur les parasites des mammifères V2.0 (GHMPD2).
"Certains des ensembles de données que nous avions étaient plus anciens : ils contenaient des noms obsolètes pour des espèces particulières, ou ils comportaient des erreurs parce que les données avaient été saisies à la main", a déclaré Poisot à propos du processus chronophage qui était nécessaire pour le apprentissage automatique. "Après cela, la tâche principale était de déterminer le niveau de confiance que nous avions dans la capacité du modèle à faire des prédictions."
Les chercheurs se sont ensuite concentrés sur 20 virus jugés préoccupants et susceptibles de se propager aux humains.
"Nous avons eu beaucoup de discussions au sein de l'équipe, car au début, certains résultats nous semblaient étranges", a déclaré Poisot, qui a été surpris de voir le virus Ectromelia lié à la souris identifié comme un virus à surveiller. "Nous étions sceptiques, mais lorsque nous avons cherché dans la littérature, nous avons découvert qu'il y avait eu des cas chez l'homme."
Les chercheurs ont également pu identifier des régions grâce au modèle, ce qui pourrait aider les scientifiques à poursuivre la recherche virale et vaccinale de manière plus ciblée.
"Notre modèle fait des prédictions spatiales, mais plus précisément, le modèle indique spécifiquement dans quel groupe de mammifères et à quel endroit certains types de virus sont susceptibles de se trouver", a déclaré Poisot.
Les résultats ont montré deux domaines d'intérêt spécifique : le bassin amazonien, où l'interaction entre le virus et l'hôte est plus originale et où de nouvelles interactions sont les plus susceptibles d'être observées ; et l'Afrique subsaharienne, où l'algorithme a identifié de nouveaux hôtes susceptibles d'être porteurs de virus zoonotiques.
"Nous déplaçons vraiment les endroits où nous devons aller étudier les mammifères pour découvrir de nouveaux virus", a expliqué Poisot.
Alors que les agents pathogènes zoonotiques peuvent prendre de nombreuses formes - bactériennes, parasitaires, virales - leur prévalence devrait être de plus en plus courante à mesure que les animaux humains et non humains continuent d'occuper une plus grande partie du même espace.
L'équipe espère que son modèle pourra non seulement informer de nouveaux points de départ pour la recherche, mais aussi offrir une surveillance dans le monde réel. La prochaine étape serait de faire passer cette IA au niveau supérieur et d'inclure davantage de mécanismes microbiologiques, immunologiques et écologiques, pour un aperçu plus complet d'un virome mondial.
"L'algorithme prend le réseau que nous connaissons déjà et le projette dans un nouvel espace, un peu comme un théâtre d'ombres : il éclaire les interactions d'une manière nouvelle", a déclaré Poisot. "Nous savons maintenant quelles espèces surveiller, où et pour quel type de virus."
La recherche a été publiée dans la revue Patterns.
Source : Université de Montréal