Dans leur dernier article paru dans Trends in Plant Science, Lucas Amokrane (doctorant), Eric Ruelland (chercheur CNRS) accompagné de Sébastien Aubourg de l’INRAE Angers s’interrogent sur la propagation d’erreurs dans les bases de données de protéines basées sur les domaines fonctionnels.
générée par IA
En se basant sur l’exemple de leur modèle d’étude et en utilisant le terme « phosphoinositide-dependent phospholipase C Y-box-containing », ils ont pu démontrer les dérives associées à l’annotation automatique qui diffuse dans les bases.
Il apparait que la prise en compte de données structurales devient indispensable en complément de celles des séquences pour s’assurer d’une annotation fiable.