Une technique d'apprentissage profond basée sur des réseaux convolutifs temporels séparables pour découvrir des médicaments antiviraux
Rapports scientifiques volume 13, Numéro d'article : 13722 (2023) Citer cet article
2985 Accès
5 Altmétrique
Détails des métriques
Le nombre alarmant de décès causés par la pandémie de COVID-19 a contraint la communauté scientifique à accélérer le processus de découverte de médicaments thérapeutiques. À cet égard, la collaboration entre scientifiques biomédicaux et experts en intelligence artificielle (IA) a conduit au développement de nombreux outils in silico pour le criblage initial de molécules thérapeutiques. Tous les organismes vivants produisent des peptides antiviraux (AVP) dans le cadre de leur première ligne de défense contre les virus envahisseurs. Le modèle Deep-AVPiden proposé dans cet article et son application Web correspondante, déployée sur https://deep-avpiden.anvil.app, constituent un effort visant à découvrir de nouvelles AVP dans les protéomes d'organismes vivants. Outre Deep-AVPiden, un modèle informatiquement efficace appelé Deep-AVPiden (DS) a également été développé en utilisant le même réseau sous-jacent mais avec des convolutions séparables par points. Les modèles Deep-AVPiden et Deep-AVPiden (DS) affichent respectivement une précision de 90 % et 88 %, et tous deux ont une précision de 90 %. De plus, les modèles proposés ont été comparés statistiquement à l'aide du test t de Student. En comparant les modèles proposés avec les classificateurs de pointe, il a été constaté qu’ils sont bien meilleurs qu’eux. Pour tester le modèle proposé, nous avons identifié certaines AVP dans les protéines de défense naturelles des plantes, des mammifères et des poissons et avons constaté qu'elles présentaient une similarité de séquence appréciable avec certains peptides antimicrobiens validés expérimentalement. Ces AVP peuvent être synthétisées chimiquement et testées pour leur activité antivirale.
La découverte de nouveaux médicaments antimicrobiens qui tuent ou inhibent les agents pathogènes potentiellement mortels attire beaucoup d'attention en raison de l'incapacité et de l'inefficacité des antibiotiques conventionnels. Cependant, il est pertinent que la nouvelle classe de médicaments ait une efficacité élevée, une activité à large spectre et peu ou pas d’effets secondaires sur la santé humaine. Dans cette direction, des médicaments peuvent être développés à partir de peptides antimicrobiens (AMP), qui font partie intégrante de la première ligne de défense naturelle des organismes vivants. De nos jours, l’analyse et la modélisation des AMP à l’aide du machine/deep learning ont pris de l’ampleur1,2,3,4,5,6,7. Les techniques de modélisation de séquences basées sur l'apprentissage profond, telles que les réseaux neuronaux récurrents (RNN), les réseaux de mémoire à long terme (LSTM), les réseaux convolutifs temporels (TCN)8,9, etc., peuvent être utilisées efficacement pour développer des modèles robustes pour classer et découvrir de nouveaux peptides thérapeutiques comme les AMP, les peptides anticancéreux10,11, etc., dans les protéomes de diverses formes de vie. Notez que la modélisation de séquence est une technique qui entre et sort des données séquentielles, qui peuvent être sous forme de texte, audio, vidéo, etc. À cette fin, RNN a été développé comme une architecture d'apprentissage en profondeur pour capturer les dépendances entre les unités d'un élément donné. séquence pour faire des prédictions. Cependant, il ne parvient pas à capturer les dépendances à longue portée entre ces unités en raison du problème de gradient de disparition. Les LSTM ont été proposés comme une amélioration par rapport aux RNN dans la mesure où ils surmontent ce problème en utilisant un mécanisme de déclenchement (portes d'entrée, de sortie et d'oubli) pour mémoriser la corrélation entre les unités sur une longue plage. Cependant, les LSTM nécessitent plus de mémoire que les RNN pour stocker des résultats partiels. De plus, les modèles basés sur RNN et LSTM fonctionnent de manière séquentielle, de sorte que les unités d'une séquence donnée (également appelées pas de temps) ne peuvent pas être traitées en parallèle. Cependant, de telles lacunes ne sont pas présentes dans les RPT. Les calculs effectués par cette architecture d'apprentissage profond peuvent être facilement distribués et parallélisés sur des systèmes de traitement multicœurs, et ne consomment pas non plus beaucoup de mémoire.
Plusieurs modèles ont été construits pour classer les peptides antiviraux (AVP) à l’aide de ces algorithmes d’apprentissage profond. Notez que les AVP sont une sous-classe d’AMP qui ciblent l’hôte contre les virus envahisseurs en les ciblant ou en ciblant les cellules hôtes pour inhiber la réplication virale. Certaines AVP sont virucides car elles inhibent la protéine virale à l'extérieur de la cellule hôte ou entrent en compétition pour le site de liaison sur la membrane cellulaire de l'hôte12. En revanche, d’autres interfèrent avec différentes étapes du cycle de vie viral, telles que l’expression des gènes viraux, la réplication, etc. Il est intéressant de noter que de nombreuses AVP sont présentes dans les protéomes des mammifères, des plantes, des poissons et d’autres organismes vivants. Une famille d'AVP appelées cyclotides trouvées dans les plantes empêche un large éventail de virus humains tels que le virus de l'immunodéficience humaine (VIH)13, le H1N114 et la dengue15 de se lier à la membrane cellulaire de l'hôte. La Cecropin-A dérivée d'un papillon agit contre le VIH en supprimant son expression génétique. De même, une famille de peptides antimicrobiens (AMP), connus sous le nom de dermaseptines, présents chez les grenouilles du genre Phyllomedusa, ont montré un potentiel virucide contre le VIH-116. En parlant d'AVP dérivées d'organismes marins, une classe de peptides appelés clavanines inhibe la virulence du virus de l'herpès simplex (HSV), du rotavirus et de l'adénovirus17.