Une machine à noyau momentanée pour l'exploration de données cliniques afin d'éclairer la prise de décision médicale | Groupe de séparateurs par gravité Co., Ltd

Rapports scientifiques volume 13, Numéro d'article : 10459 (2023) Citer cet article

432 Accès

6 Altmétrique

Détails des métriques

La prise de décision médicale assistée par apprentissage automatique présente trois défis majeurs : parvenir à une parcimonie de modèle, garantir des prédictions crédibles et fournir des recommandations en temps réel avec une efficacité informatique élevée. Dans cet article, nous formulons la prise de décision médicale comme un problème de classification et développons une machine à noyau momentané (MKM) pour relever ces défis. L'idée principale de notre approche est de traiter les données cliniques de chaque patient comme une distribution de probabilité et d'exploiter les représentations de moments de ces distributions pour construire le MKM, qui transforme les données cliniques de grande dimension en représentations de basse dimension tout en conservant les informations essentielles. Nous appliquons ensuite cette machine à divers ensembles de données cliniques pré-chirurgicales pour prédire les résultats chirurgicaux et éclairer la prise de décision médicale, ce qui nécessite beaucoup moins de puissance de calcul et de temps de classification tout en offrant des performances favorables par rapport aux méthodes existantes. De plus, nous utilisons des ensembles de données synthétiques pour démontrer que le cadre d'exploration de données basé sur le moment développé est robuste au bruit et aux données manquantes, et atteint la parcimonie du modèle, offrant un moyen efficace de générer des prédictions satisfaisantes pour faciliter la prise de décision médicale personnalisée.

La chirurgie, en tant qu’intervention médicale majeure, est généralement envisagée lorsque d’autres traitements aboutissent à des résultats insatisfaisants. Prédire les événements indésirables après une intervention chirurgicale sur la base des données cliniques préchirurgicales des patients telles que les données du dossier de santé électronique (DSE) est d'une importance cruciale pour informer les médecins et les patients dans la prise de décision1,2. Ces dernières années, la disponibilité accrue des données cliniques et de la puissance de calcul a considérablement stimulé le développement de techniques d’apprentissage automatique (ML) pour extraire des informations à partir de données cliniques. En particulier, les algorithmes ML ont fait des progrès significatifs dans les procédures médicales assistées par l’IA pour la prédiction préopératoire des résultats postchirurgicaux grâce aux DSE3,4. Le problème général de ML se concentre sur la recherche d'une fonction f appropriée mappant chaque point de données d'entrée \({\textbf{X}}\) à la sortie souhaitée \({\textbf{y}}\), c'est-à-dire,

Cette tâche est particulièrement difficile pour les ensembles de données contenant des dossiers cliniques de grande taille et de types de données mixtes, notamment des diagnostics, des traitements, des signes vitaux et des valeurs de laboratoire5.

Au cours de la dernière décennie, de nombreuses méthodes assistées par ML ont été proposées pour aider à la prise de décision médicale grâce à la prédiction des événements postchirurgicaux. Par exemple, pour la chirurgie bariatrique, les contributions notables incluent l'application de la régression logistique (LR) et de la régression de Poisson (PR) pour estimer le taux de réadmission6, l'utilisation de réseaux neuronaux (NN) et de machines à amplification de gradient (GBM) pour prédire fuite gastro-intestinale et thromboembolie veineuse7,8, et développement de l'algorithme du super apprenant pour prédire le risque de réadmission à 30 jours après une chirurgie bariatrique9,10. En plus d'évaluer d'éventuels événements postchirurgicaux, les méthodes ML ont été largement appliquées pour identifier les anomalies dans les images médicales telles que les lésions précancéreuses ou précancéreuses11,12,13,14. Les principaux exemples vont d'une approche d'apprentissage en profondeur à la prédiction de la mortalité chez les patients atteints de maladie coronarienne et d'insuffisance cardiaque15 jusqu'aux méthodes quantitatives d'extraction de caractéristiques d'images pour le pronostic d'une revascularisation précoce chez les patients suspectés de maladie coronarienne16. Sur le plan algorithmique, les réseaux de neurones profonds ont attiré les chercheurs et les praticiens en médecine, en raison de leur capacité à découvrir des structures cachées dans de grands ensembles de données, ce qui conduit à une forte probabilité d'obtenir des résultats satisfaisants dans des conditions appropriées17. Parmi ces travaux, l'intégration des techniques de ML dans la recherche médicale, bien que réussie à bien des égards, souffre généralement d'une faible efficacité informatique en raison de la structure hétérogène, par exemple en raison de la rareté et de l'irrégularité, et de la grande taille des données cliniques18. En général, la complexité des algorithmes de ML augmente de façon exponentielle en termes de temps et d’utilisation de la mémoire en fonction de la taille des données. De plus, pour produire de meilleures performances, les réseaux de neurones profonds sacrifient davantage la robustesse au bruit et la parcimonie du modèle, en plus de l’efficacité informatique19.

0\) is a constant controlling the sparsity of the solution. Moreover, \(\bar{{\textbf{K}}}^{(j)} = \Gamma {\textbf{K}}^{(j)} \Gamma\) and \(\bar{{\textbf{L}}} = \Gamma {\textbf{L}} \Gamma\) are centered Gram matrices with the entries \({\textbf{K}}_{m,n}^{(j)} = k(p_{j,m},p_{j,n})\) and \({\textbf{L}}_{m,n} = l(y_m,y_n)\) defined by using some kernel functions k and l, where \(y_i\) denotes the class label of the \(i^{\textrm{th}}\) patient and \(\Gamma = {\textbf{I}}_N - \frac{1}{N} {\textbf{1}}_N {\textbf{1}}^{\top }_N\) is the centering matrix. Moreover, for memory and computational efficiency, we use Block HSIC Lasso24 in our experiments./p>