Etude de la Pénalisation GraphNet en Analyse de Données Multi-blocs
Résumé
L'intégration de données multiblocs est maintenant incontournable pour analyser des données complexes allant, par exemple,
des données multi-omiques, aux données d'imagerie génétique. Par ailleurs, les bases de données biologiques de référence contiennent maintenant une information très riche qu'il convient d'intégrer dans de telles analyses.
Nous proposons d'explorer la méthode netSGCCA qui permet l'intégration de réseaux dans le cadre de l'Analyse des Corrélations Canonique Généralisée pénalisée à l'aide d'une pénalité GraphNet. Plus particulièrement, nous souhaitons mettre en lumière un des désavantages de cette pénalité, qui est d'introduire des composantes ``haute-fréquence''.
L'exemple que nous étudions est issu d'une étude clinique sur la Spondylarthrite ankylosante et comprend trois blocs : deux blocs de données d'expression, et un bloc de données cliniques. Le réseau de référence que nous utilisons est extrait de la base de données STRING-DB. Nous montrons sur cet exemple un moyen de ne conserver que les éléments ``basse fréquence'' induits par l'introduction de la pénalité GraphNet.