Agenda
À la une

Soutenance de thèse de Florian Hébert

Agrocampus Ouest, campus de Rennes, amphi Roux

Prise en compte de la dépendance pour des problèmes de test global et de prédiction

Thèse dirigée par David Causeur (UMR IRMAR Laboratoire mathématiques appliquées)

Résumé

Dans de nombreux types de données, tels que les données génomiques ou fonctionnelles, les variables explicatives sont caractérisées par une forte structure de dépendance. Pour des problèmes variés, comme la construction de tests globaux ou de règles de prédiction, la prise en compte de cette structure de dépendance reste un problème ouvert. Plusieurs auteurs recommandent de prendre explicitement en compte cette dépendance, tandis que d’autres proposent de l’ignorer complètement. En réalité, il apparaît que le meilleur choix entre ces deux possibilités dépend à la fois de la structure de dépendance elle-même, mais aussi de la forme du signal d’association entre les variables explicatives et la variable réponse.  Dans cette thèse, des approches adaptatives sont proposées, visant à déterminer la meilleure façon de prendre en compte la dépendance. Une méthode de test global est construite, notamment pour les problèmes de tests d’association gène-phénotype en études d’association pangénomiques. De façon similaire, une règle de régression adaptative est développée. Dans les deux cas, la prise en compte adaptative de la dépendance est permise par l’introduction de poids. Une expression explicite des poids optimaux est ensuite obtenue. Celle-ci dépend à la fois de la structure de dépendance des variables explicatives et du signal d’association. Les  résultats obtenus sur des simulations et des  jeux de données non simulés démontrent que  les méthodes proposées offrent de bonnes  performances dans des situations variées.

Mots clés : dépendance, test global, prédiction, régression 

Title : Dependence handling for global testing and prediction problems  

Abstract : In various types of data, including  genomic or functional data, explanatory  variables are characterized by a strong  dependence structure. For diverse problems,  such as global testing or for the construction of  prediction rules, handling this dependence  structure remains an open issue. Several  authors recommend to properly take the  dependence into account, whereas others  propose to completely ignore it. It appears that  the best choice depends on both the  dependence structure itself and the pattern of  the association signal between the explanatory  variables and the response.  In this thesis, adaptive approaches are proposed, aiming at determining the best way to handle dependence. An adaptive global testing method is therefore constructed, namely for gene testing problems in genomewide association studies. Similarly, an adaptive regression rule is developed. In both cases, the flexible handling of dependence is performed by the introduction of weights. An explicit expression for the optimal weights is then  derived, which depends on both the  dependence structure of the explanatory  variables and the association signal. The results obtained in simulation studies and on non-simulated datasets demonstrate that the proposed methods perform well in various situations.

Keywords : dependence, global testing, prediction, regression