WorldCat Identities

Gassiat, Elisabeth (1961- ...).

Overview
Works: 26 works in 33 publications in 2 languages and 89 library holdings
Roles: Author, Thesis advisor, Opponent, 956
Publication Timeline
.
Most widely held works by Elisabeth Gassiat
Codage universel et identification d'ordre par sélection de modèles by Elisabeth Gassiat( Book )

4 editions published in 2014 in French and held by 45 WorldCat member libraries worldwide

Ces notes de cours se situent à l'interface entre "théorie de l'information" et "statistique". On y met en évidence les liens que le codage universel et la compression adaptative présentent avec l'inférence statistique des processus, par maximum de vraisemblance ou méthode bayésienne. Partant de résultats et outils classiques en alphabet fini, on aborde la théorie récente du codage universel en alphabet infini. On montre comment cela permet de résoudre des problèmes d'identification d'ordre, notamment pour les modèles de chaînes de Markov cachées [source : 4e de couv.]
Déconvolution aveugle by Elisabeth Gassiat( Book )

3 editions published in 1988 in French and held by 6 WorldCat member libraries worldwide

Considérant une série x formée de variables aléatoires indépendamment identiquement distribuées, et le signal Y obtenu lorsque l'on filtre X par un système linéaire s, nous étudions l'estimation de s sur la base des observations y dans le cadre semi-paramétrique suivant : la loi des x est inconnue et non gaussienne, et s possède un inverse de convolution de longueur finie fixée. Aucune hypothèse n'est faite sur la phase du système, c'est à-dire sur la causalité ou non causalité de s. Nous proposons une estimation par maximum d'objectif. L'estimateur ainsi obtenu est consistant et asymptotiquement gaussien, ce résultat restant valable quelle que soit la dimension de l'espace d'indexation des séries considérées. Nous étudions l'efficacité asymptotique de la méthode et, dans le cas causal, nous la comparons aux méthodes usuelles de moindres carrés. Interprétant notre signal sortant comme un champ autorégressif, nous proposons une méthode consistante d'identification de l'ordre du modèle.Nous étudions divers types de robustesse des estimateurs : robustesse à une sous-paramétrisation, robustesse à l'addition d'un bruit sur l'observation. Nous nous intéressons enfin au cas où la loi de x a des moments infinis, et montrons que, pour des objectifs "cumulants standardisés" et sous certaines hypothèses vérifiées en particulier pour les lois dans les domaines d'attraction de lois stables, l'estimateur obtenu reste consistant, et sa vitesse de convergence, dans le cas causal, est meilleur que pour des lois de variance finie
The estimation of the order of a mixture model by Didier Dacunha-Castelle( Book )

2 editions published in 1995 in English and held by 3 WorldCat member libraries worldwide

Testing in locally conic model, and application to mixture models by Didier Dacunha-Castelle( Book )

2 editions published in 1996 in English and held by 3 WorldCat member libraries worldwide

Approches statistiques en segmentation : application à la ré-annotation de génome by Alice Cleynen( )

1 edition published in 2013 in English and held by 2 WorldCat member libraries worldwide

We propose to model the output of transcriptome sequencing technologies (RNA-Seq) using the negative binomial distribution, as well as build segmentation models suited to their study at different biological scales, in the context of these technologies becoming a valuable tool for genome annotation, gene expression analysis, and new-transcript discovery. We develop a fast segmentation algorithm to analyze whole chromosomes series, and we propose two methods for estimating the number of segments, a key feature related to the number of genes expressed in the cell, should they be identified from previous experiments or discovered at this occasion. Research on precise gene annotation, and in particular comparison of transcription boundaries for individuals, naturally leads us to the statistical comparison of change-points in independent series. To address our questions, we build tools, in a Bayesian segmentation framework, for which we are able to provide uncertainty measures. We illustrate our models, all implemented in R packages, on an RNA-Seq dataset from a study on yeast, and show for instance that the intron boundaries are conserved across conditions while the beginning and end of transcripts are subject to differential splicing
Estimation dans des modèles à variables cachées alignement des séquences biologiques et modèles d'évolution by Ana Arribas Gil( Book )

1 edition published in 2007 in French and held by 2 WorldCat member libraries worldwide

Cette thèse est consacrée à l'estimation paramétrique dans certains modèles d'alignement de séquences biologiques. Ce sont des modèles construits à partir des considérations sur le processus d'évolution des séquences. Dans le cas de deux séquences, le processus d'évolution classique résulte dans un modèle d'alignement appelé pair-Hidden Markov Model (pair-HMM). Dans le pair-HMM les observations sont formées par le couple de séquences à aligner et l'alignement caché est une chaîne de Markov. D'un point de vue théorique nous donnons un cadre rigoureux pour ce modèle et étudions la consistance des estimateurs bayésien et par maximum de vraisemblance. D'un point de vue appliqué nous nous intéressons à la détection de motifs conservés dans les séquences à travers de l'alignement. Pour cela nous introduisons un processus d'évolution permettant différents comportements évolutifs à différents endroits de la séquence et pour lequel le modèle d'alignement est toujours un pair-HMM. Nous proposons des algorithmes d'estimation d'alignements et paramètres d'évolution adaptés à la complexité du modèle. Finalement, nous nous intéressons à l'alignement multiple (plus de deux séquences). Le processus d'évolution classique résulte dans ce cas dans un modèle d'alignement à variables cachées plus complexe et dans lequel il faut prendre en compte les relations phylogénétiques entre les séquences. Nous donnons le cadre théorique pour ce modèle et étudions, comme dans le cas de deux séquences, la propriété de consistance des estimateurs
Etude statistique du problème de la trajectographie passive by Benoît Landelle( Book )

1 edition published in 2009 in French and held by 2 WorldCat member libraries worldwide

Cette thèse présente une étude statistique du problème de la trajectographie passive. On s'intéresse dans une première partie à la question de l'observabilité pour des trajectoires paramétriques puis paramétriques par morceaux et ensuite des trajectoires à vitesse constante. La deuxième partie est consacrée à l'estimation : on présente les propriétés de l'estimateur du maximum de vraisemblance pour des trajectoires paramétriques et paramétriques par morceaux. On expose également le caractère non robuste de cette estimation en dépit de propriétés asymptotiques satisfaisantes. On s'intéresse alors à la sensibilité de l'estimation quand le modèle d'état n'est pas totalement spécifié. Son comportement est décrit pour des perturbations d'état déterministes puis stochastiques et un cadre semiparamétrique est considéré quand la loi du bruit d'état est inconnue. Dans la dernière partie, on aborde le problème de la trajectographie passive comme chaîne de Markov cachée. On s'intéresse à l'étude du filtre optimal et à sa résolution par des méthodes algorithmiques. Le filtre de Kalman étendu est expérimenté sous différentes conditions de bruit d'état. On présente ensuite des résultats de stabilité asymptotique du filtre optimal pour des chaînes de Markov cachées non ergodiques puis leur application en trajectographie passive
Estimation non paramétrique du nombre d'espèces : Application à l'étude de la faune ichtyologique du bassin du fleuve Ouëmé by Babagnidé François Koladjo( )

1 edition published in 2013 in French and held by 2 WorldCat member libraries worldwide

This manuscript is structured in two parts. The #rst part composed of Chapters 2to 4 deals with the problem of estimating the number of classes in a population withan application in ecology. The second part, corresponding to Chapter 5, concernsthe application of statistical methods to analyze fisheries data.In the first part, we consider a heterogeneous population split into several classes.From a sample, the numbers of observed individuals per class, also called abun-dances, are used to estimate the total number of classes in the population. In theliterature devoted to the number of classes estimation, methods based on a mix-ture of Poisson distributions seem to be the most effcient (see for example the workof Chao and Bunge (2002) in the parametric framework and that of Wang and Lind-say (2005) in a non-parametric framework). Applications of these approaches to realdata show that the distribution of abundances can be approximated by a convexdistribution. We propose a non-parametric approach to estimate the distribution ofabundances under the constraint of convexity. This constraint defines a theoreticalframework for estimating a discrete density. The problem of estimating the numberof classes is then tackled in two steps.We show on the one hand the existence and uniqueness of an estimator of adiscrete density under the constraint of convexity. Under this constraint, we provethat a discrete density can be written as a mixture of triangular distributions. Usingthe support reduction algorithm proposed by Groeneboom et al. (2008), we proposean exact algorithm to estimate the proportions in the mixture.On the other hand, the estimation procedure of a discrete convex density is usedto estimate the zero-truncated distribution of the observed abundance data. Thezero-truncated distribution estimate is then extended at zero to derive an estimateof the probability that a class is not observed. This extension is made so as tocancel the first component in the mixture of triangular distributions. An estimateof the total number of classes is obtained through a binomial model assuming thateach class appears in a sample by a Bernoulli trial. We show the convergence inlaw of the proposed estimator. On practical view, an application to real ecologicaldata is presented. The method is then compared to other concurrent methods usingsimulations.The second part presents the analysis of fisheries data collected on the Ouémériver in Benin. We propose a statistical approach for grouping species accordingto their temporal abundance profile, to estimate the stock of a species and theircatchability by artisanal fishing gears
Modèles contextuels et alphabets infinis en théorie de l'information by Aurélien Garivier( Book )

1 edition published in 2006 in English and held by 2 WorldCat member libraries worldwide

This thesis explores some contemporary aspects of information theory, from source coding to issues of model selection. We first consider the problem of coding memoryless sources on a countable, infinite alphabet. As it is impossible to provide a solution which is both efficient and general, two approaches are considered: we first establish conditions under which the entropic rate can be reached, and we consider restricted classes for which tail probabilities are controlled. The second approach does not set any condition on the sources but provides a partial solution by coding only a part of the information - the pattern - which captures the repetitions in the message. In order to study more complex processes, we come back to the case of finite memory sources on a finite alphabet : it has given rise to many works and efficient algorithms like the Context Tree Weighting (CTW) Method. We show here that this method is also efficient on anon-parametric class of infinite memory sources: the renewal processes. We show then that the ideas on which CTW is based lead to a consistent estimator of the memory structure of a process, when this structure is finite. In fact, we complete the study of the BIC context tree estimator for Variable Length Markov Chains. In the last part, it is shown how similar ideas can be generalized for more complex sources on a (countable or not) infinite alphabet. We obtain consistent estimators for the order of hidden Markov models with Poisson and Gaussian emission
Estimation semi-paramétrique à l'ordre 2 et applications by Ismaël Castillo( Book )

1 edition published in 2006 in English and held by 2 WorldCat member libraries worldwide

Segmentation spatiale et sélection de modèle théorie et applications statistiques by Antoine Chambaz( Book )

1 edition published in 2003 in French and held by 2 WorldCat member libraries worldwide

Cette thèse trouve sa dynamique dans l'élaboration d'une méthode originale de raffinement de localisation du trafic de téléphonie mobile en zone urbaine pour France Télécom R & D, ainsi que dans l'étude de thèmes théoriques soulevés lors de notre exploration. Notre approche est de nature statistique. Il apparaît que les thèmes centraux de cette thèse sont la segmentation spatiale et la sélection de modèle. Nous introduisons dans un premier temps les données sur lesquelles nous avons fondé notre approche du problème, que nous expliquons à leur lumière. Nous motivons le choix d'un modèle de régression hétéroscédastique. Nous présentons ensuite une démarche non paramétrique par arbres de régression de type CART et ses extensions par ré-échantillonnage Bagging et Boosting dans un cadre de régression homoscédastique. Nous proposons une adaptation de ces techniques au cas hétéroscédastique. Une analyse originale de l'importance des variables y est as~ociée. L'application commentée de notre méthode à divers jeux de données de trafic constitue notre réponse finale au problème initial. Le travail appliqué évoqué plus tôt motive l'étude de la consistance d'une famille d'estimateurs de l'ordre et de la segmentation d'un modèle segmenté. Nous nous consacrons aussi, dans un cadre général de sélection de modèle dans un emboîtement, à l'estimation de l'ordre d'un modèle et aux propriétés de consistance, ainsi qu'aux vitesses de sur- ou sous-estimation. Une approche fonctionnelle, i.e. une approche pour laquelle les événements d'intérêt sont exprimés en termes d'événements sur la mesure empirique, permet d'unifier et de généraliser une large gamme de résultats antérieurs. Les preuves font appel à une variété de techniques: arguments classiques de minimisation de contraste, concentration, inégalités maximales pour des variables dépendantes, lemme de Stein, pénalisation, Prin- cipes de Grandes et Moyennes Déviations pour la mesure empirique, tour à la Hu ber
Estimation semi-paramétrique de la période de fonctions périodiques inconnues dans divers modèles statistiques théorie et applications by Céline Lévy-Leduc( Book )

1 edition published in 2004 in French and held by 2 WorldCat member libraries worldwide

This thesis is devoted to semiparametric period estimation of unknown periodic functions in various statistical models as well as the construction of nonparametric tests to detect a periodic signal in the midst of noise. In chapter 1, we propose asymptotically optimal estimators of the period of an unknown periodic function and of the periods of two periodic functions from their sum corrupted by Gaussian white noise. In chapter 2, we propose a practical implementation of the period estimation method based on the ideas developed in the first chapter that we test on simulated laser vlbrometry signals. This algorithm is used in chapter 3 on real musical data. In chapter 4, we propose an estimator of the period when the observations are those of a particular almost periodic function corrupted by Gaussian white noise as well as a practical implementation of the method. This algorithm has also been tested on laser vibrometry data. In chapter 5, we propose a test in order to detect periodic functions in the midst of noise when the period of the function and the variance of noise are unknown. It is proved to be adaptive in the minimax sense and has been tested on laser vibrometry data
Estimation dans des modèles à variables cachées by Catherine Matias( Book )

1 edition published in 2001 in English and held by 2 WorldCat member libraries worldwide

This thesis is devoted to the inference in hidden-variables models. The Chapter 1 considers the properties of the maximum likelihood estimator (MLE) for a possibly not stationary hidden Markov model, where the hidden state space is a metric compact space, and both the transition kernel of the hidden chain and the conditional distribution of the observations depend on a parameter. For identifiable models, consistency, asymptotic normality and efficiency of the MLE is shown to follow from exponential memorylessness properties of the state prediction filter and geometric ergodicity of suitably extended Markov chains. Chapter 2 deals with a semiparametric deconvolution model. The observations are the independent sum of a signal composed by i.i.d. random variables with common unknown density g, and a white noise sequence Gaussian centered with unknown standard deviation s. When s is unknown, we prove that the rate of convergence for the estimation of g is seriously deteriorated. We propose an estimator of s that is nearly minimax when g has a support included in some fixed compact set. We also construct a universal estimator of s (i.e. without any constraint on g except the one that ensures the identifiability of the model). Chapter 3 still deals with the convolution model but assuming that the Gaussian noise has a known variance (fixed to 1). We study the estimation properties of linear functionals of g depending on a entirely known function f. We extend the results of Taupin (1998, 2001) when f is a polynomial or a trigonometric function, proving lower bounds for the pointwise minimax quadratic risk and for the minimax risk with respect to the uniform norm, and establishing lower and upper bounds for the minimax risk with respect to the "p-norm". We prove that the estimator given by Taupin (2001) reaches the optimal rates when f is a polynomial function and is nearly minimax when f is a trigonometric function
Sélection de variable structure génétique d'une population et transmission de Plasmodium à travers le moustique by Wilson Toussile( Book )

1 edition published in 2010 in French and held by 2 WorldCat member libraries worldwide

This thesis is concerned with variable selection in two practical problems. The first one is the identification of genetically homogeneous populations without prior information on the target population. The structure of interest may be contained in only a subset of available genetic markers. We propose a model selection procedure to simultaneously solve the two-fold problem of selection of the number of populations and the relevant subset of variable. The models in competition are compared using penalized maximum likelihood criteria. Under weak assumptions on the penalty function, we proved the consistency of the selection procedure. We also proposed a new penalty function with an associated non-asymptotic oracle inequality. ln practice, this result suggests a penalty function defined up to a multiplicative parameter which is calibrated thanks to the slope heuristics. Using simulated data, we found that the calibration of the penalty term improves the perforrnances of the selection procedure with respect to classical asymptotic criteria such as AIC and BlC. ln addition, we proposed a stand alone C++ package implementing our proposed selection procedure. The second problem is motivated by malaria control strategies aiming at reducing disease transmission intensity. The data we have at hand are described by variables of different types. ln addition their number is of the order of the sample size. We considered a variable selection procedure based on the variable importances from random forests to face the variable selection problem. The selected variables are assessed in Zero Inflated Negative Binomial model
Tests de modeles par maximum de vraisemblance by Christine Keribin( Book )

1 edition published in 1999 in French and held by 1 WorldCat member library worldwide

L'ORDRE D'UN MODELE PARAMETRIQUE EST, GROSSIEREMENT, LE NOMBRE DE PARAMETRES NECESSAIRES POUR DEFINIR LE MODELE. LORSQUE CET ORDRE N'EST PAS CONNU, L'ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE VA SURESTIMER L'ORDRE, POUR S'AJUSTER LE MIEUX AUX DONNEES. MAIS UN MODELE SUR-PARAMETRE NE DONNERA PAS DE BONS RESULTATS DE PREDICTION. AINSI, IL EST INTERESSANT D'ETUDIER DES ESTIMATEURS ET DES TESTS DE L'ORDRE. NOUS ETUDIONS DES TESTS DE RAPPORT DE VRAISEMBLANCE DANS LE CADRE DE TROIS MODELES : LE MODELE A OBSERVATIONS INDEPENDANTES ET IDENTIQUEMENT DISTRIBUEES (I.I.D.) IDENTIFIABLE, MEME QUAND L'ORDRE SURESTIME, LE MODELE DE MELANGE A OBSERVATIONS I.I.D. (QUI N'EST PAS IDENTIFIABLE QUAND LE NOMBRE DE COMPOSANTES EST SURESTIME), ET LE MODELE DE CHAINE DE MARKOV CACHEE (CMC) A OBSERVATIONS CONTINUES (QUI PRESENTE LES MEMES PROBLEMES D'IDENTIFIABILITE QUE LE PRECEDENT, AVEC EN PLUS LA DEPENDANCE MARKOVIENNE). DANS LE PREMIER CAS, NOUS UTILISONS DES RESULTATS CONNUS DE CONSISTANCE DE L'ESTIMATEUR DE L'ORDRE POUR DETERMINER LA VITESSE ASYMPTOTIQUE DE LA PROBABILITE DE SE TROMPER D'ORDRE. DANS LE SECOND CAS, NOUS DEMONTRONS D'ABORD LA CONSISTANCE DE L'ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE PENALISEE SOUS CERTAINES HYPOTHESES, PUIS NOUS DONNONS UN MAJORANT DU NIVEAU D'UN TEST DE CONTAMINATION. DANS LE DERNIER CAS, NOUS TESTONS UN MODELE A OBSERVATIONS I.I.D. CONTRE UN MODELE CMC A DEUX ETATS CACHES. DANS CE CAS, SUR UN SOUS-ENSEMBLE DES PARAMETRES, NOUS MONTRONS QUE LE RAPPORT DE VRAISEMBLANCE TEND EN LOI VERS LA MOITIE DU SUPREMUM DU CARRE D'UN PROCESSUS GAUSSIEN TRONQUE A SES VALEURS POSITIVES. PUIS AGRANDISSANT LE DOMAINE, NOUS MONTRONS QUE LE RAPPORT DE VRAISEMBLANCE TEND VERS L'INFINI EN PROBABILITE. PRENANT UN CAS PARTICULIER DE CMC, LE MODELE MA BRUITE, NOUS ETUDIONS, A ORDRE CONNU, UN ESTIMATEUR DU FILTRE ET DES PARAMETRES DE LA CHAINE CACHEE, QUAND CELLE-CI EST, ELLE AUSSI, A ETATS CONTINUS. DES SIMULATIONS PERMETTENT D'ILLUSTRER LES RESULTATS. CES ETUDES SONT ACCOMPAGNEES D'UN TRAVAIL BIBLIOGRAPHIQUE LES POSITIONNANT DANS LE CONTEXTE ACTUEL, LES ECLAIRANT PAR DES EXEMPLES, MONTRANT LEUR APPORT, ET PROPOSANT DES VOIES DE RECHERCHE
Prévision séquentielle par agrégation d'ensemble : application à des prévisions météorologiques assorties d'incertitudes by Paul Baudin( )

1 edition published in 2015 in French and held by 1 WorldCat member library worldwide

Dans cette thèse, nous nous intéressons à des problèmes de prévision tour après tour. L'objectif est d'imaginer et d'appliquer des stratégies automatiques, qui tirent de l'expérience du passé et s'aident éventuellement de prédicteurs élémentaires. Nous souhaitons que ces stratégies obtiennent des garanties mathématiques robustes et soient valables dans des cas de figure très généraux. Cela nous permet en pratique d'appliquer les algorithmes qui en découlent à la prévision concrète de grandeurs météorologiques. Enfin, nous nous intéressons aux déclinaisons théoriques et pratiques dans un cadre de prévision de fonctions de répartition. Nous étudions dans un premier temps la prévision séquentielle de processus bornés stationnaires ergodiques. Dans ce but, nous nous plaçons dans le cadre des suites individuelles et proposons un arbre de régression déterministe dont les prévisions sont asymptotiquement meilleures que le meilleur prédicteur lipschitzien pour une certaine constante L. Puis nous montrons que les bornes de regret obtenues impliquent que les stratégies envisagées sont asymptotiquement optimales par rapport à la classe des processus stationnaire ergodique bornés. Dans un second temps, nous présentons une méthode d'agrégation séquentielle des simulations météorologiques de pression réduite au niveau de la mer. L'objectif est d'obtenir, grâce à l'algorithme ridge, de meilleures performances en prévision qu'une certaine prévision de référence, à préciser. Tout d'abord, nous rappelons le cadre mathématique et les fondamentaux des sciences environnementales. Puis nous décrivons en détail les jeux de données utilisés et les performances pratiques de l'algorithme. Enfin, nous précisons certains aspects du jeu de données et certaines sensibilités aux paramètres l'algorithme ridge. Puis, nous déclinons la méthode précédente à l'étude d'une seconde grandeur physique : la norme de la vitesse du vent à dix mètres au-dessus du sol. Plusieurs remarques d'ordre physique sont faites au passage concernant ce jeu de données. Dans le dernier chapitre, nous présentons les enjeux et les outils de la prévision probabiliste avant de mettre en pratique deux algorithmes sur les jeux de données décrits précédemment. La première partie motive l'utilisation de prévisions probabilistes et expose l'état de l'art dans ce domaine et la seconde partie présente des scores probabilistes historiques et populaires. Les algorithmes utilisés sont ensuite décrits dans la troisième partie avant que ne soient détaillés les résultats empiriques de ceux-ci sur les jeux de données de pression réduite au niveau de la mer et de norme de la vitesse du vent
Non Parametric Mixture Models and Hidden Markov Models : Asymptotic Behaviour of the Posterior Distribution and Efficiency by Elodie, Edith Vernet( )

1 edition published in 2016 in English and held by 1 WorldCat member library worldwide

Les modèles latents sont très utilisés en pratique, comme en génomique, économétrie, reconnaissance de parole... Comme la modélisation paramétrique des densités d'émission, c'est-à-dire les lois d'une observation sachant l'état latent, peut conduire à de mauvais résultats en pratique, un récent intérêt pour les modèles latents non paramétriques est apparu dans les applications. Or ces modèles ont peu été étudiés en théorie. Dans cette thèse je me suis intéressée aux propriétés asymptotiques des estimateurs (dans le cas fréquentiste) et de la loi a posteriori (dans le cadre Bayésien) dans deux modèles latents particuliers : les modèles de Markov caché et les modèles de mélange. J'ai tout d'abord étudié la concentration de la loi a posteriori dans les modèles non paramétriques de Markov caché. Plus précisément, j'ai étudié la consistance puis la vitesse de concentration de la loi a posteriori. Enfin je me suis intéressée à l'estimation efficace du paramètre de mélange dans les modèles semi paramétriques de mélange
Contributions à la localisation intra-muros. De la modélisation à la calibration théorique et pratique d'estimateurs by Thierry Dumont( )

1 edition published in 2012 in French and held by 1 WorldCat member library worldwide

Préfigurant la prochaine grande étape dans le domaine de la navigation, la géolocalisation intra-muros est un domaine de recherche très actif depuis quelques années. Alors que la géolocalisation est entrée dans le quotidien de nombreux professionnels et particuliers avec, notamment, le guidage routier assisté, les besoins d'étendre les applications à l'intérieur se font de plus en plus pressants. Cependant, les systèmes existants se heurtent à des contraintes techniques bien supérieures à celles rencontrées à l'extérieur, la faute, notamment, à la propagation chaotique des ondes électromagnétiques dans les environnements confinés et inhomogènes. Nous proposons dans ce manuscrit une approche statistique du problème de géolocalisation d'un mobile à l'intérieur d'un bâtiment utilisant les ondes WiFi environnantes. Ce manuscrit s'articule autour de deux questions centrales : celle de la détermination des cartes de propagation des ondes WiFi dans un bâtiment donné et celle de la construction d'estimateurs des positions du mobile à l'aide de ces cartes de propagation. Le cadre statistique utilisé dans cette thèse afin de répondre à ces questions est celui des modèles de Markov cachés. Nous proposons notamment, dans un cadre paramétrique, une méthode d'inférence permettant l'estimation en ligne des cartes de propagation, sur la base des informations relevées par le mobile. Dans un cadre non-paramétrique, nous avons étudié la possibilité d'estimer les cartes de propagation considérées comme simple fonction régulière sur l'environnement à géolocaliser. Nos résultats sur l'estimation non paramétrique dans les modèles de Markov cachés permettent d'exhiber un estimateur des fonctions de propagation dont la consistance est établie dans un cadre général. La dernière partie du manuscrit porte sur l'estimation de l'arbre de contextes dans les modèles de Markov cachés à longueur variable
Inférence dans les modèles conjoints et de mélange non-linéaires à effets mixtes by Cyprien Mbogning( )

1 edition published in 2012 in French and held by 1 WorldCat member library worldwide

Cette thèse est consacrée au développement de nouvelles méthodologies pour l'analyse des modèles non-linéaires à effets mixtes, à leur implémentation dans un logiciel accessible et leur application à des problèmes réels. Nous considérons particulièrement des extensions des modèles non-linéaires à effets mixtes aux modèles de mélange et aux modèles conjoints. Dans la première partie, nous proposons, dans le but d'avoir une meilleure maîtrise de l'hétérogénéité liée aux données sur des patients issus de plusieurs clusters, des extensions des MNLEM aux modèles de mélange. Nous proposons ensuite de combiner l'algorithme EM, utilisé traditionnellement pour les modèles de mélanges lorsque les variables étudiées sont observées, et l'algorithme SAEM, utilisé pour l'estimation de paramètres par maximum de vraisemblance lorsque ces variables ne sont pas observées. La procédure résultante, dénommée MSAEM, permet ainsi d'éviter l'introduction d'une étape de simulation des covariables catégorielles latentes dans l'algorithme d'estimation. Cet algorithme est extrêmement rapide, très peu sensible à l'initialisation des paramètres, converge vers un maximum (local) de la vraisemblance et est implémenté dans le logiciel Monolix.La seconde partie de cette Thèse traite de la modélisation conjointe de l'évolution d'un marqueur biologique au cours du temps et les délais entre les apparitions successives censurées d'un évènement d'intérêt. Nous considérons entre autres, les censures à droite, les multiples censures par intervalle d'évènements répétés. Les paramètres du modèle conjoint résultant sont estimés en maximisant la vraisemblance jointe exacte par un algorithme de type MCMC-SAEM. Cette méthodologie est désormais disponible sous Monolix
Heritability Estimation in High-dimensional Mixed Models : Theory and Applications. by Anna Bonnet( )

1 edition published in 2016 in English and held by 1 WorldCat member library worldwide

We study statistical methods toestimate the heritability of a biological trait,which is the proportion of variations of thistrait that can be explained by genetic factors.First, we propose to study the heritability ofquantitative traits using high-dimensionalsparse linear mixed models. We investigate thetheoretical properties of the maximumlikelihood estimator for the heritability and weshow that it is a consistent estimator and that itsatisfies a central limit theorem with a closedformexpression for the asymptotic variance.This result, supported by an extendednumerical study, shows that the variance of ourestimator is strongly affected by the ratiobetween the number of observations and thesize of the random genetic effects. Moreprecisely, when the number of observations issmall compared to the size of the geneticeffects (which is often the case in geneticstudies), the variance of our estimator is verylarge. This motivated the development of avariable selection method in order to capturethe genetic variants which are involved themost in the phenotypic variations and providemore accurate heritability estimations. Wepropose then a variable selection methodadapted to high dimensional settings and weshow that, depending on the number of geneticvariants actually involved in the phenotypicvariations, called causal variants, it was a goodidea to include or not a variable selection stepbefore estimating heritability.The last part of this thesis is dedicated toheritability estimation for binary data, in orderto study the proportion of genetic factorsinvolved in complex diseases. We propose tostudy the theoretical properties of the methoddeveloped by Golan et al. (2014) for casecontroldata, which is very efficient in practice.Our main result is the proof of the consistencyof their heritability estimator
 
moreShow More Titles
fewerShow Fewer Titles
Audience Level
0
Audience Level
1
  Kids General Special  
Audience level: 0.88 (from 0.86 for Codage uni ... to 0.99 for Non Parame ...)

Alternative Names
Granier, Elisabeth

Languages
French (17)

English (10)