WorldCat Identities

Gassiat, Elisabeth (1961-....).

Overview
Works: 21 works in 25 publications in 2 languages and 78 library holdings
Roles: Author, Opponent, 956, Thesis advisor
Classifications: Q386, 003.54
Publication Timeline
.
Most widely held works by Elisabeth Gassiat
Codage universel et identification d'ordre par sélection de modèles by Élisabeth Gassiat( Book )

4 editions published in 2014 in French and held by 44 WorldCat member libraries worldwide

Ces notes de cours se situent à l'interface entre "théorie de l'information" et "statistique". On y met en évidence les liens que le codage universel et la compression adaptative présentent avec l'inférence statistique des processus, par maximum de vraisemblance ou méthode bayésienne. Partant de résultats et outils classiques en alphabet fini, on aborde la théorie récente du codage universel en alphabet infini. On montre comment cela permet de résoudre des problèmes d'identification d'ordre, notamment pour les modèles de chaînes de Markov cachées [source : 4e de couv.]
Déconvolution aveugle by Elisabeth Gassiat( Book )

2 editions published in 1988 in French and held by 4 WorldCat member libraries worldwide

Considérant une série x formée de variables aléatoires indépendamment identiquement distribuées, et le signal Y obtenu lorsque l'on filtre X par un système linéaire s, nous étudions l'estimation de s sur la base des observations y dans le cadre semi-paramétrique suivant : la loi des x est inconnue et non gaussienne, et s possède un inverse de convolution de longueur finie fixée. Aucune hypothèse n'est faite sur la phase du système, c'est à-dire sur la causalité ou non causalité de s. Nous proposons une estimation par maximum d'objectif. L'estimateur ainsi obtenu est consistant et asymptotiquement gaussien, ce résultat restant valable quelle que soit la dimension de l'espace d'indexation des séries considérées. Nous étudions l'efficacité asymptotique de la méthode et, dans le cas causal, nous la comparons aux méthodes usuelles de moindres carrés. Interprétant notre signal sortant comme un champ autorégressif, nous proposons une méthode consistante d'identification de l'ordre du modèle.Nous étudions divers types de robustesse des estimateurs : robustesse à une sous-paramétrisation, robustesse à l'addition d'un bruit sur l'observation. Nous nous intéressons enfin au cas où la loi de x a des moments infinis, et montrons que, pour des objectifs "cumulants standardisés" et sous certaines hypothèses vérifiées en particulier pour les lois dans les domaines d'attraction de lois stables, l'estimateur obtenu reste consistant, et sa vitesse de convergence, dans le cas causal, est meilleur que pour des lois de variance finie
Segmentation spatiale et sélection de modèle théorie et applications statistiques by Antoine Chambaz( Book )

1 edition published in 2003 in French and held by 2 WorldCat member libraries worldwide

Cette thèse trouve sa dynamique dans l'élaboration d'une méthode originale de raffinement de localisation du trafic de téléphonie mobile en zone urbaine pour France Télécom R&D, ainsi que dans l'étude de thèmes théoriques soulevés lors de notre exploration. Notre approche est de nature statistique. Il apparaît que les thèmes centraux de cette thèse sont la segmentation spatiale et la sélection de modèle. Nous introduisons dans un premier temps les données sur lesquelles nous avons fondé notre approche du problème, que nous expliquons à leur lumière. Nous motivons le choix d'un modèle de régression hétéroscédastique. Nous présentons ensuite une démarche non paramétrique par arbres de régression de type CART et ses extensions par ré-échantillonnage Bagging et Boosting dans un cadre de régression homoscédastique. Nous proposons une adaptation de ces techniques au cas hétéroscédastique. Une analyse originale de l'importance des variables y est as~ociée. L'application commentée de notre méthode à divers jeux de données de trafic constitue notre réponse finale au problème initial. Le travail appliqué évoqué plus tôt motive l'étude de la consistance d'une famille d'estimateurs de l'ordre et de la segmentation d'un modèle segmenté. Nous nous consacrons aussi, dans un cadre général de sélection de modèle dans un emboîtement, à l'estimation de l'ordre d'un modèle et aux propriétés de consistance, ainsi qu'aux vitesses de sur- ou sous-estimation. Une approche fonctionnelle, i.e. une approche pour laquelle les événements d'intérêt sont exprimés en termes d'événements sur la mesure empirique, permet d'unifier et de généraliser une large gamme de résultats antérieurs. Les preuves font appel à une variété de techniques: arguments classiques de minimisation de contraste, concentration, inégalités maximales pour des variables dépendantes, lemme de Stein, pénalisation, Prin- cipes de Grandes et Moyennes Déviations pour la mesure empirique, tour à la Hu ber
Estimation dans des modèles à variables cachées by Catherine Matias( Book )

1 edition published in 2001 in English and held by 2 WorldCat member libraries worldwide

This thesis is devoted to the inference in hidden-variables models. The Chapter 1 considers the properties of the maximum likelihood estimator (MLE) for a possibly not stationary hidden Markov model, where the hidden state space is a metric compact space, and both the transition kernel of the hidden chain and the conditional distribution of the observations depend on a parameter. For identifiable models, consistency, asymptotic normality and efficiency of the MLE is shown to follow from exponential memorylessness properties of the state prediction filter and geometric ergodicity of suitably extended Markov chains. Chapter 2 deals with a semiparametric deconvolution model. The observations are the independent sum of a signal composed by i.i.d. random variables with common unknown density g, and a white noise sequence Gaussian centered with unknown standard deviation s. When s is unknown, we prove that the rate of convergence for the estimation of g is seriously deteriorated. We propose an estimator of s that is nearly minimax when g has a support included in some fixed compact set. We also construct a universal estimator of s (i.e. without any constraint on g except the one that ensures the identifiability of the model). Chapter 3 still deals with the convolution model but assuming that the Gaussian noise has a known variance (fixed to 1). We study the estimation properties of linear functionals of g depending on a entirely known function f. We extend the results of Taupin (1998, 2001) when f is a polynomial or a trigonometric function, proving lower bounds for the pointwise minimax quadratic risk and for the minimax risk with respect to the uniform norm, and establishing lower and upper bounds for the minimax risk with respect to the "p-norm". We prove that the estimator given by Taupin (2001) reaches the optimal rates when f is a polynomial function and is nearly minimax when f is a trigonometric function
Testing in locally conic model, and application to mixture models by Didier Dacunha-Castelle( Book )

1 edition published in 1996 in English and held by 2 WorldCat member libraries worldwide

Estimation dans des modèles à variables cachées alignement des séquences biologiques et modèles d'évolution by Ana Arribas Gil( Book )

1 edition published in 2007 in French and held by 2 WorldCat member libraries worldwide

Cette thèse est consacrée à l'estimation paramétrique dans certains modèles d'alignement de séquences biologiques. Ce sont des modèles construits à partir des considérations sur le processus d'évolution des séquences. Dans le cas de deux séquences, le processus d'évolution classique résulte dans un modèle d'alignement appelé pair-Hidden Markov Model (pair-HMM). Dans le pair-HMM les observations sont formées par le couple de séquences à aligner et l'alignement caché est une chaîne de Markov. D'un point de vue théorique nous donnons un cadre rigoureux pour ce modèle et étudions la consistance des estimateurs bayésien et par maximum de vraisemblance. D'un point de vue appliqué nous nous intéressons à la détection de motifs conservés dans les séquences à travers de l'alignement. Pour cela nous introduisons un processus d'évolution permettant différents comportements évolutifs à différents endroits de la séquence et pour lequel le modèle d'alignement est toujours un pair-HMM. Nous proposons des algorithmes d'estimation d'alignements et paramètres d'évolution adaptés à la complexité du modèle. Finalement, nous nous intéressons à l'alignement multiple (plus de deux séquences). Le processus d'évolution classique résulte dans ce cas dans un modèle d'alignement à variables cachées plus complexe et dans lequel il faut prendre en compte les relations phylogénétiques entre les séquences. Nous donnons le cadre théorique pour ce modèle et étudions, comme dans le cas de deux séquences, la propriété de consistance des estimateurs
Modèles contextuels et alphabets infinis en théorie de l'information by Aurélien Garivier( Book )

1 edition published in 2006 in English and held by 2 WorldCat member libraries worldwide

This thesis explores some contemporary aspects of information theory, from source coding to issues of model selection. We first consider the problem of coding memoryless sources on a countable, infinite alphabet. As it is impossible to provide a solution which is both efficient and general, two approaches are considered: we first establish conditions under which the entropic rate can be reached, and we consider restricted classes for which tail probabilities are controlled. The second approach does not set any condition on the sources but provides a partial solution by coding only a part of the information - the pattern - which captures the repetitions in the message. In order to study more complex processes, we come back to the case of finite memory sources on a finite alphabet : it has given rise to many works and efficient algorithms like the Context Tree Weighting (CTW) Method. We show here that this method is also efficient on anon-parametric class of infinite memory sources: the renewal processes. We show then that the ideas on which CTW is based lead to a consistent estimator of the memory structure of a process, when this structure is finite. In fact, we complete the study of the BIC context tree estimator for Variable Length Markov Chains. In the last part, it is shown how similar ideas can be generalized for more complex sources on a (countable or not) infinite alphabet. We obtain consistent estimators for the order of hidden Markov models with Poisson and Gaussian emission
Estimation semi-paramétrique à l'ordre 2 et applications by Ismaël Castillo( Book )

1 edition published in 2006 in English and held by 2 WorldCat member libraries worldwide

Approches statistiques en segmentation = Statistical approaches for segmentation : application à la ré-annotation de génome by Alice Cleynen( )

1 edition published in 2013 in English and held by 2 WorldCat member libraries worldwide

Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel
Sélection de variable structure génétique d'une population et transmission de Plasmodium à travers le moustique by Wilson Toussile( Book )

1 edition published in 2010 in French and held by 2 WorldCat member libraries worldwide

This thesis is concerned with variable selection in two practical problems. The first one is the identification of genetically homogeneous populations without prior information on the target population. The structure of interest may be contained in only a subset of available genetic markers. We propose a model selection procedure to simultaneously solve the two-fold problem of selection of the number of populations and the relevant subset of variable. The models in competition are compared using penalized maximum likelihood criteria. Under weak assumptions on the penalty function, we proved the consistency of the selection procedure. We also proposed a new penalty function with an associated non-asymptotic oracle inequality. ln practice, this result suggests a penalty function defined up to a multiplicative parameter which is calibrated thanks to the slope heuristics. Using simulated data, we found that the calibration of the penalty term improves the perforrnances of the selection procedure with respect to classical asymptotic criteria such as AIC and BlC. ln addition, we proposed a stand alone C++ package implementing our proposed selection procedure. The second problem is motivated by malaria control strategies aiming at reducing disease transmission intensity. The data we have at hand are described by variables of different types. ln addition their number is of the order of the sample size. We considered a variable selection procedure based on the variable importances from random forests to face the variable selection problem. The selected variables are assessed in Zero Inflated Negative Binomial model
The estimation of the order of a mixture model by Didier Dacunha-Castelle( Book )

1 edition published in 1995 in English and held by 2 WorldCat member libraries worldwide

Estimation semi-paramétrique de la période de fonctions périodiques inconnues dans divers modèles statistiques théorie et applications by Céline Lévy-Leduc( Book )

1 edition published in 2004 in French and held by 2 WorldCat member libraries worldwide

Cette thèse porte sur l'estimation semi-paramétrique de la période de fonctions périodiques inconnues dans divers cadres statistiques ainsi qu'à la mise en place de tests non-paramétriques permettant de détecter la présence de signal périodique dans du bruit. Dans le chapitre 1, nous proposons des estimateurs asymptotiquement optimaux de la période d'une fonction périodique et des périodes de deux fonctions périodiques à partir de leur somme bruitée. Dans le chapitre 2, nous proposons un algorithme pratique d'estimation de période fondée sur les idées du chapitre 1 que nous testons sur des données simulées de vibrométrie laser. Cet algorithme est testé dans le chapitre 3 sur des données réelles musicales. Dans le chapitre 4, nous proposons un estimateur de période lorsque les observations correspondent à une fonction presque périodique particulière bruitée ainsi qu'une mise en oeuvre pratique de la méthode que l'on a testée sur des signaux de vibrométrie laser. Dans le chapitre 5, on propose un test de détection de fonctions périodiques dans du bruit lorsque la période de la fonction et la variance du bruit sont inconnues qui est adaptatif au sens du minimax et on l'a teste sur des données de vibrométrie laser
Etude statistique du problème de la trajectographie passive by Benoît Landelle( Book )

1 edition published in 2009 in French and held by 2 WorldCat member libraries worldwide

Cette thèse présente une étude statistique du problème de la trajectographie passive. On s'intéresse dans une première partie à la question de l'observabilité pour des trajectoires paramétriques puis paramétriques par morceaux et ensuite des trajectoires à vitesse constante. La deuxième partie est consacrée à l'estimation : on présente les propriétés de l'estimateur du maximum de vraisemblance pour des trajectoires paramétriques et paramétriques par morceaux. On expose également le caractère non robuste de cette estimation en dépit de propriétés asymptotiques satisfaisantes. On s'intéresse alors à la sensibilité de l'estimation quand le modèle d'état n'est pas totalement spécifié. Son comportement est décrit pour des perturbations d'état déterministes puis stochastiques et un cadre semiparamétrique est considéré quand la loi du bruit d'état est inconnue. Dans la dernière partie, on aborde le problème de la trajectographie passive comme chaîne de Markov cachée. On s'intéresse à l'étude du filtre optimal et à sa résolution par des méthodes algorithmiques. Le filtre de Kalman étendu est expérimenté sous différentes conditions de bruit d'état. On présente ensuite des résultats de stabilité asymptotique du filtre optimal pour des chaînes de Markov cachées non ergodiques puis leur application en trajectographie passive
Modèles de mélange semi-paramétriques et applications aux tests multiples by Van Hanh Nguyen( )

1 edition published in 2013 in English and held by 1 WorldCat member library worldwide

In a multiple testing context, we consider a semiparametric mixture model with two components. One component is assumed to be known and corresponds to the distribution of p-values under the null hypothesis with prior probability p. The other component f is nonparametric and stands for the distribution under the alternative hypothesis. The problem of estimating the parameters p and f of the model appears from the false discovery rate control procedures. In the first part of this dissertation, we study the estimation of the proportion p. We discuss asymptotic efficiency results and establish that two different cases occur whether f vanishes on a non-empty interval or not. In the first case, we exhibit estimators converging at parametric rate, compute the optimal asymptotic variance and conjecture that no estimator is asymptotically efficient (i.e. attains the optimal asymptotic variance). In the second case, we prove that the quadratic risk of any estimator does not converge at parametric rate. In the second part of the dissertation, we focus on the estimation of the nonparametric unknown component f in the mixture, relying on a preliminary estimator of p. We propose and study the asymptotic properties of two different estimators for this unknown component. The first estimator is a randomly weighted kernel estimator. We establish an upper bound for its pointwise quadratic risk, exhibiting the classical nonparametric rate of convergence over a class of Holder densities. The second estimator is a maximum smoothed likelihood estimator. It is computed through an iterative algorithm, for which we establish a descent property. In addition, these estimators are used in a multiple testing procedure in order to estimate the local false discovery rate
Contributions à la localisation intra-muros. De la modélisation à la calibration théorique et pratique d'estimateurs by Thierry Dumont( )

1 edition published in 2012 in French and held by 1 WorldCat member library worldwide

Préfigurant la prochaine grande étape dans le domaine de la navigation, la géolocalisation intra-muros est un domaine de recherche très actif depuis quelques années. Alors que la géolocalisation est entrée dans le quotidien de nombreux professionnels et particuliers avec, notamment, le guidage routier assisté, les besoins d'étendre les applications à l'intérieur se font de plus en plus pressants. Cependant, les systèmes existants se heurtent à des contraintes techniques bien supérieures à celles rencontrées à l'extérieur, la faute, notamment, à la propagation chaotique des ondes électromagnétiques dans les environnements confinés et inhomogènes. Nous proposons dans ce manuscrit une approche statistique du problème de géolocalisation d'un mobile à l'intérieur d'un bâtiment utilisant les ondes WiFi environnantes. Ce manuscrit s'articule autour de deux questions centrales : celle de la détermination des cartes de propagation des ondes WiFi dans un bâtiment donné et celle de la construction d'estimateurs des positions du mobile à l'aide de ces cartes de propagation. Le cadre statistique utilisé dans cette thèse afin de répondre à ces questions est celui des modèles de Markov cachés. Nous proposons notamment, dans un cadre paramétrique, une méthode d'inférence permettant l'estimation en ligne des cartes de propagation, sur la base des informations relevées par le mobile. Dans un cadre non-paramétrique, nous avons étudié la possibilité d'estimer les cartes de propagation considérées comme simple fonction régulière sur l'environnement à géolocaliser. Nos résultats sur l'estimation non paramétrique dans les modèles de Markov cachés permettent d'exhiber un estimateur des fonctions de propagation dont la consistance est établie dans un cadre général. La dernière partie du manuscrit porte sur l'estimation de l'arbre de contextes dans les modèles de Markov cachés à longueur variable
Inférence dans les modèles conjoints et de mélange non-linéaires à effets mixtes by Cyprien Mbogning( )

1 edition published in 2012 in French and held by 1 WorldCat member library worldwide

The main goal of this thesis is to develop new methodologies for the analysis of non linear mixed-effects models, along with their implementation in accessible software and their application to real problems. We consider particularly extensions of non-linear mixed effects model to mixture models and joint models. The study of these two extensions is the essence of the work done in this document, which can be divided into two major parts. In the first part, we propose, in order to have a better control of heterogeneity linked to data of patient issued from several clusters, extensions of NLMEM to mixture models. We suggest in this Thesis to combine the EM algorithm, traditionally used for mixtures models when the variables studied are observed, and the SAEM algorithm, used to estimate the maximum likelihood parameters when these variables are not observed. The resulting procedure, referred MSAEM, allows avoiding the introduction of a simulation step of the latent categorical covariates in the estimation algorithm. This algorithm appears to be extremely fast, very little sensitive to parameters initialization and converges to a (local) maximum of the likelihood. This methodology is now available under the Monolix software. The second part of this thesis deals with the joint modeling of the evolution of a biomarker over time and the time between successive appearances of a possibly censored event of interest. We consider among other, the right censoring and interval censorship of multiple events. The parameters of the resulting joint model are estimated by maximizing the exact joint likelihood by using a MCMC-SAEM algorithm. The proposed methodology is now available under Monolix
Formation spontanée de chemins : des fourmis aux marches aléatoires renforcées by Line Le Goff( )

1 edition published in 2014 in French and held by 1 WorldCat member library worldwide

Cette thèse est consacrée à la modélisation de la formation spontanée de chemins préférentiels par des marcheurs déposant des traces attractives sur leurs trajectoires. Plus précisément, par une démarche pluridisciplinaire couplant modélisation et expérimentation, elle vise à dégager un ensemble de règles minimales individuelles permettant l'apparition d'un tel phénomène. Dans ce but, nous avons étudié sous différents angles les modèles minimaux que sont les marches aléatoires renforcées (MAR).Ce travail comporte deux parties principales. La première démontre de nouveaux résultats dans le domaine des probabilités et statistiques. Nous avons généralisé le travail publié par M. Benaïm et O. Raimond en 2010 afin d'étudier l'asymptotique d'une classe de MAR auxquelles les demi-tours sont interdits. Nous avons également développé une procédure statistique permettant, sous certaines conditions adéquates de régularité, d'estimer les paramètres de MAR paramétrées et d'évaluer des marges d'erreur.Dans la seconde partie, sont décrits les résultats et analyses d'une étude comportementale et expérimentale de la fourmi Linepithema humile. Une partie de notre réflexion est centrée sur le rôle et la valeur des paramètres du modèle proposé par J.-L. Deneubourg et al. en 1990. Nous nous sommes aussi demandés dans quelle mesure une MAR peut reproduire les déplacements d'une fourmi dans un réseau. Dans ces objectifs, nous avons mené des expériences confrontant des fourmis à des réseaux à une ou plusieurs bifurcations. Nous avons appliqué aux données expérimentales les outils statistiques développés dans cette thèse. Nous avons aussi effectué une étude comparative entre les simulations de plusieurs modèles et les expériences
DECONVOLUTION AVEUGLE DES SYSTEMES LINEAIRES ALEATOIRES BRUITES OU NON by Emmanuelle Gautherat( Book )

1 edition published in 1997 in French and held by 1 WorldCat member library worldwide

CETTE THESE EST CONSACREE A LA DECONVOLUTION AVEUGLE DES SYSTEMES ALEATOIRES REELS OU COMPLEXES QUI ADMETTENT UNE REPRESENTATION LINEAIRE PAR RAPPORT A UNE SUITE DE VARIABLES ALEATOIRES DISCRETES DE CARDINAL DE SUPPORT FINI. CE PROBLEME A TROIS COMPOSANTES : L'ESTIMATION DU FILTRE INVERSE, L'ESTIMATION DU SUPPORT DES VARIABLES DISCRETES ET DES MASSES LE CHARGEANT ET LA RESTITUTION DU SIGNAL ORIGINAL. CES TROIS QUESTIONS SONT TRAITEES SUCCESSIVEMENT. L'ESTIMATION DU FILTRE INVERSE EST BASEE SUR UNE METHODE DE MINIMISATION DE CONTRASTE PENALISE LORSQUE LE MODELE EST PERTURBE PAR UN BRUIT ADDITIF. UNE CLARIFICATION DES CONTRASTES UTILISES EST DONNEE. ON ETABLIT DES ESTIMATEURS DU FILTRE INVERSE ET DU NIVEAU DE BRUIT FAIBLEMENT ET FORTEMENT CONSISTANTS. LE PROBLEME EST AUSSI RESOLU LORSQUE LE NOMBRE DE POINTS DE SUPPORT N'EST PAS CONNU MAIS DE MAJORANT CONNU. ON OBTIENT AUSSI DES ESTIMATEURS CONSISTANTS PAR UNE TECHNIQUE DE CONTRASTE COMPENSEE. ENFIN, ON OBTIENT DES ESTIMATEURS DES POINTS DE SUPPORT ET DES MASSES FAIBLEMENT ET FORTEMENT CONSISTANTS. LE SIGNAL EST ALORS RESTITUE PAR DES TECHNIQUES CLASSIQUES DE CLASSIFICATION BAYESIENNE. DANS LE CADRE PARAMETRIQUE, LA VITESSE DE CONVERGENCE DE L'ESTIMATEUR DU FILTRE INVERSE, DANS LE CADRE NON BRUITE, EST CONTROLEE PAR LA QUEUE DE LA NORME DANS L#1 DU FILTRE INVERSE. DANS LE CAS DU MODELE BRUITE, LE MODELE EST REGULIER. LA VITESSE OBTENUE EST ALORS CLASSIQUEMENT EN N#-#<1/2>
TESTS DE MODELES PAR MAXIMUM DE VRAISEMBLANCE by Christine Keribin( Book )

1 edition published in 1999 in French and held by 1 WorldCat member library worldwide

L'ORDRE D'UN MODELE PARAMETRIQUE EST, GROSSIEREMENT, LE NOMBRE DE PARAMETRES NECESSAIRES POUR DEFINIR LE MODELE. LORSQUE CET ORDRE N'EST PAS CONNU, L'ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE VA SURESTIMER L'ORDRE, POUR S'AJUSTER LE MIEUX AUX DONNEES. MAIS UN MODELE SUR-PARAMETRE NE DONNERA PAS DE BONS RESULTATS DE PREDICTION. AINSI, IL EST INTERESSANT D'ETUDIER DES ESTIMATEURS ET DES TESTS DE L'ORDRE. NOUS ETUDIONS DES TESTS DE RAPPORT DE VRAISEMBLANCE DANS LE CADRE DE TROIS MODELES : LE MODELE A OBSERVATIONS INDEPENDANTES ET IDENTIQUEMENT DISTRIBUEES (I.I.D.) IDENTIFIABLE, MEME QUAND L'ORDRE SURESTIME, LE MODELE DE MELANGE A OBSERVATIONS I.I.D. (QUI N'EST PAS IDENTIFIABLE QUAND LE NOMBRE DE COMPOSANTES EST SURESTIME), ET LE MODELE DE CHAINE DE MARKOV CACHEE (CMC) A OBSERVATIONS CONTINUES (QUI PRESENTE LES MEMES PROBLEMES D'IDENTIFIABILITE QUE LE PRECEDENT, AVEC EN PLUS LA DEPENDANCE MARKOVIENNE). DANS LE PREMIER CAS, NOUS UTILISONS DES RESULTATS CONNUS DE CONSISTANCE DE L'ESTIMATEUR DE L'ORDRE POUR DETERMINER LA VITESSE ASYMPTOTIQUE DE LA PROBABILITE DE SE TROMPER D'ORDRE. DANS LE SECOND CAS, NOUS DEMONTRONS D'ABORD LA CONSISTANCE DE L'ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE PENALISEE SOUS CERTAINES HYPOTHESES, PUIS NOUS DONNONS UN MAJORANT DU NIVEAU D'UN TEST DE CONTAMINATION. DANS LE DERNIER CAS, NOUS TESTONS UN MODELE A OBSERVATIONS I.I.D. CONTRE UN MODELE CMC A DEUX ETATS CACHES. DANS CE CAS, SUR UN SOUS-ENSEMBLE DES PARAMETRES, NOUS MONTRONS QUE LE RAPPORT DE VRAISEMBLANCE TEND EN LOI VERS LA MOITIE DU SUPREMUM DU CARRE D'UN PROCESSUS GAUSSIEN TRONQUE A SES VALEURS POSITIVES. PUIS AGRANDISSANT LE DOMAINE, NOUS MONTRONS QUE LE RAPPORT DE VRAISEMBLANCE TEND VERS L'INFINI EN PROBABILITE. PRENANT UN CAS PARTICULIER DE CMC, LE MODELE MA BRUITE, NOUS ETUDIONS, A ORDRE CONNU, UN ESTIMATEUR DU FILTRE ET DES PARAMETRES DE LA CHAINE CACHEE, QUAND CELLE-CI EST, ELLE AUSSI, A ETATS CONTINUS. DES SIMULATIONS PERMETTENT D'ILLUSTRER LES RESULTATS. CES ETUDES SONT ACCOMPAGNEES D'UN TRAVAIL BIBLIOGRAPHIQUE LES POSITIONNANT DANS LE CONTEXTE ACTUEL, LES ECLAIRANT PAR DES EXEMPLES, MONTRANT LEUR APPORT, ET PROPOSANT DES VOIES DE RECHERCHE
Prévision séquentielle par agrégation d'ensemble : application à des prévisions météorologiques assorties d'incertitudes by Paul Baudin( )

1 edition published in 2015 in French and held by 1 WorldCat member library worldwide

Dans cette thèse, nous nous intéressons à des problèmes de prévision tour après tour. L'objectif est d'imaginer et d'appliquer des stratégies automatiques, qui tirent de l'expérience du passé et s'aident éventuellement de prédicteurs élémentaires. Nous souhaitons que ces stratégies obtiennent des garanties mathématiques robustes et soient valables dans des cas de figure très généraux. Cela nous permet en pratique d'appliquer les algorithmes qui en découlent à la prévision concrète de grandeurs météorologiques. Enfin, nous nous intéressons aux déclinaisons théoriques et pratiques dans un cadre de prévision de fonctions de répartition. Nous étudions dans un premier temps la prévision séquentielle de processus bornés stationnaires ergodiques. Dans ce but, nous nous plaçons dans le cadre des suites individuelles et proposons un arbre de régression déterministe dont les prévisions sont asymptotiquement meilleures que le meilleur prédicteur lipschitzien pour une certaine constante L. Puis nous montrons que les bornes de regret obtenues impliquent que les stratégies envisagées sont asymptotiquement optimales par rapport à la classe des processus stationnaire ergodique bornés. Dans un second temps, nous présentons une méthode d'agrégation séquentielle des simulations météorologiques de pression réduite au niveau de la mer. L'objectif est d'obtenir, grâce à l'algorithme ridge, de meilleures performances en prévision qu'une certaine prévision de référence, à préciser. Tout d'abord, nous rappelons le cadre mathématique et les fondamentaux des sciences environnementales. Puis nous décrivons en détail les jeux de données utilisés et les performances pratiques de l'algorithme. Enfin, nous précisons certains aspects du jeu de données et certaines sensibilités aux paramètres l'algorithme ridge. Puis, nous déclinons la méthode précédente à l'étude d'une seconde grandeur physique : la norme de la vitesse du vent à dix mètres au-dessus du sol. Plusieurs remarques d'ordre physique sont faites au passage concernant ce jeu de données. Dans le dernier chapitre, nous présentons les enjeux et les outils de la prévision probabiliste avant de mettre en pratique deux algorithmes sur les jeux de données décrits précédemment. La première partie motive l'utilisation de prévisions probabilistes et expose l'état de l'art dans ce domaine et la seconde partie présente des scores probabilistes historiques et populaires. Les algorithmes utilisés sont ensuite décrits dans la troisième partie avant que ne soient détaillés les résultats empiriques de ceux-ci sur les jeux de données de pression réduite au niveau de la mer et de norme de la vitesse du vent
 
moreShow More Titles
fewerShow Fewer Titles
Audience Level
0
Audience Level
1
  Kids General Special  
Audience level: 0.88 (from 0.86 for Codage uni ... to 0.99 for Inférence ...)

Alternative Names
Granier, Elisabeth

Languages
French (17)

English (7)