skip to content
Rééchantillonnage et sélection de modèles Preview this item
ClosePreview this item
Checking...

Rééchantillonnage et sélection de modèles

Author: Sylvain Arlot; Pascal Massart; Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne).
Publisher: [s.l.] : [s.n.], 2007.
Dissertation: Thèse doctorat : Mathématiques : Paris 11 : 2007.
Edition/Format:   Thesis/dissertation : Thesis/dissertation : French
Database:WorldCat
Summary:
Cette thèse s'inscrit dans les domaines de la statistique non-paramétrique et de la théorie statistique de l'apprentissage. Son objet est la compréhension fine de certaines méthodes de rééchantillonnage ou de sélection de modèles, du point de vue non-asymptotique. La majeure partie de ce travail de thèse consiste dans la calibration précise de méthodes de sélection de modèles optimales en pratique,
Rating:

(not yet rated) 0 with reviews - Be the first.

Subjects
More like this

 

Find a copy in the library

&AllPage.SpinnerRetrieving; Finding libraries that hold this item...

Details

Material Type: Thesis/dissertation
Document Type: Book
All Authors / Contributors: Sylvain Arlot; Pascal Massart; Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne).
OCLC Number: 494372676
Notes: Thèse rédigée en anglais, seule l'introduction est en français.
Description: 1 vol. (299 p.) : ill. ; 30 cm.
Responsibility: Sylvain Arlot ; sous la direction de [Pascal Massart].

Abstract:

Cette thèse s'inscrit dans les domaines de la statistique non-paramétrique et de la théorie statistique de l'apprentissage. Son objet est la compréhension fine de certaines méthodes de rééchantillonnage ou de sélection de modèles, du point de vue non-asymptotique. La majeure partie de ce travail de thèse consiste dans la calibration précise de méthodes de sélection de modèles optimales en pratique, pour le problème de la prédiction. Nous étudions la validation croisée V-fold (très couramment utilisée, mais mal comprise en théorie, notamment pour ce qui est de choisir V) et plusieurs méthodes de pénalisation. Nous proposons des méthodes de calibration précise de pénalités, aussi bien pour ce qui est de leur forme générale que des constantes multiplicatives. L'utilisation du rééchantillonnage permet de résoudre des problèmes difficiles, notamment celui de la régression avec un niveau de bruit variable. Nous validons théoriquement ces méthodes du point de vue non-asymptotique, en prouvant des inégalités oracle et des propriétés d'adaptation. Ces résultats reposent entre autres sur des inégalités de concentration. Un second problème que nous abordons est celui des régions de confiance et des tests multiples, lorsque l'on dispose d'observations de grande dimension, présentant des corrélations générales et inconnues. L'utilisation de méthodes de rééchantillonnage permet de s'affranchir du fléau de la dimension, et d'apprendre ces corrélations. Nous proposons principalement deux méthodes, et prouvons pour chacune un contrôle non-asymptotique de leur niveau.

This thesis takes place within the theories of non-parametric statistics and statistical learning. Its goal is to provide an accurate understanding of several resampling or model selection methods, from the non-asymptotic viewpoint. The main advance in this thesis consists in the accurate calibration of model selection procedures, in order to make them optimal in practice for prediction. We study V-fold cross-validation (very commonly used, but badly known in theory, in particular for the question of choosing V) and several penalization procedures. We propose methods for calibrating accurately some penalties, for both their general shape and the multiplicative constants. The use of resampling allows to solve hard problems, in particular regression with a variable noise-level. We prove non-asymptotic theoretical results on these methods, such as oracle inequalities and adaptivity properties. These results rely in particular on some concentration inequalities. We also consider the problem of confidence regions and multiple testing, when the data are high-dimensional, with general and unknown correlations. Using resampling methods, we can get rid of the curse of dimensionality, and "learn" these correlations. We mainly propose two procedures, and prove for both a non-asymptotic control of their level.

Reviews

User-contributed reviews
Retrieving GoodReads reviews...
Retrieving DOGObooks reviews...

Tags

Be the first.
Confirm this request

You may have already requested this item. Please select Ok if you would like to proceed with this request anyway.

Linked Data


Primary Entity

<http://www.worldcat.org/oclc/494372676> # Rééchantillonnage et sélection de modèles
    a schema:Book, bgn:Thesis, schema:CreativeWork ;
   bgn:inSupportOf "Thèse doctorat : Mathématiques : Paris 11 : 2007." ;
   library:oclcnum "494372676" ;
   library:placeOfPublication <http://experiment.worldcat.org/entity/work/data/368586324#Place/s_l> ; # s.l.
   library:placeOfPublication <http://id.loc.gov/vocabulary/countries/fr> ;
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/validation_croisee_v_fold> ; # Validation croisée V-fold
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/regions_de_confiance> ; # Régions de confiance
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/regression_non_parametrique> ; # Régression non-paramétrique
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/heteroscedastique> ; # Hétéroscédastique
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Topic/modeles_mathematiques_theses_et_ecrits_academiques> ; # Modèles mathématiques--Thèses et écrits académiques
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Topic/reechantillonnage_statistique_theses_et_ecrits_academiques> ; # Rééchantillonnage (statistique)--Thèses et écrits académiques
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/apprentissage_statistique> ; # Apprentissage statistique
   schema:about <http://experiment.worldcat.org/entity/work/data/368586324#Thing/statistique_non_parametrique> ; # Statistique non-paramétrique
   schema:contributor <http://viaf.org/viaf/313172559> ; # Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne).
   schema:contributor <http://viaf.org/viaf/29615709> ; # Pascal Massart
   schema:creator <http://experiment.worldcat.org/entity/work/data/368586324#Person/arlot_sylvain_1983> ; # Sylvain Arlot
   schema:datePublished "2007" ;
   schema:description "Cette thèse s'inscrit dans les domaines de la statistique non-paramétrique et de la théorie statistique de l'apprentissage. Son objet est la compréhension fine de certaines méthodes de rééchantillonnage ou de sélection de modèles, du point de vue non-asymptotique. La majeure partie de ce travail de thèse consiste dans la calibration précise de méthodes de sélection de modèles optimales en pratique, pour le problème de la prédiction. Nous étudions la validation croisée V-fold (très couramment utilisée, mais mal comprise en théorie, notamment pour ce qui est de choisir V) et plusieurs méthodes de pénalisation. Nous proposons des méthodes de calibration précise de pénalités, aussi bien pour ce qui est de leur forme générale que des constantes multiplicatives. L'utilisation du rééchantillonnage permet de résoudre des problèmes difficiles, notamment celui de la régression avec un niveau de bruit variable. Nous validons théoriquement ces méthodes du point de vue non-asymptotique, en prouvant des inégalités oracle et des propriétés d'adaptation. Ces résultats reposent entre autres sur des inégalités de concentration. Un second problème que nous abordons est celui des régions de confiance et des tests multiples, lorsque l'on dispose d'observations de grande dimension, présentant des corrélations générales et inconnues. L'utilisation de méthodes de rééchantillonnage permet de s'affranchir du fléau de la dimension, et d'apprendre ces corrélations. Nous proposons principalement deux méthodes, et prouvons pour chacune un contrôle non-asymptotique de leur niveau."@fr ;
   schema:description "This thesis takes place within the theories of non-parametric statistics and statistical learning. Its goal is to provide an accurate understanding of several resampling or model selection methods, from the non-asymptotic viewpoint. The main advance in this thesis consists in the accurate calibration of model selection procedures, in order to make them optimal in practice for prediction. We study V-fold cross-validation (very commonly used, but badly known in theory, in particular for the question of choosing V) and several penalization procedures. We propose methods for calibrating accurately some penalties, for both their general shape and the multiplicative constants. The use of resampling allows to solve hard problems, in particular regression with a variable noise-level. We prove non-asymptotic theoretical results on these methods, such as oracle inequalities and adaptivity properties. These results rely in particular on some concentration inequalities. We also consider the problem of confidence regions and multiple testing, when the data are high-dimensional, with general and unknown correlations. Using resampling methods, we can get rid of the curse of dimensionality, and "learn" these correlations. We mainly propose two procedures, and prove for both a non-asymptotic control of their level."@fr ;
   schema:exampleOfWork <http://worldcat.org/entity/work/id/368586324> ;
   schema:inLanguage "fr" ;
   schema:name "Rééchantillonnage et sélection de modèles"@fr ;
   schema:productID "494372676" ;
   schema:publication <http://www.worldcat.org/title/-/oclc/494372676#PublicationEvent/s_l_s_n_2007> ;
   schema:publisher <http://experiment.worldcat.org/entity/work/data/368586324#Agent/s_n> ; # [s.n.]
   wdrs:describedby <http://www.worldcat.org/title/-/oclc/494372676> ;
    .


Related Entities

<http://experiment.worldcat.org/entity/work/data/368586324#Person/arlot_sylvain_1983> # Sylvain Arlot
    a schema:Person ;
   schema:birthDate "1983" ;
   schema:deathDate "" ;
   schema:familyName "Arlot" ;
   schema:givenName "Sylvain" ;
   schema:name "Sylvain Arlot" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/apprentissage_statistique> # Apprentissage statistique
    a schema:Thing ;
   schema:name "Apprentissage statistique" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/heteroscedastique> # Hétéroscédastique
    a schema:Thing ;
   schema:name "Hétéroscédastique" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/regions_de_confiance> # Régions de confiance
    a schema:Thing ;
   schema:name "Régions de confiance" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/regression_non_parametrique> # Régression non-paramétrique
    a schema:Thing ;
   schema:name "Régression non-paramétrique" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/statistique_non_parametrique> # Statistique non-paramétrique
    a schema:Thing ;
   schema:name "Statistique non-paramétrique" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Thing/validation_croisee_v_fold> # Validation croisée V-fold
    a schema:Thing ;
   schema:name "Validation croisée V-fold" ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Topic/modeles_mathematiques_theses_et_ecrits_academiques> # Modèles mathématiques--Thèses et écrits académiques
    a schema:Intangible ;
   schema:name "Modèles mathématiques--Thèses et écrits académiques"@fr ;
    .

<http://experiment.worldcat.org/entity/work/data/368586324#Topic/reechantillonnage_statistique_theses_et_ecrits_academiques> # Rééchantillonnage (statistique)--Thèses et écrits académiques
    a schema:Intangible ;
   schema:name "Rééchantillonnage (statistique)--Thèses et écrits académiques"@fr ;
    .

<http://viaf.org/viaf/29615709> # Pascal Massart
    a schema:Person ;
   schema:birthDate "1958" ;
   schema:deathDate "" ;
   schema:familyName "Massart" ;
   schema:givenName "Pascal" ;
   schema:name "Pascal Massart" ;
    .

<http://viaf.org/viaf/313172559> # Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne).
    a schema:Organization ;
   schema:name "Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne)." ;
    .


Content-negotiable representations

Close Window

Please sign in to WorldCat 

Don't have an account? You can easily create a free account.