skip to content
Intégration sémantique de données guidée par une ontologie Preview this item
ClosePreview this item
Checking...

Intégration sémantique de données guidée par une ontologie

Author: Fatiha Saïs; Marie-Christine Rousset; Nathalie Pernelle; Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne).; Université Paris-Sud (1970-2019).
Publisher: Lille : Atelier national de reproduction des thèses, 2007.
Dissertation: Reproduction de : Thèse de doctorat : Informatique : Paris 11 : 2007.
Series: Lille thèses.
Edition/Format:   Thesis/dissertation : Thesis/dissertation : Microfiche : Master microform : FrenchView all editions and formats
Summary:
Dans cette thèse, nous traitons du problème d'intégration sémantique de données. L'objectif est de pouvoir combiner des sources de données autonomes et hétérogènes. Pour y parvenir, toutes les données doivent être représentées selon un même schéma et selon une sémantique unifiée. Cette thèse est articulée en deux parties relativement indépendantes. La première présente une méthode automatique
Rating:

(not yet rated) 0 with reviews - Be the first.

Subjects
More like this

Find a copy in the library

&AllPage.SpinnerRetrieving; Finding libraries that hold this item...

Details

Genre/Form: Thèses et écrits académiques
Material Type: Thesis/dissertation
Document Type: Book
All Authors / Contributors: Fatiha Saïs; Marie-Christine Rousset; Nathalie Pernelle; Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne).; Université Paris-Sud (1970-2019).
OCLC Number: 1164717392
Description: Microfiches. ; 105 x 148 mm.
Series Title: Lille thèses.
Responsibility: Fatiha Saïs ; sous la direction de [Marie-Christine Rousset et Nathalie Pernelle].

Abstract:

Dans cette thèse, nous traitons du problème d'intégration sémantique de données. L'objectif est de pouvoir combiner des sources de données autonomes et hétérogènes. Pour y parvenir, toutes les données doivent être représentées selon un même schéma et selon une sémantique unifiée. Cette thèse est articulée en deux parties relativement indépendantes. La première présente une méthode automatique et flexible de réconciliation de données avec une ontologie dans le cas où les données sont représentées dans des tableaux. Pour représenter le résultat de la réconciliation, nous avons défini le format SML dont l'originalité est de permettre de représenter tous les appariements trouvés mais également les informations imparfaitement identifiées. La seconde partie présente deux méthodes de réconciliation de références décrites relativement à un même schéma. Il s'agit de décider si des descriptions différentes se réfèrent à la même entité du monde réel. La première méthode, nommée L2R, est logique. La sémantique des données et du schéma y est traduite par un ensemble de règles de (non) réconciliation permettant d'inférer des décisions de (non) réconciliation certaines. La seconde, nommée N2R, est numérique. Dans cette méthode, la sémantique du schéma est traduite par une mesure de similarité informée utilisée pour calculer la similarité des paires de références. Ce calcul est exprimé dans un système d'équations non linéaire résolu par une méthode itérative. Ces méthodes obtiennent des résultats satisfaisants sur des données réelles, ce qui montre la faisabilité d'approches complètement automatiques et guidées uniquement par une ontologie pour ces deux problèmes de réconciliation.

This thesis deals with semantic data integration guided by an ontology. Data integration aims at combining autonomous and heterogonous data sources. To this end, all the data should be represented according to the same schema and according to a unified semantics. This thesis is divided into two parts. In the first one, we present an automatic and flexible method for data reconciliation with an ontology. We consider the case where data are represented in tables. The reconciliation result is represented in the SML format which we have defined. Its originality stems from the fact that it allows representing all the established mappings but also information that is imperfectly identified. In the second part, we present two methods of reference reconciliation. This problem consists in deciding whether different data descriptions refer to the same real world entity. We have considered this problem when data is described according to the same schema. The first method, called L2R, is logical: it translates the schema and the data semantics into a set of logical rules which allow inferring correct decisions both of reconciliation and no reconciliation. The second method, called N2R, is numerical. It translates the schema semantics into an informed similarity measure used by a numerical computation of the similarity of the reference pairs. This computation is expressed in a non linear equation system solved by using an iterative method. Our experiments on real datasets demonstrated the robustness and the feasibility of our approaches. The solutions that we bring to the two problems of reconciliation are completely automatic and guided only by an ontology.

Reviews

User-contributed reviews
Retrieving GoodReads reviews...
Retrieving DOGObooks reviews...

Tags

Be the first.
Confirm this request

You may have already requested this item. Please select Ok if you would like to proceed with this request anyway.

Linked Data


\n\n

Primary Entity<\/h3>\n
<http:\/\/www.worldcat.org\/oclc\/1164717392<\/a>> # Int\u00E9gration s\u00E9mantique de donn\u00E9es guid\u00E9e par une ontologie<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nbgn:Thesis<\/a>, bgn:Microform<\/a>, schema:CreativeWork<\/a>, schema:Book<\/a> ;\u00A0\u00A0\u00A0\nbgn:inSupportOf<\/a> \"Reproduction de : Th\u00E8se de doctorat : Informatique : Paris 11 : 2007.<\/span>\" ;\u00A0\u00A0\u00A0\nlibrary:oclcnum<\/a> \"1164717392<\/span>\" ;\u00A0\u00A0\u00A0\nlibrary:placeOfPublication<\/a> <http:\/\/id.loc.gov\/vocabulary\/countries\/fr<\/a>> ;\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Thing\/enrichissement_semantique<\/a>> ; # Enrichissement s\u00E9mantique<\/span>\n\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/raisonnement_non_monotone<\/a>> ; # Raisonnement non-monotone<\/span>\n\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/ontologies_informatique<\/a>> ; # Ontologies (informatique)<\/span>\n\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/intelligence_artificielle<\/a>> ; # Intelligence artificielle<\/span>\n\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/appariement_statistique<\/a>> ; # Appariement (statistique)<\/span>\n\u00A0\u00A0\u00A0\nschema:author<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/sais_fatiha_1979<\/a>> ; # Fatiha Sa\u00EFs<\/span>\n\u00A0\u00A0\u00A0\nschema:contributor<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Organization\/universite_paris_sud_1970_2019<\/a>> ; # Universit\u00E9 Paris-Sud (1970-2019).<\/span>\n\u00A0\u00A0\u00A0\nschema:contributor<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/rousset_marie_christine<\/a>> ; # Marie-Christine Rousset<\/span>\n\u00A0\u00A0\u00A0\nschema:contributor<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/pernelle_nathalie<\/a>> ; # Nathalie Pernelle<\/span>\n\u00A0\u00A0\u00A0\nschema:contributor<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Organization\/universite_de_paris_sud_faculte_des_sciences_d_orsay_essonne<\/a>> ; # Universit\u00E9 de Paris-Sud. Facult\u00E9 des sciences d\'Orsay (Essonne).<\/span>\n\u00A0\u00A0\u00A0\nschema:description<\/a> \"This thesis deals with semantic data integration guided by an ontology. Data integration aims at combining autonomous and heterogonous data sources. To this end, all the data should be represented according to the same schema and according to a unified semantics. This thesis is divided into two parts. In the first one, we present an automatic and flexible method for data reconciliation with an ontology. We consider the case where data are represented in tables. The reconciliation result is represented in the SML format which we have defined. Its originality stems from the fact that it allows representing all the established mappings but also information that is imperfectly identified. In the second part, we present two methods of reference reconciliation. This problem consists in deciding whether different data descriptions refer to the same real world entity. We have considered this problem when data is described according to the same schema. The first method, called L2R, is logical: it translates the schema and the data semantics into a set of logical rules which allow inferring correct decisions both of reconciliation and no reconciliation. The second method, called N2R, is numerical. It translates the schema semantics into an informed similarity measure used by a numerical computation of the similarity of the reference pairs. This computation is expressed in a non linear equation system solved by using an iterative method. Our experiments on real datasets demonstrated the robustness and the feasibility of our approaches. The solutions that we bring to the two problems of reconciliation are completely automatic and guided only by an ontology.<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\nschema:description<\/a> \"Dans cette th\u00E8se, nous traitons du probl\u00E8me d\'int\u00E9gration s\u00E9mantique de donn\u00E9es. L\'objectif est de pouvoir combiner des sources de donn\u00E9es autonomes et h\u00E9t\u00E9rog\u00E8nes. Pour y parvenir, toutes les donn\u00E9es doivent \u00EAtre repr\u00E9sent\u00E9es selon un m\u00EAme sch\u00E9ma et selon une s\u00E9mantique unifi\u00E9e. Cette th\u00E8se est articul\u00E9e en deux parties relativement ind\u00E9pendantes. La premi\u00E8re pr\u00E9sente une m\u00E9thode automatique et flexible de r\u00E9conciliation de donn\u00E9es avec une ontologie dans le cas o\u00F9 les donn\u00E9es sont repr\u00E9sent\u00E9es dans des tableaux. Pour repr\u00E9senter le r\u00E9sultat de la r\u00E9conciliation, nous avons d\u00E9fini le format SML dont l\'originalit\u00E9 est de permettre de repr\u00E9senter tous les appariements trouv\u00E9s mais \u00E9galement les informations imparfaitement identifi\u00E9es. La seconde partie pr\u00E9sente deux m\u00E9thodes de r\u00E9conciliation de r\u00E9f\u00E9rences d\u00E9crites relativement \u00E0 un m\u00EAme sch\u00E9ma. Il s\'agit de d\u00E9cider si des descriptions diff\u00E9rentes se r\u00E9f\u00E8rent \u00E0 la m\u00EAme entit\u00E9 du monde r\u00E9el. La premi\u00E8re m\u00E9thode, nomm\u00E9e L2R, est logique. La s\u00E9mantique des donn\u00E9es et du sch\u00E9ma y est traduite par un ensemble de r\u00E8gles de (non) r\u00E9conciliation permettant d\'inf\u00E9rer des d\u00E9cisions de (non) r\u00E9conciliation certaines. La seconde, nomm\u00E9e N2R, est num\u00E9rique. Dans cette m\u00E9thode, la s\u00E9mantique du sch\u00E9ma est traduite par une mesure de similarit\u00E9 inform\u00E9e utilis\u00E9e pour calculer la similarit\u00E9 des paires de r\u00E9f\u00E9rences. Ce calcul est exprim\u00E9 dans un syst\u00E8me d\'\u00E9quations non lin\u00E9aire r\u00E9solu par une m\u00E9thode it\u00E9rative. Ces m\u00E9thodes obtiennent des r\u00E9sultats satisfaisants sur des donn\u00E9es r\u00E9elles, ce qui montre la faisabilit\u00E9 d\'approches compl\u00E8tement automatiques et guid\u00E9es uniquement par une ontologie pour ces deux probl\u00E8mes de r\u00E9conciliation.<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\nschema:exampleOfWork<\/a> <http:\/\/worldcat.org\/entity\/work\/id\/10337104767<\/a>> ;\u00A0\u00A0\u00A0\nschema:genre<\/a> \"Th\u00E8ses et \u00E9crits acad\u00E9miques<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\nschema:inLanguage<\/a> \"fr<\/span>\" ;\u00A0\u00A0\u00A0\nschema:isPartOf<\/a> <http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Series\/lille_theses<\/a>> ; # Lille th\u00E8ses.<\/span>\n\u00A0\u00A0\u00A0\nschema:isPartOf<\/a> <http:\/\/worldcat.org\/issn\/0294-1767<\/a>> ; # Lille-th\u00E8ses,<\/span>\n\u00A0\u00A0\u00A0\nschema:name<\/a> \"Int\u00E9gration s\u00E9mantique de donn\u00E9es guid\u00E9e par une ontologie<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\nschema:productID<\/a> \"1164717392<\/span>\" ;\u00A0\u00A0\u00A0\nwdrs:describedby<\/a> <http:\/\/www.worldcat.org\/title\/-\/oclc\/1164717392<\/a>> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n\n

Related Entities<\/h3>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Organization\/universite_de_paris_sud_faculte_des_sciences_d_orsay_essonne<\/a>> # Universit\u00E9 de Paris-Sud. Facult\u00E9 des sciences d\'Orsay (Essonne).<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Organization<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Universit\u00E9 de Paris-Sud. Facult\u00E9 des sciences d\'Orsay (Essonne).<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Organization\/universite_paris_sud_1970_2019<\/a>> # Universit\u00E9 Paris-Sud (1970-2019).<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Organization<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Universit\u00E9 Paris-Sud (1970-2019).<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/pernelle_nathalie<\/a>> # Nathalie Pernelle<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Person<\/a> ;\u00A0\u00A0\u00A0\nschema:familyName<\/a> \"Pernelle<\/span>\" ;\u00A0\u00A0\u00A0\nschema:givenName<\/a> \"Nathalie<\/span>\" ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Nathalie Pernelle<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/rousset_marie_christine<\/a>> # Marie-Christine Rousset<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Person<\/a> ;\u00A0\u00A0\u00A0\nschema:familyName<\/a> \"Rousset<\/span>\" ;\u00A0\u00A0\u00A0\nschema:givenName<\/a> \"Marie-Christine<\/span>\" ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Marie-Christine Rousset<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Person\/sais_fatiha_1979<\/a>> # Fatiha Sa\u00EFs<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Person<\/a> ;\u00A0\u00A0\u00A0\nschema:birthDate<\/a> \"1979<\/span>\" ;\u00A0\u00A0\u00A0\nschema:deathDate<\/a> \"\" ;\u00A0\u00A0\u00A0\nschema:familyName<\/a> \"Sa\u00EFs<\/span>\" ;\u00A0\u00A0\u00A0\nschema:givenName<\/a> \"Fatiha<\/span>\" ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Fatiha Sa\u00EFs<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Series\/lille_theses<\/a>> # Lille th\u00E8ses.<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nbgn:PublicationSeries<\/a> ;\u00A0\u00A0\u00A0\nschema:hasPart<\/a> <http:\/\/www.worldcat.org\/oclc\/1164717392<\/a>> ; # Int\u00E9gration s\u00E9mantique de donn\u00E9es guid\u00E9e par une ontologie<\/span>\n\u00A0\u00A0\u00A0\nschema:name<\/a> \"Lille th\u00E8ses.<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Thing\/enrichissement_semantique<\/a>> # Enrichissement s\u00E9mantique<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Thing<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Enrichissement s\u00E9mantique<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/appariement_statistique<\/a>> # Appariement (statistique)<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Intangible<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Appariement (statistique)<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/intelligence_artificielle<\/a>> # Intelligence artificielle<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Intangible<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Intelligence artificielle<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/ontologies_informatique<\/a>> # Ontologies (informatique)<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Intangible<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Ontologies (informatique)<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/experiment.worldcat.org\/entity\/work\/data\/10337104767#Topic\/raisonnement_non_monotone<\/a>> # Raisonnement non-monotone<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nschema:Intangible<\/a> ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Raisonnement non-monotone<\/span>\"@fr<\/a> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/id.loc.gov\/vocabulary\/countries\/fr<\/a>>\u00A0\u00A0\u00A0\u00A0a \nschema:Place<\/a> ;\u00A0\u00A0\u00A0\ndcterms:identifier<\/a> \"fr<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/worldcat.org\/issn\/0294-1767<\/a>> # Lille-th\u00E8ses,<\/span>\n\u00A0\u00A0\u00A0\u00A0a \nbgn:PublicationSeries<\/a> ;\u00A0\u00A0\u00A0\nschema:hasPart<\/a> <http:\/\/www.worldcat.org\/oclc\/1164717392<\/a>> ; # Int\u00E9gration s\u00E9mantique de donn\u00E9es guid\u00E9e par une ontologie<\/span>\n\u00A0\u00A0\u00A0\nschema:issn<\/a> \"0294-1767<\/span>\" ;\u00A0\u00A0\u00A0\nschema:name<\/a> \"Lille-th\u00E8ses,<\/span>\" ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n
<http:\/\/www.worldcat.org\/title\/-\/oclc\/1164717392<\/a>>\u00A0\u00A0\u00A0\u00A0a \ngenont:InformationResource<\/a>, genont:ContentTypeGenericResource<\/a> ;\u00A0\u00A0\u00A0\nschema:about<\/a> <http:\/\/www.worldcat.org\/oclc\/1164717392<\/a>> ; # Int\u00E9gration s\u00E9mantique de donn\u00E9es guid\u00E9e par une ontologie<\/span>\n\u00A0\u00A0\u00A0\nschema:dateModified<\/a> \"2021-01-10<\/span>\" ;\u00A0\u00A0\u00A0\nvoid:inDataset<\/a> <http:\/\/purl.oclc.org\/dataset\/WorldCat<\/a>> ;\u00A0\u00A0\u00A0\u00A0.\n\n\n<\/div>\n\n

Content-negotiable representations<\/p>\n