Synthèse paramétrique de la parole Arabe (Computer file, 2020) [WorldCat.org]
skip to content
Synthèse paramétrique de la parole Arabe Preview this item
ClosePreview this item
Checking...

Synthèse paramétrique de la parole Arabe

Author: Amal HouidhekDenis JouvetVincent ColotteHamid AmiriZied LachiriAll authors
Publisher: 2020.
Dissertation: Thèse de doctorat : Informatique : Université de Lorraine : 2020.
Thèse de doctorat : Informatique : Université de Tunis El Manar : 2020.
Edition/Format:   Computer file : Document : Thesis/dissertation : French
Summary:
Cette thèse porte sur l'adaptation de la synthèse paramétrique de la parole à partir d'un texte écrit à la langue arabe. Pour ce faire, différentes méthodes ont été développées afin de mettre en place des systèmes de synthèse. Ces méthodes sont basées sur une description du signal de parole par un ensemble de paramètres acoustiques et prosodiques. De même, chaque son est représenté par un
Rating:

(not yet rated) 0 with reviews - Be the first.

Subjects
More like this

Find a copy online

Links to this item

Find a copy in the library

&AllPage.SpinnerRetrieving; Finding libraries that hold this item...

Details

Genre/Form: Thèses et écrits académiques
Material Type: Document, Thesis/dissertation, Internet resource
Document Type: Internet Resource, Computer File
All Authors / Contributors: Amal Houidhek; Denis Jouvet; Vincent Colotte; Hamid Amiri; Zied Lachiri; Adnen Cherif; Yannick Estève; Université de Lorraine.; Université de Tunis El Manar.; École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine.; Laboratoire lorrain de recherche en informatique et ses applications.; École nationale d'ingénieurs de Tunis (Tunisie).
OCLC Number: 1225568480
Notes: Thèse soutenue en co-tutelle.
Titre provenant de l'écran-titre.
Description: 1 online resource
Responsibility: Amal Houidhek ; sous la direction de Denis Jouvet, Vincent Colotte et Hamid Amiri.

Abstract:

Cette thèse porte sur l'adaptation de la synthèse paramétrique de la parole à partir d'un texte écrit à la langue arabe. Pour ce faire, différentes méthodes ont été développées afin de mettre en place des systèmes de synthèse. Ces méthodes sont basées sur une description du signal de parole par un ensemble de paramètres acoustiques et prosodiques. De même, chaque son est représenté par un ensemble de descripteurs contextuels contenant toutes les informations affectant la prononciation de celui-ci. Une partie de ces descripteurs dépend de la langue et de ses particularités, ainsi, afin d'adapter l'approche de synthèse paramétrique à l'arabe, une étude des particularités phonologiques de l'arabe était nécessaire. L'accent a été mis sur deux phénomènes : la gémination et la longueur des voyelles (courte/longue). Deux descripteurs associés à ces deux phénomènes ont été ajoutés à l'ensemble des descripteurs contextuels. De même, différentes approches de choix des unités ont été proposées pour modéliser les consonnes géminées et les voyelles longues. Quatre combinaisons de modélisation sont possibles en alternant la différentiation ou la fusion des consonnes simples et géminées d'une part et des voyelles courtes et longues d'autres part. Un ensemble des tests perceptifs et objectifs a été conduit afin d'évaluer l'effet des quatre approches de modélisation des unités sur la qualité de la parole synthétisée. Les évaluations ont été faites dans le cas de synthèse paramétrique par HMM (Hidden Markov Model) puis dans le cas de la synthèse paramétrique par DNN. Les résultats subjectifs sont montrés que dans le cas de l'approche par HMM, les quatre approches produisent des signaux de qualité similaire, une conclusion qui a été confirmée par les mesures objectives calculées pour évaluer la prédiction des durées des unités de parole. Cependant, les résultats des évaluations objectives dans le cas de l'approche par DNN ont montré que la différentiation des consonnes simples (respectivement des voyelles courtes) des consonnes géminées (respectivement des voyelles longues) permet d'avoir une prédiction des durées légèrement meilleure qu'avec les autres des approches de modélisation. En revanche, cette amélioration n'a pas été perçue lors des tests perceptifs ; les participants ont trouvé que les signaux générés par les quatre approches sont similaires en termes de qualité globale. Une dernière partie de la thèse a été consacrée à la comparaison de l'approche de synthèse par HMM à celle par DNN. L'ensemble des tests conduits ont montré que l'utilisation des DNN a amélioré la qualité perçue des signaux générés.

The presented thesis deals with the adaptation of the conversion of a written text into speech using a parametric approach to the Arabic language. Different methods have been developed in order to set up synthesis systems. These methods are based on a description of the speech signal by a set of parameters. Besides, each sound is represented by a set of contextual features containing all the information affecting the pronunciation of this sound. Part of these features depend on the language and its peculiarities, so in order to adapt the parametric synthesis approach to Arabic, a study of its phonological peculiarities wasneeded. Two phenomena were identified : the gemination and the vowels quantity (short/ long). Two features associated to these phenomena have been added to the contextual features set. In the same way, different approaches have been proposed to model The geminated consonants and the long vowels of the speech units. Four combinations of modeling are possible : alternating the differentiation or fusion of simple and geminated consonants on the one hand and short and long vowels on the other hand. A set of perceptual and objective tests was conducted to evaluate the effect of the fourunit modelling approaches on the quality of the generated speech. The evaluations were made in the case of parametric synthesis by HMM then in the case of parametric synthesisby DNN. The subjective results showed that when the HMM approach is used, the four approaches produce signals with a similar quality, this result that was confirmed by the objective measures calculated to evaluate the prediction of the durations of the speech units. However, the results of objective evaluations in the case of the DNN approach have shown that the differentiation of simple consonants (respectively short vowels) geminated consonants (respectively long vowels) leads to a slightly better prediction of the durations than the other modelling approaches. On the other hand, this improvement was not perceived during the perceptive tests ; listeners found that the signals generated by the four approaches are similar in terms of overall quality. The last part of this thesis was devoted to the comparison of the synthesis approach by the HMMs to that by the DNNs.All the tests conducted have shown that the use of DNNs has improved the perceived quality of the generated signals.

Reviews

User-contributed reviews
Retrieving GoodReads reviews...
Retrieving DOGObooks reviews...

Tags

Be the first.
Confirm this request

You may have already requested this item. Please select Ok if you would like to proceed with this request anyway.

Close Window

Please sign in to WorldCat 

Don't have an account? You can easily create a free account.