Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-23547
Titel: Observations on the dynamic control of an articulatory synthesizer using speech production data
Alternativtitel: Betrachtungen zur dynamischen Steuerung eines artikulatorischen Synthesizers mit Hilfe von Sprachproduktionsdaten
VerfasserIn: Steiner, Ingmar Michael Augustus
Sprache: Englisch
Erscheinungsjahr: 2010
Kontrollierte Schlagwörter: Sprachsynthese
Sprachproduktion
Elektromagnetische Artikulographie
Dynamische Optimierung
Freie Schlagwörter: Artikulatorische Sprachsynthese
Vokaltrakt
articulatory speech synthesis
speech production
electromagnetic articulography
dynamic optimization
vocal tract
gestural score
DDC-Sachgruppe: 400 Sprache, Linguistik
Dokumenttyp: Dissertation
Abstract: This dissertation explores the automatic generation of gestural score based control structures for a three-dimensional articulatory speech synthesizer. The gestural scores are optimized in an articulatory resynthesis paradigm using a dynamic programming algorithm and a cost function which measures the deviation from a gold standard in the form of natural speech production data. This data had been recorded using electromagnetic articulography, from the same speaker to which the synthesizer's vocal tract model had previously been adapted. Future work to create an English voice for the synthesizer and integrate it into a text-to-speech platform is outlined.
Die vorliegende Dissertation untersucht die automatische Erzeugung von gesturalpartiturbasierten Steuerdaten für ein dreidimensionales artikulatorisches Sprachsynthesesystem. Die gesturalen Partituren werden in einem artikulatorischen Resynthese-Paradigma mittels dynamischer Programmierung optimiert, unter Zuhilfenahme einer Kostenfunktion, die den Abstand zu einem "Gold Standard" in Form natürlicher Sprachproduktionsdaten mißt. Diese Daten waren mit elektromagnetischer Artikulographie am selben Sprecher aufgenommen worden, an den zuvor das Vokaltraktmodell des Synthesesystems angepaßt worden war. Weiterführende Forschung, eine englische Stimme für das Synthesesystem zu erzeugen und sie in eine Text-to-Speech-Plattform einzubetten, wird umrissen.
Link zu diesem Datensatz: urn:nbn:de:bsz:291-scidok-32243
hdl:20.500.11880/23603
http://dx.doi.org/10.22028/D291-23547
Erstgutachter: Barry, William
Tag der mündlichen Prüfung: 19-Mai-2010
Datum des Eintrags: 10-Aug-2010
Fakultät: P - Philosophische Fakultät
Fachrichtung: P - Sprachwissenschaft und Sprachtechnologie
Ehemalige Fachrichtung: bis SS 2016: Fachrichtung 4.7 - Allgemeine Linguistik
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
Diss_Steiner_korr.pdf18,68 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.