Der Gegenstandsbereich der vorliegenden Arbeit ist die Sprachsynthese, d.h. die maschinelle Generierung lautsprachlicher Äußerungen. Spätestens seit der Erfindung des Computers fasziniert den Menschen die Idee, einer Maschine das Sprechen lehren oder sogar mit ihr kommunizieren zu können. In der bisherigen Geschichte der Sprachsynthese konnte die generierte Sprachausgabe immer nur so gut sein wie der jeweils aktuelle Entwicklungsstand auf dem Gebiet der Informationselektronik es zuließ.
Die neusten Verfahren und Methoden zur Sprachsynthese arbeiten auf der Basis umfangreichen Datenmaterials, das einerseits eine hervorragende Synthesequalität gewährleistet, andererseits aber an die Grenzen des bei der Aufbereitung der Daten tolerablen Arbeitsaufwandes geht. Die jüngsten Entwicklungen auf dem Gebiet der Sprachsynthese verlangen also nach ausgefeilten Strategien, den immens gewachsenen Arbeitsaufwand unter Aufrechterhaltung der hohen Synthesequalität zu reduzieren. Vorliegende Arbeit leistet einen solchen Beitrag zur Verbesserung der Ökonomie von Sprachsynthese auf der Basis großer Korpora.
Inhaltsverzeichnis
1 Einleitung
2 Sprachsyntheseverfahren
2.1 Systemarchitektur
2.2 Sprachsynthese nach Regeln
2.3 Datengesteuerte Sprachsynthese
2.3.1 Einheiten der konkatenativen Sprachsynthese
2.3.2 Anwendungen mit begrenztem Bausteininventar
2.3.3 Selektive konkatenative Synthese
2.4 Qualitätsanforderungen an die Sprachsynthese
2.4.1 Die Qualitätsmerkmale
2.4.2 Methoden zur Qualitätsmessung
3 Sprachliche Einheiten in langue und parole
3.1 Die abstrakten Einheiten des Sprachsystems
3.1.1 Der Satz
3.1.2 Das Wort
3.1.3 Das Morphem
3.1.4 Das Phonem
3.2 Lautsprachliche Korrelate abstrakter Spracheinheiten
3.2.1 Die Intonationsphrase
3.2.2 Die Wortform
3.2.3 Das Morph
3.2.4 Das Phon
4 Eine spezielle Einheitendefinition zur Generierung flektierter Wortformen
4.1 Erhebung von Daten
4.1.1 Erstellungskriterien für das Datenmaterial
4.1.2 Aufnahme der Daten
4.1.3 Aufbereitung des Korpus
4.2 Vorexperimente
4.2.1 Die Position der Schnittgrenze
4.2.2 Der phonetische Kontext der Schnittgrenze
4.2.3 Hypothese für einen Perzeptionstest
4.3 Evaluation durch einen Perzeptionstest
4.3.1 Auswahl der Testmethode
4.3.2 Auswahl der Stimuli
4.3.3 Auswahl der Testpersonen
4.3.4 Testergebnisse
4.4 Zusammenfassung
5 Diskussion
Zielsetzung & Themen
Das Hauptziel dieser Arbeit besteht darin, die Ökonomie der Sprachsynthese auf Basis großer Korpora zu verbessern, indem flektierte Wortformen durch die Verwendung spezieller morphologischer Subeinheiten generiert werden. Hierbei wird untersucht, ob sich durch eine Reduktion des Inventars auf Subworteinheiten bei gleichzeitiger Beibehaltung hoher perzeptiver Qualität die Komplexität der Datengewinnung reduzieren lässt.
- Verfahren der Sprachsynthese (regelbasiert vs. datengesteuert)
- Linguistische Einheiten im Sprachsystem (langue und parole)
- Morphologische Grundlagen der Wortformengenerierung
- Experimentelle Untersuchung zur Schnittstellenoptimierung
- Evaluation der perzeptiven Qualität mittels Perzeptionstest
Auszug aus dem Buch
3.1.2 Das Wort
In diesem Abschnitt wird eine Wortdefinition vorgenommen. Da sich eine solche Definition als schwierig darstellt, werden zunächst einige Aspekte erörtert, die für die Definition des Wortes berücksichtigt werden müssen.
Wie im vorherigen Abschnitt bereits angesprochen, ist das Wort eine Subeinheit des Satzes. Es besitzt dabei syntaktische Relevanz, indem es seine satzbezogene Funktion durch Flexion kennzeichnet. Gleichzeitig aber stellt das Wort eine Einheit der Semantik dar. Eine Zweiteilung der Bedeutungskomponente von Wörtern nehmen Griesbach und Schulz wie folgt vor:
„Die kleinsten Elemente der Sprache sind die Wörter. Man unterscheidet zunächst Wörter, die EINE BESTIMMTE BEDEUTUNG haben (Inhaltswörter) [...] und solche, die keine eigene Bedeutung haben, sondern nur im Satz die BEZIEHUNGEN DER WÖRTER untereinander aufzeigen (Funktionswörter) [...]“ (Griesbach und Schulz, 1962: 7)
Die Auffassung der Wörter als kleinste Elemente der Sprache folgt einem anderen Element bzw. Einheitenbegriff als es in vorliegender Arbeit der Fall ist. Die noch folgenden Abschnitte werden zeigen, wie das Wort in sprachlich funktionale Subelemente gegliedert werden kann. Durchaus gängig aber ist die Unterscheidung zwischen Inhalts- und Funktionswörtern, bezeichnen sie doch den wohl vorhandenen Unterschied zwischen Wörtern mit außersprachlicher Denotation wie Haus, Katze, Gedanke gegenüber Wörtern mit lediglich sprachinhärenter und damit (vor allem) funktionaler Bedeutung wie und, als, an. Somit ist aber zweifelhaft, ob man den Funktionswörtern jegliche Bedeutung absprechen darf. Denn nach Simmler (1998) sind die grammatikalisch bedeutenden Wörter lediglich bedeutungsarm nicht aber frei von Bedeutung. Demnach trifft Simmler eine Unterscheidung zwischen Lexemen, den außersprachlich bedeutenden Wörtern, und Grammemen, den innersprachlich bedeutenden Wörtern. Alternativ zu den Begriffen des Lexems bzw. Grammems spricht Kramsky (1969) von sogenannten Autosemantika bzw. Synsemantika, denen aber im Wesentlichen das gleiche Unterscheidungskriterium zugrundeliegt.
Zusammenfassung der Kapitel
1 Einleitung: Die Arbeit führt in die Thematik der maschinellen Sprachsynthese ein und begründet die Notwendigkeit, durch morphologische Subeinheiten die Ökonomie des Syntheseprozesses zu optimieren.
2 Sprachsyntheseverfahren: Dieses Kapitel vergleicht regelbasierte mit datengesteuerten Systemen und beleuchtet die Rolle von Speichermedien sowie Qualitätsanforderungen wie Verständlichkeit und Natürlichkeit.
3 Sprachliche Einheiten in langue und parole: Hier werden theoretische linguistische Einheiten wie Satz, Wort, Morphem und Phonem diskutiert und deren lautsprachliche Entsprechungen erläutert.
4 Eine spezielle Einheitendefinition zur Generierung flektierter Wortformen: Dieser empirische Teil beschreibt die Erhebung des Datenmaterials, die Durchführung der Vorexperimente sowie die methodische Evaluation durch einen Perzeptionstest.
5 Diskussion: Das abschließende Kapitel interpretiert die Ergebnisse im Hinblick auf die locus-Theorie und diskutiert die perzeptive Relevanz der gefundenen morphologischen Schnittstellen für künftige Synthesekonzepte.
Schlüsselwörter
Sprachsynthese, Konkatenative Synthese, Morphologie, Wortformengenerierung, Perzeptionstest, Sprachqualität, Flexion, Subworteinheiten, Koartikulation, Linguistische Einheiten, Satz, Morphem, Phonem, Mean-Opinion-Score, Sprachkorpus
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der maschinellen Sprachsynthese und untersucht, wie flektierte Wortformen durch die Kombination von Wortstämmen und Flexionsendungen effizienter generiert werden können.
Was sind die zentralen Themenfelder?
Die zentralen Felder sind die methodische Unterscheidung verschiedener Sprachsyntheseverfahren, die linguistische Fundierung sprachlicher Einheiten und die empirische Überprüfung der Synthesequalität durch Hörerstudien.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Reduktion des Speicherbedarfs bei der Sprachsynthese durch eine Einheitendefinition auf Subwortebene, ohne dabei die Natürlichkeit der Sprachausgabe zu beeinträchtigen.
Welche wissenschaftliche Methode wird verwendet?
Es wird ein korpusbasierter Ansatz verfolgt, der durch phonetische Analysen motiviert ist und dessen Ergebnisse mittels eines Perzeptionstests (ACR-Verfahren) evaluiert werden.
Was wird im Hauptteil behandelt?
Der Hauptteil behandelt die morphologische Struktur von Wörtern, die Definition von Syntheseeinheiten sowie die experimentelle Untersuchung von Schnittstellen zwischen Stamm und Flexionsendung.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind Sprachsynthese, Konkatenative Synthese, Flexionsmorphologie, Perzeptionstest und Sprachqualität.
Warum wird die morphologische Struktur des Wortes so detailliert betrachtet?
Da die Arbeit flektierte Wortformen aus Subeinheiten generiert, ist ein tiefes Verständnis der morphologischen Struktur und der Grenzsignale zwischen Morphemen essentiell, um Signaldiskontinuitäten bei der Konkatenation zu vermeiden.
Welche Erkenntnis liefert das Perzeptionsexperiment bezüglich der Artikulatoren?
Das Experiment zeigt, dass die Anpassung des Endungslinkskontextes an den Artikulationsort des stammfinalen Lautes die perzeptive Qualität der synthetisierten Wortformen signifikant steigert.
- Quote paper
- Dr. Jörg Bröggelwirth (Author), 2000, Die Verwendung spezieller Einheiten zur Generierung flektierter Wortformen in der konkatenativen Sprachsynthese, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/161324