In dieser Studie werden die computerunterstützten Korpusanalysen mit der zu diesem Zweck erstellten und frei zugänglichen Webapplikation „plivac.net/linguistik“ behandelt. Der Schwerpunkt liegt in den quantitativen Untersuchungen eines über 3 Millionen Zeichen großen Textkorpus, der gleichmäßig bosnische, kroatische und serbische Texte umfasst. Mithilfe der Webapplikation wurden verschiedene quantitative Untersuchungen durchgeführt und ausgewertet.
Die Arbeit umfasst fünf Hauptkapitel. Im ersten wird die Webapplikation vorgestellt und ihre Funktionsweise anhand eines konkreten Beispiels unter die Lupe genommen. Im Kapitel Phonetik werden die Phoneme des Gesamtkorpus nach akustischen und artikulatorischen Merkmalen untersucht und die Ergebnisse graphisch dargestellt und erläutert. Drei weitere Kapitel die Phonemhäufigkeit, die Wortlänge und die Satzlänge befassen sich mit den Verteilungen nach verschiedenen Textarten und nach dem Jat-Reflex, wonach die ijekawischen und ekawischen Texte untereinander verglichen werden.
Die gewonnenen Erkenntnisse bekräftigen die These über die Existenz einer Sprache der serbokroatischen oder der kroatoserbischen, die infolge der Staatsbildungsprozesse nach dem Zerfall Jugoslawiens und der Dominanz der politischen gegenüber linguistischen Kriterien zur Spaltung dieser in vier nationale Sprachen Bosnisch, Kroatisch, Serbisch und zuletzt auch Montenegrinisch führte. Anhand der Untersuchungsergebnisse lässt sich eine Schlussfolgerung ziehen, dass die sprachlichen Unterschiede der Textkorpora vielmehr von der Textsorte abhängen als von der geographischen Lage ihres Ursprungs.
Inhaltsverzeichnis
1. EINLEITUNG
1.1. Die Welt des Internets und Computers
1.2. Quantitative Untersuchungen der Textkorpora
1.3. Verwendete Textkorpora
2. COMPUTERUNTERSTÜTZTE KORPUSANALYSE MIT DER SELBSTERSTELLTEN WEBAPPLIKATION
2.1. Funktionalitäten der Applikation:
2.2. Funktionsweise der Applikation
2.2.1. Text vorbereiten
2.2.2. Das Einfügen des vorbereiteten Textes
2.2.3. Die Textuntersuchungsoption auswählen
2.2.4. Text bearbeiten
2.3. Das Resultat der Textuntersuchung
3. PHONETIK UND PHONOLOGIE
3.1. Begriffe
3.2. Entstehung von Lauten
3.3. Phonemeinteilung nach akustischen Merkmalen
3.3.1. Vokalische Phoneme
3.3.2. Konsonantische Phoneme
3.3.3. Kompakte Phoneme
3.3.4. Diffuse Phoneme
3.3.5. Gravide Phoneme
3.3.6. Akute Phoneme
3.3.7. Nasale Phoneme
3.3.8. Kontinuierliche und unterbrochene Phoneme
3.3.9. Stimmhafte und stimmlose Konsonanten
3.3.10. Gleitlaute (Stridente)
3.3.11. Gespannte Phoneme
3.4. Einteilung der Phoneme nach artikulatorischen Merkmalen
3.4.1. Vokale
3.4.2. Konsonanten
4. PHONEMHÄUFIGKEIT
4.1. Phonemhäufigkeit im Gesamtkorpus
4.2. Phonemhäufigkeit in den literarischen Texten
4.3. Phonemhäufigkeit in journalistischen Texten
4.4. Phonemhäufigkeit in den Interviewtranskripten
4.5. Phonemhäufigkeit in den Sachtexten
5. WORTLÄNGE
5.1. Wortlänge im Gesamtkorpus
5.2. Wortlänge in den literarischen Korpora
5.3. Wortlänge in den journalistischen Texten
5.4. Wortlänge in den Interviewtranskripten
5.5. Wortlänge in den Sachtexten
6. SATZLÄNGE
6.1. Satzlänge in den literarischen Texten
6.2. Satzlänge in den journalistischen Texten
6.3. Satzlänge in den Interviewtranskripten
6.4. Satzlänge aller Korpora im Überblick
7. ZUSAMMENFASSUNG
7.1. Phonemhäufigkeit
7.2. Wortlänge
7.3. Satzlänge
8. SAŽETAK
8.1. Frekventnost fonema
8.2. Dužina riječi
8.3. Dužina rečenice
9. LITERATURVERZEICHNIS
9.1. Literatur aus dem Internet
Zielsetzung und Themen
Diese Diplomarbeit befasst sich mit der quantitativen Analyse bosnischer, kroatischer und serbischer Texte unter Zuhilfenahme computerlinguistischer Methoden. Ziel ist es, sprachliche Merkmale wie Phonemhäufigkeit, Wortlänge und Satzlänge in verschiedenen Textsorten zu untersuchen, um Gemeinsamkeiten und Unterschiede sowie stilistische Eigenheiten der Texte zu identifizieren.
- Computergestützte Korpusanalyse mittels einer selbsterstellten Webapplikation
- Phonetische und phonologische Untersuchung der Lautstruktur
- Detaillierte Analyse der Phonemhäufigkeit in verschiedenen Genres (literarisch, journalistisch, Sachtexte, Interviews)
- Untersuchung der Wortlängenverteilung und Vergleich mit historischen Daten
- Analyse der Satzlängenverteilung und deren Bedeutung für den Schreibstil
Auszug aus dem Buch
Die Welt des Internets und Computers
In der heutigen Welt des Internets und Computers begegnen wir uns fast jeden Tag mit neuen Ideen und neuen Möglichkeiten, die uns diese Zeit bietet. Noch gestern wäre diese Arbeit nicht möglich zu schreiben - vielleicht nicht in diesem Ausmaß.
Die anthropologischen Untersuchungen und viele andere die sich mit dem Menschen als einem weisen Wesen auseinander gesetzt haben, beweisen uns, dass wir heute ohne unsere Sprache als Kommunikationsmittel sicherlich nicht das wären, was wir heutzutage sind.
Wie schon vorher erwähnt, bieten uns die neuesten Technologien viele Möglichkeiten zur Forschung verschiedenster Phänomene, die unser Leben bestimmen. Diese Arbeit nutzt sie um manche Geheimnisse des Phänomens der menschlichen Sprache aufzuklären.
Zusammenfassung der Kapitel
1. EINLEITUNG: Dieses Kapitel führt in die computergestützte quantitative Textanalyse ein und beschreibt die verwendeten Textkorpora.
2. COMPUTERUNTERSTÜTZTE KORPUSANALYSE MIT DER SELBSTERSTELLTEN WEBAPPLIKATION: Es wird die Funktionsweise und der Anwendungsbereich der für die Arbeit entwickelten Webapplikation zur Textuntersuchung erläutert.
3. PHONETIK UND PHONOLOGIE: Dieses Kapitel behandelt die theoretischen Grundlagen der Phonetik und Phonologie sowie die Einteilung von Phonemen nach akustischen und artikulatorischen Merkmalen.
4. PHONEMHÄUFIGKEIT: Hier wird die Häufigkeit von Phonemen im Gesamtkorpus sowie in spezifischen Textgattungen detailliert analysiert.
5. WORTLÄNGE: Das Kapitel widmet sich der computerbasierten Berechnung und Auswertung der Wortlängen in den untersuchten Korpora.
6. SATZLÄNGE: Die Analyse der Satzlängen anhand von Wörtern und Graphemen steht hier im Mittelpunkt, inklusive Vergleichen mit anderen Forschern.
7. ZUSAMMENFASSUNG: Eine Zusammenführung der Ergebnisse zur Phonemhäufigkeit, Wortlänge und Satzlänge über alle untersuchten Korpora hinweg.
8. SAŽETAK: Dies ist eine Zusammenfassung der Arbeit in bosnischer/kroatischer/serbischer Sprache.
9. LITERATURVERZEICHNIS: Auflistung aller verwendeten Quellen und Internetverweise.
Schlüsselwörter
Computerlinguistik, Texttechnologie, Korpusanalyse, Phonemhäufigkeit, Wortlänge, Satzlänge, Bosnisch, Kroatisch, Serbisch, Quantitative Textanalyse, Phonetik, Phonologie, Sprachvergleich, JAT-Reflex, Literaturanalyse.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht quantitative Eigenschaften bosnischer, kroatischer und serbischer Texte mithilfe von selbst entwickelten computerlinguistischen Werkzeugen.
Was sind die zentralen Themenfelder der Untersuchung?
Die zentralen Felder sind die Analyse der Phonemhäufigkeit, der Wortlänge und der Satzlänge in unterschiedlichen Textgattungen.
Was ist das primäre Ziel der Forschungsarbeit?
Das Ziel ist es, durch die Quantifizierung sprachlicher Merkmale Gemeinsamkeiten und Unterschiede in der Struktur der Texte zu erfassen und statistisch auszuwerten.
Welche wissenschaftliche Methode wird verwendet?
Es wird eine korpuslinguistische Methode angewandt, bei der Texte mit einer eigens erstellten Webapplikation auf verschiedene Merkmale hin untersucht werden.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die methodische Beschreibung der Webanwendung sowie die detaillierten Analysen der Phonetik, Phonemverteilung, Wortlängen und Satzstrukturen.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind Computerlinguistik, Textkorpora, Phonemhäufigkeit, Wortlänge, Satzlänge sowie die sprachliche Vergleiche zwischen den b/k/s-Varianten.
Warum spielt die Unterscheidung des JAT-Reflexes eine Rolle?
Die Einteilung in ijekawische und ekawische Varianten ist für die sprachliche Charakterisierung der Texte essenziell, da sie sich in der Laut- und Wortstruktur niederschlägt.
Was zeigt der Vergleich mit den Analysen von Neweklowsky?
Der Vergleich verdeutlicht, dass sich die Verteilungsmuster von Wort- und Satzlängen über verschiedene Zeiträume hinweg als erstaunlich stabil und textartabhängig erweisen.
- Arbeit zitieren
- Ernest Plivac (Autor:in), 2004, Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie, München, GRIN Verlag, https://www.hausarbeiten.de/document/272858