Aspects of Linguistic Complexity
Home
A comparative German – Norwegian Valence Approach to the Creation of Resources for Easy-To-Understand Language
The research project „Aspects of Linguistic Complexity A Comparative German – Norwegian Valence Approach to the Creation of Resources for Easy-To-Understand Language“ is a cooperation between Darmstadt University of Applied Sciences (Melanie Siegel) and Trondheim University (Dorothee Beerman, Lars Hellan). It is funded by the DAAD (German Academic Exchange Service).
Resources developed in this project can be found in github: https://github.com/hdaSprachtechnologie/easy-to-understand_language
We held our first project workshop in Trondheim in May 2018.
Project
Wissenschaftliche Zielsetzung
- Ressourcen mit Information über Verbvalenzen
- zur Unterstützung der Initiativen, die öffentliche Sprache besser zugänglich machen
- Leichte Sprache (LS) für Deutsch und Klart Språk (KS) für Norwegisch
- Forschungsfragen:
- Welche Faktoren beeinflussen die Komplexität von Sprache?
- Welche Rolle spielt dabei die Valenz?
- Methoden:
- Korpusanalysen
Methoden
- Aufbau eines Textkorpus mit Texten in LS/KS
- Extraktion von Verben und ihren Argumenten aus diesen Texten
- Vergleich der Verbvalenzen mit der deutschen Valenzdatenbank E-Valbu (http://hypermedia.ids-mannheim.de/evalbu/index.html)
- Lexikon von Verben und ihren Valenzrahmen in LS und ihr Bezug zu ‚normalen‘ Verben/Valenzrahmen
- Einträge im Open German WordNet OdeNet
- Suche nach parallelen Verben und ihren Valenzrahmen im Norwegischen
- Aufbau eines Open Norwegian WordNet mit Informationen über KS-Verben
- Aufbau eines regelbasierten Systems zur automatischen Übersetzung von Texten in LS/KS
Arbeitsplan
- Phase 1 (2018): Datenextraktion
- Aufbau von LS-KS Korpora
- Extraktion von Verben und Valenzrahmen aus LS-KS
- Mapping von LS-KS Valenzrahmen auf Standard-Valenzrahmen für beide Sprachen
- Identifikation einer Menge von kritischen Unterschieden zwischen LS-KS-Valenzen und Standard-Valenzen in beiden Sprachen
- Phase 2 (2019): Aufbau von Ressourcen
- Extraktion von Verben mit Valenzrahmen-Annotationen und anderen Konstruktionen, die in Standardsprache und LS-KS unterschiedlich sind
- Aufbau von Online-Wörterbüchern und Phrasen-Wörterbüchern für LS-KS
- Aufbau von Synsets im OdeNet
- Implementierung einer Applikation, die eine automatische Übersetzung ermöglicht (Norwegisch)
Workshops
- Workshop Trondheim (7.-11. Mai 2018)
- Aufbau von Korpora
- Workshop Darmstadt (Oktober 2018)
- Extraktionsprozesse und Formate
- Workshop Trondheim (Mai 2019)
- Lexika und Synsets
- Applikation zur Übersetzung
- Workshop Darmstadt (Oktober 2019)
- Zugriff auf Lexika und Synsets
- Applikation zur Übersetzung
Partner
NTNU Trondheim
Dorothee Beermann: https://www.ntnu.edu/employees/dorothee.beermann
Lars Hellan: https://www.ntnu.edu/employees/lars.hellan
Darmstadt University of Applied Sciences
Melanie Siegel: http://www.melaniesiegel.de/ und die Studierenden aus dem Master-Studiengang Informationswissenschaft der Hochschule Darmstadt
Workshops & Project Work
Workshop Program, Trondheim May 7-11 2018
Monday (Basics)
10:15 Lars Hellan Klart Sprak, concept and goals
11:00 Melanie Siegel Leichte Sprache, State of the Arts
11:45 Anna Struck: Klart Sprak
12:00 Lunch
13:30 Yannick Schladt Komplexität von Sprache
14:00 Anke Willner Leichte Sprache – Einfache Sprache
14:30 Suna Kaya TypeCraft
Tuesday (Technology)
9:15 Dan Flickinger ERG technology
10:15 Lars Hellan NorSource technology
11:00 Andreas Stiegelmayr Technology in Germany
11:30 Daniela Keller LanguageTool
12:00 Lunch
13:45 discussion technology
Wednesday (Corpus)
10:00 Skype conference with Darmstadt report from Trondheim
10:30 Skype conference with Darmstadt report from Darmstadt
11:30 Mina Schütz Korpusaufbau
Thursday, Friday
project meetings in smaller interest groups, discussion
final dinner
Projektarbeiten zur Arbeit mit dem LanguageTool
- Hinweise zum Schreiben eigener Regeln in LanguageTool (Adrian Hüttl)
- Einführung in LanguageTool (Daniela Keller)
- Regeln erstellen und testen (Helena Keck)
- Neue Regeln für die Leichte Sprache (Studierende der Hochschule Darmstadt)