Login     Glossar    
  Infobanner
e-teaching.org  
Alexander Weggerle

Damit beispielsweise hörbehinderte oder ausländische Studierende einer Vorlesungsaufzeichung besser folgen können, wurde im Projekt Net4Voice an automatischen Transkriptionsverfahren gearbeitet. Eng kooperiert wird mit dem Projekt Synote der University Southampton, das eine Annotationsumgebung für Multimediainhalte bereithält. Im Interview schildert Alexander Weggerle, welche Herausforderungen sich beim automatisierten Transkribieren ergeben und wie die Transkripte in der Praxis für Lehre und Lernen genutzt werden.

Wie werden automatische Transkriptionsverfahren an der Universität Ulm konkret eingesetzt?

Die Vorlesungen der Technischen Informatik werden aufgezeichnet und anschließend transkribiert. Das automatisch generierte Transkript wird anschließend in Synote den Studenten zur Verfügung gestellt. Hier haben sie die Möglichkeit sich frei durch die Vorlesung zu bewegen, indem Sie im Text innerhalb der ausgewählten Vorlesung suchen, die Folien anklicken, sich Notizen zu Textstellen erstellen oder einfach die gesprochene Sprache anhören. All diese Komponenten sind miteinander verknüpft, so dass ein Klick in den Text die passende Stelle der Aufzeichnung abspielt, die zugehörige Folie und die Notizen zu dieser Stelle anzeigt.



Zusätzlich wird es in der nächsten Version von Synote die Möglichkeit geben, auch übergreifend in Vorlesungen zu suchen, um damit den Zugang zu Inhalten zu erleichtern. Wird ein Suchergebnis ausgewählt, erhält der Student eine geteilte Ansicht mit der passenden Folie, dem markierten Text und der passenden Stelle in der Aufnahme.

Welche Rückmeldungen erhalten Sie von den Studierenden?
Die Rückmeldung der Studierenden ist überwiegend positiv. Vor allem die ausländischen Studenten und Studenten mit einer Behinderung nehmen das Angebot sehr gerne an. Für die Klausur werden die Aufzeichnungen und Transkripte dann von den meisten Studenten genutzt. Unsere Bemühungen werden aber nur als erster Schritt von den Studenten angesehen. Sie fragen z.B. zusätzlich nach einer Videoaufzeichnung der Vorlesung und wollen das Transkript à la Wikipedia bearbeiten.

Worin bestehen die besonderen Herausforderungen bei der automatischen Transkription von Lehrveranstaltungen?

Gesprochene Sprache unterscheidet sich doch sehr von geschriebenem Text. Die Grammatik wird lediglich grob beachtet, es werden häufig Füllwörter wie „Äh“ oder „Hmm“ verwendet und man weicht eher mal vom Thema ab. Oft wird sehr schnell und auch ein wenig unsauber gesprochen. Endungen werden verschluckt oder man spricht mit einem (leichten) Dialekt. Der Dozent legt verständlicherweise nur wenig Wert auf eine klare Aussprache, er konzentriert sich ganz auf die Thematik.
Bisherige Transkriptionssysteme wie Dragon Natural Speaking oder die Windows Speech Recognition wurden für das Diktieren von Briefen entwickelt. Beim Diktat konzentriert man sich jedoch hauptsächlich auf eine saubere Aussprache, man redet sehr langsam und betont auch jedes einzelne Wort bis zu den Endungen. Zusätzlich werden Satzzeichen diktiert, die dem Transkriptionssystem helfen die Worte in sinnvolle Einheiten zu unterteilen und so einen Themenwechsel besser zu erkennen. Folglich sind die Fehlerraten bei diesen Systemen für Vorlesungen sehr hoch und nicht zufriedenstellend.
Aufgrund der hohen Fehlerraten bei herkömmlichen Systemen haben wir eine Kooperation mit dem European Media Lab (EML) in Heidelberg gestartet, um eine Transkriptionssoftware speziell für Lehrveranstaltungen zu entwickeln. Hierfür wird die Software mit Aufzeichnungen von Vorlesungen der letzten zwei Jahre trainiert. Hierbei lernt sie dann auch das notwendige Vokabular für die korrekte Transkription.

Sind nächste Schritte geplant, um Net4Voice weiterzuentwickeln und auf andere Fachgebiete zu übertragen?

Wir haben eine Vielzahl von Anfragen unterschiedlicher Hochschulen in Deutschland und dem deutschsprachigen Ausland, die Spracherkennung einsetzen wollen. Konkret beraten wir uns gerade mit der TU Wien und dem Projekt GESTU (Gehörlos erfolgreich studieren). Ziel des Projekts ist es, die Sprachtranskription für Gehörlose in einem Modellversuch zu testen und dabei zu evaluieren, wie sich die Technik auf ganz Österreich übertragen lässt.
Für Net4Voice selbst sind Anschlussprojekte im Gespräch, um die Einsatzgebiete der Sprachtranskription weiter zu evaluieren und um eine Einführung der Technik an mehr Hochschulen und Fachbereichen zu ermöglichen.

Seitenanfang
  Logo IWM Logo MWK Impressum Kontakt  
 
 
Community
Benutzername:

Passwort: