Springe direkt zu Inhalt

Schneller suchen in Audio- und Videoarchiven

Das Start-up aureka.ai wertet Sprachaufzeichnungen mithilfe künstlicher Intelligenz aus

30.08.2021

Automatisch transkribieren, schneller auswerten: Die Software von Laura Sofia Salas (l.) und Cecilia Maas (r.) ermöglicht neue Forschungsansätze mit Audio- und Videodaten in den Kultur-, Geistes- und Sozialwissenschaften.

Automatisch transkribieren, schneller auswerten: Die Software von Laura Sofia Salas (l.) und Cecilia Maas (r.) ermöglicht neue Forschungsansätze mit Audio- und Videodaten in den Kultur-, Geistes- und Sozialwissenschaften.
Bildquelle: Leo Seidel / BPW Berlin-Brandenburg

„Jeden Tag landen Unmengen von Audio- und Videodateien unsortiert in den Tiefen des Internets, in Bibliotheken und Archiven, auf Smartphones und Laptops“, sagt Cecilia Maas. Dazu kämen unendlich viele audiovisuelle Zeugnisse vergangener Jahrzehnte: Augenzeugenberichte, Interviews, Filme, TV- und Radiobeiträge. Aus der Sicht der Historikerin sind alle diese Daten potenzielle Forschungsobjekte – sofern sie systematisch ausgewertet werden können. Bisher war das nur mit viel Zeit und Mühe möglich: Forscherinnen und Forscher mussten das Material sichten, transkribieren, markieren und archivieren. Mit ihrem Start-up aureka.ai will Cecilia Maas diese Abläufe effizienter gestalten: „Wir nutzen künstliche Intelligenz, um Audio- und Videodaten automatisiert aufzubereiten, damit sie für Archivarbeit, Forschung und journalistische Recherchen genutzt werden können.“

Die Software von aureka.ai erkennt Sprache sowie Sprecherinnen und Sprecher selbst bei Aufnahmen mit schlechter Tonqualität, wandelt das gesprochene Wort automatisch in Text um und versieht ihn mit Zeitangaben. Die Nutzerinnen und Nutzer können das Transkript einsehen, durchsuchen, von jeder Stelle sekundengenau zur entsprechenden Stelle in der Aufnahme wechseln und sich Notizen machen.

Die Gründungsidee entstand während der Promotion

Die Idee dafür hatte Cecilia Maas während ihrer Promotion in Geschichte. Am Lateinamerika-Institut (LAI) der Freien Universität und am internationalen Graduiertenkolleg „Global Intellectual History“ untersuchte sie die Film- und Phonographieindustrie im Südamerika des beginnenden 20. Jahrhunderts. „Obwohl automatische Spracherkennung etwa als Diktierfunktion am Handy schon breit angewendet wurde, konnte ich dennoch keine geeigneten Tools für meine Recherche in audiovisuellen Archiven finden“, sagt die Historikerin. Der Gedanke an diese Marktlücke ließ sie auch nach Abgabe ihrer Doktorarbeit nicht los: Gemeinsam mit einem Freund, der bereits Stadtverwaltungen bei der Digitalisierung unterstützt hat, entwickelte sie ein erstes Geschäftskonzept und reichte es beim Wettbewerb „Research to Market Challenge“ der Berliner Universitäten ein.

„Wir haben zwar nicht gewonnen, waren aber trotzdem überzeugt, dass unsere Idee funktionieren kann“, berichtet Cecilia Maas. Auch ihr Doktorvater Stefan Rinke, Professor für die Geschichte Lateinamerikas am LAI, habe sie ermutigt. Ein Gründungsberater der Freien Universität empfahl ihr, sich für das Berliner Startup Stipendium zu bewerben. Gemeinsam mit der Kulturmanagerin Laura Sofia Salas und dem Software-Entwickler Jonas Schweiger arbeitete sie sechs Monate an einem Prototyp der Software und bereitete den Antrag auf ein einjähriges EXIST-Gründerstipendium vor. Als die Zusage dafür kam, konnte die angehende Gründerin ihr Team um die Entwicklerin und Linguistin Aislyn Rose und den Entwickler Felix Mertineit erweitern.

Eine Maschine macht nur das, wofür sie trainiert wurde

Wissenschaftliche Mentorin des Start-ups ist Claudia Müller-Birn, Professorin für Human Centered Computing am Institut für Informatik der Freien Universität Berlin. „Unsere Mentorin hat viel Erfahrung mit Projekten an der Schnittstelle von Geisteswissenschaften und Informatik“, sagt Cecilia Maas. „Sie hilft uns unter anderem dabei, die Vorgänge des maschinellen Lernens für unsere Nutzerinnen und Nutzer transparent und verständlich zu gestalten.“ Für Forscherinnen und Forscher sei es besonders wichtig, dass die Arbeit der künstlichen Intelligenz nachvollziehbar bleibt, damit sie den Forschungsprozess dokumentieren und weiterhin selbst steuern können.

„Eine Maschine macht nur das, wofür sie trainiert wurde“, sagt die Gründerin. Deshalb funktioniere eine reine Transkriptionssoftware, wie andere Unternehmen sie anbieten, nicht optimal im Kontext von Archiven. So lasse sich aureka.ai etwa mit fachspezifischen Wörterbüchern für bestimmte Fachgebiete adaptieren. Außerdem arbeitet das Team an einer Funktion, die Transkripte automatisch analysiert und zusammenfasst. Zudem sollen Nutzerinnen und Nutzer künftig eigene Kriterien für die Analyse vorgeben können.

Ein Pilotprojekt hat das Start-up bereits zusammen mit dem Digitalen Deutschen Frauenarchiv und dem feministischen Archiv FFBIZ umgesetzt. „Mit unserer Software wurden Audio- und Videodokumente in die Online-Bibliothek integriert und komplett durchsuchbar gemacht“, berichtet Cecilia Maas. Als Partner oder Dienstleister für solche und ähnliche Projekte will sich das Team auch künftig finanzieren. „So können wir unsere Technologie auf die Bedürfnisse jedes Kunden anpassen und weiter verbessern.“

Weitere Informationen

Die Freie Universität Berlin fördert Unternehmensausgründungen mit der Service-Einrichtung Profund Innovation in der Abteilung Forschung. Profund Innovation unterstützt Studierende, Wissenschaftlerinnen und Wissenschaftler sowie Alumni dabei, Anwendungsideen für ihre Forschung zu entwickeln, Start-ups oder Spin-Offs zu gründen sowie Forschungsergebnisse gemeinsam mit etablierten Unternehmen zu verwerten.

Mit dem Berliner Startup Stipendium fördern die Freie Universität Berlin, die Technische Universität Berlin, Charité – Universitätsmedizin Berlin und die Humboldt-Universität zu Berlin Gründerinnen und Gründer, die innovative und/oder technologiebasierte Geschäftsideen im Team umsetzen wollen. Das Programm wird aus Mitteln der Senatsverwaltung für Wirtschaft, Energie und Betriebe sowie des Europäischen Sozialfonds finanziert. Das EXIST-Gründerstipendium ist ein Förderprogramm des Bundesministeriums für Wirtschaft und Energie und wird ebenfalls durch den Europäischen Sozialfonds kofinanziert.