SODP logo

    Die 15 besten Transkriptionssoftwares im Jahr 2024

    Automatisierte Transkriptionssoftware hat die Art und Weise, wie viele im digitalen Verlagswesen Audio- und Videoinhalte transkribieren, revolutioniert und die Geschwindigkeit, Effizienz und Genauigkeit des Prozesses erhöht.
    Aktualisiert am: 1. Dezember 2025
    Thomas Bellink

    Erstellt von

    Thomas Bellink

    Vahe Arabian

    Faktencheck durch

    Vahe Arabian

    Andrew Kemp

    Herausgegeben von

    Andrew Kemp

    Top-Auswahl

    Hinweis: Unsere Top-Empfehlungen basieren auf unabhängigen Recherchen, Analysen und/oder praktischen Tests unserer Redakteure.

    Beschreibung

    Glühwürmchen

    Fröhlicher Schreiber

    Podcastle

    erneut ansehen


    Frag ChatGPT

    Automatisierte Transkriptionssoftware hat die Art und Weise, wie viele im digitalen Verlagswesen Audio- und Videoinhalte transkribieren, revolutioniert und die Geschwindigkeit, Effizienz und Genauigkeit des Prozesses erhöht.

    Automatisierte Transkriptionsdienste sind zwar relativ neu und wurden erst durch die Entwicklung automatischer Spracherkennungssoftware ermöglicht, haben sich aber schnell etabliert. Fast 16 % der Medien- und Unterhaltungsbranche nutzen mindestens einmal im Monat Transkriptionssoftware, im Marktforschungssektor sind es sogar 22,5 %.

    Die Einführung dieser Technologien ist rein praktischer Natur – was Menschen in Stunden schaffen, kann Software in wenigen Minuten erledigen.

    Transkriptionen bieten zahlreiche Vorteile: Verlage können schriftliche Aufzeichnungen von Interviews oder Meetings teilen, und Audio- und Videoinhalte werden besser zugänglich gemacht. Bevor wir die 15 besten Transkriptionssoftware-Anbieter für 2024 vorstellen, betrachten wir einige dieser Vorteile genauer.

    Vorteile der Verwendung von Transkriptionssoftwareprogrammen 

    Erweiterte Suche

    Einer der größten Vorteile von Text gegenüber Audio ist die Möglichkeit für den Benutzer, per Knopfdruck nach einem Schlüsselbegriff zu suchen und durch ein Dokument zu navigieren.

    Die Tastenkombination Strg+F ist eines der effizientesten Werkzeuge, die einem Benutzer zur Verfügung stehen, und ihre Verwendung zur Suche nach wichtigen Begriffen während einer Pressekonferenz, eines Interviews oder einer Besprechung kann Zeit sparen, die anderswo besser genutzt werden kann.

    Erhöhen Sie die Teilbarkeit

    Durch die Transkription von Audiodateien in Text können diese einfacher per E-Mail oder über die Cloud mit Teammitgliedern geteilt werden. Textdateien sind deutlich kleiner als Audiodateien.

    Mehrsprachige Arbeitsbereiche

    Viele Transkriptionsdienste können mehrere Sprachen transkribieren und anschließend übersetzen. Dadurch wird Transkriptionssoftware zu einem nützlichen Werkzeug für die Kommunikation zwischen internationalen Niederlassungen oder für die Aufzeichnung und Transkription internationaler Pressekonferenzen oder Reden.

    Zugänglichkeit

    Transkriptionen können die Zugänglichkeit von Informationen für Mitarbeiter mit Hörbehinderung verbessern, während Transkriptionssoftware, die Echtzeit-Transkriptionen für Besprechungen und Konferenzen ermöglicht, von unschätzbarem Wert sein kann.

    Wie man die beste Transkriptionssoftware auswählt

    Bei der Entscheidung, welche Transkriptionssoftware für Ihr Unternehmen am besten geeignet ist, müssen Sie einige wichtige Merkmale und Faktoren berücksichtigen.

    Genauigkeit

    Letztendlich kommt es darauf an, wie genau die Software das Gesprochene aufzeichnet. Ungenaue Software kann im weiteren Verlauf des Prozesses zu Verwirrung führen und somit potenzielle Produktivitätssteigerungen zunichtemachen.

    Bearbeitungszeit

    Wie schnell transkribiert die Software die Audioaufnahmen? Dies kann in Arbeitsbereichen mit hohem Aufkommen, wie beispielsweise Nachrichtenseiten, ein wichtiger Faktor sein.

    Sprachunterstützung

    Ob eine Software eine bestimmte Sprache unterstützt, kann für mehrsprachige oder nicht-englischsprachige Publikationen ein entscheidender Faktor sein. Nur wenige Transkriptionsprogramme unterstützen Sprachen mit nicht-lateinischer Schrift, was Organisationen in Asien oder dem Nahen Osten benachteiligen kann.

    Benutzerdefinierte Glossare

    In hochtechnischen Bereichen ist es wichtig, dass Transkriptionen auch komplexe Begriffe präzise wiedergeben. Nehmen wir beispielsweise eine Apotheke, die Arzneimittel herstellt; hier ist es von größter Bedeutung, dass jede chemische Substanz korrekt transkribiert wird. Spezielle Glossare gewährleisten, dass Fachbegriffe in der Transkription korrekt wiedergegeben werden.

    Kosten

    Viele der unten aufgeführten Transkriptionsdienste bieten unterschiedliche Preismodelle an. Es ist wichtig zu prüfen, ob die Transkriptionen nutzungsbasiert abgerechnet werden oder ein monatliches Abonnement erfordern.

    Ausgestattet mit dem Wissen um die vielfältigen Vorteile der Software sowie dem Verständnis dafür, welche Merkmale bei der Auswahl eines Dienstes zu berücksichtigen sind, wollen wir die 15 Transkriptionsdienste näher betrachten, die unserer Meinung nach zu den Besten ihres Fachs gehören.

    1

    Colibri

    Colibri

    Colibri ist ein virtueller Meeting-Assistent, der Meetings in Echtzeit transkribiert. Die Transkriptionssoftware schließt die Lücke der Protokollierung von Meetings und transkribiert gleichzeitig importierte Video- und Audiodateien.

    Diese Software erstellt Zusammenfassungen von Besprechungen und bietet die Möglichkeit, wichtige gesprochene Informationen per Knopfdruck oder Sprachansage hervorzuheben. Colibri unterstützt jedoch nur Transkriptionen in Englisch.

    Colibri bietet drei Abonnementstufen an: ein Einsteiger-Abonnement für 16 US-Dollar pro Monat und Nutzer mit bis zu 20 Stunden Transkription, ein professionelles Abonnement für 40 US-Dollar pro Monat und Nutzer mit 100 Stunden Transkription. Unternehmen können außerdem einen individuellen Preis für mehrere Nutzer vereinbaren.

    2

    Beschreibung

    Beschreibung

    Descript bietet neben seinem Transkriptionsdienst auch eine Reihe redaktioneller Werkzeuge an und wird von Organisationen wie der Washington Post, der New York Times und Al Jazeera genutzt.

    Descript bietet zahlreiche Funktionen zur Organisation von Transkripten, darunter die automatische Sprecherkennzeichnung zur Bestimmung der sprechenden Person, das automatische Filtern von Füllwörtern wie „äh“ und das Löschen von Wiederholungen. Die Software umfasst außerdem Cloud-Synchronisierung und die Möglichkeit zum Importieren von Transkripten.

    Descript kann insgesamt 23 Sprachen , allerdings handelt es sich bei den meisten davon um Sprachen, die auf dem Lateinischen basieren.

    Descript bietet zwar eine kostenlose Version an, deren Funktionalität jedoch stark eingeschränkt ist: Pro Nutzer steht lediglich eine Stunde Transkription pro Monat zur Verfügung. Der Dienst bietet drei Abonnementstufen: 12 US-Dollar pro Bearbeiter mit 10 Stunden Audiomaterial, 24 US-Dollar pro Bearbeiter mit 30 Stunden Audiomaterial sowie einen individuellen Vertrag mit einem persönlichen Ansprechpartner.

    3

    Glühwürmchen

    Glühwürmchen

    Fireflies ist ein Transkriptionsdienst, der sich auf die Transkription von Geschäftstreffen spezialisiert hat. Er wird von Unternehmen wie Netflix, Expedia und Uber genutzt.

    Fireflies kann während einer Videokonferenz oder direkt aus hochgeladenen Audio- oder Videodateien automatisch transkribieren. Die Software verfügt außerdem über eine KI-Suchfunktion, die nach bestimmten Wörtern suchen oder nach bestimmten Themen filtern kann.

    Fireflies‘ „Conversation Intelligence“ nutzt KI, um nach Besprechungen Notizen zu erstellen und dabei Kennzahlen wie Redezeit und Stimmungslage der Nutzer zu analysieren. Die Software unterstützt derzeit sieben Sprachen .

    Fireflies bietet eine kostenlose Option mit eingeschränkter Transkriptionsfunktion, eine Pro-Version für 18 $ pro Monat mit unbegrenzter Transkription und eine Business-Option für 29 $ pro Monat mit unbegrenztem Speicherplatz und der Funktion für Nachbesprechungsnotizen. Bei jährlicher Abrechnung gewährt das Unternehmen 40 % Rabatt. Zusätzlich zu den genannten Tarifen gibt es auch einen individuell anpassbaren Enterprise-Tarif.

    4

    Getreide

    Getreide

    Grain , das bereits in der kostenlosen Version viele Funktionen bietet, ist in erster Linie eine Software zur Transkription von Meetings und lässt sich in virtuelle Meeting-Software wie Zoom, Google Meet und Slack integrieren. Es wird von Unternehmen wie Zapier, Webflow und Podium eingesetzt.

    Grain umfasst einige Kernfunktionen einer Transkriptionssoftware, darunter eine Suchfunktion sowie eine Clip- und Markierungsfunktion. Grain unterstützt derzeit bis zu 22 Sprachen , bietet aber Live-Transkription nur in Englisch an.

    In der kostenlosen Version kann Grain dank seiner Integrationen für virtuelle Meetings bis zu 100 Meetings transkribieren. Der Import von Rohvideo- und Audiodateien kostet 19 US-Dollar pro Nutzer und Monat, bietet aber unbegrenzte Transkriptionen. Die Enterprise-Option des Unternehmens, deren Preis verhandelbar ist, bietet eine größere Anzahl an Plattformintegrationen.

    5

    Fröhlicher Schreiber

    Fröhlicher Schreiber

    Happy Scribe ist eine spezialisierte Transkriptionssoftware mit optimierten Funktionen. Die Software wird von Organisationen wie der BBC, Forbes, RTÉ und sogar den Vereinten Nationen eingesetzt.

    Einer der Vorteile von Happy Scribe gegenüber anderer Transkriptionssoftware ist die Unterstützung von über 60 verschiedenen Sprachen . Happy Scribe bietet außerdem weitere nützliche Funktionen wie Sprechererkennung und Zeitstempel.

    Happy Scribe ist jedoch weniger genau als andere Dienste wie Rev und verspricht lediglich eine Genauigkeit von 85 %. Die durchschnittliche Bearbeitungszeit für Transkriptionen beträgt die Hälfte der Audiolänge.

    Happy Scribe ist ein Pay-as-you-use-Service. Die Preise für den automatisierten Service liegen bei 0,20 € (0,21 $) pro Minute, mit einem Transkriptionslimit von 75 Stunden.

    6

    Maestra

    Maestra

    Maestra ist eine cloudbasierte Transkriptionssoftware, die bis zu 70 Sprachen . Die Software konzentriert sich hauptsächlich auf die Bereitstellung mehrsprachiger Untertitel für Videoinhalte, insbesondere für YouTube-Produzenten.

    Maestra bietet viele nützliche Funktionen, darunter einen interaktiven Texteditor und ein benutzerdefiniertes Glossar. Die Software umfasst außerdem verschiedene Kollaborationsfunktionen, wie das Hochladen von Dateien in MaestraCloud und die gemeinsame Textbearbeitung in MaestraTeams.

    Diese Transkriptionssoftware bietet ein nutzungsbasiertes Preismodell mit 10 US-Dollar pro Audiostunde. Maestra bietet außerdem ein Abonnement für seine Software an, das 29 US-Dollar pro Nutzer und Monat kostet – oder 19 US-Dollar pro Monat bei jährlicher Zahlung. Auch im Abonnement fallen 5 US-Dollar pro Audiostunde an. Es gibt zudem eine verhandelbare Unternehmensoption.

    7

    Meetgeek

    Meetgeek

    Meetgeek ist eine weitere Meeting-Assistent-Software, die sowohl Meetings transkribieren als auch in die Software importierte Audio- und Videodateien transkribieren kann.

    Die KI von Meetgeek kann automatisch Zitate aus den Meetings vorschlagen, die hervorgehoben werden sollen, und außerdem Zusammenfassungen von Meetings versenden, an denen die Nutzer nicht teilnehmen konnten.

    Meetgeek bietet außerdem Analysetools, mit denen sich die Beteiligung in Meetings messen lässt. Die Software unterstützt zudem Transkriptionen in über 80 Sprachen , allerdings bieten nur wenige davon die Möglichkeit, benutzerdefinierte Glossare zu erstellen.

    Ein professionelles Abonnement bei Meetgeek.ai kostet 19 US-Dollar pro Nutzer und Monat und beinhaltet bis zu 20 Stunden Transkription. Ein Business-Abonnement kostet 39 US-Dollar pro Nutzer und Monat und beinhaltet bis zu 40 Stunden. Darüber hinaus gibt es ein individuelles Enterprise-Paket, das direkt mit dem Unternehmen verhandelt werden kann.

    Insgesamt ermöglicht es im Vergleich zu anderen Meeting-Assistenten wie Colibri weniger Transkriptionsstunden, bietet aber mehr Unterstützung für Sprachen.

    8

    Murf

    Murf

    Unsere letzte Empfehlung ist Murf , das sich zwar auf Voice-Overs und Audio-Kreationen spezialisiert hat, aber auch eine Transkriptionsfunktion bietet.

    Murf bietet über 120 verschiedene Text-to-Speech-Stimmen sowie diverse Audiobearbeitungsfunktionen, wie z. B. Klangverbesserung, Stimmverzerrer und kollaborative Audiobearbeitung.

    Die Transkriptionsfunktion verfügt über einen integrierten Texteditor und versieht Wörter mit Zeitstempeln an ihrer Position im Audio. Der Texteditor sortiert die Texte außerdem automatisch in Blöcke, um die Lesbarkeit des Transkripts zu verbessern.

    Es gibt zwar verschiedene Tarife, aber für die Transkription von mehr als 10 Minuten Audiomaterial pro Jahr ist ein Basis-Abonnement für 26 US-Dollar pro Nutzer und Monat erforderlich – dieses beinhaltet ein jährliches Transkriptionslimit von 24 Stunden. Unbegrenzte Transkriptionen sind nur mit einem Enterprise-Abonnement möglich, das 59 US-Dollar pro Nutzer und Monat kostet (mindestens 5 Nutzer).

    Medienunternehmen, die einen Transkriptionsdienst als Teil eines spezialisierten Sprachbearbeitungspakets suchen, sollten Murf in Betracht ziehen. Ansonsten gibt es in dieser Liste bessere Alternativen.

    9

    Otter

    Otter

    Otter konzentriert sich hauptsächlich auf die Transkription virtueller Meetings in Echtzeit und anhand hochgeladener Audio- und Videodateien. Es wird unter anderem von Wired, TechCrunch und Engadget genutzt.

    Die Software kann in virtuelle Meeting-Software wie Zoom, Google Meets und Microsoft Teams integriert werden und bietet eine erweiterte Zusammenfassung nach dem Meeting.

    Otter bietet praktische Funktionen wie Sprechererkennung und ein benutzerdefiniertes Glossar. Außerdem gibt es eine Screenshot-Funktion, mit der sich Folien direkt zu den Nachbesprechungsnotizen hinzufügen lassen. Bei Doppelbuchungen kann Otter einen KI-Assistenten zu den Besprechungen schicken, der eine Kopie des Transkripts und der Zusammenfassung bereitstellt.

    Die kostenlose Basic-Version richtet sich an Nutzer, die lediglich 30-minütige Anrufe aufzeichnen und transkribieren möchten (maximal 5 Stunden). Die Professional-Version von Otter bietet 20 Stunden Transkription und eine maximale Anrufdauer von 90 Minuten zum Preis von 8,33 $ pro Monat. Die Business-Version kostet 20 $ pro Nutzer und Monat und umfasst 100 Stunden Transkription, wobei Anrufe bis zu 4 Stunden dauern können. Otter bietet außerdem eine Enterprise-Version zu verhandelbaren Preisen an.

    Aktuell unterstützt die Software nur Englisch.

    10

    Podcastle

    Podcastle

    Podcastle ist ein Audio-Broadcasting-Dienst mit Transkriptionsfunktion und eine gute Option für Podcast -Ersteller .

    Die Transkriptionssoftware von Podcastle verfügt über einige erkennbare Merkmale, darunter eine Funktion zum Löschen wiederholter Wörter und automatische Episodenzusammenfassungen – diese Funktionen sind jedoch nur in der teuersten Abonnementstufe verfügbar.

    Die Software umfasst Audiobearbeitungswerkzeuge wie Mehrspurbearbeitung, Klangverbesserung und einen Hintergrundgeräuschfilter. Podcastle bietet jedoch kein eigenes Glossar für Fachbegriffe und unterstützt lediglich fünf europäische Sprachen ohne Unterstützung für nicht-lateinische Schriftsysteme.

    Podcastle bietet einen kostenlosen Basic-Tarif für Einsteiger an, der einstündige Transkriptionen umfasst. Der Storyteller-Tarif kostet 11,99 $ und ermöglicht die Transkription von bis zu 10 Stunden Audiomaterial sowie einen umfassenderen Zugriff auf Bearbeitungsfunktionen. Der Pro-Tarif kostet 23,99 $ und bietet bis zu 25 Stunden Transkription.

    11

    Rev

    Rev

    Rev ist ein hochwertiger Transkriptionsdienst, der sowohl professionelle Transkribierer als auch eine firmeneigene, automatisierte Transkriptionssoftware einsetzt. Große Medienunternehmen wie Viacom, CBS und PBS nutzen ihn.

    Die automatische Transkription von Rev bietet eine garantierte Genauigkeit von 90 % bei qualitativ hochwertigem Audio mit minimalen Hintergrundgeräuschen. Bei Audio mit starken Hintergrundgeräuschen und Akzenten kann es jedoch zu Problemen kommen. Der Dienst bietet aber auch eine teurere Option mit menschlicher Transkription an, die eine Genauigkeit von 99 % garantiert.

    Die Transkriptionssoftware enthält außerdem einige Bearbeitungswerkzeuge, darunter einen interaktiven Transkripteditor und ein benutzerdefiniertes Glossar für Fachbegriffe. Rev kann bis zu 31 Sprachen , darunter auch Sprachen mit nicht-lateinischen Schriften wie Mandarin.

    Rev bietet eine Vielzahl von Transkriptionsoptionen, von Audiodateien bis hin zu Live-Untertiteln für Zoom-Meetings. Die einmalige Nutzung der automatisierten Software kostet jedoch 0,25 US-Dollar pro Minute. Das Unternehmen bietet außerdem ein Standard-Abonnement für 29,99 US-Dollar pro Monat an, mit dem bis zu 20 Stunden Inhalte transkribiert werden können, sowie einen individuellen Firmenvertrag für Organisationen mit höherem Transkriptionsbedarf.

    12

    erneut ansehen

    erneut ansehen

    Rewatch ist ein interner Videokommunikationsdienst mit integrierter Videotranskriptionsfunktion. Die Software eignet sich besonders für Unternehmen, die zwei Aufgaben gleichzeitig erledigen möchten. Sie wird unter anderem von Zendesk, GitHub und Brex eingesetzt.

    Die Transkripte bieten eine erweiterte Suchfunktion, um spezifische Informationen in aufgezeichneten Besprechungen und Berichten zu finden, da der gesuchte Begriff im Video hervorgehoben und mit einem Zeitstempel versehen wird.

    Rewatch bietet derzeit 31 verschiedene Sprachen in seinem Transkriptionsdienst an, darunter auch nicht-lateinische Schriftsysteme.

    Rewatch ist hinsichtlich seiner Preisgestaltung weniger detailliert als einige Konkurrenten und lädt Interessenten ein, sich mit ihm in Verbindung zu setzen, um die Gebühren zu besprechen. Die Preisstruktur basiert jedoch auf der Nutzung und nicht auf der Anzahl der Transkripte.

    13

    Sonix

    Sonix

    Sonix ist eine Transkriptionssoftware, die sich ideal für Unternehmen eignet, die ihre Transkripte übersichtlich verwalten möchten. Sie wird unter anderem vom Wall Street Journal, ABC News und The New Yorker eingesetzt.

    Die Transkriptionssoftware bietet zahlreiche Funktionen zur Informationssuche in Transkripten, darunter eine erweiterte Stichwortsuche, die für jedes gespeicherte Transkript durchgeführt werden kann. Nutzer der höchsten Abonnementstufe können zudem mehrere benutzerdefinierte Glossare erstellen – ein nützliches Feature für Organisationen mit vielen Medienkanälen.

    Sonix kann bis zu 38 verschiedene Sprachen , einschließlich spezifischer regionaler Varianten und Sprachen mit nicht-lateinischen Schriften.

    Der Service ist nutzungsbasiert und kostet im Basistarif 10 US-Dollar pro Stunde. Sonix bietet jedoch auch ein Abonnement für 22 US-Dollar pro Monat und Nutzer an, wodurch sich der Stundensatz auf 5 US-Dollar reduziert. Für große Transkriptionsvolumen bietet Sonix außerdem ein Enterprise-Paket an, dessen Konditionen jedoch direkt mit dem Unternehmen verhandelt werden müssen.

    14

    Sprechen

    Sprechen

    Speak geht mit seiner Transkriptionssoftware einen Schritt weiter und bietet detaillierte Stimmungsanalysen und Datenvisualisierung. Die Software wird unter anderem von Amazon, Deloitte und dem IEEE eingesetzt.

    Speak konzentriert sich primär auf die Recherche und bietet neben der Analyse von Transkriptionen auch Amazon-Rezensionsanalysen und Wettbewerbsanalysen an. Diese Funktionen machen Speak zu einem nützlichen Werkzeug sowohl für die Marktforschung als auch für die Transkription.

    Das Unternehmen bietet durchschnittliche Transkriptionszeiten von der Hälfte der Audiolänge und verspricht eine Genauigkeit von 95 %. Die Transkriptionssoftware unterstützt derzeit zwei Sprachen – Englisch und Französisch – vier weitere befinden sich in der Beta-Phase.

    Dies ist definitiv eine der teuersten Transkriptionssoftware-Optionen auf dieser Liste. Der Einstiegspreis liegt bei 10 US-Dollar pro Nutzer und Monat und bietet Zugriff auf einen Transkriptionsdienst mit flexibler Abrechnung. Das Unternehmen bietet außerdem eine Premium-Option für 585 US-Dollar pro Monat an, die 10 Stunden Transkription für bis zu sechs Nutzer umfasst. Bei Abschluss eines Jahresabonnements können die Preise um 20 % reduziert werden. Speak bietet darüber hinaus auch individuelle Preispläne an.

    15

    Trint

    Trint

    Trint bietet eine Reihe von redaktionellen Werkzeugen und Storytelling-Tools, die Publikationen und Medien bei der Erstellung von Geschichten aus Interviews unterstützen. Es wird unter anderem von der Washington Post, AP und dem Spiegel genutzt.

    Trint ist eine Software für die kollaborative Transkription und nutzt viele Funktionen von Google Docs, darunter die Möglichkeit, Transkripte mit Tags zu versehen, hervorzuheben und zu kommentieren. Die Software kann außerdem die Audioausgabe parallel zum Transkript wiedergeben.

    Verlage, die sich auf die Erstellung von Videoinhalten , werden diese Transkriptionssoftware ebenfalls sehr nützlich finden, da Trint es ermöglicht, Audioausschnitte mit Zeitcodes zu versehen, um schnell auf ein bestimmtes Zitat zugreifen zu können. Der Transkriptionseditor kann auch mit mehreren Audioclips gleichzeitig arbeiten, und die Software ist in Adobe Premiere Pro integriert.

    Trint ist mit Preisen ab 48 US-Dollar pro Person und Monat teurer als andere Anbieter in dieser Liste. Dieser Einstiegspreis beinhaltet die Transkription von bis zu sieben Audiodateien. Für unbegrenzte Transkriptionen zahlen Verlage 60 US-Dollar pro Nutzer und Monat. Trint bietet außerdem eine individuelle Unternehmenslösung an.

    Welche ist die genaueste Transkriptionssoftware?

    Um die Frage nach der genauesten Transkriptionssoftware zu beantworten, haben wir eine Studie durchgeführt. Anhand eines dreiminütigen TED-Talks von Derek Sivers verglichen wir die Fehlerquote der verschiedenen Transkriptionssoftwares. Unser Test ergab, dass Otter die genaueste Transkriptionssoftware ist, gefolgt von Sonix und Rev.

    Otter unterliefen im Transkript lediglich drei Fehler: zwei falsch gesetzte Punkte und ein Rechtschreibfehler im Namen Wera Muhler – ein Fehler, den auch alle anderen Transkriptionsprogramme machten. Den Namen Peter Gollwitzer hingegen schrieb Otter korrekt, was keinem der anderen Programme gelang.

    Sonix folgte dicht dahinter mit vier Fehlern: einem fehlenden Punkt, einem fehlenden Wort und Rechtschreibfehlern bei den Namen Wera Muhler und Peter Gollwitzer. Diese Fehler lassen sich mithilfe eines von Sonix beigefügten Glossars korrigieren.

    Rev enthielt fünf Fehler. Wie Sonix schrieb auch Rev beide Namen falsch, hatte zwei fehlende Punkte und verwechselte versehentlich „und ihre“ mit „in ihren“. Insgesamt war jede Transkription zu über 99 % korrekt.

    Obwohl Otter die präziseste Transkriptionssoftware ist, erfolgen die genauesten Transkriptionen nach wie vor mit menschlichen Ohren – ein Punkt, auf den Seiten wie Sonix und Rev immer wieder hinweisen. Dennoch hat Otter für eine Transkriptionssoftware eine beachtliche Leistung vollbracht.

    Schlussbetrachtung

    Transkriptionssoftware ist ein nützliches Werkzeug für so gut wie jede Organisation, aber in besonderem Maße für Publikationen und Redaktionen, die auf Zitate, Pressekonferenzen und Interviews angewiesen sind.

    Dies gilt insbesondere in der Zeit nach der Pandemie, in der viele Verlage Interviews und interne Besprechungen über Software wie Zoom und Google Meet abhalten. Echtzeit-Transkriptionssoftware ist dabei ein nützliches Werkzeug, um den Überblick über das Gesagte zu behalten und aussagekräftige Besprechungszusammenfassungen zu erstellen.

    Viele dieser Transkriptionsprogramme bieten kostenlose Testversionen an. Es lohnt sich also, diese auszuprobieren und zu prüfen, wie genau sie für Ihren Arbeitsablauf geeignet sind.

    Häufig gestellte Fragen

    Was ist Transkriptionssoftware?

    Transkriptionssoftware nutzt KI, um gesprochene Sprache in Audio- oder Videodateien in Text umzuwandeln. Die Programme exportieren diese Texte in Dokumente, üblicherweise in Microsoft Word- oder PDF-Dateien.

    Was ist Audio- und Videotranskription?

    Video- und Audiotranskription bezeichnet die Umwandlung von gesprochenem Text aus Audio- oder Videodateien in Text.

    Wie lange dauert die Transkription einer Stunde Audiomaterial?

    Im Allgemeinen benötigt ein Mensch etwa eine Stunde, um 15 Minuten Text zu transkribieren. Demnach dauert die Transkription einer Stunde Audiomaterial im Durchschnitt vier Stunden. Bei automatisierter Transkription beträgt die durchschnittliche Transkriptionszeit die Hälfte der Audiolänge.

    Wie transkribiert man Audio am besten?

    Die beste Methode, Audioaufnahmen präzise zu transkribieren, ist die Beauftragung eines Transkriptionsdienstes durch einen Menschen. Die schnellste Möglichkeit, eine Transkription zu erhalten, bietet jedoch die automatische Transkription.