Ansvarsfraskrivelse: Våre toppvalg er basert på redaktørenes uavhengige forskning, analyse og/eller praktiske testing.
Automatisert transkriberingsprogramvare har revolusjonert hvordan mange innen digital publisering transkriberer lyd- og videoinnhold, noe som øker prosessens hastighet, effektivitet og nøyaktighet.
Selv om automatiserte transkripsjonstjenester er relativt nye, muliggjort av utviklingen av automatisk talegjenkjenningsprogramvare, har de raskt satt sitt preg. Nesten 16 % av medie- og underholdningsbransjen bruker transkripsjonsprogramvare minst én gang i måneden, og tallet stiger til 22,5 % for markedsundersøkelsessegmentet.
Adopsjonen av disse teknologiene er rent praktisk – det mennesker kan gjøre på timer, kan programvare oppnå på få minutter.
Transkripsjoner tilbyr flere forskjellige fordeler, fra å la utgivere dele skriftlige referater fra intervjuer eller møter til å øke tilgjengeligheten til lyd- og videoinnhold. La oss se litt mer i dybden på noen av disse fordelene før vi utforsker hvilke tjenester som har kommet med på listen vår over de 15 beste transkripsjonsprogramvarene for 2024.
En av tekstens største fordeler fremfor lyd er brukerens mulighet til å søke etter et nøkkelord og navigere gjennom et dokument med et knappetrykk.
Ctrl+F er et av de mest effektive verktøyene en bruker har til rådighet, og å bruke det til å finne viktige termer under en pressekonferanse, et intervju eller et møte kan spare tid som er bedre brukt andre steder.
Å transkribere lydfiler til tekst gjør det enklere å dele dem mellom teammedlemmer, enten via e-post eller skyen. Tekstfiler er betydelig mindre i størrelse enn lydfiler.
Mange transkripsjonstjenester kan transkribere flere språk og deretter oversette dem. Dette gjør transkripsjonsprogramvare til et nyttig verktøy for kommunikasjon på tvers av internasjonale avdelinger eller for å ta opp og transkribere internasjonale pressekonferanser eller taler.
Transkripsjoner kan forbedre informasjonstilgjengeligheten for ansatte med hørselshemming, mens transkripsjonsprogramvare som gir transkripsjon i sanntid for møter og konferanser kan være uvurderlig.
Det er noen forskjellige kjernefunksjoner og faktorer å vurdere når du bestemmer hvilken transkripsjonsprogramvare som fungerer best for din bedrift.
Dette koker ned til hvor nøyaktig programvaren er til å registrere hva som blir sagt. Unøyaktig programvare kan forårsake forvirring senere i prosessen, og til slutt redusere potensielle produktivitetsgevinster.
Hvor raskt transkriberer programvaren lyden? Dette kan være en viktig faktor på arbeidsplasser med mye trafikk, som for eksempel nyhetssider.
Hvorvidt en programvare støtter et bestemt språk kan være en avgjørende faktor for flerspråklige eller ikke-engelsktalende publikasjoner. Svært få transkripsjonsverktøy inkluderer språk med ikke-latinsk skrift, noe som kan skade organisasjoner basert i Asia eller Midtøsten.
Innenfor svært tekniske felt kan det være viktig for transkripsjoner å transkribere svært komplekse ord nøyaktig. Ta for eksempel et apotek som blander sammensetninger for å lage legemidler; det ville være svært viktig at hvert kjemikalie transkriberes nøyaktig. Tilpassede ordlister sikrer at tekniske termer gjenspeiles nøyaktig i transkripsjonen.
Mange av transkripsjonstjenestene på listen vår nedenfor har tatt i bruk forskjellige prisordninger. Det er viktig å vurdere om transkripsjonene er betal-etter-bruk eller har et månedlig abonnement.
Bevæpnet med programvarens ulike fordeler, samt en forståelse av hvilke funksjoner du bør vurdere når du velger en tjeneste, la oss utforske de 15 transkripsjonstjenestene vi mener er på topp.
Colibri er en virtuell møteassistent som transkriberer møter i sanntid. Transkriberingsprogramvaren fyller nisjen med å ta møtenotater, samtidig som den transkriberer importerte video- og lydfiler.
Denne programvaren genererer sammendrag etter møter og inkluderer funksjonen for å fremheve viktig informasjon som blir sagt opp enten via knapp eller talemelding. Colibri støtter imidlertid bare transkripsjon på engelsk.
Colibri har tre abonnementsnivåer: et startnivå for 16 dollar per måned per bruker, som gir opptil 20 timer med transkripsjon, og et profesjonelt nivå som koster 40 dollar per måned per bruker, og gir 100 timer med transkripsjon. Det er også mulig for bedrifter å avtale en tilpasset pris med flere brukere.
Descript tilbyr en rekke redaksjonelle verktøy i tillegg til transkripsjonstjenesten sin, og brukes av organisasjoner som The Washington Post, The New York Times og Al Jazeera.
Descript har mange funksjoner for å organisere transkripsjoner, som automatiserte taleetiketter for å bestemme hvilken person som snakker, automatisk filtrering av fyllspråk – som «ums» – og sletting av gjentatte ord. Programvaren inkluderer også skysynkronisering og muligheten til å importere transkripsjoner.
Descript kan transkribere totalt 23 språk , men de fleste av disse er latinbaserte språk.
Selv om Descript tilbyr et gratis nivå, er funksjonaliteten ekstremt begrenset, med bare 1 time transkripsjon per måned tilgjengelig per bruker. Tjenesten tilbyr tre abonnementsnivåer: $12 per redaktør med 10 timer lyd, $24 per redaktør med 30 timer lyd, og en tilpasset avtale som følger med en dedikert representant for selskapet.
Fireflies er en transkripsjonstjeneste som spesialiserer seg på transkribering av forretningsmøter. Den brukes av selskaper som Netflix, Expedia og Uber.
Fireflies kan transkribere automatisk under en videokonferansesamtale, eller direkte fra en hvilken som helst opplastet lyd- eller videofil. Programvaren inkluderer også en AI-søkefunksjon, som kan søke etter bestemte ord eller filtrere etter bestemte emner.
Fireflies' «Conversation Intelligence» bruker AI til å lage notater etter møter, og analysere målinger som brukerens taletid og holdninger. Programvaren støtter for øyeblikket 7 språk .
Fireflies tilbyr et gratis alternativ som gir begrenset transkripsjon, en pro-versjon for $18 per måned som inkluderer ubegrenset transkripsjon og et bedriftsalternativ for $29 per måned som inkluderer ubegrenset lagring og funksjonen for notater etter møter. Selskapet tilbyr 40 % rabatt på årlig fakturering. I tillegg til nivåene ovenfor finnes det også et tilpasset bedriftsnivå.
Grain , som tilbyr mye funksjonalitet i gratisversjonen, er først og fremst en programvare for transkripsjon av møter, som integreres i programvare for virtuelle møter som Zoom, Google Meets og Slack. Den brukes av organisasjoner som _Zapier, Webflow og Podium.
Grain inkluderer noen sentrale transkripsjonsprogramvarefunksjoner, inkludert en søkefunksjon og en klipp- og uthevingsfunksjon. Grain støtter for øyeblikket opptil 22 språk , men tilbyr bare live transkripsjon på engelsk.
I gratisversjonen kan Grain transkribere opptil 100 møter gjennom sine virtuelle møteintegrasjoner. Hvis du vil importere rå video- og lydfiler, koster det 19 dollar per bruker per måned, men det gir en ubegrenset mengde transkripsjon. Selskapets omsettelige bedriftsalternativ tilbyr et større antall plattformintegrasjoner.
Happy Scribe er en dedikert transkripsjonsprogramvare med mer strømlinjeformede funksjoner. Programvaren brukes av organisasjoner som BBC, Forbes, RTÉ og til og med FN.
En av fordelene med Happy Scribe fremfor annen transkriberingsprogramvare er at den støtter mer enn 60 forskjellige språk . Happy Scribe kommer også med andre nyttige funksjoner som taleridentifikasjon og tidsstempler.
Happy Scribe er imidlertid mindre nøyaktig enn andre tjenester som Rev, og lover bare en nøyaktighetsrate på 85 %. Den gjennomsnittlige behandlingstiden for transkripsjoner er halvparten av lydlengden.
Happy Scribe er en betal-etter-bruk-tjeneste, med priser for den automatiserte tjenesten satt til € 0,20 ($ 0,21) per minutt, med en transkripsjonsgrense på 75 timer.
Maestra er en skybasert transkripsjonsprogramvare som kan transkribere opptil 70 språk . Programvaren fokuserer hovedsakelig på å tilby flerspråklige undertekster for videoinnhold, spesielt for YouTube-produsenter.
Maestra kommer med mange nyttige funksjoner, som en interaktiv tekstredigerer samt en tilpasset ordliste. Programvaren inkluderer også diverse samarbeidsfunksjoner, som muligheten til å laste opp filer til MaestraCloud og samarbeidende tekstredigering i MaestraTeams.
Denne transkripsjonsprogramvaren har en betal-etter-bruk-prisordning satt til $10 per time med lyd. Maestra inkluderer også en abonnementstjeneste for programvaren sin, som koster $29 per bruker, per måned – eller $19 per måned hvis det betales årlig. Abonnementet inkluderer imidlertid fortsatt en lydavgift på $5 per time. Det er også et forhandlingsbart bedriftsalternativ.
Meetgeek er en annen programvare for møteassistenter som kan transkribere møter samt transkribere fra lyd og video importert til programvaren.
Meetgeeks AI kan automatisk foreslå sitater fra møtene som skal fremheves, samt sende sammendrag fra møter som brukerne ikke kunne delta på.
Meetgeek inkluderer også analyseverktøy som kan måle engasjementet i et møte. Den støtter også transkripsjon på mer enn 80 språk , selv om bare en håndfull av dem støtter tilpassede ordlister.
Et profesjonelt abonnement på Meetgeek.ai koster 19 dollar per bruker per måned og gir opptil 20 timer med transkripsjon, mens et bedriftsabonnement koster 39 dollar per måned per bruker og gir opptil 40 timer. Det finnes også en tilpasset bedriftspakke som kan forhandles direkte med selskapet.
Totalt sett tillater den færre transkripsjonstimer sammenlignet med andre møteassistenter som Colibri, men tilbyr mer støtte for språk.
Vår siste anbefaling er Murf , som spesialiserer seg på voice-overs og lydkreativer, og som også har en transkripsjonsfunksjon.
Det finnes over 120 forskjellige tekst-til-tale-stemmealternativer i Murf, samt diverse lydredigeringsfunksjoner, som lydforbedring, stemmeveksler og samarbeidende lydredigering.
Transkripsjonsfunksjonen har en integrert tekstredigerer som tidsstempler ord til deres plassering i lyden. Tekstredigereren sorterer også automatisk tekstene i blokker for å gjøre transkripsjonen mer fordøyelig.
Selv om det finnes flere abonnementer, krever transkribering av mer enn 10 minutter med lyd per år en grunnleggende abonnementspakke på 26 dollar per bruker per måned – som gir en årlig transkripsjonsgrense på 24 timer. Ubegrenset transkripsjon krever et bedriftsabonnement som koster 59 dollar per bruker per måned med minimum 5 brukere.
Medieselskaper som ønsker en transkripsjonstjeneste som en del av en mer spesialisert stemmeredigeringspakke bør vurdere Murf. Ellers finnes det bedre alternativer andre steder på denne listen.
Otter fokuserer primært på å transkribere virtuelle møter i sanntid og fra opplastede lyd- og videofiler. Det brukes av blant annet Wired, TechCrunch og Engadget.
Programvaren kan legges til programvare for virtuelle møter, som Zoom, Google Meets og Microsoft Teams, og gir et avansert sammendrag etter møtet.
Otter inkluderer funksjoner for livskvalitet, som for eksempel identifisering av talere og en tilpasset ordliste. Den legger også til en skjermbildeknapp for å umiddelbart legge til et lysbilde i notatene etter møtet. Når en bruker er dobbeltbooket, kan Otteri sende en AI-assistent til møter for å gi en kopi av transkripsjonen og sammendraget.
Gratisversjonen Basic er rettet mot de som bare trenger å ta opp og transkribere 30-minutters samtaler med en grense på 5 timer. Otters profesjonelle versjon gir 20 timer med transkripsjon, med samtaletiden økt til 90 minutter, til en kostnad på $8,33 per måned. Bedriftsnivået koster $20 per bruker, per måned, og gir 100 timer med samtaler som kan vare i 4 timer. Otter tilbyr også et forhandlingsbart bedriftsnivå.
For øyeblikket støtter programvaren bare engelsk.
Podcastle er en lydkringkastingstjeneste med transkripsjonsfunksjon og er et sterkt alternativ for podcast- innholdsskapere .
Podcastles transkriberingsprogramvare har noen gjenkjennelige funksjoner, inkludert en funksjon for å slette gjentatte ord og automatiserte episodesammendrag – selv om disse funksjonene er låst bak det dyreste abonnementsnivået.
Programvaren inkluderer lydredigeringsverktøy som flersporsredigering, lydforbedring og et bakgrunnsstøyfilter. Podcastle mangler en tilpasset ordliste for tekniske termer og har bare totalt fem europeiske språk uten støtte for ikke-latinsk skrift.
Podcastle tilbyr en gratis basisplan for nye podkastere som ønsker å komme i gang, og tilbyr transkripsjoner på én time. Storyteller-planen koster 11,99 dollar og gir transkribering av opptil 10 timer med lyd, samt mer omfattende tilgang til redigeringsfunksjoner. Pro-nivået koster 23,99 dollar og gir opptil 25 timer.
Rev er en transkripsjonstjeneste av høy kvalitet som benytter både profesjonelle transkribentere og intern automatisert transkripsjonsprogramvare. Store medieorganisasjoner som Viacom, CBS og PBS bruker den.
Revs automatiserte transkripsjon tilbyr en garantert nøyaktighet på 90 % for lyd av høy kvalitet med minimal bakgrunnsstøy. Den kan imidlertid slite med lyd med bakgrunnsstøy og tykke aksenter. Samtidig tilbyr tjenesten et dyrere alternativ for menneskelig transkripsjon som garanterer 99 % nøyaktighet.
Transkriberingsprogramvaren inneholder også noen få redaksjonelle verktøy, som en interaktiv transkripsjonseditor og en tilpasset ordliste for tekniske termer. Rev kan transkribere opptil 31 språk , inkludert språk med ikke-latinske skrifttyper som mandarin.
Rev tilbyr en rekke transkripsjonsalternativer, fra lydfiler til direkte Zoom-teksting. Engangskostnaden for den automatiserte programvaren er imidlertid $0,25 per minutt. Selskapet tilbyr også en standard abonnementstjeneste på $29,99 per måned som kan transkribere opptil 20 timer med innhold, samt en bedriftsspesifikk kontrakt for organisasjoner som trenger å skalere utover det.
Rewatch er en intern videokommunikasjonstjeneste som tilbyr en funksjon for videotranskripsjon. Denne programvaren brukes best for publikasjoner som ønsker å utføre to oppgaver samtidig. Den brukes av selskaper som Zendesk, Github og Brex.
Transkripsjonene har en avansert søkefunksjon for å finne spesifikk informasjon i innspilte møter og briefinger, ettersom det søkte ordet er uthevet og tidsstemplet i videoen.
Rewatch har for tiden 31 forskjellige språk integrert i transkripsjonstjenesten sin, inkludert ikke-latinske skrifttyper.
Rewatch er mindre detaljert om prisene sine enn noen av konkurrentene, og inviterer interesserte parter til å komme i kontakt for å diskutere prisene. Prisstrukturen er imidlertid basert på en per bruker-basis snarere enn en per transkripsjon-basis.
Sonix er en transkriberingsprogramvare som er godt egnet for bedrifter som ønsker å holde oversikt over transkripsjonene sine organisert. Den brukes av Wall Street Journal, ABC News og The New Yorker.
Transkriberingsprogramvaren har mange verktøy for å finne informasjon i transkripsjoner, for eksempel et avansert nøkkelordsøk som kan utføres på alle transkripsjoner programvaren lagrer. Sonix lar også brukere på det høyeste abonnementsnivået lage flere tilpassede ordlister, en nyttig funksjon for organisasjoner med en rekke mediekanaler.
Sonix kan transkribere opptil 38 forskjellige språk , inkludert spesifikke regionale variasjoner og språk med ikke-latinske skrifttyper.
Tjenesten er betal-etter-bruk og koster 10 dollar per time i grunnabonnementet. Sonix inkluderer imidlertid også en abonnementstjeneste på 22 dollar per måned per bruker, noe som senker avgiften til 5 dollar i timen. Sonix tilbyr også en bedriftspakke for transkripsjoner i stort volum, men dette må forhandles direkte med selskapet.
Speak tar transkripsjon et skritt videre ved å tilby dyptgående sentimentanalyse og datavisualisering. Transkripsjonsprogramvaren brukes av blant annet Amazon, Deloitte og IEEE.
Speak fokuserer primært på research, og tilbyr – i tillegg til analyse av transkripsjoner – analyse av Amazon-anmeldelser og konkurrentanalyser. Disse funksjonene gjør Speak til et nyttig verktøy for markedsundersøkelser så vel som transkripsjon.
Selskapet tilbyr gjennomsnittlige transkripsjonstider på halvparten av lydlengden, og lover 95 % nøyaktighet. Transkripsjonsprogramvaren støtter to språk – engelsk og fransk – med fire til i betafaser.
Dette er definitivt et av de dyreste alternativene for transkripsjonsprogramvare på denne listen, med en startpris på $10 per bruker per måned, som sikrer tilgang til en betal-etter-bruk-transkripsjonstjeneste. Selskapet tilbyr også et Premium-alternativ på $585 per måned som gir deg 10 timer med transkripsjon, fordelt på seks brukere. Disse prisene kan reduseres med 20 % når du velger et årsabonnement, og Speak tilbyr også en tilpasset prisplan.
Trint kommer med en rekke redaksjonelle verktøy og historiefortellingsverktøy som hjelper publikasjoner og medier med å lage historier fra intervjuer. Det brukes av blant annet The Washington Post, AP og Der Spiegel.
Trint er en samarbeidende transkripsjonsprogramvare som bruker mange funksjoner som vises i Google Dokumenter, inkludert muligheten til å merke, utheve og kommentere transkripsjoner. Programvaren kan også spille av lyd ved siden av transkripsjonen.
Utgivere som spesialiserer seg på videoinnholdsproduksjon vil også finne mye bruk for denne transkripsjonsprogramvaren, ettersom Trint lar brukere tidskode lydklipp for raskt å få tilgang til et bestemt sitat. Transkripsjonsredigereren kan også fungere på tvers av flere lydklipp, og programvaren er integrert i Adobes Premiere Pro.
Trint er dyrere enn andre alternativer på denne listen, og starter på $48 per person per måned. Denne startprisen transkriberer opptil syv lydfiler. For ubegrensede transkripsjoner må publikasjoner bruke $60 per bruker per måned. Trint tilbyr også et tilpasset bedriftsalternativ.
For å svare på spørsmålet om hvilken transkripsjonsprogramvare som er mest nøyaktig, bestemte vi oss for å gjøre litt research. Ved hjelp av en 3-minutters Ted Talk av Derek Sivers brukte vi transkripsjonsprogramvaren til å måle feilene hver av dem mot den andre. Testen vår viste at den mest nøyaktige transkripsjonsprogramvaren var Otter, etterfulgt av Sonix og Rev.
Otter gjorde bare tre feil i transkripsjonen, hvorav to var feilplasserte punktum og en feilstaving av navnet Wera Muhler – en feil som alle andre transkripsjonsprogramvarer gjorde. Otter klarte imidlertid å stave navnet Peter Gollwitzer riktig, en bragd ingen av de andre transkripsjonsprogramvarene klarte.
Sonix fulgte tett bak med fire feil, ett feilplassert punktum, ett manglende ord og feilstavinger av navnene Wera Muhler og Peter Gollwitzer. Disse feilene kan rettes opp med en tilpasset ordliste, som Sonix inkluderer.
Rev gjorde fem feil. I likhet med Sonix stavet den begge navnene feil, hadde to feilplasserte punktum og forvekslet ved et uhell «og deres» med «i deres». Totalt sett var hver transkripsjon mer enn 99 % nøyaktig.
Selv om Otter er den mest nøyaktige transkripsjonsprogramvaren, gjøres de mest nøyaktige transkripsjonene fortsatt med menneskelige ører, et poeng som nettsteder som Sonix og Rev raskt påpeker. Otter klarte likevel en svært imponerende bragd for et transkripsjonsprogramvare.
Transkripsjonsprogramvare er et nyttig verktøy for omtrent alle organisasjoner, men dobbelt så nyttig for publikasjoner og nyhetsredaksjoner som er avhengige av sitater, pressekonferanser og intervjuer.
Dette gjelder spesielt i tiden etter pandemien, hvor mange publikasjoner har gått over til å gjennomføre intervjuer og interne møter gjennom programvare som Zoom og Google Meets. Programvare for transkripsjon i sanntid er et nyttig verktøy for å holde seg oppdatert på hva som blir sagt og generere handlingsrettede møtesammendrag.
Mange av disse transkripsjonsprogramvarene har gratis prøveversjoner, så det er verdt å sjekke ut hvordan de er og hvor nøyaktige de er for arbeidsflyten din.
Transkripsjonsprogramvare bruker kunstig intelligens til å gjøre om tale i lyd- eller videofiler til tekst. Programmene eksporterer disse tekstene i dokumenter, vanligvis en Microsoft Word-fil eller en PDF.
Video- og lydtranskripsjon refererer til å gjøre om tale som finnes i enten en lyd- eller videofil til tekst.
Generelt sett tar det vanligvis én time for et menneske å transkribere 15 minutter med tekst, så én time med lyd fra en person tar i gjennomsnitt fire timer. For automatisert transkripsjon er gjennomsnittstiden halvparten av lengden på lyden.
Den beste måten å transkribere lyd nøyaktig på er å bestille en transkripsjon fra et menneske. Den beste måten å motta en transkripsjon raskt på er imidlertid å bruke automatisk transkripsjon.