Alt hvad du behøver at vide

Tale til tekst, automatisk transskription, automatiske undertekster, automatisk talegenkendelse (ASR), computertalegenkendelse og stemme til tekst er alle inden for det samme område af AI-teknologi, der sætter talte ord i skrevet tekst!

Hvad er tale til tekst?

Tale til tekst er et automatisk talegenkendelsessystem (ASR), der primært består af statistiske modeller, der kortlægger kontinuerlige talte ytringer eller talebølgeformer til tekst på menneskeligt sprog. ASR-systemet er sammensat ud fra en sprogmodel, en udtalemodel (leksikon/ordbog) og en akustisk model. Når ASR-systemet konsekvent fodres og trænes med nye taledata af flere talere, modtager det et udvidet ordforråd, og nøjagtigheden af ASRs-transkriptet øges. Derfor, jo mere ASR har brugt, jo bedre nøjagtighed modtager den. Nøjagtighedsniveauerne måles og indstilles af Ordfejlfrekvens (WHEN).

For at en ASR-model skal betragtes som meget nøjagtig, skal WER-korrespondancen være mindre end 10%. Txtplays ASR-modellen anses for at være meget nøjagtig, og det er fordi vi leverer en nøjagtighed på 94%.

Hvorfor har vi brug for det?

  • Sprogbarrierer: Undertekster giver folk mulighed for at forstå sprog, der ikke er deres modersmål/de ikke taler ved at oversætte ord eller sætninger til brugerens foretrukne sprog.
  • Forbedret koncentration: hjælp til mennesker med læse- eller indlæringsvanskeligheder. Mennesker med læse- eller indlæringsvanskeligheder kan drage fordel af undertekster for at forstå indholdet bedre og hurtigere.
  • Støjende miljøer: I støjende omgivelser, f.eks. på offentlige steder, fly eller tog, gør undertekster det muligt at følge med i dialogen.
  • Undertekster: er en fremragende ressource til sprogindlæring.
  • Undgå at forstyrre andre de fleste mennesker ser videoer på lydløs, mens de er offentligt.
  • Citater og referencer: For forskere, forfattere og journalister kan undertekster være en værdifuld kilde til citater og referencer, når man skriver om film- eller medieindhold.
  • Transskription af lange interviews: 1 times lydindhold tager cirka 6 timer at transskribere manuelt,

Tale til tekst og automatisk talegenkendelse (ASR) gør det muligt for alle at tilføje tekst at være visuelt tilgængeligt for alle. Tilføjelse af tale til tekst og undertekster giver tilgængelighed for hørehæmmede målgrupper, der ellers ville blive udelukket fra dette indhold. Derfor er automatisk talegenkendelse (ASR) blevet en nødvendighed at besidde for at gøre indhold tilgængeligt for alle.

At gøre onlinevideoindhold tilgængeligt for alle er blevet et nyt EU-direktiv fastlagt af Retningslinjer for Det Europæiske Handicapforum og Retningslinjer for tilgængelighed af webindhold (WCAG).

EU-direktivets datoer og lovgivning:

  • 23. september i 2019: Tilgængelighedskrav gælder for alle offentlige websteder, der lanceres efter denne dato.
  • 23. september i 2020: Loven vil også blive anvendt baglæns - det vil sige, den vil gælde for alle offentlige websteder.
  • 23. juni i 2021: Lovgivningen gælder også for mobile applikationer.

Hvordan fungerer tale til tekst med talegenkendelse?

Med automatisk talegenkendelse (ASR) genkender en algoritme de ord, der tales i din video, og leverer maskinbaserede tekster til indeksering, undertekstning og søgning. Resultatet er godt og brugbart, men ikke altid perfekt. Resultatet, der leveres, afhænger meget af lydkvaliteten af det anvendte kildemateriale.

Hvis der er meget støj, og hvis mange mennesker taler i hinandens mund, vil resultatet ikke være perfekt. Underteksterne skal derfor ofte omarbejdes, men det tidskrævende arbejde er blevet udført - især med hensyn til tidspunktet for underteksterne. Txtplay kan levere efterbehandling af underteksterne på timebasis.



Søg efter et ord, eller klik på teksten for at navigere. Underteksterne i dette eksempel er ikke efterbehandlet og leveres direkte fra vores tale-til-tekst-algoritme.

__wf_reserved_arv

Kom godt i gang!

Trin 1: Opret din txtplay-konto
Tryk på en „Kom i gang“ -knapper på vores hjemmeside, og bliv direkte overført til vores „Opret konto“ side. Over på siden „Opret konto“ indsætter du dit navn, e-mail-adresse og valgte adgangskode. Når du har oprettet din konto, sender vi et aktiveringslink til din e-mail-adresse. Hvis du ikke modtager en aktiverings-e-mail, skal du tjekke din junk- eller spam-e-mail-mappe. Ellers kan du sende en e-mail til vores support på contact@imgplay.com.

Trin 2: Vælg din betalingsmetode
Txtplay accepterer næsten alle betalingsmetoder såsom American Express, Visa og Mastercard.

Trin 3: Vælg et af vores prismoduler
Vælg mellem Pay as you go, Pro og Enterprise.

Betal som du går: €0,25/MIN transskriberede medier, perfekt til hurtig nem adgang til udskrifter og undertekster!

Fordele: For fagfolk, der dagligt støder på transskriptionsbehov. Få større rabatter jo mere inkluderet transkription. Kontakt vores salgschef for detaljer!

Virksomhed: Transskriptionsrabatter med høj volumen med avancerede funktionsindstillinger bygget til teams. Kontakt vores salgschef for et tilfredsstillende samarbejde!

Trin 4: Upload din lyd- eller videofil
Upload dit medie, og vælg dit sprog. Vores talegenkendelsesmotor tager sig af jobbet og giver dig besked, når det er gjort. Du kan fortsætte med at arbejde, mens vores AI gør magien.

Trin 5: Rediger din lyd- eller videofil
Vi forbinder dine medier til udskriften i vores online teksteditor, hvor du kan opdatere, fremhæve, registrere højttalere og søge gennem din tekst, og rulle ind i din lyd eller video.

Trin 6: Eksporter til over 20 formater
Vi understøtter over 20 formater, herunder: SRT, VTT, .docx. Du kan finjustere eksporten med detaljer som Timecode, Atlasformat, højttalere osv. Vi har også udviklervenlige muligheder.

Gratis kontra betalt tale til tekst

Der er gratis tale-til-tekst-versioner, som du kan finde online, men der er nogle forskelle mellem gratis og betalte versioner, som vi synes er vigtige at huske på. For det første er kvaliteten af de udskrifter, som den gratis ASR genererer, de kommer ofte med lav nøjagtighed. Hos txtplay stræber vi altid efter at øge vores nøjagtighed, så vi kan levere udskrifter af høj kvalitet til vores kunder. For det andet kommer gratis tjenester med en pris, og det er dine data, de opbevarer dine data for deres egen interesse. Hos txtplay tror vi på privatliv og sikkerhed, derfor sletter vi altid alle vores kunders data lige efter din proces er færdig. For det tredje understøtter gratis tjenester undertiden ikke det filformat, du har brug for. Hos txtplay understøtter vi transskripteksport til over 20 formater, hvilket gør det muligt for vores kunder at, for eksempel, downloade transkriptet som en Word-fil for at inkludere det i et interview eller en srt-fil for at tilføje undertekster til en video.

Andre ytringsfrihed til teksttjenester

  • Lav nøjagtighed
  • Begrænset behandling
  • Ingen kundesupport
  • Ingen klare retningslinjer for datalagring
  • Ingen online platformeditor
  • Begrænsede fileksportmuligheder

Txtplays betalte tale til teksttjenester

  • Høj nøjagtighed
  • Ubegrænset behandling
  • Kundesupport
  • Klare retningslinjer for datalagring
  • Online platformredaktør
  • Næsten ubegrænsede muligheder for forskellige fileksportmuligheder