Tal till text, automatisk transkription, automatiska undertexter, automatisk taligenkänning (ASR), datortaligenkänning och röst till text är alla inom samma område av AI-teknik som sätter talade ord i skriftlig text!
Tal till text är ett automatiskt taligenkänningssystem (ASR) som huvudsakligen består av statistiska modeller som kartlägger kontinuerliga talade yttranden eller talvågformer till text på mänskligt språk. ASR-systemet är sammansatt från en språkmodell, en uttalsmodell (lexikon/ordbok) och en akustisk modell. När ASR-systemet konsekvent matas och tränas med nya taldata av flera talare får det ett utökat ordförråd, och noggrannheten i ASR-transkriptet ökar. Därför, ju mer ASR har använt desto bättre noggrannhet får den. Noggrannhetsnivåerna mäts och ställs in av Felfrekvens för ord (WER).
För att en ASR-modell ska anses vara mycket exakt måste WER-korrespondensen vara mindre än 10%. Txtplays ASR-modell anses vara mycket exakt och det beror på att vi levererar en noggrannhet på 94%.
Tal-till-text och automatisk taligenkänning (ASR) gör att ljudinnehåll kan vara visuellt tillgängligt för alla genom att lägga till text. Att lägga till tal-till-text och undertexter ger tillgänglighet för hörselskadade målgrupper som annars skulle uteslutas från detta innehåll. Därför har automatisk taligenkänning (ASR) blivit en nödvändighet att ha för att göra innehåll tillgängligt för alla.
Att göra videoinnehåll på nätet tillgängligt för alla har blivit ett nytt EU-direktiv som fastställts av Riktlinjer för det europeiska handikappforumet och Riktlinjer för tillgänglighet för webbinnehåll (WCAG).
EU-direktivets datum och lagstiftning:
Med automatisk taligenkänning (ASR) känner en algoritm igen orden som talas i din video och levererar maskinbaserade texter för indexering, textning och sökning. Resultatet är bra och användbart, men inte alltid perfekt. Resultatet som levereras beror mycket på ljudkvaliteten hos källmaterialet som används.
Om det finns mycket ljud, och om många människor pratar i varandras munnar, blir resultatet inte perfekt. Undertexterna behöver därför ofta omarbetas, men det tidskrävande arbetet har gjorts - särskilt när det gäller tidpunkten för undertexterna. Txtplay kan tillhandahålla efterbehandling av undertexterna på timbasis.
Sök efter ett ord eller klicka på texten för att navigera. Undertexterna i detta exempel är inte efterbehandlade och tillhandahålls direkt från vår tal-till-text-algoritm.
Steg 1: Skapa ditt txtplay-konto
Tryck på valfri ”Kom igång” -knappar på vår webbplats och bli direkt överförd till vår ”skapa konto” -sida. Över på sidan ”skapa konto” anger du ditt namn, e-postadress och valt lösenord. När du har skapat ditt konto skickar vi en aktiveringslänk till din e-postadress, om du inte får ett aktiveringsmail kontrollera din skräp- eller skräppostmapp. Annars kan du maila vår support på contact@imgplay.com.
Steg 2: Välj betalningsmetod
Txtplay accepterar nästan alla betalningsmetoder som American Express, Visa och Mastercard.
Steg 3: Välj en av våra prissättningsmoduler
Välj mellan Pay as you go, Pro och Enterprise.
Betala som du går: €0.25/MIN transkriberad media, perfekt för snabb åtkomst till transkript och undertexter!
Proffs: För proffs som möter transkriptionsbehov dagligen. Få större rabatter ju mer inkluderad transkription. Kontakta vår försäljningschef för mer information!
Företag: Höga volymtranskriptionsrabatter med avancerade funktionsinställningar byggda för team. Kontakta vår säljare för ett tillfredsställande samarbete!
Steg 4: Ladda upp din ljud- eller videofil
Ladda upp dina media och välj ditt språk. Vår taligenkänningsmotor tar hand om jobbet och meddelar dig när det är klart. Du kan fortsätta arbeta medan vår AI gör magin.
Steg 5: Redigera din ljud- eller videofil
Vi ansluter dina media till transkriptet i vår textredigerare online där du kan uppdatera, markera, upptäcka högtalare och söka igenom din text, och bläddra i ditt ljud eller video.
Steg 6: Exportera till över 20 format
Vi stöder över 20 format inklusive: SRT, VTT, .docx. Du kan finjustera exporten med detaljer som Timecode, Atlasformat, högtalare etc. Vi har också utvecklarvänliga alternativ.
Det finns gratis tal-till-text-versioner som du kan hitta online, men det finns vissa skillnader mellan gratis och betalda versioner som vi tycker är viktiga att tänka på. För det första är kvaliteten på de transkript som den fria ASR genererar, de kommer ofta med låg noggrannhet. På txtplay strävar vi alltid efter att öka vår noggrannhet, så att vi kan leverera högkvalitativa transkript till våra kunder. För det andra kommer gratis tjänster med ett pris, och det är dina data, de behåller dina data för sitt eget intresse. På txtplay tror vi på integritet och säkerhet, det är därför vi alltid raderar alla våra kunders uppgifter direkt efter att din process är klar. För det tredje stöder gratistjänster ibland inte det filformat du behöver. På txtplay stöder vi transkriptexport till över 20 format som gör det möjligt för våra kunder att till exempel ladda ner transkriptet som en Word-fil för att inkludera det i en intervju eller en srt-fil för att lägga till undertexter för en video.