MacWhisper är den gratis transkriptionsprogramvaran jag har väntat på

Letar du efter Mac-programvara för att transkribera ljudfiler till skrivna textfiler? Det finns gott om betalverktyg, som Otter.ai och Trint, som kan kosta riktiga pengar när du börjar använda dem för mycket. Men MacWhisper är gratislösningen internet har väntat på. Eller åtminstone den jag har väntat på.

OpenAI släppte ett otroligt kraftfullt gratisprogram redan i september 2022 som gjorde det möjligt för personer med vissa tekniska kunskaper att konvertera sina ljud- och videofiler till otroligt exakta transkriptioner. Problemet var att det inte var särskilt tillgängligt för den genomsnittliga användaren, eftersom du behövde vara bekant med att använda kommandon i Terminal-appen.

Men med MacWhisper, som först upptäcktes av 9to5Mac, någon har äntligen utvecklat ett GUI, eller grafiskt användargränssnitt, som bygger ovanpå OpenAIs Whisper och lämnar alla förvirrande tekniska grejer under huven, så att du bara kan dra och släppa din ljudfil och få en transkription mycket snabbt. Och MacWhisper är extremt exakt eftersom OpenAI:s Whisper har tränats på 680,000 timmar av ljuddata på webben.

En av de fina sakerna med MacWhisper är att du inte laddar upp ljud- eller videofilen som du vill transkribera till internet. Det är viktigt för journalister som kanske arbetar med en känslig berättelse, eller alla som bara generellt är försiktiga med att ladda upp sina personliga filer till molnet. Filen ligger kvar på ditt skrivbord, vilket betyder att det inte finns någon chans att någon kan fånga upp ditt ljud.

Återigen, MacWhisper är bara ett nytt användargränssnitt för ett gratisprogram som introducerades av OpenAI i slutet av förra året, men det kommer verkligen att göra ljudtranskription enkelt för nästan vem som helst. Eftersom jag har använt Whisper och har funnit det oerhört användbart sedan det släpptes. Och även jag kommer nu att använda MacWhsiper, för det kommer säkerligen att påskynda mitt arbetsflöde.

Som bara ett exempel, efter nyheterna om kryptoföretaget FTX:s kollaps, använde jag Whisper för att transkribera dussintals timmar av gamla YouTube-intervjuer med företagets grundare Sam Bankman-Fried. Därifrån kunde jag söka i utskrifterna och hitta konstiga och intressanta idéer för artiklar att skriva, som när SBF sa i juni 2021 att blockchain skulle ha fixat Enron. SBF:s jämförelse med Enron var en udda slump, med tanke på allt vi nu vet om hur FTX kollapsade. Men jag skulle aldrig ha hittat det ögonblicket i en gammal obskyr intervju utan att ha dussintals utskrifter jag kunde söka efter. Och den processen, även om den var lättare än att lyssna på timmar och timmar av band, var fortfarande klumpig och inte särskilt automatiserad.

Efter att ha installerat Whisper på min maskin, brukade jag skriva "whisper audiofilename.mp3 —model tiny.en" i Macs Terminal-app när jag ville transkribera en fil. Med WhisperMac kan jag bara dra och släppa min ljudfil och den gör sin magi utan extra skrivning.

Jag testade MacWhisper med ett avsnitt av NBC Nightly News som jag laddade ner från YouTube. Och bortsett från några få fel, som att tolka ordet "vindkyla" som "vindkullar" och att höra Lester Holt som "Lester Hold", var utskriften mycket exakt. MacWhisper är gratis, men det finns en betalnivå av programvaran som kan vara något mer exakt eftersom den använder OpenAI:s mer intensiva träningsmodeller, men gratisversionen kommer att fungera alldeles utmärkt för de flesta.

MacWhisper låter dig exportera det transkriberade ordet i några olika format, inklusive vanlig text, CSV eller till och med ett undertextfilformat som SRT och VTT.

Och MacWhisper är inte bara för engelska. Du kan transkribera ljud på 100 olika språk, vilket är otroligt praktiskt. Den enda funktionen MacWhisper inte har, som jag har njutit av att leka med på Whisper i Terminal-appen, är språköversättning. Jag har översatt virala videor till ryska och kinesiska och har fått höra av folk som talar språken på Twitter att översättningarna är exakt.

Den andra funktionen som MacWhisper inte har, även om den inte heller är tillgänglig från OpenAIs Whisper, är förmågan att skilja högtalare åt. Om du till exempel transkriberar en intervju med två talare, finns det inga tydliga markeringar som visar när en talare har slutat och en annan har börjat. Men jag misstänker att någon kommer att bygga upp den förmågan så småningom. Betaltjänster som Trint gör detta automatiskt, och det skulle vara bra att ha gratis så småningom, men du får vad du betalar för.

Det finns också en funktion med MacWhisper där du kan konvertera tal från din dators mikrofon till text, vilket kan vara praktiskt om du vill transkribera något i farten.

Jag tillbringade månader med att undra när någon äntligen skulle utveckla ett GUI för Whisper, eftersom ett fåtal personer försökte men inte skapade något särskilt användarvänligt. Men MacWhisper, som utvecklades av Jordi Bruin, är mjukvaran jag har väntat på. Bruin har även utvecklat mjukvara som MacGPT, som tillåter användare att komma åt ChatGPT från deras menyrad.

Du kan ladda ner MacWhisper gratis, med e-postregistrering, på Bruins hemsida.

Källa: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/