UiBhjelps åpne kunnskaps­kort

KI 2737 Filformater Whisper

Kort beskrivelse av de forskjellige output filformatene til Whisper
JSON:
En JSON-fil (JavaScript Object Notation) er en fil som inneholder strukturert tekstdata, men ikke fildata som dokumenter eller bilder. Innholdet i JSON-filer kan leses med programmer som Notepad på Windows. JSON brukes ofte til å strukturere data som kan integreres i programmer eller programvare. For eksempel NVIVO

LRC:
En LRC-fil er en tekstbasert fil som inneholder sangtekster til en lydfil. Når lydfilen spilles av med en musikk- eller lydspiller, leses LRC-filen samtidig, og teksten vises synkronisert med sangen. LRC-filer inneholder tidskoder som styrer når teksten vises. Vanligvis har LRC-filer samme navn som tilhørende lydfil, for eksempel audio.mp3 og audio.lrc. LRC-filer ligner på undertekstfiler som SRT.

SRT:
SubRip Subtitle-filer (SRT), som har filendelsen .srt, er et populært format for undertekster. Disse filene brukes til å legge til teksting på videoinnhold etter produksjon, noe som gjør videoene mer tilgjengelige for et bredere publikum.

TEXT
En tekstfil (TXT) inneholder ren tekst uten noen form for formatering eller styling.

TSV:
Tab-separated values (TSV) er et enkelt, tekstbasert filformat for lagring av tabulære data. Hver rad i tabellen er adskilt med en ny linje, og verdier innenfor en rad er adskilt med tabulatorer. TSV er derfor et "delimiter-separated values"-format, likt CSV (comma-separated values).

TXT:
TXT-filer inneholder ren tekst uten noen form for formatering eller visuelle elementer.

VTT:
VTT er et filformat som brukes til å lagre undertekster eller bildetekster for videoinnhold. VTT-filer fungerer ofte som transkripsjoner av nettmøter eller webinarer. Når du tar opp en sesjon på plattformer som Zoom eller Microsoft Teams, genereres VTT-filen som et eget dokument.