OFFLINETRANSCRIBE
DOKUMENTATION
VERSION
2024.04.07.0923
OFFLINETRANSCRIBE.DE
COPYRIGHT ©2024 TADELSUCHT UG (HAFTUNGSBESCHRÄNKT)
1 Einleitung 3
1.1 Unterstütze Aufnahmen-/Audio-Dateiformate . . . . . . . . . . . . . 3
1.2 Auswahl an Transkriptions-Software . . . . . . . . . . . . . . . . . . . 4
1.2.1 OpenAI Whisper .......................... 4
1.2.2 Whisper.cpp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Whisper.cpp BLAS .............................. 6
2 Installation 7
2.1 Installation über die grafische Oberfläche ................ 8
2.2 Installation über die Kommandozeile .................. 9
2.3 Lizenzierung der Anwendung . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.1 Einzelbenutzerlizenzen . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 Mehrbenutzer-/Terminal-Server-Lizenzen . . . . . . . . . . . 10
3 Benutzeroberfläche im Detail (GUI) 12
3.1 Transkription ................................. 13
3.2 Wartschlange für die Transkription . . . . . . . . . . . . . . . . . . . . 14
3.3 Abgeschlossene Transkriptionen . . . . . . . . . . . . . . . . . . . . . 15
3.4 Programmeinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.5 Programmressourcen initialisieren . . . . . . . . . . . . . . . . . . . . 18
3.6 Technische Informationen . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 Kommandozeilen (CMD) 19
4.1 Parameterliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.2 Aufrufbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5 Konfigurationsdatei 22
6 Häufig gestellte Fragen (FAQ) 23
6.1 Was hat OfflineTranscribe für Systemanforderungen? . . . . . . . . . 23
6.2 OfflineTranscribe lässt sich nicht installieren. [Windows SmartScreen] 23
6.3 Werden meine Dateien bzw. Daten hochgeladen oder verlassen in
irgendeiner Weise meinen Computer? . . . . . . . . . . . . . . . . . . 24
6.4 Von wie vielen Benutzern darf eine Lizenz gleichzeitig verwendet wer-
den? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
6.5 Auf wie vielen Computern kann eine Lizenz genutzt werden? . . . . 24
6.6 Ich bekomme folgende Meldung "Der Lizenzschlüssel wird derzeit
bereits von mehreren Geräten verwendet". Was bedeutet das? . . . . 24
6.7 Ein Transkription-Prozess startet nicht. Was kann ich tun? . . . . . . 25
6.8 Die Transkription auf meinem Computer ist mir zu langsam. Was
kann ich tun? ................................. 25
1
6.9 Das Programm sagt mir, dass für meine Auswahl an Transkriptions-
Software und Transkriptions-Modell der Arbeitsspeicher nicht reicht.
Was kann ich tun? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
6.10 Fehlerbehebung bei Zugriffsproblemen auf den Programmressourcen-
Ordner ..................................... 26
7 Referenzen 27
2
1
Einleitung
Mit OfflineTranscribe können Aufnahmen-/Audio-Dateien, wie MP3-Dateien, ohne
eine Internetverbindung auf dem eigenen Computer von Sprache in Text umge-
wandelt werden, also transkribiert werden. Es ist ein Programm, das eine einfache
Benutzeroberfläche für eine Auswahl an Transkriptions-Software und -Modellen
bietet und die Bereitstellung und Nutzung dieser automatisiert.
1.1 Unterstütze Aufnahmen-/Audio-Dateiformate
Das Programm unterstützt verschiedene Dateiformate. MP3- und WAV-Dateien
werden nativ unterstützt, während andere Audio-Dateiformate erst innerhalb des
Programms automatisch in eine kompatible Audio-Datei konvertiert werden. Die
konvertierten Dateien werden unter dem Pfad %appdata%\OfflineTranscribe\
ConvertedAudioFiles mit einem Namen wie beispielsweise "Recording_5d2d3b9c-
a360-4f52-a335-093e3d9d5c98.mp3" temporär abgelegt. Dies geschieht mit der en-
thaltenen Software "ffmpeg"[3].
Folgende Dateiformate wurden getestet und werden unterstützt:
(Weitere Formate können eventuell auch unterstützt werden, da die enthaltene
Konvertierungs-Software sehr viele Audio-Datei-Formate unterstützt [Mehr Infor-
mationen dazu: https://en.wikipedia.org/wiki/FFmpeg#Supported_formats].)
3
MP3 WAV OGG FLAC M4A
1.2 Auswahl an Transkriptions-Software
Dieser Abschnitt geht auf die unterstützte Auswahl an Transkriptions-Software und
-Modellen ein. Dabei werden diese kurz beschrieben und auf eventuell interes-
sante Einzelheiten eingegangen.
1.2.1 OpenAI Whisper
Whisper ist ein Allzweckmodell für die Spracherkennung. Es wurde anhand eines
großen Datensatzes mit verschiedenen Audiodaten trainiert und ist ein Multitasking-
Modell, das sowohl mehrsprachige Spracherkennung als auch Sprachübersetzung
und Sprachidentifikation durchführen kann.[2]
Modelle Folgende Modelle können für die enthaltende Transkriptions-Software
Whisper ausgewählt werden:
Modellname Schnelligkeit Fehlerquote Beschreibung
tiny +++++ + Schnellste / meiste Fehler
base ++++ ++ Schnell
small +++ +++ Normal
medium ++ ++++ Besser
large + +++++ Beste / Geringste Fehler
tiny_en +++++ + Nur Englisch - Schnellste/meiste Fehler
base_en ++++ ++ Nur Englisch - Schnell
small_en +++ +++ Nur Englisch - Normal
medium_en ++ ++++ Nur Englisch - Besser
Unterstütze Sprache Die Sprachunterstützung und Fehlerquote können je nach
Sprache stark variieren (Mehr Informationen: https://github.com/openai/whisper/
blob/eff383b27b783e280c089475852ba83f20f64998/language-breakdown.svg).
Hier ist die Auflistung der unterstützten Sprachen:
Englisch
Chinesisch
Deutsch
Spanisch
Russisch
Koreanisch
Französisch
Japanisch
Portugiesisch
Türkisch
Polnisch
Katalanisch
4
Niederländisch
Arabisch
Schwedisch
Italienisch
Indonesisch
Hindi
Finnisch
Vietnamesisch
Hebräisch
Ukrainisch
Griechisch
Malaiisch
Tschechisch
Rumänisch
Dänisch
Ungarisch
Tamil
Norwegisch
Thai
Urdu
Kroatisch
Bulgarisch
Litauisch
Latein
Maori
Malayalam
Walisisch
Slowakisch
Telugu
Persisch
Lettisch
Bengalisch
Serbisch
Aserbaidschanisch
Slowenisch
Kannada
Estnisch
Mazedonisch
Bretonisch
Baskisch
Isländisch
Armenisch
Nepali
Mongolisch
Bosnisch
Kasachisch
Albanisch
Suaheli
Galicisch
Marathi
Punjabi
Singhalesisch
Khmer
Shona
Yoruba
Somali
Afrikaans
Okzitanisch
Georgisch
Weißrussisch
Tadschikisch
Sindhi
Gujarati
Amharisch
Jiddisch
Laotisch
Usbekisch
Färöisch
Haitianisches-
Kreolisch
Pashto
Turkmenisch
Nynorsk
Maltesisch
Sanskrit
Luxemburgisch
5
Myanmar
Tibetisch
Tagalog
Malagasy
Assamese
Tatar
Hawaiianisch
Lingala
Hausa
Baschkirisch
Javanisch
Sundanese
1.2.2 Whisper.cpp
Diese Software ist eine alternative Implementierung von OpenAI’s Whisper. Sie ist
in der Programmiersprache C++ verfasst, was je nach System zu einer schnelleren
Transkription führen kann.[4] Es werden umformatierte Whisper-Modelle verwen-
det und nativ werden nur WAV-Dateien unterstützt. OfflineTranscribe kümmert
sich aber bei anderen Audio-Dateiformaten, wie auch bei OpenAI’s Whisper, um
die interne Konvertierung in das kompatible Audio-Dateiformat. Abgesehen von
dem gerade genannten, verhält sich die Software genauso wie OpenAI’s Whisper
mit den gegebenen Modellen und unterstützten Sprachen (siehe 1.2.1).
1.3 Whisper.cpp BLAS
Diese Software ist Whisper.cpp (siehe 1.2.2) bloß mit einer Implementierung, die
die Programmbibliothek BLAS für die Berechnungen der Transkription verwendet.[5]
Auf manchen Systemen ist diese schneller als die normale Implementierung. Sie
verhält sich genauso wie Whisper.cpp und nutzt dieselben Modelle.
6
2
Installation
Das Programm kann mittels der, auf https://OfflineTranscribe.de verfügbaren,
Exe-Datei "OfflineTranscribe-Setup.exe" gestartet werden. Diese ist gegebenfalls je
nach Quelle in einer komprimierten Zip-Datei gepackt.
Folgend wird in Abschnitt 2.1 auf die grafische Installation und in Abschnitt 2.2 auf
die Kommandozeilen-Installation eingegangen.
Weiterhin folgt in Abschnitt 2.3 die Erklärung, wie man die Anwendung mit einem
Lizenzschlüssel lizenzieren kann.
7
2.1 Installation über die grafische Oberfläche
8
2.2 Installation über die Kommandozeile
Mit dem Parameter "/S" kann eine Installation unbeaufsichtigt durchgeführt wer-
den. Wenn der Installationspfad festgelegt werden soll, kann dies über den Param-
eter /D=C:\NewInstallDir\\ durchgeführt werden.
Beispiel 1: OfflineTranscribe-Setup.exe /S
Beispiel 2: OfflineTranscribe-Setup.exe /S /D=C:\\NewInstallDir\\
2.3 Lizenzierung der Anwendung
Zur Lizenzierung der Anwendung muss mit einem Lizenzschlüssel einmalig eine
Online-Aktivierung der Installation durchgeführt werden. Die Anzahl der maxi-
malen Aktivierungen ist dabei limitiert und abhängig von der erworbenen Lizenz.
Bei der Aktivierung wird nach einer erfolgreichen Kommunikation mit dem Lizen-
zserver eine "LicenseConfirmation"-Datei auf dem Computer angelegt, die den Lizen-
zschlüssel, das Ablaufdatum und die Geräte-ID enthält. Diese Datei wird bei jedem
Start der Anwendung herangezogen, um die Gültigkeit der Lizenz zu prüfen. Diese
Prüfung funktioniert auch ohne Internetverbindung.
Unter den Programmeinstellungen findet man die Einstellungen für die Lizenz.
Diese Lizenz bezogenen Einstellungen werden folgend in ihren verschiedenen For-
men gegebenfalls mit einer kurzen Erklärung durchgegangen.
Keinen Lizenzschlüssel eingegeben
9
Lizenzschlüssel nicht erkannt
Ein Lizenzschlüssel wird als ungültig angezeigt, wenn dieser nicht die korrekten
Lizenzschlüsselstruktur besitzt, der Schlüssel dem Lizenzserver unbekannt ist oder
der Lizenzserver nicht erreichbar iust.
Lizenzschlüssel wurde als gültig erkannt
In diesem Fall wird die Aktivierungsschaltfläche aktiv und die Online-Aktivierung
kann mit einem Klick auf die Schaltfläche durchgeführt werden.
Ansicht nach erfolgreicher Online-Aktivierung
Nach der Aktivierung sieht man das Datum an dem die Lizenz abläuft und die An-
zahl der durchgeführten Aktivierungen sowie die Anzahl der maximal möglichen
Aktivierungen angezeigt.
2.3.1 Einzelbenutzerlizenzen
Die "LicenseConfirmation"-Dateien von Einzelbenutzerlizenzen müssen immer im
Arbeitsordner liegen, wie %appdata%/OfflineTranscribe/.
Diese "LicenseConfirmation"-Dateien der Einzelbenutzerlizenz sind computerspez-
ifisch und können nicht einfach auf einen anderen Computer kopiert werden, um
das Programm zu lizenzieren. Es muss auf dem neuen Computer mit dem Lizen-
zschlüssel wieder erneut eine Onlineaktivierung speziell für diesen Rechner durchge-
führt werden.
2.3.2 Mehrbenutzer-/Terminal-Server-Lizenzen
Die "LicenseConfirmation"-Datei bei Mehrbenutzer-/Terminal-Server-Lizenzen kann
im Arbeitsordner liegen, wie %appdata%/OfflineTranscribe/, oder im Programm-
Installationsordner. Diese "LicenseConfirmation"-Dateien der Mehrbenutzer-/Terminal-
Server-Lizenzen sind nicht computerspezifisch und können einfach auf einen an-
deren Computer kopiert werden, um das Programm auf diesem zu lizenzieren. Dieses
10
veränderte Verhalten im Vergleich zu Einzelbenutzerlizenzen ist besonders für die
weit verbreitete automatisierte Verteilung der Anwendung innerhalb von Unternehmen
gedacht.
11
3
Benutzeroberfläche im
Detail (GUI)
In diesem Kapitel wird im Detail auf die Benutzeroberfläche, ihre einzelnen Ele-
mente sowie auf nennenswerte Aspekte eingegangen.
In dem dargestellten Screenshot der Anwendung sind bereits Eintragungen durch
12
den Benutzer vorgenommen worden, um beispielsweise die Liste der Audio-Dateien,
die Warteschlange für die Transkription sowie die Liste der abgeschlossenen Tran-
skription demonstrativ mit Elementen zu füllen. Ebenso wurden auch schon bei
den Einstellungen für die Transkription sowie für die Anwendung im Allgemeinen
Änderungen vorgenommen.
Folgend werden Ausschnitte aus diesem Bild genommen, um die einzelnen Teile
der Benutzeroberfläche zu erklären:
3.1 Transkription
Diese Elementgruppe enthält die beiden Unterelementgruppen "Audio" und "Ein-
stellungen für die Transkription".
In der Unterelementgruppe "Audio" können Audio-Aufnahmen von der Festplatte
ausgewählt werden, die zu Text transkribiert werden sollen. Es können dabei mehrere
Audio-Dateien gleichzeitig ausgewählt werden. Die ausgewählten Dateien befinden
sich dann in der Auflistung, in der der Name, die Länge und der Dateipfad der
Audio-Datei angezeigt werden.
Unter der Unterelementgruppe "Audio" befindet sich die "Einstellungen für die
Transkription". In diesen Einstellungen können Sie die Art der Transkription auswählen.
Zunächst steht Ihnen die Auswahl der Software zur Verfügung, die für die Tran-
skription verwendet werden soll.
13
Je nach ausgewählter Software verändert sich die nachfolgende Auswahl der "Mod-
elle der Transkriptionssoftware". Diese Modelle sind unterschiedlich angelernte
Speicher für die Software, die zur Transkription genutzt werden. Die Modelle un-
terscheiden sich beispielsweise bei der Genauigkeit der Transkription, der Schnel-
ligkeit der Transkription und dem Sprachumfang. Als vereinfachtes Beispiel: Ein
Modell, das nur auf Englisch angelernt ist, würde bei einer englischen Audio-Aufnahme
bei der Transkription wesentlich schneller sein als eines, das gleich für 6 verschiedene
Sprachen angelernt wurde, da die einzelnen Worte mit mehr Wörtern auf Überein-
stimmungen abgeglichen werden müssten.
Als letzte Auswahlmöglichkeit bleibt die Auswahl der Sprache der Audio-Datei. Manche
Software- und Modell-Auswahlkombinationen bieten das automatische Erkennen
der Sprache in der Audio-Datei an. Andere nicht. In diesem Fall muss manueell
die korrekte Sprache ausgewählt werden, da ansonsten die Software versucht, die
Transkription mit der falschen ausgewählten Sprache vorzunehmen. Das Ergebnis
wäre in diesem Fall maximal unterhaltsam, aber wenig nützlich.
Wenn schlussendlich die entsprechenden Audio-Dateien und die Transkription-
seinstellungen festgelegt wurden, kann mit einem Klick auf "Zur Transkription-
swarteschlange hinzufügen" die Transkription begonnen werden. Je nach Anwen-
dungseinstellung startet bereits jetzt automatisch der Transkriptionsprozess und
die Verarbeitung kann in der Transkriptionswarteschlange verfolgt werden.
3.2 Wartschlange für die Transkription
In dieser Elementgruppe werden die Transkriptionsaufträge dargestellt, die derzeit
ausgeführt oder als nächstes ausgeführt werden.
Die Aufträge, die noch nicht gestartet wurden, enthalten dabei die Informationen
der derzeitigen Platznummer in der Liste, des Dateinamens, der Länge der Auf-
nahme, der ausgewählten Transkriptionssoftware, des ausgewählten Transkription-
smodells und der ausgewählten oder automatisch ermittelten Sprache der Audio-
datei. Darunter befindet sich der komplette Dateipfad der Audiodatei. Im Hin-
tergrund des Auftrags ist auch eine grafische Darstellung der Höhen und Tiefen
der Audiodatei sichtbar. Rechts befindet sich der Startknopf, der die Transkription
startet. Gefolgt davon gibt es Schaltflächen, mit denen die Aufträge in der Liste ver-
schoben oder komplett entfernt werden können.
14
Aufträge, die gestartet wurden und noch nicht abgeschlossen sind, unterscheiden
sich in der Oberfläche in einigen Punkten. So wurde der Start-Knopf durch einen
Stop-Knopf ersetzt und eine zusätzliche Schaltfläche darunter hinzugefügt. Diese
Schaltfläche öffnet ein Ausgabefenster, das die bisherigen Prozessausgaben und
technischen Daten der Transkriptionssoftware anzeigt. Eine solche Prozessaus-
gabe ist in dem folgenden Bild dargestellt.
Als weitere Änderungen sind eine Prozentangabe des Transkriptionsfortschritts, die
Anzahl der transkribierten Minuten, die Gesamtzahl an Audiominuten, ein visueller
Ladebalken und die Zeit, die die Transkription bereits dauert, sichtbar. Bei längeren
Transkriptionen wird auch noch die wahrscheinliche verbleibende Zeit in Minuten
angezeigt. Dies ist in dem folgenden Bild zu sehen.
3.3 Abgeschlossene Transkriptionen
In dieser Elementgruppe werden die Transkriptionsaufträge dargestellt, die abgeschlossen
sind.
15
Die Aufträge zeigen zunächst den Zeitpunkt an, zu dem die Transkription abgeschlossen
wurde. Danach folgen der Name der Audio-Datei, die Dauer der Audio-Datei, die
verwendete Transkriptionssoftware, das Modell, die Sprache der Audio-Datei und
die Anzahl der bei der Transkription gefundenen Wörter. Unter diesen Informatio-
nen werden der Pfad zur Audio-Datei und die benötigte Zeit für die Transkription
angezeigt. Neben all diesen Informationen zum Transkriptionsauftrag findet sich
ein Knopf, mit dem man den Auftrag aus der Liste entfernen kann. Danach gibt es
einen Knopf, mit dem man sich den transkribierten Text innerhalb der Anwendung
anzeigen lassen kann. Die Knöpfe darunter bieten die Möglichkeit, den transkri-
bierten Text in den verfügbaren Dateiformaten auf der Festplatte zu speichern.
3.4 Programmeinstellungen
Software-Lizenz: Hier kann der Lizenzcode eingegeben und aktiviert werden. Der
Aktivieren-Knopf wird aktiv, wenn ein gültiger Lizenzcode eingegeben wurde und
neben dem Lizenzcode-Feld ein grüner Haken erscheint. Eine genaue Erklärung,
wie die Lizenzierung funktioniert, findet sich in Abschnitt 2.3.
Programmsprache: Hier kann die Sprache der Benutzeroberfläche ausgewählt
werden.
Neu hinzugefügte Transkriptionsaufgaben sofort ausführen: Hier kann festgelegt
werden, ob Transkriptionsaufgaben sofort beim Hinzufügen in der Warteschlange
16
gestartet werden.
Automatischer Start der Transkription beim Programmstart: Hier kann festgelegt
werden, ob beim Programmstart automatisch auch die Transkriptionsaufgaben in
der Warteschlange abgearbeitet werden sollen.
Maximale Anzahl von gleichzeitigen Prozessen: Hier kann die maximale Anzahl
von gleichzeitigen Prozessen ausgewählt werden, die durch den automatischen Start
("Automatischer Start der Transkription beim Programmstart") gleichzeitig ausge-
führt werden.
Technische Informationen anzeigen: Hier kann die Unterelementgruppe für tech-
nische Informationen angezeigt werden. Diese umfassen die Anzahl der derzeit
laufenden Transkriptionsprozesse, die CPU- und Arbeitspeicherauslastung.
Programm-Ressourcen initialisieren: Hier können manuell die Programm-Ressourcen
initialisiert werden. Diese umfassen die Transkriptionssoftware und das Transkrip-
tionsmodell, die gerade in der Unterelementgruppe "Transkription" ausgewählt sind
(siehe Abschnitt 3.1). Beim Klick auf die Schaltfläche öffnet sich das in Abschnitt 3.5
beschriebene Fenster.
Programm-Ressourcen zurücksetzen: Diese Schaltfläche löscht alle initialisierten
Daten aller Transkriptionssoftware und löscht alle heruntergeladenen Transkriptionsmodell-
Daten. Dies kann helfen, falls ein Fehler bei der Initialisierung aufgetreten ist.
Software-Version: Hier wird die Versionsnummer der aktuell installierten Pro-
grammversion angezeigt.
Update-Kanal: Hier kann der Update-Kanal eingestellt werden. Zur Auswahl ste-
hen "Release" und "Test".
Update: Über diese Schaltfläche kann die Software aktualisiert werden. Sofern
keine neuere Version verfügbar ist, ist die Schaltfläche grau, etwas transparent und
nicht auswählbar. Wenn eine neue Version verfügbar ist, ist die Schaltfläche mit der
Farbe Orange unterlegt und auswählbar.
Dokumentation: Mit einem Klick auf diese Schaltfläche wird versucht, diese Doku-
mentation in dem Standard-Webbrowser des Betriebssystems zu öffnen.
17
Rechtliche Hinweise: Hier kann das Impressum, die AGBs sowie weitere rechtliche
Texte betrachtet werden.
3.5 Programmressourcen initialisieren
Nach einem manuellen Start der Initialisierung der Programmressourcen oder beim
Starten einer Transkription, bei der noch Programmressourcen fehlen, öffnet sich
dieses Ladefenster. Es zeigt die durchgeführten Schritte an und ermöglicht es, den
Fortschritt beim Initialisieren zu verfolgen.
3.6 Technische Informationen
In dieser Unterelementgruppe werden technische Informationen angezeigt, wie
die Anzahl der derzeit laufenden Transkriptionsprozesse, die CPU- und Arbeitspe-
icherauslastung.
18
4
Kommandozeilen (CMD)
OfflineTranscribe kann auch über die Kommandozeile genutzt werden. Folgend
wird auf die Nutzung über die Konsole eingegangen sowie auf Besonderheiten, auf
die geachtet werden sollte.
Die Kommandozeilenfunktionalität (CLI) basiert auf denselben Programmstruk-
turen, die die grafische Oberfläche nutzt, was zur Besonderheit führt, dass beim
Aufruf der CLI auf das Programm explizit gewartet werden muss, da andernfalls die
Kommandozeile sofort den nächsten Befehl erwartet, während OfflineTranscribe
19
im Hintergrund läuft. Daher muss das Programm immer mit "start /w OfflineTran-
scribe CLI" gestartet werden, damit auf die Beendigung der Anwendung gewartet
wird und die Ausgabe korrekt angezeigt wird. Ein Aufrufbeispiel ist in der "OfflineTranscribe-
CLI-Example.bat" im Installationsordner oder im Abschnitt 4.2 zu sehen. Weiterhin
ist zu erwähnen, dass die Dateipfade, die das Programm annimmt, auch Windows-
Environment-Variables unterstützen, sofern diese verwendet werden sollen.
4.1 Parameterliste
Die folgende Tabelle listet alle verfügbaren Parameter auf, die einzeln oder in Kom-
bination verwendet werden können:
Parameter Abkürzung Beschreibung
CLI Notwendiger Parameter für die Nutzung des CLI.
–software -s Transkriptions-Software
[Whisper, WhisperCPP, WhisperCPPBLAS]
–model -m
Transkriptions-Modell (Abhängig von der Software)
[tiny, base, small, medium, large,
tiny_en, base_en, small_en, medium_en]
–language -l
Sprache der Audio-Datei.
auto = Automatische Spracherkennung
ISO-639-1-Code [en, zh, de, es, ru, ko, fr, ..]
–input -i Pfad zur Audio-Datei.
(Beispiel: C:\recording.mp3)
–output -o Pfad zur Ausgabe-Datei.
(BeispieL: C:\output.txt
–format -g Ausgabeformat
[txt, srt]
–help -h Zeigt den aktuellen Hilfstext an.
–version Zeigt die aktuelle Versionsnummer an.
4.2 Aufrufbeispiele
Die folgenden Beispiele zeigen die Verwendung der Parameter:
20
1chcp 65001
2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"
CLI -s WhisperCPP -m tiny -l en -i sample_audio_recording.mp3 -o
"%USERPROFILE%\Downloads\sample_audio_recording.txt" -f txt
,
,
3pause
1chcp 65001
2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"
CLI -s WhisperCPPBLAS -m small -l de -i
"C:\sample_audio_recording.mp3" -o"C:\sample_audio_recording.srt"
-f srt
,
,
,
3pause
1chcp 65001
2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"
CLI -s Whisper -m large -l zh -i"C:\sample_audio_recording.mp3"
-o"C:\sample_audio_recording.srt" -f srt
,
,
3pause
21
5
Konfigurationsdatei
Die Anwendung erstellt beim Start die "Configuration.ini", welche dafür da ist die
in der Benutzeroberfläche gemachten Einstellungen zu speichern. Diese Datei wird
in dem Ordner %appdata%\OfflineTranscribe\ erstellt. In diesem Ordner liegen
auch temporäre Dateien, ggf. die Lizenzverifikationsdatei sowie die Ergebnisse der
Transkribierungsprozesses.
Folgend beispielhaft die Maximalausprägung der "Configuration.ini":
1[UI]
2Language =de
3SelectedTranscriptionSoftware =Whisper
4SelectedTranscriptionModel =tiny
5UpdateChannel =Release
6LastAudioFilesOpenFileDialogPath =C:
7SelectedTranscriptionLanguage =auto
8
9[BackgroundWorker]
10 NumberOfConcurrentProcesses = 1
22
6
Häufig gestellte Fragen
(FAQ)
6.1 Was hat OfflineTranscribe r Systemanforderungen?
Kompatibilität wurde mit Windows 10 und Windows 11 getestet. Es werden ca.
500 MB Speicherplatz zur Installation benötigt. Je nach gewählter Transkriptions-
Software und -Modell können bis zu 20 GB Speicherplatzverbrauch während der
Nutzung dazu kommen. Das Programm benötigt einmalig eine Internetverbindung
für die Lizenzaktivierung. Ebenso wird ggf. eine Internetanbindung einmalig benötigt,
um das ausgewählte Transkriptions-Modell automatisch durch OfflineTranscribe
herunterladen zu lassen. Die Transkriptions-Modelle können aber auch schon vorher
in den entsprechenden Ordner platziert werden, damit kein Download durch die
Anwendung erforderlich ist.
6.2 OfflineTranscribe lässt sich nicht installieren. [Windows SmartScreen]
Erscheint bei einem Doppelklick auf die heruntergeladene Installationsdatei eine
Meldung, wie "Der Computer wurde durch Windows geschützt" oder "Von Win-
dows Smartscreen wurde der Start einer unbekannten App verhindert", muss zur
Installation auf den Text "Weitere Informationen" innerhalb des Fensters geklickt
werden und dann auf "Trotzdem ausführen".
Eine solche Meldung wird von Microsoft angezeigt, wenn ein ausführbares Pro-
23
gramm relativ neu erstellt wurde und Microsoft es noch nicht kennt. Microsoft wird
automatisch im Hintergrund die exe-Datei hochladen, analysieren und diese Mel-
dung bei anderen nicht mehr anzeigen, sobald das Programm schon länger von
vielen Nutzern verwendet wird. Daher kann das Problem leider bei jeder neuen
Version des Programms erneut auftreten.
6.3 Werden meine Dateien bzw. Daten hochgeladen oder verlassen
in irgendeiner Weise meinen Computer?
Nein! Ihre Daten verbleiben auf Ihrem Rechner alleine. OfflineTranscribe lädt keine
Ihrer Daten zu irgendeinem Server hoch. Das Programm baut nur in wenigen Fällen
überhaupt eine Verbindung zu den OfflineTranscribe-Servern auf. Diese Fälle um-
fassen die einmalig notwendige Lizenzaktivierung, die Suche nach Programmup-
dates, die Prüfung, ob eine Lizenz derzeit auf mehreren Rechnern gleichzeitig genutzt
wird, und erforderliche Transkriptions-Modelldaten.
6.4 Von wie vielen Benutzern darf eine Lizenz gleichzeitig verwen-
det werden?
Dies ist abhängig von dem gewählten Angebot. Einzelbenutzer-Lizenzen dürfen
nur von einem Benutzer gleichzeitig verwendet werden, während Mehrbenutzer/-
Terminal-Server-Lizenzen, je nach Angebot, von mehreren Benutzern gleichzeitig
verwendet werden dürfen.
6.5 Auf wie vielen Computern kann eine Lizenz genutzt werden?
Eine Lizenz kann auf mehreren Computern installiert werden, aber nur von einem
dieser Computer gleichzeitig genutzt werden. Beim Start der Applikation sowie
zwischendurch bei der Benutzung wird geprüft, ob die Lizenz bereits auf mehr
als einem Computer verwendet wird. Ist dies der Fall, wird das Programm in den
Demo-Modus zurückgeworfen, bis der Computer wieder der einzige ist, der die
Software-Lizenz verwendet. Bis dahin geht kein Fortschritt verloren und das Pro-
gramm schließt sich nicht automatisch oder dergleichen. Der einzige Unterschied
ist, dass wieder die Limitierungen des Demo-Modus eingeschaltet werden.
6.6 Ich bekomme folgende Meldung "Der Lizenzschlüssel wird derzeit
bereits von mehreren Geräten verwendet". Was bedeutet das?
Das bedeutet, dass die Lizenz derzeit auf mehreren Computern in den letzten 15
Minuten verwendet wurde und nicht auf noch einem weiteren Rechner gleichzeitig
24
genutzt werden darf. Sofern Sie die Lizenz auf mehreren Rechnern in den letzten 15
Minuten gleichzeitig genutzt haben und dort das Programm nun wieder geschlossen
wurde, wird spätestens nach 15 Minuten die Ausführung von OfflineTranscribe wieder
auf dem jetzigen Computer möglich sein. Sofern dies nicht der Fall ist und Ihnen
kein weiterer Computer bekannt ist, auf dem das Programm derzeit läuft, kann ein
Lizenzcode-Diebstahl nicht ausgeschlossen werden. In diesem Fall kontaktieren
Sie bitte den Support, damit wir zusammen eine Lösung finden, wie Sie wieder ar-
beiten können.
6.7 Ein Transkription-Prozess startet nicht. Was kann ich tun?
In diesem Fall probieren Sie bitte, die Programmressourcen zurückzusetzen. Wenn
dies nicht funktioniert und Sie "Automatische Spracherkennung" aktiviert haben,
wählen Sie bitte die korrekte Sprache selbst aus. Wenn dies ebenfalls nicht funk-
tioniert oder Sie bereits eine Sprache ausgewählt haben, probieren Sie eine andere
Transkription-Software aus der Auswahl.
6.8 Die Transkription auf meinem Computer ist mir zu langsam.
Was kann ich tun?
Da die Transkription komplett offline bei Ihnen auf dem eigenen Rechner abläuft,
kommt auch dabei nur Ihre CPU und Ihr Arbeitspeicher zum Einsatz. Je nach aus-
gewählter Transkriptions-Software und Transkriptions-Modell kann es sein, dass
Ihr Computer nicht leistungsstark genug für Ihre Ansprüche an die Geschwindigkeit
der Transkription ist. In diesem Fall empfehlen wir, verschiedene Transkriptions-
Software und Transkriptions-Modelle innerhalb des Programms auszutesten und,
wenn dies nicht hilft, sich einen schnelleren Computer zu besorgen. Ansonsten
bleibt Ihnen natürlich auch noch die Möglichkeit, auf einen Cloud-basierten Transkriptions-
Service von einem anderen Anbieter, wie Google, zu wechseln.
6.9 Das Programm sagt mir, dass für meine Auswahl an Transkriptions-
Software und Transkriptions-Modell der Arbeitsspeicher nicht
reicht. Was kann ich tun?
In diesem Fall können Sie manuell den virtuellen Arbeitsspeicher erhöhen. Geben
Sie dafür "Windows virtuellen Arbeitsspeicher erhöhen" in eine Suchmaschine ein
oder lesen Sie beispielsweise diesen Artikel:
https://www.makeuseof.com/tag/virtual-memory-low-heres-fix/.
25
6.10 Fehlerbehebung bei Zugriffsproblemen auf den Programmressourcen-
Ordner
Sollten Sie auf Schwierigkeiten stoSSen, weil das Programm meldet, dass auf den
Programmressourcen-Ordner (%AppData%\OfflineTranscribe) nicht zugegriffen
werden kann, könnten verschiedene Ursachen zugrunde liegen. Dies könnte da-
rauf hindeuten, dass eine Transkription noch läuft, wobei abhängig von der gewählten
Transkriptions-Software entweder "python.exe" oder "main.exe" im Task-Manager
mit hoher CPU-Auslastung sichtbar sein könnte. Diese Prozesse können bei Be-
darf über den Task-Manager beendet werden. Eine weitere Möglichkeit ist, dass
mehrere Instanzen von OfflineTranscribe gleichzeitig ausgeführt werden, oder Ihr
Virenscanner die Ordner gerade überprüft.
In jedem Fall kann ein Neustart des Computers helfen, um sicherzustellen, dass
kein Zugriff mehr auf den Ordner besteht. Bevor Sie diesen Schritt jedoch aus-
führen, wird empfohlen, im Task-Manager nach den erwähnten Prozessen zu suchen
und zu überprüfen, ob diese aktiv sind und möglicherweise manuell beendet wer-
den müssen.
26
7
Referenzen
7
References
[1] OfflineTranscribe
https://OfflineTranscribe.de/
[2] OpenAi Whisper
https://github.com/openai/whisper
[3] OpenAi Whisper
https://en.wikipedia.org/wiki/FFmpeg
[4] whisper.cpp https://github.com/ggerganov/whisper.cpp
[5] BLAS https://en.wikipedia.org/wiki/Basic_Linear_Algebra_
Subprograms
27
WordPress Appliance - Powered by TurnKey Linux