OFFLINETRANSCRIBE

DOKUMENTATION

VERSION

2024.08.29.1603

OFFLINETRANSCRIBE.DE

1 Einleitung 3

1.1 Unterstütze Aufnahmen-/Audio-Dateiformate . . . . . . . . . . . . . 3

1.2 Auswahl an Transkriptions-Software . . . . . . . . . . . . . . . . . . . 4

1.2.1 OpenAI Whisper .......................... 4

1.2.2 Whisper.cpp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3 Whisper.cpp BLAS .............................. 6

2 Installation 7

2.1 Installation über die graﬁsche Oberﬂäche ................ 8

2.2 Installation über die Kommandozeile .................. 9

2.3 Lizenzierung der Anwendung . . . . . . . . . . . . . . . . . . . . . . . 9

2.3.1 Einzelbenutzerlizenzen . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Mehrbenutzer-/Terminal-Server-Lizenzen . . . . . . . . . . . 10

2.4 Einschränkungen der Auswahlmöglichkeiten . . . . . . . . . . . . . . 11

2.5 Transkriptions-Modelle im Installationsordner bereitstellen . . . . . 11

3 Benutzeroberﬂäche im Detail (GUI) 13

3.1 Transkription ................................. 14

3.2 Wartschlange für die Transkription . . . . . . . . . . . . . . . . . . . . 15

3.3 Abgeschlossene Transkriptionen . . . . . . . . . . . . . . . . . . . . . 16

3.4 Programmeinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.5 Programmressourcen initialisieren . . . . . . . . . . . . . . . . . . . . 19

3.6 Technische Informationen . . . . . . . . . . . . . . . . . . . . . . . . . 19

4 Kommandozeilen (CMD) 20

4.1 Parameterliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.2 Aufrufbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

5 Konﬁgurationsdatei 23

6 Häuﬁg gestellte Fragen (FAQ) 24

6.1 Was hat OfﬂineTranscribe für Systemanforderungen? . . . . . . . . . 24

6.2 OfﬂineTranscribe lässt sich nicht installieren. [Windows SmartScreen] 24

6.3 Werden meine Dateien bzw. Daten hochgeladen oder verlassen in

irgendeiner Weise meinen Computer? . . . . . . . . . . . . . . . . . . 25

6.4 Von wie vielen Benutzern darf eine Lizenz gleichzeitig verwendet wer-

den? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6.5 Auf wie vielen Computern kann eine Lizenz genutzt werden? . . . . 25

6.6 Ich bekomme folgende Meldung "Der Lizenzschlüssel wird derzeit

bereits von mehreren Geräten verwendet". Was bedeutet das? . . . . 25

6.7 Ein Transkription-Prozess startet nicht. Was kann ich tun? . . . . . . 26

6.8 Die Transkription auf meinem Computer ist mir zu langsam. Was

kann ich tun? ................................. 26

6.9 Das Programm sagt mir, dass für meine Auswahl an Transkriptions-

Software und Transkriptions-Modell der Arbeitsspeicher nicht reicht.

Was kann ich tun? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

6.10 Fehlerbehebung bei Zugriffsproblemen auf den Programmressourcen-

Ordner ..................................... 27

7 Referenzen 28

Einleitung

Mit OfﬂineTranscribe können Aufnahmen-/Audio-Dateien, wie MP3-Dateien, ohne

eine Internetverbindung auf dem eigenen Computer von Sprache in Text umge-

wandelt werden, also transkribiert werden. Es ist ein Programm, das eine einfache

Benutzeroberﬂäche für eine Auswahl an Transkriptions-Software und -Modellen

bietet und die Bereitstellung und Nutzung dieser automatisiert.

1.1 Unterstütze Aufnahmen-/Audio-Dateiformate

Das Programm unterstützt verschiedene Dateiformate. MP3- und WAV-Dateien

werden nativ unterstützt, während andere Audio-Dateiformate erst innerhalb des

Programms automatisch in eine kompatible Audio-Datei konvertiert werden. Die

konvertierten Dateien werden unter dem Pfad %appdata%\OfflineTranscribe\

ConvertedAudioFiles mit einem Namen wie beispielsweise "Recording_5d2d3b9c-

a360-4f52-a335-093e3d9d5c98.mp3" temporär abgelegt. Dies geschieht mit der en-

thaltenen Software "ffmpeg"[3].

Folgende Dateiformate wurden getestet und werden unterstützt:

(Weitere Formate können eventuell auch unterstützt werden, da die enthaltene

Konvertierungs-Software sehr viele Audio-Datei-Formate unterstützt [Mehr Infor-

mationen dazu: https://en.wikipedia.org/wiki/FFmpeg#Supported_formats].)

• MP3 • WAV • OGG • FLAC • M4A

1.2 Auswahl an Transkriptions-Software

Dieser Abschnitt geht auf die unterstützte Auswahl an Transkriptions-Software und

-Modellen ein. Dabei werden diese kurz beschrieben und auf eventuell interes-

sante Einzelheiten eingegangen.

1.2.1 OpenAI Whisper

Whisper ist ein Allzweckmodell für die Spracherkennung. Es wurde anhand eines

großen Datensatzes mit verschiedenen Audiodaten trainiert und ist ein Multitasking-

Modell, das sowohl mehrsprachige Spracherkennung als auch Sprachübersetzung

und Sprachidentiﬁkation durchführen kann.[2]

Modelle Folgende Modelle können für die enthaltende Transkriptions-Software

Whisper ausgewählt werden:

Modellname Schnelligkeit Fehlerquote Beschreibung

tiny +++++ + Schnellste / meiste Fehler

base ++++ ++ Schnell

small +++ +++ Normal

medium ++ ++++ Besser

large + +++++ Beste / Geringste Fehler

tiny_en +++++ + Nur Englisch - Schnellste/meiste Fehler

base_en ++++ ++ Nur Englisch - Schnell

small_en +++ +++ Nur Englisch - Normal

medium_en ++ ++++ Nur Englisch - Besser

Unterstütze Sprache Die Sprachunterstützung und Fehlerquote können je nach

Sprache stark variieren (Mehr Informationen: https://github.com/openai/whisper/

blob/eff383b27b783e280c089475852ba83f20f64998/language-breakdown.svg).

Hier ist die Auﬂistung der unterstützten Sprachen:

• Englisch

• Chinesisch

• Deutsch

• Spanisch

• Russisch

• Koreanisch

• Französisch

• Japanisch

• Portugiesisch

• Türkisch

• Polnisch

• Katalanisch

• Niederländisch

• Arabisch

• Schwedisch

• Italienisch

• Indonesisch

• Hindi

• Finnisch

• Vietnamesisch

• Hebräisch

• Ukrainisch

• Griechisch

• Malaiisch

• Tschechisch

• Rumänisch

• Dänisch

• Ungarisch

• Tamil

• Norwegisch

• Thai

• Urdu

• Kroatisch

• Bulgarisch

• Litauisch

• Latein

• Maori

• Malayalam

• Walisisch

• Slowakisch

• Telugu

• Persisch

• Lettisch

• Bengalisch

• Serbisch

• Aserbaidschanisch

• Slowenisch

• Kannada

• Estnisch

• Mazedonisch

• Bretonisch

• Baskisch

• Isländisch

• Armenisch

• Nepali

• Mongolisch

• Bosnisch

• Kasachisch

• Albanisch

• Suaheli

• Galicisch

• Marathi

• Punjabi

• Singhalesisch

• Khmer

• Shona

• Yoruba

• Somali

• Afrikaans

• Okzitanisch

• Georgisch

• Weißrussisch

• Tadschikisch

• Sindhi

• Gujarati

• Amharisch

• Jiddisch

• Laotisch

• Usbekisch

• Färöisch

• Haitianisches-

Kreolisch

• Pashto

• Turkmenisch

• Nynorsk

• Maltesisch

• Sanskrit

• Luxemburgisch

• Myanmar

• Tibetisch

• Tagalog

• Malagasy

• Assamese

• Tatar

• Hawaiianisch

• Lingala

• Hausa

• Baschkirisch

• Javanisch

• Sundanese

1.2.2 Whisper.cpp

Diese Software ist eine alternative Implementierung von OpenAI’s Whisper. Sie ist

in der Programmiersprache C++ verfasst, was je nach System zu einer schnelleren

Transkription führen kann.[4] Es werden umformatierte Whisper-Modelle verwen-

det und nativ werden nur WAV-Dateien unterstützt. OfﬂineTranscribe kümmert

sich aber bei anderen Audio-Dateiformaten, wie auch bei OpenAI’s Whisper, um

die interne Konvertierung in das kompatible Audio-Dateiformat. Abgesehen von

dem gerade genannten, verhält sich die Software genauso wie OpenAI’s Whisper

mit den gegebenen Modellen und unterstützten Sprachen (siehe 1.2.1).

1.3 Whisper.cpp BLAS

Diese Software ist Whisper.cpp (siehe 1.2.2) bloß mit einer Implementierung, die

die Programmbibliothek BLAS für die Berechnungen der Transkription verwendet.[5]

Auf manchen Systemen ist diese schneller als die normale Implementierung. Sie

verhält sich genauso wie Whisper.cpp und nutzt dieselben Modelle.

Installation

Das Programm kann mittels der, auf https://OfflineTranscribe.de verfügbaren,

Exe-Datei "OfﬂineTranscribe-Setup.exe" gestartet werden. Diese ist gegebenfalls je

nach Quelle in einer komprimierten Zip-Datei gepackt.

Folgend wird in Abschnitt 2.1 auf die graﬁsche Installation und in Abschnitt 2.2 auf

die Kommandozeilen-Installation eingegangen.

Weiterhin folgt in Abschnitt 2.3 die Erklärung, wie man die Anwendung mit einem

Lizenzschlüssel lizenzieren kann.

2.1 Installation über die graﬁsche Oberﬂäche

2.2 Installation über die Kommandozeile

Mit dem Parameter "/S" kann eine Installation unbeaufsichtigt durchgeführt wer-

den. Wenn der Installationspfad festgelegt werden soll, kann dies über den Param-

eter /D=C:\NewInstallDir\\ durchgeführt werden.

Beispiel 1: OfflineTranscribe-Setup.exe /S

Beispiel 2: OfflineTranscribe-Setup.exe /S /D=C:\\NewInstallDir\\

2.3 Lizenzierung der Anwendung

Zur Lizenzierung der Anwendung muss mit einem Lizenzschlüssel einmalig eine

Online-Aktivierung der Installation durchgeführt werden. Die Anzahl der maxi-

malen Aktivierungen ist dabei limitiert und abhängig von der erworbenen Lizenz.

Bei der Aktivierung wird nach einer erfolgreichen Kommunikation mit dem Lizen-

zserver eine "LicenseConﬁrmation"-Datei auf dem Computer angelegt, die den Lizen-

zschlüssel, das Ablaufdatum und die Geräte-ID enthält. Diese Datei wird bei jedem

Start der Anwendung herangezogen, um die Gültigkeit der Lizenz zu prüfen. Diese

Prüfung funktioniert auch ohne Internetverbindung.

Unter den Programmeinstellungen ﬁndet man die Einstellungen für die Lizenz.

Diese Lizenz bezogenen Einstellungen werden folgend in ihren verschiedenen For-

men gegebenfalls mit einer kurzen Erklärung durchgegangen.

Keinen Lizenzschlüssel eingegeben

Lizenzschlüssel nicht erkannt

Ein Lizenzschlüssel wird als ungültig angezeigt, wenn dieser nicht die korrekten

Lizenzschlüsselstruktur besitzt, der Schlüssel dem Lizenzserver unbekannt ist oder

der Lizenzserver nicht erreichbar iust.

Lizenzschlüssel wurde als gültig erkannt

In diesem Fall wird die Aktivierungsschaltﬂäche aktiv und die Online-Aktivierung

kann mit einem Klick auf die Schaltﬂäche durchgeführt werden.

Ansicht nach erfolgreicher Online-Aktivierung

Nach der Aktivierung sieht man das Datum an dem die Lizenz abläuft und die An-

zahl der durchgeführten Aktivierungen sowie die Anzahl der maximal möglichen

Aktivierungen angezeigt.

2.3.1 Einzelbenutzerlizenzen

Die "LicenseConﬁrmation"-Dateien von Einzelbenutzerlizenzen müssen immer im

Arbeitsordner liegen, wie %appdata%/OfflineTranscribe/.

Diese "LicenseConﬁrmation"-Dateien der Einzelbenutzerlizenz sind computerspez-

iﬁsch und können nicht einfach auf einen anderen Computer kopiert werden, um

das Programm zu lizenzieren. Es muss auf dem neuen Computer mit dem Lizen-

zschlüssel wieder erneut eine Onlineaktivierung speziell für diesen Rechner durchge-

führt werden.

2.3.2 Mehrbenutzer-/Terminal-Server-Lizenzen

Die "LicenseConﬁrmation"-Datei bei Mehrbenutzer-/Terminal-Server-Lizenzen kann

im Arbeitsordner liegen, wie %appdata%/OfflineTranscribe/, oder im Programm-

Installationsordner. Diese "LicenseConﬁrmation"-Dateien der Mehrbenutzer-/Terminal-

Server-Lizenzen sind nicht computerspeziﬁsch und können einfach auf einen an-

deren Computer kopiert werden, um das Programm auf diesem zu lizenzieren. Dieses

veränderte Verhalten im Vergleich zu Einzelbenutzerlizenzen ist besonders für die

weit verbreitete automatisierte Verteilung der Anwendung innerhalb von Unternehmen

gedacht.

2.4 Einschränkungen der Auswahlmöglichkeiten

In der neuen Version können bestimmte Software- und Modelloptionen durch eine

spezielle Textdatei im Installationsordner eingeschränkt werden. Erstellen Sie eine

Datei mit dem Namen HideSoftwareAndModelFiles.txt im Installationsordner

der Anwendung. In dieser Datei können Sie die Namen der Software und Modelle

auﬂisten, die nicht angezeigt werden sollen. Jedes Element muss auf einer eigenen

Zeile stehen.

Beispiel:

Whisper

Whisper.cpp

Whisper.cpp BLAS

tiny_en

base_en

small_en

medium_en

tiny

base

small

medium

large

(Falls alle Modelle ausgeblendet werden, startet die Anwendung nicht und es er-

scheint eine Fehlermeldung.)

2.5 Transkriptions-Modelle im Installationsordner bereitstellen

Um die Transkriptionsmodelle lokal im Installationsordner bereitzustellen, können

Sie die AI-Modelldateien in den Ordner WhisperCPP im Installationsverzeichnis

der Anwendung kopieren. Zusätzlich müssen Sie eine leere Datei mit dem Namen

ModelFilesAreInTheInstallationFolder im Installationsordner anlegen. Dies

signalisiert der Anwendung, die Modelle aus dem Installationsordner statt aus dem

Benutzerverzeichnis zu laden.

Beispiel:

•C:\Program Files\OfflineTranscribe\WhisperCPP\ggml-model-whisper-tiny.

bin

•C:\Program Files\OfflineTranscribe\ModelFilesAreInTheInstallationFolder

(Ohne die ModelFilesAreInTheInstallationFolder Datei greift die Anwendung

weiterhin auf das Benutzerverzeichnis zu.)

Benutzeroberﬂäche im

Detail (GUI)

In diesem Kapitel wird im Detail auf die Benutzeroberﬂäche, ihre einzelnen Ele-

mente sowie auf nennenswerte Aspekte eingegangen.

In dem dargestellten Screenshot der Anwendung sind bereits Eintragungen durch

den Benutzer vorgenommen worden, um beispielsweise die Liste der Audio-Dateien,

die Warteschlange für die Transkription sowie die Liste der abgeschlossenen Tran-

skription demonstrativ mit Elementen zu füllen. Ebenso wurden auch schon bei

den Einstellungen für die Transkription sowie für die Anwendung im Allgemeinen

Änderungen vorgenommen.

Folgend werden Ausschnitte aus diesem Bild genommen, um die einzelnen Teile

der Benutzeroberﬂäche zu erklären:

3.1 Transkription

Diese Elementgruppe enthält die beiden Unterelementgruppen "Audio" und "Ein-

stellungen für die Transkription".

In der Unterelementgruppe "Audio" können Audio-Aufnahmen von der Festplatte

ausgewählt werden, die zu Text transkribiert werden sollen. Es können dabei mehrere

Audio-Dateien gleichzeitig ausgewählt werden. Die ausgewählten Dateien beﬁnden

sich dann in der Auﬂistung, in der der Name, die Länge und der Dateipfad der

Audio-Datei angezeigt werden.

Unter der Unterelementgruppe "Audio" beﬁndet sich die "Einstellungen für die

Transkription". In diesen Einstellungen können Sie die Art der Transkription auswählen.

Zunächst steht Ihnen die Auswahl der Software zur Verfügung, die für die Tran-

skription verwendet werden soll.

Je nach ausgewählter Software verändert sich die nachfolgende Auswahl der "Mod-

elle der Transkriptionssoftware". Diese Modelle sind unterschiedlich angelernte

Speicher für die Software, die zur Transkription genutzt werden. Die Modelle un-

terscheiden sich beispielsweise bei der Genauigkeit der Transkription, der Schnel-

ligkeit der Transkription und dem Sprachumfang. Als vereinfachtes Beispiel: Ein

Modell, das nur auf Englisch angelernt ist, würde bei einer englischen Audio-Aufnahme

bei der Transkription wesentlich schneller sein als eines, das gleich für 6 verschiedene

Sprachen angelernt wurde, da die einzelnen Worte mit mehr Wörtern auf Überein-

stimmungen abgeglichen werden müssten.

Als letzte Auswahlmöglichkeit bleibt die Auswahl der Sprache der Audio-Datei. Manche

Software- und Modell-Auswahlkombinationen bieten das automatische Erkennen

der Sprache in der Audio-Datei an. Andere nicht. In diesem Fall muss manueell

die korrekte Sprache ausgewählt werden, da ansonsten die Software versucht, die

Transkription mit der falschen ausgewählten Sprache vorzunehmen. Das Ergebnis

wäre in diesem Fall maximal unterhaltsam, aber wenig nützlich.

Wenn schlussendlich die entsprechenden Audio-Dateien und die Transkription-

seinstellungen festgelegt wurden, kann mit einem Klick auf "Zur Transkription-

swarteschlange hinzufügen" die Transkription begonnen werden. Je nach Anwen-

dungseinstellung startet bereits jetzt automatisch der Transkriptionsprozess und

die Verarbeitung kann in der Transkriptionswarteschlange verfolgt werden.

3.2 Wartschlange für die Transkription

In dieser Elementgruppe werden die Transkriptionsaufträge dargestellt, die derzeit

ausgeführt oder als nächstes ausgeführt werden.

Die Aufträge, die noch nicht gestartet wurden, enthalten dabei die Informationen

der derzeitigen Platznummer in der Liste, des Dateinamens, der Länge der Auf-

nahme, der ausgewählten Transkriptionssoftware, des ausgewählten Transkription-

smodells und der ausgewählten oder automatisch ermittelten Sprache der Audio-

datei. Darunter beﬁndet sich der komplette Dateipfad der Audiodatei. Im Hin-

tergrund des Auftrags ist auch eine graﬁsche Darstellung der Höhen und Tiefen

der Audiodatei sichtbar. Rechts beﬁndet sich der Startknopf, der die Transkription

startet. Gefolgt davon gibt es Schaltﬂächen, mit denen die Aufträge in der Liste ver-

schoben oder komplett entfernt werden können.

Aufträge, die gestartet wurden und noch nicht abgeschlossen sind, unterscheiden

sich in der Oberﬂäche in einigen Punkten. So wurde der Start-Knopf durch einen

Stop-Knopf ersetzt und eine zusätzliche Schaltﬂäche darunter hinzugefügt. Diese

Schaltﬂäche öffnet ein Ausgabefenster, das die bisherigen Prozessausgaben und

technischen Daten der Transkriptionssoftware anzeigt. Eine solche Prozessaus-

gabe ist in dem folgenden Bild dargestellt.

Als weitere Änderungen sind eine Prozentangabe des Transkriptionsfortschritts, die

Anzahl der transkribierten Minuten, die Gesamtzahl an Audiominuten, ein visueller

Ladebalken und die Zeit, die die Transkription bereits dauert, sichtbar. Bei längeren

Transkriptionen wird auch noch die wahrscheinliche verbleibende Zeit in Minuten

angezeigt. Dies ist in dem folgenden Bild zu sehen.

3.3 Abgeschlossene Transkriptionen

In dieser Elementgruppe werden die Transkriptionsaufträge dargestellt, die abgeschlossen

sind.

Die Aufträge zeigen zunächst den Zeitpunkt an, zu dem die Transkription abgeschlossen

wurde. Danach folgen der Name der Audio-Datei, die Dauer der Audio-Datei, die

verwendete Transkriptionssoftware, das Modell, die Sprache der Audio-Datei und

die Anzahl der bei der Transkription gefundenen Wörter. Unter diesen Informatio-

nen werden der Pfad zur Audio-Datei und die benötigte Zeit für die Transkription

angezeigt. Neben all diesen Informationen zum Transkriptionsauftrag ﬁndet sich

ein Knopf, mit dem man den Auftrag aus der Liste entfernen kann. Danach gibt es

einen Knopf, mit dem man sich den transkribierten Text innerhalb der Anwendung

anzeigen lassen kann. Die Knöpfe darunter bieten die Möglichkeit, den transkri-

bierten Text in den verfügbaren Dateiformaten auf der Festplatte zu speichern.

3.4 Programmeinstellungen

Software-Lizenz: Hier kann der Lizenzcode eingegeben und aktiviert werden. Der

Aktivieren-Knopf wird aktiv, wenn ein gültiger Lizenzcode eingegeben wurde und

neben dem Lizenzcode-Feld ein grüner Haken erscheint. Eine genaue Erklärung,

wie die Lizenzierung funktioniert, ﬁndet sich in Abschnitt 2.3.

Programmsprache: Hier kann die Sprache der Benutzeroberﬂäche ausgewählt

werden.

Neu hinzugefügte Transkriptionsaufgaben sofort ausführen: Hier kann festgelegt

werden, ob Transkriptionsaufgaben sofort beim Hinzufügen in der Warteschlange

gestartet werden.

Automatischer Start der Transkription beim Programmstart: Hier kann festgelegt

werden, ob beim Programmstart automatisch auch die Transkriptionsaufgaben in

der Warteschlange abgearbeitet werden sollen.

Maximale Anzahl von gleichzeitigen Prozessen: Hier kann die maximale Anzahl

von gleichzeitigen Prozessen ausgewählt werden, die durch den automatischen Start

("Automatischer Start der Transkription beim Programmstart") gleichzeitig ausge-

führt werden.

Technische Informationen anzeigen: Hier kann die Unterelementgruppe für tech-

nische Informationen angezeigt werden. Diese umfassen die Anzahl der derzeit

laufenden Transkriptionsprozesse, die CPU- und Arbeitspeicherauslastung.

Programm-Ressourcen initialisieren: Hier können manuell die Programm-Ressourcen

initialisiert werden. Diese umfassen die Transkriptionssoftware und das Transkrip-

tionsmodell, die gerade in der Unterelementgruppe "Transkription" ausgewählt sind

(siehe Abschnitt 3.1). Beim Klick auf die Schaltﬂäche öffnet sich das in Abschnitt 3.5

beschriebene Fenster.

Programm-Ressourcen zurücksetzen: Diese Schaltﬂäche löscht alle initialisierten

Daten aller Transkriptionssoftware und löscht alle heruntergeladenen Transkriptionsmodell-

Daten. Dies kann helfen, falls ein Fehler bei der Initialisierung aufgetreten ist.

Software-Version: Hier wird die Versionsnummer der aktuell installierten Pro-

grammversion angezeigt.

Update-Kanal: Hier kann der Update-Kanal eingestellt werden. Zur Auswahl ste-

hen "Release" und "Test".

Update: Über diese Schaltﬂäche kann die Software aktualisiert werden. Sofern

keine neuere Version verfügbar ist, ist die Schaltﬂäche grau, etwas transparent und

nicht auswählbar. Wenn eine neue Version verfügbar ist, ist die Schaltﬂäche mit der

Farbe Orange unterlegt und auswählbar.

Dokumentation: Mit einem Klick auf diese Schaltﬂäche wird versucht, diese Doku-

mentation in dem Standard-Webbrowser des Betriebssystems zu öffnen.

Rechtliche Hinweise: Hier kann das Impressum, die AGBs sowie weitere rechtliche

Texte betrachtet werden.

3.5 Programmressourcen initialisieren

Nach einem manuellen Start der Initialisierung der Programmressourcen oder beim

Starten einer Transkription, bei der noch Programmressourcen fehlen, öffnet sich

dieses Ladefenster. Es zeigt die durchgeführten Schritte an und ermöglicht es, den

Fortschritt beim Initialisieren zu verfolgen.

3.6 Technische Informationen

In dieser Unterelementgruppe werden technische Informationen angezeigt, wie

die Anzahl der derzeit laufenden Transkriptionsprozesse, die CPU- und Arbeitspe-

icherauslastung.

Kommandozeilen (CMD)

OfﬂineTranscribe kann auch über die Kommandozeile genutzt werden. Folgend

wird auf die Nutzung über die Konsole eingegangen sowie auf Besonderheiten, auf

die geachtet werden sollte.

Die Kommandozeilenfunktionalität (CLI) basiert auf denselben Programmstruk-

turen, die die graﬁsche Oberﬂäche nutzt, was zur Besonderheit führt, dass beim

Aufruf der CLI auf das Programm explizit gewartet werden muss, da andernfalls die

Kommandozeile sofort den nächsten Befehl erwartet, während OfﬂineTranscribe

im Hintergrund läuft. Daher muss das Programm immer mit "start /w OfﬂineTran-

scribe CLI" gestartet werden, damit auf die Beendigung der Anwendung gewartet

wird und die Ausgabe korrekt angezeigt wird. Ein Aufrufbeispiel ist in der "OfﬂineTranscribe-

CLI-Example.bat" im Installationsordner oder im Abschnitt 4.2 zu sehen. Weiterhin

ist zu erwähnen, dass die Dateipfade, die das Programm annimmt, auch Windows-

Environment-Variables unterstützen, sofern diese verwendet werden sollen.

4.1 Parameterliste

Die folgende Tabelle listet alle verfügbaren Parameter auf, die einzeln oder in Kom-

bination verwendet werden können:

Parameter Abkürzung Beschreibung

CLI Notwendiger Parameter für die Nutzung des CLI.

–software -s Transkriptions-Software

[Whisper, WhisperCPP, WhisperCPPBLAS]

–model -m

Transkriptions-Modell (Abhängig von der Software)

[tiny, base, small, medium, large,

tiny_en, base_en, small_en, medium_en]

–language -l

Sprache der Audio-Datei.

auto = Automatische Spracherkennung

ISO-639-1-Code [en, zh, de, es, ru, ko, fr, ..]

–input -i Pfad zur Audio-Datei.

(Beispiel: C:\recording.mp3)

–output -o Pfad zur Ausgabe-Datei.

(BeispieL: C:\output.txt

–format -g Ausgabeformat

[txt, srt]

–help -h Zeigt den aktuellen Hilfstext an.

–version Zeigt die aktuelle Versionsnummer an.

4.2 Aufrufbeispiele

Die folgenden Beispiele zeigen die Verwendung der Parameter:

1chcp 65001

2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"

CLI -s WhisperCPP -m tiny -l en -i sample_audio_recording.mp3 -o

"%USERPROFILE%\Downloads\sample_audio_recording.txt" -f txt

,→

3pause

1chcp 65001

2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"

CLI -s WhisperCPPBLAS -m small -l de -i

"C:\sample_audio_recording.mp3" -o"C:\sample_audio_recording.srt"

-f srt

,→

3pause

1chcp 65001

2start /w"C:\Program Files\OfflineTranscribe\OfflineTranscribe.exe"

CLI -s Whisper -m large -l zh -i"C:\sample_audio_recording.mp3"

-o"C:\sample_audio_recording.srt" -f srt

,→

3pause

Konﬁgurationsdatei

Die Anwendung erstellt beim Start die "Conﬁguration.ini", welche dafür da ist die

in der Benutzeroberﬂäche gemachten Einstellungen zu speichern. Diese Datei wird

in dem Ordner %appdata%\OfflineTranscribe\ erstellt. In diesem Ordner liegen

auch temporäre Dateien, ggf. die Lizenzveriﬁkationsdatei sowie die Ergebnisse der

Transkribierungsprozesses.

Folgend beispielhaft die Maximalausprägung der "Conﬁguration.ini":

1[UI]

2Language =de

3SelectedTranscriptionSoftware =Whisper

4SelectedTranscriptionModel =tiny

5UpdateChannel =Release

6LastAudioFilesOpenFileDialogPath =C:

7SelectedTranscriptionLanguage =auto

9[BackgroundWorker]

10 NumberOfConcurrentProcesses = 1

Häuﬁg gestellte Fragen

(FAQ)

6.1 Was hat OfﬂineTranscribe für Systemanforderungen?

Kompatibilität wurde mit Windows 10 und Windows 11 getestet. Es werden ca.

500 MB Speicherplatz zur Installation benötigt. Je nach gewählter Transkriptions-

Software und -Modell können bis zu 20 GB Speicherplatzverbrauch während der

Nutzung dazu kommen. Das Programm benötigt einmalig eine Internetverbindung

für die Lizenzaktivierung. Ebenso wird ggf. eine Internetanbindung einmalig benötigt,

um das ausgewählte Transkriptions-Modell automatisch durch OfﬂineTranscribe

herunterladen zu lassen. Die Transkriptions-Modelle können aber auch schon vorher

in den entsprechenden Ordner platziert werden, damit kein Download durch die

Anwendung erforderlich ist.

6.2 OfﬂineTranscribe lässt sich nicht installieren. [Windows SmartScreen]

Erscheint bei einem Doppelklick auf die heruntergeladene Installationsdatei eine

Meldung, wie "Der Computer wurde durch Windows geschützt" oder "Von Win-

dows Smartscreen wurde der Start einer unbekannten App verhindert", muss zur

Installation auf den Text "Weitere Informationen" innerhalb des Fensters geklickt

werden und dann auf "Trotzdem ausführen".

Eine solche Meldung wird von Microsoft angezeigt, wenn ein ausführbares Pro-

gramm relativ neu erstellt wurde und Microsoft es noch nicht kennt. Microsoft wird

automatisch im Hintergrund die exe-Datei hochladen, analysieren und diese Mel-

dung bei anderen nicht mehr anzeigen, sobald das Programm schon länger von

vielen Nutzern verwendet wird. Daher kann das Problem leider bei jeder neuen

Version des Programms erneut auftreten.

6.3 Werden meine Dateien bzw. Daten hochgeladen oder verlassen

in irgendeiner Weise meinen Computer?

Nein! Ihre Daten verbleiben auf Ihrem Rechner alleine. OfﬂineTranscribe lädt keine

Ihrer Daten zu irgendeinem Server hoch. Das Programm baut nur in wenigen Fällen

überhaupt eine Verbindung zu den OfﬂineTranscribe-Servern auf. Diese Fälle um-

fassen die einmalig notwendige Lizenzaktivierung, die Suche nach Programmup-

dates, die Prüfung, ob eine Lizenz derzeit auf mehreren Rechnern gleichzeitig genutzt

wird, und erforderliche Transkriptions-Modelldaten.

6.4 Von wie vielen Benutzern darf eine Lizenz gleichzeitig verwen-

det werden?

Dies ist abhängig von dem gewählten Angebot. Einzelbenutzer-Lizenzen dürfen

nur von einem Benutzer gleichzeitig verwendet werden, während Mehrbenutzer/-

Terminal-Server-Lizenzen, je nach Angebot, von mehreren Benutzern gleichzeitig

verwendet werden dürfen.

6.5 Auf wie vielen Computern kann eine Lizenz genutzt werden?

Eine Lizenz kann auf mehreren Computern installiert werden, aber nur von einem

dieser Computer gleichzeitig genutzt werden. Beim Start der Applikation sowie

zwischendurch bei der Benutzung wird geprüft, ob die Lizenz bereits auf mehr

als einem Computer verwendet wird. Ist dies der Fall, wird das Programm in den

Demo-Modus zurückgeworfen, bis der Computer wieder der einzige ist, der die

Software-Lizenz verwendet. Bis dahin geht kein Fortschritt verloren und das Pro-

gramm schließt sich nicht automatisch oder dergleichen. Der einzige Unterschied

ist, dass wieder die Limitierungen des Demo-Modus eingeschaltet werden.

6.6 Ich bekomme folgende Meldung "Der Lizenzschlüssel wird derzeit

bereits von mehreren Geräten verwendet". Was bedeutet das?

Das bedeutet, dass die Lizenz derzeit auf mehreren Computern in den letzten 15

Minuten verwendet wurde und nicht auf noch einem weiteren Rechner gleichzeitig

genutzt werden darf. Sofern Sie die Lizenz auf mehreren Rechnern in den letzten 15

Minuten gleichzeitig genutzt haben und dort das Programm nun wieder geschlossen

wurde, wird spätestens nach 15 Minuten die Ausführung von OfﬂineTranscribe wieder

auf dem jetzigen Computer möglich sein. Sofern dies nicht der Fall ist und Ihnen

kein weiterer Computer bekannt ist, auf dem das Programm derzeit läuft, kann ein

Lizenzcode-Diebstahl nicht ausgeschlossen werden. In diesem Fall kontaktieren

Sie bitte den Support, damit wir zusammen eine Lösung ﬁnden, wie Sie wieder ar-

beiten können.

6.7 Ein Transkription-Prozess startet nicht. Was kann ich tun?

In diesem Fall probieren Sie bitte, die Programmressourcen zurückzusetzen. Wenn

dies nicht funktioniert und Sie "Automatische Spracherkennung" aktiviert haben,

wählen Sie bitte die korrekte Sprache selbst aus. Wenn dies ebenfalls nicht funk-

tioniert oder Sie bereits eine Sprache ausgewählt haben, probieren Sie eine andere

Transkription-Software aus der Auswahl.

6.8 Die Transkription auf meinem Computer ist mir zu langsam.

Was kann ich tun?

Da die Transkription komplett ofﬂine bei Ihnen auf dem eigenen Rechner abläuft,

kommt auch dabei nur Ihre CPU und Ihr Arbeitspeicher zum Einsatz. Je nach aus-

gewählter Transkriptions-Software und Transkriptions-Modell kann es sein, dass

Ihr Computer nicht leistungsstark genug für Ihre Ansprüche an die Geschwindigkeit

der Transkription ist. In diesem Fall empfehlen wir, verschiedene Transkriptions-

Software und Transkriptions-Modelle innerhalb des Programms auszutesten und,

wenn dies nicht hilft, sich einen schnelleren Computer zu besorgen. Ansonsten

bleibt Ihnen natürlich auch noch die Möglichkeit, auf einen Cloud-basierten Transkriptions-

Service von einem anderen Anbieter, wie Google, zu wechseln.

6.9 Das Programm sagt mir, dass für meine Auswahl an Transkriptions-

Software und Transkriptions-Modell der Arbeitsspeicher nicht

reicht. Was kann ich tun?

In diesem Fall können Sie manuell den virtuellen Arbeitsspeicher erhöhen. Geben

Sie dafür "Windows virtuellen Arbeitsspeicher erhöhen" in eine Suchmaschine ein

oder lesen Sie beispielsweise diesen Artikel:

https://www.makeuseof.com/tag/virtual-memory-low-heres-fix/.

6.10 Fehlerbehebung bei Zugriffsproblemen auf den Programmressourcen-

Ordner

Sollten Sie auf Schwierigkeiten stoSSen, weil das Programm meldet, dass auf den

Programmressourcen-Ordner (%AppData%\OfflineTranscribe) nicht zugegriffen

werden kann, könnten verschiedene Ursachen zugrunde liegen. Dies könnte da-

rauf hindeuten, dass eine Transkription noch läuft, wobei abhängig von der gewählten

Transkriptions-Software entweder "python.exe" oder "main.exe" im Task-Manager

mit hoher CPU-Auslastung sichtbar sein könnte. Diese Prozesse können bei Be-

darf über den Task-Manager beendet werden. Eine weitere Möglichkeit ist, dass

mehrere Instanzen von OfﬂineTranscribe gleichzeitig ausgeführt werden, oder Ihr

Virenscanner die Ordner gerade überprüft.

In jedem Fall kann ein Neustart des Computers helfen, um sicherzustellen, dass

kein Zugriff mehr auf den Ordner besteht. Bevor Sie diesen Schritt jedoch aus-

führen, wird empfohlen, im Task-Manager nach den erwähnten Prozessen zu suchen

und zu überprüfen, ob diese aktiv sind und möglicherweise manuell beendet wer-

den müssen.

Referenzen

References

[1] OfﬂineTranscribe

https://OfflineTranscribe.de/

[2] OpenAi Whisper

https://github.com/openai/whisper

[3] OpenAi Whisper

https://en.wikipedia.org/wiki/FFmpeg

[4] whisper.cpp https://github.com/ggerganov/whisper.cpp

[5] BLAS https://en.wikipedia.org/wiki/Basic_Linear_Algebra_

Subprograms