Audio in Text auf Linux mit whisper

Zaki Morgenstern
22.02.2025
Digital & frei
- #Linux
- #Audio-Transskript
- #Howto

Wie nutze ich whisper auf Linux, um eine Rede im Audio-Format in Text zu transkribieren?

Um Whisper auf Linux zu nutzen, um eine Rede im Audio-Format in Text zu transkribieren, folge diesen Schritten:

1. Voraussetzungen prüfen

Stelle sicher, dass Python 3.8 oder höher auf deinem System installiert ist.
Du benötigst auch pip, den Paketmanager für Python.

Überprüfe die Python-Version:

   python3 --version

Falls Python nicht installiert ist, kannst du es mit folgendem Befehl installieren:

   sudo apt update
   sudo apt install python3 python3-pip

2. Whisper installieren

Whisper ist ein Modell von OpenAI, das du über die openai-whisper-Bibliothek nutzen kannst. Installiere es mit pip:

   pip install openai-whisper

Zusätzlich benötigst du ffmpeg, um Audio-Dateien zu verarbeiten:

   sudo apt update
   sudo apt install ffmpeg

3. Whisper verwenden

Nach der Installation kannst du Whisper verwenden, um eine Audio-Datei in Text zu transkribieren.

Beispiel-Befehl:

   whisper audio_datei.mp3 --model base

audio_datei.mp3: Ersetze dies durch den Pfad zu deiner Audio-Datei.
--model base: Hier kannst du das Modell angeben. Verfügbare Modelle sind tiny, base, small, medium, und large. Je größer das Modell, desto genauer, aber auch langsamer die Transkription.

Beispiel:

   whisper rede.wav --model medium

Whisper wird die Audio-Datei verarbeiten und die Transkription in einer Textdatei speichern.

4. Transkription anpassen (optional)

Whisper bietet verschiedene Optionen, um die Transkription anzupassen:

--language: Gib die Sprache der Audio-Datei an (z.B. --language de für Deutsch).
--output_dir: Gib ein Verzeichnis an, in dem die Transkription gespeichert werden soll.
--task: Wähle zwischen transcribe (Standard) und translate (Übersetzung in Englisch).

Beispiel:

   whisper rede.wav --language de --model medium --output_dir /pfad/zum/verzeichnis

5. Ergebnisse anzeigen

Nach der Ausführung findest du die Transkription in einer .txt-Datei im selben Verzeichnis wie die Audio-Datei (oder im angegebenen --output_dir).

Beispiel:

   cat rede.txt

6. Weitere Optionen

Du kannst auch andere Formate wie .mp3, .wav, .flac, etc. verwenden. Whisper unterstützt eine Vielzahl von Audioformaten.

Wenn du Whisper häufiger nutzen möchtest, kannst du auch ein Skript erstellen, um die Transkription zu automatisieren.

7. GPU-Unterstützung (optional)

Falls du eine NVIDIA-GPU hast, kannst du Whisper mit CUDA beschleunigen. Dazu musst du torch mit CUDA-Unterstützung installieren:

   pip install torch torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

Danach sollte Whisper automatisch die GPU nutzen, falls verfügbar.

Das war's! Du kannst nun Whisper auf Linux verwenden, um Audio in Text zu transkribieren.

***pip install openai-whisper
error: externally-managed-environment

× This environment is externally managed
╰─> To install Python packages system-wide, try apt install
python3-xyz, where xyz is the package you are trying to
install.

If you wish to install a non-Debian-packaged Python package,
create a virtual environment using python3 -m venv path/to/venv.
Then use path/to/venv/bin/python and path/to/venv/bin/pip. Make
sure you have python3-full installed.

If you wish to install a non-Debian packaged Python application,
it may be easiest to use pipx install xyz, which will manage a
virtual environment for you. Make sure you have pipx installed.

See /usr/share/doc/python3.12/README.venv for more information.

note: If you believe this is a mistake, please contact your Python installation or OS distribution provider. You can override this, at the risk of breaking your Python installation or OS, by passing --break-system-packages.
hint: See PEP 668 for the detailed specification.

pip install openai-whisper
error: externally-managed-environment

× This environment is externally managed
╰─> To install Python packages system-wide, try apt install
python3-xyz, where xyz is the package you are trying to
install.

If you wish to install a non-Debian-packaged Python package,
create a virtual environment using python3 -m venv path/to/venv.
Then use path/to/venv/bin/python and path/to/venv/bin/pip. Make
sure you have python3-full installed.

If you wish to install a non-Debian packaged Python application,
it may be easiest to use pipx install xyz, which will manage a
virtual environment for you. Make sure you have pipx installed.

See /usr/share/doc/python3.12/README.venv for more information.

Quelle: deepseek.com 22.02.2025
"Wie nutze ich whisper auf Linux, um eine Rede im Audio-Format in Text zu transkribieren?"

Zaki Morgenstern @Zaki Morgenstern

Audio in Text auf Linux mit whisper

Wie nutze ich whisper auf Linux, um eine Rede im Audio-Format in Text zu transkribieren?

1. Voraussetzungen prüfen

2. Whisper installieren

3. Whisper verwenden

4. Transkription anpassen (optional)

5. Ergebnisse anzeigen

6. Weitere Optionen

7. GPU-Unterstützung (optional)

Verbunden

Windows, macOS oder Linux?