Audio in Text auf Linux mit whisper
- Zaki Morgenstern
- Digital & frei
-
- #Linux
- #Audio-Transskript
- #Howto
Wie nutze ich whisper auf Linux, um eine Rede im Audio-Format in Text zu transkribieren?
Um Whisper auf Linux zu nutzen, um eine Rede im Audio-Format in Text zu transkribieren, folge diesen Schritten:
1. Voraussetzungen prüfen
- Stelle sicher, dass Python 3.8 oder höher auf deinem System installiert ist.
- Du benötigst auch
pip
, den Paketmanager für Python.
Überprüfe die Python-Version:
python3 --version
Falls Python nicht installiert ist, kannst du es mit folgendem Befehl installieren:
sudo apt update
sudo apt install python3 python3-pip
2. Whisper installieren
Whisper ist ein Modell von OpenAI, das du über die openai-whisper
-Bibliothek nutzen kannst. Installiere es mit pip
:
pip install openai-whisper
Zusätzlich benötigst du ffmpeg
, um Audio-Dateien zu verarbeiten:
sudo apt update
sudo apt install ffmpeg
3. Whisper verwenden
Nach der Installation kannst du Whisper verwenden, um eine Audio-Datei in Text zu transkribieren.
Beispiel-Befehl:
whisper audio_datei.mp3 --model base
audio_datei.mp3
: Ersetze dies durch den Pfad zu deiner Audio-Datei.--model base
: Hier kannst du das Modell angeben. Verfügbare Modelle sindtiny
,base
,small
,medium
, undlarge
. Je größer das Modell, desto genauer, aber auch langsamer die Transkription.
Beispiel:
whisper rede.wav --model medium
Whisper wird die Audio-Datei verarbeiten und die Transkription in einer Textdatei speichern.
4. Transkription anpassen (optional)
Whisper bietet verschiedene Optionen, um die Transkription anzupassen:
--language
: Gib die Sprache der Audio-Datei an (z.B.--language de
für Deutsch).--output_dir
: Gib ein Verzeichnis an, in dem die Transkription gespeichert werden soll.--task
: Wähle zwischentranscribe
(Standard) undtranslate
(Übersetzung in Englisch).
Beispiel:
whisper rede.wav --language de --model medium --output_dir /pfad/zum/verzeichnis
5. Ergebnisse anzeigen
Nach der Ausführung findest du die Transkription in einer .txt
-Datei im selben Verzeichnis wie die Audio-Datei (oder im angegebenen --output_dir
).
Beispiel:
cat rede.txt
6. Weitere Optionen
Du kannst auch andere Formate wie .mp3
, .wav
, .flac
, etc. verwenden. Whisper unterstützt eine Vielzahl von Audioformaten.
Wenn du Whisper häufiger nutzen möchtest, kannst du auch ein Skript erstellen, um die Transkription zu automatisieren.
7. GPU-Unterstützung (optional)
Falls du eine NVIDIA-GPU hast, kannst du Whisper mit CUDA beschleunigen. Dazu musst du torch
mit CUDA-Unterstützung installieren:
pip install torch torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
Danach sollte Whisper automatisch die GPU nutzen, falls verfügbar.
Das war's! Du kannst nun Whisper auf Linux verwenden, um Audio in Text zu transkribieren.
***pip install openai-whisper
error: externally-managed-environment
× This environment is externally managed
╰─> To install Python packages system-wide, try apt install
python3-xyz, where xyz is the package you are trying to
install.
If you wish to install a non-Debian-packaged Python package,
create a virtual environment using python3 -m venv path/to/venv.
Then use path/to/venv/bin/python and path/to/venv/bin/pip. Make
sure you have python3-full installed.
If you wish to install a non-Debian packaged Python application,
it may be easiest to use pipx install xyz, which will manage a
virtual environment for you. Make sure you have pipx installed.
See /usr/share/doc/python3.12/README.venv for more information.
note: If you believe this is a mistake, please contact your Python installation or OS distribution provider. You can override this, at the risk of breaking your Python installation or OS, by passing --break-system-packages.
hint: See PEP 668 for the detailed specification.
pip install openai-whisper
error: externally-managed-environment
× This environment is externally managed
╰─> To install Python packages system-wide, try apt install
python3-xyz, where xyz is the package you are trying to
install.
If you wish to install a non-Debian-packaged Python package,
create a virtual environment using python3 -m venv path/to/venv.
Then use path/to/venv/bin/python and path/to/venv/bin/pip. Make
sure you have python3-full installed.
If you wish to install a non-Debian packaged Python application,
it may be easiest to use pipx install xyz, which will manage a
virtual environment for you. Make sure you have pipx installed.
See /usr/share/doc/python3.12/README.venv for more information.
note: If you believe this is a mistake, please contact your Python installation or OS distribution provider. You can override this, at the risk of breaking your Python installation or OS, by passing --break-system-packages.
hint: See PEP 668 for the detailed specification.
Quelle: deepseek.com 22.02.2025
"Wie nutze ich whisper auf Linux, um eine Rede im Audio-Format in Text zu transkribieren?"