Software

Transcribir audio con Whisper

Whisper es un modelo de reconocimiento de voz multilingüe de código abierto creado por OpenAI. Permite transcribir audio a texto con alta precisión sin depender de servicios en la nube. Requisitos Python 3.8 o superior. Pip y virtualenv. FFmpeg instalado en el sistema (necesario para convertir formatos de audio). GPU opcional (CUDA) para acelerar inferencias con modelos grandes. Instala FFmpeg en Linux con sudo apt install ffmpeg o usa los binarios oficiales en Windows/macOS.

Whisper
Python
Transcripción
IA

sábado, 16 de marzo de 2024 | 2 minutos Leer