Logo Ingenium MX
  • Inicio
  • Acerca de
  • Posts
  • Blog
  • Español
    Español English
  • Dark Theme
    Light Theme
Logo Inverted Logo
  • Blog
  • Electrónica
    • ¿Qué es una PCB?
    • ¿Qué es un circuito antirrebote?
    • Puente H con relevadores
    • MQTT en pocas palabras
    • OPC UA en contexto
    • Motores a pasos
    • Pull-up vs pull-down
    • Cómo escoger baterías
    • Cambiadores de rango con op-amps
    • Protección contra inversión de polaridad
    • Capacitancia parasitaria en PCBs
  • Microcontroladores
    • Raspberry Pi Pico
    • Elegir la ESP32 adecuada
    • Módulos PIO en la Pico
    • Programar la Pico en C++
    • Ampliar entradas digitales con I2C
    • Instalar micro-ROS en la Pico
    • Elegir módulo ESP32 para PCB
  • Comunicaciones
    • Meshtastic explicado
    • Controlar un LED con ESP32 y MQTT
  • Sensores
    • Encoders
    • Sensores Hall
    • Sensores ultrasónicos
    • Lidar
  • Robótica
    • Herramientas ROS 2
  • Software
    • Transcribir audio con Whisper
  • Hardware digital
    • FPGAs
  • linux
    • Ubuntu 24.04 en WSL
Hero Image
Transcribir audio con Whisper

Whisper es un modelo de reconocimiento de voz multilingüe de código abierto creado por OpenAI. Permite transcribir audio a texto con alta precisión sin depender de servicios en la nube. Requisitos Python 3.8 o superior. Pip y virtualenv. FFmpeg instalado en el sistema (necesario para convertir formatos de audio). GPU opcional (CUDA) para acelerar inferencias con modelos grandes. Instala FFmpeg en Linux con sudo apt install ffmpeg o usa los binarios oficiales en Windows/macOS.

  • Whisper
  • Python
  • Transcripción
  • IA
sábado, 16 de marzo de 2024 | 2 minutos Leer
Navegación
  • Acerca de
  • Posts
Contacto
  • ingenium.mex01@gmail.com
  • ingeniummx
  • Ingenium Mx

Toha Theme Logo Toha
© 2025 Ingenium Mx. Todos los derechos reservados.
Funcionando con Hugo Logo