OpenTranscribe

OpenTranscribe es una aplicación de escritorio diseñada para transcribir archivos de audio y vídeo a texto utilizando la potencia del modelo Whisper de OpenAI, pero ejecutándose de forma totalmente local.

Descripción Técnica

La aplicación utiliza whisper.cpp para garantizar una alta eficiencia y un bajo consumo de recursos, permitiendo transcripciones rápidas incluso en hardware modesto. La interfaz está construida con Python y PyQt6.

Características Principales

  • Múltiples Formatos de Exportación: Guarda tus transcripciones en Word (.docx), CSV, SRT (subtítulos), VTT y TXT.
  • Editor Estilo Karaoke: Incluye un reproductor integrado que resalta el texto en tiempo real mientras se escucha el audio.
  • Diarización de Hablantes: Soporte experimental para detectar y diferenciar entre distintas personas en una conversación.
  • Privacidad Total: Al ejecutarse localmente, tus archivos de audio nunca abandonan tu ordenador.
  • Alto Rendimiento: Gracias a la implementación en C++, aprovecha al máximo la CPU y GPU para acelerar el proceso.

Galería del Proyecto

Interfaz de OpenTranscribe

Captura de pantalla de OpenTranscribe en acción

Documentación y Código

Logo OpenTranscribe

Tecnologías

  • Python
  • C++ (Whisper.cpp)
  • PyQt6
  • OpenAI Whisper
  • AI & Machine Learning