Cómo usar el reconocimiento de voz a texto en Camtasia Editor

Actualización 14 de noviembre de 2024 21:43

Problema

Cómo usar la función de reconocimiento de voz a texto en Camtasia Editor.

Solución

Camtasia 2024 y versiones posteriores utilizan nuestra nueva funcionalidad de subtitulado impulsada por la tecnología Whisper de OpenAI (Política de TechSmith AI). Para usar este nuevo método, vaya a Subtítulos > Reconocimiento de voz a texto y Camtasia Editor transcribirá automáticamente su contenido.

Método del motor de voz de Microsoft (descontinuado)

Las versiones antiguas de Camtasia tienen una función llamada Reconocimiento de voz a texto que utiliza el motor de voz de Microsoft para convertir el audio de la presentación en subtítulos. Siga el proceso a continuación para configurar la función.

Instalación

El motor de voz de Microsoft ya está instalado en Windows 7, 8, 10 y 11. No es necesario instalar el motor nuevamente. Después de instalar Camtasia Editor, las funciones de reconocimiento de voz estarán listas para usarse. Esto se puede encontrar dentro de Subtítulos seleccionando el ícono de engranaje. El reconocimiento de voz a texto solo estará disponible si hay audio en la línea de tiempo.

Idiomas disponibles

Inglés de EE. UU.
Inglés del Reino Unido
Alemán
Francés
Español
Japonés
Chino tradicional
Chino simplificado

Completar el entrenamiento de voz en Camtasia

Antes de usar la función de reconocimiento de voz a texto, se debe completar el siguiente entrenamiento para que el reconocimiento de voz sea exitoso.

Entrene su computadora para que entienda su voz
Configure su micrófono
Agregue palabras al diccionario de reconocimiento de voz

Complete todos los pasos necesarios. Una vez que el entrenamiento esté completo, no necesitará entrenar de nuevo. Puede exportar e importar el perfil para reutilizar la información de entrenamiento en diferentes inicios de sesión o computadoras. Los usuarios pueden tener más de un perfil para cada inicio de sesión.

Consejos para mejorar la precisión del motor de voz

En Configuración > Hora e idioma > Voz, también puede encontrar importantes estos métodos.
- La precisión mejora con el entrenamiento y la calidad del audio. La mejor precisión requiere de 4 a 5 horas de entrenamiento. Cuanto más entrene su computadora, mejor resultado podrá obtener.
- No hay modelos acústicos ni configuraciones de calidad de audio para el motor de voz, sin embargo, en máquinas con XP, puede configurar la calidad de reconocimiento frente al reconocimiento de voz.
- Use un micrófono de buena calidad y configure el micrófono correctamente.
- Elija un reconocedor de voz que se ajuste mejor a su acento (por ejemplo, EE. UU. vs. Reino Unido para inglés).
Use el mejor reconocedor de voz que pueda conseguir. Por ejemplo, en XP, puede instalar Speech Recognizer 6.1 en lugar de la versión pública predeterminada Speech Recognizer 5.1.
Se pueden agregar palabras personalizadas al diccionario del usuario indicándole al sistema la palabra de texto y pronunciándola (por ejemplo, puede indicarle explícitamente al sistema cómo pronuncia la palabra “Camtasia”).
Use el perfil de entrenamiento adecuado para realizar el reconocimiento de voz.
Grabe o dicte su voz en un ambiente silencioso y hable a su velocidad normal.

También puede instalar paquetes de idioma de MS para obtener los motores de voz en otros idiomas.

Para más información sobre la API de voz de Microsoft, vea este artículo.