Cómo usar la función de reconocimiento de voz en Camtasia

Problema

Cómo utilizar la función de reconocimiento de voz en Camtasia.

Solución

Camtasia 2024 y versiones posteriores utilizan nuestra nueva funcionalidad de subtitulado impulsada por la tecnología Whisper de OpenAI (Política de IA de TechSmith). Para usar este nuevo método, vaya a Subtítulos > Reconocimiento de voz y Camtasia transcribirá automáticamente su contenido.

Método del motor de reconocimiento de voz de Microsoft (descontinuado)

Las versiones antiguas de Camtasia tienen una función llamada Reconocimiento de Voz que utiliza el motor de reconocimiento de voz de Microsoft para convertir el audio de la presentación en subtítulos. Siga el siguiente proceso para configurar la función.

Instalación

El motor de reconocimiento de voz de Microsoft ya está instalado en Windows 7, 8, 10 y 11. No es necesario volver a instalar el motor. Después de instalar Camtasia, las funciones de reconocimiento de voz estarán listas para usar. Esto se puede encontrar en Subtítulos seleccionando el icono de engranaje. El reconocimiento de voz solo estará disponible si hay audio en la línea de tiempo.
mceclip2.png

Idiomas Disponibles

  • Inglés de EE.UU.
  • Inglés del Reino Unido
  • Alemán
  • Francés
  • Español
  • Japonés
  • Chino Tradicional
  • Chino Simplificado

Completar el entrenamiento de voz en Camtasia

Antes de usar la función de reconocimiento de voz, se debe completar el siguiente entrenamiento para que el reconocimiento de voz sea exitoso.

  • Entrene su computadora para que entienda su voz
  • Configure su micrófono
  • Agregue palabras al diccionario de reconocimiento de voz
    CamWind_SpeechToText.png

Complete todos los pasos necesarios. Una vez que el entrenamiento esté completo, no necesitará entrenar nuevamente. Puede exportar y luego importar el perfil para reutilizar la información del entrenamiento en diferentes inicios de sesión o computadoras. Los usuarios pueden tener más de un perfil por cada inicio de sesión.

Consejos para mejorar la precisión del motor de reconocimiento de voz

  • En Configuración > Hora & Idioma > Voz, también puede encontrar estos métodos importantes.
    • La precisión mejora con el entrenamiento y la calidad del audio. La mejor precisión requiere 4-5 horas de entrenamiento. Cuanto más entrene su computadora, mejores resultados obtendrá.
    • No hay modelos acústicos ni configuraciones de calidad de audio para el motor de voz, sin embargo, en una máquina XP, puede configurar la calidad de reconocimiento frente al reconocimiento de voz.
    • Use un micrófono de buena calidad y configure correctamente el micrófono.
    • Elija un reconocedor de voz que mejor se adapte a su acento (por ejemplo, EE.UU. vs. Reino Unido para inglés).
  • Use el mejor reconocedor de voz que pueda obtener. Por ejemplo, en XP, puede instalar Speech Recognizer 6.1 en lugar de la versión predeterminada Speech Recognizer 5.1.
  • Las palabras personalizadas se pueden agregar al diccionario de un usuario diciéndole al sistema el texto de la palabra y hablando la palabra (por ejemplo, puede decirle explícitamente al sistema cómo reconocer cómo dice la palabra "Camtasia").
  • Use el perfil de entrenamiento adecuado para realizar el reconocimiento de voz.
  • Grabe o dicte su voz en un entorno tranquilo y hable a su velocidad normal.

También puede instalar paquetes de idiomas de MS para obtener motores de reconocimiento de voz en otros idiomas.

Para obtener más información sobre la API de voz de Microsoft, consulte este artículo.