Como usar o Reconhecimento de Voz no Editor Camtasia

Problema

Como usar o recurso de Reconhecimento de Voz no Editor Camtasia.

Solução

O Camtasia 2024 e versões posteriores utilizam nossa nova funcionalidade de legendas alimentada pela tecnologia Whisper da OpenAI (Política de IA da TechSmith). Para usar esse novo método, vá para Legendas > Reconhecimento de Voz e o Editor Camtasia transcreverá automaticamente seu conteúdo.

Método Microsoft Speech Engine (descontinuado)

Versões antigas do Camtasia possuem um recurso chamado Reconhecimento de Voz que utiliza o Microsoft Speech Engine para converter o áudio da apresentação em legendas. Siga o processo abaixo para configurar o recurso.

Instalação

O Microsoft Speech Engine já está instalado no Windows 7, 8, 10 e 11. Não é necessário instalar o motor novamente. Após instalar o Editor Camtasia, os recursos de reconhecimento de voz estarão prontos para uso. Isso pode ser encontrado dentro de Legendas selecionando o ícone de engrenagem. O Reconhecimento de Voz estará disponível apenas se houver áudio na linha do tempo.
mceclip2.png

Idiomas Disponíveis

  • Inglês dos EUA
  • Inglês do Reino Unido
  • Alemão
  • Francês
  • Espanhol
  • Japonês
  • Chinês Tradicional
  • Chinês Simplificado

Complete o Treinamento de Voz no Camtasia

Antes de usar o recurso de Reconhecimento de Voz, o seguinte treinamento deve ser concluído para que o reconhecimento de voz seja bem-sucedido.

  • Treine seu computador para entender sua voz
  • Configure seu microfone
  • Adicione palavras ao dicionário de reconhecimento de voz
    CamWind_SpeechToText.png

Complete todas as etapas necessárias. Uma vez que o treinamento esteja completo, não é necessário treinar novamente. Você pode exportar e importar o perfil para reutilizar as informações de treinamento em diferentes logins ou computadores. Os usuários podem ter mais de um perfil para cada login.

Dicas para Melhorar a Precisão do Speech Engine

  • Em Configurações > Hora e Idioma > Voz, você também pode encontrar esses métodos importantes.
    • A precisão é melhorada com treinamento e qualidade de áudio. A melhor precisão requer 4-5 horas de treinamento. Quanto mais você treinar seu computador, melhor será o resultado.
    • Não existem modelos acústicos e configurações de qualidade de áudio para o speech engine, entretanto, em máquinas XP, você pode ajustar a qualidade do reconhecimento versus o reconhecimento de fala.
    • Use um microfone de qualidade decente e configure-o adequadamente.
    • Escolha um reconhecedor de voz que combine melhor com seu sotaque (ex.: EUA vs. Reino Unido para o inglês).
  • Use o melhor reconhecedor de voz que puder. Por exemplo, no XP, você pode instalar o Speech Recognizer 6.1 em vez da versão pública padrão Speech Recognizer 5.1.
  • Palavras personalizadas podem ser adicionadas ao dicionário do usuário informando o texto da palavra e falando a palavra (ex.: você pode dizer explicitamente ao sistema para reconhecer como você pronuncia a palavra “Camtasia”).
  • Use o perfil de treinamento adequado para realizar o reconhecimento de voz.
  • Grave ou dite sua voz em um ambiente silencioso e fale em sua velocidade normal.

Você também pode instalar pacotes de idiomas MS para obter os motores de voz em outros idiomas.

Para mais informações sobre a Microsoft Speech API, veja este artigo.

Este artigo foi útil?
0 de 2 acharam isto útil