Como usar o Reconhecimento de Voz no Editor Camtasia

Atualizado 14 de Novembro de 2024 21:44

Problema

Como usar o recurso de Reconhecimento de Voz no Editor Camtasia.

Solução

O Camtasia 2024 e versões posteriores utilizam nossa nova funcionalidade de legendas alimentada pela tecnologia Whisper da OpenAI (Política de IA da TechSmith). Para usar esse novo método, vá para Legendas > Reconhecimento de Voz e o Editor Camtasia transcreverá automaticamente seu conteúdo.

Método Microsoft Speech Engine (descontinuado)

Versões antigas do Camtasia possuem um recurso chamado Reconhecimento de Voz que utiliza o Microsoft Speech Engine para converter o áudio da apresentação em legendas. Siga o processo abaixo para configurar o recurso.

Instalação

O Microsoft Speech Engine já está instalado no Windows 7, 8, 10 e 11. Não é necessário instalar o motor novamente. Após instalar o Editor Camtasia, os recursos de reconhecimento de voz estarão prontos para uso. Isso pode ser encontrado dentro de Legendas selecionando o ícone de engrenagem. O Reconhecimento de Voz estará disponível apenas se houver áudio na linha do tempo.

Idiomas Disponíveis

Inglês dos EUA
Inglês do Reino Unido
Alemão
Francês
Espanhol
Japonês
Chinês Tradicional
Chinês Simplificado

Complete o Treinamento de Voz no Camtasia

Antes de usar o recurso de Reconhecimento de Voz, o seguinte treinamento deve ser concluído para que o reconhecimento de voz seja bem-sucedido.

Treine seu computador para entender sua voz
Configure seu microfone
Adicione palavras ao dicionário de reconhecimento de voz

Complete todas as etapas necessárias. Uma vez que o treinamento esteja completo, não é necessário treinar novamente. Você pode exportar e importar o perfil para reutilizar as informações de treinamento em diferentes logins ou computadores. Os usuários podem ter mais de um perfil para cada login.

Dicas para Melhorar a Precisão do Speech Engine

Em Configurações > Hora e Idioma > Voz, você também pode encontrar esses métodos importantes.
- A precisão é melhorada com treinamento e qualidade de áudio. A melhor precisão requer 4-5 horas de treinamento. Quanto mais você treinar seu computador, melhor será o resultado.
- Não existem modelos acústicos e configurações de qualidade de áudio para o speech engine, entretanto, em máquinas XP, você pode ajustar a qualidade do reconhecimento versus o reconhecimento de fala.
- Use um microfone de qualidade decente e configure-o adequadamente.
- Escolha um reconhecedor de voz que combine melhor com seu sotaque (ex.: EUA vs. Reino Unido para o inglês).
Use o melhor reconhecedor de voz que puder. Por exemplo, no XP, você pode instalar o Speech Recognizer 6.1 em vez da versão pública padrão Speech Recognizer 5.1.
Palavras personalizadas podem ser adicionadas ao dicionário do usuário informando o texto da palavra e falando a palavra (ex.: você pode dizer explicitamente ao sistema para reconhecer como você pronuncia a palavra “Camtasia”).
Use o perfil de treinamento adequado para realizar o reconhecimento de voz.
Grave ou dite sua voz em um ambiente silencioso e fale em sua velocidade normal.

Você também pode instalar pacotes de idiomas MS para obter os motores de voz em outros idiomas.

Para mais informações sobre a Microsoft Speech API, veja este artigo.