Camtasia Editorでの音声認識（Speech-To-Text）の使い方

更新 2024年11月14日 21:34

問題

Camtasia Editorでの音声認識機能の使い方。

解決策

Camtasia 2024以降は、OpenAIのWhisper技術による新しいキャプション機能を利用しています（TechSmith AIポリシー）。この新しい方法を使用するには、キャプション > 音声認識（Speech-to-Text）に進むと、Camtasia Editorが自動的にコンテンツを文字起こしします。

Microsoft Speech Engine方式（廃止）

旧バージョンのCamtasiaには、Microsoft Speech Engineを利用してプレゼンテーションの音声をキャプションに変換する音声認識機能がありました。以下の手順で機能を設定してください。

インストール

Microsoft Speech EngineはWindows 7、8、10、11に標準でインストールされています。エンジンを再インストールする必要はありません。Camtasia Editorをインストールすると、音声認識機能が使用可能になります。これはキャプション内の歯車アイコンから確認できます。タイムラインに音声がある場合のみ、音声認識機能が利用可能です。

対応言語

米国英語
英国英語
ドイツ語
フランス語
スペイン語
日本語
繁体字中国語
簡体字中国語

Camtasiaでの音声トレーニングの完了

音声認識機能を使用する前に、以下のトレーニングを完了する必要があります。これにより音声認識の成功率が向上します。

コンピューターに自分の声を認識させるトレーニングを行う
マイクロフォンを設定する
音声認識辞書に単語を追加する

必要なすべてのステップを完了してください。トレーニングが完了すれば、再度トレーニングを行う必要はありません。プロファイルをエクスポートしてインポートすることで、異なるログインやコンピューターでトレーニング情報を再利用できます。ユーザーはログインごとに複数のプロファイルを持つことができます。

音声認識エンジンの精度向上のためのヒント

設定 > 時刻と言語 > 音声で、以下の方法も重要です。
- トレーニングと音声品質によって精度が向上します。最高の精度を得るには4～5時間のトレーニングが必要です。トレーニングを重ねるほど結果が良くなります。
- 音声認識エンジンには音響モデルや音声品質設定はありませんが、XPマシンでは認識品質と認識音声の設定が可能です。
- 良質なマイクを使用し、適切にマイクを設定してください。
- 自分のアクセントに最適な音声認識器を選択してください（例：英語の場合、米国英語か英国英語か）。
可能な限り最良の音声認識器を使用してください。例えば、XPではデフォルトのパブリックドメイン版Speech Recognizer 5.1の代わりにSpeech Recognizer 6.1をインストールできます。
カスタム単語は、システムにテキスト単語を伝え、発音を話すことでユーザー辞書に追加できます（例：「Camtasia」という単語の発音を明示的に認識させることが可能です）。
適切なトレーニングプロファイルを使用して音声認識を行ってください。
静かな環境で通常の速度で声を録音または口述してください。

他言語の音声認識エンジンを入手するには、MSの言語パックをインストールすることもできます。

Microsoft Speech APIの詳細については、こちらの記事をご覧ください。

問題

解決策

Microsoft Speech Engine方式（廃止）

インストール

Camtasiaでの音声トレーニングの完了

音声認識エンジンの精度向上のためのヒント

サポートを受ける