Camtasiaで音声認識を使う方法

問題

Camtasia で音声認識機能を使用する方法。

解決策

Camtasia 2024以降では、OpenAIのWhisperテクノロジーによって駆動される新しいキャプション機能を利用します (TechSmithのAIポリシー)。 この新しい方法を使用するためには、キャプション > 音声認識 に移動し、Camtasiaが自動的にコンテンツを転写します。

マイクロソフト音声エンジン方式(中止)

旧バージョンのCamtasiaには、プレゼンテーションのオーディオをキャプションに変換するための マイクロソフト音声エンジンを利用した音声認識機能があります。 機能を構成するためのプロセスは以下のとおりです。

インストール

マイクロソフト音声エンジンはすでにWindows 7、8、10、および11にインストールされています エンジンを再インストールする必要はありません。Camtasiaをインストールした後、音声 認識機能が使用可能になります。これは、歯車アイコンを選択するとキャプション内に表示されます。 音声認識は、タイムライン上にオーディオがある場合にのみ利用できます。
mceclip2.png

利用可能な言語

  • 米国英語
  • 英国英語
  • ドイツ語
  • フランス語
  • スペイン語
  • 日本語
  • 繁体字中国語
  • 簡体字中国語

Camtasiaで音声トレーニングを完了する

音声認識機能を使用する前に、音声認識が成功するためには 以下のトレーニングを完了する必要があります。

  • コンピュータに自分の声を理解させる
  • マイクを設定する
  • 音声認識辞書に単語を追加する
    CamWind_SpeechToText.png

必要なすべてのステップを完了します。トレーニングが完了したら、再度トレーニングする必要はありません。プロファイルをエクスポートしてからインポートして 別のログインやコンピュータでトレーニング情報を再利用することができます。ユーザーは 各ログインに対して複数のプロファイルを持つことができます。

音声エンジンの精度を向上させるためのヒント

  • 設定 > 時刻と言語 > スピーチにあるこれらの方法も重要です。
    • 精度はトレーニングとオーディオ品質によって向上します。最高の精度には 4〜5時間のトレーニングが必要です。コンピュータをトレーニングすればするほど、 より良い結果が得られます。
    • 音声エンジンには音響モデルやオーディオ品質設定はありませんが、XPマシン上では 認識品質と認識スピードを設定することができます。
    • 適切な品質のマイク