Camtasia (Windows): Microsoft 音声認識エンジンの設定方法 (キャプション/字幕の音声入力)

問題

Camtasia で音声入力機能を使用するには、どのようにすれば良いですか?

解決策

Camtasia Studio 7.1 以降では、Microsoft 音声認識エンジンを利用して音声入力と呼ばれる新機能を追加し、音声をキャプションへ変換できます。

参考) 音声入力でキャプション(字幕)を作成する方法については、チュートリアルの「キャプションシリーズ」から 「音声入力」のビデオ をご参照ください。

以下は、最適な音声入力を得るための Microsoft エンジンの設定方法 です。

インストール

Windows 7 / 8 / 10

Microsoft 音声認識(スピーチ)エンジンは、OSの一部として搭載されているので、改めてインストールする必要はありません。Camtasia をインストール後、音声認識機能は使用可能です。

使用できる言語:

  • 英語(米国、英国)
  • ドイツ語
  • フランス語
  • スペイン語
  • 日本語
  • 繁体字中国語
  • 簡体字中国語

コンピュータのボイストレーニングとマイクの設定

音声録音をより正確に音声入力するには、音声認識ソフトウェアにより提供されているボイストレーニングチュートリアルを行うことをお勧めします。
音声をディクテーションするために、ご使用のパソコンをトレーニングしてマイク設定をすることを奨励します。パソコンのトレーニングを行うと(約4時間が目安です)、再度トレーニングする必要はありません。
トレーニング情報のプロファイルは、エクスポートしてインポートすると、別のログインや別のコンピュータで再度使用できます。ユーザーは、各ログインで 1つ以上のプロファイルを持つことができます。
したがって、ご使用のコンピューターに他の人のプロファイルファイルをインポートしておくと、その人が録音した音声ファイルを文字に書き起こすことができます。ただし、現在は、複数のプロファイルを同時に使用できないため、音声ファイルに複数の人の音声が録音されている場合、ひとりの人のプロファイルを使用してもあまり役には立ちません。

音声認識エンジンの精度を高めるヒント

  • できる限り最も性能の良い認識エンジンを使用します。たとえば、Windows XPでは、一般にデフォルトになっているMicrosoft音声認識エンジンのバージョン5.1ではなく、Microsoft音声認識エンジンのバージョン6.1を使用します。
  • 音声認識の精度はトレーニングとオーディオの品質により良くなります。最もよい精度を得るには、4、5 時間のトレーニングが必要とされています。使用しているコンピュータをトレーニングすればするほど、精度が良くなります。コンピュータをトレーニングするには、Camtasiaからアクセスできます。
    Camtasiaのメイン画面 > [ ツール ] > [ スピーチ ] > [ スピーチのプロパティ ] > Windowsの[ 音声認識のプロパティ ] > [ プロファイルのトレーニング ] をクリックしてWindowsで行います。
  • 専門用語など普段一般にあまり使用されない用語などは、ユーザーの辞書にテキストの単語と発音された単語をコンピュータに学習させることで追加できます。(たとえば、あなたが "カムタジア" とどのように発音するかをコンピュータに認識させるために、はっきりと発音して学習させます。)辞書に追加するには、Camtasiaからアクセスできます。
    Camtasiaのメイン画面 > [ ツール ] > [ スピーチ ] > [ 音声入力の向上 ] > [ 辞書への語句の追加を開始する ]をクリックして行います。
  • 音声認識エンジンには、サンプルモデル、音質設定などはありません。
  • 良い品質のマイクを使用してマイクの設定を正しく行ってください。
    [ スピーチのプロパティ ] > Windowsの[ 音声認識のプロパティ ] > [ マイクの構成 ] をクリックしてWindowsでマイクの設定を行います。
  • 音声認識のために正しいトレーニングプロファイルを使用します。
  • 静かな場所で通常の話す速度で、ご自分の音声を録音、またはディクテーションします。
  • ご自分のアクセントに合う音声認識エンジンを使用します。(たとえば、米国の英語、または英国の英語をトレーニングする場合)

英語以外の言語の場合は、MS Language Packのインストールが必要な場合があります。

その他の情報

Microsoft Speech API (英語): http://en.wikipedia.org/wiki/Microsoft_Speech_API

203729278