JP4861941B2 - 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム - Google Patents
書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム Download PDFInfo
- Publication number
- JP4861941B2 JP4861941B2 JP2007242678A JP2007242678A JP4861941B2 JP 4861941 B2 JP4861941 B2 JP 4861941B2 JP 2007242678 A JP2007242678 A JP 2007242678A JP 2007242678 A JP2007242678 A JP 2007242678A JP 4861941 B2 JP4861941 B2 JP 4861941B2
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- data
- text data
- time
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013518 transcription Methods 0.000 title claims description 76
- 230000035897 transcription Effects 0.000 title claims description 76
- 238000012790 confirmation Methods 0.000 title claims description 31
- 238000000034 method Methods 0.000 title claims description 29
- 238000004590 computer program Methods 0.000 title claims description 7
- 238000012545 processing Methods 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000005259 measurement Methods 0.000 description 8
- 238000012935 Averaging Methods 0.000 description 5
- 241001175904 Labeo bata Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Description
このような大量の書き起こし作業は、書き起こし専用のアプリケーションソフトを用いて行われることが多い。
また、作業者の入力ミスの問題もある。多くの書き起こし用のアプリケーションソフトでは、音声データを再生して、再生された内容を、アプリケーションソフトによって表示される処理画面の特定の場所(テキスト入力画面)に入力する方式をとっている。図8は、従来の書き起こし作業を行う際の処理画面の例示図である。この処理画面には、音声再生ボタンと音声再生ボタンに対応するテキスト入力領域が設けられている。作業者は、音声再生ボタンをクリックすることで、スピーカから再生される音声を聴取することができる。またキーボードにより、再生した音声の音声再生ボタンに対応するテキスト入力領域に、書き起こしたテキストを入力することができる。しかし、作業者の不注意で入力する位置を間違えることがある。在宅で作業を行う場合には、このような入力ミスを発見することも難しい。
例えば、上記の課題を解決する本発明の書き起こし内容確認方法は、所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているかを確認する処理手段を有する装置により実行される方法である。前記処理手段が、前記音声データ及び前記テキストデータから、前記音声データの音節の種類毎の音節時間データを導出し、この導出した音節の種類毎の音節時間データと当該音節の種類の前記標準音節時間データとを比較することで、導出した前記音節時間データが前記標準音節時間データから所定の範囲内にあるか否かによって前記テキストデータの妥当性を判断する第1段階と、前記音声データを平仮名単位で音声認識して得られる音節認識対数尤度と、前記音声データの音声認識の結果として前記テキストデータと同一の認識結果を1つ得るような音声認識により得られる単語認識対数尤度とから、前記音声データと前記テキストデータとの合致度合を定量的に表す類似度を導出して、導出した類似度を所定の値と比較して前記テキストデータの妥当性を判断する第2段階と、の少なくとも一方を実行する。
前記音節認識対数尤度には、例えば前記音声データ、HMMの音響モデル、及び少なくとも平仮名が格納された音節認識用辞書を用いてHMM法により得られる音響尤度の対数を用いることができる。前記単語認識対数尤度には、例えば前記音声データ、前記音響モデル、及び前記テキストデータのみが格納された単語認識用辞書を用いてHMM法により得られる音響尤度の対数を用いることができる。
例えば、本発明の書き起こし内容確認装置は、所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているかを確認する装置である。前記音声データ及び当該音声データを元に書き起こされたテキストデータから、前記音声データの音節の種類毎の音節時間データを導出する音声処理手段と、前記音声処理手段により導出された音節の種類毎の音節時間データを当該音節の種類の標準音節時間データと比較して、比較結果により前記テキストデータの妥当性を判断する音節時間比較手段と、前記音声データを平仮名単位で音声認識して得られる音節認識対数尤度及び前記音声データの音声認識の結果として前記テキストデータと同一の認識結果を1つ得るような音声認識により得られる単語認識対数尤度から、前記音声データと前記テキストデータとの合致度合を定量的に表す類似度を導出する類似度測定手段と、前記類似度測定手段で導出した前記類似度を所定の値と比較して前記テキストデータの妥当性を判断する類似度比較手段と、を備え、前記音節時間比較手段と前記類似度比較手段との少なくとも一方が妥当であると判断した場合に、前記テキストデータが妥当であると判断する。
この書き起こし内容確認装置は、前記音声処理手段で判別された音節の種類別に、前記音節時間を前記音節の種類別に集計する音節時間算出手段を更に備える構成であってもよい。また、音節時間算出手段は、前記音声処理手段で導出された音節時間を、音節の種類毎に平均して、音節の種類毎の前記標準音節時間データを算出し、所定の記録手段に記録するようになっていてもよい。
例えば、本発明のコンピュータプログラムは、所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているかを確認するコンピュータに、前記音声データ及び前記テキストデータから、前記音声データの音節の種類毎の音節時間データを導出し、この導出した音節の種類毎の音節時間データと当該音節の種類の前記標準音節時間データとを比較することで、導出した前記音節時間データが前記標準音節時間データから所定の範囲内にあるか否かによって前記テキストデータの妥当性を判断する処理、前記音声データを平仮名単位で音声認識して得られる音節認識対数尤度と、前記音声データの音声認識の結果として前記テキストデータと同一の認識結果を1つ得るような音声認識により得られる単語認識対数尤度とから、前記音声データと前記テキストデータとの合致度合を定量的に表す類似度を導出して、導出した類似度を所定の値と比較して前記テキストデータの妥当性を判断する処理、の少なくとも一方を実行させるためのコンピュータプログラムである。
図1は、本実施形態の書き起こし内容確認システム1の機能ブロック構成図である。書き起こし内容確認システム1は、例えばCPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスクドライブ等の大容量記録装置、及び入出力インタフェースを備えた汎用のコンピュータ等の情報処理装置が所定のコンピュータプログラムを読み込んで実行することで実現される。この情報処理装置は、入出力インタフェースにより、外部装置2から、書き起こし内容確認に必要なデータである録音音声データや書き起こされた結果であるテキストデータ、音節の種類毎の標準的な音節時間である標準音節時間データ等を読み込み、書き起こし内容の確認結果等の必要な情報を出力する。
ラベルデータ記録部22は、大規模音声データを書き起こしたテキストデータであるラベルデータが記録される。ラベルデータは、音声データと同じく文毎にファイルとして記録されており、例えばファイル名で、対応するラベルデータと音声データとが判るようになっている。
標準音節データ記録部24は、音節の種類毎の標準音節時間データが記録される。標準音節時間データは、大規模音声データと当該大規模音声データに対応するラベルデータにより導出された音節時間を、音節毎に平均することで得られる。
テキストデータ記録部26は、録音音声データ記録部25に記録された音声データを元に書き起こされたテキストデータが記録される。
妥当性の判断は、例えば、(1)音声の各音節の長さが妥当か、(2)音声と書き起こしにより作成されたテキストは発音的に類似しているか、の2点に着目して行われる。(1)と(2)の両方を満たしている場合に、テキストデータが妥当である(書き起こしの作業者は音声データから正しく書き起こした)と判断される。両方を満たさない場合には、不正行為或いは入力ミスがあったと判断する。なお、システム構築者の判断により、(1)、(2)のいずれか一方だけを満たした場合でもテキストデータが正しいとしてもよい。
出力部11は、書き起こし内容の確認結果の表示を行う。
音声データ及びこの音声データから書き起こされたテキストデータ(図2では「おーねがいしーます」)により音声セグメント処理を行うと、各音節の音声データの先頭からの開始時刻及び終了時刻が得られる。例えば、図2では、「ま」の開始時刻は310ms、終了時刻は380msである。音節の開始時刻と終了時刻が得られるので、音節時間が導出できる。例えば、図2では「ま」の音節時間は70msである。
なお、標準音節時間データを外部装置2からの入力でなく書き起こし内容確認システム1内で導出する場合には、録音音声データのかわりに大規模音声データ記録部21に記録された大規模音声データ及びテキストデータのかわりにラベルデータ記録部22に記録されたラベルデータを取得して、音声処理部12により、上記と同様に音節の種類を判別して、音節時間の導出を行う。
なお、標準音節時間データを外部装置2からの入力でなく書き起こし内容確認システム1内で導出する場合には、音声処理部12で導出された大規模音声データの各音節の音節時間を、上記と同様に音節の種類別に平均し、標準音節時間データを算出するようにしてもよい。標準音節時間データは、大容量記録部18に記録される。
類似度測定部15は、単語音声認識部20で得られた単語認識の音響対数尤度(「単語認識対数尤度」という)と、音節音声認識部19で得られた音節認識の音響対数尤度(「音節認識対数尤度」という)から類似度を算出する。類似度は、例えば以下の式のように、単語認識対数尤度のべき指数値をN個の音節認識対数尤度のべき指数値の和で割ることにより求められる。
(類似度)=exp(α×(単語認識対数尤度))/Σexp(α×(音節認識対数尤度))
α:調整項
Σexp(α×(音節認識対数尤度))は、N個の音節認識対数尤度の各々のexp(α×(音節認識対数尤度))の和
音節認識用辞書18aは、音節音声認識部19で音声認識を行う際のグラマーファイルとして用いられ、平仮名列が格納されている。これにより、平仮名単位の音声認識が行われる。
単語認識用辞書18bは、単語音声認識部20で音声認識を行う際のグラマーファイルとして用いられ、書き起こし結果であるテキストデータのみが格納されている。
音響モデル記録部23は、人の声の特徴をパラメータ化した音響モデルが記録される。従来の音声認識技術においても、音響モデルは必須である。
標準音節データ記録部24は、音節時間算出部13で算出された音節の種類毎の標準音節時間データが記録される。
大容量記録部18に記録される各データは、外部装置2に記録されて、必要なときにその都度ダウンロードするようにしてもよいが、処理の効率上、書き起こし内容確認システム1に格納しておく方がよい。
音節時間を導出してテキストデータの妥当性の判断を行うには、標準音節時間データが必要である。標準音節時間データは、大規模音声データ(モデルデータ)に基づいて算出した音節の種類毎の音節時間の平均である。標準音節時間データは、外部からダウンロードされてもよいし、書き起こし内容確認システム1で導出されてもよい。書き起こし内容確認システム1で標準音節時間データを導出する場合には、例えば図3のフローチャートに示すようにして行われる。
類似値を用いて行うテキストデータの妥当性の判断は、図5のフローチャートに示すように行われる。
音節音声認識部19は、録音音声データ、音響モデル、及び平仮名列が格納された音節認識用辞書を用いて平仮名単位の音声認識を行い、認識結果と音響対数尤度を得る。即ち音節音声認識部19では、音響モデルと音節認識用辞書から音素列を生成し、録音音声データの特徴量と生成した音素列との距離(尤度)計算と探索を繰り返し、最も確率の高い(近似する)音節(平仮名)を認識結果としてその音響尤度とともに抽出する。この実施形態では、Nベスト機能により複数(N個:Nは自然数)の認識結果と音響尤度とを得る。音節音声認識部19による音声認識の結果得られるN個の音響尤度の対数であるN個の音節認識対数尤度を、一時記録部17に記録する(ステップS310)。
単語音声認識部20は、録音音声データ、音響モデル、及び書き起こし結果であるテキストデータのみが格納された単語認識用辞書を用いて音声認識を行う。書き起こし結果のみを格納した単語認識用辞書を用いることで、テキストデータに書かれた内容しか音声認識の結果として出力されない。即ち、音響モデルと単語認識用辞書から音素列を生成し、録音音声データの特徴量と生成した音素列との距離(尤度)計算を行い、テキストデータと同一の1つの認識結果をその音響尤度とともに抽出する。単語音声認識部20による音声認識の結果得られる音響尤度の対数である単語認識対数尤度を、一時記録部17に記録する(ステップS320)。
また、異なる方法で2種類の類似度を算出した場合に、片方の類似度が所定値以上のときにテキストデータが正しく書き起こされたと判断すると、類似度での判断が緩くなる。
書き起こしの質は作業者により異なるために、よりよい人材を確保することが重要である。人材を評価し、確保することは管理者の仕事であるが、在宅の作業者が増加すると管理者の目が行き届かなくなり、正しい評価できない可能性がある。
このような処理により作業者に付加された得点により、能力を測定することができる。書き起こし作業者の能力を正確に把握できるために、作業者が在宅であっても、優秀な人材の確保のための評価が正確に可能になる。
二人の異なる作業者により同じ音声データを元に書き起こされたテキストデータを比較することで、書き起こし能力の向上を図る。この場合、管理者による確認作業を不要としてもよい。そのために、書き起こし内容確認システム1に図7のフローチャートに示す処理を行うテキストデータ比較部を追加する。
このような処理により、高い精度の書き起こしを効率的に行うことができる。
Claims (8)
- 所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているか否かを確認する処理手段を有する装置により実行される方法であって、
前記処理手段が、
前記音声データと、前記テキストデータとが入力されるステップと、
入力された前記テキストデータに含まれる音節の種類を判別するステップと、
入力された前記音声データに含まれる音節と、当該音節に対応する前記テキストデータに含まれる音節とを、人の声の特徴をパラメータにした音響モデルに基づいて対応付けるステップと、
前記テキストデータの音節に対応付けられた前記音声データの音節の時間を、判別された前記音節の種類ごとに、音節時間として算出するステップと、
判別された前記音節の種類に対応する標準音節時間データを、標準音節時間として取得するステップと、
算出された前記音節時間と、取得された前記標準音節時間とを前記音節の種類ごとに比較するステップと、
前記比較の結果、算出された前記音節時間が、取得された前記標準音節時間から所定の範囲内にある場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記標準音節時間から所定の範囲外である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定するステップと
を有する第1段階と、
前記音声データと、前記テキストデータとが入力されるステップと、
入力された前記音声データに対して、平仮名単位の音声認識を行うことにより前記音声データの音響対数尤度を算出するステップと、
入力された前記音声データに対して、前記テキストデータに含まれる単語に基づいて音声認識を行うことにより前記音声データの単語認識対数尤度を算出するステップと、
算出された前記音節認識対数尤度と、算出された前記単語認識対数尤度とに基づいて、前記音声データと前記テキストデータとの類似度を算出するステップと、
前記類似度が所定値以上である場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記類似度が所定値未満である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定するステップと、
を有する第2段階と、
の少なくとも一方の段階を実行する、書き起こし内容確認方法。 - 前記処理手段が、前記第2段階で、N個(Nは自然数)の前記音節認識対数尤度を得て
、前記単語対数尤度とN個の前記音節認識対数尤度とから前記類似度を導出する、
請求項1記載の書き起こし内容確認方法。 - 前記処理手段が、前記第2段階で、前記類似度を、前記単語認識対数尤度のべき指数値
をN個の前記音節認識対数尤度のべき指数値の和で割ることにより導出する、
請求項2記載の書き起こし内容確認方法。 - 前記音節認識対数尤度は、前記音声データ、HMMの音響モデル、及び少なくとも平仮
名が格納された音節認識用辞書によりHMM法を用いて得られる音響尤度の対数であり、
前記単語認識対数尤度は、前記音声データ、前記音響モデル、及び前記テキストデータ
のみが格納された単語認識用辞書によりHMM法を用いて得られる音響尤度の対数である
、
請求項1〜3のいずれかの項に記載の書き起こし内容確認方法。 - 所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているか否かを確認する装置であって、
前記音声データと、前記テキストデータとが入力される入力手段と、
入力された前記テキストデータに含まれる音節の種類を判別する判別手段と、
入力された前記音声データに含まれる音節と、当該音節に対応する前記テキストデータに含まれる音節とを、人の声の特徴をパラメータにした音響モデルに基づいて対応付ける対応付け手段と、
前記テキストデータの音節に対応付けられた前記音声データの音節の時間を、判別された前記音節の種類ごとに、音節時間として算出する算出手段と、
判別された前記音節の種類に対応する標準音節時間データを、標準音節時間として取得する取得手段と、
算出された前記音節時間と、取得された前記標準音節時間とを前記音節の種類ごとに比較する比較手段と、
前記比較の結果、算出された前記音節時間が、取得された前記標準音節時間から所定の範囲内にある場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記標準音節時間から所定の範囲外である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定する判定手段と
を有する第1手段と、
前記音声データと、前記テキストデータとが入力される第2入力手段と、
入力された前記音声データに対して、平仮名単位の音声認識を行うことにより前記音声データの音響対数尤度を算出する音響対数尤度算出手段と、
入力された前記音声データに対して、前記テキストデータに含まれる単語に基づいて音声認識を行うことにより前記音声データの単語認識対数尤度を算出する単語認識対数尤度算出手段と、
算出された前記音節認識対数尤度と、算出された前記単語認識対数尤度とに基づいて、前記音声データと前記テキストデータとの類似度を算出する類似度算出手段と、
前記類似度が所定値以上である場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記類似度が所定値未満である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定する第2判定手段と、
を有する第2手段と、
の少なくとも一方の手段を有する、書き起こし内容確認装置。 - 前記判別手段で判別された音節の種類別に、前記算出手段によって算出された前記音節時間を前記音節の種類別に集計する音節時間算出手段を更に備える、
請求項5記載の書き起こし内容確認装置。 - 前記音節時間算出手段は、前記算出手段によって算出された前記音節時間を、音節の種類毎に平均して、音節の種類毎の前記標準音節時間データを算出し、所定の記録手段に記録する、
請求項6記載の書き起こし内容確認装置。 - 所定の音声データ、前記音声データを元に書き起こされたテキストデータ、及び音節の種類毎の標準的な時間を表す標準音節時間データから、前記テキストデータが前記音声データから正しく書き起こされているか否かを確認する処理手段を有するコンピュータに、
前記音声データと、前記テキストデータとが入力されるステップと、
入力された前記テキストデータに含まれる音節の種類を判別するステップと、
入力された前記音声データに含まれる音節と、当該音節に対応する前記テキストデータに含まれる音節とを、人の声の特徴をパラメータにした音響モデルに基づいて対応付けるステップと、
前記テキストデータの音節に対応付けられた前記音声データの音節の時間を、判別された前記音節の種類ごとに、音節時間として算出するステップと、
判別された前記音節の種類に対応する標準音節時間データを、標準音節時間として取得するステップと、
算出された前記音節時間と、取得された前記標準音節時間とを前記音節の種類ごとに比較するステップと、
前記比較の結果、算出された前記音節時間が、取得された前記標準音節時間から所定の範囲内にある場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記標準音節時間から所定の範囲外である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定するステップと
を有する第1段階と、
前記音声データと、前記テキストデータとが入力されるステップと、
入力された前記音声データに対して、平仮名単位の音声認識を行うことにより前記音声データの音響対数尤度を算出するステップと、
入力された前記音声データに対して、前記テキストデータに含まれる単語に基づいて音声認識を行うことにより前記音声データの単語認識対数尤度を算出するステップと、
算出された前記音節認識対数尤度と、算出された前記単語認識対数尤度とに基づいて、前記音声データと前記テキストデータとの類似度を算出するステップと、
前記類似度が所定値以上である場合には、前記テキストデータが前記音声データから正しく書き起こされていると判定し、前記類似度が所定値未満である場合には、前記テキストデータが前記音声データから正しく書き起こされていないと判定するステップと、
を有する第2段階と、
の少なくとも一方の段階を実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007242678A JP4861941B2 (ja) | 2007-09-19 | 2007-09-19 | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007242678A JP4861941B2 (ja) | 2007-09-19 | 2007-09-19 | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009075249A JP2009075249A (ja) | 2009-04-09 |
JP4861941B2 true JP4861941B2 (ja) | 2012-01-25 |
Family
ID=40610284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007242678A Expired - Fee Related JP4861941B2 (ja) | 2007-09-19 | 2007-09-19 | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4861941B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6306400B2 (ja) * | 2014-04-04 | 2018-04-04 | Kddi株式会社 | クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法 |
CN111105799B (zh) * | 2019-12-09 | 2023-07-07 | 国网浙江省电力有限公司杭州供电公司 | 基于发音量化和电力专用词库的离线语音识别装置及方法 |
CN111858852B (zh) * | 2020-07-07 | 2022-07-05 | 国网福建省电力有限公司 | 一种基于数据相似性的全防误点表校核方法 |
CN113140210B (zh) * | 2021-04-30 | 2024-06-07 | 武汉悦学帮网络技术有限公司 | 音频批改方法、装置、电子设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3171107B2 (ja) * | 1996-04-26 | 2001-05-28 | 日本電気株式会社 | 音声認識装置 |
JP2001228890A (ja) * | 2000-02-17 | 2001-08-24 | Mitsubishi Electric Corp | 音声認識装置 |
JP4610451B2 (ja) * | 2005-09-09 | 2011-01-12 | 株式会社エヌ・ティ・ティ・データ | 音声認識装置及びプログラム |
JP2007133033A (ja) * | 2005-11-08 | 2007-05-31 | Nec Corp | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム |
-
2007
- 2007-09-19 JP JP2007242678A patent/JP4861941B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009075249A (ja) | 2009-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10147418B2 (en) | System and method of automated evaluation of transcription quality | |
KR101183344B1 (ko) | 사용자 정정들을 이용한 자동 음성 인식 학습 | |
US7603279B2 (en) | Grammar update system and method for speech recognition | |
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
US8645139B2 (en) | Apparatus and method of extending pronunciation dictionary used for speech recognition | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP2009139862A (ja) | 音声認識装置及びコンピュータプログラム | |
JP2002132287A (ja) | 音声収録方法および音声収録装置および記憶媒体 | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
JP4861941B2 (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP6996570B2 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP4354299B2 (ja) | 事例検索プログラム、事例検索方法及び事例検索装置 | |
US20020184019A1 (en) | Method of using empirical substitution data in speech recognition | |
JP3735209B2 (ja) | 話者認識装置及び方法 | |
JP5447382B2 (ja) | 音声認識仮説検証装置、音声認識装置、それに用いられる方法およびプログラム | |
JP5673239B2 (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
JP4798606B2 (ja) | 音声認識装置、およびプログラム | |
JP4981850B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP4408665B2 (ja) | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム | |
JP4962930B2 (ja) | 発音評定装置、およびプログラム | |
Chen et al. | A proof-of-concept study for automatic speech recognition to transcribe AAC speakers’ speech from high-technology AAC systems | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム | |
JP4621936B2 (ja) | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100325 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100402 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111011 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4861941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |