JP2009109913A - 確認支援装置及びコンピュータプログラム - Google Patents

確認支援装置及びコンピュータプログラム Download PDF

Info

Publication number
JP2009109913A
JP2009109913A JP2007284284A JP2007284284A JP2009109913A JP 2009109913 A JP2009109913 A JP 2009109913A JP 2007284284 A JP2007284284 A JP 2007284284A JP 2007284284 A JP2007284284 A JP 2007284284A JP 2009109913 A JP2009109913 A JP 2009109913A
Authority
JP
Japan
Prior art keywords
data
result
recognition
unit data
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007284284A
Other languages
English (en)
Other versions
JP4926000B2 (ja
Inventor
Masaharu Harada
将治 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007284284A priority Critical patent/JP4926000B2/ja
Publication of JP2009109913A publication Critical patent/JP2009109913A/ja
Application granted granted Critical
Publication of JP4926000B2 publication Critical patent/JP4926000B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認作業を支援する確認支援装置及びコンピュータプログラムを提供する。
【解決手段】確認支援装置1は、音データに含まれる各単位データ間の時期データの関係から、続けて出力すべき一又は複数の単位データを選択し(S102)、選択された単位データに該当する音を、選択された単位データに係る時期データに基づく順序で出力し(S104)、またステップS102にて選択された単位データに対応する認識処理の結果を示す画像を表示し(S106)、ステップS102へ戻り、以降の処理を繰り返す。
【選択図】図4

Description

本発明は、動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を支援する確認支援装置、及び該確認支援装置を実現するためのコンピュータプログラムに関する。
話者が発声した音声に基づく音声データに対し、発声内容に基づくテキストデータを生成する音声認識処理が実用化されており、音声認識処理により生成されたテキストデータは、発声内容を文章化する書き起こし処理、検索用キーワードを付与する処理等の様々な処理に用いられる。ただし現在の音声認識処理の技術は、100%の認識率が保証されたものではなく、誤認識を行うこともあるため、認識処理の結果に対し、人手による確認、修正等の作業を要する。この様な音声認識処理の結果の確認を支援する装置として、認識結果に基づく音声を出力し、話者に認識結果の確認を求める装置が、特許文献1に開示されている。
特開2000−89797号公報
しかしながら特許文献1に開示された装置は、話者がその場で発声した音声の正誤判定を、原則的には話者が行うものであり、発声内容を文章化する書き起こし処理、検索用キーワードを付与する処理等の話者の過去の発声内容に対する認識処理の結果に対して、話者に限らない確認者が確認する形態に適用することはできない。
本発明は斯かる事情に鑑みてなされたものであり、音声データ等の出力データについて、認識の対象となる認識対象区間毎の出力データである単位データに対し、続けて出力すべき複数の単位データを選択して、続けて出力すると共に、出力している単位データに係る認識データが示す認識処理の結果を出力し、認識処理の結果に対する正誤判定の結果の入力を受け付けて記録することにより、認識処理の結果に対する正誤確認の作業を支援し、しかもその正誤確認を、認識処理後に話者以外の確認者が行うことも可能な確認支援装置、及び該確認支援装置を実現するためのコンピュータプログラムの提供を目的とする。
第1の装置は、動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を支援する確認支援装置において、各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースと、各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択する選択手段と、選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力する第1出力手段と、単位データを出力中に、該単位データに対応する認識データが示す認識処理の結果を出力する第2出力手段と、認識処理の結果に対する正誤判定の結果の入力を受け付ける受付手段と、正誤判定の結果を記録する結果記録手段とを備えることを要件とする。
第2の装置は、第1の装置において、前記選択手段、第1出力手段及び第2出力手段による処理と、前記受付手段及び結果記録手段による処理とを夫々繰り返す様に構成してあることを要件とする。
第3の装置は、第2の装置において、前記結果記録手段は、正誤判定の結果を受け付けることなく所定回数以上繰り返して出力された単位データに対し、予め設定されている所定の正誤判定の結果を記録する様に構成してあることを要件とする。
第4の装置は、第1乃至第3の装置のいずれかにおいて、前記認識処理は、単位データを、予め登録されている複数の候補データと照合した結果を示す類似度に基づき選択された一の候補データを認識データとする様に構成してあり、前記受付手段が受け付けた正誤判定の対象となる一の単位データと認識処理の結果が同じである他の単位データの中で、類似度が所定値以上である単位データを抽出する抽出手段を更に備え、前記記録手段は、前記抽出手段が抽出した単位データの正誤判定の結果を、一の単位データと同じ正誤判定の結果として記録する様に構成してあることを要件とする。
第5のコンピュータプログラムは、動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を、コンピュータに支援させるコンピュータプログラムにおいて、コンピュータに、各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースにアクセスして、各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択させる手順と、選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力させる手順と、単位データを出力中に、該単位データに対応付けられた認識データが示す認識処理の結果を出力させる手順と、認識処理の結果に対する正誤判定の結果の入力を受け付けた場合に、受け付けた結果を記録させる手順とを実行させることを要件とする。
第1の装置及び第2の装置並びに第5のコンピュータプログラムでは、認識処理の結果に対する正誤確認の作業を効率化することが可能である。
第3の装置は、繰り返し回数が所定回数に達した単位データに対し、例えば誤認識を示す所定の正誤判定を自動的に行うことにより、認識処理の結果の正誤判定を効率化する。
第4の装置は、一の単位データに対する正誤判定の結果が例えば正である場合に、認識処理の結果が同じである他の単位データの中で、類似度が所定値以上である単位データに対する正誤判定の結果を、一の単位データと同じ正誤判定の結果とすることにより、正誤判定作業を軽減する。
本発明の確認支援装置及びコンピュータプログラムは、動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を支援する。本発明は、各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースを用い、各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択し、選択した複数の単位データを、該単位データに係る時期データに基づく順序で続けて出力し、単位データを出力中に、該単位データに係る認識データが示す認識処理の結果を出力する。そして本発明は、認識処理の結果に対する正誤判定の結果の入力を受け付け、正誤判定の結果を記録する。
この構成により本発明では、例えば音データである出力データに含まれる、人が発声した音声を示す音声データに対する音声認識処理に適用することが可能であり、正誤判定の対象となる出力データを自動的に選択して出力し、認識処理の結果に対する正誤確認の作業を効率化することが可能である等、優れた効果を奏する。しかも認識処理後に、話者以外の確認者が正誤確認を行うことも可能である。
また本発明は、単位データの選択、出力、認識処理結果の出力、正誤判定の結果の受け付け及び記録を繰り返し、正誤判定の結果を受け付けることなく所定回数以上繰り返して出力された単位データに対し、予め設定されている所定の正誤判定の結果を記録する。
この構成により、本発明では、繰り返し回数が所定回数に達した単位データに対し、例えば誤認識を示す所定の正誤判定を自動的に行うことで、確認者が正誤を付け難い単位データに対して、自動的に誤認識として、認識処理の結果の正誤判定を効率化することが可能である等、優れた効果を奏する。
さらに本発明は、受け付けた正誤判定の対象となる一の単位データと認識処理の結果が同じである他の単位データの中で、類似度が所定値以上である単位データを抽出し、抽出した単位データの正誤判定の結果を、一の単位データと同じ正誤判定の結果として記録する。
この構成により、本発明では、例えば単位データに対して認識結果が正であることを示す判定を行った場合に、類似度が所定値以上である他の単位データの認識結果が自動的に正として判定されるので、確認者による正誤判定作業を軽減し、正誤判定作業を効率化することが可能である等、優れた効果を奏する。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。本発明の実施例に係る確認支援装置は、動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対して、確認者が正誤の確認を行うことを支援する。なおここでは確認支援装置の一例として、音を出力させる音データを出力データとして用い、音データに含まれる、人が発声した音声を示す音声データに対する音声認識処理を行い、音声認識処理の結果に対する正誤判定を支援する形態について説明する。
図1は、本発明の実施例に係る確認支援装置の構成例を示すブロック図である。図1に示す確認支援装置1は、パーソナルコンピュータ等のコンピュータを用いた本発明の実施例に係る確認支援装置1であり、確認支援装置1は、装置全体を制御するCPU等の制御部10と、本発明のコンピュータプログラム100等のプログラム及びデータ等の各種情報を記録するCD−ROM等の記録媒体から各種情報を読み取るCD−ROMドライブ等の補助記憶部11と、補助記憶部11により読み取った各種情報を記録するハードディスク等の記録部12と、一時的に発生する情報を記録するRAM等の記憶部13とを備えている。そして記録部12に記録したコンピュータプログラム100を記憶部13に記憶させ、制御部10の制御にて実行することにより、コンピュータは、本発明の実施例に係る確認支援装置1として動作する。
さらに確認支援装置1は、音を出力するスピーカ等の音出力部14と、画像を出力するモニタ等の表示部15と、確認者の操作を受け付けるマウス、キーボード等の操作部16とを備えている。
また本発明の実施例に係る確認支援装置1は、本発明のコンピュータプログラム100を実行することにより、記録部12の記録領域の一部を、音声データを含む音データを記録する音データベース(音DB)12a、音声認識処理の結果を記録する認識結果データベース(認識結果DB)12b、音声認識処理の結果に対する判定結果を記録する判定結果データベース(判定結果DB)12c等の各種データベースとして用いる。なお記録部12の記録領域の一部を各種データベースとして用いるのではなく、確認支援装置1に接続された他の装置にデータベースを確保する様にしても良い。
音データベース12aには、WAVファイル等のファイル形式で音データが記録されており、各音データには、音データを特定する音IDとして、「001」等のファイル名が付されている。
図2は、本発明の実施例に係る確認支援装置1が備える認識結果データベース12bの記録内容の例を概念的に示す説明図である。認識結果データベース12bには、音声認識処理の結果として、音ID、認識対象区間、認識結果、類似度等の各種データがレコード単位で記録されている。なお本発明において、認識対象区間毎の音データを、認識処理の単位となる単位データと定義する。
ここで音声認識処理の一例について説明する。音声認識処理としては、例えば図示しない音声認識装置により、先ず話者が発声した音声及び雑音を含む音に基づく音データから、所定時間長のフレームを生成し、生成したフレーム単位でスペクトルに変換し、変換したスペクトルからパワー、ピッチ、ケプストラム等の特徴量を抽出する。さらに音声認識装置は、抽出した特長量等のフレームに係る情報から、当該フレームの区間が音声を含む音声区間であるか、音声を含まない非音声区間であるかを判定する。そして音声認識装置は、音声区間であると判定したフレームに係る音データのパワー、ピッチ、ケプストラム等の特徴量を、音響モデル及び単語辞書と照合し、単語辞書に登録されている単語、即ち認識の候補となる候補データとの類似度を導出し、類似度が高い候補データにより示される単語を音声認識処理の結果である認識データとして出力する。
図2に戻り、音IDとは、音データベース12aに記録されている音データを特定するデータである。認識対象区間とは、音データ中で音声認識処理が行われた区間を、出力時期を示す時期データとして示している。例えば認識対象区間が「1.0−2.3」である場合、当該音データに基づく出力を開始する時刻を基準時刻として、出力開始時刻が基準時刻から1.0秒後であり、出力終了時刻が2.3秒後である区間、即ち1.0秒後から2.3秒後までの時間に対する区間が認識対象区間であることを示している。認識結果とは、音声認識処理の結果を示す認識データを示している。類似度とは、音声認識処理において、認識結果となった候補データに対する音データの類似度である。例えば図2において、音IDが「001」である音データの「1.0−2.3」秒の区間に含まれる音声は、「あした」であると認識され、認識に係る類似度は、「0.8」である。なお図2に示す類似度は、0.0〜1.0の値をとり、候補データと音データとが一致した場合に1.0となる。例えば単語辞書に対する音データの特徴量の音響尤度が類似度として用いられる。
図3は、本発明の実施例に係る確認支援装置1が備える判定結果データベース12cの記録内容の例を概念的に示す説明図である。判定結果データベース12cは、認識結果データベース12bに記録されている認識結果に対する正誤判定の結果を記録するデータベースであり、音ID、認識対象区間、認識結果、類似度等の認識結果に係るデータと、判定結果、訂正結果等の正誤判定結果に係るデータとが対応付けて記録されている。判定結果としては、認識結果が正しいと判定したことを示す「確認」、認識結果が誤っていたが、訂正されたことを示す「訂正」、認識結果が誤っていたことを示す「削除」等のデータが記録される。誤認識と判定した場合で、異なる単語と誤認識していると判定され、確認者による訂正が行われたときには、訂正結果として訂正後のデータが記録される。例えば図3の例では、認識結果である「さきゅう」が「やきゅう」に訂正されている。誤認識と判定した場合で、例えば雑音である非音声区間の音データを音声区間の音データと判定したときには、当該音データを認識の対象から除外する削除が行われる。なお認識結果データベース12b及び判定結果データベース12cを夫々異なるデータベースとして用いるのではなく、判定結果に基づいて、認識結果データベース12bを更新する様にしても良い。その場合、訂正が行われた単位データに対する認識結果を訂正する更新が行われる。また削除が行われた単位データに係るレコードを削除する更新が行われる。
次に本発明の実施例に係る確認支援装置1の処理について説明する。図4は、本発明の実施例に係る確認支援装置1の認識結果出力処理の例を示すフローチャートである。確認者は、操作部16を用いて確認支援装置1を操作し、音声認識結果に対する判定の対象となる音データ、例えば音IDが「001」である音データを指定する。音データの指定を受け付けた確認支援装置1は、コンピュータプログラム100を実行する制御部10の制御により、認識結果データベース12bの中から指定された音データに係る単位データについてのレコードを抽出する(S101)。ステップS101では、指定された音データを特定する音IDに合致するレコードを抽出する。
確認支援装置1は、制御部10の制御により、抽出したレコードの中で、各単位データ間の時期データの関係から、続けて出力すべき一又は複数の単位データを選択する(S102)。ステップS102の処理として、確認支援装置1は、認識対象区間として示されている時期データである出力開始時刻に基づいて、各単位データに対して出力順序に応じた並べ替えを行い、一の単位データの直前に出力すべき単位データの出力終了時刻から、一の単位データの出力開始時刻までの時間が、予め設定されている連続出力基準時間未満である場合、一の単位データは、直前に出力すべき単位データに続けて出力すべき単位データであると判定する。この判定を二番目に出力すべき単位データから繰り返し行うことで続けて出力すべき一連の単位データを判定し、判定した一連の単位データを続けて出力すべき複数の単位データとして選択する。なお最初に出力すべき単位データの出力終了時刻から、二番目に出力すべき単位データの出力開始時刻までの時間が、連続出力時間以上である場合、最初に出力すべき単位データのみが選択される。連続出力基準時間は、例えば記録部12に予め記録されている。また続けて出力すべきとして選択される単位データの出力開始時刻から出力終了時刻までの時間の合計が、予め設定されている上限時間を超えない様に単位データの選択に制限を設ける様にしても良い。
確認支援装置1は、制御部10の制御により、音データベース12aから、判定の対象となる音データを読み取り(S103)、読み取った音データに基づいて、ステップS102にて選択された単位データに該当する音を、選択された単位データに係る時期データに基づく順序で音出力部14から出力する(S104)。選択された単位データに該当する音データの音とは、音データにおける、単位データの認識対象区間として示されている時期データが示す出力開始時刻から出力終了時刻までの区間の音である。時期データに基づく順序とは、認識対象区間として示されている時期データである出力開始時刻に基づく順序である。ステップS104では、認識対象区間である単位データに基づく音が出力されるため、例えば図3に例示した認識対象区間が「1.0−2.3」、「2.8−4.4」及び「6.2−8.5」である音データに基づく音を出力することになるが、続けて出力する音データについては、認識対象区間以外の音声が含まれないと見なされた区間をも含む音データ、即ち「1.0−8.5」の区間の音データに基づく音を出力する様にしても良い。
また確認支援装置1は、制御部10の制御により、ステップS102にて選択された単位データに対応付けられた認識データを、認識結果データベース12bから読み取り(S105)、読み取った認識データが示す認識処理の結果を示す画像を表示部15に表示(出力)する(S106)。ステップS103〜S104の処理と、ステップS105〜S106の処理とは、実質的に並行して実行する。即ち確認支援装置1は、単位データに該当する音を出力中に、当該単位データの認識結果を表示する。
そして確認支援装置1は、制御部10の制御により、ステップS102へ戻り、以降の処理を繰り返す。
図5は、本発明の実施例に係る確認支援装置1の表示部15から出力する画像の例を示す説明図である。図5は、ステップS106にて出力される認識結果確認画面の例を示している。図5に例示した画像では、続けて出力すべき単位データに対応する音データに係る信号波形が表示されている。図5において、T1〜T2として示す区間の信号波形が、続けて出力すべき一連の単位データである。また信号波形の単位データに該当する箇所の下方に、認識データが示す「あした」、「ごご」、「てんき」等の認識結果が表示されており、更に認識結果の下方に、認識結果に対する正誤判定の判定結果を入力する「確認」、「削除」等の押釦を模した画像が表示されている。そして図5に例示した画像を表示中に、確認支援装置1は、ステップS104の処理として、認識結果が表示されている単位データに該当する音データに基づく音を、音出力部14から出力する。ステップS102〜S106の処理は、繰り返し実行されるため、認識結果が表示されている単位データに該当する音データに基づく音は繰り返し出力される。この様にして確認支援装置1は、認識結果出力処理を実行する。
図4及び図5を用いて説明した認識結果出力処理と並行して、判定結果入力処理が行われる。図5に例示した画面が表示されている時に、確認者は、音出力部14から出力された音を聴取し、表示部15に表示されている認識結果の正誤判定を行う。そして確認者は、認識結果が正しいと判定した場合、操作部16により、「確認」と示された画像を指定する操作を行う。また確認者は、認識結果が誤りであると判定した場合、「削除」と示された画像を指定する操作を行う。さらに確認者は、認識結果が誤りであり、訂正を要すると判定した場合、認識結果が表示されている欄を指定して、訂正結果を入力した上で、「確認」と示された画像を指定する操作を行う。
図6は、本発明の実施例に係る確認支援装置1の判定結果入力処理の例を示すフローチャートである。確認支援装置1は、コンピュータプログラム100を実行する制御部10の制御により、操作部16から、認識処理の結果に対する正誤判定の結果の入力を受け付け(S201)、受け付けた正誤判定の結果を判定結果データベース12cに記録し(S202)、ステップS201へ戻り、以降の処理を繰り返す。判定結果入力処理は、認識結果出力処理と連動した処理であり、認識結果出力処理が実行されている間、認識結果出力処理にて出力されている認識処理の結果に対する判定結果の受付及び記録を繰り返す処理である。この様にして確認支援装置1は、判定結果入力処理を実行する。
次に確認支援装置1の認識結果出力処理又は判定結果出力処理に追加して実行することが可能な各種追加処理について説明する。図7は、本発明の実施例に係る確認支援装置1の第1追加処理の例を示すフローチャートである。第1追加処理は、認識結果出力処理におけるステップS102〜S106の処理の繰り返し時において、ステップS102の実行前に行われる処理である。確認支援装置1は、コンピュータプログラム100を実行する制御部10の制御により、判定結果データベース12cを参照して、正誤判定の結果が記録されている単位データを、ステップS102の選択の対象から除外し(S301)、ステップS102以降の処理を実行する。即ち認識結果出力処理に追加して第1追加処理を実行することにより、ステップS102〜S106の処理の繰り返し時において、確認支援装置1は、ステップS301にて除外された単位データ以外の単位データの中から単位データを選択するステップS102以降の処理を実行する。
図8は、本発明の実施例に係る確認支援装置1の表示部15から出力する画像の例を示す説明図である。図8(a)は、図5に例示した状態から認識処理の結果である「ごご」に対し、確認者は、認識結果が正しいと判定して「確認」を指定した状態を示している。この様な判定結果が入力された後の第1追加処理により、認識処理の結果が「ごご」である単位データは、ステップS102の選択の対象から除外される。図5に示す状態では、認識処理の結果が「あした」、「ごご」及び「てんき」である単位データが、続けて出力すべき一連の単位データとして選択されていたが、「ごご」が選択の対象から除外された図8(a)の状態では、「あした」に係る単位データの出力終了時刻から、「てんき」に係る単位データの出力開始時刻までの時間が、連続出力基準時間以上となるため、続けて出力すべき一連の単位データとしては、「あした」に係る単位データのみが選択される。従って図8(a)の状態では、T1〜T3として示す区間、即ち「あした」の区間のみに対応する音が繰り返し出力される。
図8(b)は、図8(a)に例示した状態から認識処理の結果である「あした」に対し、確認者は、認識結果が誤りであると判定して「削除」を指定した状態を示している。この様な判定結果が入力された後の第1追加処理により、認識処理の結果が「あした」である単位データは、ステップS102の選択の対象から除外される。図5に示す状態から「あした」及び「ごご」が除外されることにより、続けて出力すべき一連の単位データとして「てんき」のみが選択される。従って図8(b)の状態では、T4〜T2として示す区間、即ち「てんき」の区間のみに対応する音が繰り返し出力される。なお図8(b)に示す状態から、「てんき」に対して判定結果が入力された場合、音IDが「001」である音データの中で、「てんき」の次に出力すべき単位データの中から、続けて出力すべき一連の単位データの選択が行われる。
図9は、本発明の実施例に係る確認支援装置1の第2追加処理の例を示すフローチャートである。第2追加処理は、認識結果出力処理におけるステップS106の実行後に行われる処理である。確認支援装置1は、コンピュータプログラム100を実行する制御部10の制御により、判定結果データベース12cを参照して、ステップS104にて対応する音が出力された単位データであって、正誤判定の結果が記録されていない単位データについて、ステップS104における出力回数を計数する(S401)。ステップS401の計数は、例えば予め判定結果データベース12cに初期値が「0」である出力回数の項目を設定しておき、ステップS104の出力を行う毎に、出力回数の項目のデータに「1」を加算することにより実現される。
そして確認支援装置1は、制御部10の制御により、計数した出力回数が、予め設定されている「5」等の上限出力回数以上である単位データに対し、認識結果が誤りであることを示す「削除」が指定されたものとして、正誤判定の結果を判定結果データベース12cに記録し(S402)、ステップS102へ戻り、以降の処理を繰り返す。ステップS402において、「削除」以外の正誤判定の結果を記録する様に設定することも可能である。なお上限出力回数は、例えば記録部12に予め記録されている。また第1追加処理及び第2追加処理を組み合わせて実行することも可能である。
図10は、本発明の実施例に係る確認支援装置1の第3追加処理の例を示すフローチャートである。第3追加処理は、判定結果入力処理におけるステップS201の実行後に行われる処理である。確認支援装置1は、コンピュータプログラム100を実行する制御部10の制御により、ステップS201にて受け付けた正誤判定の結果が、認識結果が正しいことを示す「確認」である場合に限り、正誤判定の対象となった一の単位データと認識処理の結果が同じである他の単位データの中で、類似度が「0.8」等の予め設定されている基準類似度以上である単位データを認識結果データベース12bから抽出する(S501)。なお抽出の対象となる他の単位データは、一の単位データと同じ音データに係る単位データに限る様にしても良い。ステップS501において、単位データを抽出する条件として、一の単位データの正誤判定の結果が「確認」であり、他の単位データの類似度が「0.8」以上であることを設定しているが、これらの条件は適宜設定することが可能である。また正誤判定の結果を受け付けた一の単位データの類似度が所定値以上である場合にのみ、他の単位データの正誤判定を自動的に行うという様に、一の単位データに対して類似度についての条件を設定することも可能である。
そして確認支援装置1は、制御部10の制御により、判定結果データベース12cを参照して、ステップS501にて抽出した他の単語データに対して、正誤判定の結果が記録されていない場合に限り、正誤判定の対象となった一の単位データと同じ正誤判定の結果、即ち「確認」を他の単語データの正誤判定の結果として判定結果データベース12cに記録する(S502)。ステップS502の処理は、判定結果入力処理におけるステップS202の処理と共に実行される。即ち一の単位データ及び他の単位データに対して正誤判定の結果が記録される。この様な第3追加処理は、第1追加処理及び第2追加処理と共に実行することも可能である。
図11は、本発明の実施例に係る確認支援装置1の第3追加処理の例を概念的に示す説明図である。図11は、音データに係る信号波形と、音データに含まれる単位データに対する認識処理の結果及び類似度とを時系列で示している。図11(a)は、音データに、認識処理の結果が「きのう」、「かいぎ」、「かいぎ」及び「かいぎ」である単位データが含まれており、夫々の類似度が「0.9」、「0.8」、「0.8」及び「0.7」であることを示している。また「きのう」に係る単位データと、最初の「かいぎ」に係る単位データとが続けて出力すべき一連の単位データとして選択されている。図11(a)に示す状態において、確認支援装置1は、認識結果出力処理として、T5〜T6に示す区間、即ち「きのう」及び「かいぎ」を繰り返し出力する。
図11(b)は、図11(a)に示す状態から、「きのう」及び最初の「かいぎ」に対して、確認者により正誤判定の結果として「確認」が入力された状態を示している。最初の「かいぎ」に対して「確認」が入力されることにより、2番目の「かいぎ」は、最初の「かいぎ」と認識処理の結果が同じであり、しかも類似度が基準類似度である「0.8」以上であることから、確認支援装置1は、2番目の「かいぎ」に対して「確認」を正誤判定の結果として記録する。また3番目の「かいぎ」は、認識処理の結果が最初の「かいぎ」と同じであるが、類似度が基準類似度である「0.8」未満であるため、確認支援装置1による自動的な正誤判定は行われない。なお「きのう」並びに最初の「かいぎ」及び2番目の「かいぎ」の正誤判定の結果が記録されることにより、これらの単位データは、認識結果出力処理の単位データの選択の対象から除外されるため、図11(b)の段階での認識結果出力処理として、確認支援装置1は、T7〜T8に示す区間、即ち3番目の「かいぎ」を繰り返し出力する。
前記実施の形態は、本発明の無限にある実施の形態の一部を例示したに過ぎず、各種ハードウェア及びソフトウェア等の構成は、適宜設定することが可能である。例えば前記実施の形態では、出力データが音データであり、認識処理として、音声認識処理を実行する形態を示したが、本発明はこれに限らず、動画を出力させる動画データを出力データとし、動画に対する認識処理の判定を支援する形態に展開することも可能である。例えば幹線道路、高速道路等の道路に設置されたカメラにより撮影して得られた動画データに対し、道路を走行する車両に対する車種、色等の種類を認識する認識処理を行い、その認識処理の結果に対して正誤判定を行う作業を支援する形態に展開する等、様々な形態に展開することが可能である。この様な形態に展開する場合、確認支援装置は、走行する車両を撮影した動画と、当該車両の車種についての認識結果とを表示し、確認者は動画として表示された車両と認識処理の結果である車種との整合性を判定する。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を支援する確認支援装置において、
各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースと、
各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択する選択手段と、
選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力する第1出力手段と、
単位データを出力中に、該単位データに対応する認識データが示す認識処理の結果を出力する第2出力手段と、
認識処理の結果に対する正誤判定の結果の入力を受け付ける受付手段と、
正誤判定の結果を記録する結果記録手段と
を備えることを特徴とする確認支援装置。
(付記2)
前記選択手段、第1出力手段及び第2出力手段による処理と、前記受付手段及び結果記録手段による処理とを夫々繰り返す様に構成してあることを特徴とする付記1に記載の確認支援装置。
(付記3)
前記結果記録手段にて正誤判定の結果が記録された単位データを、前記選択手段による選択の対象から除外する手段を更に備えることを特徴とする付記1又は付記2に記載の確認支援装置。
(付記4)
前記結果記録手段は、正誤判定の結果を受け付けることなく所定回数以上繰り返して出力された単位データに対し、予め設定されている所定の正誤判定の結果を記録する様に構成してあることを特徴とする付記2又は付記3に記載の確認支援装置。
(付記5)
前記認識処理は、単位データを、予め登録されている複数の候補データと照合した結果を示す類似度に基づき選択された一の候補データを認識データとする様に構成してあり、
前記受付手段が受け付けた正誤判定の対象となる一の単位データと認識処理の結果が同じである他の単位データの中で、類似度が所定値以上である単位データを抽出する抽出手段を更に備え、
前記記録手段は、前記抽出手段が抽出した単位データの正誤判定の結果を、一の単位データと同じ正誤判定の結果として記録する様に構成してある
ことを特徴とする付記1乃至付記4のいずれかに記載の確認支援装置。
(付記6)
前記受付手段が受け付けた一の単位データに対する正誤判定の結果が、正である場合にのみ、前記抽出手段は、類似度が所定値以上である単位データを抽出する様に構成してあることを特徴とする付記5に記載の確認支援装置。
(付記7)
前記出力データは、音を出力させる音データであり、
前記認識処理は、音データに含まれる、人が発声した音声を示す音声データに対する音声認識処理である
ことを特徴とする付記1乃至付記6のいずれかに記載の確認支援装置。
(付記8)
動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を、コンピュータに支援させるコンピュータプログラムにおいて、
コンピュータに、
各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースにアクセスして、各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択させる手順と、
選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力させる手順と、
単位データを出力中に、該単位データに対応付けられた認識データが示す認識処理の結果を出力させる手順と、
認識処理の結果に対する正誤判定の結果の入力を受け付けた場合に、受け付けた結果を記録させる手順と
を実行させることを特徴とするコンピュータプログラム。
本発明の実施例に係る確認支援装置の構成例を示すブロック図である。 本発明の実施例に係る確認支援装置が備える認識結果データベースの記録内容の例を概念的に示す説明図である。 本発明の実施例に係る確認支援装置が備える判定結果データベースの記録内容の例を概念的に示す説明図である。 本発明の実施例に係る確認支援装置の認識結果出力処理の例を示すフローチャートである。 本発明の実施例に係る確認支援装置の表示部から出力する画像の例を示す説明図である。 本発明の実施例に係る確認支援装置の判定結果入力処理の例を示すフローチャートである。 本発明の実施例に係る確認支援装置の第1追加処理の例を示すフローチャートである。 本発明の実施例に係る確認支援装置の表示部から出力する画像の例を示す説明図である。 本発明の実施例に係る確認支援装置の第2追加処理の例を示すフローチャートである。 本発明の実施例に係る確認支援装置の第3追加処理の例を示すフローチャートである。 本発明の実施例に係る確認支援装置の第3追加処理の例を概念的に示す説明図である。
符号の説明
1 確認支援装置
10 制御部
11 補助記憶部
12 記録部
12a 音データベース
12b 認識結果データベース
12c 判定結果データベース
13 記憶部
14 音出力部
15 表示部
16 操作部
100 コンピュータプログラム

Claims (5)

  1. 動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を支援する確認支援装置において、
    各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースと、
    各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択する選択手段と、
    選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力する第1出力手段と、
    単位データを出力中に、該単位データに対応する認識データが示す認識処理の結果を出力する第2出力手段と、
    認識処理の結果に対する正誤判定の結果の入力を受け付ける受付手段と、
    正誤判定の結果を記録する結果記録手段と
    を備えることを特徴とする確認支援装置。
  2. 前記選択手段、第1出力手段及び第2出力手段による処理と、前記受付手段及び結果記録手段による処理とを夫々繰り返す様に構成してあることを特徴とする請求項1に記載の確認支援装置。
  3. 前記結果記録手段は、正誤判定の結果を受け付けることなく所定回数以上繰り返して出力された単位データに対し、予め設定されている所定の正誤判定の結果を記録する様に構成してあることを特徴とする請求項2に記載の確認支援装置。
  4. 前記認識処理は、単位データを、予め登録されている複数の候補データと照合した結果を示す類似度に基づき選択された一の候補データを認識データとする様に構成してあり、
    前記受付手段が受け付けた正誤判定の対象となる一の単位データと認識処理の結果が同じである他の単位データの中で、類似度が所定値以上である単位データを抽出する抽出手段を更に備え、
    前記記録手段は、前記抽出手段が抽出した単位データの正誤判定の結果を、一の単位データと同じ正誤判定の結果として記録する様に構成してある
    ことを特徴とする請求項1乃至請求項3のいずれかに記載の確認支援装置。
  5. 動画及び/又は音を出力させる出力データに対し、認識処理の対象となる認識対象区間を検出し、検出した認識対象区間毎の出力データである単位データについてなされた認識処理の結果に対する正誤確認を、コンピュータに支援させるコンピュータプログラムにおいて、
    コンピュータに、
    各単位データについて、出力時期を示す時期データ及び認識処理の結果を示す認識データを対応付けて記録するデータベースにアクセスして、各単位データ間の時期データの関係から、続けて出力すべき複数の単位データを選択させる手順と、
    選択した複数の単位データを、該単位データに対応付けられた時期データに基づく順序で出力させる手順と、
    単位データを出力中に、該単位データに対応付けられた認識データが示す認識処理の結果を出力させる手順と、
    認識処理の結果に対する正誤判定の結果の入力を受け付けた場合に、受け付けた結果を記録させる手順と
    を実行させることを特徴とするコンピュータプログラム。
JP2007284284A 2007-10-31 2007-10-31 確認支援装置及びコンピュータプログラム Expired - Fee Related JP4926000B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007284284A JP4926000B2 (ja) 2007-10-31 2007-10-31 確認支援装置及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007284284A JP4926000B2 (ja) 2007-10-31 2007-10-31 確認支援装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009109913A true JP2009109913A (ja) 2009-05-21
JP4926000B2 JP4926000B2 (ja) 2012-05-09

Family

ID=40778428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007284284A Expired - Fee Related JP4926000B2 (ja) 2007-10-31 2007-10-31 確認支援装置及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4926000B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8913744B2 (en) 2010-12-08 2014-12-16 Nuance Communications, Inc. Filtering confidential information in voice and image data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287547A (ja) * 1991-03-18 1992-10-13 Hitachi Ltd 音声操作端末兼用携帯電話機システム
JP2005228178A (ja) * 2004-02-16 2005-08-25 Nec Corp 書き起こしテキスト作成支援システムおよびプログラム
JP2006267319A (ja) * 2005-03-23 2006-10-05 Nec Corp 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置
JP2007256714A (ja) * 2006-03-24 2007-10-04 Internatl Business Mach Corp <Ibm> 字幕修正装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287547A (ja) * 1991-03-18 1992-10-13 Hitachi Ltd 音声操作端末兼用携帯電話機システム
JP2005228178A (ja) * 2004-02-16 2005-08-25 Nec Corp 書き起こしテキスト作成支援システムおよびプログラム
JP2006267319A (ja) * 2005-03-23 2006-10-05 Nec Corp 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置
JP2007256714A (ja) * 2006-03-24 2007-10-04 Internatl Business Mach Corp <Ibm> 字幕修正装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8913744B2 (en) 2010-12-08 2014-12-16 Nuance Communications, Inc. Filtering confidential information in voice and image data
US9330267B2 (en) 2010-12-08 2016-05-03 Nuance Communications, Inc. Filtering confidential information in voice and image data

Also Published As

Publication number Publication date
JP4926000B2 (ja) 2012-05-09

Similar Documents

Publication Publication Date Title
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
JP5255769B2 (ja) テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル
JP4784120B2 (ja) 音声書き起こし支援装置及びその方法ならびにプログラム
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US20080255835A1 (en) User directed adaptation of spoken language grammer
JP5098613B2 (ja) 音声認識装置及びコンピュータプログラム
JP2008209717A (ja) 入力された音声を処理する装置、方法およびプログラム
JP2011002656A (ja) 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム
US20080154591A1 (en) Audio Recognition System For Generating Response Audio by Using Audio Data Extracted
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP5326169B2 (ja) 音声データ検索システム及び音声データ検索方法
JP5271299B2 (ja) 音声認識装置、音声認識システム、及び音声認識プログラム
GB2527242A (en) System and method for dynamic response to user interaction
US20170270923A1 (en) Voice processing device and voice processing method
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
US9045098B2 (en) Vocabulary dictionary recompile for in-vehicle audio system
JP7326931B2 (ja) プログラム、情報処理装置、及び情報処理方法
WO2012173516A1 (ru) Способ и компьютерное устройство для автоматизированной обработки текста
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JP4926000B2 (ja) 確認支援装置及びコンピュータプログラム
JP4840051B2 (ja) 音声学習支援装置及び音声学習支援プログラム
JP4839291B2 (ja) 音声認識装置およびコンピュータプログラム
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
KR20150107344A (ko) 디스플레이 장치 및 디스플레이 장치의 비속어 처리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees