JP5921601B2 - 音声認識辞書更新装置、音声認識辞書更新方法、プログラム - Google Patents

音声認識辞書更新装置、音声認識辞書更新方法、プログラム Download PDF

Info

Publication number
JP5921601B2
JP5921601B2 JP2014096577A JP2014096577A JP5921601B2 JP 5921601 B2 JP5921601 B2 JP 5921601B2 JP 2014096577 A JP2014096577 A JP 2014096577A JP 2014096577 A JP2014096577 A JP 2014096577A JP 5921601 B2 JP5921601 B2 JP 5921601B2
Authority
JP
Japan
Prior art keywords
word
unregistered
recognition dictionary
storage unit
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014096577A
Other languages
English (en)
Other versions
JP2015215390A (ja
Inventor
太一 浅見
太一 浅見
祥子 山畠
祥子 山畠
浩和 政瀧
浩和 政瀧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014096577A priority Critical patent/JP5921601B2/ja
Publication of JP2015215390A publication Critical patent/JP2015215390A/ja
Application granted granted Critical
Publication of JP5921601B2 publication Critical patent/JP5921601B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、音声認識に用いられる音声認識辞書に単語を追加して更新する音声認識辞書更新装置、音声認識辞書更新方法、プログラムに関する。
音声認識システムに用いる認識辞書に追加で登録すべき単語を自動的に選出し、選出された単語を認識辞書に追加する音声認識辞書更新装置が特許文献1に開示されている。この音声認識辞書更新装置は、音声認識システム運用者(以下、単に運用者ともいう)が入力した関連文書から認識辞書に登録されていない未登録単語を抽出し、音声認識システム運用中に蓄積された音声と認識結果を用いて未登録単語それぞれのタスク関連度と平均認識信頼度を算出し、タスク関連度と平均認識信頼度から未登録単語それぞれの登録優先度を算出し、登録優先度の高い未登録単語を追加すべき単語として選出する。
以下図1、図2を参照して、特許文献1の音声認識辞書更新装置について説明する。図1は、特許文献1の音声認識辞書更新装置9の構成を示すブロック図である。図2は、特許文献1の音声認識辞書更新装置9の動作を示すフローチャートである。
図1に示すように、特許文献1の音声認識辞書更新装置9は、関連文書記憶部710と、未登録単語抽出部110と、未登録単語記憶部810と、未登録単語特徴量抽出部210と、入力音声記憶部720と、音声認識部120と、認識結果記憶部820と、認識結果特徴量抽出部220と、タスク関連度算出部310と、認識辞書記憶部730と、暫定認識辞書登録部130と、暫定認識辞書記憶部830と、登録優先度算出部320と、暫定音声認識部140と、暫定認識結果記憶部840と、認識信頼度算出部230と、認識辞書登録部330と、追加登録単語確認除外部030と、認識辞書更新部040と、拡張認識辞書記憶部900を含む構成である。
音声認識システム利用者(以下、単に利用者ともいう)は音声認識辞書更新装置9に音声を入力する。入力された音声(以下、入力音声という)は入力音声記憶部720に記憶されると同時に、認識辞書記憶部730に記憶されている認識辞書を用いて音声認識部120で音声認識され、認識結果が認識結果記憶部820に記憶される。
音声認識システム運用者は音声認識辞書更新装置9に関連文書を入力する。入力された関連文書は関連文書記憶部710に記憶される。
音声認識システム運用者の単語追加指示を契機として、図2に示す手順で以下のように単語追加処理と認識辞書の更新処理が行われる。
(ア)未登録単語抽出部110が、関連文書記憶部710に記憶された関連文書と、認識辞書記憶部730に記憶された認識辞書から、関連文書に出現しているが認識辞書に登録されていない未登録単語を抽出し、未登録単語記憶部810に記憶させる(S110)。
(イ)未登録単語特徴量抽出部210が、未登録単語それぞれについて、未登録単語が含まれる関連文書中の文とその前後n個の文(共起窓)の集合に含まれる単語である複数の単語と当該未登録単語との間の共起頻度をベクトル値とする共起頻度ベクトルを生成する(S210)。
(ウ)認識結果特徴量抽出部220が、認識結果記憶部820に記憶された認識結果から、認識結果をm文ごとに分割した発話窓の集合に含まれる単語の生起頻度をベクトル値とする単語頻度ベクトルを生成する(S220)。
(エ)タスク関連度算出部310が、未登録単語それぞれの共起頻度ベクトルと単語頻度ベクトルから、未登録単語それぞれのタスク関連度を算出する。タスク関連度は共起頻度ベクトルと単語頻度ベクトルのコサイン距離から算出され、システム利用者の入力音声の内容と未登録単語との間の意味的な関連の高さを表す(S310)。
(オ)暫定認識辞書登録部130が、認識辞書記憶部730に記憶された認識辞書に、未登録単語記憶部810に記憶された未登録単語を全て追加した暫定認識辞書を生成し、暫定認識辞書記憶部830に記憶させる(S130)。
(カ)暫定音声認識部140が、暫定認識辞書を用いて、入力音声記憶部720に記憶された音声を音声認識した暫定認識結果を生成し、暫定認識結果記憶部840に記憶させる(S140)。
(キ)認識信頼度算出部230が、暫定認識結果を用いて、未登録単語それぞれの認識結果出力の正解らしさを表す指標である認識信頼度と、当該未登録単語の出現回数をもとに、未登録単語それぞれの平均認識信頼度を算出する(S230)。
(ク)登録優先度算出部320が、未登録単語それぞれのタスク関連度と平均認識信頼度を用いて、未登録単語それぞれの登録優先度を算出する。登録優先度は、例えばタスク関連度と平均認識信頼度の重み付き和として算出される(S320)。
(ケ)認識辞書登録部330が、登録優先度が事前に設定された閾値θ以上となる未登録単語を全て選出し(S3301)、選出された未登録単語を追加登録単語確認除外部030に出力する。閾値θは大きくすれば登録すべき未登録単語が選出されなくなるリスクが増加し、小さくすれば不要な未登録単語が選出されてしまうリスクが増加する。θとして通常は0.1程度の値が利用される。追加登録単語確認除外部030は入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。追加登録単語確認除外部030は指定されなかった未登録単語を認識辞書登録部330に出力する(S030)。認識辞書登録部330は追加登録単語確認除外部030から入力された指定されなかった未登録単語を、認識辞書記憶部730に記憶された認識辞書に追加した拡張認識辞書を生成し、拡張認識辞書記憶部900に記憶させる(S3302)。以上のステップS3301、S030、S3302からなる手順全体をステップS330と呼ぶ。
(コ)認識辞書更新部040が、認識辞書記憶部730の内容を拡張認識辞書の内容に更新する(S040)。
以上の手順により認識辞書が更新され、それ以降に音声認識システム利用者が入力した音声は更新後の認識辞書を用いて音声認識部120で音声認識されることになる。更新後の認識辞書には、タスク関連度が高く、かつ認識信頼度が高い(=実際に入力音声において発声されている可能性が高い)単語が新たに登録されているため、更新前よりも高精度に音声認識を行うことができる。
上記の手順(ケ)/(S330)において音声認識システム運用者による未登録単語の確認/除外を行うことにより、明らかに発声されないであろう不要な単語が誤って選出された場合に、当該不要な単語が認識辞書に追加され、認識結果に誤認識として出現してしまう危険性を低減することができる。
なお、本発明では、以下の特許文献1の数式を利用する。
式(1)「手順(イ)共起頻度ベクトルの生成」
式(2)「手順(ウ)単語頻度ベクトルの生成」
式(3)「手順(キ)平均認識信頼度の算出」
式(4)「手順(キ)平均認識信頼度の算出に用いる単語ごとの認識信頼度の算出」
式(5)「手順(ク)登録優先度の算出」
特開2013−171222号公報
特許文献1のような従来技術を用いた音声認識システムを長期間に渡って運用する場合、音声認識システム運用者が単語追加指示を行うのは1度だけではない。システム運用中に新たな関連文書を入手できた場合や、入力される音声中で発声される単語が時間の経過とともに変化してきた場合には、音声認識システム運用者は、そのつど単語追加指示を行って認識辞書を更新し、音声認識精度を維持することになる。
従来技術において音声認識システム運用者が2回目以降に単語追加指示を行った際、1回目に従来技術の手順(ケ)/(S330)において除外した不要な単語が再度追加すべき未登録単語として選出されてしまう場合が多い。単語追加処理では1回目とは別の関連文書と入力音声が使われるものの、未登録単語の選出アルゴリズムは1回目と変わらないためである。そのため、音声認識システム運用者は単語追加指示を行うたびに、毎回毎回同じ不要な単語を除外する作業が発生し、システム運用作業の効率が低下する。2回目に新たに選出されてしまった不要な単語も存在するため、3回目、4回目と単語追加実行を繰り返すたびに不要な単語の除外作業の量は増加する傾向があり、さらなる作業効率の低下を招く。この作業で除外しそこねた不要な単語は拡張認識辞書に登録されてその後も残り続けるため、不要な単語の除外作業には慎重さが求められる。このように音声認識システム運用者は、回を負うごとに増加する不要な単語の除外作業を慎重に行わなければならないため、システム運用コストが増大してしまうという課題があった。
そこで本発明は、運用者の不要な単語の選出作業を抑制することができる音声認識辞書更新装置を提供することを目的とする。
本発明の音声認識辞書更新装置は、認識辞書記憶部と、未登録単語管理部と、登録管理部と、除外単語記憶部と、未登録単語補正部を含む。
認識辞書記憶部は、認識辞書を記憶する。未登録単語管理部は、関連文書を入力とし、運用者の単語追加指示を契機として、関連文書中に出現し、認識辞書に登録されていない単語である未登録単語を抽出して記憶する。登録管理部は、未登録単語を所定の基準で選出して、選出された未登録単語を運用者に提示し、選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、除外単語以外の未登録単語を認識辞書に追加した拡張認識辞書を新たな認識辞書として認識辞書記憶部に記憶された認識辞書を更新する。除外単語記憶部は、除外単語を記憶する。未登録単語補正部は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語のうち、除外単語に一致する単語を削除する。
本発明の音声認識辞書更新装置によれば、運用者の不要な単語の選出作業を抑制することができる。
特許文献1の音声認識辞書更新装置の構成を示すブロック図。 特許文献1の音声認識辞書更新装置の動作を示すフローチャート。 実施例1の音声認識辞書更新装置の構成を示すブロック図。 実施例1の音声認識辞書更新装置の動作を示すフローチャート。 実施例2の音声認識辞書更新装置の構成を示すブロック図。 実施例2の音声認識辞書更新装置の動作を示すフローチャート。 実施例3の音声認識辞書更新装置の構成を示すブロック図。 実施例3の音声認識辞書更新装置の動作を示すフローチャート。 実施例4の音声認識辞書更新装置の構成を示すブロック図。 実施例4の音声認識辞書更新装置の動作を示すフローチャート。 実施例1の変形例の音声認識辞書更新装置の構成を示すブロック図。 実施例1の変形例の音声認識辞書更新装置の動作を示すフローチャート。 実施例2の変形例の音声認識辞書更新装置の構成を示すブロック図。 実施例2の変形例の音声認識辞書更新装置の動作を示すフローチャート。 実施例3の変形例の音声認識辞書更新装置の構成を示すブロック図。 実施例3の変形例の音声認識辞書更新装置の動作を示すフローチャート。 実施例4の変形例の音声認識辞書更新装置の構成を示すブロック図。 実施例4の変形例の音声認識辞書更新装置の動作を示すフローチャート。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下、図3、図4を参照して、本発明の実施例1の音声認識辞書更新装置1について説明する。図3は、本実施例の音声認識辞書更新装置1の構成を示すブロック図である。図4は、本実施例の音声認識辞書更新装置1の動作を示すフローチャートである。
図3に示す通り、特許文献1の音声認識辞書更新装置9(図1)との違いは、特許文献1の音声認識辞書更新装置9における追加登録単語確認除外部030が追加登録単語確認除外保存部050に置き換えられている点、特許文献1の音声認識辞書更新装置9に含まれていない除外単語記憶部060と未登録単語補正部070が追加されている点である。
以下、新規な構成である追加登録単語確認除外保存部050と未登録単語補正部070の動作を図4を参照して説明する。なお図3に示された構成のうち、図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
<追加登録単語確認除外保存部050>
入力:認識辞書登録部330で選出された未登録単語
出力:音声認識システム運用者に指定されなかった未登録単語(認識辞書登録部330へ)、音声認識システム運用者に指定された未登録単語(除外単語記憶部060へ)
処理:追加登録単語確認除外保存部050は、認識辞書登録部330が未登録単語を選出した(S3301)後に、以下の処理を行う。
1)追加登録単語確認除外保存部050は、入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。追加登録単語確認除外部050は指定されなかった未登録単語を認識辞書登録部330に出力する(S030)。
2)追加登録単語確認除外保存部050は、さらに、音声認識システム運用者に指定された未登録単語(除外単語)を除外単語記憶部060に記憶させる(S050)。
<未登録単語補正部070>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:未登録単語補正部070は、未登録単語抽出部110が抽出した未登録単語を未登録単語記憶部810に記憶させた(S110)後に以下の処理(S070)を行う。
1)未登録単語補正部070は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)未登録単語補正部070は、未登録単語のうち、除外単語に一致するものを取り除く。
3)未登録単語補正部070は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順2)で取り除かれる単語はなく、従来技術と同じ出力となる。
以上の処理によって音声認識システム運用者が除外した単語を記憶し、未登録単語の抽出処理の直後に除外単語を取り除くことにより、2回目以降の単語追加実行時に、
*過去に除外した不要な未登録単語が再度選出されなくなる
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が短縮される
*S230で算出される平均認識信頼度の正確性が向上し、結果として拡張認識辞書の質が向上し、音声認識精度の改善効果が大きくなる
という効果が得られる。
以下、図5、図6を参照して、本発明の実施例2の音声認識辞書更新装置2について説明する。図5は、本実施例の音声認識辞書更新装置2の構成を示すブロック図である。図6は、本実施例の音声認識辞書更新装置2の動作を示すフローチャートである。
図5に示す通り、実施例1の音声認識辞書更新装置1との違いは、実施例1における未登録単語補正部070が、本実施例において不要単語推定除去部080に置き換えられている点のみである。実施例1の未登録単語補正部070では過去に音声認識システム運用者によって除外された除外単語と一致する未登録単語のみを取り除いていたが、それに加えて実施例2の不要単語推定除外部080では除外単語から推定した(必ずしも除外単語と一致するとは限らない)不要単語も取り除く。実施例2では実施例1よりも多くの不要単語が取り除かれるため、音声認識システム運用者の不要単語除外作業量の削減効果、単語追加の処理時間削減効果、平均認識信頼度の正確性向上による音声認識精度の改善効果がより大きなものとなる。
以下、新規な構成である不要単語推定除去部080の動作を図6を参照して説明する。なお図5に示された構成のうち、図3や図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
<不要単語推定除去部080>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:不要単語推定除去部080は、未登録単語抽出部110が抽出した未登録単語を、未登録単語記憶部810に記憶させた(S110)後に以下の処理(S080)を行う。
1)不要単語推定除去部080は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)不要単語推定除去部080は、以下のルールで推定除外単語を求める。
(ア)不要単語推定除去部080は、未登録単語のうち、除外単語と一致するものは推定除外単語とする。
(イ)不要単語推定除去部080は、除外単語のうち記号(ひらがな・カタカナ・漢字・アルファベット以外の文字)のみで構成されている記号除外単語を集め、記号除外単語中に現れる全ての記号の集合(除外記号集合)を生成する。未登録単語のうち、除外記号集合に含まれる記号のみで構成されているものは推定除外単語とする。
3)不要単語推定除去部080は、未登録単語のうち、推定除外単語に一致するものを取り除く。
4)不要単語推定除去部080は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※実施例1と同様に、1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順2)で推定除外単語は一つも得られず、従来技術と同じ出力となる。
本技術分野では、関連文書としてWebから収集した文書などが入力されるため、関連文書には思わぬ記号が含まれている場合が多い。
記号には、音声認識システムの利用用途次第で重要な記号と不要な記号が存在する。例えば音楽に関する内容の音声を認識するシステムでは「#」(シャープ)や「♭」(フラット)は重要な記号だが、音楽以外の内容ではこれらの記号は不要な場合が多い。完全に自動で重要な記号と不要な記号を区別することは難しいため、実施例2では利用用途を熟知した音声認識システム運用者が除外した単語を活用することで不要な記号を特定している。例えば上記手順2)のルール(イ)の第1文で不要な記号の特定を行っている。
また、ある記号が不要でも、その記号が特殊な単語の一部として現れているときには重要となる場合もある(例えば認識辞書に「#」は不要だが、プログラミング言語の「C#」は登録したいと音声認識システム運用者が考える場合)。上記手順2)のルール(イ)の第2文では、不要な記号のみから構成される単語を除去している。これによって、「#」を音声認識システム運用者が除外したとき、次回以降の単語追加実行時に「##」は除外記号集合に含まれる記号のみで構成されているため自動的に除去されるが「C#」は除外記号集合に含まれない文字(アルファベットのC)を単語の記述に含むため、除去されずに未登録単語の選出処理に渡されることになり、重要な単語が誤って除去される事態を防いでいる。
手順2)のルール(イ)の追加により、不要単語推定除去部080では実施例1の未登録単語補正部070よりも多くの単語が取り除かれることになり、
*過去に除外した不要な未登録単語が再度選出されなくなるのに加えて、不要な記号のみからなる不要な未登録単語も選出されなくなるので、実施例1より大きく作業効率が改善する
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が実施例1より大きく短縮される
*S230で算出される平均認識信頼度の正確性が実施例1より大きく向上し、結果として音声認識精度の改善効果がより大きくなる
という効果を得られる。
以下、図7、図8を参照して、本発明の実施例3の音声認識辞書更新装置3について説明する。図7は、本実施例の音声認識辞書更新装置3の構成を示すブロック図である。図8は、本実施例の音声認識辞書更新装置3の動作を示すフローチャートである。
図7に示す通り、実施例1または2の音声認識辞書更新装置1、2との違いは、実施例1および2における追加登録単語確認除外保存部050が登録優先度保存部090に置き換えられている点、実施例1および2の音声認識辞書更新装置1、2に含まれない除外登録優先度記憶部091と登録優先度閾値算出部092が追加されている点である。なお、本実施例では、実施例2の構成をベースに上述の変更(050を090に置換、091、092を追加する変更)を加えているが、これに限定されず、実施例1の構成に、同様の変更(050を090に置換、091、092を追加する変更)を加えた構成としてもよい。
認識辞書登録部330は、事前に設定された閾値以上の登録優先度を持つ未登録単語を選出する。本実施例では、音声認識システム運用者が除外した未登録単語それぞれの登録優先度(除外登録優先度)を保存し、次回以降の単語追加実行時には除外登録優先度から算出した閾値を認識辞書登録部330に設定することにより、不要な未登録単語の選出を実施例1または2よりも大きく抑制する。
以下、新規な構成である登録優先度保存部090と登録優先度閾値算出部092の動作を図8を参照して説明する。なお図7に示された構成のうち、図5、図3、図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
<登録優先度保存部090>
入力:認識辞書登録部330で選出された未登録単語
出力:音声認識システム運用者に指定されなかった未登録単語(認識辞書登録部330へ)、音声認識システム運用者に指定された未登録単語(除外単語記憶部060へ)、音声認識システム運用者に指定された未登録単語の登録優先度(除外登録優先度記憶部091へ)
処理:登録優先度保存部090は、認識辞書登録部330が未登録単語を選出した(S3301)後に、以下の処理を行う。
1)登録優先度保存部090は、入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。登録優先度保存部090は、指定されなかった未登録単語を認識辞書登録部330に出力する(従来技術のS030と同じ処理)。
2)登録優先度保存部090は、さらに、音声認識システム運用者に指定された未登録単語(除外単語)を除外単語記憶部060に記憶させるとともに、除外単語の登録優先度を除外登録優先度記憶部091に記憶させる(S090)。このとき、過去の単語追加実行時に記憶されていた除外登録優先度は消去してから、今回の除外登録優先度を記憶させる。除外登録優先度は複数個(音声認識システム運用者によって除外された未登録単語の個数と同じ数)存在し、N_allはその個数を指す。
<登録優先度閾値算出部092>
入力:除外登録優先度記憶部091に記憶されている除外登録優先度
出力:登録優先度閾値(認識辞書登録部330へ)
処理:登録優先度閾値算出部092は、登録優先度算出部320が未登録単語それぞれの登録優先度を算出した(S320)後に、以下の処理を行う。
1)登録優先度閾値算出部092は、認識辞書登録部330に設定されている登録優先度閾値θを取得する。
2)登録優先度閾値算出部092は、除外登録優先度記憶部091に記憶されている除外登録優先度を全て取得する。
3)登録優先度閾値算出部092は、除外登録優先度の個数(N_all)が所定の値Nよりも小さい場合、手順1で取得した登録優先度閾値θをそのまま認識辞書登録部330に設定して処理を終了する。Nは登録優先度閾値の変更判断をするために必要な除外登録優先度の個数を表し、50程度の値が用いられる。
4)登録優先度閾値算出部092は、除外登録優先度の個数がN以上となっている場合、登録優先度閾値θに、登録優先度閾値最大上昇幅Δθを加えたθ+Δθを計算し、除外登録優先度のうち値がθ+Δθ以下となっている低登録優先度の個数(N_small)をカウントする。Δθを大きくすれば登録優先度閾値の上昇量が大きくなって未登録単語が選出されにくくなり、小さくすれば登録優先度の閾値の上昇量が小さくなって不要単語の選出を抑制しにくくなる。Δθには通常0.05〜0.1程度の値が用いられる。
5)登録優先度閾値算出部092は、除外登録優先度の総数(N_all)のうち、低登録優先度の個数(N_small)の割合(N_small / N_all)が所定の値R以上となっている場合、低登録優先度の中での最大の登録優先度を、登録優先度閾値θの更新値として認識辞書登録部330に設定する。N_small / N_allがR未満となっていた場合は、手順1で取得した登録優先度閾値θをそのまま認識辞書登録部330に設定する。Rは、除外登録優先度が閾値付近にどの程度密集している場合に閾値上昇の判断をするかを表すパラメータであり、通常は0.8程度の値が用いられる。
※1回目の実行時には除外登録優先度記憶部091に除外登録優先度が1つも記憶されていないため、上記の手順3でN_allがN以上とならず、登録優先度閾値の変更は行われない。
認識辞書登録部330は登録優先度が閾値θ以上となっている未登録単語を選出する。このとき、登録優先度が閾値θを少しだけ上回る未登録単語は、選出された未登録単語の中では低めの登録優先度を持ち、不要単語である可能性が比較的高い。
音声認識システム運用者が不要単語を除外した時、閾値θを少しだけ上回る未登録単語が数多く除外されていた場合、閾値を上昇させるべきだと考えられる。実施例3はこの考えに基づき、音声認識システム運用者が除外した不要単語の登録優先度(除外登録優先度)を活用して、次回以降の単語追加実行時に不要単語が選出されにくくなるように閾値θを上昇させるかどうかを判断する。
上記の手順3〜5により、以下のように登録優先度閾値が設定される。
*音声認識システム運用者が一定数N以上の未登録単語を除外したとき、
*登録優先度閾値を少しだけ(Δθだけ)上回る未登録単語が数多く(割合R以上)除外されていた場合、
*次回の単語追加実行時に、それら登録優先度閾値θを少しだけ上回る未登録単語を全て除外するように(低登録優先度の最大値に)登録優先度閾値を設定し直す。
実施例3では、以上のように、前回実行時に音声認識システム運用者が閾値付近の未登録単語を数多く除外した場合、それらが再度選出されないように閾値を変更する。これにより、実施例1や2の効果に加えて不要単語の選出を抑制し、音声認識システム運用者の不要単語除外作業をさらに削減することができる。
以下、図9、図10を参照して、本発明の実施例4の音声認識辞書更新装置4について説明する。図9は、本実施例の音声認識辞書更新装置4の構成を示すブロック図である。図10は、本実施例の音声認識辞書更新装置4の動作を示すフローチャートである。
図9に示す通り、実施例1の音声認識辞書更新装置1との違いは、実施例1における未登録単語補正部070が類似未登録単語除外部095に置き換えられている点である。
音声認識システム運用者が過去に除外した不要な単語と文字列として類似した単語は不要である可能性が高い(例えば「PC−9801」が不要な場合は、「PC−8801」や「PC−9801F」も不要と考えられる)。実施例4の音声認識辞書更新装置4は、この考えに基づき、不要な単語の選出を実施例1の音声認識辞書更新装置1よりも大きく抑制する。
実施例1の未登録単語補正部070は、過去に音声認識システム運用者に除外された単語(除外単語)と完全に一致する単語のみを未登録単語から取り除いていたが、実施例4の類似未登録単語除外部095はそれに加えて、除外単語と類似した単語(除外単語と編集距離の近い単語)も未登録単語から取り除く。これにより、不要な未登録単語の選出を実施例1よりも大きく抑制する。
以下、類似未登録単語除外部095の動作を図10を参照して説明する。なお図9に示された構成のうち、図3と同じ参照番号が付与されている構成の動作は前述した実施例1と同じであるから適宜説明を略す。
<類似未登録単語除外部095>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語と同一の単語、および類似する単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:類似未登録単語除外部095は、未登録単語抽出部110が抽出した未登録単語を未登録単語記憶部810に記憶させた(S110)後に以下の処理(S095)を行う。
1)類似未登録単語除外部095は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)類似未登録単語除外部095は、未登録単語それぞれについて、以下の処理を行う。
2−1)類似未登録単語除外部095は、当該未登録単語と除外単語それぞれとの間の編集距離を算出し、それぞれの編集距離を当該未登録単語の文字数で除した正規化編集距離を算出する。編集距離は例えば参考非特許文献1などに開示されている既存の方法で算出する。正規化編集距離は、当該未登録単語を構成する文字列のうち除外単語と異なっている部分がどの程度あるかを表す実数値であり、当該未登録単語が除外単語と完全に一致する場合は0となり、異なる部分が増加するにしたがって値は大きくなる(例えば、4文字の未登録単語と4文字の除外単語があり、一致する文字が1文字もない場合、編集距離=4、正規化編集距離=4÷4=1.0、となる)。
2−2)類似未登録単語除外部095は、正規化編集距離のうち一つでも所定の正規化編集距離閾値τ以下となる場合、当該未登録単語を取り除く。τ=0と設定した場合は除外単語と完全一致する未登録単語のみが取り除かれるため、実施例1と同じ出力となる。通常はτ=0.2程度の値に設定する。τ=0.2と設定すると、例えば5文字の未登録単語のうち4文字以上が除外単語と一致する場合に取り除かれることになる。
3)類似未登録単語除外部095は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順3で取り除かれる単語はなく、従来技術と同じ出力となる。
以上の処理によって音声認識システム運用者が除外した単語(除外単語)を記憶し、未登録単語の抽出処理の直後に除外単語に類似した単語を取り除くことにより、2回目以降の単語追加実行時に、
*過去に除外した不要な未登録単語が再度選出されなくなるのに加えて、過去に除外した未登録単語に類似した不要な未登録単語も選出されなくなるので、実施例1より大きく作業効率が改善する
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が実施例1より大きく短縮される
*S230で算出される平均認識信頼度の正確性が実施例1より大きく向上し、結果として音声認識精度の改善効果がより大きくなる
という効果を得られる。
(参考非特許文献1:Daniel Jurafsky and James H. Martin: “Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition”, Prentice Hall, 2009)
<発明の効果>
本発明によって2回目以降の単語追加実行時に不要な単語の選出が抑制されるため、音声認識システム運用者が除外すべき単語が減少し、運用作業の効率が向上する。結果として、音声認識システム運用中の認識辞書メンテナンスコストが低減される。
さらに本発明では、未登録単語の選出処理の前(従来技術の手順(ア)の直後、手順(イ)の直前のタイミング)に不要な単語の除外を行うため、従来技術での未登録単語それぞれに対して行う処理(手順(イ)の共起頻度ベクトル生成処理、手順(エ)のタスク関連度算出処理、手順(ク)の登録優先度算出処理)にかかる時間が短縮される。加えて、暫定認識辞書からも不要な単語が除外されるため暫定認識辞書のサイズが小さくなり、手順(カ)の暫定認識結果生成処理(暫定認識辞書による音声認識処理)にかかる時間も短縮される。これらの処理時間削減効果により、音声認識システム運用者が単語追加実行指示を行ってから単語追加処理が完了するまで待つ時間が短縮され、2回目以降の単語追加時のさらなる作業効率向上につながる。
さらに、暫定認識辞書から不要な単語が削減されると、手順(キ)で算出される平均認識信頼度の正確性が向上する。特許文献1の段落[0037]に記載されている通り、認識信頼度は、算出される。以下に、特許文献1の段落[0037]を引用する。
<特許文献1の段落[0037]>
認識信頼度の算出方法は既知のいかなる方法も用いることができるが、例えば以下のように算出することができる(より詳しくは、「李, 河原, 鹿野, “2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法”, 情報処理学会研究報告, Vol.2003, No.124, pp.281-286」参照)。音声認識システムは入力音声に対する音響モデルおよび言語モデルの尤度が一番高い単語列を認識結果として出力する。しかし、もし入力音声の発音が曖昧であったり、単語列の繋がりが不自然でない単語が複数あったりしたときには、尤度が同程度の対立候補が多数現れ、音声認識システムが最適な認識結果の識別に困難をきたすことがある。音声認識システムが出力を決定するときに有力な対立候補が多数存在すれば認識信頼度は低くなり、逆に対立候補がほとんど存在しなければ認識信頼度は高くなる。
<特許文献1の段落[0037]終わり>
暫定認識辞書に不要な単語が多いと、それらの単語が暫定音声認識処理中に上記「有力な対立候補」となってしまう可能性が高くなり、本来高い平均認識信頼度が付与されるべき単語の平均認識信頼度が低くなってしまうケースが増加する。暫定認識辞書から不要な単語を事前に削減しておくことで認識信頼度の正確性が向上するため、平均認識信頼度を用いて算出される登録優先度の正確性も向上し、その結果、追加すべき未登録単語がより正確に選出されるようになる。本来追加すべき単語が選出されないケースや追加すべきでない単語が選出されてしまうケースが減少するため、最終的に生成される拡張認識辞書の質が向上し、認識辞書更新後により大きな音声認識精度の向上効果が得られる。
<本発明のポイント>
本発明は、「音声認識システム運用者によって除外された単語は確実に不要単語である」との考えに基づき、2回目以降の単語追加実行時に不要単語が選出されてしまうことを防ぐ。具体的には、従来技術の手順(ケ)において音声認識システム運用者によって除外された不要単語を記憶しておき、2回目以降の単語追加実行時に、従来技術の未登録単語の抽出処理(手順(ア)、S110)の直後のタイミングで不要単語の除外を行う。
このタイミングで不要単語の除外処理を行うことにより、それ以降の様々な処理にかかる時間の削減効果(<発明の効果>の第2段落)および、追加すべき未登録単語の選出の正確性を向上させる効果(<発明の効果>の第3段落)を得る。
[変形例1]
以下、図11、図12を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例1の変形例(変形例1)である音声認識辞書更新装置5について説明する。図11は、本変形例の音声認識辞書更新装置5の構成を示すブロック図である。図12は、本変形例の音声認識辞書更新装置5の動作を示すフローチャートである。
図11に示すように本変形例の音声認識辞書更新装置5は、実施例1に含まれる構成要件を全て過不足なく含んでいる。ただし、関連文書記憶部710と、未登録単語抽出部110と、未登録単語記憶部810は、未登録単語管理部5100に含まれる。また、未登録単語特徴量抽出部210と、入力音声記憶部720と、音声認識部120と、認識結果記憶部820と、認識結果特徴量抽出部220と、タスク関連度算出部310は、タスク関連度管理部5210に含まれる構成である。また、暫定認識辞書登録部130と、暫定認識辞書記憶部830と、暫定音声認識部140と、暫定認識結果記憶部840と、認識信頼度算出部230は、平均認識信頼度管理部5220に含まれる構成である。また、音声認識辞書更新装置5は、タスク関連度管理部5210、平均認識信頼度管理部5220、登録優先度算出部320の三つの構成要件をさらに集約した登録優先度管理部5200を含む。また、認識辞書登録部330と、追加登録単語確認除外保存部050と、認識辞書更新部040と、拡張認識辞書記憶部900は、登録管理部5300に含まれる構成である。本変形例の音声認識辞書更新装置5は、上述の新たな構成要件に加え、認識辞書記憶部730と、除外単語記憶部060と、未登録単語補正部070を含む。本変形例の音声認識辞書更新装置5は実施例1と同じ動作を実行するが、実施例1に存在する各構成要件が、これらを含む新たな構成要件内に集約されているため、各構成要件を集約してなる新たな構成要件の動作について、異なる表現でその動作例を開示するものとする。
前述同様、認識辞書記憶部730は、認識辞書を記憶している。未登録単語管理部5100は、関連文書を入力とし、運用者の単語追加指示を契機として、関連文書中に出現し、認識辞書に登録されていない単語である未登録単語を抽出して記憶する(S5100)。
登録優先度管理部5200は、各未登録単語の登録優先度を算出する(S5200)。より詳細には、タスク関連度管理部5210は、利用者の入力音声を入力とし、利用者の入力音声の内容と未登録単語それぞれとの間の意味的な関連の高さを表すタスク関連度を、未登録単語ごとに算出する(S5210)。平均認識信頼度管理部5220は、認識辞書に未登録単語を追加した暫定認識辞書を用いて、利用者の入力音声を音声認識した結果である暫定認識結果を生成し、暫定認識結果に基づいて各未登録単語の認識結果出力の正解らしさを表す指標の出現回数平均である平均認識信頼度を算出する(S5220)。登録優先度算出部320は、実施例1と同様に、各未登録単語のタスク関連度と平均認識信頼度に基づいて、各未登録単語の登録優先度を算出する。
登録管理部5300は、未登録単語を所定の基準(例えば前述の登録優先度とその閾値)で選出して、選出された未登録単語を運用者に提示し、選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、除外単語以外の未登録単語を認識辞書に追加した拡張認識辞書を新たな認識辞書として認識辞書記憶部730に記憶された認識辞書を更新する(S5300)。除外単語記憶部060は、除外単語を記憶する(S060)。未登録単語補正部070は、運用者の単語追加指示を契機として、未登録単語管理部5100に新たに記憶された未登録単語のうち、除外単語に一致する単語を削除する(S070)。
このように、本変形例の音声認識辞書更新装置5によれば、実施例1の音声認識辞書更新装置1と同様に、運用者の不要な単語の選出作業を抑制することができる。
[変形例2]
以下、図13、図14を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例2の変形例(変形例2)である音声認識辞書更新装置6について説明する。図13は、本変形例の音声認識辞書更新装置6の構成を示すブロック図である。図14は、本変形例の音声認識辞書更新装置6の動作を示すフローチャートである。
図13に示すように本変形例の音声認識辞書更新装置6は、実施例2に含まれる構成要件を全て過不足なく含んでいる。ただし、本変形例の音声認識辞書更新装置6は、変形例1と同様に、実施例2に存在する構成要件を集約した新たな構成要件である、未登録単語管理部5100、登録優先度管理部5200、登録管理部5300を含む。これらの構成は、変形例1と同様であるから説明を略す。本変形例の音声認識辞書更新装置6は、上述の新たな構成要件に加え、認識辞書記憶部730と、除外単語記憶部060と、不要単語推定除去部080を含む。
ステップS5100、S5200、S5300、S060は変形例1と同様に実行される。不要単語推定除去部080は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語のうち、除外単語に一致する単語、および除外単語に類似する単語を削除する(S080)。前述したように、例えば不要単語推定除去部080は、除外単語のうち記号のみで構成されている単語である記号除外単語の集合を除外記号集合として生成し、未登録単語管理部5100に新たに記憶された未登録単語のうち、除外記号集合に含まれる記号のみで構成される未登録単語を削除する(S080)。
このように、本変形例の音声認識辞書更新装置6によれば、実施例2の音声認識辞書更新装置2と同様の効果を得ることが出来る。
[変形例3]
以下、図15、図16を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例3の変形例(変形例3)である音声認識辞書更新装置7について説明する。図15は、本変形例の音声認識辞書更新装置7の構成を示すブロック図である。図16は、本変形例の音声認識辞書更新装置7の動作を示すフローチャートである。
図15に示すように本変形例の音声認識辞書更新装置7は、実施例3に含まれる構成要件を全て過不足なく含んでいる。ただし、本変形例の音声認識辞書更新装置7は、変形例1、2と同様に、実施例3に存在する構成要件を集約した新たな構成要件である、未登録単語管理部5100、登録優先度管理部5200を含む。これらの構成は、変形例1、2と同様であるから説明を略す。また、本変形例の音声認識辞書更新装置7は、上述の構成要件に加え、認識辞書登録部330、認識辞書更新部040、拡張認識辞書記憶部900、登録優先度保存部090、除外登録優先度記憶部091、登録優先度閾値算出部092を集約した登録管理部7300を含む。さらに、本変形例の音声認識辞書更新装置5は、認識辞書記憶部730と、除外単語記憶部060と、不要単語推定除去部080を含む。
ステップS5100、S5200、S060、S080は変形例2と同様に実行される。登録管理部7300は、出力した除外単語の登録優先度に基づいて登録優先度閾値を設定および更新し、登録優先度閾値を前記所定の基準として前記未登録単語を選出する(S7300)。
このように、本変形例の音声認識辞書更新装置7によれば、実施例3の音声認識辞書更新装置3と同様の効果を得ることが出来る。
[変形例4]
以下、図17、図18を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例4の変形例(変形例4)である音声認識辞書更新装置8について説明する。図17は、本変形例の音声認識辞書更新装置8の構成を示すブロック図である。図18は、本変形例の音声認識辞書更新装置8の動作を示すフローチャートである。
図17に示すように本変形例の音声認識辞書更新装置8は、実施例4に含まれる構成要件を全て過不足なく含んでいる。本変形例の音声認識辞書更新装置8は、変形例1の音声認識辞書更新装置5の構成とほとんど同じであるが、変形例1における未登録単語補正部070が、本変形例において類似未登録単語除外部095に変更されている点のみ異なる。
ステップS5100、S5200、S5300、S060は変形例1と同様に実行される。次に、類似未登録単語除外部095は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語を構成する文字列のうち除外単語と異なっている部分の程度を表す値である正規化編集距離を算出し、正規化編集距離に基づいて、新たに記憶された未登録単語を削除する(S095)。
このように、本変形例の音声認識辞書更新装置8によれば、実施例4の音声認識辞書更新装置4と同様の効果を得ることが出来る。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (6)

  1. 除外単語を記憶する除外単語記憶部と、
    認識辞書を記憶する認識辞書記憶部と、
    関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して未登録単語記憶部に記憶する未登録単語管理部と、
    前記未登録単語記憶部に記憶された未登録単語のうち、前記除外単語記憶部に記憶された除外単語に一致する単語、および当該除外単語に類似する単語を削除し、前記未登録単語記憶部の内容を削除されずに残った未登録単語とする不要単語推定除去部と、
    前記不要単語推定除去部により削除されずに残り、前記未登録単語記憶部に記憶された未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を前記除外単語として前記除外単語記憶部に記憶させ、前記運用者指示がなかった未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理部と、
    を含む音声認識辞書更新装置。
  2. 請求項1に記載の音声認識辞書更新装置であって、
    前記不要単語推定除去部が、
    前記除外単語のうち記号のみで構成されている単語である記号除外単語の集合を除外記号集合として生成し、前記未登録単語管理部に新たに記憶された未登録単語のうち、前記除外記号集合に含まれる記号のみで構成される未登録単語を削除する
    音声認識辞書更新装置。
  3. 除外単語を記憶する除外単語記憶部と、
    認識辞書を記憶する認識辞書記憶部と、
    関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して未登録単語記憶部に記憶する未登録単語管理部と、
    前記未登録単語記憶部に記憶された未登録単語を構成する文字列のうち前記除外単語記憶部に記憶された除外単語と異なっている部分の程度を表す値である正規化編集距離を算出し、前記正規化編集距離に基づいて、前記記憶された未登録単語の一部または全部を削除し、前記未登録単語記憶部の内容を削除されずに残った未登録単語とする類似未登録単語除外部と、
    前記類似未登録単語除外部により削除されずに残り、前記未登録単語記憶部に記憶された未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を前記除外単語として前記除外単語記憶部に記憶させ、前記運用者指示がなかった未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理部と、
    を含む音声認識辞書更新装置。
  4. 請求項1から3の何れかに記載の音声認識辞書更新装置であって、
    平均認識信頼度を、前記各未登録単語の認識結果出力の正解らしさを表す指標の出現回数平均であるものとし、
    タスク関連度を、利用者の入力音声の内容と前記未登録単語それぞれとの間の意味的な関連の高さを表すものとし、
    登録優先度を、前記タスク関連度と前記平均認識信頼度に基づく指標であるものとし、
    前記登録管理部が、
    前記出力した除外単語の前記登録優先度に基づいて登録優先度閾値を設定および更新し、前記登録優先度閾値を前記所定の基準として前記未登録単語を選出する
    音声認識辞書更新装置。
  5. 認識辞書を記憶する認識辞書記憶部と、除外単語を記憶する除外単語記憶部と、未登録単語を記憶する未登録単語記憶部を含む音声認識辞書更新装置が実行する音声認識辞書更新方法であって、
    関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して前記未登録単語記憶部に記憶する未登録単語管理ステップと、
    前記未登録単語記憶部に記憶された未登録単語のうち、前記除外単語記憶部に記憶された除外単語に一致する単語、および当該除外単語に類似する単語を削除し、前記未登録単語記憶部の内容を削除されずに残った未登録単語とする不要単語推定除去ステップと、
    前記不要単語推定除去ステップにより削除されずに残り、前記未登録単語記憶部に記憶された未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を前記除外単語として前記除外単語記憶部に記憶させ、前記運用者指示がなかった未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理ステップと、
    を含む音声認識辞書更新方法。
  6. コンピュータを、請求項1から4の何れかに記載の音声認識辞書更新装置として機能させるためのプログラム。
JP2014096577A 2014-05-08 2014-05-08 音声認識辞書更新装置、音声認識辞書更新方法、プログラム Active JP5921601B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014096577A JP5921601B2 (ja) 2014-05-08 2014-05-08 音声認識辞書更新装置、音声認識辞書更新方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014096577A JP5921601B2 (ja) 2014-05-08 2014-05-08 音声認識辞書更新装置、音声認識辞書更新方法、プログラム

Publications (2)

Publication Number Publication Date
JP2015215390A JP2015215390A (ja) 2015-12-03
JP5921601B2 true JP5921601B2 (ja) 2016-05-24

Family

ID=54752352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014096577A Active JP5921601B2 (ja) 2014-05-08 2014-05-08 音声認識辞書更新装置、音声認識辞書更新方法、プログラム

Country Status (1)

Country Link
JP (1) JP5921601B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7192507B2 (ja) * 2019-01-09 2022-12-20 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP7406921B2 (ja) * 2019-03-25 2023-12-28 株式会社Nttデータグループ 情報処理装置、情報処理方法およびプログラム
CN112735428A (zh) * 2020-12-27 2021-04-30 科大讯飞(上海)科技有限公司 一种热词获取方法、语音识别方法及相关设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316376A (ja) * 2002-04-22 2003-11-07 Toshiba Corp 未知語登録装置および未知語登録方法
JP4705023B2 (ja) * 2004-06-10 2011-06-22 パナソニック株式会社 音声認識装置、音声認識方法、及びプログラム
JP5670293B2 (ja) * 2011-11-21 2015-02-18 日本電信電話株式会社 単語追加装置、単語追加方法、およびプログラム
JP5546565B2 (ja) * 2012-02-22 2014-07-09 日本電信電話株式会社 単語追加装置、単語追加方法、およびプログラム
JP5713963B2 (ja) * 2012-06-18 2015-05-07 日本電信電話株式会社 音声認識単語追加装置とその方法とプログラム

Also Published As

Publication number Publication date
JP2015215390A (ja) 2015-12-03

Similar Documents

Publication Publication Date Title
US10460029B2 (en) Reply information recommendation method and apparatus
TWI664540B (zh) Search word error correction method and device, and weighted edit distance calculation method and device
US20160117405A1 (en) Information Processing Method and Apparatus
JP6335898B2 (ja) 製品認識に基づく情報分類
US11366840B2 (en) Log-aided automatic query expansion approach based on topic modeling
WO2015135452A1 (en) Text information processing method and apparatus
US8719025B2 (en) Contextual voice query dilation to improve spoken web searching
WO2017177809A1 (zh) 语言文本的分词方法和系统
CN106445915B (zh) 一种新词发现方法及装置
US10410632B2 (en) Input support apparatus and computer program product
JP6495792B2 (ja) 音声認識装置、音声認識方法、プログラム
KR101944274B1 (ko) 텍스트 기반의 상황 분류 장치 및 방법
CN113053367A (zh) 语音识别方法、语音识别的模型训练方法以及装置
CN113204667B (zh) 音频标注模型的训练与音频标注的方法、装置
CN113935339A (zh) 翻译方法、装置、电子设备及存储介质
JP5921601B2 (ja) 音声認識辞書更新装置、音声認識辞書更新方法、プログラム
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
CN108182173A (zh) 一种提取关键词的方法、装置及电子设备
JP7093292B2 (ja) 対話セッションテキストをセグメンテーションするシステム及び方法
JP5546565B2 (ja) 単語追加装置、単語追加方法、およびプログラム
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN107562715B (zh) 词向量处理方法、装置以及电子设备
JP5670293B2 (ja) 単語追加装置、単語追加方法、およびプログラム
JP6486789B2 (ja) 音声認識装置、音声認識方法、プログラム
CN111444315A (zh) 纠错词组候选项的筛选方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160412

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5921601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150