JPWO2008007688A1

JPWO2008007688A1 - 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法

Info

Publication number: JPWO2008007688A1
Application number: JP2008524811A
Authority: JP
Inventors: 晋也石川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2006-07-13
Filing date: 2007-07-11
Publication date: 2009-12-10
Also published as: US20090204392A1; WO2008007688A1

Abstract

通話端末間における音声認識用辞書を拡充するための簡便な手段を提供する。音声認識辞書の更新支援装置１００は、通話端末２００間の通話内容を音声認識するとともに、該音声認識結果から前記辞書データの提供元の音声認識辞書に含まれる単語を検出する音声認識処理部１０２と、辞書データの提供先となる通話端末２００に対して、前記検出された単語に対応する辞書データを送信する許可単語送信部１０４と、を備える。通話端末２００は、前記受け取った辞書データを登録するか否かをユーザに確認する追加確認部２０２を備え、登録操作が行われた場合にのみ、個人用認識辞書２０１に追加登録する。

Description

（関連出願）本願は、先の日本特許出願２００６−１９３０１１号（２００６年７月１３日出願）の優先権を主張するものであり、前記先の出願の全記載内容は、本書に引用をもって繰込み記載されているものとみなされる。
本発明は、音声認識用の音声認識辞書を内蔵する通話端末、その音声認識辞書の更新支援装置及び更新方法に関する。

音声認識に用いる音声認識辞書（以下、単に「辞書」ともいう。）の収録単語を増やしすぎると、認識処理の遅延やよく似た単語間での認識誤りが起こり、反対に、辞書の収録単語が少ない場合には該辞書に含まれない単語を認識することができず、認識精度が低下してしまうため、すべてのユーザに適用する共有辞書とは別に、個人辞書を持つ音声認識システムが知られている。

例えば、特開２００５−１２８０７６号公報に、通話端末から発せられた音声を音声認識し、テキスト化して返す音声認識システムが開示されている。同公報の音声認識システムでは、すべての通話端末で共有する共有辞書の他に、ユーザ単位で汎用的でない語彙、文章を登録する個人辞書を備える構成が開示されている。また、この音声認識システムでは、通話端末から、語彙と読みを送信して、辞書データを追加することが可能となっている。

また、特開２００４−０７２２７４号公報には、複数台の子機を有する親子電話機において、子機毎にカスタマイズ可能なユーザ辞書（読み付け用／認識用）を備え、入出力先となる子機のユーザ辞書を適用して音声処理（読み上げ、音声認識）を行う構成が開示されている。また、この親子電話機では、親機に子機毎に登録されているユーザ辞書の辞書データの使用を他の子機又は親機に許可するために、指定された辞書データ（同公報では「音声コマンド」）をコピーする機能を備えることが提案されている。

特開２００５−１２８０７６号公報特開２００４−０７２２７４号公報

以上の特許文献１、２の開示事項は、本書に引用をもって繰り込み記載されているものとする。以下の分析は本発明により与えられる。

上記した各文献にも記載されているとおり、音声認識において良好な認識結果を得るためには、発話者毎に最適化された音声認識辞書を用意することが望ましい。しかしながら、音声認識辞書の収録データを簡便に増やす手段が無いのが実情である。例えば、特許文献１には、各個人が新規辞書データを登録する例（特許文献１の図２、図４参照）が示されているが、語彙と対応する読みを逐一入力するという煩雑な操作が必要となっている。

特許文献２に記載の方法によれば、ある子機のユーザ辞書を他の電話機に使用許可することが可能となっているが、当該許可により強制的に他のユーザ辞書が書き換えられてしまうという問題点がある。このような方法は、利用者が限られた親子電話機であるからこそ許容できるものであって、不特定の利用者によって使用される通話端末間では受け入れることができない。

また、特許文献２に記載の方法では、使用許可する辞書データを特定する手間があり、少数のコマンドではなく多くの単語を含む辞書を有する通話端末には向いていないという別の問題点もある。

本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、辞書データを簡便に選択し、他の通話端末に提供することが可能であり、しかも辞書が強制的に書き換えられてしまうことの無いシステム及び通話端末を提供することにある。

本発明の第１の視点によれば、ユーザ毎にカスタマイズ可能な音声認識辞書の更新支援装置であって、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の通話端末の音声認識辞書に含まれる単語を検出する音声認識処理部と、辞書データの提供先となる通話端末の了解を得た上で、該提供先通話端末の音声認識辞書に前記検出された単語に対応する辞書データを登録する辞書データ登録部と、を備え、任意の単語を音声入力することにより任意の通話端末に対して辞書データを提供可能とする音声認識辞書の更新支援装置が提供される。

本発明の第２の視点によれば、音声認識機能を有する通話端末に保持された音声認識辞書の更新支援装置であって、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の通話端末の音声認識辞書に含まれる単語を検出する音声認識処理部と、辞書データの提供先となる通話端末に対して、前記検出された単語に対応する辞書データを送信する辞書データ送信部と、を備え、任意の単語を音声入力することにより任意の通話端末に対して辞書データを送信することを可能とする音声認識辞書の更新支援装置及び該更新支援装置を介して辞書データを送受信可能な通話端末が提供される。

本発明の第３の視点によれば、入力音声を音声認識する機能と、前記音声認識に用いる辞書データの送信機能とを備えた通話端末であって、自機の音声認識辞書を用いて入力音声を音声認識するとともに、該音声認識結果から前記自機の音声認識辞書に含まれる単語を検出する音声認識処理部と、他の通話端末に対して、前記検出された単語に対応する辞書データを送信する辞書データ送信部と、前記辞書データを受信した際に、自機の音声認識辞書に追加するか否かを確認した上で登録する追加確認部と、を備え、音声入力された任意の単語に対応する辞書データを、任意の通話端末と送受信する通話端末が提供される。

本発明の第４の視点によれば、音声認識機能を有する通話端末毎に用意された（即ち、ユーザ毎にカスタマイズ可能な）音声認識辞書の更新方法であって、音声認識辞書の更新支援装置が、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の音声認識辞書に含まれる単語を検出するステップと、前記音声認識辞書の更新支援装置が、辞書データの提供先となる通話端末に対して、該通話端末の音声認識辞書に前記検出された辞書データを追加して良いか否かを確認するステップと、前記音声認識辞書の更新支援装置が、前記確認結果に従って、前記提供先通話端末の音声認識辞書に、前記検出された単語に対応する辞書データを登録するステップと、を含む音声認識辞書の更新方法が提供される。

本発明の第５の視点によれば、音声認識機能を有する通話端末に保持された音声認識辞書の更新方法であって、音声認識辞書の更新支援装置が、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の音声認識辞書に含まれる単語を検出するステップと、前記音声認識辞書の更新支援装置が、辞書データの提供先となる通話端末に対して、前記検出された単語に対応する辞書データを送信するステップと、前記辞書データを受信した通話端末が、ユーザの操作に従って、自機の音声認識辞書に、前記辞書データを追加するステップと、を含む音声認識辞書の更新方法が提供される。

本発明の第６の視点によれば、音声認識機能を有する通話端末に保持された音声認識辞書の更新方法であって、一の通話端末が、自機の音声認識辞書を用いて入力音声を音声認識するとともに、該音声認識結果から前記自機の音声認識辞書に含まれる単語を検出するステップと、前記一の通話端末が、他の通話端末に対して、前記検出された単語に対応する辞書データを送信するステップと、前記他の通話端末が、ユーザの操作に従って、自機の音声認識辞書に、前記辞書データを追加するステップと、を含む音声認識辞書の更新方法が提供される。

本発明によれば、他の通話端末に渡したい単語を発声するだけで、通話端末の辞書データを選択し、他の通話端末に分け与えることが可能となる。また、本発明によれば、辞書データを送信するのみであるので、受取側の通話端末の音声認識辞書が強制的に書き換えられてしまうことも無い。

本発明の第１の実施例のシステム構成を表した図である。本発明の第１の実施例の音声認識辞書の更新支援装置側で行われる動作を表したフローチャートである。本発明の第１の実施例の携帯電話端末（通話端末）側で行われる動作を表したフローチャートである。本発明の効果を具体的に説明するための参考図である。本発明の第２の実施例のシステム構成を表した図である。本発明の第３の実施例に係る携帯電話端末（通話端末）の構成を表した図である。

続いて、本発明を実施するための最良の形態について、図面を参照して詳細に説明する。

［第１の実施例］
図１は、本発明の第１の実施例のシステム構成を表した図である。図１を参照すると、複数の携帯電話端末（通話端末）２００と、携帯電話端末２００間の通話を中継する電話局内に配置された音声認識辞書の更新支援装置１００とが示されている。

音声認識辞書の更新支援装置１００は、すべての携帯電話端末２００の通話音声の認識処理に用いる共有認識辞書（共有音声認識辞書）１０１と、通話音声の認識処理を行う音声認識処理部１０２と、通話中に発話されることによって検出された他者への配布許可がなされた各携帯電話端末２００の個人用認識辞書（ユーザ辞書）２０１内の単語を一時記憶する許可単語一時記憶部１０３と、通話終了時に許可単語一時記憶部１０３に保存されていた単語を携帯電話端末２００に送信する許可単語送信部（辞書データ送信部）１０４と、を備えて構成される。

音声認識処理部１０２は、携帯電話端末２００間での通話開始と同時に、通話を行う携帯電話端末２００から個人用認識辞書２０１を受信する。音声認識処理部１０２は、前記各携帯電話端末２００から受信した個人用認識辞書２０１と、共有認識辞書１０１を参照し、各携帯電話端末２００間の通話音声の認識処理を行う。

音声認識処理部１０２は、前記通話音声の認識処理の結果、いずれかの携帯電話端末２００から受信した個人用認識辞書２０１に登録されていた単語を検知すると、その単語を許可単語一時記憶部１０３に記録する。

そして、いずれかの携帯電話端末２００で通話が終了すると、許可単語送信部（辞書データ送信部）１０４はその時点で許可単語一時記憶部１０３に保存されている単語（辞書データ）を、前記通話を終了した携帯電話端末２００に対して送信する。

携帯電話端末２００は、カスタマイズ可能な個人用認識辞書２０１と、所定の辞書データ提供モードで通話要求が行われた際に個人用認識辞書２０１を音声認識辞書の更新支援装置１００に送信する制御部（図示省略）と、前記音声認識辞書の更新支援装置１００の許可単語送信部１０４から渡される単語を個人用認識辞書２０１に加えるか否かをユーザに確認した上で、前記個人用認識辞書２０１への登録を行う追加確認部２０２と、を備えて構成される。

続いて、本実施例の動作について図面を参照して詳細に説明する。図２は、通話開始とともに音声認識辞書の更新支援装置１００側で行われる動作を表したフローチャートである。図３は、通話終了後に携帯電話端末（通話端末）２００側で行われる動作を表したフローチャートである。以下、図２、図３の順に、本実施例の動作を説明する。

図２に示すとおり、通話開始と同時に、携帯電話端末２００から、各個人用認識辞書２０１が、音声認識辞書の更新支援装置１００の音声認識処理部１０２へ送信される（ステップＳ１０１）。例えば、図１のように、３台の携帯電話端末２００間で三者通話を行う場合は３つの個人用認識辞書２０１が音声認識処理部１０２にセットされることになる。

続いて、音声認識処理部１０２は、各携帯電話端末２００から受け取った個人用認識辞書２０１の内容と、共有認識辞書１０１を用いて、携帯電話端末２００からの発話に応じて随時音声認識を行う（ステップＳ１０２）。

ここで、音声認識処理部１０２は、この音声認識処理の間、随時認識結果を確認し、いずれかの携帯電話端末２００の個人用認識辞書２０１に含まれる単語が音声認識されたことを確認すると（ステップＳ１０３のＹＥＳ）、その単語を許可単語一時記憶部１０３に記録する（ステップＳ１０４）。

通話に参加していた携帯電話端末２００のひとつが通話を終了すると（ステップＳ１０５のＹＥＳ）、許可単語送信部１０４は、その時点で許可単語一時記憶部１０３に記録されたすべての単語を当該通話を終了した携帯電話端末２００に送信する（ステップＳ１０６）。

すべての携帯電話端末２００が通話を終了すると（ステップＳ１０７のＹＥＳ）、図２のステップＳ１０６の単語（辞書データ）の送信動作を行った後、許可単語一時記憶部１０３の内容は消去される（ステップＳ１０８）。

音声認識辞書の更新支援装置１００は、すべての携帯電話端末２００の通話が終了するまで、上記処理を繰り返し実行し、通話内容から、各携帯電話端末２００の個人用認識辞書２０１に登録された単語を検出し、許可単語一時記憶部１０３に記録する動作を繰り返す（ステップＳ１０７のＮＯ）。

一方、携帯電話端末２００において通話の終了を行うと、図３に示すとおり、携帯電話端末２００は、音声認識辞書の更新支援装置１００から送信された単語を受信する（ステップＳ２０１；図２のステップＳ１０６）。

前記単語を受信した携帯電話端末２００は、追加確認部２０２を起動し、前記受信した単語を、個々にあるいは数個まとめてその表示部に表示し、個人用認識辞書２０１に追加するか否かを、ユーザに問い合わせる（ステップＳ２０２）。

ここで、ユーザにより所定の登録操作が行われた場合（ステップＳ２０３のＹＥＳ）、追加確認部２０２は、前記登録操作が行われた単語を個人用認識辞書２０１に追加登録する（ステップＳ２０４）。

音声認識辞書の更新支援装置１００から受信した単語で、登録するか否かを未確認の単語が無くなるまで、追加確認部２０２は、上記ステップＳ２０２からＳ２０４の動作を繰り返す（ステップＳ２０５）。

以上のように、本実施例に係る音声認識辞書の更新支援装置１００によれば、個々人の携帯電話端末２００内に含まれる個人用認識辞書２０１中に含まれる単語を、通話中にその単語に言及するだけで、通話相手の携帯電話端末２００へ送信することが可能となっている。

一般に、通話中に任意の単語が用いられるということは、直接的ではないにしても、同時に、その単語の用例や意味の説明が行われているに等しい。従って、本実施例に係る音声認識辞書の更新支援装置１００によれば、通常の言語コミュニケーションを行ううちに自然に、単語（辞書データ）を受け取る側にとってその単語（辞書データ）が有用かどうかの情報も伝達される。

また、本実施例に係る携帯電話端末（通話端末）２００によれば、上記単語（辞書データ）の有用性に関する情報が得られるだけでなく、単語（辞書データ）が必要がどうかを判断してから、個人用認識辞書２０１に登録することが可能となっている。

また、一般に、音声認識辞書の収録単語数を増やし過ぎると、ユーザにとってなじみの無い単語が誤認識結果として現れる不都合があり、収録単語を厳選することが重要であるが、上記のとおり、本実施例に係る携帯電話端末（通話端末）２００によれば、無用の単語（辞書データ）が登録されることは無いため、認識精度の劣化を抑止することが可能となっている。

なお、上記した実施例では、終話した携帯電話端末（通話端末）２００に対して、検出した単語のすべてを送信するものとして説明したが、音声認識辞書の更新支援装置１００側で、当該携帯電話端末（通話端末）２００の個人用認識辞書２０１にすでに登録されているか否かの重複チェックを行うこととしてもよい。また、或いは、携帯電話端末（通話端末）２００の追加確認部２０２で、個人用認識辞書２０１にすでに登録されているかを確認してから、ユーザに登録するか否かを問うものとすることも可能である。

続いて、本発明の具体の動作例を示して、本発明の効果をより端的に説明する。図４は、２台の携帯電話端末（通話端末）を用いて２者間（ユーザＡ、ユーザＢ）で通話を行い、単語（辞書データ）の追加を行った例を示している。

図４の最上段に示す通話前の状態において、携帯電話端末２００Ａ、携帯電話端末２００Ｂは、それぞれ異なる単語を個人用認識辞書２０１Ａ、２０１Ｂに保持している。ユーザＡは国際的なスポーツイベントに関心があり、その携帯電話端末２００Ａの個人用認識辞書２０１Ａには、「ＷＢＣ」（＝ＷｏｒｌｄＢａｓｅｂａｌｌＣｌａｓｓｉｃ）、「トリノオリンピック」等といったキーワードが登録されている。一方、ユーザＢは大相撲に関心があり、その携帯電話端末２００Ｂの個人用認識辞書２０１Ｂには、「朝青龍」、「白鳳」といった力士名が登録されている。

図４の上から２段目に示すように、音声認識辞書の更新支援装置１００を経由して、通話中にそれぞれが興味を持つ内容に言及することで、通話終了時には次段に示すように、それぞれ相手が言及した単語を個人用認識辞書２０１Ａ、２０１Ｂに登録するか否かの確認メッセージが表示される。

例えば、ユーザＡは、ユーザＢとの会話により新たに力士「白鳳」に関心を持ち、今後自分が話題に挙げる可能性があると考え、個人用音声認識辞書２０１Ａに追加することを選んでいる。これにより、携帯電話端末２００Ａで、その後「白鳳」を含む音声を入力し音声認識を行った場合、キーワード「白鳳」を含む個人用認識辞書２０１Ａが参照され、的確に音声認識させることが可能となる。

一方、ユーザＢは、ユーザＡとの会話中に出てきたキーワードに関心を持たなかったので今後自分が話題に挙げる可能性は無いと考え、個人用音声認識辞書２０１Ｂに追加することを拒んでいる。これにより、携帯電話端末２００Ｂで、その後「ＷＢＣ」と誤認識されやすい単語を音声入力した場合であっても、個人用認識辞書２０１Ｂにはキーワード「ＷＢＣ」が登録されていないため、「ＷＢＣ」と誤認識されることを抑止できる。

以上の例にも示すように、本発明によれば、自然な通話を通して、音声認識辞書に追加する単語（辞書データ）を判別することが可能となり、各ユーザの音声認識辞書を、それぞれの嗜好に合った単語のみを収録した状態に保持することが可能となっている。

［第２の実施例］
続いて、上記第１の実施例に変更を加えた本発明の第２の実施例について説明する。

図５は、本発明の第２の実施例のシステム構成を表した図である。図５を参照すると、許可単語送信部１０４に代えて、許可単語登録部（辞書データ登録部）１０５を備えている点と、個人用認識辞書１０６（図１の２０１）が音声認識辞書の更新支援装置１００側に配置されている点の２点で、第１の実施例と相違している。

本実施例の動作も上記第１の実施例と略同様であり、音声認識処理部１０２が、共通認識辞書１０１及び個人用認識辞書１０６を参照して、音声認識を行う（図２のステップＳ１０２参照）。但し、本実施例においては、音声認識辞書の更新支援装置１００側に個人用認識辞書１０６があるため、第１の実施例のような個人用認識辞書の送信は不要となる。

音声認識処理部１０２は、この音声認識処理の間、随時認識結果を確認し、いずれかの携帯電話端末２００の個人用認識辞書１０６に含まれる単語が音声認識されたことを確認すると（図２のステップＳ１０３のＹＥＳ参照）、その単語を許可単語一時記憶部１０３に記録する（図２のステップＳ１０４参照）。

そして、通話に参加していた携帯電話端末２００のひとつが通話を終了すると（図２のステップＳ１０５のＹＥＳ）、許可単語登録部（辞書データ登録部）１０５は、その時点で許可単語一時記憶部１０３に記録された単語を個人用認識辞書に登録するか否かを、当該通話を終了した携帯電話端末２００に確認する。

ここで、肯定応答が得られたならば、許可単語登録部（辞書データ登録部）１０５は、当該携帯電話端末２００の個人用認識辞書１０６に、前記確認が得られた単語（辞書データ）を登録する。反対に、否定応答であれば、許可単語登録部（辞書データ登録部）１０５は、当該単語（辞書データ）の登録は行わない。

すべての携帯電話端末２００が通話を終了すると（図２のステップＳ１０７のＹＥＳ参照）、前記辞書データの確認と登録動作を行った後、許可単語一時記憶部１０３の内容が消去される点は、上記第１の実施例と同様である。

本実施例の構成によっても上記第１の実施例と同様に、各ユーザの音声認識辞書の収録データを簡便に豊富化することが可能となる。

［第３の実施例］
続いて、上記音声認識辞書の更新支援装置１００を用いず、携帯電話端末２００のみで上記単語（辞書データ）の提供・交換を実現する本発明の第３の実施例について説明する。

図６は、本発明の第３の実施例に係る携帯電話端末の構成を表した図である。図６を参照すると、上記第１の実施例で説明した個人用認識辞書２１１、追加確認部２１２に加え、共有認識辞書（共有音声認識辞書）２２１、音声認識処理部２２２、許可単語一時記憶部２２３、許可単語送信部（辞書データ送信部）２２４を備えた携帯電話端末（通話端末）２１０が示されている。

上記共有認識辞書（共有音声認識辞書）２２１、音声認識処理部２２２、許可単語一時記憶部２２３、許可単語送信部（辞書データ送信部）２２４は、それぞれ、上記第１の実施例の音声認識辞書の更新支援装置１００の共有認識辞書（共有音声認識辞書）１０１、音声認識処理部１０２、許可単語一時記憶部１０３と、許可単語送信部１０４に相当する。

共有認識辞書２２１は、携帯電話出荷時等に書き込まれる辞書であり、基本的に携帯電話端末２１０の機種が同一であれば同内容である。

音声認識処理部２２２は、所定の辞書データ提供モードが選択された状態での通話時において共有認識辞書２２１と個人用認識辞書２１１とを用いて、携帯電話端末２１０のレシーバ等から入力されるユーザの音声を認識する。また、音声認識処理部２２２は、前記音声認識の結果、自機の個人用認識辞書２１１に登録されていた単語を検知すると、その単語を許可単語一時記憶部２２３に記録する。

また、本実施例では、音声認識辞書の更新支援装置１００を経由しないため、携帯電話端末２１０にそれぞれ備えられた許可単語送信部２２４が、適宜指定する携帯電話端末２１０に対して、許可単語一時記憶部２２３に保存されている単語（辞書データ）を送信する構成となっている。単語（辞書データ）の送信方法は、相手の携帯電話端末を特定できれば足り、携帯電話網を経由して送信しても良いし、あるいは、近距離無線通信や赤外線通信を用いて送信することとしても良い。

追加確認部２１２は、上記第１の実施例と同様に、許可単語送信部２２４より送信された単語（辞書データ）を個人用認識辞書２１１に登録するか否かの確認を行い、必要な場合のみ個人用認識辞書２１１に追加登録する。

本実施例も、上記第１の実施例と同様の動作にて、発話された内容に含まれる個人用認識辞書２１１の収録単語を、携帯電話端末２１０に送信することが可能となっている。

以上、本発明を実施するための好適な形態を説明したが、音声入力により送信すべき辞書データを特定し、他の通話端末に対して送信するという本発明の要旨を逸脱しない範囲で、各種の変形を加えることが可能であることはいうまでもない。例えば、上記した各実施例では、共有認識辞書と、個人用認識辞書とをそれぞれ持つ構成を例示して説明したが、本発明の原理に鑑みれば、斯かる構成のみならず、辞書データを追加可能な音声認識辞書を有する通信機器全般に適用可能である。

また例えば、上記した各実施例では、個人用認識辞書、共通認識辞書には、音声認識に使用する単語のみが記録されているものとして説明したが、収録単語を含んだフレーズ（句）、文といった使用例（コーパス）も収録した辞書を用いることも好ましい。これにより、音声認識における、認識率を向上させることができる。また、前記各辞書には、各収録単語の単独出現頻度、単独出現確率(ユニグラム確率)や、その単語を含む単語系列の出現回数、出現確率(n-gram確率)といった統計情報を含めることもできる。

この場合、これらの使用例も、辞書データとして送受信し、相手の通話端末の音声認識辞書に登録できるようにすることも可能である。例えば、通話相手から新たな単語を紹介され、その単語を個人用認識辞書に登録する操作をしたとき、その単語の使用例文、フレーズも受け取ることができ、より高精度な音声認識を実現することが可能となる。同様に、その単語に関する上記の統計情報もやり取りし、統計言語モデルに反映すれば、更に高精度な音声認識を実現することが可能となる。

また上記した各実施例では、通話端末として携帯電話端末を用いた例を挙げて説明したが、本発明は、その他構内電話や家庭内の親子電話機にも同様に適用可能である。

その他本発明の全開示（請求の範囲を含む）の枠内において、その基本的技術思想に基づいて、更なる変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。

また、本発明の更なる課題・目的及び展開形態は、本発明の請求の範囲を含む全開示事項からも明らかにされる。

Claims

ユーザ毎にカスタマイズ可能な音声認識辞書の更新支援装置であって、
辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の通話端末の音声認識辞書に含まれる単語を検出する音声認識処理部と、
辞書データの提供先となる通話端末からの了解を得た上で、該提供先通話端末の音声認識辞書に前記検出された単語に対応する辞書データを登録する辞書データ登録部と、を備え、
任意の単語を音声入力することにより任意の通話端末に対して辞書データを提供可能とする音声認識辞書の更新支援装置。
音声認識機能を有する通話端末に保持された音声認識辞書の更新支援装置であって、
辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の通話端末の音声認識辞書に含まれる単語を検出する音声認識処理部と、
辞書データの提供先となる通話端末に対して、前記検出された単語に対応する辞書データを送信する辞書データ送信部と、を備え、
任意の単語を音声入力することにより任意の通話端末に対して辞書データを提供可能とする音声認識辞書の更新支援装置。
前記音声認識処理部は、辞書データの提供先及び提供先の各通話端末間の通話内容を音声認識し、前記辞書データの提供元の通話端末の音声認識辞書に含まれる単語を検出すること、
を特徴とする請求項１又は２に記載の音声認識辞書の更新支援装置。
前記辞書データとは別に、前記音声認識処理部が、前記辞書データの提供先の通話端末に対して、音声認識結果を送信すること、
を特徴とする請求項１乃至３いずれか一に記載の音声認識辞書の更新支援装置。
前記音声認識辞書には、単語の使用例となる文又は句も保持されており、
前記音声認識処理部は、前記使用例も参照して音声認識を行い、
前記辞書データ登録部は、前記使用例を含んだ辞書データを登録すること、
を特徴とする請求項１、３、４いずれか一に記載の音声認識辞書の更新支援装置。
前記音声認識辞書には、単語の使用例となる文又は句も保持されており、
前記音声認識処理部は、前記使用例も参照して音声認識を行い、
前記辞書データ送信部は、前記使用例を含んだ辞書データを送信すること、
を特徴とする請求項２乃至４いずれか一に記載の音声認識辞書の更新支援装置。
複数の通話端末間の通話を中継する網側装置に組み込まれ、
前記音声認識処理部は、複数の通話端末より受信した音声認識辞書を用いて、前記複数の通話端末間の通話内容をテキスト化して前記各通話端末に送信するとともに、前記各音声認識辞書に含まれる単語を検出し、
前記辞書データ登録部は、前記通話を終了した端末の音声認識辞書に、前記検出した単語に対応する辞書データを登録すること、
を特徴とする請求項１、３、４、５いずれか一に記載の音声認識辞書の更新支援装置。
複数の通話端末間の通話を中継する網側装置に組み込まれ、
前記音声認識処理部は、複数の通話端末より受信した音声認識辞書を用いて、前記複数の通話端末間の通話内容をテキスト化して前記各通話端末に送信するとともに、前記各音声認識辞書に含まれる単語を検出し、
前記辞書データ送信部は、前記通話を終了した端末に対して、前記検出した単語に対応する辞書データを送信すること、
を特徴とする請求項２乃至４、６いずれか一に記載の音声認識辞書の更新支援装置。
請求項２乃至４、６、８いずれか一に記載の音声認識辞書の更新支援装置に対して、自機の音声認識辞書を送信するとともに、任意の単語を音声入力することにより、任意の通話端末に対して辞書データを送信することを可能とする通話端末。
請求項２乃至４、６、８いずれか一に記載の音声認識辞書の更新支援装置から、前記辞書データを受信した際に、自機の音声認識辞書に追加するか否かを確認した上で登録する追加確認部を備えたこと、
を特徴とする通話端末。
入力音声を音声認識する機能と、前記音声認識に用いる辞書データの送信機能とを備えた通話端末であって、
自機の音声認識辞書を用いて入力音声を音声認識するとともに、該音声認識結果から前記自機の音声認識辞書に含まれる単語を検出する音声認識処理部と、
他の通話端末に対して、前記検出された単語に対応する辞書データを送信する辞書データ送信部と、
前記辞書データを受信した際に、自機の音声認識辞書に追加するか否かを確認した上で登録する追加確認部と、を備え、
音声入力された任意の単語に対応する辞書データを、任意の通話端末と送受信可能としたこと、を特徴とする通話端末。
前記辞書データとは別に、前記音声認識処理部が、前記他の通話端末に対して、音声認識結果を送信すること、
を特徴とする請求項１１に記載の通話端末。
前記音声認識辞書には、単語の使用例となる文又は句も保持されており、
前記音声認識処理部は、前記使用例も参照して音声認識を行い、
前記辞書データ送信部は、前記使用例を含んだ辞書データを送信すること、
を特徴とする請求項１１又は１２に記載の通話端末。
ユーザ毎にカスタマイズ可能な音声認識辞書の更新方法であって、
音声認識辞書の更新支援装置が、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の音声認識辞書に含まれる単語を検出するステップと、
前記音声認識辞書の更新支援装置が、辞書データの提供先となる通話端末に対して、該通話端末の音声認識辞書に前記検出された辞書データを追加して良いか否かを確認するステップと、
前記音声認識辞書の更新支援装置が、前記確認結果に従って、前記提供先通話端末の音声認識辞書に、前記検出された単語に対応する辞書データを登録するステップと、を含むこと、
を特徴とする音声認識辞書の更新方法。
音声認識機能を有する通話端末に保持された音声認識辞書の更新方法であって、
音声認識辞書の更新支援装置が、辞書データの提供元の通話端末の音声認識辞書を用いて、前記辞書データの提供元の通話端末から発せられた音声を音声認識するとともに、該音声認識結果から前記辞書データの提供元の音声認識辞書に含まれる単語を検出するステップと、
前記音声認識辞書の更新支援装置が、辞書データの提供先となる通話端末に対して、前記検出された単語に対応する辞書データを送信するステップと、
前記辞書データを受信した通話端末が、ユーザの操作に従って、自機の音声認識辞書に、前記辞書データを追加するステップと、を含むこと、
を特徴とする音声認識辞書の更新方法。
音声認識機能を有する通話端末に保持された音声認識辞書の更新方法であって、
一の通話端末が、自機の音声認識辞書を用いて入力音声を音声認識するとともに、該音声認識結果から前記自機の音声認識辞書に含まれる単語を検出するステップと、
前記一の通話端末が、他の通話端末に対して、前記検出された単語に対応する辞書データを送信するステップと、
前記他の通話端末が、ユーザの操作に従って、自機の音声認識辞書に、前記辞書データを追加するステップと、を含むこと、
を特徴とする音声認識辞書の更新方法。