JP6107003B2 - 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム - Google Patents

辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム Download PDF

Info

Publication number
JP6107003B2
JP6107003B2 JP2012195303A JP2012195303A JP6107003B2 JP 6107003 B2 JP6107003 B2 JP 6107003B2 JP 2012195303 A JP2012195303 A JP 2012195303A JP 2012195303 A JP2012195303 A JP 2012195303A JP 6107003 B2 JP6107003 B2 JP 6107003B2
Authority
JP
Japan
Prior art keywords
dictionary
user
weight
unit
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012195303A
Other languages
English (en)
Other versions
JP2014052427A (ja
Inventor
敬子 稲垣
敬子 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012195303A priority Critical patent/JP6107003B2/ja
Publication of JP2014052427A publication Critical patent/JP2014052427A/ja
Application granted granted Critical
Publication of JP6107003B2 publication Critical patent/JP6107003B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声認識システム等において認識対象とされる単語を記憶した辞書を更新する技術に関する。
一般に、音声認識システムは、認識対象とする単語を記憶した辞書を用いて認識処理を行う。このような音声認識システムは、用意された単語をあらかじめ辞書に登録しておく。例えば、辞書には、その音声認識システムが導入される環境での利用シーンにあった単語があらかじめ登録される。このような音声認識システムは、辞書に登録されていない単語を認識することができず、他の単語として認識してしまう。そこで、このような音声認識システムは、ユーザ辞書登録機能を有しているものが多い。ユーザ辞書登録機能は、専門用語等のように利用者に特化した単語や、あらかじめ辞書に登録されていても認識されにくい単語等を、あとから辞書に追加して登録する機能である。ユーザは、認識対象としたい単語を、ユーザ辞書登録機能を使って辞書に追加登録する。
しかし、辞書に単語を無条件に登録すると、同じ読みを含む単語や、類似する読みを持つ単語の区別が難しくなり、認識精度が落ちる原因になるという問題がある。また、ユーザ辞書登録機能を用いた追加登録の作業は、ユーザにとって大きな負担となる。また、そのために、ユーザ辞書登録機能が十分に活用されないという問題もある。したがって、音声認識の精度向上のためには、話題にあった辞書をユーザに負担をかけずに効率よく作成することが重要となる。
例えば、特許文献1には、認識対象として追加登録したい単語と、既に登録されている単語との類似度を判定し、類似度が閾値以上の場合には、辞書に追加するか否かをユーザに選択させる技術が記載されている。また、この関連技術は、追加登録することを選択したユーザIDとともに単語を辞書に登録し、音声認識を利用するユーザIDに対応づけられた単語から、認識処理の結果を選択する。これにより、この関連技術は、あるユーザによって登録された単語による他のユーザの認識精度の低下を防止している。また、この関連技術は、認識精度の低下を招く重複単語の登録を防止するようユーザの作業を支援している。
また、特許文献2には、認識対象の単語が記憶された辞書から認識処理の結果を選択する際に、音声認識システムの周囲にいるユーザのグループに基づいて、選択する単語の優先順位を調整する技術が記載されている。この関連技術は、ユーザのグループ毎に、そのグループによってよく利用される単語を登録したカスタマイズ辞書を作成しておく。そして、この関連技術は、音声認識システムの周囲にいるユーザのグループを特定し、特定したグループのカスタマイズ辞書に基づいて、選択する単語の優先順位を調整する。
特開2000−259172号公報 特開2008−089825号公報
しかしながら、特許文献1に記載されたものは、認識精度を上げるためには、依然としてユーザによる単語の追加登録作業が必要であり、ユーザの負担を充分に軽減できていない。
また、特許文献2に記載されたものは、音声認識システムの周囲にいるユーザのグループを特定し、特定したグループでよく利用される単語が認識されやすいようにする。このため、この関連技術は、例えば、オフィスや家庭などで音声認識システムが利用される場合のように、音声認識システムの周囲に、認識させたい音声の内容に関連するユーザが過不足なく存在する場合に有効である。ところが、例えば、医師と患者との会話を音声認識システムで電子化する場合などのように、音声認識システムの周囲に、会話の内容に関連の薄い利用者(他の医師や他の患者等)がいる場合がある。また、ある患者についての医師同士の会話を音声認識システムで電子化する場合などのように、音声認識システムの周囲に、会話の内容に関連する利用者(患者等)がいない場合もある。このような場合、この関連技術は、音声の内容に適した単語の認識精度を向上できない場合がある。
本発明は、上述の課題を解決するためになされたもので、利用者による単語の追加登録作業を不要としながら、システムの周囲にいる利用者の構成にかかわらず、話題にあった単語の認識精度をより確実に向上させる技術を提供することを目的とする。
本発明の辞書更新装置は、利用者により記録された情報を含む文書を表す利用者文書データを取得する利用者文書取得部と、前記利用者文書データのうち前記利用者により記録された情報の部分からキーワードを抽出するキーワード抽出部と、単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する重み付け変更部と、を備える。
また、本発明の音声認識システムは、前記辞書更新装置と、周囲の音声を取得する音声取得部と、前記辞書部と、前記音声取得部によって取得された音声に対する音声認識処理を行うことにより、認識処理結果の単語を前記辞書部から前記重みに基づいて選択する音声認識処理部と、を備える。
また、本発明の辞書更新方法は、利用者により記録された情報を含む文書を表す利用者文書データを取得し、前記利用者文書データのうち前記利用者により記録された情報の部分からキーワードを抽出し、単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する。
また、本発明の音声認識方法は、周囲から音声を取得し、取得した音声に対する音声認識処理を行う際に、認識処理結果の単語を、前記辞書更新方法によって更新された前記辞書部から前記重みに基づいて選択する。
また、本発明のコンピュータ・プログラムは、利用者により記録された情報を含む文書を表す利用者文書データを取得する利用者文書取得ステップと、前記利用者文書データのうち前記利用者により記録された情報の部分からキーワードを抽出するキーワード抽出ステップと、単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する重み付け変更ステップと、をコンピュータ装置に実行させる。
本発明は、利用者による単語の追加登録作業を不要としながら、システムの周囲にいる利用者の構成にかかわらず、話題にあった単語の認識精度をより確実に向上させる技術を提供することができる。
本発明の第1の実施の形態としての辞書更新装置の機能ブロック図である。 本発明の第1の実施の形態としての辞書更新装置の動作を説明するフローチャートである。 本発明の第2の実施の形態としての音声認識システムの機能ブロック図である。 本発明の第2の実施の形態における辞書に記憶される情報の一例を説明する図である。 本発明の第2の実施の形態としての音声認識システムの動作の概略を説明するフローチャートである。 本発明の第2の実施の形態としての辞書更新装置の動作を説明するフローチャートである。 (a)は、本発明の第2の実施の形態において検索される類似語の一例を説明する図であり、(b)は、関連語の一例を説明する図である。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態としての辞書更新装置10の機能ブロック構成を図1に示す。
図1において、辞書更新装置10は、利用者文書取得部11と、キーワード抽出部12と、重み付け変更部13とを含み、辞書部21に接続されている。
ここで、辞書更新装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、ROM(Read Only Memory)と、ハードディスク等の記憶装置と、スキャナやカメラ等の読取装置と、辞書部21に接続するための周辺装置接続インタフェースとを備えたコンピュータ装置によって構成可能である。この場合、利用者文書取得部11は、読取装置と、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUとによって構成される。また、キーワード抽出部12は、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUによって構成される。また、重み付け変更部13は、周辺装置接続インタフェースと、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUとによって構成される。なお、辞書更新装置10およびその各機能ブロックを構成するハードウェア構成は、上述の構成に限定されない。
辞書部21は、単語およびその重みを表す情報を記憶している。辞書部21は、例えば、音声認識システムによって用いられる。その場合、音声認識システムは、認識対象の音声データを処理することにより、音声データの認識結果を、辞書部21に記憶された単語の中から選択する。このとき、そのような音声認識システムは、候補となる複数の単語があれば、単語の重みに基づいて認識結果の単語を選択する。なお、辞書部21は、辞書更新装置10を構成するコンピュータ装置と同一のコンピュータ装置に含まれる記憶装置によって構成されていてもよい。あるいは、辞書部21は、辞書更新装置10を構成するコンピュータ装置とは異なるコンピュータ装置やストレージ装置によって構成されていてもよい。また、その場合、辞書部21は、上述の周辺装置接続インタフェースを介して辞書更新装置10に接続されていてもよいし、インターネット、LAN(Local Area Network)、SAN(Storage Area Network)、公衆回線網、無線通信網またはこれらの組合せ等によって構成されるネットワークを介して辞書更新装置10に接続されていてもよい。
利用者文書取得部11は、利用者により記録された情報を含む文書を表す利用者文書データを取得する。利用者により記録された情報を含む文書とは、例えば、所定の項目が印刷された用紙上に利用者により手書き記入された情報を含む紙媒体であってもよい。その場合、利用者文書取得部11は、紙媒体に記録された内容を表す利用者文書データを、スキャナやカメラ等の読取装置を用いて画像データとして取得する。あるいは、利用者文書データは、コンピュータ装置の入力装置を介して利用者により入力された情報を含むデジタルデータであってもよい。その場合、利用者文書取得部11は、記憶装置に記憶された利用者文書データや、ネットワークを介して取得可能な利用者文書データを取得してもよい。
キーワード抽出部12は、利用者文書データのうち利用者により記録された情報の部分からキーワードを抽出する。
もし、利用者文書データが紙媒体に記録された内容を表す画像データであれば、キーワード抽出部12は、OCR(Optical Character Recognition)等の技術を用いてキーワードの抽出を行ってもよい。その場合、具体的には、キーワード抽出部12は、画像データにおいて紙媒体を表す領域のうち、利用者により手書き記入されることが想定される部分領域の位置をあらかじめ記憶しておいてもよい。そして、キーワード抽出部12は、手書き記入が想定される部分領域をOCRによりテキスト情報に変換してから、変換したテキスト情報からキーワードを抽出すればよい。
あるいは、利用者文書データがデジタルデータであれば、キーワード抽出部12は、そのような利用者文書データのうち、利用者により入力される情報の部分の位置をあらかじめ記憶しておくことにより、その範囲を特定してもよい。あるいは、キーワード抽出部12は、そのような利用者文書データのうち、所定の文字列に挟まれる範囲等を、利用者により入力される情報の部分として特定してもよい。そして、キーワード抽出部12は、利用者により入力された情報の範囲から、キーワードを抽出すればよい。
また、キーワード抽出部12は、利用者により記録された情報の部分にテキスト情報が含まれれば、テキスト情報に対して形態素解析を行い、さらに自立語を抽出することにより、キーワードを抽出してもよい。
重み付け変更部13は、辞書部21に記憶された単語のうち、キーワード抽出部12によって抽出されたキーワードに基づく単語を検索する。例えば、重み付け変更部13は、キーワードそのものを辞書部21から検索してもよい。そして、重み付け変更部13は、検索した単語の重みを変更する。例えば、重み付け変更部13は、検索した単語の重みを、それまでの値より高くなるように、所定の比率や所定の増分だけ変更してもよい。
以上のように構成された辞書更新装置10の動作について、図2を参照して説明する。なお、辞書部21には、既に単語およびその重みが記憶されているものとする。
まず、利用者文書取得部11は、利用者により記録された情報を含む利用者文書データを取得する(ステップS1)。例えば、前述のように、利用者により記録された情報を含む文書が紙媒体であれば、利用者文書取得部11は、スキャナやカメラ等の読取装置を用いて画像データとしての利用者文書データを取得すればよい。
次に、キーワード抽出部12は、ステップS1で取得された利用者文書データのうち利用者により記録された情報の部分から、キーワードを抽出する(ステップS2)。例えば、利用者文書データが紙媒体の内容を表す画像データであれば、キーワード抽出部12は、利用者により記録された情報の領域を、OCR技術等を用いてテキスト情報に変換し、形態素解析を行うことにより、自立語をキーワードとして抽出してもよい。
次に、重み付け変更部13は、辞書部21から、キーワードに基づく単語を検索する。そして、重み付け変更部13は、検索した単語の重みを変更し、辞書部21を更新する(ステップS3)。例えば、前述のように、重み付け変更部13は、キーワードそのものに相当する単語を辞書部21から検索してもよい。そして、重み付け変更部13は、その単語の重みを所定比率や所定増分だけ、それまでより高くなるように変更してもよい。
以上で、辞書更新装置10は動作を終了する。
次に、本発明の第1の実施の形態の効果について述べる。
本発明の第1の実施の形態としての辞書更新装置は、利用者による単語の追加登録作業を不要としながら、システムの周囲にいる利用者の構成にかかわらず、話題にあった単語の認識精度をより確実に向上させる辞書を作成することができる。
その理由は、利用者文書取得部が、利用者により記録された情報を含む利用者文書データを取得し、キーワード抽出部が、利用者文書データのうち利用者により記録された情報の部分からキーワードを抽出し、重み付け変更部が、辞書に記憶された単語のうちキーワードに基づく単語の重みを変更するからである。
これにより、本発明の第1の実施の形態としての辞書更新装置によって更新された辞書では、システムの周囲にいる利用者構成にかかわらず、利用者により記録された情報に含まれるキーワードの重みが変更される。したがって、本実施の形態は、このような辞書を用いて認識処理を行うシステム(例えば、音声認識システム)において、利用者により記録された情報を含む文書を元に行われる会話等の音声認識精度をより向上させることができる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。本実施の形態では、本発明の辞書更新装置を搭載した本発明の音声認識システムについて説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第2の実施の形態としての音声認識システム2の機能ブロック構成を、図3に示す。
図3において、音声認識システム2は、辞書更新装置20と、辞書部21と、音声取得部24と、音声認識処理部25とを備える。ここで、音声認識システム2は、CPUと、RAMと、ROMと、ハードディスク等の記憶装置と、読取装置と、マイク等の音声入力装置とを備えたコンピュータ装置によって構成可能である。この場合、辞書部21は、記憶装置によって構成される。また、音声取得部24は、音声入力装置と、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUとによって構成される。また、音声認識処理部25は、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUによって構成される。また、辞書更新装置20は、読取装置と、ROMまたは記憶装置に記憶されたコンピュータ・プログラムおよび各種データをRAMに読み込んで実行するCPUとによって構成される。なお、音声認識システム2およびその各機能ブロックを構成するハードウェア構成は、上述の構成に限定されない。
辞書部21は、音声認識の対象となる単語およびその重みを記憶している。辞書部21に格納される情報の一例を図4に示す。図4において、辞書部21は、各単語について、該単語を表す情報と、その重みを表す情報とを対応付けて記憶している。この他、辞書部21は、品詞や読みの情報など、音声認識処理部25の処理に必要な各種情報を含んでいてもよい。本実施の形態では、辞書部21に記憶される単語は、重みの値が大きいほど、音声認識処理部25によって選択されやすくなるものとする。
音声取得部24は、周囲の音声を音声データとして取得する。
音声認識処理部25は、音声取得部24によって取得された音声データに対する音声認識処理を行うことにより、認識結果の単語を、辞書部21から重みに基づいて選択する。本実施の形態では、音声認識処理部25は、音声認識処理を行うことにより、辞書部21に格納された単語のうち複数の候補となる単語を得た場合、そのうち最も重みの値の大きい単語を認識結果として選択するものとする。なお、音声認識処理部25には、認識結果の単語を辞書から選択する公知の音声認識技術を適用可能である。
次に、辞書更新装置20の機能ブロックについて説明する。辞書更新装置20は、本発明の第1の実施の形態としての辞書更新装置10に対して、キーワード抽出部12に替えてキーワード抽出部22と、重み付け変更部13に替えて重み付け変更部23とを備える点が異なる。
キーワード抽出部22は、雛形文書データおよび利用者文書データの差分から、キーワードを抽出する。雛形文書データとは、利用者により情報が記録される文書の雛形となる文書を表すデータである。
例えば、利用者により情報が記録される文書は、所定の項目が印刷された紙媒体のカルテ(雛形)に、医師により手書き記入される文書であってもよい。また、利用者により情報が記録される文書は、所定の項目が印刷された紙媒体の問診票(雛形)に、患者により手書き記入される文書であってもよい。このような場合、雛形文書データとは、未記入のカルテや問診票が、カメラやスキャナ等の読取装置により電子化された画像データであってもよい。
このような場合、キーワード抽出部22は、雛形文書データの画像データおよび利用者文書データの画像データの差分を求めてもよい。そして、キーワード抽出部22は、差分情報をOCR等によりテキスト情報に変換し、テキスト情報からキーワードを抽出すればよい。
なお、雛形文書データは、紙媒体が読取装置により電子化された画像データに限らない。例えば、雛形文書データは、所定の項目に対する入力欄を含むデジタルデータであってもよい。この場合、利用者文書データは、雛形文書データに対して利用者により入力された情報が付加された情報となる。この場合、キーワード抽出部22は、あらかじめ記憶しておいた雛形文書データおよび利用者文書データの差分となるテキスト情報を求めればよい。そして、キーワード抽出部22は、差分のテキスト情報からキーワードを抽出すればよい。
また、キーワード抽出部22は、キーワードに類似する単語を検索してもよい。例えば、キーワード抽出部22は、類似語データベースを用いて、キーワードに類似する単語の検索を行ってもよい。その場合、キーワード抽出部22は、記憶装置にあらかじめ記憶された類似語データベース(図示せず)を参照してもよい。あるいは、キーワード抽出部22は、ネットワークや周辺装置接続インタフェースを介して接続された外部の類似語データベースや類似語検索サービスに接続することにより、キーワードの類似語を検索してもよい。
また、キーワード抽出部22は、キーワードに関連する単語を検索してもよい。例えば、キーワード抽出部22は、関連語データベースを用いて、キーワードに関連する単語の検索を行ってもよい。その場合、キーワード抽出部22は、記憶装置にあらかじめ記憶された関連語データベース(図示せず)を参照してもよい。あるいは、キーワード抽出部22は、ネットワークや周辺装置接続インタフェースを介して接続された外部の関連語データベースや関連語検索サービスに接続することにより、キーワードの関連語を検索してもよい。
重み付け変更部23は、本発明の第1の実施の形態における重み付け変更部13と同様に、辞書部21に記憶された単語のうち、キーワード抽出部22によって抽出されたキーワードに相当する単語の重みを変更する。さらに、重み付け変更部23は、キーワード抽出部22によってキーワードの類似語が検索されている場合、辞書部21に記憶された単語のうち、類似語に相当する単語の重みを変更する。また、重み付け変更部23は、キーワード抽出部22によってキーワードの関連語が検索されている場合、辞書部21に記憶された単語のうち、関連語に相当する単語の重みを変更する。
以上のように構成された音声認識システム2の動作について、図面を参照して説明する。
まず、音声認識システム2の動作の概略を図5に示す。
図5において、まず、辞書更新装置20は、利用者文書データに基づいて辞書部21に記憶された単語の重みを更新する(ステップS11)。このステップの詳細については後述する。
次に、音声取得部24は、周囲の音声を表す音声データを取得する(ステップS12)。
次に、音声認識処理部25は、音声データに対して音声認識処理を行うことにより、認識結果の単語を、辞書部21に記憶された単語からそれらの重みに基づいて選択し出力する(ステップS13)。
以上で、音声認識システム2は、動作を終了する。なお、音声認識システム2は、必ずしもステップS11に続いてステップS12を行う必要はない。ステップS11の処理は、ステップS12〜S13の処理とは非同期に実行可能である。ただし、ステップS11の処理は、ステップS12〜S13の処理の事前に行われていることが望ましい。
次に、ステップS11における辞書更新装置20の動作の詳細を図6に示す。なお、辞書更新装置20は、雛形文書データをあらかじめ記憶しているものとする。
図6において、まず、利用者文書取得部11は、利用者により記録された情報を含む利用者文書データを取得する(ステップS21)。この文書は、雛形となる文書に対して利用者によって情報が追加された文書であるものとする。
次に、キーワード抽出部22は、ステップS21で取得された利用者文書データと、雛形文書データとの差分から、キーワードを抽出する(ステップS22)。
次に、キーワード抽出部22は、ステップS22で抽出したキーワードの類似語および関連語を検索する(ステップS23)。
次に、重み付け変更部23は、辞書部21から、キーワード、類似語および関連語にそれぞれ相当する単語を検索する。そして、重み付け変更部23は、検索した単語の重みを変更し、辞書部21を更新する(ステップS24)。
以上で、ステップS11における辞書更新装置20の動作の説明を終了する。
次に、ステップS11における辞書更新装置20の動作の具体例について、図7を参照して説明する。
ここでは、ステップS22において、キーワード抽出部22が、利用者文書データと雛形文書データとの差分から、キーワード「風邪」を抽出したことを想定する。
この場合、キーワード抽出部22は、「風邪」に対する類似語の一例として、図7(a)に示す「感冒」「流感」「風邪ひき」を検索する。また、キーワード抽出部22は、「風邪」に対する関連語の一例として、図7(b)に示す「発熱」「頭痛」「悪寒」を検索する(ステップS23)。
すると、重み付け変更部23は、辞書部21から、「風邪」、「感冒」、「流感」、「風邪ひき」、「発熱」、「頭痛」、「悪寒」の各語を検索し、その重みを変更する(ステップS24)。
以上で、辞書更新装置20の動作の具体例の説明を終了する。
なお、本実施の形態において、重み付け変更部23は、キーワード抽出部22によって抽出されたキーワードの重みと、キーワード抽出部22によって検索された類似語や関連語の重みとを変更するものとして説明した。この他、重み付け変更部23は、あらかじめ辞書部21に含まれる類似語情報や関連語情報に基づいて、キーワードの類似語や関連語の重みを変更してもよい。例えば、辞書部21が、各単語に関して、重みを表す情報に加えて、類似語や関連語を対応付けて記憶している場合がある。この場合、キーワード抽出部22は、類似語や関連語の検索を行わなくてもよい。この場合、重み付け変更部23は、キーワード抽出部22によって抽出されたキーワードに相当する単語を辞書部21から検索し、検索した単語の重みを変更するとともに、その単語に対応付けられた類似語や関連語の重みを変更すればよい。
また、本実施の形態において、重み付け変更部23は、キーワード抽出部22によって抽出されたキーワードの類似語および関連語の双方の重みを変更する例を中心に説明したが、重み付け変更部23は、類似語および関連語のいずれかの重みを変更するだけでもよい。この場合、キーワード抽出部22は、キーワードの類似語の検索を実行し、関連語の検索を実行しなくてもよい。あるいは、キーワード抽出部22は、キーワードの関連語の検索を実行し、類似語の検索を実行しなくてもよい。
次に、本発明の第2の実施の形態の効果について述べる。
本発明の第2の実施の形態としての辞書更新装置は、利用者による単語の追加登録作業を不要としながら、システムの周囲にいる利用者の構成にかかわらず、話題にあった単語の認識精度をさらに向上させる辞書を作成することができる。
その理由は、利用者文書取得部が、利用者により記録された情報を含む利用者文書データを取得し、キーワード抽出部が、利用者文書データのうち利用者により記録された情報の部分からキーワードを抽出し、重み付け変更部が、辞書に記憶された単語のうち、キーワードやその類似語、関連語に相当する単語の重みを変更するからである。
これにより、本発明の第2の実施の形態として辞書更新装置によって更新された辞書では、システムの周囲にいる利用者構成にかかわらず、利用者により記録された情報に含まれるキーワードに加えて、その類似語や関連語の重みが変更される。
したがって、本発明の第2の実施の形態としての音声認識システムは、このような辞書を用いて認識処理を行うことにより、利用者により記録された情報を含む文書に基づいて行われる会話等において、利用者により記録された情報に含まれるキーワードだけでなく、その類似語や関連語の認識精度をさらに向上させることができる。このように、本実施の形態としての音声認識システムは、音声認識の対象となる会話を開始する前に、会話の当事者によって記録される文書がある場合に有効である。例えば、本実施の形態としての音声認識システムは、医師と患者との会話を音声認識の対象とする際に、問診票やカルテ等を用いて辞書を更新することにより、患者固有の辞書を作成することができ、会話の認識精度を向上させることが可能となる。
なお、上述した本発明の各実施の形態において、辞書更新装置は、音声認識システムで用いられる辞書を更新するものとして説明した。その他、各実施の形態としての辞書更新装置は、その他のシステムによって用いられる辞書であって、単語をその重みとともに記憶した辞書を更新する用途にも適用可能である。
また、上述した本発明の各実施の形態において、キーワード抽出部は、利用者文書データに含まれるテキスト情報や、利用者文書データから変換されたテキスト情報から、キーワードを抽出する例を中心に説明した。この他、各実施の形態のキーワード抽出部は、テキスト情報に限らず、静止画、動画、音声等の各種データおよびその組み合わせから、関連するキーワードを抽出してもよい。例えば、キーワード抽出部は、インターネット上の情報を検索して解析することにより、そのような各種データに関連するキーワードを抽出することも可能である。
また、上述した本発明の各実施の形態において、重み付け変更部は、キーワードに基づく単語を辞書部から検索し、検索した単語の重みを変更するものとして説明した。加えて、重み付け変更部は、キーワードに基づく単語が辞書部に登録されていなかった場合、該当する単語を重みとともに辞書に追加登録するようにしてもよい。その場合、重み付け変更部は、キーワードに基づく単語の重みを、標準的な重みより高い値に設定して登録するようにする。
また、上述した本発明の各実施の形態において、重み付け変更部は、利用者文書データに関連する利用者毎に、各単語の重みを変更してもよい。例えば、重み付け変更部は、各単語について、利用者IDに対応付けて重みを記憶するよう辞書部を更新してもよい。あるいは、重み付け変更部は、利用者毎に辞書部をコピーした利用者辞書を作成し、利用者文書データに関連する利用者の利用者辞書において、該当する単語の重みを変更してもよい。このような場合、利用者文書取得部が、利用者文書データと共に利用者IDを取得すればよい。このように構成することにより、各実施の形態は、例えば、医師と患者の会話を音声認識して記録する際や、電子カルテへの入力インタフェースとして音声認識が適用される際に用いられる辞書として、患者の問診票やカルテに基づく患者固有の辞書を作成可能となる。
また、上述した本発明の各実施の形態において、音声認識システムおよび辞書更新装置の各機能ブロックが、1つのコンピュータ装置によって構成される例を中心に説明したが、各実施の形態は、これらの機能ブロックが分散されて配置された複数のコンピュータ装置によって構成されていてもよい。その場合、それらの複数のコンピュータ装置は、インターネット、LAN、SAN、公衆回線網、無線通信網またはこれらの組合せ等によって構成されるネットワークを介して通信可能に接続されていればよい。
また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した辞書更新装置の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置(記憶媒体)に記憶しておき、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
また、本発明は、上述した各実施の形態に限定されず、様々な態様で実施されることが可能である。
10、20 辞書更新装置
11 利用者文書取得部
12、22 キーワード抽出部
13、23 重み付け変更部
2 音声認識システム
21 辞書部
24 音声取得部
25 音声認識処理部

Claims (9)

  1. 雛形となる文書に対して利用者により情報が追加された文書を表す利用者文書データを取得する利用者文書取得部と、
    前記雛形となる文書を表す雛形文書データおよび前記利用者文書データの差分に基づいて、前記利用者により追加された情報からキーワードを抽出するキーワード抽出部と、
    単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する重み付け変更部と、
    を備えた辞書更新装置。
  2. 前記重み付け変更部は、前記辞書部に含まれる単語のうち、前記キーワードに相当する単語の前記重みを変更することを特徴とする請求項1に記載の辞書更新装置。
  3. 前記重み付け変更部は、前記辞書部に含まれる単語のうち、前記キーワードに類似する単語の前記重みを変更することを特徴とする請求項1または請求項2に記載の辞書更新装置。
  4. 前記重み付け変更部は、前記辞書部に含まれる単語のうち、前記キーワードに関連する単語の前記重みを変更することを特徴とする請求項1から請求項3のいずれか1項に記載の辞書更新装置。
  5. 前記重み付け変更部は、前記利用者文書データに関連する利用者毎に、前記重みを変更することを特徴とする請求項1から請求項4のいずれか1項に記載の辞書更新装置。
  6. 請求項1から請求項5のいずれか1項に記載の辞書更新装置と、
    周囲の音声を取得する音声取得部と、
    前記辞書部と、
    前記音声取得部によって取得された音声に対する音声認識処理を行うことにより、認識処理結果の単語を前記辞書部から前記重みに基づいて選択する音声認識処理部と、
    を備えた音声認識システム。
  7. コンピュータ装置が、
    雛形となる文書に対して利用者により情報が追加された文書を表す利用者文書データを取得し、
    前記雛形となる文書を表す雛形文書データおよび前記利用者文書データの差分に基づいて、前記利用者により追加された情報からキーワードを抽出し、
    単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する、辞書更新方法。
  8. コンピュータ装置が、
    請求項7に記載の辞書更新方法を実行し、
    周囲から音声を取得し、
    取得した音声に対する音声認識処理を行う際に、認識処理結果の単語を前記辞書部から前記重みに基づいて選択する、音声認識方法。
  9. 雛形となる文書に対して利用者により情報が追加された文書を表す利用者文書データを取得する利用者文書取得ステップと、
    前記雛形となる文書を表す雛形文書データおよび前記利用者文書データの差分に基づいて、前記利用者により追加された情報からキーワードを抽出するキーワード抽出ステップと、
    単語およびその重みを表す情報が記憶された辞書部に含まれる単語のうち、前記キーワードに基づく単語の前記重みを変更する重み付け変更ステップと、
    をコンピュータ装置に実行させるコンピュータ・プログラム。
JP2012195303A 2012-09-05 2012-09-05 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム Active JP6107003B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012195303A JP6107003B2 (ja) 2012-09-05 2012-09-05 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012195303A JP6107003B2 (ja) 2012-09-05 2012-09-05 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2014052427A JP2014052427A (ja) 2014-03-20
JP6107003B2 true JP6107003B2 (ja) 2017-04-05

Family

ID=50610981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012195303A Active JP6107003B2 (ja) 2012-09-05 2012-09-05 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP6107003B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106486114A (zh) * 2015-08-28 2017-03-08 株式会社东芝 改进语言模型的方法和装置以及语音识别方法和装置
JP6790003B2 (ja) * 2018-02-05 2020-11-25 株式会社東芝 編集支援装置、編集支援方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075582A (ja) * 2007-08-29 2009-04-09 Advanced Media Inc 端末装置、言語モデル作成装置、および分散型音声認識システム

Also Published As

Publication number Publication date
JP2014052427A (ja) 2014-03-20

Similar Documents

Publication Publication Date Title
US11314370B2 (en) Method for extracting salient dialog usage from live data
US8577882B2 (en) Method and system for searching multilingual documents
JP6440732B2 (ja) 機械学習に基づく自動タスク分類
US9087049B2 (en) System and method for context translation of natural language
JP5671557B2 (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
US8161059B2 (en) Method and apparatus for collecting entity aliases
US8983962B2 (en) Question and answer data editing device, question and answer data editing method and question answer data editing program
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN109299227B (zh) 基于语音识别的信息查询方法和装置
US20140348400A1 (en) Computer-readable recording medium storing program for character input
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
JP2018045001A (ja) 音声認識システム、情報処理装置、プログラム、音声認識方法
KR20150041592A (ko) 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
CN113051384B (zh) 基于对话的用户画像抽取方法及相关装置
JP6107003B2 (ja) 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
KR101440887B1 (ko) 영상 및 음성 정보를 이용한 명함 인식 방법 및 장치
KR101134615B1 (ko) 사용자 적응형 이미지 관리 시스템 및 사용자 적응형 이미지 관리 방법
KR101800975B1 (ko) 필기체가 인식되어 생성된 전자문서의 공유 방법 및 그 장치
JP6640519B2 (ja) 情報分析装置及び情報分析方法
JP2018112806A (ja) 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム
JP5971794B2 (ja) 特許調査支援装置、特許調査支援方法、およびプログラム
JP6902764B1 (ja) メタデータ抽出プログラム
JP2009217367A (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170220

R150 Certificate of patent or registration of utility model

Ref document number: 6107003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150