JP2000259653A

JP2000259653A - 音声認識装置及び音声認識方法

Info

Publication number: JP2000259653A
Application number: JP11062300A
Authority: JP
Inventors: Tomohiro Iwasaki; 知弘岩▲さき▼
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1999-03-09
Filing date: 1999-03-09
Publication date: 2000-09-22

Abstract

(57)【要約】【課題】ユーザが書名等の検索時に発声する可能性が
低い付属語が始まる部分単語列（例えば、“ノエホ
ン”）もキーワードとして音声認識辞書に登録されるた
めキーワードの個数が増加し、音声認識処理に長時間を
要するなどの課題があった。【解決手段】単語の形態素を参照して図書データベー
スに登録された書名を示す文字列から、付属語から始ま
らない部分単語列を抽出して、その部分単語列をキーワ
ードとする音声認識辞書を作成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声信号を入力
して図書情報等を検索する音声認識装置及び音声認識方
法に関するものである。

【０００２】

【従来の技術】従来から大規模なデータベースに対して
は、容易に内容を検索できる検索システムが必要とされ
ている。そのため、キーボードやタッチパネルなど備え
た利用者検索端末から特定のキーワードを用いてデータ
ベースを検索し、その検索結果を表示、あるいは、音声
で利用者に通知するシステムが存在する。

【０００３】これらの文字を入力するデバイスに加え
て、特開平６−３３２４９３号公報には、音声認識技術
を用いて音声により旅行情報などのデータベースを検索
する音声検索システムが提案されている。一方、特開昭
６３−３０１３２５号公報に記述されているように、図
書館において図書情報がデータベース化されており、書
名、著者名などのキーワードを用いて文字入力によりデ
ータベースを検索するシステムが提案されている。ここ
では、音声認識技術を用いて図書館に格納されている図
書を検索する図書検索システムを一例として説明する。

【０００４】図１３は従来の音声認識装置を示す構成図
であり、図において、１は図書データベース（書名、副
書名、叢書名、副叢書名、一般件名、著者名などが含ま
れる）を管理するデータベース管理部、２は図書データ
ベースに登録された文字列（例えば、書名を示す文字
列）から部分単語列を抽出するキーワード抽出部、３は
キーワード抽出部２により抽出された部分単語列をキー
ワードとする音声認識辞書を作成する音声認識辞書作成
部、４は音声認識辞書作成部３により作成された音声認
識辞書を記憶する音声認識辞書記憶部である。

【０００５】５は外部から音声信号が入力されると、音
声認識辞書に登録された部分単語列と音声信号を照合し
て、その音声信号に対応する部分単語列を検索する音声
認識部、６は図書データベースから音声認識部５により
検索された部分単語列に対応する文字列を検索するデー
タベース検索部、７はデータベース検索部６により検索
された文字列を通知する検索結果通知部である。

【０００６】次に動作について説明する。図書データベ
ースには、予め、書名、副書名、叢書名、副叢書名、一
般件名、著者名などが登録されているが、例えば、図書
データベースの登録データを更新する場合には、音声認
識辞書も更新する必要がある。ここでは、説明の便宜
上、書名を例として説明する。

【０００７】データベース管理部１が図書データベース
に格納されている書名を更新すると、キーワード抽出部
２は、図書データベースに格納された書名を示す文字列
から部分単語列を抽出する。具体的には、書名は、図１
４に示すように、図書データベースにおいて、書名の読
み方が単語別に分かれて記憶されているので（“／”に
より単語が区切られている）、単語を１単位として、書
名の部分単語列を抽出する。

【０００８】図１５は“ピーターラビットの絵本”から
抽出された部分単語列を示すが、この例では書名を示す
文字列が４個の単語から構成されるので、合計１０個の
部分単語列が抽出される。なお、キーワード抽出部２に
より抽出された部分単語列は、データベース検索部６等
で検索可能なキーワードとなるが、図１４に示す４個の
書名からは、図１６に示すように、２６個のキーワード
が抽出される。ただし、同じキーワードが複数個抽出さ
れた場合には（この例では、「オオカミ」が２個抽出さ
れる）、１個だけ記憶するものとする。

【０００９】音声認識辞書作成部３は、キーワード抽出
部２が書名を示す文字列から部分単語列を抽出すると、
図１７に示すように、先頭から同じ単語を束ねて、キー
ワードを単語木構造化することにより、部分単語列をキ
ーワードとする音声認識辞書を作成する。

【００１０】そして、音声認識辞書記憶部４が音声認識
辞書作成部３により作成された音声認識辞書を記憶する
と、音声認識辞書の更新が完了するが、外部から音声信
号が入力されると、以下に示すように、音声認識処理を
実行して、音声信号に対応する書名を検索する検索処理
を実行する。

【００１１】即ち、音声認識部５は、外部から音声信号
が入力されると、音声認識辞書に登録された２６個の部
分単語列と音声信号を照合して、その音声信号に対応す
る部分単語列を検索する。例えば、外部から“ピーター
ラビットノエホン”という音声が入力された場合には、
音声認識辞書に登録されている“ピーターラビットノエ
ホン”の部分単語列が音声信号に対応するものとして出
力されるが、木構造の末端まで完全に発声されず、“ピ
ーターラビット” という音声が入力された場合には、
音声認識辞書に登録されている“ピーターラビット”の
部分単語列が音声信号に対応するものとして出力され
る。逆に、木構造の先端が発声されず、“ラビットノエ
ホン” という音声が入力された場合には、音声認識辞
書に登録されている“ラビットノエホン”の部分単語列
が音声信号に対応するものとして出力される。

【００１２】データベース検索部６は、音声認識部５が
音声信号に対応する部分単語列を検索すると、図書デー
タベースから当該部分単語列に対応する書名を検索す
る。即ち、キーワード抽出部２が書名を示す文字列から
部分単語列を抽出する際、書名を示す文字列と部分単語
列の対応関係を記録しているので（例えば、“ピーター
ラビット”という部分単語列は、書名“ピーターラビッ
トの絵本”を構成する部分単語列であることが記録され
ている）、その対応関係を参照して、当該部分単語列に
対応する書名を検索する。例えば、音声認識部５により
“ピーターラビット”という部分単語列が検索された場
合には、“ピーターラビットの絵本”という書名を示す
文字列が検索される。

【００１３】そして、検索結果通知部７は、データベー
ス検索部６が図書データベースから部分単語列に対応す
る書名を検索すると、その書名を表示装置に表示する等
の処理を実行する。

【００１４】

【発明が解決しようとする課題】従来の音声認識装置は
以上のように構成されているので、図書データベースを
更新すると音声認識辞書が自動的に更新されるが、ユー
ザが書名等の検索時に発声する可能性が低い付属語が始
まる部分単語列（例えば、“ノエホン”）もキーワード
として音声認識辞書に登録されるためキーワードの個数
が増加し、音声認識処理に長時間を要するなどの課題が
あった。

【００１５】この発明は上記のような課題を解決するた
めになされたもので、不要なキーワードを削除して、音
声認識処理を速やかに実行することができる音声認識装
置及び音声認識方法を得ることを目的とする。

【００１６】

【課題を解決するための手段】この発明に係る音声認識
装置は、解析手段の解析結果である単語の形態素を参照
してデータベースに登録された文字列から、付属語から
始まらない部分単語列を抽出する抽出手段と、その抽出
手段により抽出された部分単語列をキーワードとする音
声認識辞書を作成する辞書作成手段とを設けたものであ
る。

【００１７】この発明に係る音声認識装置は、部分単語
列の先頭単語を音節木構造化して、音声認識辞書を作成
するようにしたものである。

【００１８】この発明に係る音声認識装置は、抽出手段
により抽出された部分単語列の先頭単語を音節木構造化
して、その部分単語列をキーワードとする音声認識辞書
を作成する辞書作成手段を設けたものである。

【００１９】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ選定し、その文字列から部分単語列を抽
出するようにしたものである。

【００２０】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が規定値以上の検索対象の文字列
を選定し、その文字列から部分単語列を抽出するように
したものである。

【００２１】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ順番に選定し、その文字列から部分単語
列を抽出する抽出手段を設けたものである。

【００２２】この発明に係る音声認識装置は、音声認識
辞書を作成する際、文字列に係る検索対象の利用頻度に
基づいて各部分単語列の予測検索頻度を累算し、予測検
索頻度が高い部分単語列から順番に音声信号と照合する
ようにしたものである。

【００２３】この発明に係る音声認識装置は、文字列に
係る検索対象の利用頻度に基づいて文字列を構成する単
語間の遷移確率を設定するようにしたものである。

【００２４】この発明に係る音声認識装置は、文字列に
係る検索対象が属するカテゴリを分類して、カテゴリ毎
に利用頻度を合計し、その合計値に基づいて各カテゴリ
に属する検索対象の文字列の予測検索頻度に下限値を設
定するようにしたものである。

【００２５】この発明に係る音声認識方法は、単語の形
態素を参照してデータベースに登録された文字列から、
付属語から始まらない部分単語列を抽出して、その部分
単語列をキーワードとする音声認識辞書を作成するよう
にしたものである。

【００２６】この発明に係る音声認識方法は、データベ
ースに登録された文字列から部分単語列を抽出すると、
その部分単語列の先頭単語を音節木構造化して、その部
分単語列をキーワードとする音声認識辞書を作成するよ
うにしたものである。

【００２７】この発明に係る音声認識方法は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ順番に選定し、その文字列から部分単語
列を抽出するようにしたものである。

【００２８】

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。実施の形態１．図１はこの発明の実施の形態１による音
声認識装置を示す構成図であり、図において、１１は図
書データベース（書名、副書名、叢書名、副叢書名、一
般件名、著者名などが含まれる）を管理するデータベー
ス管理部、１２は図書データベースに登録された文字列
（例えば、書名を示す文字列）を構成する単語の形態素
を解析する形態素解析部（解析手段）、１３は形態素解
析部１２の解析結果を参照して図書データベースに登録
された文字列から、付属語から始まらない部分単語列を
抽出するキーワード抽出部（抽出手段）、１４はキーワ
ード抽出部１３により抽出された部分単語列をキーワー
ドとする音声認識辞書を作成する音声認識辞書作成部
（辞書作成手段）、１５は音声認識辞書作成部１４によ
り作成された音声認識辞書を記憶する音声認識辞書記憶
部である。

【００２９】１６は外部から音声信号が入力されると、
音声認識辞書に登録された部分単語列と音声信号を照合
して、その音声信号に対応する部分単語列を検索する音
声認識部（音声認識手段）、１７は図書データベースか
ら音声認識部１６により検索された部分単語列に対応す
る文字列を検索するデータベース検索部（データベース
検索手段）、１８はデータベース検索部１７により検索
された文字列を通知する検索結果通知部である。なお、
図２はこの発明の実施の形態１による音声認識方法を示
すフローチャートである。

【００３０】次に動作について説明する。図書データベ
ースには、予め、書名、副書名、叢書名、副叢書名、一
般件名、著者名などが登録されているが、例えば、図書
データベースの登録データを更新する場合には、音声認
識辞書も更新する必要がある。ここでは、説明の便宜
上、書名を例として説明する。

【００３１】データベース管理部１１が図書データベー
スに格納されている書名を更新すると（ステップＳＴ
１，ＳＴ２）、形態素解析部１２は、図書データベース
に登録された書名を示す文字列を構成する単語の形態素
を解析する（ステップＳＴ３）。具体的には、書名を示
す文字列（記述形）に対して、読みの区切り目を参考に
しながら品詞を与える処理を実行する。例えば、書名を
示す文字列が“ピーターラビットの絵本”の場合、図３
に示すように、“ピーター”と“ラビット”は未登録の
名詞であるため「未知語」と解析されるが、“ノ”は
「付属語」と解析され、“エホン”は「名詞」と解析さ
れる。

【００３２】そして、キーワード抽出部１３は、形態素
解析部１２が書名を示す文字列を構成する単語の形態素
を解析すると、その解析結果を参照して、図書データベ
ースに格納された書名を示す文字列から、付属語から始
まらない部分単語列を抽出する（ステップＳＴ４）。

【００３３】具体的には、書名は、図１４に示すよう
に、図書データベースにおいて、書名の読み方が単語別
に分かれて記憶されているので（“／”により単語が区
切られている）、単語を１単位として、書名の部分単語
列を抽出するが、付属語から始まる部分単語列（例え
ば、“ノエホン”）は、ユーザが書名等の検索時に発声
する可能性が低いので、部分単語列の抽出対象から除外
する。

【００３４】図３は“ピーターラビットの絵本”から抽
出された部分単語列を示すが、この例では付属語から始
まる部分単語列（“ノエホン”）を抽出対象から除外し
ているので、合計８個の部分単語列が抽出される（従来
例では、合計１０個の部分単語列が抽出される）。な
お、キーワード抽出部１３により抽出された部分単語列
は、データベース検索部１７等で検索可能なキーワード
となるが、図１４に示す４個の書名からは、図４に示す
ように、２０個のキーワードが抽出される（従来例で
は、２６個のキーワードが抽出される）。ただし、同じ
キーワードが複数個抽出された場合には（この例では、
「オオカミ」が２個抽出される）、１個だけ記憶するも
のとする。

【００３５】音声認識辞書作成部１４は、キーワード抽
出部１３が書名を示す文字列から部分単語列を抽出する
と、図５に示すように、先頭から同じ単語を束ねて、キ
ーワードを単語木構造化することにより、部分単語列を
キーワードとする音声認識辞書を作成する（ステップＳ
Ｔ５）。

【００３６】そして、音声認識辞書記憶部１５が音声認
識辞書作成部１４により作成された音声認識辞書を記憶
すると、音声認識辞書の更新が完了するが、外部から音
声信号が入力されると、以下に示すように、音声認識処
理を実行して、音声信号に対応する書名を検索する検索
処理を実行する。

【００３７】即ち、音声認識部１６は、外部から音声信
号が入力されると（ステップＳＴ６）、音声認識辞書に
登録された２０個の部分単語列と音声信号を照合して、
その音声信号に対応する部分単語列を検索する（ステッ
プＳＴ７）。例えば、外部から“ピーターラビットノエ
ホン”という音声が入力された場合には、音声認識辞書
に登録されている“ピーターラビットノエホン”の部分
単語列が音声信号に対応するものとして出力されるが、
木構造の末端まで完全に発声されず、“ピーターラビッ
ト” という音声が入力された場合には、音声認識辞書
に登録されている“ピーターラビット”の部分単語列が
音声信号に対応するものとして出力される。逆に、木構
造の先端が発声されず、“ラビットノエホン” という
音声が入力された場合には、音声認識辞書に登録されて
いる“ラビットノエホン”の部分単語列が音声信号に対
応するものとして出力される。

【００３８】データベース検索部１７は、音声認識部１
６が音声信号に対応する部分単語列を検索すると、図書
データベースから当該部分単語列に対応する書名を示す
文字列を検索する（ステップＳＴ８）。即ち、キーワー
ド抽出部１３が書名を示す文字列から部分単語列を抽出
する際、書名を示す文字列と部分単語列の対応関係を記
録しているので（例えば、“ピーターラビット”という
部分単語列は、書名“ピーターラビットの絵本”を構成
する部分単語列であることが記録されている）、その対
応関係を参照して、当該部分単語列に対応する書名を検
索する。例えば、音声認識部１６により“ピーターラビ
ット”という部分単語列が検索された場合には、“ピー
ターラビットの絵本”という書名を示す文字列が検索さ
れる。

【００３９】そして、検索結果通知部１８は、データベ
ース検索部１７が図書データベースから部分単語列に対
応する書名を検索すると、その書名を表示装置に表示す
る等の処理を実行する（ステップＳＴ９）。

【００４０】以上で明らかなように、この実施の形態１
によれば、単語の形態素を参照して図書データベースに
登録された書名を示す文字列から、付属語から始まらな
い部分単語列を抽出して、その部分単語列をキーワード
とする音声認識辞書を作成するように構成したので、ユ
ーザが書名等の検索時に発声する可能性が低いキーワー
ドを除いて音声認識辞書を作成することができるように
なり、その結果、音声認識辞書に登録されるキーワード
の個数が減少するため、音声認識処理を速やかに実行す
ることができる効果を奏する。

【００４１】実施の形態２．図６はこの発明の実施の形
態２による音声認識装置を示す構成図であり、図におい
て、図１と同一符号は同一または相当部分を示すので説
明を省略する。１９は音声認識辞書を作成する際、部分
単語列の先頭単語を音節木構造化して、音声認識辞書を
作成する音節木構造化部（辞書作成手段）である。

【００４２】次に動作について説明する。上記実施の形
態１では、先頭から同じ単語を束ねて、キーワードを単
語木構造化することにより、部分単語列をキーワードと
する音声認識辞書を作成するものについて示したが、例
えば、１０万冊規模の蔵書を検索する場合、先頭単語の
分岐数が膨大な個数となるため、音声認識処理の演算量
が膨大なものとなる。

【００４３】そこで、この実施の形態２では、音声認識
処理の演算量を減らすため、部分単語列の先頭単語を音
節木構造化するものである。なお、先頭単語の分岐数が
膨大な個数となっても、後続単語の分岐数はあまり多く
ならないので、文字列の先頭単語のみを音節木構造化す
る。

【００４４】具体的には、音節木構造化部１９は、音声
認識辞書作成部１４が音声認識辞書を作成すると、図７
に示すように、部分単語列の先頭単語を先頭から音節に
分割し、共通化できる音節を音節単位で束ねる処理を実
行する。例えば、部分単語列が“ラビットの絵本”であ
る場合、“ラビット”が先頭単語であるので、“ラビッ
ト”の先頭から音節に分割するが、“ラビット”を構成
する音節のうち“ラ”は、部分単語列である“ライオ
ン”を構成する“ラ”の音節と同じであるので、図７に
示すように、音節“ラ”を共通化する。ただし、“ライ
オン”の“イオン”部分のように、音節を共通化するこ
とができない部分は、音節に分離する処理を実行しな
い。

【００４５】このように、音節を共通化できない部分に
ついては、そのまま残すことになるが、音節が同じ部分
については、音節を共通化することにより、音声認識処
理の演算量を減らすことができる。なお、後続単語に関
しては、音節木構造化をしないため、音節木構造化に伴
うオーバーヘッドを小さくすることができる。

【００４６】実施の形態３．図８はこの発明の実施の形
態３による音声認識装置を示す構成図であり、図におい
て、図１と同一符号は同一または相当部分を示すので説
明を省略する。２０は図書データベースに登録された文
字列に係る図書（検索対象）の貸出頻度（利用頻度）を
入手し、その貸出頻度を予測検索頻度として出力する検
索頻度推定部（抽出手段）、２１は検索頻度推定部２０
が出力する予測検索頻度が高い順番に図書の文字列を規
定の個数だけ選定し、その文字列から部分単語列を抽出
するキーワード抽出部（抽出手段）である。

【００４７】次に動作について説明する。上記実施の形
態１では、付属語から始まる部分単語列を抽出対象から
除外することにより、キーワードの個数を減らすものに
ついて示したが、図書の貸出頻度から予測検索頻度を推
定し、その予測検索頻度が高い順番に図書の文字列を規
定の個数だけ選定することにより、キーワードの個数を
減らすようにしてもよい。

【００４８】具体的には、検索頻度推定部２０がデータ
ベース管理部１１から図書データベースに登録されてい
る文字列に係る図書の貸出頻度を入手すると、その貸出
頻度を予測検索頻度としてキーワード抽出部２１に出力
する（図９を参照）。

【００４９】そして、キーワード抽出部２１は、検索頻
度推定部２０から予測検索頻度を受けると、予測検索頻
度が高い順番に図書の文字列を予め設定された個数だけ
選定し、その文字列から部分単語列を抽出する。例え
ば、３個の文字列を選定するように設定されている場合
には、図９の場合、“ピーターラビットの絵本”と“ピ
ーターとおおかみ”と“ピーター・パン”が選定され
る。

【００５０】これにより、音声認識辞書作成部１４は、
上記実施の形態１と同様に、キーワード抽出部２１によ
り抽出された部分単語列をキーワードとする音声認識辞
書を作成するが、抽出される文字列の個数が制限される
ので、キーワードの個数が減少する。

【００５１】なお、図書館には書名が同一の図書が複数
保有されている場合があるが、各図書の貸出頻度を足し
加えてもよい。また、読みからキーワードを抽出する場
合、異なる記述形の書名も読みが同じになる場合がある
が、この場合も、各図書の貸出頻度を足し加えてもよ
い。また、著者名に関しても一人の著者が複数の図書を
書いているため、著者名から抽出するキーワードに関し
ては、それぞれの著者毎に貸出頻度を加えてもよい。叢
書名、副叢書名、一般件名についても著者名と同様であ
り、それぞれのデータ毎に貸出頻度を加えてもよい。

【００５２】さらに、図書館では、図書が無い場合に図
書を予約するサービスが行われているが、この予約待ち
頻度情報も貸出頻度と同様に、予測検索頻度として出力
するようにしてもよい。

【００５３】実施の形態４．上記実施の形態３では、予
測検索頻度が高い順番に図書の文字列を規定の個数だけ
選定するものについて示したが、予測検索頻度が規定値
以上の図書の文字列を選定し、その文字列から部分単語
列を抽出するようにしてもよく、上記実施の形態３と同
様の効果を奏する。例えば、予測検索頻度が１０以上の
文字列を選定するように設定されている場合、図９の例
では、“ピーターラビットの絵本”と“ピーターとおお
かみ”が選定される。

【００５４】実施の形態５．上記実施の形態３では、予
測検索頻度が高い順番に図書の文字列を規定の個数だけ
選定するものについて示したが、音声認識辞書作成部１
４が音声認識辞書を作成する際、図書の予測検索頻度に
基づいて各部分単語列の予測検索頻度を累算し、音声認
識部１６が音声認識処理を実行する際、予測検索頻度が
高い部分単語列から順番に音声信号と照合するようにし
てもよい。

【００５５】具体的には、キーワード抽出部２１が部分
単語列を抽出すると、図書に依存する貸出頻度を部分単
語列に付与するものであるが、部分単語列が複数の図書
に関連する場合には、貸出頻度を合計して予測検索頻度
としている。例えば、“ピーター”は、“ピーターラビ
ットの絵本”、“ピーターとおおかみ”、“ピーター・
パン”の３冊に関連しているので、３冊の貸出頻度の合
計である“２８”という予測検索頻度が付与されている
（図１０を参照）。

【００５６】これにより、音声認識部１６が音声認識処
理を実行する場合、図１０の例では、“ピーター”の予
測検索頻度が最も高く、次に、“オオカミ”の予測検索
頻度が高いので、この順番で音声信号との照合処理が実
行される。このように、過去の貸出頻度が考慮されて照
合処理が実行されるので、音声信号に対応する部分単語
列が早期に検索される確率が高まり、音声認識処理の高
速化を図ることができる効果を奏する。なお、各部分単
語列毎に予測検索頻度を累算した後、頻度の大きい一定
数の部分単語列を更に選択するようにしてもよい。

【００５７】実施の形態６．上記実施の形態５では、図
書の予測検索頻度に基づいて各部分単語列の予測検索頻
度を累算するものについて示したが、音声認識辞書作成
部１４が音声認識辞書を作成する際、図書の貸出頻度に
基づいて文字列を構成する単語間の遷移確率を設定する
ようにしてもよい。

【００５８】具体的には、音声認識辞書を確率モデルと
して使用する場合、図１１に示すように、キーワードか
ら生成される音声認識辞書に単語間の遷移確率を付け加
えるものである。図１１では単語の左上にそれぞれの単
語へわたる遷移確率を示している。先頭単語は８単語存
在し、これらの８単語で予測検索頻度の合計は“７２”
である。そのため、先頭から“ピーター”に遷移する確
率は２８／７２と見なされる。同様に、“ピーター”に
続く単語は３単語あり、それらの予測検索頻度の合計は
“２８”である。そのため、“ラビット”に遷移する確
率は１２／２８と見なされる。

【００５９】このようにして、全ての単語間に遷移確率
が計算されると、音声認識処理の実行中、単語間を遷移
する時に、この確率を乗ずると、予測検索頻度の高いキ
ーワードのスコアを高める効果があり、予測検索頻度の
高いキーワードを認識し易くすることができる。

【００６０】さらに、音声認識装置では、一般的に用い
られるビームサーチ技術を併用する場合、予測検索頻度
の低いキーワードはスコアが小さくなり、認識対象範囲
から脱落させる効果があるため、このように遷移確率を
付与し、確率モデルとして照合することにより、キーワ
ードの個数を制限するのと同様の効果を奏する。

【００６１】実施の形態７．上記実施の形態５では、図
書の予測検索頻度に基づいて各部分単語列の予測検索頻
度を累算するものについて示したが、音声認識辞書作成
部１４が音声認識辞書を作成する際、図書が属するカテ
ゴリを分類して、カテゴリ毎に利用頻度を合計し、その
合計値に基づいて各カテゴリに属する図書の文字列の予
測検索頻度に下限値を設定するようにしてもよい。

【００６２】ここでは、図書館における図書検索システ
ムを一例とし、物品の利用頻度を図書の貸出頻度とし、
物品のカテゴリを著者として説明を行う。有名な著者の
図書は、検索される頻度が高いと考えられる。そのた
め、貸出頻度を著者毎に加算して、著者毎の貸出頻度の
合計値を計算し、その著者が著した図書の予測検索頻度
の下限値を設定する。これにより、著名な著者が著した
図書がキーワードから脱落するのを防止することができ
る。

【００６３】具体的には、図１２に示すように、同じ著
者が著した図書が３個あり、これらの図書の貸出頻度が
それぞれ“１２．０”，“３．０”，“０．０”である
とする。この場合、これらの平均値が“５．０”である
ため、その１０％に相当する“０．５”を予測検索頻度
の下限値とすると、これらの図書の貸出頻度がそれぞれ
“１２．０”，“３．０”，“０．５”となる。

【００６４】これにより、貸出頻度が“０．０”である
“ピーターラビットとなかまたち”もキーワードとして
選択され易くなり、著名な著者が著した図書に属するキ
ーワードが選択され易くなるという効果を奏する。ま
た、新刊図書は貸出頻度が“０．０”であるため、キー
ワードとして抽出されにくいが、この実施の形態７によ
れば、新刊図書においても、著名な著者が著した場合等
には、キーワードとして選択され易くなるという効果を
奏する。なお、上記の説明では、予測検索頻度の下限値
を著者毎の平均値の１０％として説明を行ったが、これ
に限るものでないことは言うまでもない。

【００６５】

【発明の効果】以上のように、この発明によれば、解析
手段の解析結果である単語の形態素を参照してデータベ
ースに登録された文字列から、付属語から始まらない部
分単語列を抽出する抽出手段と、その抽出手段により抽
出された部分単語列をキーワードとする音声認識辞書を
作成する辞書作成手段とを設けるように構成したので、
ユーザが書名等の検索時に発声する可能性が低いキーワ
ードを除いて音声認識辞書を作成することができるよう
になり、その結果、音声認識辞書に登録されるキーワー
ドの個数が減少するため、音声認識処理を速やかに実行
することができる効果がある。

【００６６】この発明によれば、部分単語列の先頭単語
を音節木構造化して、音声認識辞書を作成するように構
成したので、音声認識処理の演算量が減少する結果、音
声認識処理を速やかに実行することができる効果があ
る。

【００６７】この発明によれば、抽出手段により抽出さ
れた部分単語列の先頭単語を音節木構造化して、その部
分単語列をキーワードとする音声認識辞書を作成する辞
書作成手段を設けるように構成したので、音声認識処理
の演算量が減少する結果、音声認識処理を速やかに実行
することができる効果がある。

【００６８】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け選定し、その文字列から部分単語列を抽出するように
構成したので、検索される可能性の低いキーワードの登
録が除外される結果、音声認識処理を速やかに実行する
ことができる効果がある。

【００６９】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が規定値以上の検索対象の文字列を選定し、そ
の文字列から部分単語列を抽出するように構成したの
で、検索される可能性の低いキーワードの登録が除外さ
れる結果、音声認識処理を速やかに実行することができ
る効果がある。

【００７０】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け順番に選定し、その文字列から部分単語列を抽出する
抽出手段を設けるように構成したので、検索される可能
性の低いキーワードの登録が除外される結果、音声認識
処理を速やかに実行することができる効果がある。

【００７１】この発明によれば、音声認識辞書を作成す
る際、文字列に係る検索対象の利用頻度に基づいて各部
分単語列の予測検索頻度を累算し、予測検索頻度が高い
部分単語列から順番に音声信号と照合するように構成し
たので、音声信号に対応する部分単語列が早期に検索さ
れる確率が高まり、音声認識処理の高速化を図ることが
できる効果がある。

【００７２】この発明によれば、文字列に係る検索対象
の利用頻度に基づいて文字列を構成する単語間の遷移確
率を設定するように構成したので、予測検索頻度の高い
キーワードの認識が容易になる効果がある。

【００７３】この発明によれば、文字列に係る検索対象
が属するカテゴリを分類して、カテゴリ毎に利用頻度を
合計し、その合計値に基づいて各カテゴリに属する検索
対象の文字列の予測検索頻度に下限値を設定するように
構成したので、例えば、著名な著者が著した図書がキー
ワードから脱落するのを防止することができる効果があ
る。

【００７４】この発明によれば、単語の形態素を参照し
てデータベースに登録された文字列から、付属語から始
まらない部分単語列を抽出して、その部分単語列をキー
ワードとする音声認識辞書を作成するように構成したの
で、ユーザが書名等の検索時に発声する可能性が低いキ
ーワードを除いて音声認識辞書を作成することができる
ようになり、その結果、音声認識辞書に登録されるキー
ワードの個数が減少するため、音声認識処理を速やかに
実行することができる効果がある。

【００７５】この発明によれば、データベースに登録さ
れた文字列から部分単語列を抽出すると、その部分単語
列の先頭単語を音節木構造化して、その部分単語列をキ
ーワードとする音声認識辞書を作成するように構成した
ので、音声認識処理の演算量が減少する結果、音声認識
処理を速やかに実行することができる効果がある。

【００７６】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け順番に選定し、その文字列から部分単語列を抽出する
ように構成したので、検索される可能性の低いキーワー
ドの登録が除外される結果、音声認識処理を速やかに実
行することができる効果がある。

【図面の簡単な説明】

【図１】この発明の実施の形態１による音声認識装置
を示す構成図である。

【図２】この発明の実施の形態１による音声認識方法
を示すフローチャートである。

【図３】部分単語列の抽出方法を説明する説明図であ
る。

【図４】抽出された部分単語列を示す説明図である。

【図５】音声認識辞書の辞書構成を示す構成図であ
る。

【図６】この発明の実施の形態２による音声認識装置
を示す構成図である。

【図７】音声認識辞書の辞書構成を示す構成図であ
る。

【図８】この発明の実施の形態３による音声認識装置
を示す構成図である。

【図９】図書データベースの貸出頻度等を示す説明図
である。

【図１０】部分単語列に付加された予測検索頻度を示
す説明図である。

【図１１】確率モデルからなる音声認識辞書の辞書構
成を示す構成図である。

【図１２】図書データベースの貸出頻度等を示す説明
図である。

【図１３】従来の音声認識装置を示す構成図である。

【図１４】図書データベースの構成を説明する説明図
である。

【図１５】部分単語列の抽出方法を説明する説明図で
ある。

【図１６】抽出された部分単語列を示す説明図であ
る。

【図１７】音声認識辞書の辞書構成を示す構成図であ
る。

【符号の説明】

１２形態素解析部（解析手段）、１３，２１キーワ
ード抽出部（抽出手段）、１４音声認識辞書作成部
（辞書作成手段）、１６音声認識部（音声認識手
段）、１７データベース検索部（データベース検索手
段）、１９音節木構造化部（辞書作成手段）、２０
検索頻度推定部（抽出手段）。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 15/403 ３１０Ｚ

Claims

【特許請求の範囲】

【請求項１】データベースに登録された文字列を構成
する単語の形態素を解析する解析手段と、上記解析手段
の解析結果を参照して上記データベースに登録された文
字列から、付属語から始まらない部分単語列を抽出する
抽出手段と、上記抽出手段により抽出された部分単語列
をキーワードとする音声認識辞書を作成する辞書作成手
段と、上記辞書作成手段により作成された音声認識辞書
から音声信号に対応する部分単語列を検索する音声認識
手段と、上記データベースから上記音声認識手段により
検索された部分単語列に対応する文字列を検索するデー
タベース検索手段とを備えた音声認識装置。
【請求項２】辞書作成手段は、音声認識辞書を作成す
る際、部分単語列の先頭単語を音節木構造化して、音声
認識辞書を作成することを特徴とする請求項１記載の音
声認識装置。
【請求項３】データベースに登録された文字列から部
分単語列を抽出する抽出手段と、上記抽出手段により抽
出された部分単語列の先頭単語を音節木構造化して、そ
の部分単語列をキーワードとする音声認識辞書を作成す
る辞書作成手段と、上記辞書作成手段により作成された
音声認識辞書から音声信号に対応する部分単語列を検索
する音声認識手段と、上記データベースから上記音声認
識手段により検索された部分単語列に対応する文字列を
検索するデータベース検索手段とを備えた音声認識装
置。
【請求項４】抽出手段は、データベースに登録された
文字列に係る検索対象の利用頻度を参照して、その利用
頻度が高い順番に検索対象の文字列を規定の個数だけ選
定し、その文字列から部分単語列を抽出することを特徴
とする請求項１から請求項３のうちのいずれか１項記載
の音声認識装置。
【請求項５】抽出手段は、データベースに登録された
文字列に係る検索対象の利用頻度を参照して、その利用
頻度が規定値以上の検索対象の文字列を選定し、その文
字列から部分単語列を抽出することを特徴とする請求項
１から請求項３のうちのいずれか１項記載の音声認識装
置。
【請求項６】データベースに登録された文字列に係る
検索対象の利用頻度を参照して、その利用頻度が高い順
番に検索対象の文字列を規定の個数だけ順番に選定し、
その文字列から部分単語列を抽出する抽出手段と、上記
抽出手段により抽出された部分単語列をキーワードとす
る音声認識辞書を作成する辞書作成手段と、上記辞書作
成手段により作成された音声認識辞書から音声信号に対
応する部分単語列を検索する音声認識手段と、上記デー
タベースから上記音声認識手段により検索された部分単
語列に対応する文字列を検索するデータベース検索手段
とを備えた音声認識装置。
【請求項７】辞書作成手段は、音声認識辞書を作成す
る際、文字列に係る検索対象の利用頻度に基づいて各部
分単語列の予測検索頻度を累算し、音声認識手段は、予
測検索頻度が高い部分単語列から順番に音声信号と照合
することを特徴とする請求項４から請求項６のうちのい
ずれか１項記載の音声認識装置。
【請求項８】辞書作成手段は、音声認識辞書を作成す
る際、文字列に係る検索対象の利用頻度に基づいて文字
列を構成する単語間の遷移確率を設定することを特徴と
する請求項７記載の音声認識装置。
【請求項９】辞書作成手段は、音声認識辞書を作成す
る際、文字列に係る検索対象が属するカテゴリを分類し
て、カテゴリ毎に利用頻度を合計し、その合計値に基づ
いて各カテゴリに属する検索対象の文字列の予測検索頻
度に下限値を設定することを特徴とする請求項７または
請求項８記載の音声認識装置。
【請求項１０】データベースに登録された文字列を構
成する単語の形態素を解析すると、その解析結果を参照
して上記データベースに登録された文字列から、付属語
から始まらない部分単語列を抽出して、その部分単語列
をキーワードとする音声認識辞書を作成する一方、その
音声認識辞書から音声信号に対応する部分単語列を検索
し、上記データベースから当該部分単語列に対応する文
字列を検索する音声認識方法。
【請求項１１】データベースに登録された文字列から
部分単語列を抽出すると、その部分単語列の先頭単語を
音節木構造化して、その部分単語列をキーワードとする
音声認識辞書を作成する一方、その音声認識辞書から音
声信号に対応する部分単語列を検索し、上記データベー
スから当該部分単語列に対応する文字列を検索する音声
認識方法。
【請求項１２】データベースに登録された文字列に係
る検索対象の利用頻度を参照して、その利用頻度が高い
順番に検索対象の文字列を規定の個数だけ順番に選定
し、その文字列から部分単語列を抽出すると、その部分
単語列をキーワードとする音声認識辞書を作成する一
方、その音声認識辞書から音声信号に対応する部分単語
列を検索し、上記データベースから当該部分単語列に対
応する文字列を検索する音声認識方法。