JP2000259653A - 音声認識装置及び音声認識方法 - Google Patents

音声認識装置及び音声認識方法

Info

Publication number
JP2000259653A
JP2000259653A JP11062300A JP6230099A JP2000259653A JP 2000259653 A JP2000259653 A JP 2000259653A JP 11062300 A JP11062300 A JP 11062300A JP 6230099 A JP6230099 A JP 6230099A JP 2000259653 A JP2000259653 A JP 2000259653A
Authority
JP
Japan
Prior art keywords
speech recognition
partial word
string
word string
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11062300A
Other languages
English (en)
Inventor
Tomohiro Iwasaki
知弘 岩▲さき▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11062300A priority Critical patent/JP2000259653A/ja
Publication of JP2000259653A publication Critical patent/JP2000259653A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ユーザが書名等の検索時に発声する可能性が
低い付属語が始まる部分単語列(例えば、“ノエホ
ン”)もキーワードとして音声認識辞書に登録されるた
めキーワードの個数が増加し、音声認識処理に長時間を
要するなどの課題があった。 【解決手段】 単語の形態素を参照して図書データベー
スに登録された書名を示す文字列から、付属語から始ま
らない部分単語列を抽出して、その部分単語列をキーワ
ードとする音声認識辞書を作成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声信号を入力
して図書情報等を検索する音声認識装置及び音声認識方
法に関するものである。
【0002】
【従来の技術】従来から大規模なデータベースに対して
は、容易に内容を検索できる検索システムが必要とされ
ている。そのため、キーボードやタッチパネルなど備え
た利用者検索端末から特定のキーワードを用いてデータ
ベースを検索し、その検索結果を表示、あるいは、音声
で利用者に通知するシステムが存在する。
【0003】これらの文字を入力するデバイスに加え
て、特開平6−332493号公報には、音声認識技術
を用いて音声により旅行情報などのデータベースを検索
する音声検索システムが提案されている。一方、特開昭
63−301325号公報に記述されているように、図
書館において図書情報がデータベース化されており、書
名、著者名などのキーワードを用いて文字入力によりデ
ータベースを検索するシステムが提案されている。ここ
では、音声認識技術を用いて図書館に格納されている図
書を検索する図書検索システムを一例として説明する。
【0004】図13は従来の音声認識装置を示す構成図
であり、図において、1は図書データベース(書名、副
書名、叢書名、副叢書名、一般件名、著者名などが含ま
れる)を管理するデータベース管理部、2は図書データ
ベースに登録された文字列(例えば、書名を示す文字
列)から部分単語列を抽出するキーワード抽出部、3は
キーワード抽出部2により抽出された部分単語列をキー
ワードとする音声認識辞書を作成する音声認識辞書作成
部、4は音声認識辞書作成部3により作成された音声認
識辞書を記憶する音声認識辞書記憶部である。
【0005】5は外部から音声信号が入力されると、音
声認識辞書に登録された部分単語列と音声信号を照合し
て、その音声信号に対応する部分単語列を検索する音声
認識部、6は図書データベースから音声認識部5により
検索された部分単語列に対応する文字列を検索するデー
タベース検索部、7はデータベース検索部6により検索
された文字列を通知する検索結果通知部である。
【0006】次に動作について説明する。図書データベ
ースには、予め、書名、副書名、叢書名、副叢書名、一
般件名、著者名などが登録されているが、例えば、図書
データベースの登録データを更新する場合には、音声認
識辞書も更新する必要がある。ここでは、説明の便宜
上、書名を例として説明する。
【0007】データベース管理部1が図書データベース
に格納されている書名を更新すると、キーワード抽出部
2は、図書データベースに格納された書名を示す文字列
から部分単語列を抽出する。具体的には、書名は、図1
4に示すように、図書データベースにおいて、書名の読
み方が単語別に分かれて記憶されているので(“/”に
より単語が区切られている)、単語を1単位として、書
名の部分単語列を抽出する。
【0008】図15は“ピーターラビットの絵本”から
抽出された部分単語列を示すが、この例では書名を示す
文字列が4個の単語から構成されるので、合計10個の
部分単語列が抽出される。なお、キーワード抽出部2に
より抽出された部分単語列は、データベース検索部6等
で検索可能なキーワードとなるが、図14に示す4個の
書名からは、図16に示すように、26個のキーワード
が抽出される。ただし、同じキーワードが複数個抽出さ
れた場合には(この例では、「オオカミ」が2個抽出さ
れる)、1個だけ記憶するものとする。
【0009】音声認識辞書作成部3は、キーワード抽出
部2が書名を示す文字列から部分単語列を抽出すると、
図17に示すように、先頭から同じ単語を束ねて、キー
ワードを単語木構造化することにより、部分単語列をキ
ーワードとする音声認識辞書を作成する。
【0010】そして、音声認識辞書記憶部4が音声認識
辞書作成部3により作成された音声認識辞書を記憶する
と、音声認識辞書の更新が完了するが、外部から音声信
号が入力されると、以下に示すように、音声認識処理を
実行して、音声信号に対応する書名を検索する検索処理
を実行する。
【0011】即ち、音声認識部5は、外部から音声信号
が入力されると、音声認識辞書に登録された26個の部
分単語列と音声信号を照合して、その音声信号に対応す
る部分単語列を検索する。例えば、外部から“ピーター
ラビットノエホン”という音声が入力された場合には、
音声認識辞書に登録されている“ピーターラビットノエ
ホン”の部分単語列が音声信号に対応するものとして出
力されるが、木構造の末端まで完全に発声されず、“ピ
ーターラビット” という音声が入力された場合には、
音声認識辞書に登録されている“ピーターラビット”の
部分単語列が音声信号に対応するものとして出力され
る。逆に、木構造の先端が発声されず、“ラビットノエ
ホン” という音声が入力された場合には、音声認識辞
書に登録されている“ラビットノエホン”の部分単語列
が音声信号に対応するものとして出力される。
【0012】データベース検索部6は、音声認識部5が
音声信号に対応する部分単語列を検索すると、図書デー
タベースから当該部分単語列に対応する書名を検索す
る。即ち、キーワード抽出部2が書名を示す文字列から
部分単語列を抽出する際、書名を示す文字列と部分単語
列の対応関係を記録しているので(例えば、“ピーター
ラビット”という部分単語列は、書名“ピーターラビッ
トの絵本”を構成する部分単語列であることが記録され
ている)、その対応関係を参照して、当該部分単語列に
対応する書名を検索する。例えば、音声認識部5により
“ピーターラビット”という部分単語列が検索された場
合には、“ピーターラビットの絵本”という書名を示す
文字列が検索される。
【0013】そして、検索結果通知部7は、データベー
ス検索部6が図書データベースから部分単語列に対応す
る書名を検索すると、その書名を表示装置に表示する等
の処理を実行する。
【0014】
【発明が解決しようとする課題】従来の音声認識装置は
以上のように構成されているので、図書データベースを
更新すると音声認識辞書が自動的に更新されるが、ユー
ザが書名等の検索時に発声する可能性が低い付属語が始
まる部分単語列(例えば、“ノエホン”)もキーワード
として音声認識辞書に登録されるためキーワードの個数
が増加し、音声認識処理に長時間を要するなどの課題が
あった。
【0015】この発明は上記のような課題を解決するた
めになされたもので、不要なキーワードを削除して、音
声認識処理を速やかに実行することができる音声認識装
置及び音声認識方法を得ることを目的とする。
【0016】
【課題を解決するための手段】この発明に係る音声認識
装置は、解析手段の解析結果である単語の形態素を参照
してデータベースに登録された文字列から、付属語から
始まらない部分単語列を抽出する抽出手段と、その抽出
手段により抽出された部分単語列をキーワードとする音
声認識辞書を作成する辞書作成手段とを設けたものであ
る。
【0017】この発明に係る音声認識装置は、部分単語
列の先頭単語を音節木構造化して、音声認識辞書を作成
するようにしたものである。
【0018】この発明に係る音声認識装置は、抽出手段
により抽出された部分単語列の先頭単語を音節木構造化
して、その部分単語列をキーワードとする音声認識辞書
を作成する辞書作成手段を設けたものである。
【0019】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ選定し、その文字列から部分単語列を抽
出するようにしたものである。
【0020】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が規定値以上の検索対象の文字列
を選定し、その文字列から部分単語列を抽出するように
したものである。
【0021】この発明に係る音声認識装置は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ順番に選定し、その文字列から部分単語
列を抽出する抽出手段を設けたものである。
【0022】この発明に係る音声認識装置は、音声認識
辞書を作成する際、文字列に係る検索対象の利用頻度に
基づいて各部分単語列の予測検索頻度を累算し、予測検
索頻度が高い部分単語列から順番に音声信号と照合する
ようにしたものである。
【0023】この発明に係る音声認識装置は、文字列に
係る検索対象の利用頻度に基づいて文字列を構成する単
語間の遷移確率を設定するようにしたものである。
【0024】この発明に係る音声認識装置は、文字列に
係る検索対象が属するカテゴリを分類して、カテゴリ毎
に利用頻度を合計し、その合計値に基づいて各カテゴリ
に属する検索対象の文字列の予測検索頻度に下限値を設
定するようにしたものである。
【0025】この発明に係る音声認識方法は、単語の形
態素を参照してデータベースに登録された文字列から、
付属語から始まらない部分単語列を抽出して、その部分
単語列をキーワードとする音声認識辞書を作成するよう
にしたものである。
【0026】この発明に係る音声認識方法は、データベ
ースに登録された文字列から部分単語列を抽出すると、
その部分単語列の先頭単語を音節木構造化して、その部
分単語列をキーワードとする音声認識辞書を作成するよ
うにしたものである。
【0027】この発明に係る音声認識方法は、データベ
ースに登録された文字列に係る検索対象の利用頻度を参
照して、その利用頻度が高い順番に検索対象の文字列を
規定の個数だけ順番に選定し、その文字列から部分単語
列を抽出するようにしたものである。
【0028】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による音
声認識装置を示す構成図であり、図において、11は図
書データベース(書名、副書名、叢書名、副叢書名、一
般件名、著者名などが含まれる)を管理するデータベー
ス管理部、12は図書データベースに登録された文字列
(例えば、書名を示す文字列)を構成する単語の形態素
を解析する形態素解析部(解析手段)、13は形態素解
析部12の解析結果を参照して図書データベースに登録
された文字列から、付属語から始まらない部分単語列を
抽出するキーワード抽出部(抽出手段)、14はキーワ
ード抽出部13により抽出された部分単語列をキーワー
ドとする音声認識辞書を作成する音声認識辞書作成部
(辞書作成手段)、15は音声認識辞書作成部14によ
り作成された音声認識辞書を記憶する音声認識辞書記憶
部である。
【0029】16は外部から音声信号が入力されると、
音声認識辞書に登録された部分単語列と音声信号を照合
して、その音声信号に対応する部分単語列を検索する音
声認識部(音声認識手段)、17は図書データベースか
ら音声認識部16により検索された部分単語列に対応す
る文字列を検索するデータベース検索部(データベース
検索手段)、18はデータベース検索部17により検索
された文字列を通知する検索結果通知部である。なお、
図2はこの発明の実施の形態1による音声認識方法を示
すフローチャートである。
【0030】次に動作について説明する。図書データベ
ースには、予め、書名、副書名、叢書名、副叢書名、一
般件名、著者名などが登録されているが、例えば、図書
データベースの登録データを更新する場合には、音声認
識辞書も更新する必要がある。ここでは、説明の便宜
上、書名を例として説明する。
【0031】データベース管理部11が図書データベー
スに格納されている書名を更新すると(ステップST
1,ST2)、形態素解析部12は、図書データベース
に登録された書名を示す文字列を構成する単語の形態素
を解析する(ステップST3)。具体的には、書名を示
す文字列(記述形)に対して、読みの区切り目を参考に
しながら品詞を与える処理を実行する。例えば、書名を
示す文字列が“ピーターラビットの絵本”の場合、図3
に示すように、“ピーター”と“ラビット”は未登録の
名詞であるため「未知語」と解析されるが、“ノ”は
「付属語」と解析され、“エホン”は「名詞」と解析さ
れる。
【0032】そして、キーワード抽出部13は、形態素
解析部12が書名を示す文字列を構成する単語の形態素
を解析すると、その解析結果を参照して、図書データベ
ースに格納された書名を示す文字列から、付属語から始
まらない部分単語列を抽出する(ステップST4)。
【0033】具体的には、書名は、図14に示すよう
に、図書データベースにおいて、書名の読み方が単語別
に分かれて記憶されているので(“/”により単語が区
切られている)、単語を1単位として、書名の部分単語
列を抽出するが、付属語から始まる部分単語列(例え
ば、“ノエホン”)は、ユーザが書名等の検索時に発声
する可能性が低いので、部分単語列の抽出対象から除外
する。
【0034】図3は“ピーターラビットの絵本”から抽
出された部分単語列を示すが、この例では付属語から始
まる部分単語列(“ノエホン”)を抽出対象から除外し
ているので、合計8個の部分単語列が抽出される(従来
例では、合計10個の部分単語列が抽出される)。な
お、キーワード抽出部13により抽出された部分単語列
は、データベース検索部17等で検索可能なキーワード
となるが、図14に示す4個の書名からは、図4に示す
ように、20個のキーワードが抽出される(従来例で
は、26個のキーワードが抽出される)。ただし、同じ
キーワードが複数個抽出された場合には(この例では、
「オオカミ」が2個抽出される)、1個だけ記憶するも
のとする。
【0035】音声認識辞書作成部14は、キーワード抽
出部13が書名を示す文字列から部分単語列を抽出する
と、図5に示すように、先頭から同じ単語を束ねて、キ
ーワードを単語木構造化することにより、部分単語列を
キーワードとする音声認識辞書を作成する(ステップS
T5)。
【0036】そして、音声認識辞書記憶部15が音声認
識辞書作成部14により作成された音声認識辞書を記憶
すると、音声認識辞書の更新が完了するが、外部から音
声信号が入力されると、以下に示すように、音声認識処
理を実行して、音声信号に対応する書名を検索する検索
処理を実行する。
【0037】即ち、音声認識部16は、外部から音声信
号が入力されると(ステップST6)、音声認識辞書に
登録された20個の部分単語列と音声信号を照合して、
その音声信号に対応する部分単語列を検索する(ステッ
プST7)。例えば、外部から“ピーターラビットノエ
ホン”という音声が入力された場合には、音声認識辞書
に登録されている“ピーターラビットノエホン”の部分
単語列が音声信号に対応するものとして出力されるが、
木構造の末端まで完全に発声されず、“ピーターラビッ
ト” という音声が入力された場合には、音声認識辞書
に登録されている“ピーターラビット”の部分単語列が
音声信号に対応するものとして出力される。逆に、木構
造の先端が発声されず、“ラビットノエホン” という
音声が入力された場合には、音声認識辞書に登録されて
いる“ラビットノエホン”の部分単語列が音声信号に対
応するものとして出力される。
【0038】データベース検索部17は、音声認識部1
6が音声信号に対応する部分単語列を検索すると、図書
データベースから当該部分単語列に対応する書名を示す
文字列を検索する(ステップST8)。即ち、キーワー
ド抽出部13が書名を示す文字列から部分単語列を抽出
する際、書名を示す文字列と部分単語列の対応関係を記
録しているので(例えば、“ピーターラビット”という
部分単語列は、書名“ピーターラビットの絵本”を構成
する部分単語列であることが記録されている)、その対
応関係を参照して、当該部分単語列に対応する書名を検
索する。例えば、音声認識部16により“ピーターラビ
ット”という部分単語列が検索された場合には、“ピー
ターラビットの絵本”という書名を示す文字列が検索さ
れる。
【0039】そして、検索結果通知部18は、データベ
ース検索部17が図書データベースから部分単語列に対
応する書名を検索すると、その書名を表示装置に表示す
る等の処理を実行する(ステップST9)。
【0040】以上で明らかなように、この実施の形態1
によれば、単語の形態素を参照して図書データベースに
登録された書名を示す文字列から、付属語から始まらな
い部分単語列を抽出して、その部分単語列をキーワード
とする音声認識辞書を作成するように構成したので、ユ
ーザが書名等の検索時に発声する可能性が低いキーワー
ドを除いて音声認識辞書を作成することができるように
なり、その結果、音声認識辞書に登録されるキーワード
の個数が減少するため、音声認識処理を速やかに実行す
ることができる効果を奏する。
【0041】実施の形態2.図6はこの発明の実施の形
態2による音声認識装置を示す構成図であり、図におい
て、図1と同一符号は同一または相当部分を示すので説
明を省略する。19は音声認識辞書を作成する際、部分
単語列の先頭単語を音節木構造化して、音声認識辞書を
作成する音節木構造化部(辞書作成手段)である。
【0042】次に動作について説明する。上記実施の形
態1では、先頭から同じ単語を束ねて、キーワードを単
語木構造化することにより、部分単語列をキーワードと
する音声認識辞書を作成するものについて示したが、例
えば、10万冊規模の蔵書を検索する場合、先頭単語の
分岐数が膨大な個数となるため、音声認識処理の演算量
が膨大なものとなる。
【0043】そこで、この実施の形態2では、音声認識
処理の演算量を減らすため、部分単語列の先頭単語を音
節木構造化するものである。なお、先頭単語の分岐数が
膨大な個数となっても、後続単語の分岐数はあまり多く
ならないので、文字列の先頭単語のみを音節木構造化す
る。
【0044】具体的には、音節木構造化部19は、音声
認識辞書作成部14が音声認識辞書を作成すると、図7
に示すように、部分単語列の先頭単語を先頭から音節に
分割し、共通化できる音節を音節単位で束ねる処理を実
行する。例えば、部分単語列が“ラビットの絵本”であ
る場合、“ラビット”が先頭単語であるので、“ラビッ
ト”の先頭から音節に分割するが、“ラビット”を構成
する音節のうち“ラ”は、部分単語列である“ライオ
ン”を構成する“ラ”の音節と同じであるので、図7に
示すように、音節“ラ”を共通化する。ただし、“ライ
オン”の“イオン”部分のように、音節を共通化するこ
とができない部分は、音節に分離する処理を実行しな
い。
【0045】このように、音節を共通化できない部分に
ついては、そのまま残すことになるが、音節が同じ部分
については、音節を共通化することにより、音声認識処
理の演算量を減らすことができる。なお、後続単語に関
しては、音節木構造化をしないため、音節木構造化に伴
うオーバーヘッドを小さくすることができる。
【0046】実施の形態3.図8はこの発明の実施の形
態3による音声認識装置を示す構成図であり、図におい
て、図1と同一符号は同一または相当部分を示すので説
明を省略する。20は図書データベースに登録された文
字列に係る図書(検索対象)の貸出頻度(利用頻度)を
入手し、その貸出頻度を予測検索頻度として出力する検
索頻度推定部(抽出手段)、21は検索頻度推定部20
が出力する予測検索頻度が高い順番に図書の文字列を規
定の個数だけ選定し、その文字列から部分単語列を抽出
するキーワード抽出部(抽出手段)である。
【0047】次に動作について説明する。上記実施の形
態1では、付属語から始まる部分単語列を抽出対象から
除外することにより、キーワードの個数を減らすものに
ついて示したが、図書の貸出頻度から予測検索頻度を推
定し、その予測検索頻度が高い順番に図書の文字列を規
定の個数だけ選定することにより、キーワードの個数を
減らすようにしてもよい。
【0048】具体的には、検索頻度推定部20がデータ
ベース管理部11から図書データベースに登録されてい
る文字列に係る図書の貸出頻度を入手すると、その貸出
頻度を予測検索頻度としてキーワード抽出部21に出力
する(図9を参照)。
【0049】そして、キーワード抽出部21は、検索頻
度推定部20から予測検索頻度を受けると、予測検索頻
度が高い順番に図書の文字列を予め設定された個数だけ
選定し、その文字列から部分単語列を抽出する。例え
ば、3個の文字列を選定するように設定されている場合
には、図9の場合、“ピーターラビットの絵本”と“ピ
ーターとおおかみ”と“ピーター・パン”が選定され
る。
【0050】これにより、音声認識辞書作成部14は、
上記実施の形態1と同様に、キーワード抽出部21によ
り抽出された部分単語列をキーワードとする音声認識辞
書を作成するが、抽出される文字列の個数が制限される
ので、キーワードの個数が減少する。
【0051】なお、図書館には書名が同一の図書が複数
保有されている場合があるが、各図書の貸出頻度を足し
加えてもよい。また、読みからキーワードを抽出する場
合、異なる記述形の書名も読みが同じになる場合がある
が、この場合も、各図書の貸出頻度を足し加えてもよ
い。また、著者名に関しても一人の著者が複数の図書を
書いているため、著者名から抽出するキーワードに関し
ては、それぞれの著者毎に貸出頻度を加えてもよい。叢
書名、副叢書名、一般件名についても著者名と同様であ
り、それぞれのデータ毎に貸出頻度を加えてもよい。
【0052】さらに、図書館では、図書が無い場合に図
書を予約するサービスが行われているが、この予約待ち
頻度情報も貸出頻度と同様に、予測検索頻度として出力
するようにしてもよい。
【0053】実施の形態4.上記実施の形態3では、予
測検索頻度が高い順番に図書の文字列を規定の個数だけ
選定するものについて示したが、予測検索頻度が規定値
以上の図書の文字列を選定し、その文字列から部分単語
列を抽出するようにしてもよく、上記実施の形態3と同
様の効果を奏する。例えば、予測検索頻度が10以上の
文字列を選定するように設定されている場合、図9の例
では、“ピーターラビットの絵本”と“ピーターとおお
かみ”が選定される。
【0054】実施の形態5.上記実施の形態3では、予
測検索頻度が高い順番に図書の文字列を規定の個数だけ
選定するものについて示したが、音声認識辞書作成部1
4が音声認識辞書を作成する際、図書の予測検索頻度に
基づいて各部分単語列の予測検索頻度を累算し、音声認
識部16が音声認識処理を実行する際、予測検索頻度が
高い部分単語列から順番に音声信号と照合するようにし
てもよい。
【0055】具体的には、キーワード抽出部21が部分
単語列を抽出すると、図書に依存する貸出頻度を部分単
語列に付与するものであるが、部分単語列が複数の図書
に関連する場合には、貸出頻度を合計して予測検索頻度
としている。例えば、“ピーター”は、“ピーターラビ
ットの絵本”、“ピーターとおおかみ”、“ピーター・
パン”の3冊に関連しているので、3冊の貸出頻度の合
計である“28”という予測検索頻度が付与されている
(図10を参照)。
【0056】これにより、音声認識部16が音声認識処
理を実行する場合、図10の例では、“ピーター”の予
測検索頻度が最も高く、次に、“オオカミ”の予測検索
頻度が高いので、この順番で音声信号との照合処理が実
行される。このように、過去の貸出頻度が考慮されて照
合処理が実行されるので、音声信号に対応する部分単語
列が早期に検索される確率が高まり、音声認識処理の高
速化を図ることができる効果を奏する。なお、各部分単
語列毎に予測検索頻度を累算した後、頻度の大きい一定
数の部分単語列を更に選択するようにしてもよい。
【0057】実施の形態6.上記実施の形態5では、図
書の予測検索頻度に基づいて各部分単語列の予測検索頻
度を累算するものについて示したが、音声認識辞書作成
部14が音声認識辞書を作成する際、図書の貸出頻度に
基づいて文字列を構成する単語間の遷移確率を設定する
ようにしてもよい。
【0058】具体的には、音声認識辞書を確率モデルと
して使用する場合、図11に示すように、キーワードか
ら生成される音声認識辞書に単語間の遷移確率を付け加
えるものである。図11では単語の左上にそれぞれの単
語へわたる遷移確率を示している。先頭単語は8単語存
在し、これらの8単語で予測検索頻度の合計は“72”
である。そのため、先頭から“ピーター”に遷移する確
率は28/72と見なされる。同様に、“ピーター”に
続く単語は3単語あり、それらの予測検索頻度の合計は
“28”である。そのため、“ラビット”に遷移する確
率は12/28と見なされる。
【0059】このようにして、全ての単語間に遷移確率
が計算されると、音声認識処理の実行中、単語間を遷移
する時に、この確率を乗ずると、予測検索頻度の高いキ
ーワードのスコアを高める効果があり、予測検索頻度の
高いキーワードを認識し易くすることができる。
【0060】さらに、音声認識装置では、一般的に用い
られるビームサーチ技術を併用する場合、予測検索頻度
の低いキーワードはスコアが小さくなり、認識対象範囲
から脱落させる効果があるため、このように遷移確率を
付与し、確率モデルとして照合することにより、キーワ
ードの個数を制限するのと同様の効果を奏する。
【0061】実施の形態7.上記実施の形態5では、図
書の予測検索頻度に基づいて各部分単語列の予測検索頻
度を累算するものについて示したが、音声認識辞書作成
部14が音声認識辞書を作成する際、図書が属するカテ
ゴリを分類して、カテゴリ毎に利用頻度を合計し、その
合計値に基づいて各カテゴリに属する図書の文字列の予
測検索頻度に下限値を設定するようにしてもよい。
【0062】ここでは、図書館における図書検索システ
ムを一例とし、物品の利用頻度を図書の貸出頻度とし、
物品のカテゴリを著者として説明を行う。有名な著者の
図書は、検索される頻度が高いと考えられる。そのた
め、貸出頻度を著者毎に加算して、著者毎の貸出頻度の
合計値を計算し、その著者が著した図書の予測検索頻度
の下限値を設定する。これにより、著名な著者が著した
図書がキーワードから脱落するのを防止することができ
る。
【0063】具体的には、図12に示すように、同じ著
者が著した図書が3個あり、これらの図書の貸出頻度が
それぞれ“12.0”,“3.0”,“0.0”である
とする。この場合、これらの平均値が“5.0”である
ため、その10%に相当する“0.5”を予測検索頻度
の下限値とすると、これらの図書の貸出頻度がそれぞれ
“12.0”,“3.0”,“0.5”となる。
【0064】これにより、貸出頻度が“0.0”である
“ピーターラビットとなかまたち”もキーワードとして
選択され易くなり、著名な著者が著した図書に属するキ
ーワードが選択され易くなるという効果を奏する。ま
た、新刊図書は貸出頻度が“0.0”であるため、キー
ワードとして抽出されにくいが、この実施の形態7によ
れば、新刊図書においても、著名な著者が著した場合等
には、キーワードとして選択され易くなるという効果を
奏する。なお、上記の説明では、予測検索頻度の下限値
を著者毎の平均値の10%として説明を行ったが、これ
に限るものでないことは言うまでもない。
【0065】
【発明の効果】以上のように、この発明によれば、解析
手段の解析結果である単語の形態素を参照してデータベ
ースに登録された文字列から、付属語から始まらない部
分単語列を抽出する抽出手段と、その抽出手段により抽
出された部分単語列をキーワードとする音声認識辞書を
作成する辞書作成手段とを設けるように構成したので、
ユーザが書名等の検索時に発声する可能性が低いキーワ
ードを除いて音声認識辞書を作成することができるよう
になり、その結果、音声認識辞書に登録されるキーワー
ドの個数が減少するため、音声認識処理を速やかに実行
することができる効果がある。
【0066】この発明によれば、部分単語列の先頭単語
を音節木構造化して、音声認識辞書を作成するように構
成したので、音声認識処理の演算量が減少する結果、音
声認識処理を速やかに実行することができる効果があ
る。
【0067】この発明によれば、抽出手段により抽出さ
れた部分単語列の先頭単語を音節木構造化して、その部
分単語列をキーワードとする音声認識辞書を作成する辞
書作成手段を設けるように構成したので、音声認識処理
の演算量が減少する結果、音声認識処理を速やかに実行
することができる効果がある。
【0068】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け選定し、その文字列から部分単語列を抽出するように
構成したので、検索される可能性の低いキーワードの登
録が除外される結果、音声認識処理を速やかに実行する
ことができる効果がある。
【0069】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が規定値以上の検索対象の文字列を選定し、そ
の文字列から部分単語列を抽出するように構成したの
で、検索される可能性の低いキーワードの登録が除外さ
れる結果、音声認識処理を速やかに実行することができ
る効果がある。
【0070】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け順番に選定し、その文字列から部分単語列を抽出する
抽出手段を設けるように構成したので、検索される可能
性の低いキーワードの登録が除外される結果、音声認識
処理を速やかに実行することができる効果がある。
【0071】この発明によれば、音声認識辞書を作成す
る際、文字列に係る検索対象の利用頻度に基づいて各部
分単語列の予測検索頻度を累算し、予測検索頻度が高い
部分単語列から順番に音声信号と照合するように構成し
たので、音声信号に対応する部分単語列が早期に検索さ
れる確率が高まり、音声認識処理の高速化を図ることが
できる効果がある。
【0072】この発明によれば、文字列に係る検索対象
の利用頻度に基づいて文字列を構成する単語間の遷移確
率を設定するように構成したので、予測検索頻度の高い
キーワードの認識が容易になる効果がある。
【0073】この発明によれば、文字列に係る検索対象
が属するカテゴリを分類して、カテゴリ毎に利用頻度を
合計し、その合計値に基づいて各カテゴリに属する検索
対象の文字列の予測検索頻度に下限値を設定するように
構成したので、例えば、著名な著者が著した図書がキー
ワードから脱落するのを防止することができる効果があ
る。
【0074】この発明によれば、単語の形態素を参照し
てデータベースに登録された文字列から、付属語から始
まらない部分単語列を抽出して、その部分単語列をキー
ワードとする音声認識辞書を作成するように構成したの
で、ユーザが書名等の検索時に発声する可能性が低いキ
ーワードを除いて音声認識辞書を作成することができる
ようになり、その結果、音声認識辞書に登録されるキー
ワードの個数が減少するため、音声認識処理を速やかに
実行することができる効果がある。
【0075】この発明によれば、データベースに登録さ
れた文字列から部分単語列を抽出すると、その部分単語
列の先頭単語を音節木構造化して、その部分単語列をキ
ーワードとする音声認識辞書を作成するように構成した
ので、音声認識処理の演算量が減少する結果、音声認識
処理を速やかに実行することができる効果がある。
【0076】この発明によれば、データベースに登録さ
れた文字列に係る検索対象の利用頻度を参照して、その
利用頻度が高い順番に検索対象の文字列を規定の個数だ
け順番に選定し、その文字列から部分単語列を抽出する
ように構成したので、検索される可能性の低いキーワー
ドの登録が除外される結果、音声認識処理を速やかに実
行することができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声認識装置
を示す構成図である。
【図2】 この発明の実施の形態1による音声認識方法
を示すフローチャートである。
【図3】 部分単語列の抽出方法を説明する説明図であ
る。
【図4】 抽出された部分単語列を示す説明図である。
【図5】 音声認識辞書の辞書構成を示す構成図であ
る。
【図6】 この発明の実施の形態2による音声認識装置
を示す構成図である。
【図7】 音声認識辞書の辞書構成を示す構成図であ
る。
【図8】 この発明の実施の形態3による音声認識装置
を示す構成図である。
【図9】 図書データベースの貸出頻度等を示す説明図
である。
【図10】 部分単語列に付加された予測検索頻度を示
す説明図である。
【図11】 確率モデルからなる音声認識辞書の辞書構
成を示す構成図である。
【図12】 図書データベースの貸出頻度等を示す説明
図である。
【図13】 従来の音声認識装置を示す構成図である。
【図14】 図書データベースの構成を説明する説明図
である。
【図15】 部分単語列の抽出方法を説明する説明図で
ある。
【図16】 抽出された部分単語列を示す説明図であ
る。
【図17】 音声認識辞書の辞書構成を示す構成図であ
る。
【符号の説明】
12 形態素解析部(解析手段)、13,21 キーワ
ード抽出部(抽出手段)、14 音声認識辞書作成部
(辞書作成手段)、16 音声認識部(音声認識手
段)、17 データベース検索部(データベース検索手
段)、19 音節木構造化部(辞書作成手段)、20
検索頻度推定部(抽出手段)。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/403 310Z

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 データベースに登録された文字列を構成
    する単語の形態素を解析する解析手段と、上記解析手段
    の解析結果を参照して上記データベースに登録された文
    字列から、付属語から始まらない部分単語列を抽出する
    抽出手段と、上記抽出手段により抽出された部分単語列
    をキーワードとする音声認識辞書を作成する辞書作成手
    段と、上記辞書作成手段により作成された音声認識辞書
    から音声信号に対応する部分単語列を検索する音声認識
    手段と、上記データベースから上記音声認識手段により
    検索された部分単語列に対応する文字列を検索するデー
    タベース検索手段とを備えた音声認識装置。
  2. 【請求項2】 辞書作成手段は、音声認識辞書を作成す
    る際、部分単語列の先頭単語を音節木構造化して、音声
    認識辞書を作成することを特徴とする請求項1記載の音
    声認識装置。
  3. 【請求項3】 データベースに登録された文字列から部
    分単語列を抽出する抽出手段と、上記抽出手段により抽
    出された部分単語列の先頭単語を音節木構造化して、そ
    の部分単語列をキーワードとする音声認識辞書を作成す
    る辞書作成手段と、上記辞書作成手段により作成された
    音声認識辞書から音声信号に対応する部分単語列を検索
    する音声認識手段と、上記データベースから上記音声認
    識手段により検索された部分単語列に対応する文字列を
    検索するデータベース検索手段とを備えた音声認識装
    置。
  4. 【請求項4】 抽出手段は、データベースに登録された
    文字列に係る検索対象の利用頻度を参照して、その利用
    頻度が高い順番に検索対象の文字列を規定の個数だけ選
    定し、その文字列から部分単語列を抽出することを特徴
    とする請求項1から請求項3のうちのいずれか1項記載
    の音声認識装置。
  5. 【請求項5】 抽出手段は、データベースに登録された
    文字列に係る検索対象の利用頻度を参照して、その利用
    頻度が規定値以上の検索対象の文字列を選定し、その文
    字列から部分単語列を抽出することを特徴とする請求項
    1から請求項3のうちのいずれか1項記載の音声認識装
    置。
  6. 【請求項6】 データベースに登録された文字列に係る
    検索対象の利用頻度を参照して、その利用頻度が高い順
    番に検索対象の文字列を規定の個数だけ順番に選定し、
    その文字列から部分単語列を抽出する抽出手段と、上記
    抽出手段により抽出された部分単語列をキーワードとす
    る音声認識辞書を作成する辞書作成手段と、上記辞書作
    成手段により作成された音声認識辞書から音声信号に対
    応する部分単語列を検索する音声認識手段と、上記デー
    タベースから上記音声認識手段により検索された部分単
    語列に対応する文字列を検索するデータベース検索手段
    とを備えた音声認識装置。
  7. 【請求項7】 辞書作成手段は、音声認識辞書を作成す
    る際、文字列に係る検索対象の利用頻度に基づいて各部
    分単語列の予測検索頻度を累算し、音声認識手段は、予
    測検索頻度が高い部分単語列から順番に音声信号と照合
    することを特徴とする請求項4から請求項6のうちのい
    ずれか1項記載の音声認識装置。
  8. 【請求項8】 辞書作成手段は、音声認識辞書を作成す
    る際、文字列に係る検索対象の利用頻度に基づいて文字
    列を構成する単語間の遷移確率を設定することを特徴と
    する請求項7記載の音声認識装置。
  9. 【請求項9】 辞書作成手段は、音声認識辞書を作成す
    る際、文字列に係る検索対象が属するカテゴリを分類し
    て、カテゴリ毎に利用頻度を合計し、その合計値に基づ
    いて各カテゴリに属する検索対象の文字列の予測検索頻
    度に下限値を設定することを特徴とする請求項7または
    請求項8記載の音声認識装置。
  10. 【請求項10】 データベースに登録された文字列を構
    成する単語の形態素を解析すると、その解析結果を参照
    して上記データベースに登録された文字列から、付属語
    から始まらない部分単語列を抽出して、その部分単語列
    をキーワードとする音声認識辞書を作成する一方、その
    音声認識辞書から音声信号に対応する部分単語列を検索
    し、上記データベースから当該部分単語列に対応する文
    字列を検索する音声認識方法。
  11. 【請求項11】 データベースに登録された文字列から
    部分単語列を抽出すると、その部分単語列の先頭単語を
    音節木構造化して、その部分単語列をキーワードとする
    音声認識辞書を作成する一方、その音声認識辞書から音
    声信号に対応する部分単語列を検索し、上記データベー
    スから当該部分単語列に対応する文字列を検索する音声
    認識方法。
  12. 【請求項12】 データベースに登録された文字列に係
    る検索対象の利用頻度を参照して、その利用頻度が高い
    順番に検索対象の文字列を規定の個数だけ順番に選定
    し、その文字列から部分単語列を抽出すると、その部分
    単語列をキーワードとする音声認識辞書を作成する一
    方、その音声認識辞書から音声信号に対応する部分単語
    列を検索し、上記データベースから当該部分単語列に対
    応する文字列を検索する音声認識方法。
JP11062300A 1999-03-09 1999-03-09 音声認識装置及び音声認識方法 Pending JP2000259653A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11062300A JP2000259653A (ja) 1999-03-09 1999-03-09 音声認識装置及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11062300A JP2000259653A (ja) 1999-03-09 1999-03-09 音声認識装置及び音声認識方法

Publications (1)

Publication Number Publication Date
JP2000259653A true JP2000259653A (ja) 2000-09-22

Family

ID=13196150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11062300A Pending JP2000259653A (ja) 1999-03-09 1999-03-09 音声認識装置及び音声認識方法

Country Status (1)

Country Link
JP (1) JP2000259653A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002304189A (ja) * 2001-04-05 2002-10-18 Nippon Telegr & Teleph Corp <Ntt> 音声認識利用型文書作成方法、装置、認識辞書作成プログラム、および同プログラムを記録した記録媒体
JP2007322758A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
JP2010211075A (ja) * 2009-03-11 2010-09-24 Sony Ericsson Mobile Communications Ab 携帯情報端末、情報処理方法及び情報処理プログラム
KR101434190B1 (ko) * 2012-11-12 2014-08-27 주식회사 인프라웨어 음성신호를 이용한 전자도서 제어방법 및 장치
JP2016500843A (ja) * 2012-10-18 2016-01-14 グーグル インコーポレイテッド 検索クエリ情報を使用する音声認識処理のための方法およびシステム
CN101685498B (zh) * 2008-06-20 2016-04-20 富士通先端科技株式会社 帐票识别装置、方法、数据库生成装置、方法
CN106328146A (zh) * 2016-08-22 2017-01-11 广东小天才科技有限公司 一种视频的字幕生成方法及装置
CN108630200A (zh) * 2017-03-17 2018-10-09 株式会社东芝 声音关键字检测装置以及声音关键字检测方法
CN112749258A (zh) * 2021-01-21 2021-05-04 京东数字科技控股股份有限公司 数据搜索的方法和装置、电子设备和存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002304189A (ja) * 2001-04-05 2002-10-18 Nippon Telegr & Teleph Corp <Ntt> 音声認識利用型文書作成方法、装置、認識辞書作成プログラム、および同プログラムを記録した記録媒体
JP2007322758A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
JP4736962B2 (ja) * 2006-06-01 2011-07-27 日産自動車株式会社 キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
CN101685498B (zh) * 2008-06-20 2016-04-20 富士通先端科技株式会社 帐票识别装置、方法、数据库生成装置、方法
JP2010211075A (ja) * 2009-03-11 2010-09-24 Sony Ericsson Mobile Communications Ab 携帯情報端末、情報処理方法及び情報処理プログラム
JP2016500843A (ja) * 2012-10-18 2016-01-14 グーグル インコーポレイテッド 検索クエリ情報を使用する音声認識処理のための方法およびシステム
KR101434190B1 (ko) * 2012-11-12 2014-08-27 주식회사 인프라웨어 음성신호를 이용한 전자도서 제어방법 및 장치
CN106328146A (zh) * 2016-08-22 2017-01-11 广东小天才科技有限公司 一种视频的字幕生成方法及装置
CN108630200A (zh) * 2017-03-17 2018-10-09 株式会社东芝 声音关键字检测装置以及声音关键字检测方法
CN108630200B (zh) * 2017-03-17 2022-01-07 株式会社东芝 声音关键字检测装置以及声音关键字检测方法
CN112749258A (zh) * 2021-01-21 2021-05-04 京东数字科技控股股份有限公司 数据搜索的方法和装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US7983915B2 (en) Audio content search engine
JP3488174B2 (ja) 内容情報と話者情報を使用して音声情報を検索するための方法および装置
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US8126897B2 (en) Unified inverted index for video passage retrieval
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
US20080270110A1 (en) Automatic speech recognition with textual content input
JP2742115B2 (ja) 類似文書検索装置
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
US20040073874A1 (en) Device for retrieving data from a knowledge-based text
JP5321583B2 (ja) 共起辞書生成システム、スコアリングシステム、共起辞書生成方法、スコアリング方法及びプログラム
JP2012027845A (ja) 情報処理装置、関連文提供方法、及びプログラム
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001084255A (ja) 文書検索装置および方法
JP2000259653A (ja) 音声認識装置及び音声認識方法
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003150624A (ja) 情報抽出装置および情報抽出方法
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
JP6735711B2 (ja) 学習装置、映像検索装置、方法、及びプログラム
JP2007172179A (ja) 意見抽出装置、意見抽出方法、および意見抽出プログラム
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置
JP2002183194A (ja) 検索式生成装置およびその方法
JPH06274546A (ja) 情報量一致度計算方式
CN113486155B (zh) 一种融合固定短语信息的中文命名方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071108

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071108

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071211