JP2009109758A - 音声認識辞書生成装置及び方法 - Google Patents
音声認識辞書生成装置及び方法 Download PDFInfo
- Publication number
- JP2009109758A JP2009109758A JP2007282161A JP2007282161A JP2009109758A JP 2009109758 A JP2009109758 A JP 2009109758A JP 2007282161 A JP2007282161 A JP 2007282161A JP 2007282161 A JP2007282161 A JP 2007282161A JP 2009109758 A JP2009109758 A JP 2009109758A
- Authority
- JP
- Japan
- Prior art keywords
- abbreviation
- word
- dictionary
- speech recognition
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】ユーザが用いる省略語の認識率が高い音声認識辞書生成装置を提供する。
【解決手段】ユーザが作成した文章を入力する入力部31と、入力された文章を単語に分割し、当該分割された各単語と辞書に登録された単語とを比較する構文解析部32と、構文解析部による比較に基づいて省略語を抽出する既知省略語判定部33及び省略語推定部34と、抽出された省略語の正式単語を特定する省略語判定部35と、抽出された省略語と特定された正式単語とを関連付けて辞書に登録する登録部37とを備える。
【選択図】 図1
【解決手段】ユーザが作成した文章を入力する入力部31と、入力された文章を単語に分割し、当該分割された各単語と辞書に登録された単語とを比較する構文解析部32と、構文解析部による比較に基づいて省略語を抽出する既知省略語判定部33及び省略語推定部34と、抽出された省略語の正式単語を特定する省略語判定部35と、抽出された省略語と特定された正式単語とを関連付けて辞書に登録する登録部37とを備える。
【選択図】 図1
Description
本発明は、音声認識に用いられる辞書の生成装置及び生成方法に関するものである。
省略語を認識する音声認識装置として、発声のし易さを考慮したルールに基づいて認識対象語の省略語を生成し、これを認識対象語とともに音声認識辞書に登録するようにしたものが知られている(特許文献1参照)。
しかしながら、発声し易い省略語であってもユーザが用いる省略語とは異なる場合には、ユーザが用いる省略語を認識できないという問題があった。
本発明が解決しようとする課題は、ユーザが用いる省略語の認識率が高い音声認識辞書生成装置及び方法を提供することである。
本発明は、以下の解決手段によって上記課題を解決する。
すなわち本発明は、ユーザが作成した文章を用い、ここから省略語を抽出することを特徴とする。そして、ユーザによる文章から省略語の正式単語を特定し、これらを関連付けて辞書に登録する。
本発明によれば、ユーザが用いる省略語の認識率が向上する。
以下、本発明の実施形態を図面に基づいて説明する。
図1は、本実施形態に係る音声認識辞書生成装置を示すブロック図である。
なお、図1に示す音声認識辞書生成装置は音声認識機能付きナビゲーション装置の一部として機能するものである。したがって、最初に音声認識機能付きナビゲーション装置の全体構成について説明し、次いで音声認識辞書生成装置としての動作と、ナビゲーション装置の音声認識機能の動作とを説明する。
同図に示す装置は、入力装置1と、ナビゲーション装置2と、制御装置3と、辞書4とを備える。
入力装置1は、マイクロフォン11、携帯電話機12、タッチパネル13及びキーボード14などを備え、音声認識辞書生成装置として機能する際は、マイクロフォン11、携帯電話機12、タッチパネル13及びキーボード14の全てを用いることができる。また、ナビゲーション装置の音声認識機能として作用する際は、マイクロフォン11やタッチパネル13が用いられる。
音声認識辞書生成装置として機能する際の入力装置1は、本装置を利用するユーザが作成した文章を入力するとともに、この文章を制御装置3の入力部31へ出力するために用いられる。
たとえば、マイクロフォン11は、ユーザが作成した文章を音声として入力し、これを入力部31へ出力する。また、携帯電話機12は、携帯電話機の音声送信機能を利用し、ユーザが作成した文章を音声で入力するとともにこれを入力部31へ通信信号として出力する。また、携帯電話機12は、その電子メール機能を利用し、ユーザが作成した文章を電子メール(テキストファイルデータ)として入力するとともに、電気通信網を介して入力部31へ出力することもできる。タッチパネル13は、たとえばナビゲーション装置2のディスプレイ24に設けられたものであり、このタッチパネル13からユーザが作成した文章を入力し、入力部31へ出力する。キーボード14は、別設された入力装置であり、このキーボード14からユーザが作成した文章を入力し、入力部31へ出力する。
なお、マイクロフォン11や携帯電話機12の音声送信機能による入力操作は、音声による文章入力であるのに対し、携帯電話機12の電子メール機能、タッチパネル13及びキーボード14は、スイッチ操作による文章の電子的入力である。
ナビゲーション装置2の音声認識機能として作用する際のマイクロフォン11は、ナビゲーション装置2の各種入力操作をユーザの音声により行うものであり、ユーザが所望の指令を発声すると、この音声がマイクロフォン11から入力部31へ読み込まれ、音声を認識したのち、その指令をナビゲーション装置2へ出力する。これにより、タッチパネル13などによる入力操作が省かれることになる。
ナビゲーション装置2は、GPSアンテナ21、車速センサ22、ジャイロセンサ23、ディスプレイ24及び地図データベース25などを備える。なお、地図データベース25には、店舗などの施設名とその住所が関連付けられて記憶されている。そして、マイクロフォン11からの音声指令が入力された際にはナビゲーション装置2の音声認識機能が働いてその音声を認識し、タッチパネル13からの手入力と同様に、目的地、経由地、経路などを設定することができる。なお、本例のナビゲーション装置2は公知の装置であるため、本実施形態に関連する入力処理以外の構成や処理については、その制御部の図示を含め詳細な説明を省略する。
辞書4は、構文解析辞書41、省略語辞書42、単語辞書43、待ち受け辞書44及び手操作省略語辞書45を備える。
構文解析辞書41は、入力された文章又は指示の形態素解析及び構文解析を制御装置3の構文解析部32にて実行する際に参照する辞書であり、形態素解析や構文解析に必要な一般単語が品詞等とともに登録されている。
省略語辞書42は、ユーザが作成した文章から抽出された省略語が登録済みであるかどうかを制御装置3の既知省略語判定部33にて判定する際に参照する辞書であり、一般的に慣用されている省略語や、これまで登録されたユーザがよく使用する省略語が登録されている。
単語辞書43は、抽出された省略語の正式単語を制御装置3の省略語推定部34にて推定する際に参照する辞書であり、さらに、推定された正式単語の精度(確かさ)を制御装置3の省略語判定部35にて判定する際に参照する辞書でもある。この単語辞書43には、一般的な単語とその関連語(キーワード)が関連付けられて登録されている。
図3は、本実施形態に係る単語辞書43のデータ構造の一例を示す図、図4は単語辞書43のデータ構造の他の例を示す図である。
図3に示す例は、いわゆるタグ付き辞書であり、「マツモトキヨシ」(登録商標)、「ケンタッキーフライドチキン」(登録商標)、「セブンイレブン」(登録商標)といった単語のそれぞれに、「マツモトキヨシ」の単語では、薬局、ドラッグストア、風邪薬、買うなどの関連語が関連付けられて登録され、「ケンタッキーフライドチキン」の単語では、食べる、食事、チキン、ファーストフードなどの関連語が関連付けられて登録され、「セブンイレブン」の単語では、コンビニ、買うなどの関連語が関連付けられて登録されている。
これに対して、図4に示す例は、いわゆるネットワーク辞書であり、「マツモトキヨシ」、「ケンタッキーフライドチキン」、「セブンイレブン」といった単語のそれぞれに、「マツモトキヨシ」の単語では、風邪薬、買う、歯ブラシ、調剤薬局などの関連語がネットワーク化されて登録され、「ケンタッキーフライドチキン」の単語では、買う、食べるなどの関連語がネットワーク化されて登録され、「セブンイレブン」の単語では、買う、食べる、歯ブラシなどの関連語がネットワーク化されて登録されている。
何れの形態にしても、単語辞書43に登録された「マツモトキヨシ」、「ケンタッキーフライドチキン」、「セブンイレブン」といった単語を参照すると、その関連語も参照できるようにデータベース化されている。
図1に戻り、待ち受け辞書44は、ナビゲーション装置2の音声認識機能を用いる場合において、ユーザからの指令音声を構文解析部32が認識する際に参照する辞書であり、単語辞書43に登録されたものと同様の単語と、省略語辞書42に登録された省略語が登録されている。
手操作省略語辞書45は、ナビゲーション装置2のユーザによる指示を手操作で行う場合において、その指示内容を認識する際に参照する辞書であり、手操作する際に参照される省略語と単語が登録されている。
制御装置3は、入力部31、構文解析部32、既知省略語判定部33、省略語推定部34、省略語判定部35、手操作省略語判定部36及び登録部37などを備える。
入力部31は、上述したとおり、音声認識辞書生成装置として機能する際は、ユーザが作成した文章を、マイクロフォン11、携帯電話機12、タッチパネル13及びキーボード14などの入力装置1を介して入力し、この文章を構文解析部32へ出力する。また、ナビゲーション装置2の音声認識機能として作用する際は、ユーザの指令を、マイクロフォン11やタッチパネル13などの入力装置1を介して入力し、構文解析部32へ出力する。
構文解析部32は、音声認識辞書生成装置として機能する際は、入力部31から送られてきた文章を、構文解析辞書41を参照しながら形態素解析及び構文解析を実行して単語に分割する。
ここで、形態素解析とは構文解析の足場となるもので、入力された文章を形態素(意味をもつ最小単位)の品詞を判別する操作である。また、本例の構文解析とは、上記形態素解析の結果判別された品詞に基づいて、入力された文章を単語に分割する操作である。たとえば、入力部31に「昨日、海老名のマツキヨで風邪薬を買ったあと、ケンタで昼食を食べたよ。」(マツキヨとケンタは登録商標)という文章が入力されたとすると、構文解析部32は、これを「昨日/海老名/の/マツキヨ/で/風邪薬/を/買った/あと/ケンタ/で/昼食/を/食べた/よ」というように各単語に分割する。
さらに、構文解析部32は、上記のようにして分割された各単語が、構文解析辞書41に登録された単語であるかどうかを検索し、登録されていない単語を省略語として抽出し、抽出された省略語を既知省略語判定部33に出力する。後述するように、構文解析辞書41には、一般的な単語が登録されており、形態素解析により変化した単語であっても該当する単語が特定されるので、一般的な単語以外の省略語などがここで抽出される。
なお、構文解析部32がナビゲーション装置2の音声認識機能として作用する場合は、マイクロフォン11から入力された音声を上述した形態素解析及び構文解析により単語に分割したのち、待ち受け辞書44を参照して文章の意味を解析する。そして、解析結果としてのユーザ指令をナビゲーション装置2の制御部へ出力する。また、タッチパネル13から入力されたスイッチ操作による入力データを、手操作省略語辞書45を参照して意味を認識し、解析結果としてのユーザ指令をナビゲーション装置2の制御部へ出力する。
既知省略語判定部33は、音声認識辞書生成装置特有の処理手段であり、構文解析部32から送られてきた省略語が省略語辞書42に登録されているか否かを検索し、登録されていない場合は、その省略語を省略語推定部34へ出力する。
省略語推定部34は、音声認識辞書生成装置特有の処理手段であり、既知省略語判定部33から送られてきた未登録の省略語の正式単語が何かを単語辞書43を参照しながら推定する処理手段である。ここで、正式単語とは、省略語の本来の単語、すなわち省略しなかったときの単語の意味であり、上記“マツキヨ”の例で言えばこの省略語の正式単語は「マツモトキヨシ」である。
省略語推定部34における省略語の正式単語の推定処理は、たとえばその省略語と単語辞書43に登録されている単語とを対比し、所定の閾値以上同じ文字列があったときは、その単語をその省略語の正式単語と推定することにより行われる。
なお、この場合の所定の閾値は、定数とすることもできるが、省略語の文字列の数に応じて変動させることもできる。たとえば、“マツキヨ” のように省略語が4文字である場合は所定の閾値を4文字とし、“ケンタ” のように省略語が3文字である場合は所定の閾値を3文字とすることができる。一般的な省略語は、正式単語の文字列のうちの幾つかをそのまま引用することが多いので、省略語の文字列数を所定の閾値とすると推定精度がより向上することになる。
なお、省略語推定部34で推定された正式単語が複数ある場合も含めて、その省略語と推定された正式単語とを省略語判定部35へ出力する。
省略語判定部35は、音声認識辞書生成装置特有の処理手段であり、省略語推定部34で推定された正式単語の精度(確かさ)を確認して決定する処理手段であり、以下のように幾つかの判定手法を採ることができる。
一つの手法は、図3又は図4に示すような、単語辞書43に登録された単語の関連語を利用して判定する手法である。すなわち、ある省略語を含む文章には、その省略語の前後などに、その省略語の正式単語に関連する関連語(キーワード)を用いることが少なくない。たとえば、“マツキヨ”が「マツモトキヨシ」の省略語であると推定した場合、推定された正式単語が「マツモトキヨシ」であれば、その文章の中に「マツモトキヨシ」に関連する関連語が使用されている可能性が高い。この手法では、こうした関連語を用いて正式単語の確かさを検証し、関連語が文章中に用いられているときは、その推定された正式単語をその省略語の正式単語とみなす。
その他の手法として、ナビゲーション装置2の地図データベース25のデータを用いて検証することもできる。たとえば、推定された正式単語が店舗などの施設名である場合、その施設が所在する地名が文章中にあることも少なくない。この手法では、文章中に出てきた地名を含む周辺地域に、推定された正式単語の施設が所在するかどうかを、地図データベース25を参照して検証し、所在するときは、その推定された正式単語をその省略語の正式単語とみなす。
なお、省略語判定部35にて正式単語であると判定されたものは、省略語と関連付けられた状態で登録部37と手操作省略語判定部36へ出力される。これに対して、省略語判定部35にて正式単語であると判定されなかった場合には、その推定された正式単語を破棄し、登録部37には出力しない。
手操作省略語判定部36は、音声認識辞書生成装置特有の処理手段であり、省略語判定部35から送られてきた省略語が、その正式単語から見て手操作省略辞書45に登録すべき省略語であるか否かを判定する。
ナビゲーション装置2の手操作入力においては、省略語が語頭から連続した文字列である場合には、そのままその正式単語は出力される。たとえば、手操作省略語辞書45には、一つの単語としての「ケンタッキーフライドチキン」が登録されているので、ユーザが「ケンタ」まで手操作で入力すると、「ケンタッキーフライドチキン」という単語がヒットすることになる。
逆に、省略語がその正式単語と関連付けられて手操作省略語辞書45に登録されてしまうと、語頭の文字列が同じである他の単語が検索に引っかからない可能性がある。たとえば、「ケンタ」という単語を「ケンタッキーフライドチキン」の省略語であるとして登録すると、語頭の文字列が「ケンタ」である「現代出版」や「居酒屋健太」(現代出版及び居酒屋健太は商標)などの単語がヒットしないおそれがある。したがってこのような場合には、その省略語と正式単語とを関連付けて手操作省略語辞書45に登録しないこととする。
これに対して、正式単語の文字列の中間文字列を間引いてできた省略語、たとえば、マツモトキヨシ→マツキヨや、正式単語の後半の文字列を用いた省略語、たとえばサイゼリア→ゼリア(サイゼリアは商標)などの場合には、上述した不都合はなく、また省略語として登録すると認識率が向上するので、手操作省略語として適切であると判定し、その正式単語と省略語を登録部37へ出力する。
登録部37は、音声認識辞書生成装置特有の処理手段であり、省略語判定部35から送られてきた正式単語と省略語とを省略語辞書42及び待ち受け辞書44に登録する。また、手操作省略語判定部36から送られてきた正式単語と省略語とを手操作省略語辞書45に登録する。
なお、上記入力部31が本発明の入力手段、上記構文解析部32が本発明の解析手段、上記既知省略語判定部33と上記省略語推定部34が本発明の抽出手段、上記省略語判定部35が本発明の特定手段、上記登録部37が本発明の登録手段にそれぞれ対応する。
次に、本実施形態の音声認識辞書生成装置としての動作を説明する。
図2は、本実施形態に係る音声認識辞書生成装置の動作を示すフローチャートである。
まず、ステップS1にて、当該音声認識辞書生成装置を用いるユーザが作成した文章を、マイクロフォン11,携帯電話機12,ディスプレイのタッチパネル13又はキーボード14から入力部31へ入力する。なお、この入力操作は、機会があるたびに頻繁に実行することが好ましい。
たとえば、「昨日、海老名のマツキヨで風邪薬を買ったあと、ケンタで昼食を食べたよ。」という文章が入力されたものとする。
次のステップS2では、構文解析辞書41から構文解析部32に形態素解析及び構文解析に必要なデータを読み込み、ステップS3にて形態素解析及び構文解析を実行して入力したユーザの文章を各単語に分割する。
この形態素解析及び構文解析により、上記文章は、「キノウ・エビナ・ノ・マツキヨ・デ・カゼグスリ・ヲ・カッタ・アト・ケンタ・デ・チュウショク・ヲ・タベタ・ヨ」といった各単語に分割される。
次のステップS4では、上記のように分割された各単語のうち、構文解析辞書41に登録されていない単語があるか否かを判定し、不明な単語がなかった場合はステップS1へ戻って次の文章の構文解析を続行する。
これに対して、ステップS4にて不明な単語があった場合には、その単語を抽出して既知省略語判定部33へ出力し、ステップS5へ進む。上記文章で言えば、“マツキヨ”と、“ケンタ”が不明な単語として抽出される。
ステップS5では、省略語辞書42から既知省略語判定部33に必要なデータを読み込む。そして、入力された“マツキヨ”と“ケンタ”が、省略語辞書42に登録されているか否かを検索し、ステップS6にて省略語辞書42に登録されている省略語と一致する場合はステップS1へ戻って次の文章の構文解析を続行する。
これに対して、ステップS6にて省略語辞書42に登録された省略語のいずれにも一致しない場合には、これらの省略語を省略語推定部34へ出力し、ステップS7へ進む。
ステップS7では、単語辞書43から省略語推定部34に必要なデータを読み込み、ステップS8では、単語辞書43のデータを用いてこれらの不明な単語が何の省略語であるのかを推定する。たとえば、不明な単語の文字列と単語辞書43に登録された単語の文字列とを比較し、所定の閾値(たとえば3文字)以上同一であるときは、その不明な単語がその単語の省略語であると推定する。
上記の“マツキヨ”の例で言えば、単語辞書43に登録された「マツモトキヨシ」と4文字同一であり、“ケンタ”の例で言えば、単語辞書43に登録された「ケンタッキーフライドチキン」と3文字同一であるので、省略語推定部34は、“マツキヨ”は「マツモトキヨシ」の省略語であり、“ケンタ”は「ケンタッキーフライドチキン」の省略語であると推定する。
次のステップS9〜S10では、省略語推定部43にて推定された省略語が正しいか否かを省略語判定部44において判定する。省略語判定部44では、省略語推定部43でも用いた単語辞書43の関連語のデータを用いて省略語の推定が正しいかどうかを判定する。
たとえば、図3に示す単語辞書43の例では、「マツモトキヨシ」という単語には、“薬局”、“ドラッグストア”、“風邪薬”、“買う”といった関連語が結びつけられており、このうちのいずれかが入力された文章の中で不明な単語“マツキヨ”の周囲に存在するかどうかを判定し、存在する場合はその推定が正しいものと判定する。上記の例では、「昨日海老名の“マツキヨ”で風邪薬を買ったあと…」という入力文章の中に関連語である「風邪薬」と「買う」が存在するので、“マツキヨ”が「マツモトキヨシ」の省略語であると判定する。
同様に、図3に示す単語辞書43の例では、「ケンタッキーフライドチキン」という単語には、“食べる”、“食事”、“チキン”、“ファーストフード”といった関連語が結び付けられており、入力された文章は「…ケンタで昼食を食べたよ。」であるから、「食べる」が存在する。したがって、“ケンタ”が「ケンタッキーフライドチキン」の省略語であると判定する。
なお、上述したように、省略語判定部44における他の判定手法として、省略語の正式単語が店舗などの施設名であり、その施設に関連する地名が入力文章中にある場合には、その地名を含む地域に省略語の施設が存在するか否かを、地図データベース24から検索し、判定することもできる。
上記文章の例で言えば、「昨日、海老名のマツキヨで風邪薬を…」という入力文章中に、省略語であると推定された“マツキヨ”の前後に「海老名」という地名が存在するので、海老名を含む地域にマツモトキヨシという店舗(施設)が存在するか否かを、地図データベース24を参照して判定する。そして、海老名地域に「マツモトキヨシ」が存在すれば、マツキヨがマツモトキヨシの省略語であると判定する。
ステップS10の判定の結果、省略語ではないと判定された場合は、その推定が誤っていたとみなし、推定された省略語を廃棄し、ステップS1へ戻って構文解析を続行する。この場合は、不明単語である旨をユーザに喚起し、ユーザ自らの手操作によって、その省略語の正式単語を入力するように構成することもできる。
これに対して、ステップS10の判定の結果、推定された省略語の正式単語が特定された場合には、その省略語と正式単語とを登録部37へ出力し、ステップS11へ進む。ステップS11において、登録部37は、省略語と正式単語を関連付けて省略語辞書42へ登録する。これと同時に、その省略語と正式単語とを関連付けて待ち受け辞書44にも登録する。
ステップS12では、手操作省略語判定部36は、その省略語が正式単語から見て手操作省略辞書45に登録すべき省略語であるか否かを判定する。上述したように、手操作入力においては、省略語が語頭から連続した文字列である場合には、そのままその正式単語は出力される。逆に、省略語がその正式単語と関連付けられて手操作省略語辞書45に登録されると、語頭の文字列が同じである他の単語が検索に引っかからない可能性がある。したがって、このような場合には、その省略語と正式単語とを関連付けて手操作省略語辞書45に登録しないこととする。
これに対して、正式単語の文字列の中間文字列を間引いてできた省略語、たとえば、マツモトキヨシ→マツキヨや、正式単語の後半の文字列を用いた省略語、たとえばサイゼリア→ゼリアなどの場合には、上述した不都合はなく、また省略語として登録すると認識率が向上するので、手操作省略語として適切であると判定し、ステップS13へ進み、登録部37が手操作省略語辞書45に登録する。
以上、本実施形態の音声認識辞書生成装置によれば、ユーザが作成した文章から省略語を抽出し、その正式単語を特定した上で辞書に登録するので、そのユーザが使用する省略語が辞書に登録されることになる。これにより、省略語の認識率が向上する。
また、抽出された省略語から正式単語を特定するにあたり、正式単語の意味内容を考慮した関連語が文章中に存在するかどうかを判定するので、省略語の推定精度がより高くなる。
さらに、抽出された省略語から正式単語を特定するにあたり、地名を含む周辺地域と正式単語とを地図データベースを参照しながら判定するので、文章中に関連語が含まれていなくても、省略語の推定精度を高めることができる。
ちなみに、本実施形態のナビゲーション装置2の音声認識機能について概説する。
ナビゲーション装置2にて目的地などを設定する際、装置から「目的地」を音声入力するよう指示があると、ユーザはマイクロフォン11に向かって所望の目的地を発声する。手操作で入力する場合にはタッチパネル13を用いてスイッチ操作する。
マイクロフォン11から音声入力したときは、この音声が制御装置3の入力部31を介して構文解析部32へ出力され、ここで待ち受け辞書44を参照しながら入力された目的地を認識したのち、その目的地データは、ナビゲーション装置2の制御部へ出力されて設定されることになる。このとき、音声中に省略語が存在しても、待ち受け辞書44には、上述の音声認識辞書生成装置によって登録されたユーザが使用する省略語が登録されているので、これを認識することができる。
また、手操作によって目的地を入力したときは、この入力データが制御装置3の入力部31を介して構文解析部32へ出力され、手操作省略語辞書45を参照しながら入力された目的地を認識したのち、その目的地データは、ナビゲーション装置2の制御部へ出力されて設定されることになる。このとき、手操作入力中に省略語が存在しても、手操作省略語辞書45には、上述の音声認識辞書生成装置によって登録されたユーザが使用する省略語が登録されており、しかも語頭から連続した省略語は登録されていないので、語頭が同じ他の単語の認識率も向上することになる。
また、マイクロフォン11により自然会話を集音し、自然会話の中からユーザが希望する目的地を自動設定することもできる。たとえば、ユーザが同乗者に対し、「これから海老名のケンタへ行ってランチにしようか」と話したとすると、これをマイクロフォン11で入力し、制御装置3の入力部31を介して構文解析部32に出力する。そして、構文解析部32は構文解析辞書41を参照しながら構文解析し、また待ち受け辞書44を参照しながらユーザの発話内容を認識する。最終的には、「海老名のケンタへ行く」というのがユーザの希望であることを認識し、この店舗をナビゲーション装置2の目的地として自動的に設定する。
こうした音声認識においてユーザは省略語を使用することがあるが、本実施形態に係る音声認識辞書生成装置により登録された待ち受け辞書44を用いて音声認識を実行すれば、そのユーザの省略語の認識率は高くなる。
なお、上述した実施形態では、ナビゲーション装置2の音声認識機能に本実施形態の音声認識辞書生成装置を応用した例を示したが、同様の構造を用いて、パソコンや携帯端末等、様々な電子機器における文字変換、たとえば、“マツキヨ” と入力すると、変換対象の中に「マツモトキヨシ」が含まれるといったことや、検索、たとえば、“エムピム”をキーワードにして検索すると「ampm」(登録商標)がヒットするといったことなどにも応用することができる。
1…入力装置
2…ナビゲーション装置
3…制御装置
31…入力部
32…構文解析部
33…既知省略語判定部
34…省略語推定部
35…省略語判定部
36…手操作省略語判定部
37…登録部
4…辞書
2…ナビゲーション装置
3…制御装置
31…入力部
32…構文解析部
33…既知省略語判定部
34…省略語推定部
35…省略語判定部
36…手操作省略語判定部
37…登録部
4…辞書
Claims (6)
- ユーザが作成した文章を入力する入力手段と、
前記入力された文章を単語に分割し、当該分割された各単語と辞書に登録された単語とを比較する解析手段と、
前記解析手段による比較に基づいて省略語を抽出する抽出手段と、
前記抽出された省略語の正式単語を特定する特定手段と、
前記抽出された省略語と前記特定された正式単語とを関連付けて前記辞書に登録する登録手段と、を備えることを特徴とする音声認識辞書生成装置。 - 請求項1に記載の音声認識辞書生成装置において、
前記特定手段は、前記文章のうちの前記省略語以外の単語の意味に基づいて、前記省略語の正式単語を特定することを特徴とする音声認識辞書生成装置。 - 請求項1又は2に記載の音声認識辞書生成装置において、
前記特定手段は、前記文章のうちの前記省略語以外の単語に地名が含まれている場合に、当該地名を含む周辺地域に存在する施設名に基づいて、前記省略語の正式単語を特定することを特徴とする音声認識辞書生成装置。 - 請求項1〜3のいずれか一項に記載の音声認識辞書生成装置において、
前記入力手段は、音声による文章を入力することを特徴とする音声認識辞書生成装置。 - 請求項1〜4のいずれか一項に記載の音声認識辞書生成装置において、
前記入力手段は、スイッチ操作による文章を入力することを特徴とする音声認識辞書生成装置。 - ユーザが作成した文章から省略語を抽出し、当該抽出された省略語の正式単語を特定し、これらを関連付けて辞書に登録することを特徴とする音声認識辞書生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007282161A JP2009109758A (ja) | 2007-10-30 | 2007-10-30 | 音声認識辞書生成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007282161A JP2009109758A (ja) | 2007-10-30 | 2007-10-30 | 音声認識辞書生成装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009109758A true JP2009109758A (ja) | 2009-05-21 |
Family
ID=40778305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007282161A Pending JP2009109758A (ja) | 2007-10-30 | 2007-10-30 | 音声認識辞書生成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009109758A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011030817A1 (ja) * | 2009-09-09 | 2011-03-17 | クラリオン株式会社 | 情報検索装置,情報検索方法及びナビゲーションシステム |
WO2013164870A1 (ja) * | 2012-05-02 | 2013-11-07 | 三菱電機株式会社 | 音声合成装置 |
WO2015075920A1 (ja) * | 2013-11-25 | 2015-05-28 | Necソリューションイノベータ株式会社 | 入力支援装置、入力支援方法及び記録媒体 |
JP2018032187A (ja) * | 2016-08-24 | 2018-03-01 | 日本電信電話株式会社 | 正式名称・省略表現リスト生成装置、正式名称・省略表現リスト生成方法、プログラム |
JP2018155606A (ja) * | 2017-03-17 | 2018-10-04 | 本田技研工業株式会社 | ナビゲーションシステム、ナビゲーション方法、および、プログラム |
-
2007
- 2007-10-30 JP JP2007282161A patent/JP2009109758A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949133B2 (en) | 2009-09-09 | 2015-02-03 | Clarion Co., Ltd. | Information retrieving apparatus |
CN102549652A (zh) * | 2009-09-09 | 2012-07-04 | 歌乐株式会社 | 信息检索装置、信息检索方法及导航系统 |
EP2477186A4 (en) * | 2009-09-09 | 2015-09-16 | Clarion Co Ltd | INFORMATION RECEIVING DEVICE, INFORMATION CALLING PROCEDURE AND NAVIGATION SYSTEM |
WO2011030817A1 (ja) * | 2009-09-09 | 2011-03-17 | クラリオン株式会社 | 情報検索装置,情報検索方法及びナビゲーションシステム |
JP5570675B2 (ja) * | 2012-05-02 | 2014-08-13 | 三菱電機株式会社 | 音声合成装置 |
WO2013164870A1 (ja) * | 2012-05-02 | 2013-11-07 | 三菱電機株式会社 | 音声合成装置 |
DE112012006308B4 (de) * | 2012-05-02 | 2016-02-04 | Mitsubishi Electric Corporation | Sprachsynthesevorrichtung |
WO2015075920A1 (ja) * | 2013-11-25 | 2015-05-28 | Necソリューションイノベータ株式会社 | 入力支援装置、入力支援方法及び記録媒体 |
JPWO2015075920A1 (ja) * | 2013-11-25 | 2017-03-16 | Necソリューションイノベータ株式会社 | 入力支援装置、入力支援方法及びプログラム |
US9996508B2 (en) | 2013-11-25 | 2018-06-12 | Nec Solution Innovators, Ltd. | Input assistance device, input assistance method and storage medium |
JP2018032187A (ja) * | 2016-08-24 | 2018-03-01 | 日本電信電話株式会社 | 正式名称・省略表現リスト生成装置、正式名称・省略表現リスト生成方法、プログラム |
JP2018155606A (ja) * | 2017-03-17 | 2018-10-04 | 本田技研工業株式会社 | ナビゲーションシステム、ナビゲーション方法、および、プログラム |
CN108627169A (zh) * | 2017-03-17 | 2018-10-09 | 本田技研工业株式会社 | 导航系统、导航方法和存储介质 |
US10775795B2 (en) | 2017-03-17 | 2020-09-15 | Honda Motor Co., Ltd. | Navigation system, navigation method, and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
JP3962763B2 (ja) | 対話支援装置 | |
US6266642B1 (en) | Method and portable apparatus for performing spoken language translation | |
US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
US10037758B2 (en) | Device and method for understanding user intent | |
US9530405B2 (en) | Intention estimating device and intention estimating method | |
US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
US6223150B1 (en) | Method and apparatus for parsing in a spoken language translation system | |
US6356865B1 (en) | Method and apparatus for performing spoken language translation | |
TWI698857B (zh) | 語音辨識系統及其方法、與電腦程式產品 | |
JP2010055044A (ja) | 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム | |
EP1617409A1 (en) | Multimodal method to provide input to a computing device | |
KR20110024075A (ko) | 패턴 데이터베이스화 장치 및 그 방법, 이를 이용한 음성 이해 장치 및 그 방법 | |
CN103050115A (zh) | 识别装置、识别方法、生成装置和生成方法 | |
TW200415573A (en) | Adaptive context sensitive analysis | |
JP2009109758A (ja) | 音声認識辞書生成装置及び方法 | |
US20150073796A1 (en) | Apparatus and method of generating language model for speech recognition | |
JP2003533827A (ja) | テキスト入力を語彙知識ベースに照合しその照合の結果を利用するシステムおよび方法 | |
JP2005257954A (ja) | 音声検索装置、音声検索方法および音声検索プログラム | |
JP4220151B2 (ja) | 音声対話装置 | |
JPH07191687A (ja) | 自然言語処理装置及びその方法 | |
JP6495856B2 (ja) | 適用用途の異なる辞書を生成する辞書生成装置、サーバ、プログラム及び方法 | |
JP2004295578A (ja) | 翻訳装置 | |
Hahn et al. | Optimizing CRFs for SLU tasks in various languages using modified training criteria | |
JP5474723B2 (ja) | 音声認識装置およびその制御プログラム |