JP2008268571A - 音声認識装置、その音声認識方法 - Google Patents
音声認識装置、その音声認識方法 Download PDFInfo
- Publication number
- JP2008268571A JP2008268571A JP2007111611A JP2007111611A JP2008268571A JP 2008268571 A JP2008268571 A JP 2008268571A JP 2007111611 A JP2007111611 A JP 2007111611A JP 2007111611 A JP2007111611 A JP 2007111611A JP 2008268571 A JP2008268571 A JP 2008268571A
- Authority
- JP
- Japan
- Prior art keywords
- paraphrase
- vocabulary
- speech recognition
- rule
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 25
- 230000014509 gene expression Effects 0.000 claims abstract description 64
- 230000008569 process Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 2
- 230000000877 morphologic effect Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Abstract
【解決手段】語彙記憶部に記憶されている語彙を認識対象とする音声認識装置であって、語彙記憶部に記憶されている語彙の言い換え表現を新たに追加する言い換え表現学習部を有する。言い換え表現学習部は、複数の言い換え規則の中から一つ以上の言い換え規則を特定する規則特定手段と、特定した言い換え規則を用いて語彙記憶部に記憶されている語彙の言い換え表現を生成する手段と、生成した言い換え表現を語彙記憶部に追加する手段とを有する。
【選択図】図1
Description
鹿野、伊藤、河原、武田、山本、音声認識システム、オーム社、2001.
語彙記憶部に記憶されている語彙を認識対象とする音声認識装置であって、
前記語彙記憶部に記憶されている語彙の言い換え表現を新たに追加する言い換え表現学習部を有し、
前記言い換え表現学習部は、
複数の言い換え規則の中から一つの言い換え規則を特定する規則特定手段と、
特定した言い換え規則を用いて前記語彙記憶部に記憶されている語彙の言い換え表現を生成する手段と、
生成した言い換え表現を前記語彙記憶部に追加する手段とを有する。
図1は、本発明の一実施形態が適用された音声認識装置1の概略構成図である。
本発明は、上記実施形態に制限されない。上記実施形態は、様々な変形が可能である。
本発明の異なる実施例として、キーワード認識を言い換え規則の特定に用いる実施の形態を以下に示す。本実施例では、ユーザが言い換え語学習のみのために発話した音声ではなく、システム操作のために行った発話音声から言い換え語彙を学習することを想定している。よって、学習対象とするエントリは一つに特定されていない場合が多く、複数のエントリからユーザが選択的に発話を行った場合に、学習対象となるエントリを推定しながら言い換え規則を学習する。
則を適用した例を示す。これら図16に示した言い換え規則のうち、展開結果にキーワード「カントリークラブ」が含まれている「東京都民カントリークラブ」、「神奈川国際カントリークラブ」が言い換え語の候補となる。よって、これらの言い換え語を生成した言い換え規則「5.特定語句の置換2」が使用された言い換え規則であると推定できる。ここで、使用された言い換え規則は唯一に絞れるとは限らないが、可能性のある言い換え規則候補は全て使用された可能性があるとする。
先の実施例では学習対象語彙の推定S25は、キーワード認識の結果のみを用いて行ったが、辞書105に登録されている語彙の認識結果を用いて、学習対象語彙をさらに絞り込んでもよい。例えば、先の例で、辞書105に登録されている語彙を認識した結果が「東京都民ゴルフクラブ」のみであったとする。言い換えられた語も、言い換え前の語と音響的な距離が近く、言い換えられる前の語が認識結果として出現する可能性も高いため、言い換えられた学習対象語彙は「東京都民ゴルフクラブ」であると推定することができる。
また、言い換え規則の候補は、状況に応じて変化させることで、言い換え語候補をより減らすこともできる。例えば、ユーザがすでに発話した内容や、システムの応答に使用されている語は省略される可能性が高い。図17にすでにユーザが発話した内容が省略される言い換えが行われた例を示す。S1、U1はそれぞれシステム発話の第一発話、ユーザの第一発話を示している。U1でユーザは「東京」というキーワードを発話しているため、U2の発話で「東京国際展示場」からキーワード「東京」が省略されている。このようにユーザが、すでに発話されたキーワードを省略して発話する可能性が高い性質を利用して言い換え表現学習部106は、言い換えが行われた学習対象語の推定を行う。例えば、図18の認識対象語彙例の場合、システム発話S1で絞り込まれる認識対象「1.代々木公園」、「2.東京ドーム」、及び「3.東京国際展示場」がU2の認識対象となるが、これらのうち、キーワード「東京」を含む2、3、に関してのみこれらを省略した言い換え語を認識対象語彙とする。または、GPSから求められる現在位置に基づいて、現在地周辺に関連する情報を省略した言い換え後を認識対象としてもよい。例えば、現在位置が東京の場合、キーワード「東京」を含む2、3、に関してのみこれらを省略した言い換え語を認識対象語彙とする。このように状況に応じて使用される可能性の高い言い換え規則を絞りこむことで言い換え語候補の増大による音声認識処理速度の低下を防ぐことができる。ただし、言い換え規則を状況に応じて絞り込んでも、キーワードスポットにより認識されたキーワード数が多いなど、学習対象語やその言い換え語が絞り込みきれない場合は、ある程度学習対象語またはその言い換え語が絞り込まれるような問い返しを行い、言い換え語が一定数以下になった場合にのみ音声認識処理による言い換え規則特定を行なう。
10 主制御部
101 分析部
102 照合部
103 音響モデル
104 文法
105 辞書
106 言い換え表現学習部
107 音声認識用データベース
108 キーワード選択部
20 操作入力装置
30 音声入力装置
40 表示装置
Claims (20)
- 語彙記憶部に記憶されている語彙を認識対象とする音声認識装置であって、
前記語彙記憶部に記憶されている語彙の言い換え表現を新たに追加する言い換え表現学習部を有し、
前記言い換え表現学習部は、
複数の言い換え規則の中から一つ以上の言い換え規則を特定する規則特定手段と、
特定した言い換え規則を用いて前記語彙記憶部に記憶されている語彙の言い換え表現を生成する手段と、
生成した言い換え表現を前記語彙記憶部に追加する手段と
を有することを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置であって、
前記規則特定手段は、
前記語彙記憶部に記憶されている1つ以上の語彙に対して複数の言い換え規則を適用して生成した複数の言い換え表現を認識対象とする音声認識を行った結果を用いる
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置であって、
前記規則特定手段は、
前記語彙記憶部に記憶されている1つ以上の語彙に対して複数の言い換え規則を適用して生成した複数の言い換え表現を提示し、提示した言い換え表現の中から選択された1つ以上を用いる
ことを特徴とする音声認識装置。 - 語彙記憶部に記憶されている語彙を認識対象とする音声認識装置の音声認識方法であって、
複数の言い換え規則の中から一つの言い換え規則を特定する規則特定ステップと、
特定した言い換え規則を用いて前記語彙記憶部に記憶されている語彙の言い換え表現を生成するステップと、
生成した言い換え表現を前記語彙記憶部に追加するステップと
を行うことを特徴とする音声認識装置の音声認識方法。 - 認識対象語彙の特徴的な音素列であるキーワードを認識語彙として、
音声認識処理した結果により言い換え規則を特定することを特徴とした請求項1記載の音声認識装置。 - キーワード認識結果から得られる認識スコアがあらかじめ設定された閾値を上回った場合に限り、
前記キーワード認識結果を用いた言い換え規則を特定することを特徴とする講求項5記載の音声認識装置。 - 入力音声の記憶装置を備え、
請求項2記載の音声認識による言い換え規則特定手段に用いる入力音声を記憶し、
請求項2記載の言い換え規則特定手段により特定した言い換え表現を、
請求項2記載の語彙記憶部への追加手段により追加した認識辞書を用いて、
前記音声記憶装置に記憶した入力音声を再度認識処理することを特徴とする請求項2記載の音声認識装置。 - 複数の認識結果候補を出力する音声認識処理部を備え、
語彙記憶部に記憶されている、言い換え規則を適用していない語彙と前記言い換え語彙追加手段により追加した語彙の双方を認識語彙として認識処理し、
前記認識処理の複数の認識結果から最も適切な認識結果を選択する認識結果選択手段を備えることを特徴とする請求項2記載の音声認識装置。 - 音声認識結果に認識の確からしさを表す認識スコアを付与する認識スコア付与部を備え、
言い換え規則を適用していない語彙の認識結果の認識結果の認識スコアと前記言い換え語彙追加手段により追加した語彙の認識結果の認識スコアの差が、あらかじめ設定された閾値を上回る際にのみ前記言い換え語彙追加手段により追加した語彙の認織結果を最も適切な認識結果として選択することを特徴とする請求項8記載の音声認識装置。 - 語彙記憶部に記憶されている語彙の認識結果を用いて言い換え規則特定を行なう請求項2記載の音声認識装置。
- 音声認識結果の認識スコアがあらかじめ定めた閾値より高い場合のものだけを用いて言い換え規則特定を行なうことを特徴とする請求項10記載の音声認識装置。
- 音声認識処理を行なう状況に応じて言い換え規則の特定方法を変更することを特徴とする請求項1記載の音声認識装置。
- 過去に発話された情報を省略する言い換え規則を優先することを特徴とする請求項1記載の音声認識装置。
- 過去に言い換え規則を適用して登録された語彙を特定した言い換え規則を優先することを特徴とする請求項1記載の音声認識装置。
- 音声認識装置が過去に出力した情報を省略する言い換え規則を優先することを特徴とする請求項1記載の音声認識装置。
- ユーザの所在する地域を判定する所在地域特定装置を備え、
前記ユーザの所在地域に関連する情報を省略する言い換え規則を優先することを特徴とする請求項1記載の音声認識装置。 - 言い換え規則により生成される言い換え語が一定数以下となる場合にのみ音声認識処理による言い換え規則特定を行ない、
言い換え規則により生成される言い換え語が一定数以上となる場合は、追加情報の入力をユーザに求め、情報が追加された後に改めて言い換え規則の特定を行なうことを特徴とする請求項2記載の音声認識装置。 - 前記語彙記憶部に記憶されている語彙に含まれる地名部分の省略を言い換え規則とすることを特徴とする請求項1記載の音声認識装置。
- 前記語彙記憶部に記憶されている語彙を形態素解析し、
形態素間の順序の入れ替えを言い換え規則とすることを特徴とする請求項1記載の音声認識装置。 - 前記語彙記憶部に記憶されている語彙に含まれる特定の語句の置換を言い換え規則とすることを特徴とする請求項1記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007111611A JP5009037B2 (ja) | 2007-04-20 | 2007-04-20 | 音声認識装置、その音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007111611A JP5009037B2 (ja) | 2007-04-20 | 2007-04-20 | 音声認識装置、その音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008268571A true JP2008268571A (ja) | 2008-11-06 |
JP5009037B2 JP5009037B2 (ja) | 2012-08-22 |
Family
ID=40048154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007111611A Active JP5009037B2 (ja) | 2007-04-20 | 2007-04-20 | 音声認識装置、その音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5009037B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010191400A (ja) * | 2009-01-21 | 2010-09-02 | Xanavi Informatics Corp | 音声認識装置およびデータ更新方法 |
JP2010243653A (ja) * | 2009-04-02 | 2010-10-28 | Alpine Electronics Inc | 音声認識辞書編集装置及び音声認識装置 |
JP2011039468A (ja) * | 2009-08-14 | 2011-02-24 | Korea Electronics Telecommun | 電子辞書で音声認識を用いた単語探索装置及びその方法 |
JP2011065108A (ja) * | 2009-09-18 | 2011-03-31 | Konica Minolta Business Technologies Inc | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
JP2014048540A (ja) * | 2012-08-31 | 2014-03-17 | Toshiba Tec Corp | 認識辞書作成装置及び認識辞書作成プログラム |
JP2018200452A (ja) * | 2017-05-30 | 2018-12-20 | アルパイン株式会社 | 音声認識装置および音声認識方法 |
CN118711589A (zh) * | 2024-08-27 | 2024-09-27 | 江苏盛美塾信息科技有限公司 | 一种基于人工智能的多功能一体化交互控制系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1138994A (ja) * | 1997-07-17 | 1999-02-12 | Denso Corp | 音声認識装置及びナビゲーションシステム |
JP2002041081A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
JP2004133003A (ja) * | 2002-10-08 | 2004-04-30 | Mitsubishi Electric Corp | 音声認識辞書作成方法及びその装置と音声認識装置 |
JP2005031255A (ja) * | 2003-07-09 | 2005-02-03 | Mitsubishi Electric Corp | 辞書作成装置及び音声認識装置 |
-
2007
- 2007-04-20 JP JP2007111611A patent/JP5009037B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1138994A (ja) * | 1997-07-17 | 1999-02-12 | Denso Corp | 音声認識装置及びナビゲーションシステム |
JP2002041081A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
JP2004133003A (ja) * | 2002-10-08 | 2004-04-30 | Mitsubishi Electric Corp | 音声認識辞書作成方法及びその装置と音声認識装置 |
JP2005031255A (ja) * | 2003-07-09 | 2005-02-03 | Mitsubishi Electric Corp | 辞書作成装置及び音声認識装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010191400A (ja) * | 2009-01-21 | 2010-09-02 | Xanavi Informatics Corp | 音声認識装置およびデータ更新方法 |
JP2010243653A (ja) * | 2009-04-02 | 2010-10-28 | Alpine Electronics Inc | 音声認識辞書編集装置及び音声認識装置 |
JP2011039468A (ja) * | 2009-08-14 | 2011-02-24 | Korea Electronics Telecommun | 電子辞書で音声認識を用いた単語探索装置及びその方法 |
JP2011065108A (ja) * | 2009-09-18 | 2011-03-31 | Konica Minolta Business Technologies Inc | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
US8630852B2 (en) | 2009-09-18 | 2014-01-14 | Konica Minolta Business Technologies, Inc. | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program |
JP2014048540A (ja) * | 2012-08-31 | 2014-03-17 | Toshiba Tec Corp | 認識辞書作成装置及び認識辞書作成プログラム |
JP2018200452A (ja) * | 2017-05-30 | 2018-12-20 | アルパイン株式会社 | 音声認識装置および音声認識方法 |
CN118711589A (zh) * | 2024-08-27 | 2024-09-27 | 江苏盛美塾信息科技有限公司 | 一种基于人工智能的多功能一体化交互控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5009037B2 (ja) | 2012-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11182122B2 (en) | Voice control of computing devices | |
US10503468B2 (en) | Voice enabling applications | |
JP4188989B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
US8521539B1 (en) | Method for chinese point-of-interest search | |
JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
JP4412504B2 (ja) | 音声認識装置、音声認識方法、及び音声認識用プログラム | |
US9449599B2 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
JP5009037B2 (ja) | 音声認識装置、その音声認識方法 | |
US20060100871A1 (en) | Speech recognition method, apparatus and navigation system | |
JP5189874B2 (ja) | 多言語の非ネイティブ音声の認識 | |
JP2008064885A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
EP2863385B1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
US8566091B2 (en) | Speech recognition system | |
JP7305844B2 (ja) | 音声処理 | |
KR101063607B1 (ko) | 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법 | |
EP3005152B1 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
JP2008089625A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP4914632B2 (ja) | ナビゲーション装置 | |
JP2008076811A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
WO2021025900A1 (en) | Automated speech recognition system | |
JP2009116075A (ja) | 音声認識装置 | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120501 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120530 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5009037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150608 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |