JPH0844384A - 連続単語音声認識装置 - Google Patents
連続単語音声認識装置Info
- Publication number
- JPH0844384A JPH0844384A JP6174414A JP17441494A JPH0844384A JP H0844384 A JPH0844384 A JP H0844384A JP 6174414 A JP6174414 A JP 6174414A JP 17441494 A JP17441494 A JP 17441494A JP H0844384 A JPH0844384 A JP H0844384A
- Authority
- JP
- Japan
- Prior art keywords
- word
- grammar
- grammer
- strings
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
可能な文を定義・変更するためには、文法規則(書き換
え規則)に従って文法を作成し、それをコンパイルして
装置に反映させるといった一般ユーザーには難解な手続
きが必要であった問題点を解決する新しい連続単語音声
認識装置を提案する。また、少ない表示領域で、受理可
能な文の種類をユーザーに知らしめる文法表示部を提案
する。 【構成】 どの単語とどの単語が連結できるかなどの単
語接続情報や、個々の単語の属性を含んだ文法情報30
と、文法情報30を利用してマイクロホン10から入力
された音声を認識し認識結果を出力する音声認識部20
と、文法情報30を定義・編集するためのユーザーイン
ターフェースを備えた文法定義部40と、装置の使用者
に、装置が受理可能な文の種類を通知するためのユーザ
ーインターフェースを備えた文法表示部とから構成され
る。
Description
文法定義や文法表示のユーザーインターフェースに関す
るものである。
どのような音声入力を受理可能かをユーザーに知らせる
場合には、発声可能な単語を列挙し、単語リストとして
ディスプレイなどに表示することが一般的である。
規則に従って連結した文として、一度の発声で入力する
ことができる。連続単語音声認識に関しては文献「連続
発声した単語音声を効率的に認識する2段DPマッチン
グ、日経エレクトロニクス、1983年11月7日号」
に詳しい。
音声認識装置において、装置が受理可能な入力をユーザ
ーに知らせるために、可能なすべての文を列挙して表示
することは困難である。すなわち規則で受理可能な単語
の組み合わせは一般に膨大になり、すべてを列挙するこ
とは困難であり、またユーザーにとっても非常に不親切
なインターフェースとなる。そこで従来は全く表示を行
わないか、規則で受理可能な文のうち限られた個数の文
だけを例として表示するか、あるいは別途作成された例
文を表示するか、などの方式が用いられていた。
能な文を定義する方法として、これまでは書き換え規則
などの文法規則を用いて定義を作成し、それをコンパイ
ルして有効化していた。しかし、文法規則やそのコンパ
イルなどの概念は、開発者向けの極めて難解なインター
フェースであり、認識装置の一般的なユーザーが単語や
文型の追加を行うことを困難にしていた。
て、装置が受理可能な文を定義・変更するためには、文
法規則(書き換え規則)に従って文法を作成し、それを
コンパイルして装置に反映させるといった一般ユーザー
には難解な手続きが必要であった問題点を解決する新し
い連続単語音声認識装置を提案する。また、本発明は、
少ない表示領域で、受理可能な文の種類をユーザーに知
らしめる文法表示部を提案する。
単語列内の列を識別する列番号を第1の次元、単語列の
各列内で単語を識別する単語番号を第2の次元とする2
次元の表形式に文法を展開して表示し、表の行と列とで
指定される単語を定義・編集することにより、文法を定
義・編集できる文法定義部を有することを特徴とする連
続単語音声認識装置。 (2)請求項1の連続単語音声認識装置の文法定義部に
おいて、表の各列に名前を定義することを特徴とする連
続単語音声認識装置。 (3)請求項2の連続単語音声認識装置において、受理
可能な単語列を発話者に知らしめる文法表示部として、
文法を表形式に定義し、表の各列の名前を区切り記号で
区切って連結して表示する文法表示部を有することを特
徴とする連続単語音声認識装置。 (4)請求項1の連続単語音声認識装置の文法定義部に
おいて、表中の各単語に意味を定義し、入力音声が単語
列として認識された場合は、認識された各単語の意味を
順番に連結して、入力音声の認識結果として出力するこ
とを特徴とする連続単語音声認識装置。
施例を示す。音声認識部20は文法情報30を利用して
マイク10から入力された音声を認識し認識結果を出力
する。文法情報30はどの単語とどの単語が連接できる
かなどの単語接続情報や、個々の単語の属性情報(表
記、読み、意味など)を含んでいる。文法定義部40は
文法情報30を定義・編集するためのユーザーインター
フェースを提供する。文法表示部50は装置の使用者
に、装置が受理可能な文の種類を通知するためのユーザ
ーインターフェースを提供する。
な文の定義例を示した。「9月15日」のような日付を
受理可能にするために、括弧で囲んだ非終端記号と引用
符で囲んだ終端記号を用いて書き換え規則の形式で定義
している(例1)。「東京から京都まで」のような入力
を受け付けるための文法も同様である(例2)。
能な文の文法情報を定義するために、単語列内の列を識
別する列番号を第1の次元、単語列の各列内で単語を識
別する単語番号を第2の次元とする2次元の表形式のユ
ーザーインターフェースを用いる。表の行番号と列番号
で指定される位置(セルと呼ぶ)に単語を定義する。表
の各列から1単語づつ選び、列の並びの順番に単語を接
続してできる文が、ユーザーが入力可能な文となる。表
形式を採用することにより、視覚的に文法を把握するこ
とができ、書き換え規則などに精通しないユーザーでも
容易に定義・変更することができる。
例を示した。文法定義部では図3に示したような表を画
面に表示し、ユーザーは表の上で単語を選択し、その単
語の属性を定義・編集したり、表の上で単語を移動・複
写・削除したりすることができる。単語の属性として
は、画面への表示などに用いられる単語の「表記」や、
単語の「読み」、認識結果として用いられる単語の「意
味」などがある。
合には一目で受理可能な文を把握するのは一般に困難を
極め、規則を追加・変更することは非専門家には不可能
である。それに比べて、本発明のように表形式で定義し
た場合には非専門家でも一目で視覚的に受理可能な文を
理解することができ、定義も容易に拡張・変更できる。
な文の表示例を示した。受理可能なすべての文を列挙し
ている。表示画面の広さにも依存するがすべての文を表
示するのは困難であり、一定個数に制限するか、別途例
文を用意しておいて表示するしかない。また、一般に文
例だけから受理可能な文法を推論することは困難なこと
が多い。
の単語を代表する名前(列名)を定義することができ
る。この定義結果を利用して、本発明の文法表示部では
装置が受理可能な文を表示する場合に、表の各列の列名
をつなげて、<列名1|列名2|列名3>のように記号
で区切って表示する。列名が定義されていない場合は表
の第一行の単語の表記を代わりに用いることなどが可能
である。区切り記号を挿入することにより各列に複数の
選択肢があることが表現できる。図5に本発明の文法表
示部による受理可能な文の表示例を示した。図3の例1
の文法に対応して<何|月|何|日>、例2の文法に対
応して<出発駅|から|目的駅|まで>のように表示さ
れる。このように表示すれば、わずか1行の表示で受理
できる表形式の文法が一覧でき、表示すべき文例の組み
合わせ的爆発を避けることができる。
列から認識結果として選ばれた単語の意味情報を順番に
連結して出力する。意味情報の例としては音声認識装置
の出力を受け取って動作する被制御装置へのコマンドな
どがある。連続単語音声認識装置の場合は一度の発声
で、複数のコマンドを続けて被制御装置へ送ることがで
きる。
法に比べて、非専門家でも表形式により視覚的に容易に
文法を把握して定義・変更可能なユーザーインターフェ
ースを有し、かつ少ない表示面積で装置が受理可能な文
の種類を有効に表示することができる連続単語音声認識
装置の実現が可能となった。
例。
の表示例である。
Claims (4)
- 【請求項1】連続単語音声認識装置において、受理可能
な単語列を定義する文法定義部として、単語列内の列を
識別する列番号を第1の次元、単語列の各列内で単語を
識別する単語番号を第2の次元とする2次元の表形式に
文法を展開して表示し、表の行と列とで指定される単語
を定義・編集することにより、文法を定義・編集できる
文法定義部を有することを特徴とする連続単語音声認識
装置。 - 【請求項2】請求項1の連続単語音声認識装置の文法定
義部において、表の各列に名前を定義することを特徴と
する連続単語音声認識装置。 - 【請求項3】請求項2の連続単語音声認識装置におい
て、受理可能な単語列を発話者に知らしめる文法表示部
として、文法を表形式に定義し、表の各列の名前を区切
り記号で区切って連結して表示する文法表示部を有する
ことを特徴とする連続単語音声認識装置。 - 【請求項4】請求項1の連続単語音声認識装置の文法定
義部において、表中の各単語に意味を定義し、入力音声
が単語列として認識された場合は、認識された各単語の
意味を順番に連結して、入力音声の認識結果として出力
することを特徴とする連続単語音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6174414A JP2967688B2 (ja) | 1994-07-26 | 1994-07-26 | 連続単語音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6174414A JP2967688B2 (ja) | 1994-07-26 | 1994-07-26 | 連続単語音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0844384A true JPH0844384A (ja) | 1996-02-16 |
JP2967688B2 JP2967688B2 (ja) | 1999-10-25 |
Family
ID=15978143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6174414A Expired - Fee Related JP2967688B2 (ja) | 1994-07-26 | 1994-07-26 | 連続単語音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2967688B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000014727A1 (en) * | 1998-09-09 | 2000-03-16 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
WO2000019410A1 (en) * | 1998-09-30 | 2000-04-06 | Lernout & Hauspie Speech Products N.V. | Graphic user interface for navigation in speech recognition system grammars |
KR20040051349A (ko) * | 2002-12-12 | 2004-06-18 | 한국전자통신연구원 | 출현불가능한 어휘조합에 대한 정보를 반영한 연속 음성인식 방법 |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2005351980A (ja) * | 2004-06-08 | 2005-12-22 | Canon Inc | 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 |
JP2008203516A (ja) * | 2007-02-20 | 2008-09-04 | Canon Inc | 情報処理装置および情報処理方法 |
US7603277B2 (en) | 2003-06-30 | 2009-10-13 | Nuance Communications, Inc. | Speech recognition device using statistical language model |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080235018A1 (en) * | 2004-01-20 | 2008-09-25 | Koninklikke Philips Electronic,N.V. | Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62293472A (ja) * | 1986-06-13 | 1987-12-21 | Fujitsu Ltd | 音声翻訳装置 |
JPH04289899A (ja) * | 1991-03-19 | 1992-10-14 | Hitachi Ltd | 口語音声認識装置及び方法 |
JPH0695828A (ja) * | 1992-09-14 | 1994-04-08 | Toshiba Corp | 音声入力システム |
-
1994
- 1994-07-26 JP JP6174414A patent/JP2967688B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62293472A (ja) * | 1986-06-13 | 1987-12-21 | Fujitsu Ltd | 音声翻訳装置 |
JPH04289899A (ja) * | 1991-03-19 | 1992-10-14 | Hitachi Ltd | 口語音声認識装置及び方法 |
JPH0695828A (ja) * | 1992-09-14 | 1994-04-08 | Toshiba Corp | 音声入力システム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000014727A1 (en) * | 1998-09-09 | 2000-03-16 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
WO2000019410A1 (en) * | 1998-09-30 | 2000-04-06 | Lernout & Hauspie Speech Products N.V. | Graphic user interface for navigation in speech recognition system grammars |
US6456972B1 (en) | 1998-09-30 | 2002-09-24 | Scansoft, Inc. | User interface for speech recognition system grammars |
KR20040051349A (ko) * | 2002-12-12 | 2004-06-18 | 한국전자통신연구원 | 출현불가능한 어휘조합에 대한 정보를 반영한 연속 음성인식 방법 |
US7603277B2 (en) | 2003-06-30 | 2009-10-13 | Nuance Communications, Inc. | Speech recognition device using statistical language model |
US7698137B2 (en) | 2003-06-30 | 2010-04-13 | Nuance Communications, Inc. | Speech recognition device using statistical language model |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2005351980A (ja) * | 2004-06-08 | 2005-12-22 | Canon Inc | 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 |
JP4579585B2 (ja) * | 2004-06-08 | 2010-11-10 | キヤノン株式会社 | 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 |
JP2008203516A (ja) * | 2007-02-20 | 2008-09-04 | Canon Inc | 情報処理装置および情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2967688B2 (ja) | 1999-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102165437B (zh) | 信息处理装置及信息处理方法 | |
JP4826275B2 (ja) | 応答生成装置、方法及びプログラム | |
US6161093A (en) | Information access system and recording medium | |
JP2011254553A (ja) | 小型キーパッド用日本語入力メカニズム | |
JP4186992B2 (ja) | 応答生成装置、方法及びプログラム | |
JPH01501977A (ja) | 言語翻訳システム | |
WO2006026908A1 (fr) | Procede permettant d'introduire dans un terminal portatif des caracteres chinois a l'aide de lettres phonetiques continues | |
CN102165438A (zh) | 信息处理装置及信息处理方法 | |
US9405742B2 (en) | Method for phonetizing a data list and voice-controlled user interface | |
JPH0844384A (ja) | 連続単語音声認識装置 | |
JP4840051B2 (ja) | 音声学習支援装置及び音声学習支援プログラム | |
JP6641680B2 (ja) | 音声出力装置、音声出力プログラムおよび音声出力方法 | |
Mertens et al. | FONILEX manual | |
JP2016197184A (ja) | 発音学習コンテンツ提供装置、システム、プログラム及び方法 | |
JPH10269204A (ja) | 中国語文書自動校正方法及びその装置 | |
JP2006284645A (ja) | 音声再生装置およびその再生プログラムならびにその再生方法 | |
JP3663012B2 (ja) | 音声による入力装置 | |
JP2007122510A (ja) | 提示装置及び提示プログラム | |
WO2022254843A1 (ja) | 情報処理装置および情報処理方法 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP5293091B2 (ja) | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 | |
JP2002189490A (ja) | ピンイン音声入力の方法 | |
JP2005106844A (ja) | 音声出力装置、サーバ及びプログラム | |
JP4579400B2 (ja) | 自然言語応答装置及び方法並びに自然言語応答プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990721 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070820 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100820 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |