JP2006011271A - 音声認識文法作成装置及びその制御方法 - Google Patents
音声認識文法作成装置及びその制御方法 Download PDFInfo
- Publication number
- JP2006011271A JP2006011271A JP2004191596A JP2004191596A JP2006011271A JP 2006011271 A JP2006011271 A JP 2006011271A JP 2004191596 A JP2004191596 A JP 2004191596A JP 2004191596 A JP2004191596 A JP 2004191596A JP 2006011271 A JP2006011271 A JP 2006011271A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition grammar
- components
- component
- grammar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 19
- 239000000470 constituent Substances 0.000 claims description 23
- 230000007704 transition Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 230000003190 augmentative effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 description 28
- 235000008429 bread Nutrition 0.000 description 23
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 235000021152 breakfast Nutrition 0.000 description 4
- 239000007787 solid Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000012830 plain croissants Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】 音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素をグループ化し、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する。
【選択図】 図1
Description
上記表記において、< >内はノンターミナルノード(ルール名)を示し、[ ]内は省略可能を示す。
上記表記において、| はOR結合を示し、構成要素の並びはAND結合を示す。
上述の目的を達成するために、本発明は、音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法において、音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素をグループ化するグループ化工程と、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成工程とを備えることを特徴とする。
図1は、本発明の第1の実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。
|<時><分>
|<時><秒>
|<分><秒>
|<分>
|<秒>
402は、朝食のオーダーを示すルールの例であり、構成要素の順序が指定されていない例を示すものである。<飲み物>には“コーヒー”、“紅茶”など、<パン>には“トースト”、“クロワッサン”など、<卵>には“オムレツ”、“目玉焼き”などが考えられるが、具体例は省略する。
|<飲み物><パン>
|<飲み物><卵><パン>
|<飲み物><卵>
|<飲み物>
|<パン><飲み物><卵>
|<パン><飲み物>
|<パン><卵><飲み物>
|<パン><卵>
|<パン>
|<卵><飲み物><パン>
|<卵><飲み物>
|<卵><パン><飲み物>
|<卵><パン>
|<卵>
本実施の形態では、音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素を拡張BNF変換部104によりグループ化し、グループ化された前記省略してはならない構成要素を含む構成要素を画像表示部102によりグラフィカルに表示し、表示内容に応じたユーザ操作に基づき、拡張BNF変換部104により前記省略してはならない構成要素を含む構成要素の組み合わせを展開して拡張BNF形式の音声認識文法を作成し出力する。
本発明の第2の実施の形態は、上述した第1の実施の形態に対して、音声認識文法作成装置が拡張BNF変換部の代わりに遷移ネットワーク変換部を備える点において相違する。本実施の形態のその他の要素は、上述した第1の実施の形態(図1)の対応するものと同一なので、説明を省略する。
本発明の第3の実施の形態は、上述した第1及び第2の実施の形態に対して、下記の点において相違する。本実施の形態のその他の要素は、上述した第1及び第2の実施の形態(図1、図5)の対応するものと同一なので、説明を省略する。
上記第1乃至第3の実施の形態では、グループ化された省略してはならない構成要素を含む構成要素をグラフィカルに表示し、表示内容に応じたユーザ操作に基づいて音声認識文法を作成する例を説明したが、本発明はこれに限定されるものではなく、グラフィカルに表示せずに、グループ化された省略してはならない構成要素を含む構成要素に基づいて音声認識文法を作成するよう構成しても構わない。
102 画像表示部(提示手段に対応)
103 画像編集部
104 拡張BNF変換部(グループ化手段、作成手段に対応)
105 ファイル入出力部
501 文字・操作入力部
502 画像表示部(提示手段に対応)
503 画像編集部
504 遷移ネットワーク変換部(グループ化手段、作成手段に対応)
505 ファイル入出力部
Claims (12)
- 音声認識対象を音声認識文法として記述する音声認識文法作成装置において、
音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素をグループ化するグループ化手段と、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成手段とを備えることを特徴とする音声認識文法作成装置。 - 前記グループ化手段でグループ化された前記省略してはならない構成要素を含む構成要素を提示する提示手段を更に備え、
前記作成手段は、前記提示手段の提示内容に応じたユーザ操作に基づいて、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成することを特徴とする請求項1記載の音声認識文法作成装置。 - 前記作成手段は、前記省略してはならない構成要素を含む構成要素の組み合わせを展開してメタ言語形式の音声認識文法を作成することを特徴とする請求項1記載の音声認識文法作成装置。
- 前記作成手段は、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して遷移ネットワーク形式の音声認識文法を作成することを特徴とする請求項1記載の音声認識文法作成装置。
- 前記グループ化手段は、音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素の順序を指定してグループ化することを特徴とする請求項1記載の音声認識文法作成装置。
- 前記メタ言語形式は、拡張BNF(Augmented Backus Naur Format)形式であることを特徴とする請求項3記載の音声認識文法作成装置。
- 前記遷移ネットワーク形式は、組み合わせ対象となる構成要素を矢印で結合して形成した構成要素結合関係を示すネットワークにより、構成要素の組み合わせを表す形式であることを特徴とする請求項4記載の音声認識文法作成装置。
- 前記提示手段は、グループ化された前記省略してはならない構成要素を含む構成要素をグラフィカルに表示することを特徴とする請求項2記載の音声認識文法作成装置。
- 前記提示手段は、前記提示手段の提示内容に応じたユーザ操作に基づく編集作業過程を表示可能であることを特徴とする請求項2記載の音声認識文法作成装置。
- 音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法において、
音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素をグループ化するグループ化工程と、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成工程とを備えることを特徴とする制御方法。 - 音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法をコンピュータに実行させるプログラムにおいて、
音声認識対象としての少なくとも1つの省略してはならない構成要素を含む構成要素をグループ化するモジュールと、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成するモジュールとを備えることを特徴とするプログラム。 - 請求項11記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004191596A JP4579595B2 (ja) | 2004-06-29 | 2004-06-29 | 音声認識文法作成装置、音声認識文法作成方法、プログラム、及び記憶媒体 |
US11/169,550 US7603269B2 (en) | 2004-06-29 | 2005-06-29 | Speech recognition grammar creating apparatus, control method therefor, program for implementing the method, and storage medium storing the program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004191596A JP4579595B2 (ja) | 2004-06-29 | 2004-06-29 | 音声認識文法作成装置、音声認識文法作成方法、プログラム、及び記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006011271A true JP2006011271A (ja) | 2006-01-12 |
JP2006011271A5 JP2006011271A5 (ja) | 2007-08-30 |
JP4579595B2 JP4579595B2 (ja) | 2010-11-10 |
Family
ID=35507165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004191596A Expired - Fee Related JP4579595B2 (ja) | 2004-06-29 | 2004-06-29 | 音声認識文法作成装置、音声認識文法作成方法、プログラム、及び記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7603269B2 (ja) |
JP (1) | JP4579595B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006508448A (ja) | 2002-11-28 | 2006-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ワードクラス情報を割り当てる方法 |
US9713774B2 (en) | 2010-08-30 | 2017-07-25 | Disney Enterprises, Inc. | Contextual chat message generation in online environments |
US9552353B2 (en) * | 2011-01-21 | 2017-01-24 | Disney Enterprises, Inc. | System and method for generating phrases |
US9176947B2 (en) | 2011-08-19 | 2015-11-03 | Disney Enterprises, Inc. | Dynamically generated phrase-based assisted input |
US9245253B2 (en) | 2011-08-19 | 2016-01-26 | Disney Enterprises, Inc. | Soft-sending chat messages |
US9165329B2 (en) | 2012-10-19 | 2015-10-20 | Disney Enterprises, Inc. | Multi layer chat detection and classification |
US10303762B2 (en) | 2013-03-15 | 2019-05-28 | Disney Enterprises, Inc. | Comprehensive safety schema for ensuring appropriateness of language in online chat |
US10742577B2 (en) | 2013-03-15 | 2020-08-11 | Disney Enterprises, Inc. | Real-time search and validation of phrases using linguistic phrase components |
CN109841210B (zh) * | 2017-11-27 | 2024-02-20 | 西安中兴新软件有限责任公司 | 一种智能操控实现方法及装置、计算机可读存储介质 |
US11100917B2 (en) * | 2019-03-27 | 2021-08-24 | Adobe Inc. | Generating ground truth annotations corresponding to digital image editing dialogues for training state tracking models |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05150966A (ja) * | 1991-11-26 | 1993-06-18 | Toshiba Corp | Bnfにおける言語情報抽出装置 |
JPH08123805A (ja) * | 1994-10-20 | 1996-05-17 | Canon Inc | 音声認識方法とその装置 |
JP2000029490A (ja) * | 1998-07-15 | 2000-01-28 | Denso Corp | 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム |
JP2002041082A (ja) * | 2000-07-28 | 2002-02-08 | Hitachi Ltd | 音声認識装置 |
WO2003096217A2 (en) * | 2002-05-07 | 2003-11-20 | International Business Machines Corporation | Integrated development tool for building a natural language understanding application |
JP2004133003A (ja) * | 2002-10-08 | 2004-04-30 | Mitsubishi Electric Corp | 音声認識辞書作成方法及びその装置と音声認識装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6434523B1 (en) * | 1999-04-23 | 2002-08-13 | Nuance Communications | Creating and editing grammars for speech recognition graphically |
US6549943B1 (en) * | 1999-06-16 | 2003-04-15 | Cisco Technology, Inc. | Network management using abstract device descriptions |
FR2801716B1 (fr) | 1999-11-30 | 2002-01-04 | Thomson Multimedia Sa | Dispositif de reconnaissance vocale mettant en oeuvre une regle syntaxique de permutation |
US20030009331A1 (en) * | 2001-07-05 | 2003-01-09 | Johan Schalkwyk | Grammars for speech recognition |
FR2857528B1 (fr) * | 2003-07-08 | 2006-01-06 | Telisma | Reconnaissance vocale pour les larges vocabulaires dynamiques |
-
2004
- 2004-06-29 JP JP2004191596A patent/JP4579595B2/ja not_active Expired - Fee Related
-
2005
- 2005-06-29 US US11/169,550 patent/US7603269B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05150966A (ja) * | 1991-11-26 | 1993-06-18 | Toshiba Corp | Bnfにおける言語情報抽出装置 |
JPH08123805A (ja) * | 1994-10-20 | 1996-05-17 | Canon Inc | 音声認識方法とその装置 |
JP2000029490A (ja) * | 1998-07-15 | 2000-01-28 | Denso Corp | 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム |
JP2002041082A (ja) * | 2000-07-28 | 2002-02-08 | Hitachi Ltd | 音声認識装置 |
WO2003096217A2 (en) * | 2002-05-07 | 2003-11-20 | International Business Machines Corporation | Integrated development tool for building a natural language understanding application |
JP2004133003A (ja) * | 2002-10-08 | 2004-04-30 | Mitsubishi Electric Corp | 音声認識辞書作成方法及びその装置と音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20050288931A1 (en) | 2005-12-29 |
JP4579595B2 (ja) | 2010-11-10 |
US7603269B2 (en) | 2009-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7603269B2 (en) | Speech recognition grammar creating apparatus, control method therefor, program for implementing the method, and storage medium storing the program | |
US8340956B2 (en) | Information provision system, information provision method, information provision program, and information provision program recording medium | |
JP2005031882A (ja) | 情報処理方法及び情報処理装置 | |
JP4872323B2 (ja) | Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体 | |
JP2007272870A (ja) | 印刷制御装置、gui表示方法、プリンタドライバ及び記録媒体 | |
US20060293896A1 (en) | User interface apparatus and method | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
EP1662382A2 (en) | Method for constructing user interface | |
JPH06259420A (ja) | 文章編集支援装置 | |
JP2006106845A (ja) | 文書概要作成装置、表示装置、情報処理装置、プレゼンテーションシステム、文書概要作成プログラム、文書概要作成装置制御プログラム、表示装置制御プログラム、情報処理装置制御プログラム、文書概要作成方法、文書概要作成装置制御方法、表示装置制御方法及び情報処理装置制御方法 | |
JP2003167600A (ja) | 音声認識装置及び方法、ページ記述言語表示装置及びその制御方法、並びにコンピュータ・プログラム | |
US8346560B2 (en) | Dialog design apparatus and method | |
JPH06231224A (ja) | 操作ガイダンス生成装置および操作ガイダンスの生成方法 | |
JP5082971B2 (ja) | 音声合成装置およびそれを用いた読み上げシステム。 | |
JP2006276912A (ja) | 文書編集装置、文書編集方法およびプログラム | |
JP2005032047A (ja) | ファイル自動生成装置、方法、プログラム及び記憶媒体 | |
JP2003280687A (ja) | シナリオ作成支援装置及びプログラム | |
KR20170092284A (ko) | 문서 형식 자동 변환 시스템 및 방법 | |
KR101102212B1 (ko) | 사용자전용 전자책 컨텐츠 제작 시스템 및 그 방법 | |
JPH08272388A (ja) | 音声合成装置及びその方法 | |
WO2023248307A1 (ja) | 操作支援システム、操作支援方法および操作支援プログラム | |
JP2002268664A (ja) | 音声変換装置及びプログラム | |
JP2009080614A (ja) | 表示制御装置、プログラム及び表示システム | |
JP2004287192A (ja) | 合成音声編集装置及び合成音声編集プログラム | |
JP2004287756A (ja) | 電子メール作成装置及び電子メール作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060419 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20070626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070629 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100826 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |