JP4649207B2 - 生成変形句構造文法に基づいて自然言語認識をする方法 - Google Patents
生成変形句構造文法に基づいて自然言語認識をする方法 Download PDFInfo
- Publication number
- JP4649207B2 JP4649207B2 JP2004516499A JP2004516499A JP4649207B2 JP 4649207 B2 JP4649207 B2 JP 4649207B2 JP 2004516499 A JP2004516499 A JP 2004516499A JP 2004516499 A JP2004516499 A JP 2004516499A JP 4649207 B2 JP4649207 B2 JP 4649207B2
- Authority
- JP
- Japan
- Prior art keywords
- recognized
- grammar
- speech
- sentence
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000009471 action Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 claims 1
- 230000001960 triggered effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 7
- 238000012261 overproduction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000002344 surface layer Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 241000282312 Proteles Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
著しく増加する過剰生成。
認識時の明らかな遅延(待ち時間)。
認識の確実性の低下(精度)。
システム安定性の低下(ロバスト性)。
米国特許出願公開第6182039号明細書によって自然言語認識をする方法が開示されており、この方法は、話された句の、その中に含まれるトリフォンへの解析と、この句に含まれる単語の形成と、文法規則集を用いての話された句のシンタクス的な再構成とを有している。
この発明は、話された句をシンタクス的に再構成するための文法規則集の厳密な記載が存在しておらず、特に、音声の辞書に関する示唆を何ら読み取ることができないという欠点を有している。
GT/PS文法は、これまでの最大7つのサブグラマーレベルの代わりに2つのレベルですむので、従来のグラマーに比べてはるかに小規模である。
グラマーによってカバーされているが文法的には誤っている文の数(過剰生成)が劇的に減る。
従来使用されていたスロットのおよそ3分の1しか必要ない。
現在の言語認識装置の理念とは異なり、上位のグラマーレベルにではなく下位のグラマーレベルにスロットが充填される。
GSL(文法仕様言語)によってすでに設定されている、スロット値を上位のグラマーレベルへ引き上げるためのインストルメントを一貫して活用する。
GETおよびKILLの値でしか充填することができないACTIONという名称の新たなスロットを有している。
高度な多重タスク処理能力がある互いに入れ子構造になったスロットで作業を進める。
認識性能の向上につながる。
多言語アプリケーションを導入するための簡素化されたオプションを可能にする。
ニュアンステクノロジーへのシームレスな統合能力を有している。
システム資源の活用性向上によるハードウェアコストの削減。
認識の性能向上による翻訳時間の低減。
いっそう容易な取扱性による人的資源の削減。
顧客満足度の向上。
あらゆる世界言語に応用可能(英語から中国語まで)。
図2は、認識プロセスの第2のステップとしての、認識されたトリフォンに基づく単語認識を示す説明図である。
図3は、認識プロセスの第3のステップとしての、認識された単語のシンタクス的再構成を示す説明図である。
図4は、認識された単語の品詞カテゴリーへの分類、および名詞句と動詞句への分類の一例を示す説明図である。
図5は、考えられる文法のプログラム例の説明図である。
図6は、PSG文法の構造を示す概略図である。
図7は、従来技術に基づく文法での単語組み合わせの形成を示す一例を示す説明図である。
次いで、名詞句と動詞句が句構造の観点からオブジェクトにまとめられる。
Claims (3)
- 生成変形句構造文法に基づいて自然言語認識をする方法であって、
−話された句をその中に含まれるトリフォンへと解析するステップと、
−音声単語データベース(ディクショナリー)により、認識されたトリフォンから、話された句に含まれている単語を形成するステップと、
−文法規則集(グラマー)を用いて、認識された単語から、話された句をシンタクス的に再構成するステップとを備える方法において、
話された句のシンタクス的な再構成が、
−認識された単語を品詞カテゴリー(動詞、名詞など)に振り分けるステップと、
−品詞カテゴリーを名詞句と動詞句に振り分けるステップと、
−シンタクス規則に基づいて名詞句と動詞句をまとめ、品詞カテゴリーを含むオブジェクトとするステップと、
−その品詞カテゴリーを含むオブジェクトと、設定されている文型に含まれる複数の品詞カテゴリーとを比較し(設定されている文型は、それぞれ、品詞カテゴリーに振り分けられた複数の変数を有している)、一致している場合にはその文を認識されたものとみなし、音声制御アプリケーションのアクションが惹起され、文が認識された場合、認識された文の品詞カテゴリーに振り分けられた変数が、認識された単語の相応の品詞で充填されるステップとを含んでいることを特徴とする、生成変形句構造文法に基づいて自然言語認識をする方法。 - 認識されるべき単語がさまざまな品詞カテゴリーに分類されてデータベースに保存される、請求項1に記載の方法。
- オブジェクトまたはその一部が音声制御アプリケーションの相応のアクションパラメータと組み合わされる、請求項1または2に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10229207A DE10229207B3 (de) | 2002-06-28 | 2002-06-28 | Verfahren zur natürlichen Spracherkennung auf Basis einer Generativen Transformations-/Phrasenstruktur-Grammatik |
PCT/DE2003/002135 WO2004003888A1 (de) | 2002-06-28 | 2003-06-26 | Verfahren zur natürlichen spracherkennung auf basis einer generativen transformations-/phrasenstruktur-grammatik |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005539249A JP2005539249A (ja) | 2005-12-22 |
JP4649207B2 true JP4649207B2 (ja) | 2011-03-09 |
Family
ID=29795990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004516499A Expired - Fee Related JP4649207B2 (ja) | 2002-06-28 | 2003-06-26 | 生成変形句構造文法に基づいて自然言語認識をする方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7548857B2 (ja) |
EP (1) | EP1518221A1 (ja) |
JP (1) | JP4649207B2 (ja) |
CN (1) | CN1315109C (ja) |
AU (1) | AU2003250272A1 (ja) |
CA (1) | CA2493429C (ja) |
DE (1) | DE10229207B3 (ja) |
IL (1) | IL165957A (ja) |
PL (1) | PL373306A1 (ja) |
WO (1) | WO2004003888A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7295981B1 (en) * | 2004-01-09 | 2007-11-13 | At&T Corp. | Method for building a natural language understanding model for a spoken dialog system |
GB0517082D0 (en) | 2005-08-19 | 2005-09-28 | Univ City Hong Kong | Auxiliary winding for improved performance of a planar inductive charging platform |
EP2141692A1 (de) | 2008-06-26 | 2010-01-06 | Deutsche Telekom AG | Automatisierte Sprachgesteuerte Unterstützung eines Benutzers |
KR101195812B1 (ko) * | 2010-07-08 | 2012-11-05 | 뷰모션 (주) | 규칙기반 시스템을 이용한 음성인식 시스템 및 그 방법 |
US9817813B2 (en) * | 2014-01-08 | 2017-11-14 | Genesys Telecommunications Laboratories, Inc. | Generalized phrases in automatic speech recognition systems |
CN110164449B (zh) * | 2019-04-26 | 2021-09-24 | 安徽美博智能科技有限公司 | 语音识别的空调机控制方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274192A (ja) * | 1993-03-23 | 1994-09-30 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 自然言語解析方式 |
JP2000035795A (ja) * | 1998-06-15 | 2000-02-02 | Dragon Syst Inc | 音声認識におけるノンインタラクティブ方式のエンロ―ルメント |
JP2000105597A (ja) * | 1998-09-29 | 2000-04-11 | Atr Interpreting Telecommunications Res Lab | 音声認識誤り訂正装置 |
JP2000330588A (ja) * | 1999-05-20 | 2000-11-30 | Toshiba Corp | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0242743B1 (en) * | 1986-04-25 | 1993-08-04 | Texas Instruments Incorporated | Speech recognition system |
EP0590173A1 (de) * | 1992-09-28 | 1994-04-06 | International Business Machines Corporation | Computersystem zur Spracherkennung |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
WO1998009228A1 (en) * | 1996-08-29 | 1998-03-05 | Bcl Computers, Inc. | Natural-language speech control |
US6182039B1 (en) * | 1998-03-24 | 2001-01-30 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using probabilistic language model based on confusable sets for speech recognition |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
US6633846B1 (en) * | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
DE10032255A1 (de) * | 2000-07-03 | 2002-01-31 | Siemens Ag | Verfahren zur Sprachanalyse |
US7058567B2 (en) * | 2001-10-10 | 2006-06-06 | Xerox Corporation | Natural language parser |
-
2002
- 2002-06-28 DE DE10229207A patent/DE10229207B3/de not_active Expired - Lifetime
-
2003
- 2003-06-26 PL PL03373306A patent/PL373306A1/xx not_active Application Discontinuation
- 2003-06-26 US US10/519,653 patent/US7548857B2/en not_active Expired - Fee Related
- 2003-06-26 JP JP2004516499A patent/JP4649207B2/ja not_active Expired - Fee Related
- 2003-06-26 CA CA2493429A patent/CA2493429C/en not_active Expired - Fee Related
- 2003-06-26 EP EP03761435A patent/EP1518221A1/de not_active Ceased
- 2003-06-26 CN CNB038152843A patent/CN1315109C/zh not_active Expired - Fee Related
- 2003-06-26 AU AU2003250272A patent/AU2003250272A1/en not_active Abandoned
- 2003-06-26 WO PCT/DE2003/002135 patent/WO2004003888A1/de active Application Filing
-
2004
- 2004-12-23 IL IL165957A patent/IL165957A/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274192A (ja) * | 1993-03-23 | 1994-09-30 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 自然言語解析方式 |
JP2000035795A (ja) * | 1998-06-15 | 2000-02-02 | Dragon Syst Inc | 音声認識におけるノンインタラクティブ方式のエンロ―ルメント |
JP2000105597A (ja) * | 1998-09-29 | 2000-04-11 | Atr Interpreting Telecommunications Res Lab | 音声認識誤り訂正装置 |
JP2000330588A (ja) * | 1999-05-20 | 2000-11-30 | Toshiba Corp | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
US7548857B2 (en) | 2009-06-16 |
CN1666254A (zh) | 2005-09-07 |
CA2493429C (en) | 2011-09-13 |
IL165957A (en) | 2010-11-30 |
AU2003250272A1 (en) | 2004-01-19 |
JP2005539249A (ja) | 2005-12-22 |
DE10229207B3 (de) | 2004-02-05 |
EP1518221A1 (de) | 2005-03-30 |
CN1315109C (zh) | 2007-05-09 |
WO2004003888B1 (de) | 2004-03-25 |
CA2493429A1 (en) | 2004-01-08 |
PL373306A1 (en) | 2005-08-22 |
IL165957A0 (en) | 2006-01-15 |
US20060161436A1 (en) | 2006-07-20 |
WO2004003888A1 (de) | 2004-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7072837B2 (en) | Method for processing initially recognized speech in a speech recognition session | |
US11776533B2 (en) | Building a natural language understanding application using a received electronic record containing programming code including an interpret-block, an interpret-statement, a pattern expression and an action statement | |
Moore | Using natural-language knowledge sources in speech recognition | |
CA2437620C (en) | Hierarchichal language models | |
JP5162697B2 (ja) | 情報検索手法による統一化されたタスク依存の言語モデルの生成 | |
US7043422B2 (en) | Method and apparatus for distribution-based language model adaptation | |
Riccardi et al. | Stochastic language adaptation over time and state in natural spoken dialog systems | |
US6975983B1 (en) | Natural language input method and apparatus | |
US20020016710A1 (en) | Assigning meanings to utterances in a speech recognition system | |
US7684987B2 (en) | Segmental tonal modeling for tonal languages | |
JPH0320800A (ja) | 音声認識方法および装置 | |
US20030009335A1 (en) | Speech recognition with dynamic grammars | |
US5689617A (en) | Speech recognition system which returns recognition results as a reconstructed language model with attached data values | |
US20030009331A1 (en) | Grammars for speech recognition | |
JP4649207B2 (ja) | 生成変形句構造文法に基づいて自然言語認識をする方法 | |
AbuZeina et al. | Cross-word modeling for Arabic speech recognition | |
CN114974240A (zh) | 财务系统的语音控制方法、装置、存储介质及设备 | |
KR20050101694A (ko) | 문법적 제약을 갖는 통계적인 음성 인식 시스템 및 그 방법 | |
Potamianos et al. | Categorical Understanding Using Statistical Ngram Models | |
Saini et al. | Speech Articulating Software | |
Patel et al. | Hands free java (through speech recognition) | |
Xu et al. | A multilingual-supporting dialog system using a common dialog controller | |
Brown et al. | Context-free large-vocabulary connected speech recognition with evolutional grammars | |
KR20220063661A (ko) | 자연어를 점진적으로 분석하는 장치 및 방법 | |
Kobayashi et al. | A sub-word level matching strategy in a speech understanding system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050912 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090818 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091113 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101213 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4649207 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |