JP2001519043A - コンテキスト・フリー・グラマーを使用するテキスト正規化 - Google Patents
コンテキスト・フリー・グラマーを使用するテキスト正規化Info
- Publication number
- JP2001519043A JP2001519043A JP54205298A JP54205298A JP2001519043A JP 2001519043 A JP2001519043 A JP 2001519043A JP 54205298 A JP54205298 A JP 54205298A JP 54205298 A JP54205298 A JP 54205298A JP 2001519043 A JP2001519043 A JP 2001519043A
- Authority
- JP
- Japan
- Prior art keywords
- text
- content
- computer
- context
- readable medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010606 normalization Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims description 42
- 241000287828 Gallus gallus Species 0.000 description 4
- 235000013330 chicken meat Nutrition 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241000219470 Mirabilis Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1. 入力音声内のコンテンツを認識する音声認識エンジンを有するコンピュー タ・システムにおいて、 前記音声認識エンジンからの音声入力に対応するテキストを受けるステップと 、 コンテキスト・フリー・グラマーを適用して、前記受けたテキストに対する代 替コンテンツを識別するステップと、 前記テキストを前記代替コンテンツで置換するステップと、 のコンピュータ実施ステップから成る方法。 2. 請求項1記載の方法において、前記代替コンテンツは、英数字ストリング を含むこと、を特徴とする方法。 3. 請求項1記載の方法において、前記代替コンテンツはグラフィカル・コン テンツを含むこと、を特徴とする方法。 4. 請求項1記載の方法において、前記受けたテキストは、分散型システムに おける媒体コンテンツの識別子であり、前記代替コンテンツは媒体コンテンツで あること、を特徴とする方法。 5. 請求項4記載の方法において、前記受けたテキストは、ユニフォーム・リ ソース・ロケータ(URL)であること、を特徴とする方法。 6. 請求項5記載の方法において、前記代替コンテンツは、ハイパーテキスト ・ドキュメントであること、を特徴とする方法。 7. 請求項1記載の方法において、前記代替コンテンツは、ハイパーテキスト ・ドキュメントであること、を特徴とする方法。 8. 請求項1記載の方法において、前記代替コンテンツは、オーディオ・コン テンツであること、を特徴とする方法。 9. 請求項1記載の方法において、前記コンテキスト・フリー・グラマーは、 前記受けたテキストに対し前記代替コンテンツを置換するための少なくとも1つ のルールを含むこと、を特徴とする方法。 10. 請求項1記載の方法において、前記コンピュータ・システムは、アプリ ケーション・プログラムを走らせ、また前記代替コンテンツは、前記アプリケー ション・プログラムに送ること、を特徴とする方法。 11. 請求項1記載の方法において、前記受けたテキストは、ワードのストリ ングであり、前記代替コンテンツは、前記ワードのストリングの少なくともある 部分に対応する一連の数字を含むこと、を特徴とする方法。 12. 請求項1記載の方法において、前記受けたテキストは、住所を指定する ワードのストリングであり、前記代替コンテンツは、前記住所の少なくとも一部 分を指定する一連の数字を含むこと、を特徴とする方法。 13. 請求項1記載の方法において、前記受けたテキストは通貨の額を識別す るワードのストリングであり、前記代替コンテンツは、前記通貨額を指定する数 字および通貨記号を含むこと、を特徴とする方法。 14. 請求項1記載の方法において、前記受けたテキストは分数を指定するス トリングであり、前記代替コンテンツは、前記分数を合わさって指定する数字お よび数学的演算を含むこと、を特徴とする方法。 15. 音声入力内の音声の部分を認識する音声認識器を有するコンピュータ・ システムにおいて、 テキストを正規化するためのコンテキスト・フリー・グラマーのルールを記載 したファイルを提供するステップと、 前記音声認識器からテキストを受けるステップであって、前記テキストが音声 入力に対応する、前記のステップと、 前記テキストの少なくとも1部分を正規化することにより、前記テキストの前 記一部分を正規化した英数字ストリングで置換するステップであって、前記正規 化は、前記コンテキスト・フリー・グラマーからのルールを適用して、正規化す る前記テキストの前記部分を前記正規化した英数字ストリングで置換する、前記 のステップと、 のコンピュータ実施ステップから成る方法。 16. 請求項15記載の方法であって、さらに、前記ファイルを、異なったコ ンテキスト・フリー・グラマーのルールを記載する代替ファイルで置換するステ ップと、前記異なったコンテキスト・フリー・グラマーを使用して新たなテキス トを正規化するステップと、を含むこと、を特徴とする方法。 17. 請求項15記載の方法であって、さらに、前記ファイルを使用して、前 記正規化において使用する前記コンテキスト・フリー・グラマーのためのツリー を構築するステップ、を含むことを特徴とする方法。 18. 請求項15記載の方法において、前記ファイルはテキスト・ファイルで あること、を特徴とする方法。 19. 請求項15記載の方法において、前記ファイルは、大文字化に関するル ールを含むこと、を特徴とする方法。 20. 請求項15記載の方法において、前記ファイルは、スペーシングに関す るルールを含むこと、を特徴とする方法。 21. 請求項15記載の方法において、前記ファイルは、ルールを前記コンテ キスト・フリー・グラマーの一部分として使用すべきか否かを識別するスイッチ の仕様を含むこと、を特徴とする方法。 22. 請求項15記載の方法であって、さらに、前記コンテキスト・フリー・ グラマーを変更するために前記ファイルのコンテンツを変更するステップ、を含 むことを特徴とする方法。 23. 請求項15記載の方法であって、さらに、追加のテキストを受けるステ ップと、前記コンテキスト・フリー・グラマーからの別のルールを適用すること により前記追加テキストを非テキストのコンテンツで置換することにより該追加 テキストを正規化するステップと、を含むこと、を特徴とする方法。 24. 請求項23記載の方法において、前記非テキストのコンテンツは、イメ ージ・データを含むこと、を特徴とする方法。 25. 請求項22記載の方法において、前記非テキストのコンテンツは、オー ディオ・データを含むこと、を特徴とする方法。 26. アプリケーション・プログラムと、音声入力内の音声の部分を認識しそ して前記認識した音声部分に対応するテキストを出力する音声認識器と、を有す るコンピュータ・システムにおいて、 テキスト正規化器を含むアプリケーション・プログラム・インターフェース( API)を提供するステップと、 前記音声認識器からのテキストを前記テキスト正規化器で受けるステップと、 コンテキスト・フリー・グラマーからのルールを適用することにより前記テキ ストからのルールを適用することにより前記テキストを正規化して、前記テキス トのコンテンツを変更しそして正規化したテキストを発生するステップと、 前記正規化したテキストを前記アプリケーション・プログラムに渡すステップ と、 のコンピュータ実施ステップから成る方法。 27. 請求項26記載の方法において、前記APIは、音声APIであって、 認識した音声入力に対応するテキスト出力を前記アプリケーション・プログラム に提供する音声APIであること、を特徴とする方法。 28. 請求項26記載の方法において、前記アプリケーション・プログラムは 、前記APIからのテキストを要求して、前記正規化したテキストを前記アプリ ケーション・プログラムへ渡すことをプロンプトすること、を特徴とする方法。 29. コンピュータ・システムであって、 音声入力内の音声の部分を認識しそして該認識した音声部分に対応するテキス ト出力を発生する音声認識器と、 テキストを正規化するためのルールを含むコンテキスト・フリー・グラマーと 、 前記音声認識器からのテキスト出力に少なくとも1つのルールを適用して正規 化するテキスト正規化器と、 から成るコンピュータ・システム。 30. 請求項29記載のコンピュータ・システムにおいて、前記テキスト正規 化器はアプリケーション・プログラム・インターフェース(API)の一部分で あること、を特徴とするコンピュータ・システム。 31. 請求項30記載のコンピュータ・システムにおいて、前記テキスト正規 化器はアプリケーション・プログラム・インターフェース(API)の一部分で あること、を特徴とするコンピュータ・システム。 32. 入力音声内のコンテンツを認識するための音声認識エンジンを有するシ ステムにおいて、 前記音声認識エンジンからの音声入力に対応するテキストを受けるステップと 、 コンテキスト・フリー・グラマーを適用して、前記受けたテキストに対する代 替コンテンツを識別するステップと、 前記テキストを前記代替コンテンツで置換するステップと、 のコンピュータ実施ステップから成る方法を実行するコンピュータ読み取り可能 命令を保有するコンピュータ読み取り可能媒体。 33. 請求項32記載のコンピュータ読み取り可能媒体において、前記代替コ ンテンツは、英数字ストリングを含むこと、を特徴とするコンピュータ読み取り 可能媒体。 34. 請求項32記載のコンピュータ読み取り可能媒体において、前記代替コ ンテンツはグラフィカル・コンテンツを含むこと、を特徴とするコンピュータ読 み取り可能媒体。 35. 請求項32記載のコンピュータ読み取り可能媒体において、前記受けた テキストは、分散型システムにおける媒体コンテンツの識別子であり、前記代替 コンテンツは媒体コンテンツであること、を特徴とするコンピュータ読み取り可 能媒体。 36. 請求項35記載のコンピュータ読み取り可能媒体において、前記受けた テキストは、ユニフォーム・リソース・ロケータ(URL)であること、を特徴 とするコンピュータ読み取り可能媒体。 37. 請求項36記載のコンピュータ読み取り可能媒体において、前記代替コ ンテンツは、ハイパーテキスト・ドキュメントであること、を特徴とするコンピ ュータ読み取り可能媒体。 38. 請求項32記載のコンピュータ読み取り可能媒体において、前記代替コ ンテンツは、ハイパーテキスト・ドキュメントであること、を特徴とするコンピ ュータ読み取り可能媒体。 39. 請求項32記載のコンピュータ読み取り可能媒体において、前記代替コ ンテンツは、オーディオ・コンテンツであること、を特徴とするコンピュータ読 み取り可能媒体。 40. 請求項32記載のコンピュータ読み取り可能媒体において、前記受けた テキストは、ワードのストリングであり、前記代替コンテンツは、前記ワードの ストリングの少なくともある部分に対応する一連の数字を含むこと、を特徴とす るコンピュータ読み取り可能媒体。 41. 請求項32記載のコンピュータ読み取り可能媒体において、前記受けた テキストは、住所を指定するワードのストリングであり、前記代替コンテンツは 、前記住所の少なくとも一部分を指定する一連の数字を含むこと、を特徴とする コンピュータ読み取り可能媒体。 42. 請求項32記載のコンピュータ読み取り可能媒体において、前記受けた テキストは通貨の額を識別するワードのストリングであり、前記代替コンテンツ は、前記通貨額を指定する数字および通貨記号を含むこと、を特徴とするコンピ ュータ読み取り可能媒体。 43. 請求項32記載のコンピュータ読み取り可能媒体において、前記受けた テキストは分数を指定するストリングであり、前記代替コンテンツは、前記分数 を合わさって指定する数字および数学的演算を含むこと、を特徴とするコンピュ ータ読み取り可能媒体。 44. 音声入力内の音声の部分を認識する音声認識器を有するコンピュータ・ システムにおいて、 テキストを正規化するためのコンテキスト・フリー・グラマーのルールを記載 したファイルを提供するステップと、 前記音声認識器からテキストを受けるステップであって、前記テキストが音声 入力に対応する、前記のステップと、 前記テキストの少なくとも1部分を正規化することにより、前記テキストの前 記一部分を正規化した英数字ストリングで置換するステップであって、前記正規 化は、前記コンテキスト・フリー・グラマーからのルールを適用して、正規化す る前記テキストの前記部分を前記正規化した英数字ストリングで置換する、前記 のステップと、 のコンピュータ実施ステップから成る方法を実行するコンピュータ読み取り可能 命令を保有するコンピュータ読み取り可能媒体。 45. 請求項44記載のコンピュータ読み取り可能媒体であって、前記方法が 、さらに、前記ファイルを、異なったコンテキスト・フリー・グラマーのルール を記載する代替ファイルで置換するステップと、前記異なったコンテキスト・フ リー・グラマーを使用して新たなテキストを正規化するステップと、を含むこと 、を特徴とするコンピュータ読み取り可能媒体。 46. 請求項44記載のコンピュータ読み取り可能媒体において、前記ファイ ルはテキスト・ファイルであること、を特徴とするコンピュータ読み取り可能媒 体。 47. 請求項44記載のコンピュータ読み取り可能媒体において、前記ファイ ルは、ルールを前記コンテキスト・フリー・グラマーの一部分として使用すべき か否かを識別するスイッチの仕様を含むこと、を特徴とするコンピュータ読み取 り可能媒体。 48. 請求項44記載のコンピュータ読み取り可能媒体であって、前記方法が 、さらに、前記コンテキスト・フリー・グラマーを変更するために前記ファイル の コンテンツを変更するステップ、を含むことを特徴とするコンピュータ読み取り 可能媒体。 49. アプリケーション・プログラムと、音声入力内の音声の部分を認識しそ して前記認識した音声部分に対応するテキストを出力する音声認識器と、を有す るコンピュータ・システムにおいて、 テキスト正規化器を含むアプリケーション・プログラム・インターフェース( API)を提供するステップと、 前記音声認識器からのテキストを前記テキスト正規化器で受けるステップと、 コンテキスト・フリー・グラマーからのルールを適用することにより前記テキ ストからのルールを適用することにより前記テキストを正規化して、前記テキス トのコンテンツを変更しそして正規化したテキストを発生するステップと、 前記正規化したテキストを前記アプリケーション・プログラムに渡すステップ と、 のコンピュータ実施ステップから成る方法を実行するコンピュータ読み取り可能 命令を保有するコンピュータ読み取り可能媒体。 50. 請求項49記載のコンピュータ読み取り可能媒体において、前記API は、音声APIであって、認識した音声入力に対応するテキスト出力を前記アプ リケーション・プログラムに提供する音声APIであること、を特徴とするコン ピュータ読み取り可能媒体。 51. 請求項49記載のコンピュータ読み取り可能媒体において、前記アプリ ケーション・プログラムは、前記APIからのテキストを要求して、前記正規化 したテキストを前記アプリケーション・プログラムヘ渡すことをプロンプトする こと、を特徴とするコンピュータ読み取り可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/840,117 | 1997-04-03 | ||
US08/840,117 US5970449A (en) | 1997-04-03 | 1997-04-03 | Text normalization using a context-free grammar |
PCT/US1998/006852 WO1998044484A1 (en) | 1997-04-03 | 1998-04-03 | Text normalization using a context-free grammar |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001519043A true JP2001519043A (ja) | 2001-10-16 |
Family
ID=25281495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54205298A Pending JP2001519043A (ja) | 1997-04-03 | 1998-04-03 | コンテキスト・フリー・グラマーを使用するテキスト正規化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5970449A (ja) |
EP (1) | EP1016074B1 (ja) |
JP (1) | JP2001519043A (ja) |
CN (1) | CN1285068C (ja) |
DE (1) | DE69829389T2 (ja) |
WO (1) | WO1998044484A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021530749A (ja) * | 2018-11-16 | 2021-11-11 | グーグル エルエルシーGoogle LLC | 自動音声認識のためのコンテキスト非正規化 |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2945887B2 (ja) * | 1997-10-09 | 1999-09-06 | オリンパス光学工業株式会社 | コードイメージ記録装置 |
US6523031B1 (en) * | 1997-11-21 | 2003-02-18 | International Business Machines Corporation | Method for obtaining structured information exists in special data format from a natural language text by aggregation |
JP2000163418A (ja) * | 1997-12-26 | 2000-06-16 | Canon Inc | 自然言語処理装置及びその方法、及びそのプログラムを格納した記憶媒体 |
US6493662B1 (en) * | 1998-02-11 | 2002-12-10 | International Business Machines Corporation | Rule-based number parser |
US6513002B1 (en) * | 1998-02-11 | 2003-01-28 | International Business Machines Corporation | Rule-based number formatter |
US7181399B1 (en) * | 1999-05-19 | 2007-02-20 | At&T Corp. | Recognizing the numeric language in natural spoken dialogue |
JP3709305B2 (ja) * | 1999-07-01 | 2005-10-26 | 日立オムロンターミナルソリューションズ株式会社 | 地名文字列照合方法、地名文字列照合装置、地名文字列認識装置及び郵便物区分システム |
US6762699B1 (en) | 1999-12-17 | 2004-07-13 | The Directv Group, Inc. | Method for lossless data compression using greedy sequential grammar transform and sequential encoding |
US6640098B1 (en) * | 2000-02-14 | 2003-10-28 | Action Engine Corporation | System for obtaining service-related information for local interactive wireless devices |
US8478732B1 (en) * | 2000-05-02 | 2013-07-02 | International Business Machines Corporation | Database aliasing in information access system |
US6704728B1 (en) | 2000-05-02 | 2004-03-09 | Iphase.Com, Inc. | Accessing information from a collection of data |
US9699129B1 (en) | 2000-06-21 | 2017-07-04 | International Business Machines Corporation | System and method for increasing email productivity |
US8290768B1 (en) | 2000-06-21 | 2012-10-16 | International Business Machines Corporation | System and method for determining a set of attributes based on content of communications |
US6408277B1 (en) | 2000-06-21 | 2002-06-18 | Banter Limited | System and method for automatic task prioritization |
US20020099734A1 (en) * | 2000-11-29 | 2002-07-25 | Philips Electronics North America Corp. | Scalable parser for extensible mark-up language |
US7644057B2 (en) | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
US7136846B2 (en) * | 2001-04-06 | 2006-11-14 | 2005 Keel Company, Inc. | Wireless information retrieval |
US7152029B2 (en) * | 2001-07-18 | 2006-12-19 | At&T Corp. | Spoken language understanding that incorporates prior knowledge into boosting |
EP1464045A1 (en) * | 2001-12-17 | 2004-10-06 | Empirix Inc. | Method of testing a voice application |
US7343372B2 (en) | 2002-02-22 | 2008-03-11 | International Business Machines Corporation | Direct navigation for information retrieval |
US7257531B2 (en) * | 2002-04-19 | 2007-08-14 | Medcom Information Systems, Inc. | Speech to text system using controlled vocabulary indices |
US7146320B2 (en) * | 2002-05-29 | 2006-12-05 | Microsoft Corporation | Electronic mail replies with speech recognition |
US7328146B1 (en) | 2002-05-31 | 2008-02-05 | At&T Corp. | Spoken language understanding that incorporates prior knowledge into boosting |
US8495002B2 (en) | 2003-05-06 | 2013-07-23 | International Business Machines Corporation | Software tool for training and testing a knowledge base |
US20050187913A1 (en) | 2003-05-06 | 2005-08-25 | Yoram Nelken | Web-based customer service interface |
CN1830022B (zh) * | 2003-06-02 | 2010-05-05 | 国际商业机器公司 | 语音应答系统及其方法 |
US7343604B2 (en) | 2003-07-25 | 2008-03-11 | International Business Machines Corporation | Methods and apparatus for creation of parsing rules |
US7672436B1 (en) * | 2004-01-23 | 2010-03-02 | Sprint Spectrum L.P. | Voice rendering of E-mail with tags for improved user experience |
US20050216256A1 (en) * | 2004-03-29 | 2005-09-29 | Mitra Imaging Inc. | Configurable formatting system and method |
US20050240408A1 (en) * | 2004-04-22 | 2005-10-27 | Redin Jaime H | Method and apparatus for entering verbal numerals in electronic devices |
DE102004028724A1 (de) * | 2004-06-14 | 2005-12-29 | T-Mobile Deutschland Gmbh | Verfahren zur natürlichsprachlichen Erkennung von Nummern |
US8335688B2 (en) * | 2004-08-20 | 2012-12-18 | Multimodal Technologies, Llc | Document transcription system training |
US8412521B2 (en) * | 2004-08-20 | 2013-04-02 | Multimodal Technologies, Llc | Discriminative training of document transcription system |
US7584103B2 (en) * | 2004-08-20 | 2009-09-01 | Multimodal Technologies, Inc. | Automated extraction of semantic content and generation of a structured document from speech |
US7630892B2 (en) * | 2004-09-10 | 2009-12-08 | Microsoft Corporation | Method and apparatus for transducer-based text normalization and inverse text normalization |
CN100462966C (zh) * | 2004-09-14 | 2009-02-18 | 株式会社Ipb | 将文件配置成时间序列的文件相关图的制成装置 |
US8977953B1 (en) * | 2006-01-27 | 2015-03-10 | Linguastat, Inc. | Customizing information by combining pair of annotations from at least two different documents |
JP5167256B2 (ja) * | 2006-06-22 | 2013-03-21 | マルチモーダル・テクノロジーズ・エルエルシー | コンピュータ実装方法 |
US7841366B2 (en) * | 2006-08-21 | 2010-11-30 | Wpw, Llc | Systems and methods for pipeline rehabilitation installation |
US8671341B1 (en) | 2007-01-05 | 2014-03-11 | Linguastat, Inc. | Systems and methods for identifying claims associated with electronic text |
US7813929B2 (en) * | 2007-03-30 | 2010-10-12 | Nuance Communications, Inc. | Automatic editing using probabilistic word substitution models |
US20080312928A1 (en) * | 2007-06-12 | 2008-12-18 | Robert Patrick Goebel | Natural language speech recognition calculator |
US20090157385A1 (en) * | 2007-12-14 | 2009-06-18 | Nokia Corporation | Inverse Text Normalization |
JP2009244639A (ja) * | 2008-03-31 | 2009-10-22 | Sanyo Electric Co Ltd | 発話装置、発話制御プログラムおよび発話制御方法 |
US9460708B2 (en) * | 2008-09-19 | 2016-10-04 | Microsoft Technology Licensing, Llc | Automated data cleanup by substitution of words of the same pronunciation and different spelling in speech recognition |
US8364487B2 (en) * | 2008-10-21 | 2013-01-29 | Microsoft Corporation | Speech recognition system with display information |
US8990088B2 (en) * | 2009-01-28 | 2015-03-24 | Microsoft Corporation | Tool and framework for creating consistent normalization maps and grammars |
US8370155B2 (en) * | 2009-04-23 | 2013-02-05 | International Business Machines Corporation | System and method for real time support for agents in contact center environments |
CN102339228B (zh) * | 2010-07-22 | 2017-05-10 | 上海果壳电子有限公司 | 上下文无关文法的解析方法 |
US8959102B2 (en) | 2010-10-08 | 2015-02-17 | Mmodal Ip Llc | Structured searching of dynamic structured document corpuses |
US9110852B1 (en) * | 2012-07-20 | 2015-08-18 | Google Inc. | Methods and systems for extracting information from text |
US9146919B2 (en) * | 2013-01-16 | 2015-09-29 | Google Inc. | Bootstrapping named entity canonicalizers from English using alignment models |
US9471561B2 (en) * | 2013-12-26 | 2016-10-18 | International Business Machines Corporation | Adaptive parser-centric text normalization |
US9535904B2 (en) * | 2014-03-26 | 2017-01-03 | Microsoft Technology Licensing, Llc | Temporal translation grammar for language translation |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
CN104360897B (zh) * | 2014-10-29 | 2017-09-22 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
US10579834B2 (en) * | 2015-10-26 | 2020-03-03 | [24]7.ai, Inc. | Method and apparatus for facilitating customer intent prediction |
US20170154029A1 (en) * | 2015-11-30 | 2017-06-01 | Robert Martin Kane | System, method, and apparatus to normalize grammar of textual data |
US11404148B2 (en) | 2017-08-10 | 2022-08-02 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
US10496382B2 (en) * | 2018-02-22 | 2019-12-03 | Midea Group Co., Ltd. | Machine generation of context-free grammar for intent deduction |
US11250383B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
CN111370083B (zh) * | 2018-12-26 | 2023-04-25 | 阿里巴巴集团控股有限公司 | 一种文本结构化方法及装置 |
US11182504B2 (en) * | 2019-04-29 | 2021-11-23 | Microsoft Technology Licensing, Llc | System and method for speaker role determination and scrubbing identifying information |
US11482214B1 (en) * | 2019-12-12 | 2022-10-25 | Amazon Technologies, Inc. | Hypothesis generation and selection for inverse text normalization for search |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4914704A (en) * | 1984-10-30 | 1990-04-03 | International Business Machines Corporation | Text editor for speech input |
US4829576A (en) * | 1986-10-21 | 1989-05-09 | Dragon Systems, Inc. | Voice recognition system |
US5231670A (en) * | 1987-06-01 | 1993-07-27 | Kurzweil Applied Intelligence, Inc. | Voice controlled system and method for generating text from a voice controlled input |
US5349526A (en) * | 1991-08-07 | 1994-09-20 | Occam Research Corporation | System and method for converting sentence elements unrecognizable by a computer system into base language elements recognizable by the computer system |
EP0543329B1 (en) * | 1991-11-18 | 2002-02-06 | Kabushiki Kaisha Toshiba | Speech dialogue system for facilitating human-computer interaction |
US5371807A (en) * | 1992-03-20 | 1994-12-06 | Digital Equipment Corporation | Method and apparatus for text classification |
EP0598514B1 (en) * | 1992-11-18 | 1999-12-29 | Canon Information Systems, Inc. | Method and apparatus for extracting text from a structured data file and converting the extracted text to speech |
US5632002A (en) * | 1992-12-28 | 1997-05-20 | Kabushiki Kaisha Toshiba | Speech recognition interface system suitable for window systems and speech mail systems |
JPH0736882A (ja) * | 1993-07-19 | 1995-02-07 | Fujitsu Ltd | 辞書検索装置 |
US5651096A (en) * | 1995-03-14 | 1997-07-22 | Apple Computer, Inc. | Merging of language models from two or more application programs for a speech recognition system |
-
1997
- 1997-04-03 US US08/840,117 patent/US5970449A/en not_active Expired - Lifetime
-
1998
- 1998-04-03 CN CNB988047896A patent/CN1285068C/zh not_active Expired - Lifetime
- 1998-04-03 DE DE69829389T patent/DE69829389T2/de not_active Expired - Lifetime
- 1998-04-03 WO PCT/US1998/006852 patent/WO1998044484A1/en active IP Right Grant
- 1998-04-03 JP JP54205298A patent/JP2001519043A/ja active Pending
- 1998-04-03 EP EP98915327A patent/EP1016074B1/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021530749A (ja) * | 2018-11-16 | 2021-11-11 | グーグル エルエルシーGoogle LLC | 自動音声認識のためのコンテキスト非正規化 |
JP2021193464A (ja) * | 2018-11-16 | 2021-12-23 | グーグル エルエルシーGoogle LLC | 自動音声認識のためのコンテキスト非正規化 |
JP7230145B2 (ja) | 2018-11-16 | 2023-02-28 | グーグル エルエルシー | 自動音声認識のためのコンテキスト非正規化 |
US11676607B2 (en) | 2018-11-16 | 2023-06-13 | Google Llc | Contextual denormalization for automatic speech recognition |
Also Published As
Publication number | Publication date |
---|---|
CN1285068C (zh) | 2006-11-15 |
US5970449A (en) | 1999-10-19 |
DE69829389D1 (de) | 2005-04-21 |
EP1016074A1 (en) | 2000-07-05 |
WO1998044484A1 (en) | 1998-10-08 |
DE69829389T2 (de) | 2006-02-09 |
EP1016074B1 (en) | 2005-03-16 |
CN1255224A (zh) | 2000-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001519043A (ja) | コンテキスト・フリー・グラマーを使用するテキスト正規化 | |
US8290775B2 (en) | Pronunciation correction of text-to-speech systems between different spoken languages | |
JP5162697B2 (ja) | 情報検索手法による統一化されたタスク依存の言語モデルの生成 | |
US7243069B2 (en) | Speech recognition by automated context creation | |
JP4901155B2 (ja) | 音声認識装置が使用するのに適した文法を生成するための方法、媒体、およびシステム | |
US20020095289A1 (en) | Method and apparatus for identifying prosodic word boundaries | |
US6963831B1 (en) | Including statistical NLU models within a statistical parser | |
US8392191B2 (en) | Chinese prosodic words forming method and apparatus | |
US20020123877A1 (en) | Method and apparatus for performing machine translation using a unified language model and translation model | |
EP1331574B1 (en) | Named entity interface for multiple client application programs | |
Hasegawa-Johnson et al. | Grapheme-to-phoneme transduction for cross-language ASR | |
Wang et al. | Rapid development of spoken language understanding grammars | |
Di Fabbrizio et al. | AT&t help desk. | |
Rouhe et al. | An equal data setting for attention-based encoder-decoder and HMM/DNN models: A case study in Finnish ASR | |
JP5851130B2 (ja) | 日本語のための音声キー | |
JP3691773B2 (ja) | 文章解析方法とその方法を利用可能な文章解析装置 | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
US20040034524A1 (en) | Hybrid baseform generation | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP2005208483A (ja) | 音声認識装置、音声認識プログラム、言語モデル生成方法、及び言語モデル生成装置 | |
Donaj et al. | Manual sorting of numerals in an inflective language for language modelling | |
JP2004118461A (ja) | 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP2817406B2 (ja) | 連続音声認識方式 | |
Sunitha et al. | Minimum data generation for Telugu speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050328 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090128 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100209 |