JP2004334848A - 2レベル形態規則をコンパイルするための方法及びその装置 - Google Patents
2レベル形態規則をコンパイルするための方法及びその装置 Download PDFInfo
- Publication number
- JP2004334848A JP2004334848A JP2004110408A JP2004110408A JP2004334848A JP 2004334848 A JP2004334848 A JP 2004334848A JP 2004110408 A JP2004110408 A JP 2004110408A JP 2004110408 A JP2004110408 A JP 2004110408A JP 2004334848 A JP2004334848 A JP 2004334848A
- Authority
- JP
- Japan
- Prior art keywords
- finite state
- core
- rule
- state
- transducer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Devices For Executing Special Programs (AREA)
- Complex Calculations (AREA)
Abstract
【解決手段】 個別の有限状態変換器を結合して、単一の結合有限状態変換器を形成する。一実施形態では、まず有限状態変換器を有限状態変換器内の共通のコアに基づいて結合する。その後、そのコアに対する結合有限状態変換器を結合して、その一組の正字法規則に対する単一の有限状態変換器を形成する。
【選択図】 図1
Description
図1は、本発明を実装できる好適なコンピューティングシステム環境の一実施例を示す図である。コンピューティングシステム環境100は、適当なコンピューティング環境の一例にすぎず、本発明の用途又は機能性の範囲に関する制限を示唆する意図はない。コンピューティング環境100は、オペレーティング環境例100に示されている1つのコンポーネント又はその組み合わせに関係する依存関係又は要求条件があるものと解釈すべきでない。
コア演算子左文脈−−−右文脈
例えば、以下のルール:
a:b−>c:c−−−d:d
は、「a」から「b」へのコアのマッピングを表しており、c:cの左文脈とd:dの左文脈がある場合に存在しうる。
図8に示されている有限状態変換器は、規則
a:b−>c:c−−−d:d
を表しており、図9に示されている有限状態変換器は、規則
a:b<−d:d−−−e:e
を表している。
h:i−>g:g−−−j:j
に対するものであり、図12の有限状態変換器は、規則
h:i−>k:k−−−n:n
に対するものである。
110 コンピュータ
120 処理ユニット
121 システムバス
130 システムメモリ
131 読み取り専用メモリ(ROM)
132 ランダムアクセスメモリ(RAM)
133 基本入出力システム
134 オペレーティングシステム
135 アプリケーションプログラム
136 その他のプログラムモジュール
137 プログラムデータ
140 インターフェース
141 ハードディスクドライブ
144 オペレーティングシステム
145 アプリケーションプログラム
146 その他のプログラムモジュール
147 プログラムデータ
150 インターフェース
151 磁気ディスクドライブ
152 取り外し可能な不揮発性磁気ディスク
155 光ディスクドライブ
156 取り外し可能な不揮発性光ディスク
160 ユーザ入力インターフェース
161 ポインティングデバイス
162 キーボード
163 マイク
170 アダプタ
171 ローカルエリアネットワーク(LAN)
172 モデム
173 ワイドエリアネットワーク(WAN)
180 リモートコンピュータ
185 リモートアプリケーションプログラム
190 ビデオインターフェース
191 モニタ
195 出力周辺インターフェース
196 プリンタ
197 スピーカー
200 正字法規則
202 コンパイラ
204 規則FST形成
206 規則結合器
208 最小化器
210 コア結合器
214 実行可能有限状態変換器
216 表層形式
218 語彙形式
400、406、414 状態
408 自己ループ遷移
412 遷移
500、502、504 受理状態
506 棄却状態
600、602 受理状態
604 棄却状態
610、612、614 遷移
626 遷移
700、702、706 受理状態
704、708 棄却状態
710、712、714 遷移
716 遷移
718 遷移
720 遷移
722、724 遷移
802、804 状態
1002、1004 状態
902、904、906、908 状態
1006、1008、1010、1012 状態
1100、1200 初期状態
1300 初期状態
1302、1304 遷移
1306、1308 状態
1500 状態
1502、1504 遷移
1506 状態
Claims (21)
- 正字法規則をコンパイルして実行可能有限状態変換器を形成する方法であって、
前記正字法規則のコアに対してコア有限状態変換器を形成し、
前記正字法規則の文脈に対して文脈有限状態変換器を形成し、
前記正字法規則の演算子に関連付けられたテンプレートに基づき、前記コア有限状態変換器と前記文脈有限状態変換器とを結合して規則有限状態変換器を形成し、
該規則有限状態変換器を使用して、実行可能有限状態変換器を作成する
ことを特徴とする方法。 - 前記正字法規則の第2の文脈に対して第2の文脈有限状態変換器を形成し、前記規則有限状態変換器を形成することは、前記テンプレートに基づき前記コア有限状態変換器、前記文脈有限状態変換器、及び前記第2の文脈有限状態変換器を結合することを特徴とする請求項1に記載の方法。
- 前記正字法規則は第1の正字法規則であり、前記規則有限状態変換器は第1の規則有限状態変換器であり、第2の正字法規則に対するコア有限状態変換器及び文脈有限状態変換器を形成し、前記第2の規則の演算子に関連付けられたテンプレートに基づき前記コア有限状態変換器及び文脈有限状態変換器を結合して第2の規則有限状態変換器にすることを特徴とする請求項2に記載の方法。
- 前記第2の正字法規則の前記テンプレートは、前記第1の正字法規則の前記テンプレートと異なることを特徴とする請求項3に記載の方法。
- 前記第1の正字法規則の演算子は、前記第2の正字法規則の前記演算子と異なることを特徴とする請求項4に記載の方法。
- 複数の規則有限状態変換器を作成し、各規則有限状態変換器は異なる規則に関連付けられていることを特徴とする請求項1に記載の方法。
- 前記規則有限状態変換器を使用することは、同じコアを備える規則有限状態変換器を結合してコア毎に単一の結合コア有限状態変換器を形成することを特徴とする請求項6に記載の方法。
- 前記規則有限状態変換器を使用することは、コアに対する前記結合コア有限状態変換器を結合して集合有限状態変換器を形成することを特徴とする請求項7に記載の方法。
- 前記集合有限状態変換器を形成する前に各結合コア有限状態変換器を最小にすることを特徴とする請求項8に記載の方法。
- コンピュータ実行可能命令を格納するコンピュータ読取可能な媒体であって、
前記コンピュータ実行可能命令は、
正字法規則内の演算子を識別するステップと、
前記演算子に基づいてテンプレートを選択するステップと、
前記正字法規則の要素を前記テンプレートに挿入し、有限状態変換器を形成するステップと
を実行することを特徴とするコンピュータ読取可能な媒体。 - 前記正字法規則は、表層形式から語彙形式へのマッピングを示すコアを含むことを特徴とする請求項10に記載のコンピュータ読取可能な媒体。
- 前記正字法規則は、左文脈及び右文脈を含むことを特徴とする請求項11に記載のコンピュータ読取可能な媒体。
- 前記正字法規則の要素を挿入することは、前記コア、左文脈、及び右文脈を前記テンプレートに挿入することを特徴とする請求項12に記載のコンピュータ読取可能な媒体。
- 演算子を識別する前記ステップと、テンプレートを選択する前記ステップと、複数の規則のそれぞれに対する要素を挿入して複数の有限状態変換器を形成する前記ステップを実行することを特徴とする請求項10に記載のコンピュータ読取可能な媒体。
- 前記有限状態変換器のうちの少なくとも2つを結合して結合有限状態変換器を形成することを特徴とする請求項14に記載のコンピュータ読取可能な媒体。
- 少なくとも2つの有限状態変換器を結合することは、同じコアを持つすべての有限状態変換器を結合することを特徴とする請求項15に記載のコンピュータ読取可能な媒体。
- 少なくとも2つの有限状態変換器を結合することは、第1のコアを持つすべての有限状態変換器を結合することにより第1の結合有限状態変換器を形成し、第2のコアを持つすべての有限状態変換器を結合することにより第2の結合有限状態変換器を形成することを特徴とする請求項16に記載のコンピュータ読取可能な媒体。
- 前記第1の結合有限状態変換器と前記第2の結合有限状態変換器とを結合して集合有限状態変換器を形成することを特徴とする請求項17に記載のコンピュータ読取可能な媒体。
- 前記第1の結合有限状態変換器を最小化し、前記第2の結合有限状態変換器を最小化することを特徴とする請求項17に記載のコンピュータ読取可能な媒体。
- 前記集合有限状態変換器を最小化することを特徴とする請求項9に記載の方法又は請求項19に記載のコンピュータ読取可能な媒体。
- 前記集合有限状態変換器から実行可能有限状態変換器を形成することを特徴とする請求項20に記載の方法又はコンピュータ読取可能な媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/406,021 US7617089B2 (en) | 2003-04-03 | 2003-04-03 | Method and apparatus for compiling two-level morphology rules |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007302214A Division JP2008108266A (ja) | 2003-04-03 | 2007-11-21 | 2レベル形態規則をコンパイルするための方法及びその装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004334848A true JP2004334848A (ja) | 2004-11-25 |
Family
ID=32850637
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004110408A Ceased JP2004334848A (ja) | 2003-04-03 | 2004-04-02 | 2レベル形態規則をコンパイルするための方法及びその装置 |
JP2007302214A Pending JP2008108266A (ja) | 2003-04-03 | 2007-11-21 | 2レベル形態規則をコンパイルするための方法及びその装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007302214A Pending JP2008108266A (ja) | 2003-04-03 | 2007-11-21 | 2レベル形態規則をコンパイルするための方法及びその装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7617089B2 (ja) |
EP (1) | EP1465081A3 (ja) |
JP (2) | JP2004334848A (ja) |
KR (1) | KR20040086825A (ja) |
CN (1) | CN1609849A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140136210A1 (en) * | 2012-11-14 | 2014-05-15 | At&T Intellectual Property I, L.P. | System and method for robust personalization of speech recognition |
US8972243B1 (en) * | 2012-11-20 | 2015-03-03 | Amazon Technologies, Inc. | Parse information encoding in a finite state transducer |
US11145296B1 (en) * | 2019-03-25 | 2021-10-12 | Amazon Technologies, Inc. | Language and grammar model adaptation |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6032111A (en) * | 1997-06-23 | 2000-02-29 | At&T Corp. | Method and apparatus for compiling context-dependent rewrite rules and input strings |
US6760636B2 (en) * | 2000-04-03 | 2004-07-06 | Xerox Corporation | Method and apparatus for extracting short runs of ambiguity from finite state transducers |
US7010476B2 (en) * | 2000-12-18 | 2006-03-07 | Xerox Corporation | Method and apparatus for constructing finite-state networks modeling non-concatenative processes |
US20040193399A1 (en) | 2003-03-31 | 2004-09-30 | Microsoft Corporation | System and method for word analysis |
-
2003
- 2003-04-03 US US10/406,021 patent/US7617089B2/en not_active Expired - Fee Related
-
2004
- 2004-03-31 CN CNA2004100352238A patent/CN1609849A/zh active Pending
- 2004-04-02 EP EP04008086A patent/EP1465081A3/en not_active Withdrawn
- 2004-04-02 KR KR1020040022932A patent/KR20040086825A/ko not_active Application Discontinuation
- 2004-04-02 JP JP2004110408A patent/JP2004334848A/ja not_active Ceased
-
2007
- 2007-11-21 JP JP2007302214A patent/JP2008108266A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP1465081A2 (en) | 2004-10-06 |
CN1609849A (zh) | 2005-04-27 |
US7617089B2 (en) | 2009-11-10 |
KR20040086825A (ko) | 2004-10-12 |
US20040199376A1 (en) | 2004-10-07 |
JP2008108266A (ja) | 2008-05-08 |
EP1465081A3 (en) | 2006-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102129640B1 (ko) | 스트링 변환의 귀납적 합성을 위한 랭킹 기법 | |
JP4901155B2 (ja) | 音声認識装置が使用するのに適した文法を生成するための方法、媒体、およびシステム | |
KR20130111211A (ko) | 입-출력 예시를 사용한 텍스트 조작 프로그램 생성 | |
JPH1091630A (ja) | テキスト処理方法及び装置 | |
JPWO2009017131A1 (ja) | ε遷移を含まない非決定性有限オートマトン生成システムと方法およびプログラム | |
JPWO2007097208A1 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
CN108595171A (zh) | 对象的模型生成方法、装置、设备及存储介质 | |
US6944588B2 (en) | Method and apparatus for factoring unambiguous finite state transducers | |
JP2010134922A (ja) | 類似語決定方法およびシステム | |
US20030004705A1 (en) | Method and apparatus for factoring ambiguous finite state transducers | |
US7107205B2 (en) | Method and apparatus for aligning ambiguity in finite state transducers | |
JP2008108266A (ja) | 2レベル形態規則をコンパイルするための方法及びその装置 | |
US20030033135A1 (en) | Method and apparatus for extracting infinite ambiguity when factoring finite state transducers | |
US6965858B2 (en) | Method and apparatus for reducing the intermediate alphabet occurring between cascaded finite state transducers | |
JP7247593B2 (ja) | 生成装置、ソフトウェアロボットシステム、生成方法及び生成プログラム | |
JP6607482B2 (ja) | 構文解析装置、学習装置、機械翻訳装置、およびプログラム | |
JP2005063121A (ja) | ソースコード変換装置、及びソースコード変換方法、ソースコード変換プログラム、記憶媒体 | |
KR100912348B1 (ko) | 자연어처리를 위한 완성형 한글코드 음소정보 추출 방법 | |
US6760636B2 (en) | Method and apparatus for extracting short runs of ambiguity from finite state transducers | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
US20020198702A1 (en) | Method and apparatus for factoring finite state transducers with unknown symbols | |
WO2022091536A1 (ja) | 意味表現解析システム及び意味表現解析方法 | |
WO2022070422A1 (ja) | 計算機システム及び文字認識方法 | |
JP2021085996A (ja) | 音声認識システム、音声認識方法 | |
CN117744645A (zh) | 一种词性标注器的训练方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070724 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20071023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071023 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20100521 |