JP5037573B2 - 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム - Google Patents
変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム Download PDFInfo
- Publication number
- JP5037573B2 JP5037573B2 JP2009173233A JP2009173233A JP5037573B2 JP 5037573 B2 JP5037573 B2 JP 5037573B2 JP 2009173233 A JP2009173233 A JP 2009173233A JP 2009173233 A JP2009173233 A JP 2009173233A JP 5037573 B2 JP5037573 B2 JP 5037573B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- universal
- universal language
- expression
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
コンピュータによって取り扱うことができ、かつ、他の言語への変換の基礎とすることができる普遍言語による表現を生成するシステムであって、
自然言語による表現を普遍言語による表現に変換するために参照される変換規則を、少なくとも1種類の自然言語対応に記憶している変換規則部と、
与えられた自然言語による表現を、前記変換規則部に記憶される変換規則を参照して普遍言語による表現に変換処理する変換処理部とを備え、
前記変換規則部は、前記変換規則として、
自然言語を構成する自然言語要素について、それぞれが有する情報に対応する、普遍言語を構成する普遍言語要素で定義した普遍語辞書と、
自然言語の文構造に対応して配列される前記普遍言語要素の結合関係を規定すると共に、結合関係を二つの普遍語とそれらが特定の関係にあることを示す関係子とを含む二項関係で表記するための書替規則とを有し、
前記変換処理部は、与えられた自然言語による表現について、前記普遍語辞書を参照して、当該自然語表現を構成する構成要素を、前記普遍語辞書における対応する普遍言語要素に書き替える処理と、書き替えられた複数の普遍言語要素について、その配列に従って前記書替規則を適用して結合させ、かつ、前記二項関係で表記するための規則に従って、二項関係で表記される普遍言語による表現を生成する処理とを行うことを特徴とする普遍言語による表現を生成するシステムが提供される。
自然言語による表現と、コンピュータによって扱うことができる普遍言語による表現との間で相互に書き替えを行うために参照される変換規則を、少なくとも1種類の自然言語対応に記録する記録媒体であって、
前記変換規則は、
自然言語を構成する自然言語要素について、それぞれが有する情報に対応する、普遍言語を構成する普遍言語要素で定義した普遍語辞書と、
自然言語の文構造に対応して配列される前記普遍言語要素の結合関係を規定すると共に、結合関係を二つの普遍語とそれらが特定の関係にあることを示す関係子とを含む二項関係で表記するための書替規則とを有することを特徴とする変換規則を記録した記録媒体が提供される。
X(“Y”),Z
の形式で記載されている。
and(quickly,easily)、
and(Mary(icl>person),John(icl>person))
などが簡単な例として挙げられる。前者は、速くかつ簡単にの意味を表す。後者は、メアリとジョンの意味を表す。ここで、( )の記号は、要素について( )内に記述される束縛があることを示す。これについては、普遍語に関する説明の際に述べる。
−関係子−
agt 事象を引き起こすもの
and 概念間の連結関係
aoj 属性をもつもの
bas 比較の基準や程度をあらわすもの
cag 暗示的な事象を引き起こすもの
cao 暗示的な属性をもつもの
cnt 等位概念
cob 暗示的な事象の対象
con 焦点のあたっている事象や状態に影響を与える事象や状態
coo 焦点のあたっている事象や状態と同時並行に起こる事象や状態
dur 事象や状態が起こっている時間
fmt 2つのものの間の範囲
frm ものの原点
gol 対象あるいは対象に関連するものの最終状態
ins 事象を遂行するための道具
man 事象の遂行の仕方あるいは状態の性質
met 事象を遂行するための手段
mod 焦点のあたっているものを制限するもの
nam ものの名前
obj 事象によって直接影響を受ける焦点のあたっているもの
or 概念間の選択関係
per 基準単位
plc 事象の起こる場所あるいは状態が存在する場所
plf 事象が始まる場所あるいは状態が存在し始める場所
plt 事象が終わる場所あるいは状態が存在しなくなる場所
pof 全体・部分関係
pos ものの所有者
ptn 事象を一緒に引き起こす焦点のあたっていないもの
pur 事象あるいはものが存在する目的
qua ものあるいは単位の量
rsn 事象あるいは状態がおこる理由
scn 事象が起こる場面
seq 焦点のあたっている事象や状態に先立つ事象や状態
src 対象あるいは対象に関連するものの開始状態
tim 事象が起こるあるいは状態が成立する時間
tmf 事象が始まるあいは状態が成立し始まる時間
tmt 事象が終わるあるいは状態が成立し終わる時間
to ものの終点
via 事象の経由点あるいは経由状態
次に、本発明において用いる普遍語について説明する。普遍語は、次式で定義される。なお、式の表記上約束は式1と同じである。
state(equ>nation)
state(icl>situation)
state(icl>government)
また、特別の制限普遍語としては、例えば、次のような例が挙げられる。
samba(icl>dance)
さて、前述した性質を特定する情報として、属性がある。この属性は、次の式で定義される。
@ability できる
@ability−past できた
@ability−future できるだろう
@affirmative 肯定
@apodosis−cond 条件帰結
@apodosis−real 現実帰結
@apodosis−unreal 非現実帰結
@begin−just 開始直後
@begin−soon 開始直前
@complete 完了
@conclusion 結論
@confirmation 確認
@custom 習慣
@def 特定
@emphasis 強調
@end−just 終了直後
@end−soon 終了直前
@entry 焦点
@exclamation 感嘆
@expectation 期待
@future 未来
@generic 総称
@grant 許諾
@grant−not 不承認
@indef 不特定
@imperative 命令
@inevitabilit 必然
@insistence 強要
@intention 意図
@interrogative 質問
@invitation 勧誘
@may 許可
@not 否定
@obligation 義務
@obligation−not 義務なし
@ordinal 序数
@past 過去
@politeness 丁寧
@possibility 可能
@present 現在
@probability 蓋然
@progress 進行
@qfocus 疑問の焦点
@repeat 反復
@respect 尊敬
@should 当然
@state 残存状態
@theme テーマ
@topic 話題
@unexpectation 予想外
@will 意思
次に、普遍語IDは、例えば、参照可能な表記がある場合、同一の表現がある場合等において、対象を特定するために、アルファベット、数字等で識別する場合に用いられる。次のように定義される。
以上の例で用いた普遍語辞書および変換規則は、示した部分は、全体のほんの一部に過ぎない。例えば、普遍語辞書は、その語彙は、およそ100万語程度用意される。なお、本発明を特定の用途に特化して用いる場合には、語彙数は少なくてすむ。
Claims (6)
- コンピュータによって取り扱うことができ、かつ、他の言語への変換の基礎とすることができる普遍言語による表現の生成をコンピュータに実行させる際に、自然言語による表現を普遍言語による表現に変換するために参照される変換規則と、与えられた自然言語による表現を、前記記憶される変換規則を参照して普遍言語による表現に変換処理するプログラムと、を記憶する記録媒体であって、
前記変換規則として、自然言語を構成する自然言語要素について、それぞれが有する情報に対応する、普遍言語を構成する普遍言語要素で定義した普遍語辞書と、書替規則とを有し、
前記普遍語辞書には、自然言語の構成要素に対応する普遍言語が、
X(“Y”),Z
の形式で記録され、
Xには、自然言語の構成要素が表記され、Yには、前記Xに表記される構成要素が表す意味を特定する情報、および、前記Xに表記される構成要素についての評価を特定する情報のうち、少なくとも一方がそれぞれ普遍言語要素で表記され、Zには、前記Xに表記される構成要素が文の要素のいずれに相当するかを示す文要素記号が付記され、
前記書替規則には、前記ZとYとの結合関係を示す規則と、自然言語の文構造に対応して配列される前記普遍言語要素の結合関係を規定すると共に、結合関係を二つの普遍言語要素とそれらが特定の関係にあることを示す関係子とを含む二項関係で表記するための規則とが規定され、
前記プログラムは、
与えられた自然言語表現された文の構成要素である単語について、前記普遍語辞書を検索して、該当する単語に対応する普遍言語 X(“Y”),Zを索出すると共に、前記ZとYとの結合関係を示す規則を適用して、前記普遍語辞書における対応する普遍言語要素に書き替え、前記普遍言語要素に書き替えた単語の後に単語がないことを確認すると、前記辞書検索を中止する処理と、
書き替えられた複数の普遍言語要素について、その配列に従って前記書替規則を適用して結合させ、かつ、前記二項関係で表記するための規則に従って、二項関係で表記される普遍言語による表現を生成する処理と、を前記コンピュータに行わせることを特徴とする、変換規則とプログラムとを記録した記録した記録媒体。 - 請求項1に記載の記録媒体において、
前記普遍言語要素を構成する普遍語は、
それを表す文字列と、
当該普遍語について、1以上の束縛が存在する場合には、それぞれ普遍言語で定義される1以上の束縛を併記した束縛リストと、
当該普遍語を定義することに他の1以上の普遍語が用いられる場合には、その普遍語を識別する普遍語IDと、
当該普遍語について1以上の属性が特定されている場合には、それぞれ普遍言語で定義される1以上の属性を併記した属性リストとで定義され、次の形式で記録されていることを特徴とする記録媒体。
<普遍語>::= <見出し>[<束縛リスト>]
[“:”<普遍語ID>][“.”<属性リスト>]
ここで、::= は、・・・が・・・と定義されることを表す。
[ ] は、任意的に追加可能な要素を示す。
“ ” は、文字・記号が入ることを示す。
<xxx>は、変数名である。
<見出し>は、文字列で構成される。 - 請求項2に記載の記録媒体において、
前記普遍語の定義に用いられる束縛リストは、次式の形式を有することを特徴とする記録媒体。
<束縛リスト>::=“(”<束縛>[“,”<束縛>]・・・“)”
ここで、・・・は、そのものが1以上出現することを意味する。 - 請求項3に記載の記録媒体において、
前記束縛リストに挙げられる束縛は、次の形式で定義されることを特徴とする記録媒体。
<束縛>::=<関係子>{“>”|“<”}<普遍語>[<束縛リスト>]|
<関係子>{“>”|“<”}<普遍語>[<束縛リスト>]
[{“>”|“<”}<普遍語>[<束縛リスト>]]・・・
ここで、| は、離接、“または”を表す。
{ } は、選択要素を示す。 - 請求項2に記載の記録媒体において、
前記普遍語の定義に用いられる属性リストは、次の形式を有することを特徴とする記録媒体。
<属性リスト>::=<属性子>[“.”<属性子>]・・・ - コンピュータによって取り扱うことができ、かつ、他の言語への変換の基礎とすることができる普遍言語による表現を生成するシステムであって、
自然言語による表現を普遍言語による表現に変換するために参照される変換規則を、少なくとも1種類の自然言語対応に記憶している変換規則部と、
与えられた自然言語による表現を、前記変換規則部に記憶される変換規則を参照して普遍言語による表現に変換処理する変換処理部と、を備え、
前記変換規則部は、前記変換規則として、自然言語を構成する自然言語要素について、それぞれが有する情報に対応する、普遍言語を構成する普遍言語要素で定義した普遍語辞書と、書替規則とを有し、
前記普遍語辞書には、自然言語の構成要素に対応する普遍言語が、
X(“Y”),Z
の形式で記録され、
Xには、自然言語の構成要素が表記され、Yには、前記Xに表記される構成要素が表す意味を特定する情報、および、前記Xに表記される構成要素についての評価を特定する情報のうち、少なくとも一方がそれぞれ普遍言語要素で表記され、Zには、前記Xに表記される構成要素が文の要素のいずれに相当するかを示す文要素記号が付記され、
前記書替規則には、前記ZとYとの結合関係を示す規則と、自然言語の文構造に対応して配列される前記普遍言語要素の結合関係を規定すると共に、結合関係を二つの普遍言語要素とそれらが特定の関係にあることを示す関係子とを含む二項関係で表記するための規則とが規定され、
前記変換処理部は、
与えられた自然言語表現された文の構成要素である単語について、前記普遍語辞書を検索して、該当する単語に対応する普遍言語 X(“Y”),Zを索出すると共に、前記前記ZとYとの結合関係を示す規則を適用して、前記普遍語辞書における対応する普遍言語要素に書き替え、前記普遍言語要素に書き替えた単語の後に単語がないことを確認すると、前記辞書検索を中止する処理と、
書き替えられた複数の普遍言語要素について、その配列に従って前記書替規則を適用して結合させ、かつ、前記二項関係で表記するための規則に従って、二項関係で表記される普遍言語による表現を生成する処理と、を行うこと
を特徴とする普遍言語による表現を生成するシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009173233A JP5037573B2 (ja) | 1999-11-17 | 2009-07-24 | 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32752599 | 1999-11-17 | ||
JP1999327525 | 1999-11-17 | ||
JP2009173233A JP5037573B2 (ja) | 1999-11-17 | 2009-07-24 | 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001540628A Division JP4377096B2 (ja) | 1999-11-17 | 2000-11-17 | 普遍言語による表現を生成するシステム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009238255A JP2009238255A (ja) | 2009-10-15 |
JP2009238255A5 JP2009238255A5 (ja) | 2011-08-18 |
JP5037573B2 true JP5037573B2 (ja) | 2012-09-26 |
Family
ID=18200087
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001540628A Expired - Fee Related JP4377096B2 (ja) | 1999-11-17 | 2000-11-17 | 普遍言語による表現を生成するシステム |
JP2009173233A Expired - Fee Related JP5037573B2 (ja) | 1999-11-17 | 2009-07-24 | 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001540628A Expired - Fee Related JP4377096B2 (ja) | 1999-11-17 | 2000-11-17 | 普遍言語による表現を生成するシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US6704700B1 (ja) |
EP (1) | EP1241584A4 (ja) |
JP (2) | JP4377096B2 (ja) |
CN (1) | CN1415097A (ja) |
AU (1) | AU1415101A (ja) |
WO (1) | WO2001039034A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1415097A (zh) * | 1999-11-17 | 2003-04-30 | 联合国 | 用于创建通用语言的表达的系统和记录其使用的转换规则的记录介质 |
CN1271545C (zh) * | 1999-11-17 | 2006-08-23 | 联合国 | 语言翻译系统 |
JP4410486B2 (ja) | 2003-05-12 | 2010-02-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 機械翻訳装置及びプログラム |
US20070206771A1 (en) * | 2006-03-03 | 2007-09-06 | Childers Stephen Steve R | Key talk |
US20100280818A1 (en) * | 2006-03-03 | 2010-11-04 | Childers Stephen R | Key Talk |
US8463592B2 (en) * | 2010-07-27 | 2013-06-11 | International Business Machines Corporation | Mode supporting multiple language input for entering text |
CN105338161A (zh) * | 2014-06-30 | 2016-02-17 | 展讯通信(上海)有限公司 | 一种语句信息匹配系统及方法以及移动终端 |
FR3117639A1 (fr) | 2020-12-14 | 2022-06-17 | CS GROUP - France | Système et procédé de conversion d’un document source en langage naturel en une représentation abstraite en langage universel ayant un sens garanti |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4864503A (en) * | 1987-02-05 | 1989-09-05 | Toltran, Ltd. | Method of using a created international language as an intermediate pathway in translation between two national languages |
JPH0414175A (ja) * | 1990-05-07 | 1992-01-20 | Ricoh Co Ltd | 自然言語文解析装置 |
ES2101613B1 (es) * | 1993-02-02 | 1998-03-01 | Uribe Echebarria Diaz De Mendi | Metodo de traduccion automatica interlingual asistida por ordenador. |
US5587903A (en) * | 1994-06-22 | 1996-12-24 | Yale; Thomas W. | Artificial intelligence language program |
US5884247A (en) * | 1996-10-31 | 1999-03-16 | Dialect Corporation | Method and apparatus for automated language translation |
US6092035A (en) * | 1996-12-03 | 2000-07-18 | Brothers Kogyo Kabushiki Kaisha | Server device for multilingual transmission system |
JP3467159B2 (ja) * | 1996-12-03 | 2003-11-17 | ブラザー工業株式会社 | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 |
US6233546B1 (en) * | 1998-11-19 | 2001-05-15 | William E. Datig | Method and system for machine translation using epistemic moments and stored dictionary entries |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
CN1415097A (zh) * | 1999-11-17 | 2003-04-30 | 联合国 | 用于创建通用语言的表达的系统和记录其使用的转换规则的记录介质 |
-
2000
- 2000-11-17 CN CN00817888A patent/CN1415097A/zh active Pending
- 2000-11-17 EP EP00976318A patent/EP1241584A4/en not_active Withdrawn
- 2000-11-17 US US10/130,358 patent/US6704700B1/en not_active Expired - Lifetime
- 2000-11-17 AU AU14151/01A patent/AU1415101A/en not_active Abandoned
- 2000-11-17 JP JP2001540628A patent/JP4377096B2/ja not_active Expired - Fee Related
- 2000-11-17 WO PCT/JP2000/008115 patent/WO2001039034A1/ja not_active Application Discontinuation
-
2009
- 2009-07-24 JP JP2009173233A patent/JP5037573B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1241584A4 (en) | 2006-05-17 |
WO2001039034A1 (fr) | 2001-05-31 |
AU1415101A (en) | 2001-06-04 |
EP1241584A1 (en) | 2002-09-18 |
US6704700B1 (en) | 2004-03-09 |
JP4377096B2 (ja) | 2009-12-02 |
CN1415097A (zh) | 2003-04-30 |
JP2009238255A (ja) | 2009-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4291532B2 (ja) | 言語変換システム | |
JP5037573B2 (ja) | 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム | |
US20200243076A1 (en) | Multi-Dimensional Parsing Method and System for Natural Language Processing | |
US5895446A (en) | Pattern-based translation method and system | |
Van der Vlist | Relax ng: A simpler schema language for xml | |
US8271264B2 (en) | Systems and methods for natural language communication with a computer | |
EP1542138A1 (en) | Learning and using generalized string patterns for information extraction | |
JP2017199363A (ja) | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム | |
JP7230576B2 (ja) | 生成装置、学習装置、生成方法及びプログラム | |
Wax | Automated grammar engineering for verbal morphology | |
WO2022123637A1 (ja) | 文書処理システムおよび文書処理方法 | |
JPH02112068A (ja) | テキスト簡略表示方式 | |
Mridha et al. | Development of morphological rules for bangla words for universal networking language | |
Prakash et al. | Domain Specific Text Preprocessing for Open Information Extraction | |
Cuřín et al. | Building a parallel bilingual syntactically annotated corpus | |
JP3113257B2 (ja) | 機械翻訳装置 | |
Ali et al. | Development of analysis rules for Bangla root and primary suffix for universal networking language | |
JP4938298B2 (ja) | テキストの要約に含める文の候補を出力する方法およびプログラム | |
Sperberg-McQueen | Fault tolerance, error tolerance, diversity tolerance | |
Xuetao et al. | A corpus-based NLP-chain for a web-based Assisting Conversational Agent | |
KR20240067521A (ko) | 자연어 처리를 위한 데이터 전처리 장치 및 방법 | |
EP1465081A2 (en) | Method and apparatus for compiling two-level morphology rules | |
Haj et al. | Automated Checking of Conformance to SBVR Structured English Notation | |
Jaya et al. | A novel approach for construction of sentences for automatic story generation using ontology | |
JP6573839B2 (ja) | 文生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20120110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120403 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120704 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |