JP4092861B2 - 自然言語パターン作成装置及び方法 - Google Patents
自然言語パターン作成装置及び方法 Download PDFInfo
- Publication number
- JP4092861B2 JP4092861B2 JP2000224767A JP2000224767A JP4092861B2 JP 4092861 B2 JP4092861 B2 JP 4092861B2 JP 2000224767 A JP2000224767 A JP 2000224767A JP 2000224767 A JP2000224767 A JP 2000224767A JP 4092861 B2 JP4092861 B2 JP 4092861B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- natural language
- name
- sentence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は自然言語パターン作成装置及び方法に関し、例えば、パターンに基づく機械翻訳装置で使用される翻訳パターンを作成する場合に適用し得るものである。
【0002】
【従来の技術】
従来型の機械翻訳装置において、システムやユーザが登録可能な翻訳知識(システム辞書やユーザ辞書)は、単語辞書、複数単語からなるイディオム、さらに、高性能なものでも「手を焼く」などの動詞と名詞の共起表現など、機械翻訳装置が予め決めている表現に限定されていた。これは、従来型の機械翻訳装置は、原言語の文法と辞書で原言語文を構文解析をし、変換辞書で言語変換し、目的言語の文法と辞書で目的言語文を生成するため、システムの文法に則った形式でしか、システムやユーザは翻訳辞書を登録できないためである。
【0003】
さらに、原言語と目的言語は、個別に解析、生成されるため、翻訳知識としてシステム開発者やユーザの直感に即した
”[名詞句]を次に示します。”
”Following is [名詞句].”(名詞句は変数) (P1)のような原言語と目的言語の対から構成されるパターンに基づいた辞書も登録できない。
【0004】
このような課題を解決したものとして、特開平5−290082号公報に記載された翻訳パターンに基づく翻訳方法及び翻訳装置がある。この公報記載の発明は、翻訳知識を文脈自由文法の範囲内で表し、文法規則を原言語のパターンと目的言語のパターンとで対にしたものである。また、文法規則はトライ型の辞書に格納することにより、構文解析の速さを実用レベルにすることを可能にした。さらに、文法規則を原言語のパターンと目的言語のパターンとで対にしたことにより、同期導出が可能となり、言語変換、構文生成は簡単な処理だけで済むようになった。
【0005】
これにより、システム開発者やユーザの直感に即した上述したパターンP1のような原言語と目的言語の対から構成される翻訳パターンに基づいた辞書が登録できるようになり、文脈自由文法の範囲内なら任意の翻訳知識を登録でき、翻訳処理できるようになった。
【0006】
【発明が解決しようとする課題】
しかしながら、上記公報の技術では、全ての翻訳知識を文脈自由文法で記述する必要がある。
【0007】
そのため、パターンの作成には文法的知識が必要であり、ユーザ登録機能をパターンに基づく機械翻訳装置に搭載したとしても、かなりの文法的知識が必要であり、一般的なユーザには困難なものとなる。また、システム開発者がパターンを作成する場合であっても、手作業でパターンを作成していたのでは、その処理負担は非常に大きい。
【0008】
ところで、文脈自由文法では各変数(非終端記号)に制約を与えることはできず、制約を付与したい場合には、制約を付与した文法及び制約を付与していない文法を区別して独立に用意しなければならず、その結果、文法の数が膨大になってしまい、メインテナンスが非常に困難になる。
【0009】
この問題を解決するものとして、素性(形態素情報、構文情報、意味情報など翻訳で用いられる各種情報における特徴情報)を用いてパターンヘの制約を行なう方法(本件出願人による別出願)が検討されている。
【0010】
このようにパターンに対する情報(素性情報)が多くなれば、パターンの作成は一段と難しいものとなる。すなわち、素性を用いたパターンの作成では、一段と文法的知識が必要でなって作成は、難しいものとなる。
【0011】
本発明は、以上の点を考慮してなされたものであり、自然言語パターンを簡単に作成することができる自然言語パターン作成装置及び方法を提供しようとしたものである。
【0012】
【課題を解決するための手段】
かかる課題を解決するため、第1の本発明は、構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成装置であり、(1)自然言語パターンを生成する対象となる入力文を受け付ける入力手段と、(2)その入力文に対し、形態素解析を行う形態素解析手段と、(3)形態素解析結果に基づき上記自然言語パターンを利用しない構文解析を行い、この構文解析結果で得た入力文全体の句構造規則の標識を、入力文から生成する上記自然言語パターンのパターン名とするパターン名推定手段と、(4)推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開手段と、(5)展開により生成された自然言語パターンを出力する出力手段とを有することを特徴とする。 第2の本発明は、構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成装置であって、(1)自然言語パターンを生成する対象となる入力文を受け付ける入力手段と、(2)その入力文に対し、形態素解析を行う形態素解析手段と、(3)形態素の品詞とパターン名とを対応付けたテーブルから、形態素解析結果で得た特定位置の形態素の品詞に対応するパターン名を抽出し、この抽出したパターン名を入力文から生成する上記自然言語パターンのパターン名とするパターン名推定手段と、(4)推定されたパターン名に対応付け、パターン構成要素の部分に、形態素解析による形態素の情報を展開させるパターン展開手段と、(5)展開により生成された自然言語パターンを出力する出力手段とを有することを特徴とする。
【0013】
また、第3の本発明は、構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成方法であり、コンピュータが、入力手段、形態素解析手段、パターン名推定手段、パターン展開手段及び出力手段を備え、(1)入力手段が、自然言語パターンを生成する対象となる入力文を受け付ける入力工程と、(2)形態素解析手段が、その入力文に対し、形態素解析を行う形態素解析工程と、(3)パターン名推定手段が、形態素解析結果に基づき上記自然言語パターンを利用しない構文解析を行い、この構文解析結果で得た入力文全体の句構造規則の標識を、入力文から生成する上記自然言語パターンのパターン名とするパターン名推定工程と、(4)パターン展開手段が、推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開工程と、(5)出力手段が、展開により生成された自然言語パターンを出力する出力工程とを有することを特徴とする。 第4の本発明は、構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成方法であって、コンピュータが、入力手段、形態素解析手段、パターン名推定手段、パターン展開手段及び出力手段を備え、(1)入力手段が、自然言語パターンを生成する対象となる入力文を受け付ける入力工程と、(2)形態素解析手段が、その入力文に対し、形態素解析を行う形態素解析工程と、(3)パターン名推定手段が、形態素の品詞とパターン名とを対応付けたテーブルから、形態素解析結果で得た特定位置の形態素の品詞に対応するパターン名を抽出し、この抽出したパターン名を入力文から生成する自然言語パターンのパターン名とするパターン名推定工程と、(4)パターン展開手段が、推定されたパターン名に対応付け、パターン構成要素の部分に、形態素解析による形態素の情報を展開させるパターン展開工程と、(5)出力手段が、展開により生成された自然言語パターンを出力する出力工程とを有することを特徴とする。
【0014】
【発明の実施の形態】
(A)一実施形態
以下、本発明による自然言語パターン作成装置及び方法の一実施形態を図面を参照しながら詳述する。
【0015】
この実施形態の自然言語パターン作成装置及び方法は、機械翻訳装置に搭載されてユーザ登録機能の実現方法として利用されることを意図している。この実施形態の自然言語パターン作成装置及び方法は、素の対訳(図3参照)あるいは一部を変数化した対訳(図4参照)から、原言語パターン及び目的言語パターンでなる翻訳パターンを自動的に作成することを意図している。
【0016】
(A−1)実施形態の構成
図1は、この実施形態の自然言語パターン作成装置の機能的構成を示すブロック図である。なお、実際上は、例えば、パソコンなどの情報処理装置上に、処理プログラムや固定データなどがローディングされて、実施形態の自然言語パターン作成装置が構築される。
【0017】
図1において、この実施形態の自然言語パターン作成装置は、入力部101、形態素解析部102、パターン生成部103及び出力部104を有する。
【0018】
この実施形態の自然言語パターン作成装置及び方法は、素の対訳(図3)あるいは一部をパターン化した対訳(図4や図5)などから、原言語パターン及び目的言語パターンでなる翻訳パターン(図2)を自動的に作成するものである。
【0019】
図2において、上側が英語パターンを表し、下側が日本語パターンを表し、これら英語パターン及び日本語パターンが対になって翻訳パターンとなっている。各言語のパターンは、
[言語名:パターン名 パターン構成要素]
からなる。
【0020】
言語名は、英語(en)か日本語(jp)かなど各言語種類を規定する。
【0021】
言語名直後のパターン名は、左辺とも呼ばれ、そのパターンが果たす文法的役割を表しており、例えば、S(文)、VP(動詞句)、NP(名詞句)等の句構造規則での標識が適用される。
【0022】
パターン構成要素は、右辺とも呼ばれ、例えば、単語、変数、又は、単語と変数の並び、からなる。変数は[任意の数字:パターン名(パターン構成要素を伴うこともある)]で記述される。任意の数字部分は、対となっているパターン間での対応関係を示すものである。例えば、構文解析においては、変数に、別のパターンが適用することにより、パターンは入れ子構造をとることができる。また、単語及びパターン名は、以下のように、品詞(品詞=v)、活用形、意味情報(意味=人)など翻訳時に必要となる詳細な情報(素性の情報)を持つことができる。さらに、単語及びパターン名は、詳細情報を変数化([1:NP:意味=人])して、情報の参照をすることもできる。
【0023】
[en:VP arrest:品詞=v[1:NP:意味=人]]
詳細情報は素性情報とも呼ばれ、パターンにおいては、上述のように、素性名と素性値の組で与えられている。
【0024】
入力対訳としては、以下のいずれの形式でも良い。なお、図3、図4及び図5は、入力対訳の例である。
【0025】
1.加工されていない普通(素)の文(図3)
2.予め部分的にパターン化されているもの
(a) 変数を含むもの(図4)
(b) 文の内部で区切られているもの(図5)
(c) (a)(b)の混合したもの
なお、図4において、[1:NP]が変数部分を表している。変数部分のうち数字は、2個以上の同一変数名の変数が適用された場合に特に意味を有するものであり、原言語及び目的言語での変数間の対応関係を示している。また、変数名としては、例えば、NPのように、文脈自由文法での変数名を適用する。このような変数名が、翻訳パターンにそのまま反映される。
【0026】
また、図5において、品詞=代名詞のように、パターンに必要な情報が既に盛り込まれていても良い。
【0027】
入力部101は、上述したような処理対象となる対訳又は一部変数化(パターン化)された対訳を入力として受け付けるものである。なお、入力対訳は、1文が完全に構成されている必要はない。入力部101は、キーボードや、対訳をファイルから読み出すファイル読込装置等が該当する。
【0028】
形態素解析部102は、入力された対訳のそれぞれの言語文を、形態素(単語)毎に区切り、品詞や活用形などの情報を形態素毎に付与してパターン生成部103に与えるものである。ここで、形態素解析部102は、両言語の形態素辞書を内蔵しているものである。また、形態素解析部102は、一般的な形態素解析部を適用可能であるが、部分的にパターン化された対訳の入力時においては、各パターン化部分を1個の形態素としてそのまま扱う。
【0029】
パターン生成部103は、形態素解析部102の形態素解析結果から、機械翻訳処理で適用可能な(完全な形の)翻訳パターンを生成するものである。
【0030】
パターン生成部103は、図6に示すように、パターン名推定部105及びパターン展開部106から構成されている。
【0031】
パターン名推定部105は、例えば、一般的な構文解析部(パターンを利用しない構文解析部)が該当し、形態素解析結果の各形態素や複数の形態素の固まりに、翻訳パターンにした際のパターン名を付与するものである。
【0032】
パターン展開部106は、詳細は動作の項で後述するが、図7に示すようなパターン名とパターンテンプレートとを対応付けているパターンへの展開用テーブルを内蔵しており、パターン名推定部105が推定したパターン名で展開用テーブルをアクセスしてパターンテンプレートを取り出し、それに、形態素解析結果での形態素情報や推定されたパターン名等の今回の入力文(原言語又は目的言語)に係る情報を当てはめて翻訳パターンを得るものである。
【0033】
なお、形態素解析部102やパターン生成部103は、各言語毎の構成に分かれている。
【0034】
出力部104は、得られた翻訳パターンを出力するものである。例えば、表示出力や印刷出力しても良く、ファイルに書き込んでも良く、更には、機械翻訳装置におけるシステム翻訳パターン辞書やユーザ翻訳パターン辞書に直接書き込んでも良い。なお、出力部104は、一旦、表示出力し、システム開発者やユーザによる手直し(例えば、素性の情報の付加)を実行させた後、ファイルに書き込んだり、システム翻訳パターン辞書やユーザ翻訳パターン辞書に書き込んだりするようにしても良い。
【0035】
(A−2)実施形態の動作
次に、以上のような各部からなる実施形態の自然言語パターン作成装置の動作(自然言語パターン作成方法)を具体例を用いて説明する。
【0036】
入力された対訳(各言語の文)は、形態素解析部102によって、それぞれ形態素解析される。
【0037】
図8は、図3に示した加工されていない入力対訳に対する形態素解析結果を示すものである。すなわち、図3に示すような加工されていない入力対訳に対しては、一般的な形態素解析処理が実行される。
【0038】
図4に示した一部に変数を含む、部分的にパターン化された入力対訳のそれぞれの文に対しては、文頭と変数、変数と変数、あるいは、変数と文末に挟まれた範囲が形態素解析される。従って、図4の日本語文に対する形態素解析結果は、以下の通りとなる。
【0039】
彼(代名詞) は(格助詞) [1:NP] だ(助動詞,連用形)
た(助動詞,終止形)
図5に示した品詞情報及び活用情報が付与された、部分的にパターン化された入力対訳のそれぞれの文に対しては、品詞情報及び活用情報が付与されていない部分に対して形態素解析がなされる。この場合の入力対訳に対しても、図8に示す形態素解析結果が得られる。
【0040】
なお、形態素解析処理で利用する形態素辞書に、意味情報を付与できる情報をも盛り込んでも良い。例えば、「彼」や「医者」という形態素に意味=人という情報を付加していても良い。また例えば、形態素辞書に、他動詞や形容詞等については、下記のように、その目的語や被修飾語としてどういう意味をとるかを含め、形態素解析結果に意味情報を含めるようにしても良い。
【0041】
arrest 品詞=動詞 目的語意味=人
young 品詞=形容詞 被修飾語意味=生物
形態素解析結果(形態素列)を基に、パターン生成部103によって、翻訳パターンが作成される。
【0042】
パターン生成部103においてはまず、パターン名推定部105によって、そのパターンの果たす文法的役割が推定され、パターン名が付与される。文法的役割の推定方法としては、構文解析を行う方法や、品詞を文法的役割に対応付けるテーブルを用意しておいて、パターンを構成する特定の位置の単語(形態素)の品詞でテーブルを引いてパターン名を決定するヒューリスティックな方法などを適用できる。
【0043】
パターン名推定部105として構文解析部(パターンを用いない構文解析部)を適用した場合において、図8に示した形態素解析結果(図3及び図5の入力対訳に対応)に対し、図9(a)及び(b)に示す構文解析結果が得られる。この構文解析した結果は、平叙文を表す構文木(トップノードが平叙文)になっており、パターン名は平叙文(SPred)となる。また、図4の入力対訳に係る形態素解析結果に対して、図10(a)及び(b)に示す構文解析結果が得られる。この構文解析した結果も、平叙文を表す構文木になっており、パターン名は平叙文(SPred)となる。
【0044】
パターン展開部106は、パターン名とパターンテンプレートの集合を対としている図7に示す展開用テーブルを内蔵している。ここで、図7(a)は英語用の展開用テーブルを示し、図7(b)は日本語用の展開用テーブルを示している。パターン展開部106は、推定されたパターン名で、該当するパターンテンプレートを取り出し、それに形態素解析結果等を当てはめて翻訳パターンを生成する。
【0045】
なお、展開用テーブルにおいて、あるパターン名に対して複数のパターンテンプレートを設けても良く、この場合には、複数の翻訳パターンが生成される。この際には、日本語のn番目のパターンテンプレートと英語のn番目のパターンテンプレートとは対応付けられており、パターンテンプレートを両言語間で任意に組み合わせることはできない。
【0046】
図11は、図3に示す入力対訳に対して生成された翻訳パターンの例を示している。
【0047】
以上のようにして生成された翻訳パターンが出力部104によって、出力処理される。
【0048】
以上、入力対訳が1文の場合を例に動作を示したが、1文の一部分を入力対訳として入力して、翻訳パターンを生成することもできる。例えば、次の対訳を入力して翻訳パターンを生成することができる。
【0049】
arrest
逮捕する
この場合も、各部での動作は同様である。詳述は避けるが、図12に、この入力対訳に対する形態素解析結果を示し、図13に、その構文解析結果(パターン名推定結果)を示し、図14に、適用されるパターン展開用テーブル部分を示し、図15に、生成された翻訳パターンを示す。
【0050】
なお、図15に示した2番目の翻訳パターンにおいて、[1:NP:sem=ca]は、パターンテンプレートの構文情報が他動詞であるため、形態素解析での目的語意味=人を変数として入れて構成されたものである。
【0051】
(A−3)実施形態の効果
上記実施形態の自然言語パターン作成装置及び方法によれば、以下の効果を奏することができる。
【0052】
(a)入力対訳を入力するという簡単な操作を行うだけで、システム開発者やユーザは翻訳パターンを生成することができる。
【0053】
特に、文法的知識をあまり持たないユーザが手作業でパターンを作成するのは非常に困難であったが、このような課題を解決できる。また、パターンに意味等の制約を盛り込むことが検討されており、よりパターンの作成が難しくなっているが、この実施形態を適用することで簡単にパターンを作成することができ、必要ならば、作成されたパターンの一部を修正するだけで、所望する制約が付与されたパターンを容易に作成することができる。
【0054】
(b)制約などの情報を機械的に付与することができるので系統立ったパターンを作成することが可能となり、メンテナンス性の高い辞書を構築できる。
【0055】
(B)他の実施形態
パターンの表現方法として図2のような形式を示したが、同じ情報量があるなら他の表現形式を用いても良い。この場合には、その形式に応じたパターン展開用テーブルを適用することを要する。
【0056】
また、パターン展開用テーブルとして図8のような形式を示したが、同じ情報量があるなら他の表現形式を用いても良い。さらには、パターン展開用テーブルを用いずに、パターン構成要素の部分に、単に形態素解析結果の形態素を並べるような方法でパターンを作成しても良い。
【0057】
なお、上記実施形態の自然言語パターン作成装置及び方法は、パターンのユーザ登録機能に適用可能である。登録機能に対しては削除機能を搭載することも多いが、上記実施形態の方法で作成された翻訳パターンは、例えば、以下(a)〜(c)のようにして削除すれば良い。
【0058】
(a)登録された翻訳パターンの一覧を提示して、ユーザが指定した翻訳パターンを削除する。
【0059】
(b)登録時に入力した元の対訳を別ファイルに記録しておき、削除指令時にその一覧を提示する。指定された対訳に対し、登録時と同様な翻訳パターンの作成処理を行い、作成された翻訳パターンと同じものを登録辞書から削除する。
【0060】
(c)登録されている翻訳パターンから元の文字列(対訳の一方でも良い)を復元して、元の文字列の一覧を提示する。選択された元の文字列に対応する翻訳パターンを削除する。なお、パターン内の各単語(形態素)は、標準形になっているが、品詞と活用情報が付与されているので、それを元に活用させてやれば元の文字列を復元できる。
【0061】
上記実施形態は、翻訳パターンを利用した機械翻訳装置及び方法に適用することを意図して原言語パターン及び目的言語パターンでなる翻訳パターンを作成するものであったが、ある1言語だけの自然言語パターンを作成する際にも、本発明を適用することができる。例えば、回答文をパターン(自然言語パターン)を用いて構文解析する質疑応答装置であれば、1言語だけの自然言語パターンで十分である。
【0062】
【発明の効果】
以上のように、本発明の自然言語パターン作成装置及び方法によれば、パターン化の対象となる入力文に対し形態素解析を行い、形態素解析結果に基づき、構文解析の利用又は所定の対応テーブルを利用して、自然言語パターンが果たす文法的役割を表すパターン名を推定し、推定されたパターン名に対応付け、パターン構成要素の部分に、形態素解析による形態素の情報を展開させることにより自然言語パターンを生成するようにしたので、自然言語パターンを簡単に作成することができる。
【図面の簡単な説明】
【図1】実施形態の自然言語パターン作成装置の機能的構成を示すブロック図である。
【図2】実施形態の翻訳パターンの表現形式を示す説明図である。
【図3】実施形態の装置への入力対訳例(1)を示す説明図である。
【図4】実施形態の装置への入力対訳例(2)を示す説明図である。
【図5】実施形態の装置への入力対訳例(3)を示す説明図である。
【図6】実施形態のパターン生成部103の内部構成を示すブロック図である。
【図7】実施形態のパターン展開用テーブルの構成例を示す説明図である。
【図8】実施形態の装置への入力対訳例(1)及び(3)に係る形態素解析結果を示す説明図である。
【図9】実施形態の装置への入力対訳例(1)及び(3)に係るパターン名推定結果(構文解析結果)を示す説明図である。
【図10】実施形態の装置への入力対訳例(2)に係るパターン名推定結果(構文解析結果)を示す説明図である。
【図11】実施形態の装置への入力対訳例(1)に対し生成された翻訳パターン例を示す説明図である。
【図12】実施形態の装置への入力対訳例(4)に係る形態素解析結果を示す説明図である。
【図13】実施形態の装置への入力対訳例(4)に係るパターン名推定結果(構文解析結果)を示す説明図である。
【図14】実施形態の装置への入力対訳例(4)に関係するパターン展開用テーブルの構成例を示す説明図である。
【図15】実施形態の装置への入力対訳例(4)に対し生成された翻訳パターン例を示す説明図である。
【符号の説明】
100…入力部、102…形態素解析部、103…パターン生成部、104…出力部、105…パターン名推定部、106…パターン展開部。
Claims (12)
- 構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成装置であって、
上記自然言語パターンを生成する対象となる入力文を受け付ける入力手段と、
その入力文に対し、形態素解析を行う形態素解析手段と、
形態素解析結果に基づき上記自然言語パターンを利用しない構文解析を行い、この構文解析結果で得た上記入力文全体の句構造規則の標識を、上記入力文から生成する上記自然言語パターンの上記パターン名とするパターン名推定手段と、
推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開手段と、
展開により生成された上記自然言語パターンを出力する出力手段と
を有することを特徴とする自然言語パターン作成装置。 - 構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成装置であって、
上記自然言語パターンを生成する対象となる入力文を受け付ける入力手段と、
その入力文に対し、形態素解析を行う形態素解析手段と、
形態素の品詞とパターン名とを対応付けたテーブルから、上記形態素解析結果で得た特定位置の形態素の品詞に対応するパターン名を抽出し、この抽出したパターン名を上記入力文から生成する上記自然言語パターンのパターン名とするパターン名推定手段と、
推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開手段と、
展開により生成された上記自然言語パターンを出力する出力手段と
を有することを特徴とする自然言語パターン作成装置。 - 上記入力手段の受け付ける入力文が、自然言語文の1文又はその自然言語文の部分、及び、自然言語文の一文又はその自然言語文の部分の一部に、変数、単語や文節の区切り、素性情報を含むものであることを特徴とする請求項1又は2に記載の自然言語パターン作成装置。
- 上記パターン展開手段が、形態素解析結果である、素性情報を有する形態素の並びをそのままパターン構成要素として上記自然言語パターンを生成することを特徴とする請求項1〜3のいずれかに記載の自然言語パターン作成装置。
- 上記パターン展開手段が、推定されたパターン名に対応する予め用意されている1又は複数のパターンテンプレートに、形態素解析結果の形態素情報を当てはめて1又は複数の上記自然言語パターンを生成することを特徴とする請求項1〜3のいずれかに記載の自然言語パターン作成装置。
- 上記入力手段が、第1の言語及び第2の言語の対訳入力文を受付けて、
上記パターン展開手段が、第1の言語及び第2の言語の自然言語パターンの対でなる翻訳パターンを作成する
ことを特徴とする請求項1〜5のいずれかに記載の自然言語パターン作成装置。 - 構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成方法であって、
コンピュータが、入力手段、形態素解析手段、パターン名推定手段、パターン展開手段及び出力手段を備え、
上記入力手段が、上記自然言語パターンを生成する対象となる入力文を受け付ける入力工程と、
上記形態素解析手段が、その入力文に対し、形態素解析を行う形態素解析工程と、
上記パターン名推定手段が、形態素解析結果に基づき上記自然言語パターンを利用しない構文解析を行い、この構文解析結果で得た上記入力文全体の句構造規則の標識を、上記入力文から生成する上記自然言語パターンの上記パターン名とするパターン名推定工程と、
上記パターン展開手段が、推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開工程と、
上記出力手段が、展開により生成された自然言語パターンを出力する出力工程と
を有することを特徴とする自然言語パターン作成方法。 - 構文解析又は構文生成に利用される、少なくともパターン名及びパターン構成要素でなる自然言語パターンを入力文から作成する自然言語パターン作成方法であって、
コンピュータが、入力手段、形態素解析手段、パターン名推定手段、パターン展開手段及び出力手段を備え、
上記入力手段が、上記自然言語パターンを生成する対象となる入力文を受け付ける入力工程と、
上記形態素解析手段が、その入力文に対し、形態素解析を行う形態素解析工程と、
上記パターン名推定手段が、形態素の品詞とパターン名とを対応付けたテーブルから、上記形態素解析結果で得た特定位置の形態素の品詞に対応するパターン名を抽出し、この抽出したパターン名を上記入力文から生成する上記自然言語パターンのパターン名とするパターン名推定工程と、
上記パターン展開手段が、推定されたパターン名に対応付け、上記パターン構成要素の部分に、上記形態素解析による形態素の情報を展開させるパターン展開工程と、
上記出力手段が、展開により生成された自然言語パターンを出力する出力工程と
を有することを特徴とする自然言語パターン作成方法。 - 上記入力手段の受け付ける入力文が、自然言語文の1文又はその自然言語文の部分、及び、自然言語文の1文又はその自然言語文の部分の一部に、変数、単語や文節の区切り、素性情報を含むものであることを特徴とする請求項7又は8に記載の自然言語パターン作成方法。
- 上記パターン展開手段が、形態素解析結果である、素性情報を有する形態素の並びをそのままパターン構成要素として自然言語パターンを生成することを特徴とする請求項7〜9のいずれかに記載の自然言語パターン作成方法。
- 上記パターン展開手段が、推定されたパターン名に対応する予め用意されている1又は複数のパターンテンプレートに、形態素解析結果の形態素情報を当てはめて1又は複数の自然言語パターンを生成することを特徴とする請求項7〜9のいずれかに記載の自然言語パターン作成方法。
- 上記入力手段が、第1の言語及び第2の言語の対訳入力文を受付けて、
上記パターン展開手段が、第1の言語及び第2の言語の自然言語パターンの対でなる翻訳パターンを作成する
ことを特徴とする請求項7〜11のいずれかに記載の自然言語パターン作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000224767A JP4092861B2 (ja) | 2000-07-26 | 2000-07-26 | 自然言語パターン作成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000224767A JP4092861B2 (ja) | 2000-07-26 | 2000-07-26 | 自然言語パターン作成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002041511A JP2002041511A (ja) | 2002-02-08 |
JP4092861B2 true JP4092861B2 (ja) | 2008-05-28 |
Family
ID=18718663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000224767A Expired - Fee Related JP4092861B2 (ja) | 2000-07-26 | 2000-07-26 | 自然言語パターン作成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4092861B2 (ja) |
-
2000
- 2000-07-26 JP JP2000224767A patent/JP4092861B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002041511A (ja) | 2002-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Minnen et al. | Applied morphological processing of English | |
JP2654001B2 (ja) | 機械翻訳方法 | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JPS62163173A (ja) | 機械翻訳方法 | |
JPS62271064A (ja) | 機械翻訳システム | |
Sreedeepa et al. | Interlingua based Sanskrit-English machine translation | |
JPH05120324A (ja) | 言語処理方式 | |
JPS6318458A (ja) | 感情情報抽出装置 | |
JP4092861B2 (ja) | 自然言語パターン作成装置及び方法 | |
JPS6180362A (ja) | 翻訳装置 | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
JP3113257B2 (ja) | 機械翻訳装置 | |
JP2938897B2 (ja) | 文書作成処理装置 | |
JP4812811B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP3389313B2 (ja) | 機械翻訳装置 | |
JP4033088B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP2859661B2 (ja) | 機械翻訳装置 | |
JP2723886B2 (ja) | 機械翻訳装置及びその翻訳規則作成方法 | |
JP4023384B2 (ja) | 自然言語翻訳方法及び装置及び自然言語翻訳プログラム | |
JP2002032369A (ja) | 辞書作成装置 | |
Balcha et al. | Design and Development of Sentence Parser for Afan Oromo Language | |
Kovrigina | Computer morphology for investigations of a variable text | |
JPH07141382A (ja) | 外国語文書作成支援装置 | |
JPH01310469A (ja) | 翻訳装置 | |
JPH0332105B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070713 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070807 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071005 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |