JP3281746B2 - Machine translation equipment - Google Patents

Machine translation equipment

Info

Publication number
JP3281746B2
JP3281746B2 JP04164695A JP4164695A JP3281746B2 JP 3281746 B2 JP3281746 B2 JP 3281746B2 JP 04164695 A JP04164695 A JP 04164695A JP 4164695 A JP4164695 A JP 4164695A JP 3281746 B2 JP3281746 B2 JP 3281746B2
Authority
JP
Japan
Prior art keywords
priority
analysis
unit
syntax
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04164695A
Other languages
Japanese (ja)
Other versions
JPH08235186A (en
Inventor
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04164695A priority Critical patent/JP3281746B2/en
Publication of JPH08235186A publication Critical patent/JPH08235186A/en
Application granted granted Critical
Publication of JP3281746B2 publication Critical patent/JP3281746B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、第1言語で書かれた入
力文を、所望の第2言語に翻訳して出力する機械翻訳装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translator for translating an input sentence written in a first language into a desired second language and outputting the translated sentence.

【0002】[0002]

【従来の技術】従来、機械翻訳装置において、複数通り
の構文構造が得られた場合、つまり複数通りの翻訳結果
が得られる場合には、それらの間で優先順位を決定する
必要がある。この優先順位を決定する手段としては、 (1)意味解析 (2)共起関係 (3)文法規則の記述順序 などがある。
2. Description of the Related Art Conventionally, in a machine translation apparatus, when a plurality of types of syntax structures are obtained, that is, when a plurality of types of translation results are obtained, it is necessary to determine a priority among them. Means for determining this priority include (1) semantic analysis, (2) co-occurrence relation, and (3) description order of grammar rules.

【0003】(1)の意味解析の具体的な方法として
は、単語辞書に意味カテゴリー情報を書き込んでおき、
構文解析によって単語間の係り受け決定する際、係り受
けをする単語の間で意味カテゴリーが一致しないような
構文構造は採用しない、もしくは優先順位を下げるとい
うものである。
As a specific method of the semantic analysis of (1), semantic category information is written in a word dictionary,
When determining the dependency between words by syntactic analysis, a syntactic structure in which the semantic categories do not match between the words to be changed is not adopted or the priority is lowered.

【0004】(2)の共起関係の利用は、意味関係の一
種とも言えるが、ある単語について係り受けの相手先の
単語を指定して辞書に記述しておき、構文解析によって
単語間の係り受けが決定する際、係り受けの相手先の単
語が辞書記述と一致しないような構文構造は採用しな
い、または優先順位を下げるというものである。
The use of the co-occurrence relation in (2) can be said to be a kind of semantic relation. However, for a certain word, the word of the destination of the dependency is specified and described in a dictionary, and the relation between the words is analyzed by syntactic analysis. When the reception is determined, a syntax structure in which the word of the dependency destination does not match the dictionary description is not adopted or the priority is lowered.

【0005】(3)の文法規則の記述順序は、構文解析
のための規則を用いる。文法規則をメモリ上に記述する
順序を例えば、優先させたい順に記述するなどして、調
節することによって、個々の文法規則についてそれぞれ
の適用されやすさを変えることができるので、結果とし
て、特定の構文構造を作りやすくすることができるよう
になる。
The description order of the grammar rules in (3) uses rules for parsing. By adjusting the order in which grammar rules are described in memory, for example, in the order in which they are to be prioritized, it is possible to change the ease of application of each grammar rule. This will make it easier to create syntactic structures.

【0006】また、構文構造を学習することによって、
機械翻訳の正当率を向上させる技術が存在する。特開平
2−148261号公報「構文学習機能付機械翻訳装
置」において、装置が出力した解析結果をユーザが修正
し、以後の翻訳指示において、この修正履歴を用いて解
析処理を行うことによって、同一の修正を回避するもの
である。
Also, by learning the syntax structure,
Techniques exist to improve the legitimacy rate of machine translation. In Japanese Unexamined Patent Publication No. Hei 2-148261, "Machine Translation Apparatus with Syntax Learning Function", the user corrects the analysis result output by the apparatus, and in subsequent translation instructions, performs an analysis process using this correction history to obtain the same This avoids the modification.

【0007】さらに、特開平6−195377「構文優
先度学習方式の機械翻訳装置」においては、入力文の構
文構造を句構造と捉える解析処理を行い、ユーザが適切
と考える句構造全体を優先すべき構造と考え、以後の翻
訳処理において、この句構造の優先度を用いて解析結果
の優先度解釈を行っている。
Further, Japanese Patent Laid-Open Publication No. Hei 6-195377, "Syntax Priority Learning Machine Translation System" performs an analysis process in which the syntax structure of an input sentence is regarded as a phrase structure, and gives priority to the entire phrase structure that the user considers appropriate. This is considered to be the structure to be considered, and in the subsequent translation processing, the priority of the analysis result is interpreted using the priority of the phrase structure.

【0008】しかしながら、特開平2−148261号
公報の技術では、ユーザが解析処理の誤り箇所を適切に
指摘し得ることが前提条件となっており、それが不可能
な場合は機能しないという問題があった。解析処理の誤
りを訂正するという作業は、言語の文法構造に精通して
いる者でない場合は大変労力を要するものになってしま
う。
However, the technique disclosed in Japanese Patent Application Laid-Open No. 2-148261 has a precondition that the user can appropriately point out an error in the analysis processing. there were. The task of correcting an error in the parsing process requires a great deal of effort unless one is familiar with the grammatical structure of the language.

【0009】また、特開平6−195377号公報の技
術では、大局的な構文構造を捉えようとしながら局所構
造まで限定した優先度規則を用いるため、それぞれの学
習結果の適用単位は極めて限定され、汎用的でない。そ
の上、複数の構文解析結果間の優先度に差を生じる本質
的原因となっている局所構造の違いを抽出できないとい
う問題がある。さらに上記のいづれの技術においても、
学習の対象となるのは入力文全体もしくは入力文中で連
続している句に限られており、日本語のように修飾句の
出現位置が必ずしも一意に定まらない言語に対しては、
十分に機能しないものであった。
In the technique disclosed in Japanese Patent Application Laid-Open No. 6-195377, a priority rule limited to a local structure is used while trying to capture a global syntax structure. Therefore, the unit of application of each learning result is extremely limited. Not universal. In addition, there is a problem that it is not possible to extract a difference in local structure, which is an essential cause of a difference in priority between a plurality of parsing results. Furthermore, in any of the above technologies,
The target of learning is limited to the entire input sentence or phrases that are continuous in the input sentence.For languages where the appearance of modifiers is not always uniquely determined, such as Japanese,
It did not work well.

【0010】[0010]

【発明が解決しようとする課題】一般的に、翻訳処理装
置において、入力文に対して解析処理が行われると、意
味処理等にる係り受け候補絞り込みが行われ、1つな
いしは複数の構文解析結果が得られる。この構文解析結
果として得られる構文構造を句構造で捉えることは少な
くとも日本語に関しては最適とは言えない。
THE INVENTION try to challenge and solutions In general, in the translation processing unit, the analysis processing for the input sentence is carried out, semantic processing, etc. by that dependency pruning is performed in one or more of The result of parsing is obtained. It is not optimal to capture the syntax structure obtained as a result of the syntax analysis with a phrase structure, at least for Japanese.

【0011】例えば、英語文 “I bought books yesterda
y.” の構文構造を句構造で捉えた場合の解析結果例を図2で
表す。このとき、“I”“bought”“book
s”“yesterday”“.”の各形態素成分の組
み合わせで同じ意味を表現する文を生成するためには、
一意に図2の句構造を成す文を生成せざるを得ない。よ
って、この構文構造と文意とは一対一に対応していると
いえる。
[0011] For example, the English sentence "I book books yesterda"
y. 2 shows an example of an analysis result when the syntactic structure of “” is captured by a phrase structure. At this time, “I”, “bout”, “book”
s "" yesterday "". In order to generate a sentence expressing the same meaning by combining each morpheme component of "
A sentence that uniquely forms the phrase structure of FIG. 2 must be generated. Therefore, it can be said that this syntactic structure and sentence correspond one-to-one.

【0012】しかし例えば、3つの日本語文「私は昨日
本を買った」「昨日私は本を買った」「私は本を昨日買
った」の構文構造を句構造で捉えると、それぞれ図3の
(a)(b)(c)に示すように別の構文構造を持つ文
と解析されるが、これら3つの文の文意はほぼ同じであ
ることから、構文構造と文意が一対一に対応していると
は言えない。
However, for example, if the syntax structures of three Japanese sentences “I bought Japan yesterday”, “I bought a book yesterday”, and “I bought a book yesterday” are represented by phrase structures, respectively. (A), (b), and (c), the sentence is analyzed as having a different syntactic structure. However, since the sentence of these three sentences is almost the same, the syntactic structure and the sentence have a one-to-one correspondence. It cannot be said that it corresponds to.

【0013】そこで、日本語文においては、形態素成分
間の修飾/被修飾関係を修飾後の被修飾語に対する依存
関係とみて構文構造を依存構造で表現する方法がとられ
ることが多い。上記3つの文も構文構造を依存構造で捉
えると、全て図3(d)の形に集約され、構文構造と文
意が一対一に対応させることが可能となり、直感的にも
日本語の構文構造を理解しやすい形態になる。なお、図
2および図3における「名詞句」「動詞句」「主節」
「文」等の用語は、説明図の理解を助けるために便宜上
与えた呼称である。
For this reason, in Japanese sentences, a method of expressing a syntactic structure by a dependency structure is often used, in which the modification / modification relationship between morpheme components is regarded as a dependency relationship on a modified word after modification. If the above three sentences also take the syntactic structure as a dependency structure, they are all aggregated in the form of FIG. 3 (d), and the syntactic structure and sentence can correspond one-to-one. It will be in a form that makes it easy to understand the structure. In addition, "noun phrase""verbphrase""mainclause" in FIG. 2 and FIG.
Terms such as "sentences" are names given for convenience in order to facilitate understanding of the explanatory diagram.

【0014】従来の翻訳処理装置においても、複数の解
析結果が得られた場合に、それぞれの解析結果に対して
なんらかの優先度づけを行い、最も適当と思われる解析
結果を用いて翻訳文を生成したり、適当と思われる順番
がユーザに明示できる形で全ての解析結果に基づく翻訳
文を提示する機能や、各形態素成分間の係り受けを明示
的に指定することによって、所望する解析結果を得るこ
とが可能であり、この係り受けの指定内容を記憶してお
くことにより局所構文構造の学習を行うものもあった
が、構文構造の複雑な文では出力された翻訳文が入力文
に対して不適当な出力であるとユーザに理解できても、
その原因を構文解析結果から的確に指摘できないことが
多く、特にユーザが日本語に精通していない場合は係り
受けの指定はほとんど不可能であり、このような学習機
能は利用できないことがあった。
In the conventional translation processing apparatus, when a plurality of analysis results are obtained, each analysis result is given some priority, and a translated sentence is generated using the most appropriate analysis result. Function to present translations based on all analysis results in a form that allows the user to clearly indicate the order in which they are considered appropriate, and by explicitly specifying the dependency between each morpheme component to achieve the desired analysis result. In some cases, the local sentence structure is learned by storing the contents of the dependency, but in the case of a sentence with a complicated sentence structure, the output translated sentence is compared to the input sentence. User can understand that the output is inappropriate,
In many cases, the cause cannot be accurately pointed out from the results of parsing. In particular, if the user is not familiar with Japanese, it is almost impossible to specify the dependency, and such a learning function may not be available. .

【0015】また、従来の翻訳処理装置において、構文
構造の学習を行う場合には、必ずどのような単語列に対
して特定の構文構造を優先させるのかをユーザが指定し
なければならなかった上に、連続する単語列が再現しな
ければ学習が反映されないため、入力文が修飾句の挿入
位置に対する制約が少ない日本語の場合は、学習の効果
が現れにくかった。
In the conventional translation processing apparatus, when learning the syntax structure, the user must always specify which word string should be given priority to a specific syntax structure. On the other hand, the learning is not reflected unless a continuous word string is reproduced. Therefore, when the input sentence is Japanese with few restrictions on the insertion position of the modifier, the learning effect is hard to appear.

【0016】例えば、「私のテニスのラケット」を構文
解析した結果、「私の」が「テニスの」を修飾する解
(図4(a))と、「私の」が「ラケット」を修飾する
解(図4(b))が存在するものとし、後者の解析結果
を優先させるようにした場合に、「私の大切なテニスの
ラケット」のように挿入句(この場合は「大切な」)が
存在するだけで、同じ構文構造を含む文であるというこ
とが認識されていないために、学習機能を利用すること
ができなかった。
For example, as a result of parsing “my tennis racket”, a solution in which “my” modifies “tennis” (FIG. 4A) and “my” modifies “racquet” It is assumed that there is a solution (FIG. 4 (b)), and when the latter analysis result is prioritized, an insertion phrase (in this case, "important" in the form of "my important tennis racket") ), The learning function could not be used because it was not recognized that the sentence had the same syntactic structure.

【0017】また、構文解析した結果の構文構造を表示
する機能を持つ翻訳処理装置は存在したが、どのような
構文構造を優先させたことによって、その構文解析結果
全体が優先されるに至ったのかを明示的に操作者に提示
する機能は持たなかった。
Although there is a translation processing apparatus having a function of displaying the syntax structure of the result of the syntax analysis, the syntax analysis result is given priority over the entire syntax analysis result by giving priority to any syntax structure. There was no function to explicitly show the operator.

【0018】さらに、構文構造の優先度を決定する構文
解析規則の中に、ユーザにとって不適当であると考えら
れるものが存在しても、これを操作者が修正する手段は
存在していなかった。
Furthermore, even if some parsing rules that determine the priority of the syntactic structure are considered to be inappropriate for the user, there is no means for the operator to correct them. .

【0019】上記の「私のテニスのラケット」の例で
「[名詞1]の[名詞2]の[名詞3]」の形態素列を
[名詞1」と[名詞2]が両方[名詞3]を修飾するよ
うに学習したとする(図4(d))と、文「私のラケッ
トの傷」の場合にもこの学習パターンが誤って適用され
てしまう(図4(e))ため、学習パターンの適用条件
を細かく制御するには「AのBのC」のように表層的な
パターンの一致で画一的に処理することは、多様な言語
現象に対応する上で適当ではない。
In the above example of "my tennis racket", the morpheme sequence of "[noun 1] [noun 2] [noun 3]" is changed to [noun 1] and [noun 2] both [noun 3] (FIG. 4D), this learning pattern is erroneously applied to the sentence “Scratch my racket” (FIG. 4E). In order to finely control the application conditions of the pattern, it is not appropriate to perform uniform processing by matching the surface patterns such as “A, B, C” in order to cope with various language phenomena.

【0020】さらに、上記例において、「[名詞1]の
[名詞2]の[名詞3]」の形態素列に対して、「私の
テニスのラケット」が入力の場合に[名詞1]と[名詞
2]が両方[名詞3]を修飾するのが正しいと判断する
ことと、「私のラケットの傷」が入力の場合に[名詞
1]が[名詞2]を[名詞2]が[名詞3]をそれぞれ
修飾するのが正しいと判断することは互いに矛盾した判
断であるが、相互に反例として存在することを確認する
手段は与えられてないなかったので、矛盾した学習を行
う可能性があった。
Further, in the above example, when "my tennis racket" is input to the morpheme sequence of "[noun 1] [noun 2] [noun 3]", [noun 1] and [noun 1] [Noun 2] determines that it is correct to modify both [Noun 3], and when " my wound of racket" is input, [Noun 1] becomes [Noun 2] and [Noun 2] becomes [Noun It is contradictory to judge that it is correct to modify each of [3], but there is no means to confirm that they are mutually counterexamples, so there is a possibility that inconsistent learning may be performed. there were.

【0021】本発明の目的は、このような課題を解決
し、装置が出力する複数の構文解析結果のうち最適と思
われるもの、あるいはそれらの解析結果に基づく翻訳文
のうち、最適と思われるもののいずれかを操作者が選択
することによって、構文解析結果の誤り箇所を自動的に
抽出し、正しい構造の学習も自動的に行う機能を持ち、
さらに誤りを発生させた原因となったデータをユーザに
提示し、これをユーザが修正可能とする機能や、品詞や
意味などの詳細な適用条件の割り当てが可能な局所構文
構造の学習機能を持ち、学習されたデータがどのような
入力に対応して作成されたものであるかを提示できる、
構文構造学習機能を持つ翻訳処理装置を提供することで
ある。
An object of the present invention is to solve such a problem, and to optimize a plurality of parsing results output by the apparatus, or a translated sentence based on the parsing results. By selecting one of the items, the operator automatically extracts the erroneous part of the parsing result and has the function of automatically learning the correct structure,
In addition, it has a function that presents the data that caused the error to the user and allows the user to correct it, and a function to learn the local syntax structure that can assign detailed application conditions such as part of speech and meaning. , Can show what input the learned data was created for,
An object of the present invention is to provide a translation processing device having a syntax structure learning function.

【0022】[0022]

【課題を解決するための手段】本発明による翻訳処理装
置は、第1言語で記述された文を入力する入力部と、前
記入力部によって入力された入力文を形態素に分解し、
解析を行う形態素解析処理部と、文節の係り受け関係を
なす形態素成分において、入力文における相対位置、品
詞の属性条件などの優先度条件に応じて、係り受け関係
の結び付きの深さを数値化した優先度得点データを、前
記優先度条件と併せて保持する構文構造優先度記憶部
と、前記形態素解析処理部によって形態素解析された各
形態素間の構文構造を解析するとともに、複数得られた
構文構造の解析結果に対して、前記優先度条件に基づい
て構文構造の優先度得点を求め、求めた総和の大小で優
先順位を決定する構文解析処理部と、前記構文解析処理
部から出力される前記複数の解析結果を保持する構文解
析結果記憶部と、前記優先順位の順で、前記構文解析結
果記憶部に保持された解析結果を第2言語の翻訳文に変
換生成処理を行う変換生成処理部と、前記構文解析処理
部および変換生成処理部の処理結果を出力する出力部
と、前記構文解析処理部で得られた前記複数の解析結果
の中から優先順位の最も高い解析結果と、ユーザが最も
適当であると判断した解析結果を比較し、それぞれの解
析結果の構文構造において、異なる部分を局所構文構造
として抽出する解析結果差分抽出部と、前記解析結果差
分抽出部で抽出された局所構文構造に対して、該構文構
造に対する優先度条件と該優先度得点を前記出力部に出
力し、優先度条件に対する優先度得点をユーザに修正さ
せる構文構造優先度修正部とを備える。
According to the present invention, there is provided a translation processing apparatus comprising: an input unit for inputting a sentence described in a first language;
The input sentence input by the input unit is decomposed into morphemes,
The morphological analysis processing unit that performs the analysis and the dependency
In the morphological component to be formed, the relative position in the input sentence,
Dependency relationships according to priority conditions such as attribute conditions of the lyrics
Priority score data that quantifies the connection depth of
Syntax structure priority storage unit that is stored together with the writing priority condition
And each morphologically analyzed by the morphological analysis processing unit
Analyzed the syntactic structure between morphemes and obtained multiple
Based on the priority condition,
To obtain the priority score of the syntax structure.
A parsing processing unit for determining a priority order, and the parsing processing
Parsing that holds the plurality of analysis results output from the unit
The parsing result storage unit and the parsing result in the order of the priority.
Transforms the analysis result held in the result storage unit into a translated sentence of the second language.
A conversion generation processing unit that performs conversion generation processing; and the syntax analysis processing.
Output unit that outputs the processing results of the conversion unit and the conversion generation processing unit
And the plurality of analysis results obtained by the syntax analysis processing unit
Analysis results with the highest priority from among the
Compare the analysis results judged to be appropriate, and
In the syntax structure of the analysis result, different parts are
Analysis result difference extraction unit to extract as the analysis result difference
The local syntax structure extracted by the
The priority condition for the structure and the priority score are output to the output unit.
User to correct the priority score for the priority condition.
And a syntactical structure priority correcting unit .

【0023】さらに、前記解析結果差分抽出部で抽出さ
れた局所構文構造に対して、該構文構造に対する優先度
得点、および局所構文構造を構成する単語についての品
詞、意味などの学習データを前記出力部より出力し、ユ
ーザに修正、変更させる学習データ作成支援部と、前記
学習データを保持する学習データ記憶部を更に備え、
記構文解析処理部は、前記解析結果に対する優先度得点
を求めるとともに、前記学習データ記憶部を参照し、該
解析結果の構文構造に対する学習データがあれば、該学
習データに与えられている得点を前記優先度得点に加算
することを特徴とする。また、本発明による翻訳処理装
置は、第1言語で記述された文を入力する入力部と、前
記入力部によって入力された入力文を形態素に分解し、
解析を行う形態素解析処理部と、前記形態素解析処理部
によって形態素解析された各形態素間の修飾/被修飾関
係を修飾語の被修飾語に対する依存関係を表す依存構造
木で構成される構文構造を解析するとともに、複数得ら
れた構文構造の解析結果に対して、予め定められた優先
度条件に基づいて構文構造の優先度得点を求め、求めた
総和の大小で優先順位を決定する構文解析処理部と、前
記構文解析処理部から出力される前記複数の解析結果を
保持する構文解析結果記憶部と、前記優先順位の順で、
前記構文解析結果記憶部に保持された解析結果を第2言
語の翻訳文に変換生成処理を行う変換生成処理部と、前
記構文解析処理部および変換生成処理部の処理結果を出
力する出力部とを備えた機械翻訳装置において、前記構
文解析処理部で得られた前記複数の解析結果の中から優
先順位の最も高い解析結果と、ユーザが最も適当である
と判断した解析結果とにおいて、それぞれの解析結果の
構文構造を構成する依存構造木における枝分かれ部分を
解き、各枝単位でそれぞれの解析結果を比較し、一致す
る枝を削除した残りの部分を依存構造木として再構築し
た差分構文構造を抽出する解析結果差分抽出部と、前記
解析結果差分抽出部で抽出された差分構文構造に対し
て、ユーザが選択した解析結果を以後優先させるための
構文構造学習データを生成する学習データ生成部と、前
記学習データを保持する学習データ記憶部とを備え、前
記構文解析処理部は、前記学習データに基づいて、構文
構造の優先度得点を変更することを特徴とする。
Further, the analysis result difference extraction unit extracts
Priority for a given local syntax structure
Scores and items about the words that make up the local syntactic structure
Learning data such as words and meanings are output from the output unit, and
A learning data creation support unit that allows the user to modify and change
Further comprising a learning data storage unit for holding the training data, prior to
The notation parsing processing unit calculates a priority score for the analysis result.
And referring to the learning data storage unit,
If there is learning data for the syntax structure of the analysis result,
Add the score given to the training data to the priority score
It shall be the feature of the that. Further, the translation processing device according to the present invention
The input unit for inputting a sentence described in the first language;
The input sentence input by the input unit is decomposed into morphemes,
A morphological analysis processing unit for performing analysis, and the morphological analysis processing unit
/ Modification relation between each morpheme analyzed by morpheme
Dependency structure representing the dependency of a modifier on a modifier
Analyze the syntax structure composed of trees and obtain multiple
A predetermined priority is given to the analysis result of the syntactic structure
Priority score of the syntax structure based on the degree condition
A parsing processing unit that determines the priority according to the magnitude of the sum;
The plurality of analysis results output from the notation syntax analysis processing unit.
The syntax analysis result storage unit to be held, and in the order of the priority,
The analysis result held in the syntax analysis result storage unit is described in a second language.
A conversion generation processing unit that performs conversion generation processing on a translation of a word;
Output the processing results of the
A machine translation device comprising:
Excellent among the plurality of analysis results obtained by the sentence analysis processing unit
The analysis result with the highest priority and the user is most appropriate
Of the analysis results
Branches in the dependency structure tree that constructs the syntax structure
Solve, compare each analysis result for each branch unit,
And reconstruct the remaining part as a dependency tree
An analysis result difference extraction unit for extracting a difference syntax structure,
For the difference syntax structure extracted by the analysis result difference extraction unit
The analysis result selected by the user
A learning data generator for generating syntax structure learning data;
A learning data storage unit for holding the learning data.
The notation parsing processing unit, based on the learning data,
It is characterized in that the priority score of the structure is changed.

【0024】これにより、出力された目標言語文の中か
ら該装置のユーザが最も適切と思われる文を採択するだ
けで、その構文解析結果から修正を要する局所構文構造
を抽出することが可能であり、優先させるべき一方の構
造を以後必ず優先させるための学習データを自動的に作
成することができ、該装置が最も適当と見なした構文解
析結果を優先させた根拠となるデータをユーザに明示で
きる上に、構文構造の優先度を決定するデータを該装置
のユーザが直接変更可能とする機能を備え、ユーザによ
る品詞や意味などの適用条件の自在な割り当てが可能な
局所構文構造の学習データ作成支援機能を備え、学習デ
ータを用いて解析された結果を表示する際に、以前行っ
た学習の根拠を提示するために、その学習データ作成時
にその構文構造を構成していた単語を併せて表示する機
能を備えたものである。
Thus, by simply selecting the most appropriate sentence from the output target language sentence by the user of the apparatus, it is possible to extract the local syntax structure that needs to be corrected from the syntax analysis result. Yes, it is possible to automatically create learning data for always prioritizing one of the structures to be prioritized, and provide the user with data that is the basis for prioritizing the syntax analysis result deemed most appropriate by the device. A local syntax structure learning function that allows the user of the device to directly change data for determining the priority of the syntax structure in addition to being able to specify, and allows the user to freely assign application conditions such as part of speech and meaning. It has a data creation support function, and when displaying the results analyzed using the learning data, to show the basis of the previous learning, the syntax structure is created when the learning data is created. Those having a function to be displayed in conjunction with a word that had forms.

【0025】[0025]

【作用】本発明の構成によれば、翻訳処理装置が複数の
解析結果をもとにそれぞれに対応する翻訳文を出力した
場合に、それらの翻訳文の中に、システムが最優先と判
断した翻訳文より適当と思われる翻訳文が存在し、それ
をユーザが選択することにより、2つの解析結果から自
動的に局所構文構造を抽出し、ユーザに提示する。
に、抽出した局所構文構造のうち、優先すべき解析結果
の学習データを自動的に生成する。さらに、システムが
構文構造の優先度を決定する根拠としている優先度条件
と優先度得点データをユーザに提示する。 また、優先順
位を逆転させるために(ユーザの選択した構文構造を優
先させるために)、ユーザは上記データを変更すること
により優先度の調整が可能である。さらに優先順位を入
れ替えるための学習データを、品詞や意味などの適用条
件を任意に登録することが可能である。
According to the present onset Ming configuration, when the translation processing unit has output a translation corresponding to each based on a plurality of analysis results, determination in their translation, the system the highest priority There is a translation that is considered appropriate from the translated sentences, and when the user selects it, the local syntax structure is automatically extracted from the two analysis results and presented to the user. Change
In the extracted local syntax structure, the analysis result to be prioritized
Automatically generate learning data for. In addition, the system
Priority conditions that are the basis for determining the priority of the syntactic structure
And the priority score data are presented to the user. Also, priority order
In order to reverse the position (use the user-selected syntax
User to change the above data
Can adjust the priority. Enter more priority
The learning data for replacement is based on applicable terms such as part of speech and meaning.
It is possible to arbitrarily register the matter.

【0026】[0026]

【0027】[0027]

【0028】[0028]

【実施例】本発明の一実施例として、入力言語として日
本語、目標言語として英語として、日本語から英語への
日英翻訳処理について、図面を用いて詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS As an embodiment of the present invention, a Japanese-to-English translation process from Japanese to English with Japanese as the input language and English as the target language will be described in detail with reference to the drawings.

【0029】図1は本発明による機械翻訳装置の構成の
一例である。1は入力部、2は形態素解析処理部、3は
構文解析処理部、4は構文解析結果記憶部、5は変換生
成処理部、6は解析結果差分抽出部、7は出力表示部、
8は学習データ生成部、9は学習データ記憶部、10は
構文構造優先度記憶部、11は構文構造優先度修正部、
12は学習データ作成支援部である。
FIG. 1 shows an example of the configuration of a machine translation apparatus according to the present invention. 1 is an input unit, 2 is a morphological analysis processing unit, 3 is a syntax analysis processing unit, 4 is a syntax analysis result storage unit, 5 is a conversion generation processing unit, 6 is an analysis result difference extraction unit, 7 is an output display unit,
8 is a learning data generation unit, 9 is a learning data storage unit, 10 is a syntax structure priority storage unit, 11 is a syntax structure priority correction unit,
Reference numeral 12 denotes a learning data creation support unit.

【0030】図5のフローチャートを参照しながら、本
発明における機械翻訳装置の動作を具体的に説明する。
The operation of the machine translator according to the present invention will be specifically described with reference to the flowchart of FIG.

【0031】まず、入力部1において、日本語文データ
1文を取り出し、形態素解析処理部2へ送る(S50
1)。次に、形態素解析処理部2では、入力された
ら抽出可能な単語を全て抽出し、これらの単語の組み合
わせとし構成される文節を可能な限り抽出し、この文
節列で入力文全体を構成できるような文節の組み合わせ
を得る(S502)。次に、形態素解析結果である文節
の集合に対して、構文解析処理部3で構文解析処理を行
う(S503)。構文解析処理については、図6のフロ
ーチャートを参照して説明する。
First, in the input unit 1, one sentence of Japanese sentence data is extracted and sent to the morphological analysis processing unit 2 (S50).
1). Then, the morphological analysis unit 2 extracts all the sentences or <br/> et extractable word inputted, extracting as much as possible constructed clauses as the combination of these words, this clause column To obtain a combination of phrases that can constitute the entire input sentence (S502). Next, a syntax analysis process is performed by the syntax analysis processing unit 3 on the set of clauses that are the result of the morphological analysis (S503). The syntax analysis processing will be described with reference to the flowchart in FIG.

【0032】入力文中で前方に存在した構文構造がそれ
より後方に存在した構文構造に係り得るかどうかの判断
を、形態素解析結果として得られた全ての文節の集合を
含む構文解析の中間結果として得られた全ての構文構造
に対して行っているかどうかを確認し(S601)、そ
うでなければ以下の処理を行う。
A judgment as to whether or not the syntax structure existing before in the input sentence can be related to the syntax structure existing after it is made as an intermediate result of the syntax analysis including a set of all clauses obtained as a result of the morphological analysis. It is confirmed whether the processing has been performed for all the obtained syntax structures (S601), and if not, the following processing is performed.

【0033】まず、任意の2つの構文構造(形態素解析
結果の文節も含む)について、それぞれの構造を構成す
る依存構造木の最上位に位置する文節を成す語の品詞や
意味などによる係り受け規則に基づいて判断し、係り受
け可能と判断された構文構造対に対しては、構文構造優
先度記憶部10を参照の上、該当する優先度条件に与え
られる優先度得点をそれぞれの構文構造が持つ優先度得
点(形態素解析結果の文節は得点を持たないとしても良
いし、優先度を持たせるために初期得点を与えておくよ
うにすることも可能)に加算し、2つの構文構造対を包
含する新たな構文構造木を生成する(S602)。
First, with respect to any two syntactic structures (including phrases resulting from morphological analysis), the dependency rules based on the parts of speech and meanings of the words that form the clause located at the top of the dependency structure tree that constitutes each structure For the syntax structure pair determined to be dependable based on the syntax structure reference, the syntax structure priority storage unit 10 refers to the syntax structure priority storage unit 10 and assigns the priority score given to the corresponding priority condition to each syntax structure. To the priority score (the phrase in the morphological analysis result does not have to have a score, or an initial score can be given in order to have a priority). A new syntax structure tree to be included is generated (S602).

【0034】続いて、学習データ記憶部9を参照し、生
成された構文構造が学習されている構文構造であるかど
うかを調べ(S603)、学習データがあればその学習
データに与えられている得点をS602で付与した優先
度得点に加算する(S604)。
Subsequently, it is checked whether the generated syntax structure is a learned syntax structure by referring to the learning data storage unit 9 (S603). If there is any learning data, the learning data is given to the learning data. The score is added to the priority score given in S602 (S604).

【0035】例文「私が新しい本を彼に貸した」が入力
された場合の構文解析処理の過程を説明する。この文を
形態素解析処理した結果、抽出される文節列の例は図8
(a)のようになる。ここで、抽出される文節列、ある
いは「代名詞」「形容詞」等の品詞名や「終止形」等の
活用形名については、根拠とする文法体系等の際により
一義的に定まるものではないが、その不確定要素は本発
明の作用に影響を与えるものではない。
A description will be given of the parsing process when the example sentence "I lent a new book to him" is input. FIG. 8 shows an example of a phrase string extracted as a result of morphological analysis of this sentence.
(A). Here, the extracted bunsetsu sequence, the part-of-speech name such as "pronoun" or "adjective" or the inflected form name such as "termination form" are not uniquely determined by the grammar system on which they are based. The uncertainties do not affect the operation of the present invention.

【0036】形態素解析処理で抽出されたこれらの文節
に対して、構文解析処理が行われ、構文構造に優先度得
点が与えられる過程を図8(c)(d)に示す。例え
ば、文節[私が]が文節[新しい]を修飾可能であると
解析されたら、構文構造優先度記憶部8からこの係り受
け構造に適合する優先度条件を探す。構文構造優先度記
憶部8に記述される優先度条件と優先度得点データの例
を図8(b)に示す。この例の場合は文節距離の近い係
り受けを優先する優先度条件(図8(b)条件1)が該
当し、[“文節距離”×(−1)]に相当する(−1)
点が構文構造[[私が]→[新しい]]に与えられる優
先度得点として加算され、元の[私が]と[新しい]の
得点の和は0点であるので(各単語そのものに得点はな
い)、結局優先度得点は(−1)点となる(図8
(c))。
FIGS. 8C and 8D show a process in which syntactic analysis is performed on these clauses extracted in the morphological analysis and a priority score is given to the syntactic structure. For example, if the phrase [I] is analyzed to be able to modify the phrase [new], the syntactic structure priority storage unit 8 is searched for a priority condition matching this dependency structure. FIG. 8B shows an example of priority conditions and priority score data described in the syntax structure priority storage unit 8. In the case of this example, the priority condition (condition 1 in FIG. 8 (b)) that gives priority to the dependency having a short phrase distance corresponds, and corresponds to [“phrase distance” × (−1)] (−1).
The points are added as the priority score given to the syntax structure [[I] → [New]], and the sum of the original [I] and [New] scores is 0. No), and the priority score is (-1) after all (see FIG. 8).
(C)).

【0037】ここで、[[私が]→[新しい]]は、
[私が]が[新しい]を修飾する依存構造[[彼に]→
[貸した]]を修飾する場合にも図8(d)に示すよう
に、元の構文構造の優先度得点の和が0点で、適用され
る優先度条件(図8(b)条件1、4)による得点の加
算が計0点であるので、構文構造[[[新しい]→[本
を]]/[彼に]→[貸した]]に対する優先度得点は
合計0点となる。ここで、[[[新しい]→[本を]]
/[彼に]→[貸した]]は[[新しい]→[本を]]
と[彼に]が[貸した]を修飾するという依存関係を表
すものとする。
Here, [[I] → [New]] is
Dependency structure that [I] modifies [New] [[Him] →
8D, the sum of the priority scores of the original syntax structure is 0, and the priority condition applied (condition 1 in FIG. 8B). Since the addition of the scores according to (4) is 0 in total, the priority score for the syntax structure [[[new] → [book]] / [to him] → [lended]] is 0 in total. Here, [[[New] → [Book]]
/ [To him] → [lent]] is [[new] → [book]]
And [to him] qualify [lent].

【0038】構文解析結果記憶部4に保管されている構
文解析結果のうち、優先度得点最高の解を変換生成処理
部5に送り、変換生成処理を行い(S504)、変換生
成結果として翻訳文を出力表示部7に出力する(S50
5)。
Among the syntax analysis results stored in the syntax analysis result storage unit 4, the solution with the highest priority score is sent to the conversion generation processing unit 5, and a conversion generation process is performed (S504). Is output to the output display section 7 (S50).
5).

【0039】ここで、該装置の操作者が次候補の解析結
果による翻訳文(以後、「別解釈」とする)出力を命令
しなければ処理は終了する(S506)。同様に、これ
以上別解釈が存在しない場合も処理は終了する(S50
7)。
Here, if the operator of the apparatus does not instruct the output of a translated sentence (hereinafter, referred to as "another interpretation") based on the analysis result of the next candidate, the process ends (S506). Similarly, when there is no further interpretation, the process ends (S50).
7).

【0040】操作者が別解釈出力を指示し、かつ別解釈
が存在する場合は、構文解析結果記憶部4より優先度得
点が次に高い解を変換生成処理部5に送り、変換生成処
理を行い(S508)、翻訳文を最優先解から生成した
翻訳文を併記して出力表示部7に出力する(S50
9)。操作者がさらに別解釈の出力を指示した場合は、
S507以降の処理を繰り返す(S510)。また、操
作者が別解釈の翻訳文が正しいと判断した場合に、構文
解析の学習を行わないならば処理は終了する(S51
1)。
When the operator instructs another interpretation output and another interpretation exists, a solution having the next highest priority score from the syntax analysis result storage unit 4 is sent to the conversion generation processing unit 5, and the conversion generation processing is performed. Then, the translated sentence generated from the highest priority solution is written together with the translated sentence and output to the output display unit 7 (S50).
9). If the operator instructs further interpretation output,
The processing after S507 is repeated (S510). If the operator determines that the translated sentence of the different interpretation is correct and does not perform the learning of the syntax analysis, the process ends (S51).
1).

【0041】これに対し、操作者が学習を行う場合は、
最優先解の構文解析結果と、操作者が正しいと判断した
翻訳文を生成した構文解析結果を解析結果差分抽出部6
に送り、解析結果差分抽出部6では双方の構文解析結果
を比較した上で差分の局所構文構造(以後、「差分構造
対」とする)を抽出し、出力表示部7に出力する(S5
12)。
On the other hand, when the operator learns,
A parsing result difference extracting unit 6 parses the parsing result of the top priority solution and the parsing result of generating a translated sentence determined by the operator to be correct.
The analysis result difference extraction unit 6 compares the two syntax analysis results, extracts a local syntax structure of the difference (hereinafter, referred to as a “difference structure pair”), and outputs it to the output display unit 7 (S5).
12).

【0042】この差分構造対は複数の場合もあるため、
学習処理の済んでいない差分構造対がある間は学習処理
のステップを繰り返す(S514)が、なければ処理を
終了する(S513)。学習処理の詳細は、第7図のフ
ローを参照しながら具体的に説明する。
Since there may be a plurality of the differential structure pairs,
While there is a difference structure pair for which the learning process has not been completed, the steps of the learning process are repeated (S514), but if not, the process ends (S513). Details of the learning process will be specifically described with reference to the flow of FIG.

【0043】差分構造対から自動的に学習データを作成
する場合は、差分構造対のうち優先すべき方の構文構造
を学習データ自動生成部8に送り(S701)、学習デ
ータ自動生成部8では、送られた構文構造が差分構造対
の他方の構文構造より優先されることを示すのに必要な
データを付与した学習データを生成し、学習データ記憶
部9に保存し、学習処理は終了する(S702)。この
とき、局所構文構造に与える優先度得点の総和が大きい
構文解析結果を優先させる構文解析方式を採る場合であ
れば、差分構造対の他方の構文構造が持っていた得点を
上回るだけの加算得点データが学習データの優先を示す
のに必要なデータに相当する。
When automatically creating learning data from the difference structure pair, the syntax structure of the difference structure pair which should be given priority is sent to the learning data automatic generation unit 8 (S701). , Generates learning data to which data necessary to indicate that the sent syntax structure has priority over the other syntax structure of the difference structure pair is stored in the learning data storage unit 9, and the learning process ends. (S702). At this time, if the parsing method that gives priority to the parsing result in which the sum of the priority scores given to the local syntactic structure is large is used, the additional score that exceeds the score of the other syntactic structure of the differential structure pair The data corresponds to data necessary to indicate the priority of the learning data.

【0044】S701で操作者が自動学習を選択しない
場合は、学習処理の対象となる差分構造対とそれぞれの
構文構造に与えられた優先度得点をその得点を与えてい
る優先度条件とともに出力表示部7に表示する(S70
3)。このとき、一方の構文構造が既に学習されたもの
である場合は、学習された時の語と学習により追加され
た優先度得点も表示する。ここで、該差分構造対の優先
度を逆転させるために、構文構造優先度記憶部10に保
持している優先度条件の修正、或いは削除、もしくはそ
の優先度条件に対する優先度得点を変更する場合には以
下の処理を行い、そうでない場合はS706へ進む(S
704)。構文構造優先度修正部11は、操作者の入力
する修正データに従い、構文構造優先度記憶部10に保
存されている優先度条件もしくは優先度得点データを書
き換え、学習処理は終了する(S705)。
If the operator does not select the automatic learning in step S701, the difference structure pair to be subjected to the learning process and the priority score given to each syntax structure are output and displayed together with the priority condition giving the score. Displayed on the part 7 (S70
3). At this time, if one of the syntax structures has already been learned, the words at the time of learning and the priority score added by learning are also displayed. Here, in order to reverse the priority of the difference structure pair, the priority condition held in the syntax structure priority storage unit 10 is corrected or deleted, or the priority score for the priority condition is changed. Performs the following processing, otherwise proceeds to S706 (S706)
704). The syntax structure priority correction unit 11 rewrites the priority condition or the priority score data stored in the syntax structure priority storage unit 10 according to the correction data input by the operator, and the learning process ends (S705).

【0045】S704で優先度条件や優先度得点の修正
を行わず、以下の学習処理も行わない場合は処理を終了
する(S706)。学習の適用範囲を該差分構造対の場
合に限定はするが、操作者が優先させたい方の局所構文
構造を形成している該入力単語そのものの組合せに限ら
ず、その単語が属する品詞や意味区分にまで適用範囲を
拡大する学習処理を行うため、差分構造対のうち優先す
べき方の構文構造を学習データ作成支援部12に送り、
学習データ作成支援部12は、学習データ作成のための
初期データとして構文構造そのものと構文構造を構成す
る各文節の品詞や意味区分等の属性情報を抽出し、出力
表示部7に表示する(S707)。操作者による各属性
に対する条件付与によって学習の適用範囲の具体的な指
示が行われ、さらに学習データに対する加算得点が与え
られたら、これに従って学習データ作成支援部12は各
文節に対する学習データの適用条件と該入力単語を併記
し、これに優先度得点の加算得点を付加した学習データ
を作成し、学習データ記憶部9に保存した後、学習処理
を終了する(S708)。
If the priority condition and the priority score are not corrected in S704 and the following learning process is not performed, the process ends (S706). The learning application range is limited to the difference structure pair, but not limited to the combination of the input words forming the local syntax structure that the operator wants to prioritize, but also the part of speech or meaning to which the word belongs. In order to perform the learning process of expanding the application range to the section, the syntactic structure of the one of the difference structure pairs to be prioritized is sent to the learning data creation support unit 12,
The learning data creation support unit 12 extracts the syntax structure itself and attribute information such as the part of speech and semantic classification of each clause constituting the syntax structure as initial data for creating the learning data, and displays them on the output display unit 7 (S707). ). When the operator gives a condition to each attribute to give a specific instruction on the applicable range of learning, and further gives an additional score to the learning data, the learning data creation support unit 12 accordingly applies the learning data application condition to each clause. Then, learning data is created by adding the score of the priority score to the input word, and the learning data is stored in the learning data storage unit 9, and the learning process is terminated (S708).

【0046】例えば、図9(a)の解析結果に基づく翻
訳結果の例を図9(b)に示す。このとき該装置の操作
者が解析結果2に対する翻訳文の方を適当と判断して構
文解析結果を学習させる過程を説明する。まず、該装置
が最優先とした解析結果の構文構造と操作者が選択した
方との差分構造対を得るために、依存構造木の枝分かれ
部分を解き、一致する枝を削除した残りを依存構造木に
再構築する。これにより、操作者が構文構造の誤り箇所
を指摘できない場合でも図9(c)に示すように差分構
造対が抽出される。
For example, FIG. 9B shows an example of a translation result based on the analysis result of FIG. 9A. At this time, a process in which the operator of the apparatus judges that the translated sentence for the analysis result 2 is more appropriate and learns the syntax analysis result will be described. First, in order to obtain a difference structure pair between the syntax structure of the analysis result which has been given the highest priority by the apparatus and the one selected by the operator, the branching part of the dependency structure tree is solved, and the remainder obtained by removing the matching branch is used as the dependency structure. Rebuild on a tree. Thus, even when the operator cannot point out an error in the syntax structure, a difference structure pair is extracted as shown in FIG. 9C.

【0047】構文構造の学習を自動的に行う場合は、学
習の適用条件を該入力単語に限定した学習データが自動
生成される、このとき、学習データ自動生成部8は図1
1の構文構造1と2の間の優先度得点の差(1点)を逆
転させるのに必要な得点(2点)を与えた学習データを
図12のように生成する。図12に示した学習データの
適用範囲は、「私が」「新しい」「本を」「貸した」の
4文節から成る構文構造に限定されるが、「私が昨日彼
に新しい本を2冊貸した」のように他の修飾語が存在し
ても学習データは適用される。
When learning the syntax structure automatically, learning data in which the learning application conditions are limited to the input word is automatically generated. At this time, the learning data automatic generation unit 8 performs the processing shown in FIG.
Learning data to which scores (two points) necessary for reversing the difference (one point) of the priority scores between the first and second syntax structures 1 and 2 are generated as shown in FIG. The application range of the learning data shown in FIG. 12 is limited to a syntax structure consisting of four clauses “I”, “new”, “book” and “lent”, but “I gave him two new books yesterday. The learning data is applied even if there are other modifiers such as "I lent a book."

【0048】また、操作者が定義されている優先度得点
そのものを修正する場合は、差分構造対とそれぞれの構
文構造に対する優先度得点をその得点を与える優先度条
件とともに操作者に提示し、操作者はこの優先度条件の
修正や削除、或はその条件に応じた優先度得点を変更す
ることができる。図10においては、これらの表示例
と、操作者が名詞又は代名詞が動詞を修飾しているとき
という条件に対する優先度得点をそれぞれ2点から10
点に引き上げることによって構文構造全体の優先度得点
が逆転する様子を示している。このように優先度得点を
変更させることは、特定の構文構造に限らず極めて広範
囲の入力に対して作用を及ぼす。
In the case where the operator corrects the defined priority score itself, the difference score is presented to the operator together with the priority score for the difference structure pair and each syntax structure together with the priority condition for giving the score. The user can modify or delete the priority condition, or change the priority score according to the condition. In FIG. 10, these display examples and the priority score for the condition that the operator modifies the verb with a noun or a pronoun are respectively 2 to 10 points.
This shows that the priority score of the entire syntax structure is reversed by raising the score to a point. Changing the priority score in this way affects not only a specific syntax structure but also an extremely wide range of input.

【0049】さらに、このような優先度得点の変更を行
わずに適用範囲の明確な構文構造の学習を行う場合は、
学習対象となる構文構造とそこに属する各文節を構成す
る語の属性情報を格納した学習用初期データを作成し、
図11に示すように操作者に提示する。操作者は、提示
された各属性情報を元に学習適用条件の設定を行う。
Further, when learning a syntax structure having a clear scope of application without changing the priority score,
Create initial data for learning that stores the syntax structure to be learned and the attribute information of the words that make up each clause belonging to it.
It is presented to the operator as shown in FIG. The operator sets learning application conditions based on the presented attribute information.

【0050】操作者が学習データを作成した例として図
13を挙げる。図中の記号*(アスタリスク)はその項
目に任意の要素を許すことを表しており、例えば[中心
語=*],[付属語=を],[品詞=名詞],[意味=
*]の条件は、「付属語『を』を伴う任意の名詞」であ
ることを表している。図1に示す学習データは入力文
「私が新しい本を彼に貸した」に対して、以後操作者の
指定した構文構造を必ず優先させる効果を持つが、操作
者が適用範囲を拡大した図13の例の学習データの方
が、該装置が自動生成した例の図12の学習データに比
較して、より多様な入力文に対応できる。例えば、文
「彼が難しい英語の本をすらすら読むのを見ていると私
は羨ましく思う」を解析処理した結果のいくつかの依存
構造木の中で、図14に示す構造は図13の学習データ
の構造を含んでいるため学習処理による構文構造の指定
が反映され、学習効果が得られる。
FIG. 13 shows an example in which the operator creates learning data. The symbol * (asterisk) in the figure indicates that any element is permitted in the item, for example, [central word = *], [attached word =], [part of speech = noun], [meaning =
*] Indicates that the condition is "any noun with the attached word""." Learning data shown in FIG. 1. 2 with respect to the input sentence "I have lent a new book to him", but has the effect of always giving priority to the specified syntax structure of the subsequent operator, the operator has expanded the scope The learning data of the example in FIG. 13 can cope with more various input sentences than the learning data in FIG. 12 of the example automatically generated by the device. For example, in the dependency tree of the result of parsing the sentence "I envy watching him read a difficult English book," the structure shown in FIG. Since the data structure is included, the designation of the syntax structure by the learning process is reflected, and a learning effect is obtained.

【0051】次に、操作者が過去の学習と矛盾した学習
を行うことを防ぐ例を説明する。文「彼女が欲しい服を
あげた」を解析処理する際に、図13の学習データが適
用されたものとすると、[彼女が]が[あげた]を修飾
する解釈が優先されるが、ここで操作者が[彼女が]が
[欲しい]を修飾する解釈を優先させるべきであると考
えて学習データを取り消してしまうことのないように、
学習を行った際に実際に登録されている学習データの適
用が適切であった場合の単語を図15のように提示す
る。この画面でユーザは今回の解釈を優先させるべく、
さらに要素の限定をして登録を行う。図16の例では、
中心語を[欲しい]に限定し、また、動詞を連用形であ
り、授行為の意味をもち付属語「た」を持つものに限定
している。これにより、過去の学習効果を失うことなく
[彼女が]が[欲しい]を修飾するように学習データを
追加することができる。
Next, an example of preventing the operator from performing learning inconsistent with past learning will be described. If it is assumed that the learning data of FIG. 13 has been applied when analyzing the sentence "She gave her clothes", the interpretation that [She] modifies [She gave] has priority. In order to prevent the operator from canceling the training data by thinking that [She] should give priority to the interpretation that modifies [I want],
A word in the case where the application of the learning data actually registered at the time of learning is appropriate is presented as shown in FIG. On this screen, the user gives priority to this interpretation,
Further, the registration is performed by limiting the elements. In the example of FIG.
The central word is limited to [want], and the verb is limited to those that have the conjunctive word "ta", which has a semantic meaning. Thus, learning data can be added so that [she] modifies [want] without losing the learning effect of the past.

【0052】[0052]

【発明の効果】以上詳述したように、この発明によれ
ば、1つの入力文から複数提示された翻訳文の内、装置
が最優先と見なした解析結果から変換生成された翻訳文
が適切でなかった場合に、その解析結果と操作者が最も
適当であると判断した目標言語文を生成した解析結果を
比較し、それぞれの解析結果から構造の異なる部分を局
所構文構造として抽出する解析結果差分抽出部を備える
ことにより構文解析処理結果から適当でないと思われる
箇所を自動的に抽出できることから、操作者が翻訳文の
適不適は判断できるが構文解析結果の不適当な箇所を指
摘するのが困難であるという場合にも、付与される優先
度が適当でない局所構文構造を提示することができる。
As described above in detail, according to the present invention, among the plurality of translation sentences presented from one input sentence, the translation sentence converted and generated from the analysis result regarded as the highest priority by the device is obtained. If it is not appropriate, the analysis result is compared with the analysis result that generated the target language sentence determined by the operator to be the most appropriate, and the part with a different structure is extracted from each analysis result as a local syntax structure By providing a result difference extraction unit, it is possible to automatically extract places that are considered inappropriate from the results of the syntax analysis processing, so that the operator can judge the suitability of the translated sentence, but point out the inappropriate places in the syntax analysis results. Is difficult, it is possible to present a local syntax structure to which the assigned priority is not appropriate.

【0053】さらに、抽出された構文解析処理の誤りが
繰り返されることを防ぐ手段として、操作者が適当と考
える翻訳結果を以後優先させるための構文構造学習デー
タを自動生成する学習データ自動生成部とその学習デー
タを保持する学習データ記憶部を備えることにより、操
作者が学習させたい構造に関する複雑な登録作業を行わ
なくても、優先させたい構文構造の学習データを該装置
が自動的に作成して、同一単語による同一構文構造の再
現に対しては、再び修正を行わなくても操作者の望む翻
訳結果が最優先に出力されるようになる。
Further, as means for preventing an error in the extracted syntax analysis processing from being repeated, a learning data automatic generation unit for automatically generating syntax structure learning data for giving priority to a translation result considered appropriate by the operator thereafter. By providing a learning data storage unit for holding the learning data, the apparatus automatically creates learning data of a syntax structure to be prioritized without performing complicated registration work on the structure to be learned by the operator. Thus, for the reproduction of the same syntactic structure by the same word, the translation result desired by the operator is output with the highest priority without performing the correction again.

【0054】また、各々の局所構文構造に対して与える
優先度の大きさを決定するための優先度得点データを、
その得点を付与する優先度条件と併せて保持する構文構
造優先度記憶部とこれらを提示する出力表示部を備える
ことにより、該装置が構文構造に与えた優先度の根拠を
具体的に操作者に示すことができる。
Further, priority score data for determining the magnitude of the priority given to each local syntax structure is expressed as follows:
By providing a syntax structure priority storage unit that holds the priority condition along with the score and an output display unit that presents these, the operator can specify the basis of the priority given to the syntax structure by the operator. Can be shown.

【0055】さらに、構文構造優先度記憶部に保持され
る優先度データを操作者の指示に従って修正登録する構
文構造優先度修正部を備えることにより、経験的知識と
して与えられる構文構造の持つ一般的優先度を変更する
ことが可能となり、操作者は該装置の行う構文解析処理
に対して、特定の語により構成される構文構造に限定し
ない汎用的な調整を及ぼすことが可能になる。
Further, by providing a syntax structure priority correction unit for correcting and registering the priority data held in the syntax structure priority storage unit in accordance with the instruction of the operator, a general structure having a syntax structure given as empirical knowledge is provided. The priority can be changed, and the operator can make a general-purpose adjustment to the syntax analysis performed by the device, not limited to the syntax structure composed of specific words.

【0056】また、優先度を変更したい局所構文構造を
構成する単語について、品詞や意味等の条件を付与した
学習データの作成をするために必要なデータを操作者に
提示し、操作者の意図する適用条件を具備した学習デー
タを作成する学習データ作成支援部とその学習データを
保持する学習データ記憶部を備えることにより、学習デ
ータ作成支援部から提示される入力語の属性情報を基
に、優先させたい構文構造の構成要素を操作者が詳細に
指示できる場合に、その細かい意図を十分に反映でき、
適用範囲の広い学習データを作成することが可能とな
る。
For words constituting a local syntax structure whose priority is to be changed, data necessary for creating learning data to which conditions such as parts of speech and meaning are given to an operator, and the intention of the operator is provided. By providing a learning data creation support unit that creates learning data having application conditions to be applied and a learning data storage unit that holds the learning data, based on attribute information of input words presented from the learning data creation support unit, When the operator can indicate in detail the components of the syntax structure to be prioritized, the detailed intention can be fully reflected,
It is possible to create learning data having a wide application range.

【0057】さらに、上記学習データ記憶部に、学習時
に構文構造の構成要素であった単語を併記しておくこと
により、過去に作成した学習データの根拠が提示でき、
矛盾した学習データの作成を防ぎ、作業効率を向上させ
ることができる。
Furthermore, by writing words that were components of the syntax structure at the time of learning in the learning data storage unit, the basis of the learning data created in the past can be presented.
It is possible to prevent creation of inconsistent learning data and improve work efficiency.

【0058】このように、操作者の嗜好や用途あるいは
言語に対する習熟度等に応じた学習手段を選択できる
上、翻訳結果の修正や学習データ作成のための操作者の
作業効率を向上させるという効果がある。
As described above, it is possible to select a learning means according to the operator's preference, use, or proficiency in the language, and to improve the operator's work efficiency for correcting translation results and creating learning data. There is.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】英語文の構文構造を句構造木で表現した例の構
造図である。
FIG. 2 is a structural diagram of an example in which a syntax structure of an English sentence is represented by a phrase structure tree.

【図3】日本語文の構文構造を句構造木と依存構造木で
表現した例の構造図である。
FIG. 3 is a structural diagram of an example in which a syntax structure of a Japanese sentence is expressed by a phrase structure tree and a dependency structure tree.

【図4】複数の解析結果があり、互いに矛盾した学習を
繰り返す場合を説明する図である。
FIG. 4 is a diagram illustrating a case where there are a plurality of analysis results and learning that contradicts each other is repeated.

【図5】本発明の一実施例の動作を示すフローチャート
である。
FIG. 5 is a flowchart showing the operation of one embodiment of the present invention.

【図6】構文解析処理(図5のS503)における処理
を示すフローチャートである。
FIG. 6 is a flowchart showing a process in a syntax analysis process (S503 in FIG. 5).

【図7】学習処理(図5のS514)における処理を示
すフローチャートである。
FIG. 7 is a flowchart showing a process in a learning process (S514 in FIG. 5).

【図8】構文構造に与える優先度得点を説明する図であ
る。
FIG. 8 is a diagram illustrating a priority score given to a syntax structure.

【図9】構文構造の差分抽出を説明する図である。FIG. 9 is a diagram for explaining difference extraction of a syntax structure.

【図10】構文解析で優先度付けに使用する規則に対す
る優先度得点変更を説明する図である。
FIG. 10 is a diagram illustrating a change in priority score for a rule used for prioritization in syntax analysis.

【図11】学習のための初期データを説明する図であ
る。
FIG. 11 is a diagram illustrating initial data for learning.

【図12】自動生成された学習データの例を説明する図
である。
FIG. 12 is a diagram illustrating an example of automatically generated learning data.

【図13】操作者が指定した学習データの例を説明する
図である。
FIG. 13 is a diagram illustrating an example of learning data specified by an operator.

【図14】学習データが他の文に適用される場合を説明
する図である。
FIG. 14 is a diagram illustrating a case where learning data is applied to another sentence.

【図15】学習データの修正を要する場合に、過去の学
習の根拠を提示する例を説明する図である。
FIG. 15 is a diagram illustrating an example in which the basis of past learning is presented when correction of learning data is required.

【図16】過去の学習と矛盾しない学習データの作成を
説明する図である。
FIG. 16 is a diagram illustrating creation of learning data consistent with past learning.

【符合の説明】[Description of sign]

1 入力部 2 形態素解析処理部 3 構文解析処理部 4 構文解析結果記憶部 5 変換生成処理部 6 解析結果差分抽出部 7 出力表示部 8 学習データ自動生成部 9 学習データ記憶部 10 構文構造優先度記憶部 11 構文構造優先度修正部 12 学習データ作成支援部 DESCRIPTION OF SYMBOLS 1 Input part 2 Morphological analysis processing part 3 Syntax analysis processing part 4 Syntax analysis result storage part 5 Conversion generation processing part 6 Analysis result difference extraction part 7 Output display part 8 Learning data automatic generation part 9 Learning data storage part 10 Syntax structure priority Storage unit 11 Syntax structure priority correction unit 12 Learning data creation support unit

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 第1言語で記述された文を入力する入力
部と、 前記入力部によって入力された入力文を形態素に分解
し、解析を行う形態素解析処理部と、 文節の係り受け関係をなす形態素成分において、入力文
における相対位置、品詞の属性条件などの優先度条件に
応じて、係り受け関係の結び付きの深さを数値化した優
先度得点データを、前記優先度条件と併せて保持する構
文構造優先度記憶部と、 前記形態素解析処理部によって形態素解析された各形態
素間の構文構造を解析するとともに、複数得られた構文
構造の解析結果に対して、前記優先度条件に基づいて構
文構造の優先度得点を求め、求めた総和の大小で優先順
位を決定する構文解析処理部と、 前記構文解析処理部から出力される前記複数の解析結果
を保持する構文解析結果記憶部と、 前記優先順位の順で、前記構文解析結果記憶部に保持さ
れた解析結果を第2言語の翻訳文に変換生成処理を行う
変換生成処理部と前記構文解析処理部および変換生成処理部の処理結果を
出力する出力部と、 前記構文解析処理部で得られた前記複数の解析結果の中
から優先順位の最も高い解析結果と、ユーザが最も適当
であると判断した解析結果を比較し、それぞれの解析結
果の構文構造において、異なる部分を局所構文構造とし
て抽出する解析結果差分抽出部と、 前記解析結果差分抽出部で抽出された局所構文構造に対
して、該構文構造に対する優先度条件と該優先度得点を
前記出力部に出力し、優先度条件に対する優先度得点を
ユーザに修正させる構文構造優先度修正部とを備えるこ
とを特徴とする機械翻訳装置。
An input for inputting a sentence described in a first language
And the input sentence input by the input unit are decomposed into morphemes
In the morphological analysis processing unit that performs the analysis and the morphological component
Priority conditions such as relative position and part-of-speech attribute conditions in
The numerical value of the depth of the dependency relationship
It is possible to hold previous score data together with the priority condition.
Sentence structure priority storage unit and each form morphologically analyzed by the morphological analysis processing unit
Analyzes the syntactic structure between elements, and obtains multiple
The structure analysis result is configured based on the priority condition.
Calculate the priority score of the sentence structure, and order the priority according to the size of the calculated sum
A parsing processing unit for determining a position, and the plurality of analysis results output from the parsing processing unit
And a syntax analysis result storage unit that holds the same in the order of the priority.
The generated analysis result into a second language translated sentence
A conversion generation processing unit, and processing results of the syntax analysis processing unit and the conversion generation processing unit.
An output unit for outputting, and the plurality of analysis results obtained by the syntax analysis processing unit.
From the analysis result with the highest priority and the most appropriate for the user
The analysis results determined to be
In the syntactic structure of the result, different parts are
And a local syntax structure extracted by the analysis result difference extraction unit.
To calculate the priority condition and the priority score for the syntax structure.
Output to the output unit and calculate the priority score for the priority condition.
A syntax structure priority correction unit for allowing the user to correct the
And a machine translation device.
【請求項2】 前記解析結果差分抽出部で抽出された局
所構文構造に対して、該構文構造に対する優先度得点、
および局所構文構造を構成する単語についての品詞、意
味などの学習データを前記出力部より出力し、ユーザに
修正、変更させる学習データ作成支援部と、 前記学習データを保持する学習データ記憶部を更に備
え、 前記構文解析処理部は、前記解析結果に対する優先度得
点を求めるとともに、前記学習データ記憶部を参照し、
該解析結果の構文構造に対する学習データがあれば、該
学習データに与えられている得点を前記優先度得点に加
算することを特徴とする請求項1記載の機械翻訳装置。
2. The station extracted by the analysis result difference extraction unit.
Priority score for the syntactic structure,
Part-of-speech and meaning of words that make up
Outputs learning data such as taste from the output unit, and
A learning data creation support unit for correcting and changing the learning data; and a learning data storage unit for holding the learning data.
The parsing processing unit obtains a priority for the analysis result.
While obtaining points, referring to the learning data storage unit,
If there is learning data for the syntax structure of the analysis result,
The score given to the training data is added to the priority score.
2. The machine translation apparatus according to claim 1, wherein the calculation is performed.
【請求項3】 第1言語で記述された文を入力する入力
部と、 前記入力部によって入力された入力文を形態素に分解
し、解析を行う形態素解析処理部と、 前記形態素解析処理部によって形態素解析された各形態
素間の修飾/被修飾関係を修飾語の被修飾語に対する依
存関係を表す依存構造木で構成される構文構造を解析す
るとともに、複数得られた構文構造の解析結果に対し
て、予め定められた優先度条件に基づいて構文構造の優
先度得点を求め、求めた総和の大小で優先順位を決定す
る構文解析処理部と、 前記構文解析処理部から出力される前記複数の解析結果
を保持する構文解析結果記憶部と、 前記優先順位の順で、前記構文解析結果記憶部に保持さ
れた解析結果を第2言語の翻訳文に変換生成処理を行う
変換生成処理部と、 前記構文解析処理部および変換生成処理部の処理結果を
出力する出力部とを備えた機械翻訳装置において、 前記構文解析処理部で得られた前記複数の解析結果の中
から優先順位の最も高い解析結果と、ユーザが最も適当
であると判断した解析結果とにおいて、それぞれの解析
結果の構文構造を構成する依存構造木における枝分かれ
部分を解き、各枝単位でそれぞれの解析結果を比較し、
一致する枝を削除した残りの部分を依存構造木として再
構築した差分構文構造を抽出する解析結果差分抽出部
と、 前記解析結果差分抽出部で抽出された差分構文構造に対
して、ユーザが選択した解析結果を以後優先させるため
の構文構造学習データを生成する学習データ生成部と、 前記学習データを保持する学習データ記憶部とを備え、 前記構文解析処理部は、前記学習データに基づいて、構
文構造の優先度得点を 変更することを特徴とする機械翻
訳装置。
3. An input for inputting a sentence described in a first language.
And the input sentence input by the input unit are decomposed into morphemes
And a morphological analysis unit for performing the analysis, and each form subjected to morphological analysis by the morphological analysis unit.
Modification / modification relation between elements depends on modifiers
Analyzes the syntactic structure composed of dependency structure trees representing existence relationships
And the parsing results
Of the syntax structure based on a predetermined priority condition.
Find the score and determine the priority according to the sum
Parsing processing unit, and the plurality of analysis results output from the parsing processing unit
And a syntax analysis result storage unit that holds the same in the order of the priority.
The generated analysis result into a second language translated sentence
A conversion generation processing unit, and processing results of the syntax analysis processing unit and the conversion generation processing unit.
An output unit for outputting the result of the parsing, wherein the
From the analysis result with the highest priority and the most appropriate for the user
And the analysis results determined to be
Branching in the Dependency Tree Constructing the Resulting Syntactic Structure
Solve the part, compare the analysis results for each branch unit,
The remaining part after removing the matching branch is re-
Analysis result difference extraction unit that extracts the constructed difference syntax structure
And the difference syntax structure extracted by the analysis result difference extraction unit.
In order to prioritize the analysis result selected by the user
A learning data generating unit that generates the syntactic structure learning data, and a learning data storage unit that holds the learning data, wherein the syntactic analysis processing unit is configured based on the learning data.
Machine translation characterized by changing the priority score of sentence structure
Translation device.
JP04164695A 1995-03-01 1995-03-01 Machine translation equipment Expired - Fee Related JP3281746B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04164695A JP3281746B2 (en) 1995-03-01 1995-03-01 Machine translation equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04164695A JP3281746B2 (en) 1995-03-01 1995-03-01 Machine translation equipment

Publications (2)

Publication Number Publication Date
JPH08235186A JPH08235186A (en) 1996-09-13
JP3281746B2 true JP3281746B2 (en) 2002-05-13

Family

ID=12614114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04164695A Expired - Fee Related JP3281746B2 (en) 1995-03-01 1995-03-01 Machine translation equipment

Country Status (1)

Country Link
JP (1) JP3281746B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203586A (en) * 2011-03-24 2012-10-22 Toshiba Corp Document processor and program
JP2015138414A (en) 2014-01-22 2015-07-30 富士通株式会社 Machine translation device, translation method, and program thereof

Also Published As

Publication number Publication date
JPH08235186A (en) 1996-09-13

Similar Documents

Publication Publication Date Title
US5864788A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
JP2732563B2 (en) Machine translation method and apparatus
US20070011160A1 (en) Literacy automation software
JPH02297188A (en) Document preparation supporting device
KR20030094632A (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
JP3281746B2 (en) Machine translation equipment
JP4940606B2 (en) Translation system, translation apparatus, translation method, and program
JP2000330996A (en) Pronouncing electronic dictionary
JPH08329108A (en) Method for converting text into hypertext
KR950013129B1 (en) Method and apparatus for machine translation
JP2003006191A (en) Device and method for supporting preparation of foreign language document and program recording medium
JP3949874B2 (en) Translation translation learning method, translation translation learning device, storage medium, and translation system
JP5853688B2 (en) Language processing program, language processing apparatus, and language processing method
JP3041002B2 (en) Kana-kanji conversion method and kana-kanji conversion device
JPH1031676A (en) Retrieval device for bilingual example sentence
JPH10149364A (en) Word selection device and storage medium
JPH09185629A (en) Machine translation method
KR20210113551A (en) Exploratory language-learning system based on ML, NLP and a pattern-based reference library And the Method thereof
JP3253311B2 (en) Language processing apparatus and language processing method
Leech Statistically-driven Computer Grammars of English: The IBM/Lancaster Approach
JP2021043306A (en) Electronic apparatus, sound reproduction method, and program
JPH09231217A (en) System and method for language analysis
JPH07200588A (en) Translation device
JPH04372061A (en) Automatic learning machine for machine translation

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees