JP2016164707A - Automatic translation device and translation model learning device - Google Patents
Automatic translation device and translation model learning device Download PDFInfo
- Publication number
- JP2016164707A JP2016164707A JP2015044418A JP2015044418A JP2016164707A JP 2016164707 A JP2016164707 A JP 2016164707A JP 2015044418 A JP2015044418 A JP 2015044418A JP 2015044418 A JP2015044418 A JP 2015044418A JP 2016164707 A JP2016164707 A JP 2016164707A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- language
- pattern
- sentence
- english
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
この発明は自動翻訳技術に関し、特に、特許出願の特許請求の範囲の請求項(以下「クレーム」と呼ぶ)のように、ある種のルールにしたがっていながら、長文で翻訳が難しい文を扱う技術に関する。 TECHNICAL FIELD The present invention relates to automatic translation technology, and in particular, technology that handles long and difficult-to-translate sentences while following certain rules, such as the claims of a patent application claim (hereinafter referred to as “claims”). About.
外国語で書かれた特許出願の技術的内容を確認したり、権利範囲についての知識を得たりするために、外国語で書かれたクレームの意味を知る必要が生じることがある。対象になるものが少数であり、かつ対象となる文書の言語に関する知識があれば、原文を読むことについてそれほど問題はないかも知れない。しかし、対象文書が大量であったり、文書の言語についての知識が乏しかったりする場合には、対象文書のクレームを全て読むことは非現実的である。そのような場合に、自動翻訳で各クレームを自己の母語に翻訳することで、内容を把握しようとすることがよく行なわれる。 It may be necessary to know the meaning of a claim written in a foreign language in order to confirm the technical content of the patent application written in a foreign language or to obtain knowledge about the scope of rights. If you have a small number of subjects and knowledge of the language of the target document, you may not have much trouble reading the original. However, when there are a large number of target documents or knowledge of the language of the document is poor, it is unrealistic to read all the claims of the target document. In such a case, it is often performed to try to grasp the contents by translating each claim into its own language by automatic translation.
ところが、クレームを他の言語に自動翻訳した場合、その品質が低いことはよく知られている。クレームでは、発明に関する多くの限定を1文で記載することが慣例となっている。そのためにクレームの文は長くなる傾向がある。しかも、多くの発明者が開発にしのぎをけずるような技術分野では、比較的多くの限定(構成要件)をクレームに付加しないと先行技術との差異を明確にできない場合もある。そのために、クレームは、通常の文書ではほとんど生じ得ないような長さの文となることも多い。自動翻訳技術は特に近年非常に発達し精度も向上しているものの、特にクレームのように翻訳の原文が長い場合には精度の高い翻訳はまだ期待できない。 However, it is well known that when a claim is automatically translated into another language, its quality is low. In the claims, it is customary to describe many limitations relating to the invention in one sentence. Therefore, the claim text tends to be long. In addition, in technical fields where many inventors have difficulty in development, the difference from the prior art may not be clear unless relatively many limitations (constituent requirements) are added to the claims. As a result, claims are often sentences of length that rarely occur in ordinary documents. Although automatic translation technology has been greatly developed and improved in recent years, high-precision translation is not yet expected, especially when the original translation is long, as in the case of claims.
こうした問題を解決するための提案が、後掲の特許文献1でなされている。特許文献1に記載された技術は、基本的には、長いクレームを、その構成要素(以下、「構造部品」と呼ぶ。)に分割して構造部品ごとに翻訳する、という考え方に基づいている。これは、特に最近では、クレームの記載が、一般的に複数の構造部品に分けられること、それら構造部品の間は、特定の区切りパターンで区切られて記載されていること、という事実を利用している。クレームの構造部品としては、発明の主題と、1又は複数の構成要件と、発明の主題と構成要件との間に挿入される移行句が考えられる。これらの記載の順番は、言語によって異なってくる。例えば、日本語の場合には、1又は複数の構成要件が先頭に位置し、移行句が続き、移行句に続いて発明の主題が末尾に記載される。英語の場合にはこの逆で、先頭に発明の主題が記載され、続いて移行句、続いて1又は複数の構成要件という形が一般的である。
A proposal for solving such a problem is made in
日本語の場合、移行句としては「含む(ことを特徴とする)」、「を備える(ことを特徴とする)」、「からなる(ことを特徴とする)」などが主に用いられる。英語の場合には、移行句としては「comprising:」、「including:」、「consisting of:」等が用いられる。 In the case of Japanese, “contains (characteristic)”, “comprises (characteristic)”, “consists of (characteristically)”, etc. are mainly used as transition phrases. In English, “comprising:”, “including:”, “consisting of:”, etc. are used as transition phrases.
1又は複数の構成要件の間は、日本語であれば「、」+改行が主として用いられ、英語であれば「;」が用いられる。 Between one or a plurality of constituent elements, “,” + line feed is mainly used in Japanese, and “;” is used in English.
このような区切りパターンをクレーム中で検出することにより、クレームの構造を判定できる。 By detecting such a delimiter pattern in a claim, the structure of the claim can be determined.
図1に、特許文献1に開示された技術についての大まかな処理の流れを示す。図1を参照して、特許文献1におけるクレームの翻訳手順30は、コンピュータを用いたものであって、クレームのテキストに対して形態素解析及び構文解析し、構文情報を生成するステップ40と、構文解析の結果内において構造部品の区切りパターンを検出し、クレームのテキストを構成要素ごとに分割するステップ42と、各構造部品について、その構造部品名を示す文字列をテキスト中で特定し、その文字列に、構造部品名であることを示すタグを付するステップ44とを含む。構文解析の結果、構造部品の間にツリー状の構文構造が形成される。特許文献1では、この構文構造は、構造部品及びその内部の単語等に付されるタグの形で表現される。
FIG. 1 shows a rough process flow of the technique disclosed in
特許文献1の第1の実施の形態では、対象となるクレームが英語であることが想定されている。英語の場合、各構造部品に関するテキストの最初に、その構造部品の名称に相当する単語が記載されていることが多く、その後にその構造部品に関する説明を記載している形式がほとんどである。そのためにこのステップ44のような処理が容易に行なえる。また、構造部品の説明もパターン化されていることが多い。特許文献1では、そのように説明についてパターン化された説明文を説明パターン文と呼んでいる。
In the first embodiment of
特許文献1の翻訳手順30はさらに、処理対象となっている構造部品に含まれる説明パターン文を特定し、処理対象の構造部品をパターン文ごとに分割し、分割されたものが説明パターン文であることを示すタグを付すステップ46と、処理対象の構造部品の構造部品名を自動翻訳により目的言語に翻訳するステップ48と、説明パターン文ごとに、文の構造を翻訳に適したものに変更するステップ50と、ステップ50で文構造が変更された各説明文を自動翻訳によって目的言語52に翻訳するステップと、このように目的言語に翻訳された構造部品名及び各パターン文を、タグにしたがってツリー表示するステップ54とを含む。
The
ステップ50での文構造の変更とは、説明文が主語と述語とを含むような形式に変更することである。例えば英語の関係代名詞を省略して代わりに構造部品名を挿入したり、説明パターン文が修飾する名詞又は名詞句を挿入したりする。特許文献1では、これを含め、文の変換については予め変換パターンが設定されているとしている。この文構造の変換は、説明パターン文を一般の文の語順にあわせるためのものと思われる。
The change of the sentence structure in
図2を参照して、特許文献1による自動翻訳手法では、より具体的には以下の様な処理を行なう。英語クレーム70が翻訳対象であるものとする。特許文献1では、英語クレームを、英語の区切りパターンを見つけることにより複数の構造部品に分解し、それらの間にツリー構造を形成する(処理72)。前述したように、英語クレーム中の区切りパターンに着目すれば、英語クレームがどのような構造になっているかを判定できる。その結果にしたがって英語クレームを複数の構造部品に分解できる。
Referring to FIG. 2, the automatic translation method according to
特許文献1による手順では、処理72の結果、ツリー構造の英語パターン74が形成される。図2に示す例では、英語パターン74は、主題90と、移行句92と、説明94とを含む。主題90、移行句92,及び説明94をそれぞれ別個に自動翻訳する(処理76)ことで、ツリー構造の日本語パターン78が生成される。日本語パターン78は、構造としては英語パターン74と同じで、テキストが日本語に変換されたものである。すなわち、日本語パターン78は、主題の日本語訳100、移行句の日本語訳102、説明の日本語訳104を含む。特許文献1では、日本語パターン78から1文の日本語クレームを生成する代わりに、日本語パターン78をそのままツリー形式で表示するとされている。
In the procedure according to
特許文献1によれば、このような処理を行なうことで、個々の構造部品を自動翻訳すればよくなるため、構成する説明パターン文の翻訳精度が従来のものより向上するとされている。さらに、翻訳後の文を木構造で表示することにより、クレームの内容がわかりやすくなるとされている。
According to
確かに、特許文献1の手法により、クレーム全体をひとまとめに翻訳するよりも翻訳の精度は高くなると思われる。しかし、自動翻訳を用いる場合、特許文献1の技術では依然として解決すべき課題がある。
Certainly, the technique of
最も大きな問題は、説明を構成する文構造の変更である。文構造の変更は、説明文が通常文ではなく、各構造部品を修飾する形式となっていることにより必要となる処理である。文構造の変換パターンが予め準備されており、かつ説明パターン文の変更が完全に行なわれれば、既存の自動翻訳技術を用いて各説明文を翻訳しても問題は生じないかもしれない。しかし、クレームとして生じ得る文のバリエーションは事実上無限であり、それらについての文構造の変換規則を予め準備しておくことは不可能である。しかも変換パターンとしてどのようなものを準備すべきかについて、特許文献1には明確な開示がない。したがって、説明文が自動翻訳に適した文構造に変換される可能性は決して高くない。そのような変換が正しく行なわれず、説明文が文の形をなしていない場合でも、自動翻訳装置は、各説明文が通常の文であるとみなして翻訳を行なう。その結果、得られる翻訳結果が理解可能なものになる可能性はほとんどない。特に、構造部品が名詞句である場合、自動翻訳装置が文とみなして翻訳すると、翻訳文に対する悪影響が大きくなる。
The biggest problem is the change in the sentence structure that constitutes the explanation. The change of the sentence structure is a process that is necessary because the explanatory text is not a normal sentence but a format that modifies each structural component. If a sentence structure conversion pattern is prepared in advance and the explanation pattern sentence is completely changed, there may be no problem even if each explanation sentence is translated using the existing automatic translation technology. However, sentence variations that can occur as claims are virtually infinite, and it is impossible to prepare sentence structure conversion rules in advance. Moreover, there is no clear disclosure in
例えば、図3を参照して、説明文に相当する2つの名詞句1及び2を持つ英語クレーム120を考える。特許文献1にしたがって本願発明者が自動翻訳して得られた日本語クレーム122によれば、名詞句1及び名詞句2に対する翻訳がほとんど理解できないものとなっている。図3に示すように、特許文献1にしたがって処理した場合、文構造の変換がうまく行なわれないにもかかわらず、各名詞句等を文として翻訳するような場合には、得られた翻訳文は理解が困難となり、自動翻訳の目的が果たせない。
For example, referring to FIG. 3, consider an
また、このような問題は、特許出願のクレームの翻訳に関して生ずるだけでなく、同様に長文で、特定のルールにしたがって記載されるような、複数の構造部品からなる文の翻訳においても生じ得る問題である。例えば法令、約款、及び条約、並びに様々な機械、電子機器、及びソフトウェアの使用説明書等においてもこうした問題が生じ得る。 In addition, such problems arise not only with respect to the translation of claims of patent applications, but also with the translation of sentences composed of a plurality of structural parts, which are similarly long and described according to specific rules. It is. For example, such problems may occur in laws, regulations, treaties, treaties, and instructions for using various machines, electronic devices, and software.
したがって本発明の目的は、特定の形式にしたがって記載された、複数の構造部品に分割できる長文に対する自動翻訳の精度を高めることができる自動翻訳装置を提供することである。 Accordingly, an object of the present invention is to provide an automatic translation apparatus capable of improving the accuracy of automatic translation for a long sentence that can be divided into a plurality of structural parts described according to a specific format.
本発明の第1の局面に係る自動翻訳装置は、第1の言語の文を、第1の言語と異なる第2の言語の文に翻訳する。この自動翻訳装置は、第1の言語の文のパターンを特定し、第1の言語の文を構造部品に分割する分割手段と、分割手段により特定された第1の言語の文のパターンと予め対応付けられた、第2の言語の文のパターンを特定するパターン特定手段と、分割手段により分割された第1の言語の文のパターンと、パターン特定手段により特定された第2の言語のパターンとの間で、構造部品の対応関係及び各構造部品の文法特性を特定する対応特定手段と、第1の言語の構造部品の各々について、当該構造部品を構成する単語列に対し、第1の言語から第2の言語への翻訳用のモデルを使用した自動翻訳を行なって、第2の言語の翻訳を生成する翻訳手段と、第1の言語の構造部品の各々について、翻訳手段によって得られた第2の言語の翻訳を、対応特定手段により特定された、構造部品の対応関係にしたがって、パターン特定手段により特定された第2の言語の文のパターンの構造部品のいずれかに代入することにより、第1の言語の文の翻訳である第2の言語の文を生成する代入手段とを含む。 The automatic translation apparatus according to the first aspect of the present invention translates a sentence in a first language into a sentence in a second language different from the first language. The automatic translation apparatus specifies a sentence pattern of a first language, divides a sentence of the first language into structural parts, a sentence pattern of the first language identified by the dividing means, Pattern specification means for specifying the second language sentence pattern, the first language sentence pattern divided by the dividing means, and the second language pattern specified by the pattern specification means The correspondence specifying means for specifying the correspondence between the structural parts and the grammatical characteristics of each structural part, and for each of the structural parts in the first language, the first A translation unit that performs automatic translation using a model for translation from a language to a second language to generate a translation of the second language, and each of the structural parts of the first language is obtained by the translation unit. Translation of the second language By substituting one of the structural parts of the second language sentence pattern specified by the pattern specifying means according to the correspondence relationship of the structural parts specified by the correspondence specifying means, the sentence of the first language Substitution means for generating a sentence in a second language that is a translation.
第1の言語の文は、例えば特許出願のクレーム、法令、約款、及び条約、並びに様々な機械、電子機器、及びソフトウェアの使用説明書等のいずれでもよい。 The sentence in the first language may be, for example, a patent application claim, a law, a contract, a treaty, and instructions for using various machines, electronic devices, and software.
好ましくは、自動翻訳装置は、対応特定手段と前記翻訳手段との間に設けられ、対応特定手段により対応関係及び文法特性が特定された第1の言語の構造部品を受け、第1の言語の構造部品の各々について、当該構造部品を構成する単語列の順番を、第2の言語において当該単語列の各々の訳語が出現する順番にあわせて並べ替えて前記翻訳手段に与える単語並べ替え手段を含む。 Preferably, the automatic translation apparatus is provided between the correspondence specifying means and the translation means, receives the structural component of the first language in which the correspondence relation and the grammatical characteristics are specified by the correspondence specifying means, A word rearrangement unit that rearranges the order of the word strings constituting the structural part in accordance with the order in which each translated word of the word string appears in the second language, and supplies the word translation unit to the translation unit. Including.
より好ましくは、単語並べ替え手段は、第1の言語の構造部品の各々について、構文解析を行なって第1の言語の構文解析木を生成する構文解析手段と、構文解析手段により生成された第1の言語の構文解析木を、予め準備された変換規則にしたがって、第2の言語の構文解析木に変換する変換手段と、変換手段による変換で得られた第2の言語の構文解析木における単語の出現順序にしたがって、第1の言語の構造部品の単語を並べ替えて出力する並べ替え手段とを含む。 More preferably, the word rearrangement means performs syntax analysis on each of the structural parts of the first language to generate a syntax analysis tree of the first language, and the first word generated by the syntax analysis means. In the parse tree of the second language obtained by conversion by the conversion means for converting the parse tree of one language into the parse tree of the second language in accordance with a conversion rule prepared in advance, Rearrangement means for rearranging and outputting the words of the structural parts of the first language in accordance with the appearance order of the words.
翻訳手段は、第1の言語の構造部品の各々について、当該構造部品を構成する単語列に対し、当該構造部品の文法特性を持つ単語列の翻訳に対して予め最適化された、第1の言語から第2の言語への翻訳用のモデルを使用した自動翻訳を行なって、第2の言語の翻訳を生成する文法特性別翻訳手段を含んでもよい。 For each of the structural parts of the first language, the translation means is preliminarily optimized for the translation of the word strings having the grammatical characteristics of the structural parts with respect to the word strings constituting the structural parts. A grammatical property-specific translation unit that performs automatic translation using a model for translation from a language into a second language and generates a translation in the second language may be included.
さらに好ましくは、パターン特定手段は、第1の言語の文に含まれる、予め定められた区切りパターンにより、第1の言語の文を複数個の構造部品に分割する分割手段と、分割手段により分割された各構造部品の文法特性を判定する文法特性判定手段と、分割手段により分割された構造部品の出現順序及び各構造部品について文法特性判定手段により判定された文法特性とによって、第1の言語の文パターンを特定する手段とを含む。 More preferably, the pattern specifying means divides the sentence in the first language into a plurality of structural parts by a predetermined delimiter pattern included in the sentence in the first language, and divides by the dividing means. The grammatical characteristic determining means for determining the grammatical characteristics of each structural part, the appearance order of the structural parts divided by the dividing means, and the grammatical characteristics determined by the grammatical characteristic determining means for each structural part. Means for specifying the sentence pattern.
第1の言語の文は、第1の言語で記載された特許出願のクレームでもよい。 The sentence in the first language may be a claim of a patent application written in the first language.
本発明の第2の局面に係る翻訳用モデル学習装置は、第1の言語の特定の文法特性の文を、第1の言語と異なる第2の言語の文に統計的翻訳によって翻訳する際に使用される翻訳用モデルの学習を行なう。この装置は、第1の言語の特定の文法特性の文と、当該文の、第1の言語と異なる第2の言語の訳文とからなる対訳を複数個収集するための収集手段と、収集手段により収集された複数の対訳を学習データとして、第1の言語の特定の文法特性の文から第2の言語の文への統計的翻訳を行なうために必要な統計的モデルの学習を行なうための統計的学習手段とを含む。 The translation model learning device according to the second aspect of the present invention translates a sentence having a specific grammatical characteristic of a first language into a sentence of a second language different from the first language by statistical translation. Learn the translation model used. The apparatus includes: a collecting unit for collecting a plurality of parallel translations composed of a sentence having a specific grammatical characteristic of a first language and a translation of the sentence in a second language different from the first language; For learning a statistical model necessary for statistical translation from a sentence of a specific grammatical characteristic of a first language into a sentence of a second language, using a plurality of parallel translations collected by And statistical learning means.
以下の説明及び図面では、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。なお、以下の説明は、特許出願の英語クレームを日本語に翻訳する場合に関する。しかし以下の実施の形態の翻訳対象は、そのような場合には限定されない。例えば、日本語のクレームを英文に翻訳する場合にも適用できる。さらに、特許出願のクレームと同様に翻訳が難しいとされる法令、約款、及び条約、並びに様々な機械、電子機器、及びソフトウェアの使用説明書等についても適用できる。 In the following description and drawings, the same parts are denoted by the same reference numerals. Therefore, detailed description thereof will not be repeated. The following description relates to the case of translating an English claim of a patent application into Japanese. However, the translation object of the following embodiment is not limited to such a case. For example, the present invention can be applied to a case where a Japanese claim is translated into English. Furthermore, it can be applied to laws and regulations, covenants, and treaties that are difficult to translate as well as claims of patent applications, and instructions for using various machines, electronic devices, and software.
[第1の実施の形態]
<基本的考え方>
以下に説明する第1の実施の形態に係るクレームの自動翻訳システムでは、統計的機械翻訳を採用する。図4を参照して、英語、日本語を問わず、特許出願のクレームは、様々なバリエーションはあるものの、ある一定のパターンのいずれかにしたがって構造部品が配列され記載されている。本実施の形態では、こうしたクレームの構造部品の配列パターンをクレームパターンと呼ぶ。これは、図2に示す従来の英語パターン74と同様のもので、ツリー構造で表すことができる。英語のクレームパターンを英語パターン、日本語のクレームパターンを日本語パターンと呼ぶ。また、実際の英語クレームとそれに対応する日本語クレームとを比較することにより、英語パターンと日本語パターンとを対応付けることができる。すなわち、ある英語パターンにしたがって記載されたクレームを、その英語パターンに対応する日本語パターンと合致するような日本語クレームに翻訳できる。
[First Embodiment]
<Basic concept>
The automatic machine translation system for claims according to the first embodiment described below employs statistical machine translation. Referring to FIG. 4, regardless of whether in English or Japanese, the claims of the patent application are arranged and described in accordance with any of certain patterns, although there are various variations. In the present embodiment, such an arrangement pattern of structural parts of a claim is referred to as a claim pattern. This is similar to the
これらクレームパターンは、複数のクレームを分類することで得られる。各クレームパターンでは、各構造部品にはその構造部品の文法特性が付される。例えば構造部品を形成する文字列又は単語列が名詞句であれば、その構造部品には名詞句であるというマークが付され、動詞句であれば動詞句であるというマークが付される。ツリー構造の見かけが同じ2つのクレームパターンでも、ある構造部品の文法特性が異なれば、それらは別々のクレームパターンである。こうしたクレームパターンは、特許文献1で使用されている「区切りパターン」とは別のものである点に注意が必要である。
These claim patterns are obtained by classifying a plurality of claims. In each claim pattern, each structural part is given a grammatical characteristic of the structural part. For example, if a character string or word string forming a structural part is a noun phrase, the structural part is marked as a noun phrase, and if it is a verb phrase, it is marked as a verb phrase. Two claim patterns with the same appearance of the tree structure are different claim patterns if the grammatical characteristics of a certain structural component are different. It should be noted that such a claim pattern is different from the “separation pattern” used in
英語のクレームのクレームパターンと、その英語のクレームに対応する日本語のクレームのクレームパターンとを比較することにより、英語パターンと日本語パターンとを対応付けることができる。さらに、対応するクレームパターン同士で、構造部品同士の対応を付けることもできる。こうしたクレームパターン同士の対は、パターン分類データとして予め蓄積され、以下に記載するように翻訳用のモデルの学習時に使用される。なお、以下の実施の形態では、英語パターンと日本語パターンとは1対1に対応付けられているものとする。 By comparing the claim pattern of the English claim with the claim pattern of the Japanese claim corresponding to the English claim, the English pattern and the Japanese pattern can be associated with each other. Further, the corresponding claim patterns can be associated with each other. Such a pair of claim patterns is stored in advance as pattern classification data, and is used when learning a model for translation as described below. In the following embodiment, it is assumed that an English pattern and a Japanese pattern are associated one-to-one.
以下の実施の形態では、英語クレームを日本語クレームに翻訳する場合を想定する。原言語である英語クレームの単語列を複数の構造部品に分解し、各構造部品の文法特性を判定することで、英語パターンを判定する。この結果により、各構造部品を構成するテキストの内容も得られる。なお、構造部品の分解には、特許文献1と同様、クレーム中の区切りパターンを使用できる。特に、移行句はクレーム表現に特有なものでそのバリエーションも少ないので、比較的簡単に特定できる。移行句を特定した後は、言語によりその前後のいずれかに発明の主題に相当する構造部品が位置し、他方に説明に相当する1又は複数の構造部品が位置する。これら構造部品の間の分離は、特定の区切りパターンを発見することで行なうこともできるし、分離のための統計的モデルを予め作成しておき、区切り位置である可能性の高い部分を特定して行なうこともできる。
In the following embodiment, it is assumed that an English claim is translated into a Japanese claim. An English pattern is determined by decomposing a word string of an English claim as a source language into a plurality of structural parts and determining grammatical characteristics of each structural part. As a result, the contents of the text constituting each structural part can also be obtained. It should be noted that, as in the case of
本実施の形態では、構造部品の文法特性(例えば名詞句、動詞句の種別等)ごとに、別々の翻訳用モデルの学習を行なっておき、各構造部品の文法特性に応じたモデルを用いて構造部品ごとに自動翻訳を行なう。すなわち、名詞句からなる構造部品を翻訳するときは、名詞句のみを用いて予め学習した翻訳用のモデルを使用する。動詞句からなる構造部品を翻訳するときは、動詞句のみを用いて予め学習した翻訳用のモデルを使用する。この結果、各構造部品についてより理解しやすい日本語訳が得られる。 In the present embodiment, learning is performed for a separate translation model for each grammatical characteristic of a structural component (for example, the type of a noun phrase or a verb phrase), and a model corresponding to the grammatical characteristic of each structural component is used. Automatic translation for each structural part. That is, when translating a structural part composed of noun phrases, a translation model learned in advance using only noun phrases is used. When translating structural parts composed of verb phrases, a translation model learned in advance using only verb phrases is used. As a result, it is possible to obtain a more easily understood Japanese translation of each structural component.
もとの英語パターンは、ある日本語パターンと関係付けられており、英語パターンのどの構造部品が日本語パターンのどの構造部品に対応しているかも予め記録されている。この対応関係を用い、各構造部品の日本語訳を、元の英語パターンに対応する日本語パターンの、元の構造部品に対応する構造部品の位置に代入することで、クレームの日本語訳を得ることができる。 The original English pattern is related to a certain Japanese pattern, and which structural component of the English pattern corresponds to which structural component of the Japanese pattern is recorded in advance. Using this correspondence, the Japanese translation of each structural part is substituted into the position of the structural part corresponding to the original structural part of the Japanese pattern corresponding to the original English pattern, so that the Japanese translation of the claim Can be obtained.
なお、ここでいう「翻訳用モデル」とは、統計的翻訳装置で使用される、原言語から目的言語への翻訳モデル、目的言語の言語モデル、及びそれらの学習の過程で生成される句テーブル等からなる1組のモデルを指す。以下の実施の形態では、原言語は英語であり、目的言語は日本語である。また、以下の実施の形態では、文法特性として名詞句と動詞句とを採用する。 The term “translation model” used here means a translation model from a source language to a target language, a language model of the target language, and a phrase table generated in the course of learning thereof, which are used in a statistical translation apparatus. Refers to a set of models. In the following embodiment, the source language is English and the target language is Japanese. In the following embodiments, noun phrases and verb phrases are adopted as grammatical characteristics.
図4に、名詞句翻訳用モデル210と動詞句翻訳用モデル214との学習過程を模式的に示す。なお、ここでは、英語パターンと日本語パターンとについては予め収集されており、それらの間の対応関係も確立されている。この対応関係は、前述したとおり1対1である。すなわち、英語パターンが決まればそれに対応する日本語パターンも決まり、構造部品の対応関係も同様に1対1で決まる。
FIG. 4 schematically shows the learning process of the noun
図4を参照して、学習用の、クレームの対訳170を複数個準備する。各対訳170は、英語クレーム172と、その英語のクレームの翻訳である日本語クレーム174とを含む。例えば日本出願を英語に訳して米国に出願したもののように、互いに対訳に相当する関係となっている出願書類で、しかも公開されているものは多数存在する。対訳170は、それら公開された出願の組から選択すればよい。
Referring to FIG. 4, a plurality of
英語クレーム172の英語パターンを判定し、その英語パターンにしたがってクレームを構造部品に分解し、各構造部品の文法特性を英語パターンにしたがって分類する(処理176)。同様に日本語クレーム174は英語パターンに対応する日本語パターンにしたがって構造部品に分解し、各構造部品の文法特性を日本語パターンにしたがって分類する(処理180)。この処理は、人手でも実行できるし、機械可読な形式のパターン集を準備しておくことで機械でも実行できる。
The English pattern of the
このパターン分類の結果、例えば、英語クレーム172は英語パターン178に合致すると判定され、日本語クレーム174は日本語パターン182に合致すると判定される。英語パターンと日本語パターンとの構造部品は予め対応付けられており、各構造部品を対にすることができる(処理184)。例えば図4に示す例では、英語クレームの主題は日本語クレームの主題に対応付けられる。英語クレームの移行句は日本語クレームの移行句に対応付けられる。英語クレームの説明は、日本語クレームの説明に対応付けられる。
As a result of this pattern classification, for example, it is determined that the
このようにして組み合わされた構造部品のうち、本実施の形態では、構造部品の文法特性に着目し、各構造部品の対を文法特性(文法的な種別)ごとに別々の集合に分類する。すなわち、構造部品の対のテキストが名詞句であれば名詞句対の集合198に、動詞句であれば動詞句対の集合200に、各構造部品の対を分類する(処理196)。このようにして得られた名詞句対の集合198は、英語クレームの名詞句と日本語クレームの名詞句との対を多数含み、動詞句対の集合200は、英語クレームの動詞句と日本語クレームの動詞句との対を多数含む。
Of the structural parts combined in this way, in the present embodiment, focusing on the grammatical characteristics of the structural parts, the pairs of the structural parts are classified into separate sets for each grammatical characteristic (grammatical type). That is, if the text of the pair of structural parts is a noun phrase, the pair of structural parts is classified into a noun phrase pair set 198 and if it is a verb phrase, it is classified into a verb phrase pair set 200 (process 196). The
最後に、名詞句対の集合198を学習データとして名詞句翻訳用モデル210の学習を、動詞句対の集合200を学習データとして動詞句翻訳用モデル214の学習を、それぞれ行なう。
Finally, the noun
図5を参照して、英語から日本語への翻訳時には以下の様な処理を行なう。英語クレーム70を英語パターンと照合することにより、英語クレーム70のクレームパターンを特定する。この例では英語パターン74が特定されたものとする。英語パターン74は、この例では、3個の構造部品、すなわち主題と移行句と説明とを含む。これらはいずれもテキストを格納する領域を持つ。これら領域には、英語クレーム70を構造部品に分解して得られる、主題に対応する英語テキスト、移行句に対応する英語テキスト、及び説明に対応する英語テキストがそれぞれ格納される(処理72)。
Referring to FIG. 5, the following processing is performed at the time of translation from English to Japanese. By comparing the
次に、特定された英語パターンと対応付けられている日本語パターンが特定され、生成される(処理76)。具体的には、特定された英語パターン74と対になった日本語パターン78の構造を特定する情報がクレームパターンの記憶部から読み出され、この新たな日本語パターンを記憶する領域が新たに記憶領域に確保される。この例では、読み出された日本語パターン78は、説明と移行句と主題とを含む。これらはこの順番で配置されており、いずれも、記憶装置内に、対応のテキストを格納する領域を持つ。日本語パターンの生成時には、これら領域は空である。
Next, a Japanese pattern associated with the identified English pattern is identified and generated (process 76). Specifically, information specifying the structure of the
続いて、英語パターンの主題、移行句、及び説明のテキストを、それぞれの文法特性に応じて選択したモデルを使用して自動翻訳する(処理240)。例えば主題は名詞句であるから名詞句翻訳用モデルを用いて翻訳される。説明のうち、動詞句であるものは動詞句用翻訳モデルを用いて翻訳され、名詞句であるものは名詞句翻訳用モデルを用いて翻訳される。移行句は動詞句であるから動詞句翻訳用モデルを用いて翻訳される。主題を翻訳した結果は、日本語パターン78の主題の領域に、移行句を翻訳した結果は日本語パターン78の移行句の領域に、説明を翻訳した結果は日本語パターンの説明の領域に、それぞれ格納される。この結果、翻訳後の日本語パターン242が得られる。得られた日本語パターン242の各領域のテキストを、日本語パターン242の各領域の順番に連結することで英語クレーム70の翻訳である日本語のクレームが得られる。
Subsequently, the subject of the English pattern, the transitional phrase, and the explanatory text are automatically translated using a model selected according to their grammatical characteristics (process 240). For example, since the subject is a noun phrase, it is translated using a noun phrase translation model. Among the descriptions, those that are verb phrases are translated using a verb phrase translation model, and those that are noun phrases are translated using a noun phrase translation model. Since the transition phrase is a verb phrase, it is translated using a verb phrase translation model. The result of translating the subject is the subject area of the
<構成>
図6を参照して、上記した自動翻訳処理を実現する、本実施の形態に係るクレーム翻訳システム300は、英語クレームを日本語クレームに翻訳するためのものである。クレーム翻訳システム300は、名詞句の英日翻訳を行なう際に用いられる名詞句翻訳用モデル320と、動詞句の英日翻訳を行なう際に用いられる動詞句翻訳用モデル322と、これらの学習を行なうための構造部品翻訳用モデル学習部318と、動詞句構文解析用モデル312及び名詞句構文解析用モデル314を用いて英語クレーム324の構文解析を行い、構文解析後の英語クレーム334を出力するための構文解析部332と、名詞句翻訳用モデル320及び動詞句翻訳用モデル322を使用して、入力される構文解析後の英語クレーム334を翻訳して日本語クレーム326を出力するためのクレーム翻訳部328とを含む。
<Configuration>
With reference to FIG. 6, the
構造部品翻訳用モデル学習部318は、名詞句翻訳用モデル320及び動詞句翻訳用モデル322の学習を行なうために、英語と日本語とのクレームの対訳を多数記憶したクレーム対訳コーパス310と、英語の動詞句の構文解析を行なうための動詞句構文解析用モデル312と、英語の名詞句の構文解析を行なうための名詞句構文解析用モデル314と、クレームに関する英語パターンとそれに対応する日本語パターンとの対を複数個格納したパターン分類データ316と、英語の構造部品について後述する事前並べ替えをするための構文解析木変換規則330とを用いる。動詞句構文解析用モデル312は、英語の動詞句のみを学習データとして学習した構文解析用モデルである。名詞句構文解析用モデル314は、英語の名詞句のみを学習データとして学習した構文解析用モデルである。
In order to learn the noun
図7を参照して、構造部品翻訳用モデル学習部318は、クレーム対訳コーパス310からクレーム対訳を順番に読出し、そのうちの英語クレームをパターン分類データ316と照合することにより、合致する英語パターンと、その英語パターンと対になった日本語パターンを読み出すためのパターン分類部350と、クレーム対訳コーパス310から読み出されたクレーム及びパターン分類部350により読み出された英語パターンに基づいて、英語クレームを構造部品に分類し、名詞句と動詞句とに分類して出力する構造部品分類部352と、構造部品分類部352が出力する英語の名詞句を格納する名詞句データ記憶部354と、構造部品分類部352が出力する動詞句を格納する動詞句データ記憶部356とを含む。
With reference to FIG. 7, the structural part translation
構造部品翻訳用モデル学習部318はさらに、名詞句データ記憶部354に記憶された名詞句データの各々に対して、事前並べ替えと呼ばれる、英語クレームの単語の並べ替え処理を行なう名詞句事前並べ替え部358と、名詞句事前並べ替え部358の出力する、事前並べ替え後の名詞句データを記憶するための名詞句用学習データ記憶部362と、名詞句用学習データ記憶部362に記憶された事前並べ替え後の英語クレームと日本語クレームとの対を学習データとし名詞句翻訳用モデル320の学習を行なうための名詞句用モデル学習部364とを含む。
The model learning unit for
構造部品翻訳用モデル学習部318はさらに、動詞句データ記憶部356に記憶された動詞句データの各々に対して、英語クレームの単語の事前並べ替えを行なう動詞句事前並べ替え部360と、動詞句事前並べ替え部360の出力する、事前並べ替え後の動詞句データを記憶するための動詞句用学習データ記憶部366と、動詞句用学習データ記憶部366に記憶された事前並べ替え後の英語クレームと日本語クレームとの対を学習データとして動詞句翻訳用モデル322の学習を行なうための動詞句用モデル学習部368とを含む。
The structural part translation
名詞句事前並べ替え部358は、名詞句データ記憶部354に記憶された名詞句の各々について名詞句構文解析用モデル314を用いて構文解析を行ない、構文解析木を出力するための構文解析部380と、構文解析部380が出力する構文解析木を、構文解析木変換規則330内に記憶された変換規則を用いて、対応する日本語の構文解析木と同じ構造の構文解析木に変形するための木構造変換部382と、木構造変換部382により出力された変換後の構文解析木により規定される順番で英語の単語を並べ替えて名詞句用学習データ記憶部362に格納するための単語並べ替え部384とを含む。なお、この実施の形態では、翻訳前に原文(英語)の単語の並べ替えを行う事前並べ替えを採用しているが、これは一例であって、他の並べ替えの手法を用いることもできる。例えば、原文の単語の順序にしたがって単語の翻訳をした後、翻訳後の単語を目的言語の語順となるように並べ替えを行う、いわゆる事後並べ替えの手法を採用することもできる。
The noun phrase
動詞句事前並べ替え部360は、動詞句データ記憶部356に記憶された動詞句の各々について動詞句構文解析用モデル312を用いて構文解析を行ない、構文解析木を出力するための構文解析部400と、構文解析部400が出力する構文解析木を、構文解析木変換規則330内に記憶された変換規則を用いて、対応する日本語の構文解析木と同じ構造の構文解析木に変形するための木構造変換部402と、木構造変換部402により出力された変換後の構文解析木により規定される順番で英語の動詞句内の単語を並べ替えて動詞句用学習データ記憶部366に格納するための単語並べ替え部404とを含む。
The verb
本実施の形態では、動詞句構文解析用モデル312及び名詞句構文解析用モデル314はそれぞれ、英語の動詞句と英語の名詞句の構文解析を行なうように学習を行なったモデルである。これらの学習は、事前に図8に示すような構成の構文解析用モデル学習部442によって行なう。
In the present embodiment, the verb phrase
図8を参照して、構文解析用モデル学習部442は、大量の英語文書を記憶した原言語コーパス440から名詞句を抽出し、当該名詞句と、当該名詞句を分解して得られる様々な単語及び句(以下、これらをまとめて単に「名詞句」と呼ぶ)とを抽出するための名詞句抽出・分解部460と、名詞句抽出・分解部460により抽出された名詞句を記憶するための名詞句構文解析学習データ記憶部462と、名詞句構文解析学習データ記憶部462に記憶された名詞句の構文解析学習データを用いて名詞句構文解析用モデル314の学習を行なうための名詞句構文解析用モデル学習部464とを含む。名詞句構文解析用モデル314は統計的モデルであり、英語の名詞句が与えられると、その名詞句の構文解析木として最も尤度が高い構文解析木を出力するように学習を行なう。
Referring to FIG. 8, the parsing model learning unit 442 extracts a noun phrase from the
構文解析用モデル学習部442はさらに、原言語コーパス440から動詞句を抽出するための動詞句抽出部470と、動詞句抽出部470により抽出された動詞句を格納するための動詞句構文解析学習データ記憶部472と、動詞句構文解析学習データ記憶部472に記憶された動詞句の構文解析学習データを用いて動詞句構文解析用モデル312の学習を行なうための動詞句構文解析用モデル学習部474とを含む。動詞句構文解析用モデル312は統計的モデルであり、英語の動詞句が与えられると、その動詞句の構文解析木として最も尤度が高い構文解析木を出力するように学習を行なう。
The parsing model learning unit 442 further includes a verb
図9を参照して、図6に示すクレーム翻訳部328は、入力される構文解析後の英語クレーム334を受けて、パターン分類データ316を検索し、構文解析後の英語クレーム334と合致する英語パターンを持つパターン対を読み出すパターン検索部500と、パターン検索部500により読み出されたパターン対から、日本語パターンを取り出し、空の日本語パターンを生成する日本語パターン生成部504と、日本語パターン生成部504が生成した日本語パターンを記憶するための日本語パターン記憶部506とを含む。
Referring to FIG. 9, the
クレーム翻訳部328はさらに、英語パターンが付された構文解析後の英語クレーム334をパターン検索部500から受け、構文解析後の英語クレーム334を、英語パターンの構造にあわせて構造部品に分割して出力する入力文分割部502と、入力文分割部502が出力する構造部品を英語パターンの対応する部分と関連付けて記憶するための構造部品記憶部508と、構造部品記憶部508に記憶された構造部品を順番に読出し、読み出した構造部品が名詞句か動詞句かを英語パターンから特定して判定信号を出力する構造部品種別判定部510と、構造部品種別判定部510の出力する判定信号の値に応答して、動詞句構文解析用モデル312及び名詞句構文解析用モデル314のいずれかを選択するセレクタ512と、同じく構造部品種別判定部510の出力する判定信号の値に応答して、動詞句翻訳用モデル322及び名詞句翻訳用モデル320のいずれかを選択するセレクタ522と、構造部品種別判定部510により種別が判定された構造部品を構造部品記憶部508から読出し、セレクタ512の選択した構文解析用モデルを用いて構文解析を行ない、構文解析木を出力する構文解析部514とを含む。
The
クレーム翻訳部328はさらに、構文解析部514の出力する構文解析木を、構文解析木変換規則330に記憶された構文解析木変換規則にしたがって、対応する日本語の構文解析木に変換する構文解析木変換部518とを含む。
The
クレーム翻訳部328はさらに、構文解析木変換部518が出力した日本語の構文解析で各単語が現れる順番にしたがって、英語の単語を並べ替えた英語単語列を出力する単語並べ替え部520と、単語並べ替え部520が出力する英語単語列を受け、セレクタ522により選択された翻訳用モデル(対象の入力文が動詞句のときは動詞句翻訳用モデル322、名詞句のときは名詞句翻訳用モデル320)を用いて英語から日本語への統計的自動翻訳を行なう統計的自動翻訳機524と、統計的自動翻訳機524の出力する日本語文を、日本語パターン記憶部506の記憶する日本語パターンの、翻訳対象となっている構造部品に対応する領域に代入する日本語パターン代入部526とを含む。
The
<動作>
以上に構成を説明したクレーム翻訳システム300は以下のように動作する。クレーム翻訳システム300の動作は、大きく分けて3段階に別れる。第1段階は図6に示す動詞句構文解析用モデル312及び名詞句構文解析用モデル314の学習である。第2段階は、図6に示す名詞句翻訳用モデル320及び動詞句翻訳用モデル322の学習である。これら2つの処理が終了すると、第3段階として構文解析部332及びクレーム翻訳部328は英語クレーム324を日本語に翻訳して日本語クレーム326を出力可能になる。なお、これら処理に先立ち、パターン分類データ316及び構文解析木変換規則330は何らかの手段で予め準備されているものとする。以下、これらについて順番に説明する。
<Operation>
The
<第1段階:構文解析用モデルの学習>
図8を参照して、予め英語の原言語コーパス440が準備される。原言語コーパス440に記憶された各文に対しては、予め形態素解析及び構文解析が行なわれ、構文解析木の情報が付されている。
<Stage 1: Learning a model for parsing>
Referring to FIG. 8, an English
名詞句抽出・分解部460は、原言語コーパス440から、名詞句と、その名詞句に含まれる単語と、その名詞句の構文構造を示す部分解析木を抽出し、名詞句構文解析学習データ記憶部462に蓄積する。名詞句構文解析用モデル学習部464は、名詞句構文解析学習データ記憶部462に蓄積された情報を読出し、名詞句構文解析用モデル314の学習を行なう。この学習の結果、名詞句構文解析用モデル314は、英語の名詞句が与えられたときに、その構文解析木として最も尤度の高いものを出力するような計算に利用できるようになる。
The noun phrase extraction /
一方、動詞句抽出部470は、原言語コーパス440から、動詞句と、その動詞句の構文構造を示す部分解析木を抽出し、動詞句構文解析学習データ記憶部472に蓄積する。動詞句構文解析用モデル学習部474は、動詞句構文解析学習データ記憶部472に蓄積された動詞句を読出し、動詞句構文解析用モデル312の学習を行なう。この学習の結果、動詞句構文解析用モデル312は、英語の動詞句が与えられたときに、その構文解析木として最も尤度の高いものを出力するような計算に利用できるようになる。
On the other hand, the verb
<第2段階:翻訳用モデルの学習>
図7を参照して、パターン分類部350は、クレーム対訳コーパス310からクレームの日英対訳を読出し、パターン分類データ316に含まれるパターンと照合することにより、英語クレームのパターンを特定する。パターン分類部350は、特定した英語のパターンをパターン分類データ316から読み出す。パターン分類部350は、英語クレームを英語パターンにしたがって構造部品に分割しその英語パターンの各構造部品のテキスト領域に代入する。構造部品分類部352は、テキストが代入された英語パターンの各構造部品について、それが名詞句なら名詞句データ記憶部354に、動詞句なら動詞句データ記憶部356に、それぞれ蓄積する。クレーム対訳コーパス310に記憶された全てのクレーム対訳についてこの処理が終了すれば、又はこの処理と並行して、名詞句事前並べ替え部358及び動詞句事前並べ替え部360が動作できる。
<Second stage: Learning translation model>
With reference to FIG. 7, the
名詞句事前並べ替え部358の構文解析部380は、名詞句データ記憶部354に蓄積された名詞句データを順番に読み出す。構文解析部380は、読出した名詞句に対し、名詞句構文解析用モデル314を利用して構文解析することにより、構文解析木を木構造変換部382に出力する。木構造変換部382は、構文解析木が与えられると、構文解析木変換規則330に格納された木構造変換規則のいずれかを用いて英語クレームの名詞句の構文解析木を対応の日本語の構文解析木の構造に変換し、単語並べ替え部384に与える。単語並べ替え部384は、この日本語の構文解析木により定まる順番で、英語の単語を並べ替えて名詞句用学習データ記憶部362に蓄積する。名詞句用モデル学習部364は、このようにして名詞句用学習データ記憶部362に蓄積された名詞句用学習データを用いて名詞句翻訳用モデル320の学習を行なう。
The
動詞句事前並べ替え部360の構文解析部400は、動詞句データ記憶部356に蓄積された動詞句データを順番に読み出す。構文解析部400は、読出した動詞句を、動詞句構文解析用モデル312を利用して構文解析することにより、構文解析木を木構造変換部402に出力する。木構造変換部402は、構文解析木が与えられると、構文解析木変換規則330に格納された木構造変換規則のいずれかを用いて英語クレームの動詞句の構文解析木を対応の日本語の構文解析木の構造に変換し、単語並べ替え部404に与える。単語並べ替え部404は、この日本語の構文解析木により定まる順番で、英語の単語を並べ替えて動詞句用学習データ記憶部366に蓄積する。動詞句用モデル学習部368は、このようにして動詞句用学習データ記憶部366に蓄積された動詞句用学習データを用いて動詞句翻訳用モデル322の学習を行なう。
The
以上のようにして、クレーム対訳コーパス310に保存されたクレーム対訳の全てについての処理が終了すると、名詞句翻訳用モデル320及び動詞句翻訳用モデル322を利用して名詞句及び動詞句の英日の翻訳を行なうことが可能になる。
As described above, when the processing for all of the claim parallel translations stored in the claim
<第3段階:クレームの翻訳>
クレームの翻訳時、クレーム翻訳部328は以下のように動作する。クレーム翻訳部328の処理に先立ち、図6に示す構文解析部332により英語クレーム324に対する構文解析が行われる。その結果、構文解析後の英語クレーム334がクレーム翻訳部328に入力される。
<Stage 3: Claim translation>
When translating a claim, the
図9を参照して、構文解析後の英語クレーム334がクレーム翻訳部328に与えられると、パターン検索部500がパターン分類データ316に記憶されているパターンと構文解析後の英語クレーム334とを照合し、一致する英語パターンを検索する。パターン検索部500は、構文解析後の英語クレーム334の英語と最もよく一致する英語パターンを、対応の日本語パターンとともにパターン分類データ316から読出し、日本語パターンを日本語パターン生成部504に、英語パターンと構文解析後の英語クレーム334とを入力文分割部502に、それぞれ与える。
Referring to FIG. 9, when an
日本語パターン生成部504は、与えられた日本語パターンに基づいて、日本語パターン記憶部506に日本語パターンのテキストの記憶領域を、その日本語パターンの構造部品ごとに作成する。これら各領域はこの時点では空である。
Based on the given Japanese pattern, the Japanese
入力文分割部502は、構文解析後の英語クレーム334をパターン分類データ316から読出された英語パターンにしたがって分割し、各構造部品のテキストの記憶領域に代入して構造部品記憶部508に格納する。構造部品種別判定部510は、構造部品記憶部508にこれら構造部品が格納されると、そのうちの一つを読出し、その構造部品が名詞句か動詞句かを判定して判定信号をセレクタ512及びセレクタ522に与える。この判定信号に応答して、セレクタ512は、構造部品が動詞句である場合には動詞句構文解析用モデル312を、名詞句である場合には名詞句構文解析用モデル314を、それぞれ選択して構文解析部514に接続する。セレクタ522は、構造部品が動詞句である場合には動詞句翻訳用モデル322を、名詞句である場合には名詞句翻訳用モデル320を、それぞれ選択して統計的自動翻訳機524に接続する。
The input
構文解析部514は、構造部品種別判定部510から構造部品を受けとり、セレクタ512を介して接続された動詞句構文解析用モデル312又は名詞句構文解析用モデル314を使用して構造部品の構文解析を行なう。この結果、構文解析木が構文解析部514から構文解析木変換部518に与えられる。構文解析部514は、この構文解析において、対象となる構造部品が名詞句であれば名詞句構文解析用モデル314を使用して、動詞句であれば動詞句構文解析用モデル312を使用して、それぞれ対象となる構造部品の構文解析を行なう。動詞句構文解析用モデル312は動詞句を学習データとして図8で示した構文解析用モデル学習部442で学習したものであり、名詞句構文解析用モデル314は名詞句を学習データとして構文解析用モデル学習部442で学習したものである。したがって、名詞句構文解析用モデル314が行なう構文解析は構造部品の種別に応じた最適なものとなる。
The
構文解析木変換部518は、構文解析部514から構文解析木を受け取ると、構文解析木変換規則330を参照し、変換規則の中で、構文解析部514から受け取った構文解析木に対する構文解析規則として最もふさわしいものを選択する。構文解析木変換部518は、選択された変換規則を用いて、構文解析部514から与えられた構文解析木を、その構文解析木により表される英語に対し、その訳文となるべき日本語の構文構造を示す構文解析木に変換する。この変換後の構文解析木において、木の構造は日本語文の構造であるが、各リーフに割り当てられている語は英語の単語である。構文解析木変換部518は、変換後の構文解析木を単語並べ替え部520に与える。
When the syntax analysis
単語並べ替え部520は、構文解析木変換部518から与えられた変換後の構文解析木を用い、その構文解析木に出現する英単語を、構文解析木の構造によって定まる順番に並べ替え、得られた英単語列を統計的自動翻訳機524に入力として与える。
The
統計的自動翻訳機524は、この英単語列に対し、セレクタ522により接続される翻訳用モデルを用いた英語から日本語への統計的翻訳を行なって、その結果得られた日本語の単語列を日本語パターン代入部526に与える。このとき使用される翻訳用モデルは、翻訳対象の構造部品が動詞句のときには動詞句翻訳用モデル322であり、名詞句である場合には名詞句翻訳用モデル320である。したがって、各構造部品の英日翻訳は、名詞句は名詞句として、動詞句は動詞句として、正しく翻訳される可能性が高くなる。
The statistical
日本語パターン代入部526は、統計的自動翻訳機524が出力する日本語の単語列について、もとの英語の構造部品と日本語パターンの構造部品との対応情報を用いて、日本語パターン記憶部506に記憶されている日本語パターンの、該当する構造部品のテキスト記憶領域に翻訳結果を代入する。
The Japanese
以上の処理が、構造部品記憶部508に記憶された全ての構造部品に対して行なわれると、日本語パターン記憶部506に記憶された日本語パターンの各構造部品には、対応する英語の構造部品を日本語に訳した単語列が格納されることになる。これらの翻訳結果は、もとの英語の構造部品が動詞句であれば動詞句に最適化された動詞句翻訳用モデル322を用いて行なわれ、名詞句であれば名詞句に最適化された名詞句翻訳用モデル320を用いて行なわれたものである。したがって、日本語のクレームを構成する個々の構造部品は、もとの英語の構造部品について、その種別を反映した的確なものとなることが期待される。また、日本語パターン記憶部506の構造部品は、日本語のクレームにおける各構造部品の出現順序にしたがって配列されている。したがって、日本語パターン記憶部506に記憶された各構造部品を先頭から順番に読み出して適切に表示することにより、英語クレーム324に対する正確な翻訳である日本語クレーム326を得ることができる。
When the above processing is performed on all the structural parts stored in the structural
[第2の実施の形態]
上記第1の実施の形態では、図7に示す構造部品翻訳用モデル学習部318による翻訳用モデルの学習において、名詞句事前並べ替え部358及び動詞句事前並べ替え部360による、名詞句と動詞句の事前並べ替えを行なっている。また、図9に示すクレーム翻訳部328による英語クレームの翻訳時にも、構文解析部514、構文解析木変換部518及び単語並べ替え部520による単語の事前並べ替えを行なっている。このように、学習時及び翻訳時に単語の事前並べ替えを行なう事により、学習の効率が高くなり、かつ翻訳の精度も高くなる。したがって、このように単語並べ替えを行なうことが望ましい。しかし、本発明はそのような実施の形態には限定されない。英語パターンの構造部品の文法的特性(動詞句か名詞句か、というような種別)に応じて別々の翻訳用モデルの学習を予め行ない、翻訳時には翻訳対象の構造部品の文法的特性に応じて適切な翻訳用モデルを用いて自動翻訳を行なうようなものであれば、どのようなものでもよい。第2の実施の形態は、事前並べ替えを省略したものである。
[Second Embodiment]
In the first embodiment, in the translation model learning by the structural part translation
図10にこの第2の実施の形態に係るクレーム翻訳システム550の全体構成をブロック図形式で示す。このクレーム翻訳システム550が図6に示すクレーム翻訳システム300と異なるのは、動詞句構文解析用モデル312、名詞句構文解析用モデル314、及び構文解析木変換規則330を使用しない点、及び、図6の構造部品翻訳用モデル学習部318及びクレーム翻訳部328に替えて、いずれも事前並べ替えを用いない構造部品翻訳用モデル学習部570及びクレーム翻訳部572をそれぞれ含むことである。なお、動詞句構文解析用モデル312及び名詞句構文解析用モデル314は、第1の実施の形態と同様、構文解析部332による構文解析において使用される。
FIG. 10 is a block diagram showing the overall configuration of the
図11に、この構造部品翻訳用モデル学習部570の概略ブロック図を示す。構造部品翻訳用モデル学習部570が図7に示す構造部品翻訳用モデル学習部318と異なるのは、名詞句データ記憶部354、動詞句データ記憶部356、事前並べ替えのための名詞句事前並べ替え部358及び動詞句事前並べ替え部360を含まず、構造部品分類部352から出力される名詞句が直接に名詞句用学習データ記憶部362に蓄積され、動詞句が直接に動詞句用学習データ記憶部366に蓄積される点である。他の点では構造部品翻訳用モデル学習部570の各部は構造部品翻訳用モデル学習部318の対応部分と同様である。
FIG. 11 shows a schematic block diagram of the structural part translation
図12に、図10に示すクレーム翻訳部572の概略ブロック図を示す。クレーム翻訳部572は、図9と比較して、事前並べ替えに必要なセレクタ512、構文解析部514、構文解析木変換規則330,構文解析木変換部518及び単語並べ替え部520を含まず、構造部品記憶部508の出力が統計的自動翻訳機524に直接与えられる点で図9のクレーム翻訳部328と異なっている。その他の点ではクレーム翻訳部572の各部はクレーム翻訳部328の各部と同じ構成である。
FIG. 12 shows a schematic block diagram of the
この第2の実施の形態では、翻訳用モデルの学習時にも、翻訳時にも事前並べ替えが行なわれない点で第1の実施の形態と異なっている。このような構成でもクレームの翻訳は従来のものよりも高精度に行なうことができる。特に、2つの言語の語順が比較的近いような言語間の翻訳では、事前並べ替えを用いなくても十分に翻訳精度の向上を見込むことができる。 This second embodiment is different from the first embodiment in that pre-sorting is not performed during learning of a translation model or during translation. Even with such a configuration, the translation of the claims can be performed with higher accuracy than the conventional one. In particular, in the translation between languages in which the word order of the two languages is relatively close, it is possible to expect a sufficient improvement in translation accuracy without using pre-ordering.
<変形例>
上記第1の実施の形態では事前並べ替えを使用し、第2の実施の形態では事前並べ替えを使用していない。本発明はそのような実施の形態のみに限定して適用可能ではなく、たとえば、事前並べ替えを行なうか否かを選択可能にしてもよい。このようにすることで、対象となる言語によって事前並べ替えを行なう翻訳と行なわない翻訳との双方が可能になる。
<Modification>
In the first embodiment, pre-ordering is used, and in the second embodiment, pre-ordering is not used. The present invention is not limited to such an embodiment, and for example, it may be possible to select whether or not to perform rearrangement. By doing in this way, it becomes possible to perform both translation with pre-sorting and translation without translation according to the target language.
また上記実施の形態では、翻訳用モデルとして動詞句翻訳用のモデルと名詞句翻訳用のモデルとを用いている。しかし本発明はそのような実施の形態には限定されず、それ以外のモデル、例えば副詞句翻訳用のモデルを用いることもできる。 In the above embodiment, a verb phrase translation model and a noun phrase translation model are used as translation models. However, the present invention is not limited to such an embodiment, and other models such as an adverb phrase translation model may be used.
[コンピュータによる実現]
上記第1の実施の形態に係るクレーム翻訳システム300、第2の実施の形態に係るクレーム翻訳システム550、及びその他の変形例は、コンピュータハードウェアと、そのコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現できる。図13はこのコンピュータシステム930の外観を示し、図14はコンピュータシステム930の内部構成を示す。
[Realization by computer]
The
図13を参照して、このコンピュータシステム930は、メモリポート952及びDVD(Digital Versatile Disc)ドライブ950を有するコンピュータ940と、キーボード946と、マウス948と、モニタ942とを含む。
Referring to FIG. 13, the
図14を参照して、コンピュータ940は、メモリポート952及びDVDドライブ950に加えて、CPU(中央処理装置)956と、CPU956、メモリポート952及びDVDドライブ950に接続されたバス966と、ブートプログラム等を記憶する読出専用メモリ(ROM)958と、バス966に接続され、プログラム命令、システムプログラム及び作業データ等を記憶するランダムアクセスメモリ(RAM)960と、ハードディスク954を含む。コンピュータシステム930はさらに、他端末との通信を可能とするネットワーク968への接続を提供するネットワークインターフェイス(I/F)944を含む。
Referring to FIG. 14, in addition to
コンピュータシステム930を上記した実施の形態に係るクレーム翻訳システム300及びクレーム翻訳システム550の各機能部として機能させるためのコンピュータプログラムは、DVDドライブ950又はメモリポート952に装着されるDVD962又はリムーバブルメモリ964に記憶され、さらにハードディスク954に転送される。又は、プログラムはネットワーク968を通じてコンピュータ940に送信されハードディスク954に記憶されてもよい。プログラムは実行の際にRAM960にロードされる。DVD962から、リムーバブルメモリ964から又はネットワーク968を介して、直接にRAM960にプログラムをロードしてもよい。
A computer program for causing the
このプログラムは、コンピュータ940を、上記実施の形態に係るクレーム翻訳システム300及びクレーム翻訳システム550の各機能部として機能させるための複数の命令からなる命令列を含む。コンピュータ940にこの動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ940上で動作するオペレーティングシステム若しくはサードパーティのプログラム又はコンピュータ940にインストールされる、ダイナミックリンク可能な各種プログラミングツールキット又はプログラムライブラリにより提供される。したがって、このプログラム自体はこの実施の形態のシステム及び方法を実現するのに必要な機能を実現するためのオブジェクトコードの全てを必ずしも含まなくてよい。このプログラムは、命令の内、所望の結果が得られるように制御されたやり方で適切な機能又はプログラミングツールキット又はプログラムライブラリ内の適切なプログラムを実行時に動的に呼出すことにより、上記したシステムとしての機能を実現する命令のみを含んでいればよい。もちろん、プログラムのみで必要な機能を全て提供するようにしてもよい。
This program includes an instruction sequence including a plurality of instructions for causing the
また、クレーム翻訳システム300及びクレーム翻訳システム550の各機能部を別々のコンピュータに分散して処理したり、ネットワークを介して別々の地域に存在する別々のコンピュータで分散して処理したりするようにしてもよい。
In addition, the functional units of the
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。 The embodiment disclosed herein is merely an example, and the present invention is not limited to the above-described embodiment. The scope of the present invention is indicated by each claim of the claims after taking into account the description of the detailed description of the invention, and all modifications within the meaning and scope equivalent to the wording described therein are included. Including.
300、550 クレーム翻訳システム
310 クレーム対訳コーパス
312 動詞句構文解析用モデル
314 名詞句構文解析用モデル
316 パターン分類データ
318、570 構造部品翻訳用モデル学習部
320 名詞句翻訳用モデル
322 動詞句翻訳用モデル
328、572 クレーム翻訳部
330 構文解析木変換規則
358 名詞句事前並べ替え部
360 動詞句事前並べ替え部
442 構文解析用モデル学習部
524 統計的自動翻訳機
300, 550
Claims (6)
前記第1の言語の文のパターンを特定し、前記第1の言語の文を構造部品に分割する分割手段と、
前記分割手段により特定された前記第1の言語の文のパターンと予め対応付けられた、前記第2の言語の文のパターンを特定するパターン特定手段と、
前記分割手段により分割された前記第1の言語の文のパターンと、前記パターン特定手段により特定された前記第2の言語のパターンとの間で、構造部品の対応関係及び各構造部品の文法特性を特定する対応特定手段と、
前記第1の言語の構造部品の各々について、当該構造部品を構成する単語列に対し、前記第1の言語から前記第2の言語への翻訳用のモデルを使用した自動翻訳を行なって、前記第2の言語の翻訳を生成する翻訳手段と、
前記第1の言語の構造部品の各々について、前記翻訳手段によって得られた前記第2の言語の翻訳を、前記対応特定手段により特定された、構造部品の前記対応関係にしたがって、前記パターン特定手段により特定された前記第2の言語の文のパターンの構造部品のいずれかに代入することにより、前記第1の言語の文の翻訳である前記第2の言語の文を生成する代入手段とを含む、自動翻訳装置。 An automatic translation device that translates a sentence in a first language into a sentence in a second language different from the first language,
A dividing unit that identifies a sentence pattern of the first language and divides the sentence of the first language into structural parts;
Pattern specifying means for specifying a pattern of the sentence in the second language, which is associated in advance with the pattern of the sentence in the first language specified by the dividing means;
Between the sentence pattern of the first language divided by the dividing means and the pattern of the second language specified by the pattern specifying means, the correspondence between the structural parts and the grammatical characteristics of each structural part A correspondence identifying means for identifying
For each of the structural parts of the first language, automatic translation using a model for translation from the first language to the second language is performed on a word string constituting the structural part, A translation means for generating a second language translation;
For each of the structural parts in the first language, the pattern specifying means determines the translation in the second language obtained by the translation means in accordance with the correspondence relationship of the structural parts specified by the correspondence specifying means. Substituting means for generating a sentence of the second language, which is a translation of the sentence of the first language, by substituting into any of the structural components of the pattern of the sentence of the second language specified by Including automatic translation device.
前記第1の言語の構造部品の各々について、当該構造部品の文法特特性に応じた構文解析を行なって前記第1の言語の構文解析木を生成する構文解析手段と、
前記構文解析手段により生成された前記第1の言語の構文解析木を、予め準備された変換規則にしたがって、前記第2の言語の構文解析木に変換する変換手段と、
前記変換手段による変換で得られた前記第2の言語の構文解析木における単語の出現順序にしたがって、前記第1の言語の構造部品の単語を並べ替えて出力する並べ替え手段とを含む、請求項2に記載の自動翻訳装置。 The word rearranging means is:
A syntax analysis means for generating a syntax analysis tree of the first language by performing syntax analysis according to a grammatical characteristic of the structure component for each of the structural components of the first language;
Conversion means for converting the parse tree of the first language generated by the parse analysis means into the parse tree of the second language according to a conversion rule prepared in advance;
Rearrangement means for rearranging and outputting the words of the structural parts of the first language according to the appearance order of the words in the parsing tree of the second language obtained by the conversion by the conversion means. Item 3. The automatic translation device according to Item 2.
前記第1の言語の文に含まれる、予め定められた区切りパターンにより、前記第1の言語の文を複数個の構造部品に分割する分割手段と、
前記分割手段により分割された各構造部品の文法特性を判定する文法特性判定手段と、
前記分割手段により分割された前記構造部品の出現順序及び各構造部品について前記文法特性判定手段により判定された文法特性とによって、前記第1の言語の文パターンを特定する手段とを含む、請求項1〜請求項4のいずれかに記載の自動翻訳装置。 The pattern specifying means includes
Dividing means for dividing the sentence in the first language into a plurality of structural parts according to a predetermined delimiter pattern included in the sentence in the first language;
A grammatical characteristic determining means for determining a grammatical characteristic of each structural part divided by the dividing means;
Means for specifying a sentence pattern of the first language according to the appearance order of the structural parts divided by the dividing means and the grammatical characteristics determined by the grammatical characteristic determining means for each structural part. The automatic translation apparatus in any one of Claims 1-4.
前記第1の言語の前記特定の文法特性の文と、当該文の、前記第1の言語と異なる第2の言語の訳文とからなる対訳を複数個収集するための収集手段と、
前記収集手段により収集された前記複数の対訳を学習データとして、前記第1の言語の前記特定の文法特性の文から前記第2の言語の文への統計的翻訳を行なうために必要な統計的モデルの学習を行なうための統計的学習手段とを含む、翻訳用モデル学習装置。
Translation model learning apparatus for learning a translation model used when a sentence having a specific grammatical characteristic of a first language is translated into a sentence of a second language different from the first language by statistical translation Because
A collecting means for collecting a plurality of parallel translations of the sentence having the specific grammatical characteristic of the first language and a translation of the sentence in a second language different from the first language;
Statistical data necessary for statistical translation from the sentence of the specific grammatical characteristic of the first language to the sentence of the second language using the plurality of parallel translations collected by the collecting means as learning data A model learning device for translation, including statistical learning means for learning a model.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015044418A JP6952967B2 (en) | 2015-03-06 | 2015-03-06 | Automatic translator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015044418A JP6952967B2 (en) | 2015-03-06 | 2015-03-06 | Automatic translator |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016164707A true JP2016164707A (en) | 2016-09-08 |
JP6952967B2 JP6952967B2 (en) | 2021-10-27 |
Family
ID=56876587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015044418A Active JP6952967B2 (en) | 2015-03-06 | 2015-03-06 | Automatic translator |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6952967B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017199363A (en) * | 2016-04-21 | 2017-11-02 | 国立研究開発法人情報通信研究機構 | Machine translation device and computer program for machine translation |
JP2018190287A (en) * | 2017-05-10 | 2018-11-29 | 日本特許翻訳株式会社 | Machine translation device and program |
CN109829173A (en) * | 2019-01-21 | 2019-05-31 | 中国测绘科学研究院 | A kind of English place name interpretation method and device |
KR102075555B1 (en) * | 2016-12-05 | 2020-02-10 | 인티그럴 서치 인터내셔널 리미티드 | Computer automatically claim-translating device |
JP2020095653A (en) * | 2018-12-04 | 2020-06-18 | 株式会社野村総合研究所 | Creation support device and creation support method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038643A1 (en) * | 2003-07-02 | 2005-02-17 | Philipp Koehn | Statistical noun phrase translation |
JP2011175500A (en) * | 2010-02-25 | 2011-09-08 | Nippon Telegr & Teleph Corp <Ntt> | Word order conversion device, machine-translating statistical model creation device, machine translation device, word order conversion method, machine-translating statistical model creation method, machine translation method and program |
JP2012185654A (en) * | 2011-03-04 | 2012-09-27 | Fujitsu Ltd | Translation apparatus, translation program, and translation method |
JP2014170296A (en) * | 2013-03-01 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | Word order rearranging device, translation device, translation model learning device, method, and program |
-
2015
- 2015-03-06 JP JP2015044418A patent/JP6952967B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050038643A1 (en) * | 2003-07-02 | 2005-02-17 | Philipp Koehn | Statistical noun phrase translation |
JP2011175500A (en) * | 2010-02-25 | 2011-09-08 | Nippon Telegr & Teleph Corp <Ntt> | Word order conversion device, machine-translating statistical model creation device, machine translation device, word order conversion method, machine-translating statistical model creation method, machine translation method and program |
JP2012185654A (en) * | 2011-03-04 | 2012-09-27 | Fujitsu Ltd | Translation apparatus, translation program, and translation method |
JP2014170296A (en) * | 2013-03-01 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | Word order rearranging device, translation device, translation model learning device, method, and program |
Non-Patent Citations (3)
Title |
---|
富士 秀 外3名: "中日・英日翻訳への定型利用翻訳技術の適用", 言語処理学会第20回年次大会 発表論文集, JPN6018048835, 10 March 2014 (2014-03-10), JP, pages 380 - 383 * |
星野 翔 外3名: "日英統計的機械翻訳のための述語項構造に基づく事前並べ替え", 言語処理学会第19回年次大会 発表論文集 [ONLINE], JPN6018048833, 4 March 2013 (2013-03-04), JP, pages 394 - 397 * |
金内 哲也 外1名: "構成要素の統語・意味的制約と用例を利用した「の/と型」名詞句構造解析法", 第58回(平成11年前期)全国大会講演論文集(2) 人工知能と認知科学, JPN6018048836, 9 March 1999 (1999-03-09), JP, pages pp.2-61〜2-62 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017199363A (en) * | 2016-04-21 | 2017-11-02 | 国立研究開発法人情報通信研究機構 | Machine translation device and computer program for machine translation |
KR102075555B1 (en) * | 2016-12-05 | 2020-02-10 | 인티그럴 서치 인터내셔널 리미티드 | Computer automatically claim-translating device |
JP2018190287A (en) * | 2017-05-10 | 2018-11-29 | 日本特許翻訳株式会社 | Machine translation device and program |
JP2020095653A (en) * | 2018-12-04 | 2020-06-18 | 株式会社野村総合研究所 | Creation support device and creation support method |
JP7421859B2 (en) | 2018-12-04 | 2024-01-25 | 株式会社野村総合研究所 | Creation support device and creation support method |
JP7496205B2 (en) | 2018-12-04 | 2024-06-06 | 株式会社野村総合研究所 | Creation support device and program |
CN109829173A (en) * | 2019-01-21 | 2019-05-31 | 中国测绘科学研究院 | A kind of English place name interpretation method and device |
CN109829173B (en) * | 2019-01-21 | 2023-09-29 | 中国测绘科学研究院 | English place name translation method and device |
Also Published As
Publication number | Publication date |
---|---|
JP6952967B2 (en) | 2021-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11250842B2 (en) | Multi-dimensional parsing method and system for natural language processing | |
Karimi et al. | Machine transliteration survey | |
US7707026B2 (en) | Multilingual translation memory, translation method, and translation program | |
US8959011B2 (en) | Indicating and correcting errors in machine translation systems | |
KR101762866B1 (en) | Statistical translation apparatus by separating syntactic translation model from lexical translation model and statistical translation method | |
KR100530154B1 (en) | Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system | |
KR20170106308A (en) | Annotation assistance device and computer program therefor | |
WO2003083707A2 (en) | Machine translation | |
JP6952967B2 (en) | Automatic translator | |
JP2017199363A (en) | Machine translation device and computer program for machine translation | |
Brierley et al. | Open-Source Boundary-Annotated Corpus for Arabic Speech and Language Processing. | |
Wax | Automated grammar engineering for verbal morphology | |
CN106372053B (en) | Syntactic analysis method and device | |
CN111831624A (en) | Data table creating method and device, computer equipment and storage medium | |
Mahata et al. | Simplification of English and Bengali sentences for improving quality of machine translation | |
KR101709693B1 (en) | Method for Web toon Language Automatic Translating Using Crowd Sourcing | |
CN101520778A (en) | Apparatus and method for determing parts-of-speech in chinese | |
Anju et al. | Malayalam to English machine translation: An EBMT system | |
JP2018072979A (en) | Parallel translation sentence extraction device, parallel translation sentence extraction method and program | |
Rikters | Hybrid machine translation by combining output from multiple machine translation systems | |
Devi et al. | Steps of pre-processing for english to mizo smt system | |
Rikters et al. | Combining machine translated sentence chunks from multiple MT systems | |
JP2005202924A (en) | Translation determination system, method, and program | |
JP7227705B2 (en) | Natural language processing device, search device, natural language processing method, search method and program | |
Declerck et al. | Cross-linking Austrian dialectal Dictionaries through formalized Meanings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191025 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200706 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20200706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200706 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200804 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200818 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20201002 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20201006 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210309 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210406 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20210420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210608 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20210720 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20210824 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6952967 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |