JP2014199476A - Machine translation device, machine translation method and program - Google Patents

Machine translation device, machine translation method and program Download PDF

Info

Publication number
JP2014199476A
JP2014199476A JP2013073666A JP2013073666A JP2014199476A JP 2014199476 A JP2014199476 A JP 2014199476A JP 2013073666 A JP2013073666 A JP 2013073666A JP 2013073666 A JP2013073666 A JP 2013073666A JP 2014199476 A JP2014199476 A JP 2014199476A
Authority
JP
Japan
Prior art keywords
sentence
component
unit
translation
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013073666A
Other languages
Japanese (ja)
Other versions
JP6114090B2 (en
Inventor
裕貴 鈴木
Yuki Suzuki
裕貴 鈴木
一也 小西
Kazuya Konishi
一也 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2013073666A priority Critical patent/JP6114090B2/en
Publication of JP2014199476A publication Critical patent/JP2014199476A/en
Application granted granted Critical
Publication of JP6114090B2 publication Critical patent/JP6114090B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a machine translation device or the like configured to facilitate recognizing content of claim described in a foreign language.SOLUTION: A server 30 comprises: a morphological analysis unit 301 which morphologically analyzes an original sentence described in a claim; a component unit division unit 302 which detects a separation pattern used for separating a component of an invention from the claim, and divides the claim by component; a component name specifying unit 303 which extracts a component name on the basis of a result of morphological analysis from the component, to specify the component name; a description pattern sentence unit division unit 304 which divides the component by description pattern sentence when a description pattern sentence for describing the component appears in the component; a translation unit 305 which translates the original sentence of the claim; and an output unit 307 which outputs a translation result to a communication terminal 10.

Description

本発明は、請求項に記載された文章の機械翻訳を行うための翻訳装置等に関する。   The present invention relates to a translation device for performing machine translation of a sentence described in claims.

近年、各国で出願された特許文献を検索することによって技術調査を行う機会が増えている。このため、機械翻訳に対する期待が非常に高まってきている。例えば公知の翻訳装置は、翻訳対象となる文章を分割することにより翻訳が正確に行えるようにしている(特許文献1)。   In recent years, there have been increasing opportunities to conduct technical research by searching patent documents filed in various countries. For this reason, the expectation for machine translation has increased greatly. For example, a known translation apparatus can accurately translate by dividing a sentence to be translated (Patent Document 1).

特開2004−110583号公報JP 2004-110583 A

上記のように、文章を分割して翻訳を行う翻訳装置は存在したものの、外国特許文献に記載される請求項の内容の理解を促進する翻訳装置は存在せず、かかる翻訳装置が望まれていた。   As described above, although there exists a translation device that divides a sentence and translates it, there is no translation device that facilitates understanding of the contents of claims described in foreign patent documents, and such a translation device is desired. It was.

本発明は、上述した状況においてなされたものであり、外国語で記載された請求項の内容の理解を促進することを可能にする機械翻訳装置、機械翻訳方法およびプログラムを提供することにある。   The present invention has been made in the above-described situation, and provides a machine translation device, a machine translation method, and a program that can facilitate understanding of the contents of claims described in a foreign language.

上記の課題を解決するための機械翻訳装置は、通信端末から、第1言語により記述された請求項の翻訳要求を受け付けた場合、前記請求項に前記第1言語で記載されている原文の形態素解析を行う形態素解析部と、前記形態素解析の結果に基づいて、前記請求項の中から発明の構成要素を区切るために使用されている区切りパターンを検出し、前記構成要素ごとに前記請求項を分割する構成要素単位分割部と、前記構成要素の中から前記形態素解析の結果に基づいて構成要素名を抽出し、前記構成要素名を特定する構成要素名特定部と、前記構成要素内に、当該構成要素を説明するための説明パターン文が出現する場合は、前記説明パターン文ごとに前記構成要素を分割する説明パターン文単位分割部と、前記特定された構成要素名を含み、かつ前記分割を有する前記請求項を第2言語に翻訳する翻訳部と、前記請求項の翻訳文を記憶する記憶部と、前記記憶部の前記翻訳文を前記通信端末に出力する出力部とを含む。   When a machine translation apparatus for solving the above-described problems receives a request for translation of a claim described in a first language from a communication terminal, the morpheme of the original text described in the first language in the claim Based on the result of the morpheme analysis and the morpheme analysis unit that performs analysis, a delimiter pattern used to delimit the constituent elements of the invention is detected from the claims, and the claim is determined for each of the constituent elements. In the component, a component unit dividing unit to be divided, a component name is extracted from the component based on the result of the morpheme analysis, a component name specifying unit that specifies the component name, and the component, When an explanation pattern sentence for explaining the constituent element appears, an explanation pattern sentence division unit that divides the constituent element for each explanation pattern sentence, and the specified constituent element name, A translation unit that translates the claim having the division into a second language, a storage unit that stores the translation of the claim, and an output unit that outputs the translation of the storage unit to the communication terminal. Including.

上記の課題を解決するための機械翻訳方法は、通信端末から、第1言語により記述された請求項の翻訳要求を受け付けた場合、前記請求項に前記第1言語で記載されている原文の形態素解析を行うステップと、前記形態素解析の結果に基づいて、前記請求項の中から発明の構成要素を区切るために使用されている区切りパターンを検出し、前記構成要素ごとに前記請求項を分割するステップと、前記構成要素の中から前記形態素解析の結果に基づいて構成要素名を抽出し、前記構成要素名を特定するステップと、前記構成要素内に、当該構成要素を説明するための説明パターン文が出現する場合は、前記説明パターン文ごとに前記構成要素を分割するステップと、前記特定された構成要素名を含み、かつ前記分割を有する前記請求項を第2言語に翻訳するステップと、前記翻訳の結果を前記通信端末に出力するステップとを含む。   When the machine translation method for solving the above-described problem receives a request for translation of a claim described in a first language from a communication terminal, the morpheme of the original text described in the first language in the claim Based on the result of the analysis and the result of the morphological analysis, a delimiter pattern used for delimiting the constituent elements of the invention is detected from the claims, and the claims are divided for each constituent element A step of extracting a constituent element name from the constituent elements based on the result of the morphological analysis, specifying the constituent element name, and an explanation pattern for explaining the constituent element in the constituent element If a sentence appears, the step of dividing the constituent element for each of the explanation pattern sentences; and the claim including the specified constituent element name and having the division To include a step of translating, and outputting the result of said translation in said communication terminal.

上記の課題を解決するためのプログラムは、上記機械翻訳方法をコンピュータに実行させるためのものである。   A program for solving the above problem is for causing a computer to execute the machine translation method.

本発明によれば、外国語で記載された請求項の内容の理解を促進する機械翻訳を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the machine translation which promotes the understanding of the content of the claim described in the foreign language can be provided.

本発明の実施形態の翻訳システムの概要構成例を示す図である。It is a figure which shows the example of a schematic structure of the translation system of embodiment of this invention. 第1実施形態のサーバの構成例を示す図である。It is a figure which shows the structural example of the server of 1st Embodiment. 第1実施形態の通信端末の構成例を示す図である。It is a figure which shows the structural example of the communication terminal of 1st Embodiment. 第1実施形態の翻訳システムによって実現される翻訳処理の概略を説明するための図である。It is a figure for demonstrating the outline of the translation process implement | achieved by the translation system of 1st Embodiment. サーバの機能構成例を示す図である。It is a figure which shows the function structural example of a server. 区切りパターンの例、構成要素名の抽出例および説明パターン文の例を説明するための図である。It is a figure for demonstrating the example of a division | segmentation pattern, the extraction example of a component element name, and the example of an explanatory pattern sentence. 第1実施形態の翻訳システムにおける制御処理全体の一例を示すフローチャートである。It is a flowchart which shows an example of the whole control processing in the translation system of 1st Embodiment. 第1実施形態のサーバにおいて、翻訳処理の詳細の一例を示すフローチャートである。5 is a flowchart illustrating an example of details of translation processing in the server of the first embodiment. 主語が追加される場合の説明パターン文の態様を示す図である。It is a figure which shows the aspect of the description pattern sentence when a subject is added. 主語を含む説明パターンの訳文の一例を、主語を含まない場合の説明パターンと関連付けて説明するための図である。It is a figure for demonstrating an example of the translation of the description pattern containing a subject in connection with the description pattern in case a subject is not included. 各タグを含む原文データに基づいて翻訳された場合の訳文の表示態様を示す図である。It is a figure which shows the display mode of the translation at the time of being translated based on the original text data containing each tag. 主語が集約されるようにした処理を説明するための図である。It is a figure for demonstrating the process which made the subject consolidate. 訳文の表示態様を示す図である。It is a figure which shows the display mode of a translation. 変更例2において、区切りパターンの例、構成要素名の抽出例および説明パターン文の例を説明するための図である。FIG. 10 is a diagram for explaining an example of a delimiter pattern, an example of extraction of component element names, and an example of an explanation pattern sentence in Modification Example 2; 変更例2の翻訳システムで実現される構成要素の分割の概略を説明するための図である。It is a figure for demonstrating the outline of the division | segmentation of the component implement | achieved with the translation system of the example 2 of a change. 変更例2の翻訳システムで実現されるタグの付与および説明パターン文の分割の概略を説明するための図である。It is a figure for demonstrating the outline of the provision of the tag implement | achieved with the translation system of the example 2 of a change, and the division | segmentation of an explanatory pattern sentence. 変更例2の翻訳システムおいて、訳文の表示態様を示す図である。It is a figure which shows the display mode of a translation in the translation system of the example 2 of a change. 変更例4の翻訳システムおいて、通信端末の表示部の一覧表示例を示す図である。It is a figure which shows the example of a list display of the display part of a communication terminal in the translation system of the example 4 of a change.

<第1実施形態>
以下、本発明の第1実施形態における翻訳システムについて説明する。この翻訳システムは、通信端末10からの要求に応じ、請求項に記載の英語(第1言語)を日本語(第2言語)に翻訳するものである。
<First Embodiment>
Hereinafter, the translation system according to the first embodiment of the present invention will be described. This translation system translates English (first language) described in claims into Japanese (second language) in response to a request from the communication terminal 10.

本実施形態の翻訳システム1の構成例について、図1を参照して説明する。図1は、一実施形態に係る翻訳システム1の構成例を示す図である。   A configuration example of the translation system 1 of the present embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating a configuration example of a translation system 1 according to an embodiment.

図1に示すように、翻訳システム1は、通信端末10と、この通信端末10と例えばインターネット等の通信網20を介して接続可能なサーバ(機械翻訳装置)30と、外部システム40とを含んで構成されている。   As shown in FIG. 1, the translation system 1 includes a communication terminal 10, a server (machine translation device) 30 that can be connected to the communication terminal 10 via a communication network 20 such as the Internet, and an external system 40. It consists of

この翻訳システム1では、通信端末10とサーバ30との間は、HTTP(HyerText Transfer Protocol)通信が行われるようになっている。   In the translation system 1, HTTP (HyerText Transfer Protocol) communication is performed between the communication terminal 10 and the server 30.

外部システム40は、ネットワークの伝送路上に設けられ、ネットワーク上にあるサーバ30との間で例えばAPI通信が可能なサーバシステム群である。外部システム40のサーバシステム群は、例えば、形態素解析のサービスを提供する解析システム、および、機械翻訳のサービスを提供する機械翻訳システムを含む。   The external system 40 is a server system group that is provided on a network transmission line and capable of API communication with the server 30 on the network. The server system group of the external system 40 includes, for example, an analysis system that provides a morphological analysis service and a machine translation system that provides a machine translation service.

なお、外部システム40は、異なる言語(英語、中国語など)ごとに設けることが考えられる。   The external system 40 may be provided for each different language (English, Chinese, etc.).

[通信端末10の構成]
次に、図1に示した通信端末10の構成例について、図2を参照して説明する。図2は、通信端末20の構成例を示す図である。
[Configuration of communication terminal 10]
Next, a configuration example of the communication terminal 10 shown in FIG. 1 will be described with reference to FIG. FIG. 2 is a diagram illustrating a configuration example of the communication terminal 20.

図2に示すように、通信端末10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、入力部14と、表示部15と、通信インターフェース16とを備える。この実施形態では、通信端末10は、一例として、ラップトップパソコン(Laptop computer)とするが、携帯端末、PDA(Personal Digital Assist)、パーソナルコンピュータなどでもよい。   As shown in FIG. 2, a communication terminal 10 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, an input unit 14, a display unit 15, and a communication. And an interface 16. In this embodiment, the communication terminal 10 is a laptop computer as an example, but may be a portable terminal, a PDA (Personal Digital Assist), a personal computer, or the like.

CPU11は、通信端末10全体の動作を実現するための各種のプログラムの実行、演算処理、タイミング処理等を行う。   The CPU 11 performs various programs for executing the operation of the entire communication terminal 10, arithmetic processing, timing processing, and the like.

ROM12には、ウェブブラウザ等のプログラムが記憶されている。RAM13には、プログラムおよび各種のデータが一時的に保持される。   The ROM 12 stores a program such as a web browser. The RAM 13 temporarily stores programs and various data.

入力部14は、ユーザーによって行われる操作入力を受け入れるための入力デバイスである。入力部14は、操作ボタン、タッチパネル、入力ペン、センサーなどを含む。表示部15は、例えば、液晶ディスプレイ、EL(Electro-Luminescence)などのフラットパネル表示器とすることができる。   The input unit 14 is an input device for accepting an operation input performed by a user. The input unit 14 includes operation buttons, a touch panel, an input pen, a sensor, and the like. The display unit 15 may be a flat panel display such as a liquid crystal display or EL (Electro-Luminescence).

通信インターフェース16は、例えばHTTP通信に準拠するインターフェース機能を有する。   The communication interface 16 has an interface function that complies with, for example, HTTP communication.

[サーバ30の構成]
次に、図1に示したサーバ30の構成例について、図3を参照して説明する。図3は、サーバ30の構成例を示す図である。
[Configuration of Server 30]
Next, a configuration example of the server 30 illustrated in FIG. 1 will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the server 30.

サーバ30は、図3に示すように、CPU(Central Processing Unit)31と、ROM(Read Only Memory)32と、RAM(Random Access Memory)33と、通信インターフェース34と、外部アクセス部35とを含む。   As shown in FIG. 3, the server 30 includes a CPU (Central Processing Unit) 31, a ROM (Read Only Memory) 32, a RAM (Random Access Memory) 33, a communication interface 34, and an external access unit 35. .

CPU31は、各構成要素とバスで接続されて制御信号やデータの転送を行うとともに、サーバ30全体の動作を実現するためのプログラムの実行、演算処理等を行う。   The CPU 31 is connected to each component via a bus and transfers control signals and data, and executes a program for executing the operation of the entire server 30, arithmetic processing, and the like.

ROM32には、プログラムが記憶されており、本実施形態のサーバ30は、当該プログラムが実行されることにより実現される。RAM33には、当該プログラムおよび各種のデータが一時的に保持される。なお、上述したプログラムは、CD−ROM等の記憶媒体に格納されていてもよい。   The ROM 32 stores a program, and the server 30 according to the present embodiment is realized by executing the program. The RAM 33 temporarily stores the program and various data. Note that the above-described program may be stored in a storage medium such as a CD-ROM.

通信インターフェース16は、ネットワークインターフェース機能を有しており、通信端末10との通信を行う。   The communication interface 16 has a network interface function and performs communication with the communication terminal 10.

外部アクセス部35は、CPU31が外部システム40にアクセスして、例えばAPI(Application Programming Interface)などの動作環境を基に外部システム40と通信を行うためのインターフェースである。この実施形態では、外部システム40は、英語の形態素解析のサービスを提供するための外部解析システムと、英語から日本語への機械翻訳のサービスを提供するための外部翻訳システムとを含み、各外部システムでの処理結果が外部アクセス部35を介してCPU31へ伝送される。この実施形態の翻訳システム1では、サーバ30は、APIを利用して、外部システム40の各サービスを呼び出すように構成されているが、例えば、サーバ30は、外部システム40のサービス機能を兼ね備える単一のサーバ装置として構成してもよい。   The external access unit 35 is an interface through which the CPU 31 accesses the external system 40 and communicates with the external system 40 based on an operating environment such as an API (Application Programming Interface). In this embodiment, the external system 40 includes an external analysis system for providing an English morphological analysis service and an external translation system for providing a machine translation service from English to Japanese. A processing result in the system is transmitted to the CPU 31 via the external access unit 35. In the translation system 1 of this embodiment, the server 30 is configured to call each service of the external system 40 using an API. For example, the server 30 is a single unit that has the service function of the external system 40. You may comprise as one server apparatus.

[翻訳処理の概略]
次に、翻訳システム1によって実現される翻訳処理の概略について、図1および図4を参照して説明する。図4は、翻訳処理時における原文の変更態様の例を説明するための図であって、(a)は請求項における原文表記と、(b)は構成要素ごとに分割された請求項と、(c)は構成要素名にタグが付与された請求項と、(d)は説明パターン文ごとに分割された請求項とを示す。なお、図4(a)は、米国公開特許20050123138号のクレーム(請求項)1を例示的に示している。
[Outline of translation processing]
Next, an outline of translation processing realized by the translation system 1 will be described with reference to FIGS. 1 and 4. FIG. 4 is a diagram for explaining an example of a change mode of the original text at the time of translation processing, where (a) is a text description in a claim, (b) is a claim divided for each component, (C) shows a claim in which a tag is added to the component name, and (d) shows a claim divided for each explanation pattern sentence. FIG. 4A exemplarily shows claim 1 of US Published Patent No. 20050123138.

サーバ30は、通信端末10からの要求に応じて、例えば図4(a)に示すような「A communication apparatus」で始まる英語で記載されたクレームを翻訳対象として翻訳を行う。   In response to a request from the communication terminal 10, the server 30 translates, for example, a claim written in English beginning with “A communication apparatus” as shown in FIG.

このサーバ30は、クレームの形態素解析の結果に基づいて、そのクレームの中から、発明の構成要素を区切るために使用されている区切りパターンを検出し、構成要素の単位にクレームを分割する。   Based on the result of the morphological analysis of the claim, the server 30 detects a delimiter pattern used for delimiting the constituent elements of the invention from the claims, and divides the claims into units of constituent elements.

この実施形態では、構成要素の単位にクレームを分割するために、図4に示すように、<HAVE>タグと、<DIV>タグとが用いられる。図4の例では、<HAVE>タグは、「発明の名称」と「発明構成要素集合」との間を区切るためのタグとして使用される。「発明構成要素集合」は、複数の発明の構成要素からなる部分を意味する。例えば米国の英文クレームの場合、「発明の名称」と「発明構成要素集合」との間には一般に、「comprising:」という表記が記載されるので、この表記に対して<HAVE>タグが付与される。   In this embodiment, a <HAVE> tag and a <DIV> tag are used as shown in FIG. In the example of FIG. 4, the <HAVE> tag is used as a tag for separating the “invention name” from the “invention component set”. “Invention component set” means a part composed of a plurality of components of the invention. For example, in the case of English claims in the United States, the notation “comprising:” is generally written between the “invention name” and the “invention component set”, so the <HAVE> tag is assigned to this notation. Is done.

<DIV>タグは、個々の発明の構成要素の間を区切るタグとして使用される。例えば、米国の英文クレームの場合は一般に、個々の発明の構成要素の位置(開始、終了)に、「; and」や「.」という表記が記載されるので、これらの表記に対して<DIV>タグが付与される。   The <DIV> tag is used as a tag that separates the constituent elements of each invention. For example, in the case of an English claim in the United States, in general, notations such as “; and” and “.” Are described in the positions (start and end) of individual invention components. > A tag is given.

例えば図4(b)において、サーバ30は、「comprising」の後に「:」(コロン)が出現するパターンC1、「;」(セミコロン)の後に「and」が出現するパターンC2、および、「.」( ピリオド)が出現するパターンC3をすべて、区切りパターンとして認識し、構成要素CA1〜CA3ごとにクレームを分割する。例えば、図4(b)の例では、「comprising」の前に<HAVE>というタグが付与され、「:」(コロン)の後に</HAVE>というタグが付与される。さらに、「;」(セミコロン)および「.」( ピリオド)の前に<DIV>というタグが付与され、「and」および「.」( ピリオド)の後に</DIV>というタグが付与されることによって、各構成要素CA1〜CA3が分割されることになる。   For example, in FIG. 4B, the server 30 includes a pattern C1 in which “:” (colon) appears after “comprising”, a pattern C2 in which “and” appears after “;” (semicolon), and “. All the patterns C3 in which “(period) appear are recognized as delimiter patterns, and the claims are divided into the components CA1 to CA3. For example, in the example of FIG. 4B, a tag <HAVE> is given before “comprising”, and a tag </ HAVE> is given after “:” (colon). Furthermore, the tag <DIV> is added before ";" (semicolon) and "." (Period), and the tag </ DIV> is added after "and" and "." (Period) Thus, the components CA1 to CA3 are divided.

なお、各実施形態の説明では、クレームのプリアンブル部に記載されている名称(図4の例では、「A communication apparatus」という名称)を、発明の構成要素名と称する。   In the description of each embodiment, the name (named “A communication apparatus” in the example of FIG. 4) described in the preamble portion of the claim is referred to as a component name of the invention.

次に、例えば図4(c)に示すように、サーバ30は、構成要素CA1〜CA3の各構成要素名をそれぞれ抽出して各構成要素名を特定する。この実施形態では、各構成要素名を特定する一例として、構成要素名の位置にタグ61,62,63を付与する場合を示してある。   Next, for example, as illustrated in FIG. 4C, the server 30 extracts the component element names of the component elements CA <b> 1 to CA <b> 3 and specifies the component element names. In this embodiment, as an example of specifying each component name, a case where tags 61, 62, and 63 are assigned to the positions of the component names is shown.

この例では、構成要素名を特定するために、図4に示すように、<NAME>タグと、<ITEM>タグとが用いられる。図4の例では、<NAME>タグは、「発明の名称」を特定するためのタグとして使用される。例えば、米国の英文クレームの場合は一般に、「発明の名称」は、英文クレームの先頭に、名詞または名詞句として記述されるので、この表記に対して<NAME>タグが付与される。   In this example, in order to specify a component name, a <NAME> tag and an <ITEM> tag are used as shown in FIG. In the example of FIG. 4, the <NAME> tag is used as a tag for specifying “name of invention”. For example, in the case of an English claim in the United States, “name of invention” is generally described as a noun or a noun phrase at the beginning of an English claim, so a <NAME> tag is given to this notation.

<ITEM>タグは、2番目以降の発明の構成要素の名称(構成要素名)を特定するためのタグとして使用される。例えば、米国の英文クレームの場合は一般に、構成要素名は、対応する構成要素の先頭に出現する名詞または名詞句からなるので、これらの名詞または名詞句に対して<ITEM>タグが付与される。   The <ITEM> tag is used as a tag for specifying the name (component name) of the component of the second and subsequent inventions. For example, in the case of an English claim in the United States, a component name generally consists of a noun or noun phrase that appears at the beginning of the corresponding component, so the <ITEM> tag is assigned to these nouns or noun phrases .

図4(c)の例では、「A communication apparatus」という構成要素名の間に、例えば、<NAME>および</NAME>というタグ61が付与される。さらに、「a propagation environment estimating section」および「a first data acquiring section」という構成要素名の間に、例えば、<ITEM>および</ITEM>というタグ62,63が付与される。   In the example of FIG. 4C, tags 61 such as <NAME> and </ NAME> are added between the component names “A communication apparatus”, for example. Further, tags 62 and 63 such as <ITEM> and </ ITEM> are assigned between the constituent element names “a propagation environment determining section” and “a first data acquiring section”, for example.

そして、図4(d)に示すように、サーバ30は、構成要素CA1〜CA3の内部に出現する説明パターン文の単位に構成要素CA1〜CA3を分割する。図4(d)の例では、サーバ30は、「that」という関係代名詞から始まる文、「using」という現在分詞から始まる文、および、「obtained」という過去分詞から始まる文をそれぞれ、説明パターン文として認識し、説明パターン文の単位に構成要素CA2,CA3を分割する。例えば、図4(d)の例では、<ACTION>および</ACTION>というタグ71,72,73,74,75,76が付与されることによって、説明パターン文の単位に構成要素CA2,CA3が分割されることになる。   Then, as shown in FIG. 4D, the server 30 divides the constituent elements CA1 to CA3 into units of explanation pattern sentences appearing inside the constituent elements CA1 to CA3. In the example of FIG. 4 (d), the server 30 respectively describes a sentence starting from a relative pronoun “that”, a sentence starting from the present participle “using”, and a sentence starting from the past participle “obtained”. And the components CA2 and CA3 are divided into units of explanation pattern sentences. For example, in the example of FIG. 4D, the tags 71, 72, 73, 74, 75, 76 <ACTION> and </ ACTION> are added, so that the constituent elements CA2, CA3 are in units of explanation pattern sentences. Will be divided.

このように本実施形態のサーバ30では、クレーム中の構成要素間の参照関係(構成要素名、構成要素、および、説明パターン文の関係)にしたがって、クレーム内の原文を分割する。このことは、英文クレームが日本語に翻訳される度に、翻訳しやすくなることに等しく、これにより、外国語で記載された請求項の内容の理解が容易になる。   As described above, the server 30 of the present embodiment divides the original text in the claim according to the reference relationship between the constituent elements in the claim (relationship between the constituent element name, the constituent element, and the explanation pattern sentence). This is equivalent to easy translation whenever an English claim is translated into Japanese, thereby facilitating understanding of the content of a claim written in a foreign language.

[サーバ30の機能構成]
図5は、図3に示したハードウエア構成上で実現されるサーバ30の機能構成の一例を示す図である。図5に示すように、このサーバ30は、形態素解析部301、構成要素単位分割部302、構成要素名特定部303、説明パターン文単位分割部304、翻訳部305、記憶部306、出力部307および文構造変更部308を備える。
[Functional configuration of server 30]
FIG. 5 is a diagram illustrating an example of a functional configuration of the server 30 realized on the hardware configuration illustrated in FIG. 3. As shown in FIG. 5, the server 30 includes a morphological analysis unit 301, a component element unit dividing unit 302, a component name specifying unit 303, an explanation pattern sentence unit dividing unit 304, a translation unit 305, a storage unit 306, and an output unit 307. And a sentence structure changing unit 308.

記憶部306は、図3に示したROM32およびRAM33により構成され、翻訳対象の原文データ(クレーム)と、その原文データに対応付けられたデータとして訳文などを記憶する。   The storage unit 306 includes the ROM 32 and the RAM 33 shown in FIG. 3, and stores the original text data (claims) to be translated and a translation as data associated with the original text data.

図5に示した記憶部307以外の構成要素については、以下のサーバ30の動作説明において適宜参照される。   Components other than the storage unit 307 illustrated in FIG. 5 are appropriately referred to in the following description of the operation of the server 30.

[翻訳システム1の動作]
以下、この翻訳処理を実現するための翻訳システム1の動作について説明する。
[Operation of translation system 1]
Hereinafter, the operation of the translation system 1 for realizing this translation process will be described.

先ず、この翻訳処理を実現するためにサーバ30内で処理される様々なデータについて、図1、図5および図6を参照して説明する。図6は、(a)区切りパターンの例と、(b)構成要素名の抽出例と、(c)説明パターン文の例を示す図である。   First, various data processed in the server 30 in order to realize this translation processing will be described with reference to FIG. 1, FIG. 5, and FIG. FIG. 6 is a diagram illustrating an example of (a) a delimiter pattern, (b) an example of component name extraction, and (c) an example of an explanatory pattern sentence.

なお、図6(a)に示すデータは図5に示した構成要素単位分割部302によって管理され、図6(b)に示す管理データは図5に示した構成要素名特定部303によって管理され、図6(c)に示した管理データは図5に示した説明パターン文単位分割部304によって管理される。   The data shown in FIG. 6A is managed by the component unit division unit 302 shown in FIG. 5, and the management data shown in FIG. 6B is managed by the component name specifying unit 303 shown in FIG. The management data shown in FIG. 6C is managed by the explanation pattern sentence unit dividing unit 304 shown in FIG.

このサーバ30では、図6(a)に示す管理データに基づいて、クレーム中に出現する区切りパターンの検出を行う。例えば、<clam-Text>タグ、「:」(コロン)、「;」(セミコロン)、「comprising」という語がクレーム中に出現する場合、構成要素の境界として認識される。   The server 30 detects a delimiter pattern that appears in a complaint based on the management data shown in FIG. For example, if a <clam-Text> tag, “:” (colon), “;” (semicolon), or “comprising” appears in a claim, it is recognized as a component boundary.

図6(b)に示すように、このサーバ30では、構成要素の先頭に位置する名詞(名詞句)を、当該構成要素内の構成要素名として抽出して特定する。   As shown in FIG. 6B, the server 30 extracts and specifies the noun (noun phrase) located at the head of the constituent element as the constituent element name in the constituent element.

図6(c)に示すように、サーバ30は、説明パターン文を、管理データを参照して抽出する。関係代名詞、形容詞用法の現在分詞・過去分詞、および、to不定詞のいずれかから始まって名詞(名詞句)で終わる文が出現するときには、その文が説明パターン文であることを意味する。   As shown in FIG. 6C, the server 30 extracts the explanation pattern sentence with reference to the management data. When a sentence that begins with any of the related pronouns, the present participle / past participle of an adjective usage, and ends with a noun (noun phrase), it means that the sentence is an explanatory pattern sentence.

次に、この翻訳処理を実現されるために実行される処理の全体について、図1、図3〜図7を参照して説明する。図7は、翻訳システム1の制御処理の全体を示すフローチャートである。   Next, the entire process executed to realize this translation process will be described with reference to FIGS. 1 and 3 to 7. FIG. 7 is a flowchart showing the entire control process of the translation system 1.

図7において、通信端末10が、サーバ30に対して通信網20を介して翻訳要求(翻訳対象となる英文クレームを含む。)を行うと(ステップS101)、サーバ30のCPU31は、翻訳要求に応じた英文クレームのテキスト文(図4(a)参照)を対象として、形態素解析する(ステップS102)。図7のフローチャートによれば、サーバ30のCPU31は、外部アクセス部35を介して、外部システム40の解析システムを呼び出して、対応する英文クレームのテキスト文の形態素解析の結果を得る。つまり、CPU31は、英文のクレームを対象として、形態素(言語で意味を持つ最小単位)の列に分割し、各形態素の品詞を判別する。   In FIG. 7, when the communication terminal 10 makes a translation request (including an English claim to be translated) to the server 30 via the communication network 20 (step S101), the CPU 31 of the server 30 makes a translation request. The morphological analysis is performed on the text sentence of the corresponding English claim (see FIG. 4A) (step S102). According to the flowchart of FIG. 7, the CPU 31 of the server 30 calls the analysis system of the external system 40 via the external access unit 35 and obtains the result of the morphological analysis of the text sentence of the corresponding English claim. In other words, the CPU 31 divides the English claim into a row of morphemes (the smallest unit having meaning in the language), and determines the part of speech of each morpheme.

ここで、ステップS102のCPU31は、外部アクセス部35と協働して、形態素解析部301として機能する。   Here, the CPU 31 in step S <b> 102 functions as the morphological analysis unit 301 in cooperation with the external access unit 35.

次に、サーバ30のCPU31は、ステップS101で解析された形態素の結果に基づいて、翻訳対象の英文クレームの中から発明の構成要素を区切るために使用されている区切りパターンを検出し、構成要素ごとにクレームのテキスト文を分割する(ステップS103)。図4(b)の例では、CPU31は、「comprising」、「:」(コロン)、「;」(セミコロン)および「.」( ピリオド)が出現したときにそのパターンを区切りパターンC1〜C3として検出し、それらの区切りパターンC1〜C3に対応するタグ51〜53を付与することにより、構成要素CA1〜CA3の単位にテキスト文を分割する。このステップS103は、区切りパターンの例(図6(a))に基づいて検出される。   Next, based on the result of the morpheme analyzed in step S101, the CPU 31 of the server 30 detects a delimiter pattern used to delimit the constituent elements of the invention from the English claims to be translated, and The text text of the claim is divided every time (step S103). In the example of FIG. 4B, when “comprising”, “:” (colon), “;” (semi-colon), and “.” (Period) appear, the CPU 31 sets the patterns as delimiter patterns C1 to C3. By detecting and assigning tags 51 to 53 corresponding to the delimiter patterns C1 to C3, the text sentence is divided into units of the constituent elements CA1 to CA3. This step S103 is detected based on an example of a delimiter pattern (FIG. 6A).

ここで、ステップS103のCPU31は、構成要素単位分割部302として機能する。   Here, the CPU 31 in step S <b> 103 functions as the component unit division unit 302.

次に、サーバ30のCPU31は、ステップS103で分割された構成要素の中から、ステップS101の形態素解析の結果に基づいて構成要素名を抽出し、構成要素名を特定する(ステップS104)。図4(c)の例では、CPU31は、「A communication apparatus」、「a propagation environment estimating section」および「a first data acquiring section」という名詞句を構成要素CA1〜CA3の構成要素名として抽出し、これらの各構成要素名を特定するためのタグ61〜63を、各構成要素名の位置に付与する。このステップS104は、構成要素名の抽出の例(図6(b))に基づいて判定される。   Next, the CPU 31 of the server 30 extracts the component name from the components divided in step S103 based on the result of the morphological analysis in step S101, and specifies the component name (step S104). In the example of FIG. 4C, the CPU 31 extracts the noun phrases “A communication apparatus”, “a propagation environment monitoring section”, and “a first data acquiring section” as the component names of the components CA1 to CA3, Tags 61 to 63 for specifying each component name are assigned to each component name position. This step S104 is determined based on an example of extraction of component element names (FIG. 6B).

ステップS104において、CPU31は、構成要素名特定部303として機能する。   In step S <b> 104, the CPU 31 functions as the component name specifying unit 303.

次に、サーバ30のCPU31は、ステップS103で分割された構成要素内に、当該構成要素を説明するための説明パターン文が出現する場合は、説明パターン文ごとに構成要素を分割する(ステップS105)。図4(d)の例では、CPU31は、「that」という関係代名詞から始まる文、「using」という現在分詞から始まる文、および、「obtained」という過去分詞から始まる文が出現したときに、それらの文をすべて説明パターン文と判定し、それらの説明パターン文に対応するタグ71〜76を付与することにより、説明パターン文の単位に構成要素CA2,CA3を分割する。このステップS105は、説明パターン文の例(図6(c))に基づいて判定される。   Next, when an explanation pattern sentence for explaining the constituent element appears in the constituent elements divided in step S103, the CPU 31 of the server 30 divides the constituent element for each explanation pattern sentence (step S105). ). In the example of FIG. 4D, the CPU 31 detects when a sentence starting from the relative pronoun “that”, a sentence starting from the present participle “using”, and a sentence starting from the past participle “obtained” appear. Are determined as explanation pattern sentences, and tags 71 to 76 corresponding to these explanation pattern sentences are assigned, thereby dividing the constituent elements CA2 and CA3 into units of explanation pattern sentences. This step S105 is determined based on an example of the explanation pattern sentence (FIG. 6C).

ステップS105において、CPU31は、説明パターン文単位分割部304として機能する。   In step S <b> 105, the CPU 31 functions as the explanation pattern sentence unit division unit 304.

次に、サーバ30のCPU31は、ステップS102〜S105の処理結果に基づいて設定した英文クレームの翻訳処理を行う(ステップS106)。図7のフローチャートによれば、サーバ30のCPU31は、外部アクセス部35を介して、外部システム40である外部翻訳システムを呼び出して、翻訳対象の英文クレームの翻訳処理結果である翻訳文(例えば、日本語)を得る。そして、CPU31は、その翻訳文をROM32に記憶する。   Next, the CPU 31 of the server 30 performs the English complaint translation processing set based on the processing results of steps S102 to S105 (step S106). According to the flowchart of FIG. 7, the CPU 31 of the server 30 calls an external translation system, which is the external system 40, via the external access unit 35, and translates a translation sentence (for example, a translation processing result of an English claim to be translated) Japanese). Then, the CPU 31 stores the translated sentence in the ROM 32.

ステップS106において、CPU31は、外部アクセス部35と協働して、翻訳部305として機能する。なお、ステップS106の処理は、後述する図8において、詳細なフローチャートを示してある。   In step S <b> 106, the CPU 31 functions as the translation unit 305 in cooperation with the external access unit 35. The process in step S106 is shown in a detailed flowchart in FIG.

次に、サーバ30のCPU31は、ステップS106の翻訳処理結果である翻訳文(例えば、日本語)を、通信網20を介して通信端末10に出力する(ステップS107)。   Next, the CPU 31 of the server 30 outputs a translated sentence (for example, Japanese) as a result of the translation processing in step S106 to the communication terminal 10 via the communication network 20 (step S107).

ステップS107において、CPU31は、通信インターフェース34と協働して、出力部307として機能する。   In step S <b> 107, the CPU 31 functions as the output unit 307 in cooperation with the communication interface 34.

図7において、通信端末10は、サーバ30から出力された翻訳文を、通信網20を介して受信して表示部15に表示する(ステップS108)。この表示例は、後述する図10において示してある。   In FIG. 7, the communication terminal 10 receives the translated text output from the server 30 via the communication network 20 and displays it on the display unit 15 (step S108). This display example is shown in FIG.

[サーバ30の翻訳処理]
以下、サーバ30により実行される翻訳処理について説明する。
[Translation processing of server 30]
Hereinafter, the translation process executed by the server 30 will be described.

先ず、この翻訳処理を実現するためにサーバ30内で処理される構文の変更に関連して、図1、図5、図7〜図9を参照して説明する。図8は、翻訳処理の一例を示すフローチャートである。図9は、(a)英文クレームと、(b)訳文と、(c)説明パターン文の構文の変換例と、(d)〜(i)名詞句の決定手順とを示す説明図である。   First, a description will be given with reference to FIGS. 1, 5, and 7 to 9 regarding a change in syntax processed in the server 30 in order to realize this translation processing. FIG. 8 is a flowchart illustrating an example of translation processing. FIG. 9 is an explanatory diagram showing (a) an English sentence, (b) a translated sentence, (c) a syntax conversion example of an explanation pattern sentence, and (d) to (i) a procedure for determining a noun phrase.

図8において、サーバ30のCPU31は、外部システム40である外部翻訳システムを呼び出して、構成要素名を翻訳する(ステップS1061)。図9(a)に示すように、英文クレーム50内には、「a propagation environment estimating section」という構成要素名t10が記述されており、その構成要素名t10にかかる構成要素は、「that estimates a propagation environment」、「using a signal」および「transmitted from a community party」という3つの説明パターン文を含んでいる。   In FIG. 8, the CPU 31 of the server 30 calls an external translation system, which is the external system 40, and translates the component name (step S1061). As shown in FIG. 9A, in the English claim 50, the component name t10 “a propagation environment monitoring section” is described, and the component related to the component name t10 is “that estimates a It includes three explanatory pattern sentences: “propagation environment”, “using a signal”, and “transmitted from a community party”.

この場合、CPU31は、構成要素名t10の翻訳結果として、「伝播環境が推定部」という日本語訳td50を得る(図9(b)参照)。   In this case, the CPU 31 obtains a Japanese translation td50 “propagation environment is an estimation unit” as a translation result of the component name t10 (see FIG. 9B).

ステップS1061において、CPU31は、外部アクセス部35と協働して、翻訳部305として機能する。   In step S <b> 1061, the CPU 31 functions as the translation unit 305 in cooperation with the external access unit 35.

次に、CPU31は、説明パターン文が主語および述語動詞を含む文となるように文構造を変更する(ステップS1062)。この実施形態では、説明パターン文の主語は、説明パターン文が修飾する名詞または名詞句からなる。   Next, the CPU 31 changes the sentence structure so that the explanation pattern sentence becomes a sentence including the subject and the predicate verb (step S1062). In this embodiment, the subject of the explanation pattern sentence consists of a noun or noun phrase that the explanation pattern sentence modifies.

説明パターン文の文構造を変更する一例として、図9(c)の例では、CPU31は、説明パターン文内の「that」という関係代名詞を省略し、さらには、説明パターン文内の「using」という現在分詞形を原形の「use」に変換する。また、CPU31は、説明パターン文内の「transmitted」という過去分詞形の前にbe動詞の「is」を追加する。   As an example of changing the sentence structure of the explanation pattern sentence, in the example of FIG. 9C, the CPU 31 omits the relative pronoun “that” in the explanation pattern sentence, and further uses “using” in the explanation pattern sentence. The present participle form is converted to the original "use". Further, the CPU 31 adds the be verb “is” before the past participle form “transmitted” in the explanation pattern sentence.

そして、CPU31は、説明パターン文の直前の名詞(名詞句)を参照して、その名詞(名詞句)を、当該説明パターン文の主語として追加する。図9(d)の例では、「section」、「a propagation environment」および「a signal」という語が、対応する説明パターン文の主語として追加される。このステップS1062は、あらかじめ設定された変換パターンに基づいて変更される。   Then, the CPU 31 refers to the noun (noun phrase) immediately before the explanation pattern sentence, and adds the noun (noun phrase) as the subject of the explanation pattern sentence. In the example of FIG. 9D, the words “section”, “a propagation environment”, and “a signal” are added as the subject of the corresponding description pattern sentence. This step S1062 is changed based on a preset conversion pattern.

ステップS1062において、CPU31は、文構造変更部308として機能する。   In step S1062, the CPU 31 functions as the sentence structure changing unit 308.

次に、CPU31は、外部システム40である外部翻訳システムを呼び出して、説明パターン文を翻訳する(ステップS1063)。その翻訳結果として、例えば図9(e)に示すような日本語訳が得られる。   Next, the CPU 31 calls an external translation system, which is the external system 40, and translates the explanation pattern sentence (step S1063). As a result of the translation, for example, a Japanese translation as shown in FIG.

ここで、CPU31は、外部アクセス部35と協働して、翻訳部305として機能する。   Here, the CPU 31 functions as the translation unit 305 in cooperation with the external access unit 35.

次に、CPU31は、ステップS1064における翻訳後の説明パターン文の主語が、その直前の構成要素または説明パターン文の訳文に出現するかを判定する(ステップS1064)。そして、その判定の結果、例えば図9(e)に示すように、「セクション」という名詞からなる主語と、その直前の名詞句からなる「推定部」とが不一致であれば(ステップS1064のいいえ)、ステップS1062に進んで、CPU31は、例えば図9(f)に示すように、「estimating」という語をさらに追加する変更処理(ステップS1062)と、翻訳処理(ステップS1063)と、比較処理(ステップS1064:図9(g)参照)とを行う。CPU31は、説明パターン文の主語が直前の名詞(名詞句)と一致するまでの間(ステップS1064)、ステップS1062〜S1064の処理を繰り返す。このようにして、説明パターン文内の主語が、「section」/(セクション)(図9(c))→「estimating section」/(セクションを推定する)((図9(f))→「environment estimating section」/(環境推定部)(図9(h))と変更されていくことになる。つまり、CPU31は、名詞句が記述されている原文の訳文と、説明パターン文内に含まれる主語候補の訳文とが一致するように、名詞句に含まれる語を補完してその説明パターン文内の主語を決定することになる。   Next, the CPU 31 determines whether or not the subject of the translated explanatory pattern sentence in step S1064 appears in the immediately preceding component or the translated translation of the explanatory pattern sentence (step S1064). As a result of the determination, for example, as shown in FIG. 9E, if the subject consisting of the noun “section” and the “estimating part” consisting of the immediately preceding noun phrase do not match (No in step S1064) ), Proceeding to step S1062, the CPU 31, for example, as shown in FIG. 9 (f), a change process (step S1062) for further adding the word “estimating”, a translation process (step S1063), and a comparison process ( Step S1064: See FIG. 9G). The CPU 31 repeats the processes of steps S1062 to S1064 until the subject of the explanation pattern sentence matches the immediately preceding noun (noun phrase) (step S1064). In this way, the subject in the explanation pattern sentence is “section” / (section) (FIG. 9C) → “estimating section” / (estimating section) ((FIG. 9F) →→ environment In other words, the CPU 31 changes the original sentence in which the noun phrase is described and the subject included in the explanation pattern sentence. The subject included in the noun phrase is complemented to determine the subject in the explanation pattern sentence so that the candidate translation matches.

ステップS1064において、CPU31は、文構造変更部308として機能する。   In step S <b> 1064, the CPU 31 functions as the sentence structure changing unit 308.

このようにして翻訳が行われた翻訳結果の表示例について、図10を参照して説明する。図10は、通信端末10の表示部15における翻訳結果の表示例を説明するための図であって、(a)は英文クレームの文構造の変更例(図8のステップS1061〜S1064の処理結果)、(b)は文構造を変更した場合の訳文例、(c)は文構造を変更しない場合の訳文例を示す。   A display example of the translation result that has been translated in this way will be described with reference to FIG. FIG. 10 is a diagram for explaining a display example of the translation result on the display unit 15 of the communication terminal 10, and (a) is an example of changing the sentence structure of an English claim (the processing results of steps S1061 to S1064 in FIG. 8). (B) shows an example of a translation when the sentence structure is changed, and (c) shows an example of a translation when the sentence structure is not changed.

図10(b)の翻訳例によれば、構成要素CA1〜CA3の単位に日本語訳が表示され、構成要素CA1〜CA3の内容が理解しやすくなっている。一方、図10(c)の翻訳例は、ふさわしい表現になっておらず、理解しにくい。   According to the translation example of FIG. 10B, the Japanese translation is displayed in units of the constituent elements CA1 to CA3, and the contents of the constituent elements CA1 to CA3 are easy to understand. On the other hand, the translation example of FIG. 10C is not an appropriate expression and is difficult to understand.

図10(b)の翻訳結果の表示例として、構成要素CA1〜CA3の単位に階層状に表示されている。これは、翻訳文の出力処理(図7のステップS107)において、サーバ30のCPU31が、タグを付与して、構成要素名と構成要素と説明パターン文との相互関係が視認可能になるように出力するからである。このときのタグの基本的な設定態様は、図11に示してある。   As a display example of the translation result in FIG. 10B, the translation results are displayed in a hierarchy in units of the components CA1 to CA3. This is because the CPU 31 of the server 30 attaches a tag in the translated text output process (step S107 in FIG. 7) so that the interrelationship between the component name, the component, and the explanation pattern sentence can be visually recognized. It is because it outputs. The basic setting mode of the tag at this time is shown in FIG.

図11は、タグの設定例を示す図であって、(a)はタグの設定例、(b)はタグにしたがった表示例を示しているなお、図11(a)のタグの構成は、図4に示したものと同一である。   FIG. 11 is a diagram showing an example of tag setting, where (a) shows an example of tag setting, (b) shows an example of display according to the tag, and the configuration of the tag of FIG. This is the same as that shown in FIG.

図11において、(1)<HAVE>タグは<NAME>タグに関連付けられ、(2)<ITEM>タグは<HAVE>タグに関連付けられ、(3)連続する<ACTION>タグのうち先頭のものは、直前の<ITEM>タグに関連付けられ、(4)<ACTION>タグに続く<ACTION>タグは直前の<ACTION>タグに関連付けられ、(5)関連付けられたタグは、関連付け先のタグから1段インデントさせ、タグ間を線で結んで表示される。   In FIG. 11, (1) the <HAVE> tag is associated with the <NAME> tag, (2) the <ITEM> tag is associated with the <HAVE> tag, and (3) the first of the consecutive <ACTION> tags Is associated with the immediately preceding <ITEM> tag, (4) the <ACTION> tag following the <ACTION> tag is associated with the immediately preceding <ACTION> tag, and (5) the associated tag is Displayed with one line indented and connected with a line between tags.

そのため、通信端末10では、翻訳文の表示時の表示部15には、タグにしたがって、クレーム内の参照関係(構成要素名と、構成要素と、説明パターン文との相互関係)が視認可能な形態で表示される。なお、構成要素名、構成要素、および/または、説明パターン文を表示する方法として、例えば、それぞれに対応する文字列の色を変えて表示してもよいし、文字列の太さを変えて表示するようにしてもよい。   Therefore, in the communication terminal 10, the reference relationship in the claim (correlation between the component element name, the component element, and the explanation pattern sentence) can be visually recognized on the display unit 15 when displaying the translated sentence according to the tag. Displayed in form. In addition, as a method of displaying a component name, a component, and / or an explanation pattern sentence, for example, the character string corresponding to each may be displayed in different colors, or the thickness of the character string may be changed. You may make it display.

以上説明したように、本実施形態のサーバ30によれば、翻訳対象のクレームを、構成要素、構成要素名および説明パターン文の別にそれぞれ分類して機械翻訳を行う。ここで、構成要素、構成要素名および説明パターン文は、請求項(クレーム)および外国語に特有の記述や表現が使用されることが多いので、それらの記述や表現を基に、構成要素、構成要素名および説明パターン文を区分けすることになる。これにより外国語で記載された請求項の内容の理解が促進される。   As described above, according to the server 30 of the present embodiment, the machine translation is performed by classifying the claims to be translated into components, component names, and explanation pattern sentences. Here, since the description, expression peculiar to the claim (claim) and the foreign language is often used for the component, the component name, and the explanation pattern sentence, the component, The component name and the explanation pattern sentence are divided. This facilitates understanding of the content of claims written in a foreign language.

次に、本実施形態の変更例について説明する。   Next, a modified example of the present embodiment will be described.

(変更例1)
以上では、説明パターン文内に主語が重複する態様について言及しなかったが、繰り返し出現する構成要素名を1つ(最初に出現する構成要素名)に集約するようにしてもよい。
(Modification 1)
In the above description, the aspect in which the subject is duplicated in the explanation pattern sentence is not mentioned, but the component names that repeatedly appear may be integrated into one (component name that appears first).

図12は、かかる集約例を示す説明図であって、(a)はテキスト文、(b)はテキスト文内の構成要素および説明パターン文の分割例、(c)は説明パターン文内の主語の集約例を示す。   12A and 12B are explanatory diagrams showing such an aggregation example, where FIG. 12A is a text sentence, FIG. 12B is a division example of components and explanation pattern sentences in the text sentence, and FIG. 12C is a subject in the explanation pattern sentence. An example of aggregation is shown.

図12(b)の例では、「a plurality of antennas」(複数のアンテナ)という構成要素名が2つあるので、2番目の「a plurality of antennas」が削除され、1番目の「a plurality of antennas」に集約されている。この場合、図8のステップS1062において、サーバ30のCPU31(文構造変更部308)は、同一の構成要素内で、構成要素名(図12の例では、「a plurality of antennas」)が繰り返し出現する場合は、この繰り返される構成要素名を集約化して文構造を変更する。このようにすることで、構成要素名にかかる構成要素内の表現が簡略化され、誤訳が少なくなる。   In the example of FIG. 12B, since there are two component names “a plurality of antennas” (multiple antennas), the second “a plurality of antennas” is deleted, and the first “a plurality of antennas” is deleted. antennas ". In this case, in step S1062 of FIG. 8, the CPU 31 (sentence structure changing unit 308) of the server 30 repeatedly displays the component name (“a plurality of antennas” in the example of FIG. 12) within the same component. If so, the sentence structure is changed by consolidating the repeated component names. By doing so, the expression in the constituent element related to the constituent element name is simplified and mistranslation is reduced.

図13は、かかる変更処理に基づいて実施された翻訳結果の表示部15の表示例を示す図である。図13の例では、「複数のアンテナ」という構成要素名にかかる複数の構成要素が1つに集約され、かかる構成要素内の関係が分かりやすくなる。   FIG. 13 is a diagram showing a display example of the translation result display unit 15 implemented based on such change processing. In the example of FIG. 13, a plurality of constituent elements related to the constituent element name “plurality of antennas” are integrated into one, and the relationship in the constituent elements is easily understood.

(変更例2)
以上では、英語から日本語へ翻訳が行われる場合について説明した。これとは別に、中国語から日本語への翻訳に適用してもよい。
(Modification 2)
In the above, the case where translation from English to Japanese was performed was explained. Apart from this, it may be applied to translation from Chinese to Japanese.

図14は、図6と類似の例であって、(a)区切りパターンの例と、(b)構成要素名の抽出例と、(c)説明パターン文の例として、中国語に対応するようにするための例を示している。   FIG. 14 is an example similar to FIG. 6, and (a) an example of a delimiter pattern, (b) an example of extraction of component names, and (c) an example of an explanation pattern sentence so as to correspond to Chinese. An example to make it.

図14(a)の区切りパターンには、「;」(セミコロン)等の記号、「包括」などの特徴表現が含まれている。図14(b)の構成要素名の抽出例は、図6(b)のものと同様である。すなわち、構成要素の先頭に位置する名詞(名詞句)が、かかる構成要素の構成要素名として抽出される。図14(c)の説明パターン文の例として、「:」(コロン)直後の「所述」で始まり名詞(名詞句)で終わる文、「以及」で始まり名詞(名詞句)で終わる文がある。   The delimiter pattern in FIG. 14A includes a symbol such as “;” (semi-colon) and a feature expression such as “inclusive”. An example of extracting the component element names in FIG. 14B is the same as that in FIG. That is, a noun (noun phrase) positioned at the head of the component is extracted as the component name of the component. As an example of the explanation pattern sentence in FIG. 14C, a sentence that starts with “description” immediately after “:” (colon) and ends with a noun (noun phrase), and a sentence that starts with “follow” and ends with a noun (noun phrase). is there.

図14に示した例にしたがって処理をすれば、サーバ30は、図15および図16で示すようなタグを付与することになる。図15(a)および図15(b)はそれぞれ図4(a)および図4(b)に対応する説明態様である。図16(a)および図16(b)はそれぞれ図4(c)および図4(d)に対応する説明態様である。   If processing is performed in accordance with the example shown in FIG. 14, the server 30 attaches tags as shown in FIG. 15 and FIG. FIGS. 15A and 15B are explanatory forms corresponding to FIGS. 4A and 4B, respectively. FIGS. 16A and 16B are explanatory modes corresponding to FIGS. 4C and 4D, respectively.

図15(a)の例では、サーバ30によって「包括」、「;」(セミコロン)、「以及」および「。」(ピリオド)が検出されて、構成要素CA1〜CA3の単位に中国語クレームが分割されている。このとき、サーバ30は先ず、図7のステップS103と同様に、対応するタグを付与する(図15(b))。   In the example of FIG. 15A, the server 30 detects “inclusion”, “;” (semicolon), “follow” and “.” (Period), and a Chinese claim is made in the unit of the components CA1 to CA3. It is divided. At this time, the server 30 first assigns a corresponding tag as in step S103 of FIG. 7 (FIG. 15B).

そして、サーバ30は、図7のステップS104と同様に、構成要素名を抽出してタグ61,62,63を付与する(図16(a))。さらに、サーバ30は、図7のステップS105と同様に、タグ71〜75を付与して説明パターン文ごとに構成要素を分割する(図16(b))。   Then, the server 30 extracts the component element names and assigns the tags 61, 62, and 63, similarly to step S104 in FIG. 7 (FIG. 16A). Furthermore, similarly to step S105 in FIG. 7, the server 30 assigns tags 71 to 75 and divides the constituent elements for each explanation pattern sentence (FIG. 16B).

このようにして、サーバ30が、図7のステップS106およびS107と同様に処理すると、通信端末10は、図7のステップS108において、例えば図17(a)に示すような訳文を表示する。   Thus, when the server 30 performs processing in the same manner as steps S106 and S107 in FIG. 7, the communication terminal 10 displays a translated sentence as shown in FIG. 17A, for example, in step S108 in FIG.

図17(b)は、サーバ30が図7のステップS102〜S107を行わずに翻訳された訳文の表示例を示す。この表示では、クレームの内容を理解するのが困難である。   FIG. 17B shows a display example of a translation translated by the server 30 without performing steps S102 to S107 of FIG. This display makes it difficult to understand the content of the claim.

(変更例3)
上記第1実施形態および第1実施形態の中で述べた変形例で例示したタグは、構成要素、構成要素名および説明パターン文を示すための情報であればよく、当業者に知られた他の情報を適用することもできる。
(Modification 3)
The tag exemplified in the first embodiment and the modification described in the first embodiment may be information for indicating a component, a component name, and an explanation pattern sentence, and is known to those skilled in the art. This information can also be applied.

(変更例4)
以上では、各言語に対応して請求項の翻訳が行われていく場合について説明した。しかしながら、特定の技術分野(例えば、機械など)では発明の内容次第では図面を確認することで、発明の理解がさらに容易になることもあり得るし、特定の技術分野(例えば、情報技術など)では公開されている複数の特許文献の中から、類似する発明の請求項の内容を確認したい場合もある。そのため、関連する特許文献ごとに、請求項1の訳文と、代表図とを含む一覧が表示されるようにできることが好ましい。
(Modification 4)
The case where the claims are translated corresponding to each language has been described above. However, in a specific technical field (for example, a machine), depending on the content of the invention, it may be easier to understand the invention by checking the drawings, or a specific technical field (for example, information technology). Then, there are cases where it is desired to confirm the contents of claims of similar inventions from a plurality of published patent documents. Therefore, it is preferable that a list including the translation of claim 1 and a representative diagram can be displayed for each related patent document.

図18は、かかる一覧を含む通信端末10の表示部15の表示例を示す。図18の例では、検索結果ごとに、請求項1の訳文(図13の表示例と同様)と、代表図とが一覧表示される。   FIG. 18 shows a display example of the display unit 15 of the communication terminal 10 including such a list. In the example of FIG. 18, for each search result, a translation of claim 1 (similar to the display example of FIG. 13) and a representative diagram are displayed as a list.

この場合、サーバ30のCPU31は、通信端末10からの要求(例えば、図18の最上段に記載の欧州特許公報の番号)に応じて、その要求に応じた特許文献を、例えば外部のデータベースサーバから検索して取得し、この特許文献を対象として、図7および図8のフローチャートと同様のステップ処理を実施する。さらに、CPU31は、対象となる特許文献に関連する他の特許公報(例えば、図18の第2段目および第3段目のもの)を例えば上記外部のデータベースサーバから取得して、図7および図8のフローチャートと同様のステップ処理を実施する。関連する他の特許公報の検索は、請求項1内の用語、あらかじめ登録されている関連用語などに基づいて行われる。   In this case, the CPU 31 of the server 30 responds to a request from the communication terminal 10 (for example, the number of the European Patent Publication described at the top of FIG. 18), and obtains a patent document corresponding to the request, for example, an external database server. The same step process as the flowchart of FIG. 7 and FIG. 8 is implemented for this patent document. Further, the CPU 31 acquires other patent publications (for example, those in the second and third stages in FIG. 18) related to the target patent document from, for example, the above external database server, and FIG. Step processing similar to the flowchart of FIG. 8 is performed. Retrieval of other related patent publications is performed based on terms in claim 1, related terms registered in advance, and the like.

さらに、CPU31は、対象となる特許文献の代表図を、例えば上記外部のデータベースサーバから取得して各特許文献の訳文と関連付けて、通信端末10に出力する。   Further, the CPU 31 acquires a representative diagram of the target patent document from, for example, the external database server, associates it with the translation of each patent document, and outputs it to the communication terminal 10.

このような一覧表示は、関連する発明の内容の理解を視覚的に一層促進する役割を果たす。   Such a list display plays a role of visually promoting further understanding of the contents of the related invention.

10 通信端末
30 サーバ
301 形態素解析部
302 構成要素単位分割部
303 構成要素名特定部
304 説明パターン文単位分割部
305 翻訳部
306 記憶部
307 出力部
308 文構造変更部
DESCRIPTION OF SYMBOLS 10 Communication terminal 30 Server 301 Morphological analysis part 302 Constituent element division | segmentation part 303 Constituent element name specific | specification part 304 Explanation pattern sentence unit division part 305 Translation part 306 Storage part 307 Output part 308 Sentence structure change part

Claims (7)

通信端末と通信可能に接続される機械翻訳装置であって、
前記通信端末から、第1言語により記述された請求項の翻訳要求を受け付けた場合、前記請求項に前記第1言語で記載されている原文の形態素解析を行う形態素解析部と、
前記形態素解析の結果に基づいて、前記請求項の中から発明の構成要素を区切るために使用されている区切りパターンを検出し、前記構成要素ごとに前記請求項を分割する構成要素単位分割部と、
前記構成要素の中から前記形態素解析の結果に基づいて構成要素名を抽出し、前記構成要素名を特定する構成要素名特定部と、
前記構成要素内に、当該構成要素を説明するための説明パターン文が出現する場合は、前記説明パターン文ごとに前記構成要素を分割する説明パターン文単位分割部と、
前記特定された構成要素名を含み、かつ前記分割を有する前記請求項を第2言語に翻訳する翻訳部と、
前記請求項の翻訳文を記憶する記憶部と、
前記記憶部の前記翻訳文を前記通信端末に出力する出力部と
を含むことを特徴とする機械翻訳装置。
A machine translation device communicably connected to a communication terminal,
A morpheme analyzer that performs a morphological analysis of the original text described in the first language in the claim when receiving a translation request for the claim described in the first language from the communication terminal;
Based on the result of the morphological analysis, a delimiter pattern used to delimit the constituent elements of the invention is detected from the claims, and a component unit dividing unit that divides the claim for each component element ,
A component name is extracted from the component based on the result of the morphological analysis, and the component name specifying unit for specifying the component name;
When an explanation pattern sentence for explaining the constituent element appears in the constituent element, an explanation pattern sentence unit dividing unit that divides the constituent element for each explanation pattern sentence;
A translation unit including the identified component name and translating the claim having the division into a second language;
A storage unit for storing the translation of the claim;
An output unit that outputs the translated sentence in the storage unit to the communication terminal.
前記説明パターン文の文構造に応じて、前記説明パターン文が修飾する名詞または名詞句からなる主語、および述語動詞を含むように当該説明パターン文の文構造を変更する文構造変更部をさらに含むことを特徴とする請求項1に記載の機械翻訳装置。   According to the sentence structure of the explanation pattern sentence, further includes a sentence structure changing unit that changes the sentence structure of the explanation pattern sentence so as to include a subject consisting of a noun or a noun phrase modified by the explanation pattern sentence and a predicate verb. The machine translation apparatus according to claim 1. 前記主語が2語以上からなる名詞句の場合には、前記文構造変更部は、前記名詞句が記述されている原文の訳文と、前記説明パターン文内に含まれる主語候補の訳文とが一致するように、前記名詞句に含まれる語を補完して前記主語を決定することを特徴とする請求項2に記載の機械翻訳装置。   When the subject is a noun phrase consisting of two or more words, the sentence structure changing unit matches the translated sentence of the original sentence in which the noun phrase is described with the translated candidate sentence included in the explanation pattern sentence The machine translation apparatus according to claim 2, wherein the subject is determined by complementing a word included in the noun phrase. 前記文構造変更部は、同一の構成要素内で、前記構成要素名が繰り返し出現する場合は、前記繰り返される構成要素名を集約化して文構造を変更することを特徴とする請求項1ないし3のいずれか1項に記載の機械翻訳装置。   4. The sentence structure changing unit, when the component name repeatedly appears in the same component, aggregates the repeated component names to change the sentence structure. The machine translation device according to any one of the above. 前記出力部は、前記通信端末において、前記分割された構成要素、前記特定された構成要素名および前記分割された説明パターン文の相互関係が視認可能な形態で表示させるように出力することを特徴とする請求項1ないし4のいずれか1項に記載の機械翻訳装置。   The output unit is configured to output in such a manner that a mutual relationship between the divided component element, the identified component element name, and the divided explanation pattern sentence is displayed in the communication terminal in a visible form. The machine translation device according to any one of claims 1 to 4. コンピュータによって実行される機械翻訳方法であって、
通信端末から、第1言語により記述された請求項の翻訳要求を受け付けた場合、前記請求項に前記第1言語で記載されている原文の形態素解析を行うステップと、
前記形態素解析の結果に基づいて、前記請求項の中から発明の構成要素を区切るために使用されている区切りパターンを検出し、前記構成要素ごとに前記請求項を分割するステップと、
前記構成要素の中から前記形態素解析の結果に基づいて構成要素名を抽出し、前記構成要素名を特定するステップと、
前記構成要素内に、当該構成要素を説明するための説明パターン文が出現する場合は、前記説明パターン文ごとに前記構成要素を分割するステップと、
前記特定された構成要素名を含み、かつ前記分割を有する前記請求項を第2言語に翻訳するステップと、
前記翻訳の結果を前記通信端末に出力するステップと
を含むことを特徴する機械翻訳方法。
A machine translation method executed by a computer,
When receiving a request for translation of a claim written in the first language from the communication terminal, performing a morphological analysis of the original text described in the first language in the claim;
Detecting a delimiter pattern used to delimit components of the invention from the claims based on the result of the morphological analysis, and dividing the claim for each component;
Extracting a component name from the component based on the result of the morphological analysis, and specifying the component name;
When an explanation pattern sentence for explaining the constituent element appears in the constituent element, dividing the constituent element for each explanation pattern sentence;
Translating the claim comprising the identified component name and having the partition into a second language;
Outputting the result of the translation to the communication terminal. A machine translation method comprising:
請求項6に記載の機械翻訳方法をコンピュータに実行させるためのプログラム。   A program for causing a computer to execute the machine translation method according to claim 6.
JP2013073666A 2013-03-29 2013-03-29 Machine translation apparatus, machine translation method and program Active JP6114090B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013073666A JP6114090B2 (en) 2013-03-29 2013-03-29 Machine translation apparatus, machine translation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013073666A JP6114090B2 (en) 2013-03-29 2013-03-29 Machine translation apparatus, machine translation method and program

Publications (2)

Publication Number Publication Date
JP2014199476A true JP2014199476A (en) 2014-10-23
JP6114090B2 JP6114090B2 (en) 2017-04-12

Family

ID=52356360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013073666A Active JP6114090B2 (en) 2013-03-29 2013-03-29 Machine translation apparatus, machine translation method and program

Country Status (1)

Country Link
JP (1) JP6114090B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017201489A (en) * 2016-05-06 2017-11-09 雲拓科技有限公司 Claims syntax analysis configuration method
JP2018120586A (en) * 2017-01-24 2018-08-02 雲拓科技有限公司 Processing apparatus for structural analysis of scope of claim

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293075A (en) * 1996-04-22 1997-11-11 Roehm Properties Bv Device and method for machine translation
JP2012003517A (en) * 2010-06-17 2012-01-05 Intec Inc Claim structure information generating device, claim structure information generating method, and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293075A (en) * 1996-04-22 1997-11-11 Roehm Properties Bv Device and method for machine translation
JP2012003517A (en) * 2010-06-17 2012-01-05 Intec Inc Claim structure information generating device, claim structure information generating method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017201489A (en) * 2016-05-06 2017-11-09 雲拓科技有限公司 Claims syntax analysis configuration method
JP2018120586A (en) * 2017-01-24 2018-08-02 雲拓科技有限公司 Processing apparatus for structural analysis of scope of claim

Also Published As

Publication number Publication date
JP6114090B2 (en) 2017-04-12

Similar Documents

Publication Publication Date Title
Pasha et al. Madamira: A fast, comprehensive tool for morphological analysis and disambiguation of arabic.
CN102439540B (en) Input method editor
Quirk et al. MSR SPLAT, a language analysis toolkit
JP2007072646A (en) Retrieval device, retrieval method, and program therefor
KR20210048569A (en) Patent document creating device, method, computer program, computer-readable recording medium, server and system
WO2020026366A1 (en) Patent evaluation determination method, patent evaluation determination device, and patent evaluation determination program
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
JP5927955B2 (en) Information processing apparatus and program
JP2022055305A (en) Text processing method for generating text summarization, apparatus, device, and storage medium
RU2595531C2 (en) Method and system for generating definition of word based on multiple sources
JP6114090B2 (en) Machine translation apparatus, machine translation method and program
KR101069278B1 (en) Apparatus and Method for visualization of patent claim
KR20210013991A (en) Apparatus, method, computer program, computer-readable storage device, server and system for drafting patent document
WO2015075920A1 (en) Input assistance device, input assistance method and recording medium
JP2019053262A (en) Learning system
JP2009128967A (en) Document retrieval apparatus
JP5468576B2 (en) Translation apparatus, translation method, and translation program
JP5621145B2 (en) Document check device, document check program, and document check method
JP2009169761A (en) Electronic dictionary system, display control method of electronic dictionary, computer program, and data storage medium
JP2008276561A (en) Morpheme analysis device, morpheme analysis method, morpheme analysis program, and recording medium with computer program recorded thereon
JP2020021455A (en) Patent evaluation determination method, patent evaluation determination device, and patent evaluation determination program
JP2004102554A (en) Text image conversion tool
WO2016131260A1 (en) Word processing method and apparatus
JP6934621B2 (en) Methods, equipment, and programs
JP2010152705A (en) Experience information retrieval system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170316

R150 Certificate of patent or registration of utility model

Ref document number: 6114090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250