JPWO2009088067A1 - 機械翻訳装置および機械翻訳方法 - Google Patents

機械翻訳装置および機械翻訳方法 Download PDF

Info

Publication number
JPWO2009088067A1
JPWO2009088067A1 JP2009548963A JP2009548963A JPWO2009088067A1 JP WO2009088067 A1 JPWO2009088067 A1 JP WO2009088067A1 JP 2009548963 A JP2009548963 A JP 2009548963A JP 2009548963 A JP2009548963 A JP 2009548963A JP WO2009088067 A1 JPWO2009088067 A1 JP WO2009088067A1
Authority
JP
Japan
Prior art keywords
translation
basic element
premise
machine translation
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009548963A
Other languages
English (en)
Other versions
JP5423398B2 (ja
Inventor
貴士 大西
貴士 大西
安藤 真一
真一 安藤
定政 邦彦
邦彦 定政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009548963A priority Critical patent/JP5423398B2/ja
Publication of JPWO2009088067A1 publication Critical patent/JPWO2009088067A1/ja
Application granted granted Critical
Publication of JP5423398B2 publication Critical patent/JP5423398B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

前処理部(3)は、入力部(1)から入力された原文テキストが、請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定し、基本要素機能の単位で原文テキストを出力する。翻訳部(4)は、前処理部(3)から出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変える。これにより、請求項を適切に翻訳することができる。

Description

本発明は、機械翻訳装置および機械翻訳方法に関し、特に特許請求の範囲の請求項の翻訳を適切に行う機械翻訳システムおよび機械翻訳方法に関する。
機械翻訳処理においては、入力文が長くなると、解釈の曖昧性が多くなるため、処理時間の増大や、解析誤りの増加等の問題が出てくる。その典型例は、文長が非常に長くなることが多い請求項の機械翻訳である。そこで、請求項を適当な単位に分割し、その個々に対して個別に翻訳処理を行うことで、これらの問題に対処する方法が提案されている。
例えば文献1(特開平9-293075号)には、請求項特有の文体に注目して、入力請求項を分割することで、適切な翻訳結果を得るようにした機械翻訳装置の一例が記載されている。図7に示すように、文献1に記載された機械翻訳装置201は、パターン照合手段202と、パターン格納手段203と、階層化手段204と、階層データ逆転手段205と、翻訳結合手段206とから構成されている。
このような構成を有する機械翻訳装置201は次のように動作する。すなわち、まずパターン照合手段202で、パターン格納手段203に格納された請求項分割用パターンと入力請求項とのパターンマッチングを行い、移行句などの請求項特有のフレーズ、体言句、用言句に入力請求項を分割する。次に、階層化手段204において各部分を解析し、修飾関係から階層構造を作成する。そして、階層データ逆転手段205で階層構造を逆転し日本語の語順に直す。最後に、翻訳結合手段206で各階層を翻訳し結果を出力する。
図7に示した機械翻訳装置201は、請求項特有の文体に注目して請求項を分割しているが、各分割単位に対して同じ手法で翻訳を行っている。このため、翻訳する分割単位が、請求項の記載形式を構成する複数の基本要素機能の何れに属していても、翻訳の仕方が同じになるという課題がある。
[発明の目的]
本発明の目的は、請求項を従来より適切に翻訳できるようにすることにある。
本発明の機械翻訳装置は、原言語で記述された請求項を目的言語に変換する機械翻訳装置であって、入力の原文テキストの少なくとも一部分が、請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定する機能認定手段を有し、基本要素機能の単位で原文テキストを出力する前処理手段と、前処理手段から出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変える翻訳手段とを備える。
本発明の機械翻訳方法は、原言語で記述された請求項を目的言語に変換する機械翻訳方法であって、入力の原文テキストの少なくとも一部分が請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定するステップと、基本要素機能の単位で原文テキストを出力するステップと、出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変えて翻訳するステップとを備える。
本発明の効果は、請求項を適切に翻訳できることである。その理由は、請求項の基本要素機能の単位で翻訳手段における翻訳の仕方を変えることができるためである。
図1は、本発明の第1の実施の形態の構成を示すブロック図である。 図2は、本発明の第1の実施の形態の動作を示す流れ図である。 図3は、本発明の第2の実施の形態の構成を示すブロック図である。 図4は、本発明の第2の実施の形態の動作を示す流れ図である。 図5は、本発明の第3の実施の形態の構成を示すブロック図である。 図6は、本発明の第3の実施の形態の動作を示す流れ図である。 図7は、本発明に関連する機械翻訳装置の構成を示すブロック図である。
『第1の実施の形態』
図1を参照すると、本発明の第1の実施の形態に係る機械翻訳装置101は、日本語で記述された請求項を翻訳して英語で記述された請求項を出力する日英機械翻訳装置であり、入力部1と、パターン記憶部2と、出力部5と、これらに接続された処理装置6とから構成されている。
入力部1は、機械翻訳装置101への入力となる文字列(原文テキスト)を受け取り、前処理部3に入力文字列を渡すユニットであり、例えばキーボードやファイル読み取り装置などで構成される。本実施の形態では、原言語で記述された請求項を予め基本要素機能の単位に分割した文字列が入力部1から入力される。
原言語で記述された請求項は、前提部、構成要素部、付加説明部の3種類の基本要素機能で構成されている。前提部は、発明の前提を記述した部分で、英文の請求項のプリアンブルと移行句に相当する部分である。英文の請求項には1つの請求項に必ず1つのプリアンブルが存在するため、外国出願を考慮して記載された日本語による請求項には、1つの請求項に必ず1つの前提部が存在する。構成要素部は、発明の構成要素を記述した部分である。発明は通常複数の構成要素から構成されるため、1つの請求項には複数の構成要素部が記載される場合がある。付加説明部は、既出の構成要素に対して付加的な説明を加える部分である。付加説明部は、請求項によっては省略されている場合がある。
パターン記憶部2は、入力文字列が請求項の記載形式を構成する基本要素機能として予め定義された前提部、構成要素部、付加説明部のうちの何れの基本要素機能であるかを認定する際に使用する照合パターンを記憶するユニットであり、例えば磁気ディスク等で構成される。パターン記憶部2に記憶されるパターンは、例えば、パターン条件とパターン条件にマッチした際に認定される要素機能との組から構成される。パターン条件は、例えば、変数部と固定部との組み合わせからなる。変数部は、体言句、用言句、数字といった条件を記述し、可変の文字列とマッチする部分である。固定部は、マッチする表層文字列を直接記述した部分である。
文献1で用いる請求項分割用パターンと本実施の形態で用いる照合パターンとの違いは、文献1で用いる請求項分割用パターンは文切りのためのパターンであるのに対して、本実施の形態で用いる照合パターンは要素機能認定のためのパターンである点にある。また、文献1で用いる請求項分割用パターンは、請求項全体に対して適用するパターンであるのに対して、本実施の形態で用いる照合パターンは、請求項の一部分に対して適用するパターンである点でも両者は異なる。
処理装置6は、入力部1から基本要素機能単位で入力される原文テキストに対して、パターン記憶部2に記憶された照合パターンを用いて何れの基本要素機能であるかを認定し、この認定した基本要素機能の種類に応じた翻訳の仕方で原文テキストを翻訳して出力部5から出力する装置である。この処理装置6は、前処理部3と翻訳部4とを含んで構成される。
前処理部3は、入力部1から基本要素機能単位で入力された原文テキストが、前提部、構成要素部および付加説明部のうちの何れの基本要素機能であるかをパターン記憶部2に記憶された照合パターンと入力原文テキストとのパターンマッチングを行うことで認定する機能認定部31を有し、認定結果と入力原文テキストとを翻訳部4に伝達する機能を持つ。
ここで、前処理部3は、機能認定部31を用いて、認定した基本要素機能をさらに下位の区分に分類し、その分類結果を含む認定結果と入力原文テキストとを翻訳部4に伝達するようにしても良い。
例えば、前提部であると認定された基本要素機能について、その前提部が、独立項の前提部である独立項前提部であるか、それとも従属項の前提部である従属項前提部であるかを認定することができる。また、構成要素部であると認定された基本要素機能について、その構成要素部が、体言で表される体言構成要素部であるか、それとも用言で表される用言構成要素部であるかを認定することができる。
前提部が、独立項前提部、従属項前提部の何れであるかは、例えば、その認定に使用する照合パターンをパターン記憶部2に事前に記憶しておき、機能認定部31において、入力文字列とパターン記憶部2に記憶された照合パターンとのパターンマッチングを行うことにより認定することができる。
構成要素部が、体言構成要素部、用言構成要素部の何れであるかは、例えば、構成要素が体言句であるか、用言句であるかを判別することにより認定することができる。
なお、前提部が独立項前提部、従属項前提部の何れであるかの認定、および、構成要素部が体言構成要素部、用言構成要素部の何れであるかの認定は、機能認定部31で基本要素機能の認定後に行うものとして説明したが、基本要素機能の認定と同時に行っても良いし、翻訳部4内の後述する前提部翻訳部42や構成要素部翻訳部43で翻訳処理を行う前にそれぞれの認定を行っても良い。
翻訳部4は、翻訳切替部41と、前提部翻訳部42と、構成要素部翻訳部43と、付加説明部翻訳部44とから構成されている。
翻訳切替部41は、前処理部3から伝達された原文テキストをそれに付加された機能認定部31の認定結果で示される基本要素機能の種類に従って、翻訳部を切り替えるユニットである。具体的には、機能認定部31で前提部であると認定された原文テキストは前提部翻訳部42に伝達して翻訳させ、構成要素部であると認定された原文テキストは構成要素部翻訳部43に伝達して翻訳させ、付加説明部であると認定された原文テキストは付加説明部翻訳部44に伝達して翻訳させる。
前提部翻訳部42は、入力原文テキストを前提部とみなして翻訳処理を行い、翻訳結果を出力部5に渡す。前提部翻訳部42は、入力原文テキストを前提部とみなして翻訳処理するため、先頭単語の先頭文字は大文字で訳出する。また、前提部翻訳部42は、好ましくは、機能認定部31で認定された前提部の種類(独立項前提部であるか従属項前提部であるかの違い)や、表層文字列の違いによって前提部の訳出を制御する。具体的には、前提部の主辞の体言に関しては、独立項前提部か従属項前提部かによって、冠詞の制御を行う。独立項前提部であれば、主辞の体言が初出であるとみなせるので不定冠詞で訳出する。従属項前提部であれば、主辞の体言が既出であるとみなせるので定冠詞で訳出する。
構成要素部翻訳部43は、入力原文テキストを構成要素部とみなして翻訳処理を行い、翻訳結果を出力部5に渡す。構成要素部翻訳部43は、入力原文テキストを構成要素部とみなして翻訳処理するため、先頭単語の先頭文字の大文字化は行わない。また、構成要素部翻訳部43は、好ましくは、機能認定部31で認定された構成要素部の種類(体言構成要素部であるか用言構成要素部であるかの違い)や、表層文字列によって構成要素部の訳出を制御する。具体的には、体言構成要素部と認定された場合、体言が主辞の位置にあるかどうかで、冠詞の制御を行う。主辞の位置にある体言は、初出であるとみなせるので不定冠詞として訳出する。主辞以外の位置にある体言は、既出であるとみなせるので定冠詞として訳出する。
付加説明部翻訳部44は、入力原文テキストを付加説明部とみなして翻訳処理を行い、翻訳結果を出力部5に渡す。付加説明部翻訳部44では、入力原文テキストを付加説明部とみなして翻訳処理するため、先頭単語の先頭文字の大文字化は行わない。
本実施の形態の翻訳部4は、内部に翻訳切替部41、前提部翻訳部42、構成要素部翻訳部43、付加説明部翻訳部44を持ち、各翻訳部を翻訳切替部41で切り替える構成としたが、内部の翻訳部が1個で、その1個の翻訳部に対して基本要素機能の種類をパラメータとして与えることで、翻訳部内での翻訳の処理を制御する構成であっても良い。
上述のような構成を有する前処理部3および翻訳部4は、処理装置6を構成するコンピュータとプログラムとで実現することができる。プログラムは磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記憶され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前処理部3および翻訳部4として機能させる。
出力部5は、得られた翻訳結果を出力するディスプレイ装置やプリンタなどで構成される。
次に、図1及び図2のフローチャートを参照して本実施の形態の全体の動作について説明する。
まず、入力部1で入力された原文テキストの入力文字列に対して、前処理部3が機能認定部31を用いて基本要素機能の種類の認定を行い、認定結果と入力文字列とを翻訳部4に伝達する(図2のステップA1)。次に、翻訳部4において、翻訳切替部41により、認定結果が前提部であるか否かの判定を行う(ステップA2)。ステップA2で前提部であると判定された場合は、入力文字列が前提部翻訳部42で翻訳される(ステップA4)。ステップA2で前提部でないと判定された場合は、翻訳切替部41により、認定結果が構成要素部であるか否かの判定を行う(ステップA3)。ステップA3で構成要素部であると判定された場合は、入力文字列が構成要素部翻訳部43で翻訳される(ステップA5)。ステップA3で構成要素部でないと判定された場合は、付加説明部と判定され、入力文字列が付加説明部翻訳部44で翻訳される(ステップA6)。
次に、本実施の形態の効果について説明する。
本実施の形態では、入力部1から入力された原文テキストが、請求項の記載形式を構成する前提部、構成要素部および付加説明部の何れであるかを認定し、その認定結果に応じて翻訳の仕方を制御するため、請求項を適切に訳出することができる。具体的には、前提部の場合は先頭単語の先頭文字の大文字化を行い、構成要素部および付加説明部の場合は先頭単語の先頭文字の大文字化を行わないようにすることができる。
また、前提部をさらに独立項前提部と従属項前提部とに分類し、その分類に応じて翻訳の仕方を制御するため、請求項をより適切に訳出することができる。具体的には、「○○であって、」という表現が独立項前提部と認定された場合、「○○, comprising:」と訳出し、従属項前提部と認定された場合は、「○○, wherein」と訳出することができる。
また、冠詞についても請求項では厳密な訳し分けが求められるが、要素機能の認定に応じて適切に冠詞の訳し分けが行える。
『第1の実施の形態の実施例』
次に、第1の実施の形態に基づく第1の実施例について述べる。第1の実施例は、日本語の請求項を英語へ翻訳する日英機械翻訳装置である場合を考える。
第1の実施例では、予め基本要素機能の単位に分割された請求項が、入力部1から処理装置6に入力される。一例として、「機械翻訳装置であって、入力装置と、日本語を英語に翻訳する翻訳手段と、そして、出力装置と、を備え、前記翻訳手段は、パターン翻訳を利用する。」という請求項の記載が、「機械翻訳装置であって、/入力装置と、/日本語を英語に翻訳する翻訳手段と、そして、/出力装置と、を備え、/前記翻訳手段は、パターン翻訳を利用する。」と分割されて入力された場合を取り上げる。ここで、/は分割点を示す。
処理の流れの説明の前に、パターン記憶部2に記憶される照合パターンについて説明する。
本実施例の場合、パターン記憶部2には表1に示す照合パターンと表2に示す照合パターンとが記憶されている。表1の照合パターンは、基本要素機能が、前提部、構成要素部および付加説明部の何れであるかを認定するためのものであり、各々の照合パターンは、パターン条件と、その結果認定される基本要素機能の種類との組で構成される。図中の括弧付きの表記はパターン条件の変数部を表し、カッコ内にその変数部がマッチする条件が記述してある。その他の部分はパターン条件の固定部である。例えば、1行目の照合パターンは、入力文字列が「(体言句)であって、」というパターン条件にマッチすれば、その入力文字列は前提部である、とする照合パターンを示す。表1の照合パターン群には、認定結果が付加説明部である照合パターンは1つも存在せず、何れの照合パターンともマッチしなかった入力文字列は付加説明部と認定される。
Figure 2009088067
表2の照合パターンは、前提部であると認定された基本要素機能が、さらに、独立項前提部、従属項前提部の何れであるかを認定するためのものであり、各々の照合パターンは、パターン条件と、その結果認定される前提部の種類との組で構成される。図中の括弧付きの表記はパターン条件の変数部を表し、カッコ内にその変数部がマッチする条件が記述してあり、その他の部分はパターン条件の固定部である。例えば、1行目の照合パターンは、前提部を構成する入力文字列中に、「請求項(数字)に記載の」というパターン条件にマッチする部分があれば、その前提部は従属項前提部である、とする照合パターンを示す。表2の照合パターン群には、認定結果が独立項前提部である照合パターンは1つも存在せず、何れの照合パターンともマッチしなかった前提部は独立項前提部と認定される。
Figure 2009088067
以上の例を用いて処理の流れを具体的に説明する。
まず、入力部1には、「機械翻訳装置であって、」や「日本語を英語に翻訳する翻訳手段と、そして、」等が入力される。
次に、前処理部3では、機能認定部31を用いて、入力文字列と表1の各照合パターンのパターン条件とのパターンマッチングを行い、基本要素機能の何れであるかの認定を行う。「機械翻訳装置であって、」の例では、表1の1行目の照合パターンの「(体言句)であって、」のパターン条件がマッチするため前提部と認定する。さらに、前提部と認定された場合は、表2に示す照合パターンのパターン条件を満たすかどうかで独立項前提部か、従属項前提部かの認定を行う。つまり、表2の何れかのパターン条件を満たす場合は、従属項前提部と認定し、何れのパターン条件にも該当しない場合は独立項前提部と認定する。「機械翻訳装置であって、」の例では、表2の何れのパターン条件にも該当しないので、独立項前提部と認定する。
「日本語を英語に翻訳する翻訳手段と、そして、」の例では、表1の4行目の照合パターンにおける「(体言句)と、そして、」のパターン条件がマッチするため、構成要素部と認定する。さらに、構成要素部と認定された場合は、変数部が体言句か用言句かによって、体言構成要素部か用言構成要素部かの認定を行う。「日本語を英語に翻訳する翻訳手段と、そして、」の例では、「日本語を英語に翻訳する翻訳手段」が体言句であるため、体言構成要素部と認定する。
「前記翻訳装置は、パターン翻訳を利用する。」の例では、表1の何れのパターン条件にもマッチしないので、付加説明部と認定する。
翻訳切替部41では、前処理部3で認定された基本要素機能に応じて翻訳部を切り替える。「機械翻訳装置であって、」の例では、認定結果が前提部であるので、前提部翻訳部42に切り替える。「日本語を英語に翻訳する翻訳手段と、そして、」の例では、認定結果が構成要素部であるので、構成要素部翻訳部43に切り替える。「前記翻訳装置は、パターン翻訳を利用する。」の例では、認定結果が付加説明部であるので付加説明部翻訳部44に切り替える。
以下、前提部翻訳部42、構成要素部翻訳部43、付加説明部翻訳部44での翻訳処理について説明する。
まず、前提部翻訳部42での翻訳処理について説明する。前提部は、引用部と本体部と定型部とに分けて翻訳する。引用部は、表2のパターン条件にあたる部分で、「請求項(数字)に記載の」のように請求項間の従属関係を記述した部分である。本体部は、体言句でまとめられる部分で、発明本体について記述した部分である。定型部は、末尾の「であって、」や「において、」のような定型的なつなぎ文句である。「機械翻訳装置であって、」の例の場合、この請求項は独立項であるので、引用部はなく、本体部は「機械翻訳装置」となり、定型部は「であって、」となる。
前提部の訳出は、本体部、引用部、定型部の部分毎に専用の規則に従って行い、英語への翻訳であれば、本体部の訳出結果、引用部の訳出結果、定型部の訳出結果を順に結合することで前提部の訳出結果を得る。また、前提部は英文請求項では文頭にあたるため、先頭単語の先頭文字は大文字にして訳出する。
本体部の訳出は、体言句であることが分かっているので、体言句の訳出となるように機械翻訳を行う。本体部の主辞の体言に対しては、独立項前提部か従属項前提部かの前提部の種類に応じて冠詞の制御を行う。例えば、独立項前提部なら初出であるとみなせるので不定冠詞で訳出し、従属項前提部なら既出であるとみなせるので定冠詞で訳出する。
引用部の訳出は、予め決められた条件とのパターンマッチングによって訳出を決める。引用部の訳出のためのパターン条件と訳出の具体例を表3に示す。例えば1行目の訳出パターンでは、「請求項(数字)に記載の」というパターン条件にマッチする部分は、「according to claim(num)」と訳出する。
Figure 2009088067
定型部の訳出は、前提部の種類(独立項前提部であるか、従属項前提部であるかの違い)と定型部の文言との組み合わせによって決める。定型部訳出の条件と訳出の具体例を表4に示す。例えば1行目の訳出パターンでは、前提部の種類が独立項前提部であって、定型部が「であって」のときは、「, comprising:」と訳出する。同じ「であって」の定型部でも従属項前提部の場合は、3行目の訳出パターンを適用し、「, wherein」と訳出する。
Figure 2009088067
上述の翻訳処理に従うと、「機械翻訳装置であって、」の訳出は以下のようになる。まず、本体部「機械翻訳装置」の訳出結果が”A machine translation apparatus”となり、定型部「であって、」の訳出結果が” , comprising:”となり、これらの訳出結果を結合すると”A machine translation apparatus, comprising:”となる。また、「請求項1記載の機械翻訳装置であって、」の場合は、「請求項1記載の」があるためこれは従属項前提部である。この例の訳出結果は、本体部が”The machine translation apparatus”となり、引用部が”according to claim 1”となり、定型部が”, wherein”となり、これらを結合すると” The machine translation apparatus according to claim 1, wherein”となる。
次に、構成要素部翻訳部43での翻訳処理について説明する。構成要素部は、本体部と定型部とに分けて翻訳する。本体部は、体言句または用言句にまとめられる部分で、発明の構成要素について記述した部分である。定型部は、末尾の「と、」や「と、そして」のように構成要素間の関係を記述した部分である。「入力装置と、」の例の場合、「入力装置」が本体部で、「と、」が定型部となる。
構成要素部の訳出は、本体部、定型部の各部分毎に専用の規則に従って行い、本体部の訳出結果、定型部の訳出結果を順に結合することで構成要素部の訳出結果を得る。また、構成要素部は前提部に続く部分であるため、先頭単語の先頭文字の大文字化は行わない。
本体部は、構成要素部の種類、表層文字列の条件、主語の有無によって訳出を制御する。本体部における冠詞の制御は、本体部の体言が主辞の位置にある場合は初出であるとみなせるので不定冠詞として訳出する。ただし、本体部が「手段」で終わる(meansで訳される)場合は無冠詞として訳出する。本体部の体言が主辞以外の位置にある場合は既出であるとみなせるので定冠詞として訳出する。本体部の訳出のための条件とそれによって決まる訳し方の指定の例を表5に示す。この表5の例に従えば、例えば、本体部が「日本語を英語に翻訳する翻訳手段」の場合、体言構成要素部であり、本体部が「手段」で終わるので、表5の1行目の訳出パターンを適用する。つまり、訳し方の指定は「** means for 動名詞句」で冠詞は無冠詞となり、”translation means for translating Japanese into English”と訳出される。
Figure 2009088067
定型部の訳出は、予め決められた条件とのパターンマッチングによって訳出を決める。定型部の訳出のためのパターン条件と訳出の具体例を表6に示す。例えば、表6の2行目の訳出パターンは、定型部が「と、そして、」の場合は”; and”と訳出することを示す。この訳出パターンに従うと、「入力装置と、」の訳出は、本体部「入力装置」の訳出が”an input apparatus”となり、定型部「と、」の訳出が”;”となり、つなぎ合わせると”an input apparatus;”となる。
Figure 2009088067
最後に、付加説明部翻訳部44での翻訳処理について説明する。付加説明部の翻訳は、基本的には一般の機械翻訳と同様に行う。ただし、付加説明部は請求項の末尾にあたるので、先頭単語の先頭文字の大文字化は行わない。
上述の翻訳処理により、「前記翻訳手段は、パターン翻訳を利用する。」の例の訳出結果は、“said translation means uses pattern translation.”となる。
以上のようにして請求項の翻訳処理が進む。「機械翻訳装置であって、/入力装置と、/日本語を英語に翻訳する翻訳装置と、そして、/出力装置と、を備え、/前記翻訳装置は、パターン翻訳を利用する。」の例の場合では、
「機械翻訳装置であって、」
→“A machine translation apparatus, comprising:”
「入力装置と、」
→“an input apparatus;”
「日本語を英語に翻訳する翻訳手段と、そして、」
→“translation means for translating Japanese into English; and”
「出力装置と、を備え、」
→“an output apparatus, wherein”
「前記翻訳手段は、パターン翻訳を利用する。」
→“said translation means uses pattern translation.”
のように個別に翻訳処理が行われ、請求項として適切に訳出される。
次に、第1の実施例による効果について説明する。
従来の機械翻訳装置では、要素機能に応じて訳出を制御できないため、例えば、独立項の「機械翻訳装置であって、」も従属項の「請求項1記載の機械翻訳装置であって、」も”comprising:”で訳出されてしまう。一方、本実施例の機械翻訳装置101では、基本要素機能に応じて訳出を制御できるため、従属項の場合は”wherein”で訳出するように適切な訳出結果を得ることができる。
さらに、従来の機械翻訳装置では請求項全体の構造を把握するために1つの請求項を一度に全部翻訳する必要があるが、本実施例の機械翻訳装置101では基本要素機能の単位ごとに翻訳を行うことが可能で、ユーザは各基本要素機能の翻訳をどのような順序で行ってもよい。その理由は、基本要素機能の認定が他の基本要素機能と独立して行えるためである。これによって、特定の基本要素機能だけを再翻訳する場合でも、先頭文字の大文字化や冠詞の訳出が適切に行えるという効果が得られる。
また、パターン条件に目的言語そのものを記述すれば、目的言語が混ざった入力に対しても同じ枠組みで対応することができる。例えば、「機械翻訳装置, comprising:」のような入力は従来の機械翻訳システムでは正しく解析が行えないが、前提部の定型部として”, comprising:”を登録しておけば、「機械翻訳装置であって、」の場合と同様の手順で翻訳処理が可能で、”A machine translation apparatus, comprising:”の訳出結果が得られる。
『第2の実施の形態』
図3を参照すると、本発明の第2の実施の形態に係る機械翻訳装置102は、図1に示した第1の実施の形態に係る機械翻訳装置101と比較して、入力部1および前処理部3の代わりに入力部9および前処理部7を備え、ルール記憶部8を新たに備えている点で相違し、その他の点は第1の実施の形態に係る機械翻訳装置101と同じである。
入力部9は、翻訳対象となる請求項の1文全体の原文テキストを入力する点で、請求項中の基本要素機能の単位で原文テキストを入力する第1の実施の形態における入力部1と相違する。
前処理部7は、機能認定部31に加えて分割部32を有する点で、第1の実施の形態における前処理部3と相違する。
分割部32は、機能認定部31を用いて、入力の原文テキストを基本要素機能の単位に分割する機能を有する。
ルール記憶部8は、基本要素機能の順序関係の制約ルールを記憶する。請求項は、前提部、構成要素部および付加説明部の3種類の基本要素機能から構成されており、基本要素機能の取り得る順序関係に制約がある。ルール記憶部8にはその制約に係るルールが事前に記憶されており、分割部32によって参照される。
具体的には、分割部32は、機能認定部31を用いて、入力請求項に対して基本要素機能認定のためのパターン条件とマッチする部分、つまり基本要素機能を抽出していき、ルール記憶部8に記憶された順序関係の制約ルールに適合する基本要素機能の列によって請求項を分割する。分割の可能性が複数ある場合は、複数候補を出力部5を通じてユーザに提示し、入力部9からの選択入力によってユーザに正しい分割を選ばせたり、パターン条件にうまくマッチできない場合にユーザに請求項の言い回しを編集させたりする構成を付加しても良い。
次に、図3及び図4のフローチャートを参照して本実施の形態の全体の動作について説明する。
まず、入力部9で入力された請求項全文の原文テキストが、前処理部7にて基本要素機能の単位に分割される(図4のステップB1)。分割されて得られた個々の基本要素機能毎に、その基本要素機能を構成する文字列と、その基本要素機能の種類とが図示しないメモリに保持される。基本要素機能の種類には、前提部、構成要素部および付加説明部の3種類がある。また、前提部については、機能認定部31によって独立項前提部および従属項前提部の何れであるかが認定されてその認定結果が付与され、構成要素部についても、機能認定部31によって体言構成要素部および用言構成要素部の何れであるかが認定されてその認定結果が付与される。
次に、前処理部7により、分割して得られた基本要素機能の列の例えば先頭の1つの基本要素機能が処理対象として注目され(ステップB2)、この注目中の基本要素機能にかかる原文テキストについて、第1の実施の形態と同様の手順で翻訳処理が行われる(ステップA2〜A6)。前処理部7は、1つの基本要素機能についての翻訳を終えると、残りの1つの基本要素機能に注目を移し、同様の処理を繰り返す。これを分割して得られた全ての基本要素機能に関して繰り返す(ステップB3)。
次に、本実施の形態の効果について説明する。
本実施の形態では、前処理部7が入力請求項を自動的に基本要素機能の単位に分割するため、請求項全体を翻訳する場合に、入力に先立って請求項を基本要素機能の単位に分割しておく作業が不要になり、翻訳作業の効率を高めることができる。
『第2の実施の形態の実施例』
次に、第2の実施の形態に基づく第2の実施例について述べる。第2の実施例も、日本語の請求項「機械翻訳装置であって、入力装置と、日本語を英語に翻訳する翻訳手段と、そして、出力装置と、を備え、前記翻訳手段は、パターン翻訳を利用する。」を英語へ翻訳する日英機械翻訳装置である場合を考える。
まず入力部9にて、「機械翻訳装置であって、入力装置と、日本語を英語に翻訳する翻訳手段と、そして、出力装置と、を備え、前記翻訳手段は、パターン翻訳を利用する。」の全体が入力される。
次に、入力請求項は、前処理部7の分割部32で基本要素機能の単位に分割される。分割部32では、ルール記憶部8に記憶されている例えば下記の制約ルールで分割を行う。
(前提部)(構成要素部)+(付加説明部)?
上記の制約ルールにおいて、+は1回以上の繰り返しを表し、?は省略可能であることを表す。つまり、上記の制約ルールは、最初に1つの前提部があり、その次に1つ以上の構成要素部が続き、最後は、構成要素部で終わるか、或いは1つの付加説明部で終わることを示している。
入力請求項が、「機械翻訳装置であって、入力装置と、日本語を英語に翻訳する翻訳手段と、そして、出力装置と、を備え、前記翻訳装置は、パターン翻訳を利用する。」の例では、機能認定部31による表1のパターン条件とのマッチングによって、「機械翻訳装置であって、」が前提部、「入力装置と、」、「日本語を英語に翻訳する翻訳手段と、そして、」、「出力装置と、を備え、」が構成要素部、「前記翻訳手段は、パターン翻訳を利用する。」が付加説明部とそれぞれ認定され、これらの基本要素機能の列が上述の制約ルールを満たしているので、分割部32は、入力請求項が「機械翻訳装置であって、/入力装置と、/日本語を英語に翻訳する翻訳手段と、そして、/出力装置と、を備え、/前記翻訳手段は、パターン翻訳を利用する。」と分割できると判断する。
しかし、上記の分割の他にも、機能認定部31が「入力装置と、日本語を英語に翻訳する翻訳手段」を1つの名詞句として解析した結果、「入力装置と、日本語を英語に翻訳する翻訳手段と、そして、」全体を1つの構成要素部と解析すると、「機械翻訳装置であって、/入力装置と、日本語を英語に翻訳する翻訳手段と、そして、/出力装置と、を備え、/前記翻訳手段は、パターン翻訳を利用する。」のような分割候補も出てくる。このように、複数の分割候補がある場合、分割部32は、出力部5を通じてユーザに複数候補を提示し、入力部9を通じてユーザから正しい分割の選択指示を入力する。
ここでは、分割部32で「機械翻訳装置であって、/入力装置と、/日本語を英語に翻訳する翻訳手段と、そして、/出力装置と、を備え、/前記翻訳手段は、パターン翻訳を利用する。」と分割されたとすると、以降は、それぞれの基本要素機能の単位について第1の実施例と同様の翻訳処理が行われ、以下のように適切な訳出結果が得られる。
A machine translation apparatus, comprising:
an input apparatus;
translation means for translating Japanese into English; and
an output apparatus, wherein
said translation means uses pattern translation.
次に第2の実施例による効果について説明する。第1の実施例では請求項を事前に基本要素機能の単位に分割して入力する必要があったが、第2の実施例は要素機能認定のパターン条件を利用して自動で分割を行ったり、人手による分割を支援したりする構成になっているため、分割作業を簡単に行える。
『第3の実施の形態』
図5を参照すると、本発明の第3の実施の形態に係る機械翻訳装置103は、図1に示した第1の実施の形態に係る機械翻訳装置101と比較して、翻訳部4の代わりに翻訳部10を備え、出願国受付部11を新たに備えている点で相違し、その他の点は第1の実施の形態に係る機械翻訳装置101と同じである。
出願国受付部11は、翻訳した請求項を含む出願書類を提出する国や地域(以下、出願国)の指定を入力部1を通じてユーザから受け付け、翻訳部10に伝達するユニットである。出願国受付部11も前処理部7および翻訳部10と同様に処理装置6を構成するコンピュータとプログラムとで実現することができる。
翻訳部10は、第1の実施の形態における翻訳部4と比較して、前提部翻訳部42の代わりに前提部翻訳部45を備えている点で相違する。
前提部翻訳部45は、第1の実施の形態における前提部翻訳部42と比較して、出願国受付部11で受け付けた出願国に応じて前提部の訳出の仕方を制御する機能を有する点で相違する。
次に、図5及び図6のフローチャートを参照して本実施の形態の全体の動作について説明する。
まず、出願国受付部11により、出願国の指定を受け付ける(図6のステップC1)。以下、第1の実施の形態と同様の手順で翻訳部を切り替え(ステップA1、A2、A3)、各翻訳部で翻訳を行う(ステップC2、A5、A6)。このとき、入力原文テキストが前提部であり、前提部翻訳部45で入力原文テキストが翻訳されるとき、前提部翻訳部45は、出願国受付部11で受け付けられた出願国に応じて訳出を制御する(ステップC2)。
次に、本実施の形態の効果について説明する。
本実施の形態では、指定された出願国に合わせた体裁での訳出が可能になる。
『第3の実施の形態の実施例』
次に、第3の実施の形態に基づく第3の実施例について述べる。第3の実施例も、日本語の請求項を英語へ翻訳する日英機械翻訳装置である場合を考える。
本実施例は第1の実施例と構成を同じとするが、出願国受付部11により出願国として米国および欧州の何れか一方の指定を受け付ける点と、前提部翻訳部45の定型部の訳出の条件に、独立項前提部、従属項前提部の違いや定型部の文言に加えて、出願国受付部11で受け付けた米国/欧州の違いを考慮して訳出を制御する点が第1の実施例と異なる。
前提部翻訳部45の定型部での訳出の条件と訳出の具体例を表7に示す。例えば1行目の訳出パターンでは、前提部の種類が独立項前提部であって、出願国が米国、定型部が「であって、」のときは、「, comprising:」と訳出する。同じ独立項前提部で、定型部も同じ「であって」である場合でも、出願国が欧州の場合は、2行目の訳出パターンを適用し、「, characterized by comprising:」と訳出する。
Figure 2009088067
この訳出パターンに従えば、出願国が欧州と指定され、入力が「機械翻訳装置であって、」である場合は、前提部、独立項前提部と認定し、訳出結果は、”A machine translation apparatus, characterized by comprising:”となる。
第3の実施例による効果について説明する。第1の実施例では、出願国によって翻訳部を制御することはできないが、第3の実施例では外部から出願国の指定を受け付け、出願国によって翻訳部を制御できる構成となっているため、出願国に応じて適切に訳出することができる。
以上の第3の実施の形態および第3の実施例は、出願国の指定に応じて前提部の訳出を制御したが、出願国の指定に応じて、構成要素部翻訳部43における構成要素部の訳出、付加説明部翻訳部44における付加説明部の訳出を制御することも可能である。また、第2の実施の形態および第2の実施例に、出願国受付部11を追加して、出願国に応じて翻訳部4の訳出を制御するようにしても良い。
以上、実施の形態および実施例を参照して本発明を説明したが、本発明は上記実施の形態および実施例に限定されるものではない。本発明の構成や詳細には、本発明の範囲内で当業者が理解し得る様々な変更をすることができる。例えば、実施の形態および実施例では、日英翻訳を例にしたが、英日翻訳など他言語の翻訳も同様に行える。
本発明によれば、請求項を翻訳する機械翻訳装置に適用できる。
本願は、2008年1月10日に出願された日本出願特願2008−002811号を基礎とする優先権を主張し、その開示のすべてをここに取り込む。

Claims (48)

  1. 原言語で記述された請求項を目的言語に変換する機械翻訳装置であって、
    入力の原文テキストの少なくとも一部分が、請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定する機能認定手段を有し、基本要素機能の単位で原文テキストを出力する前処理手段と、
    前記前処理手段から出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変える翻訳手段と
    を備えることを特徴とする機械翻訳装置。
  2. 前記前処理手段は、前記機能認定手段を用いて入力の原文テキストを基本要素機能の単位に分割する分割手段をさらに有することを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記基本要素機能は、発明の前提を記述した部分である前提部を構成する基本要素機能と、発明の構成要素を記述した部分である構成要素部を構成する基本要素機能と、既出の構成要素に対して付加的な説明を加える部分である付加説明部を構成する基本要素機能との内の少なくとも1つの基本要素機能を含むことを特徴とする請求項1に記載の機械翻訳装置。
  4. 前記翻訳手段は、前記機能認定手段の認定結果が前提部である場合は先頭単語の先頭文字の大文字化を行い、その他の場合は先頭単語の先頭文字の大文字化を行わないことを特徴とする請求項3に記載の機械翻訳装置。
  5. 前記前提部を構成する基本要素機能は、独立項の前提部である独立項前提部と、従属項の前提部である従属項前提部とに分類されることを特徴とする請求項3に記載の機械翻訳装置。
  6. 前記翻訳手段は、前記機能認定手段の認定結果が前提部である場合、独立項前提部か従属項前提部かによって前提部の訳出を制御することを特徴とする請求項5に記載の機械翻訳装置。
  7. 前記翻訳手段は、前記機能認定手段の認定結果が独立項前提部である場合は主辞の体言の冠詞を不定冠詞で訳出し、従属項前提部である場合は主辞の体言の冠詞を定冠詞で訳出することを特徴とする請求項6に記載の機械翻訳装置。
  8. 前記構成要素部を構成する基本要素機能は、体言句が主辞となっている体言構成要素部と、用言句が主辞となっている用言構成要素部とに分類されることを特徴とする請求項3に記載の機械翻訳装置。
  9. 前記翻訳手段は、前記機能認定手段の認定結果が構成要素部である場合、体言構成要素部か用言構成要素部かによって構成要素部の訳出を制御することを特徴とする請求項8に記載の機械翻訳装置。
  10. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言が特定の文字列で終わっているか否かによって構成要素部の訳出を制御することを特徴とする請求項9に記載の機械翻訳装置。
  11. 前記特定の文字列は「手段」、「工程」、「ステップ」のいずれかを少なくとも含んでいることを特徴とする請求項10に記載の機械翻訳装置。
  12. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出することを特徴とする請求項9に記載の機械翻訳装置。
  13. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出し、その他の体言を定冠詞で訳出することを特徴とする請求項9に記載の機械翻訳装置。
  14. 前記機能認定手段は、品詞によって条件を指定する変数部と表層文字列を指定する固定部とを含むパターンによるパターンマッチングを用いて基本要素機能の種類を認定することを特徴とする請求項1に記載の機械翻訳装置。
  15. 出願国を受け付ける出願国受付手段をさらに備え、
    前記翻訳手段は、前記出願国受付手段で受け付けられた出願国に応じて翻訳の仕方を変えることを特徴とする請求項1に記載の機械翻訳装置。
  16. 前記出願国受付手段は、出願国として米国と欧州の何れか一方を選択的に受け付けることを特徴とする請求項15に記載の機械翻訳装置。
  17. 原言語で記述された請求項を目的言語に変換する機械翻訳方法であって、
    入力の原文テキストの少なくとも一部分が請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定するステップと、
    基本要素機能の単位で原文テキストを出力するステップと、
    出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変えて翻訳するステップと
    を備えることを特徴とする機械翻訳方法。
  18. 入力の原文テキストを基本要素機能の単位に分割するステップをさらに備えることを特徴とする請求項17に記載の機械翻訳方法。
  19. 前記基本要素機能は、発明の前提を記述した部分である前提部を構成する基本要素機能と、発明の構成要素を記述した部分である構成要素部を構成する基本要素機能と、既出の構成要素に対して付加的な説明を加える部分である付加説明部を構成する基本要素機能との内の少なくとも1つの基本要素機能を含むことを特徴とする請求項17に記載の機械翻訳方法。
  20. 翻訳するステップは、認定結果が前提部である場合は先頭単語の先頭文字の大文字化を行い、その他の場合は先頭単語の先頭文字の大文字化を行わないステップを有することを特徴とする請求項19に記載の機械翻訳方法。
  21. 前記前提部を構成する基本要素機能は、独立項の前提部である独立項前提部と、従属項の前提部である従属項前提部とに分類されることを特徴とする請求項19に記載の機械翻訳方法。
  22. 翻訳するステップは、認定結果が独立項前提部か従属項前提部かによって前提部の訳出を制御するステップを有することを特徴とする請求項21に記載の機械翻訳方法。
  23. 制御するステップは、
    認定結果が独立項前提部である場合は主辞の体言の冠詞を不定冠詞で訳出するステップと、
    認定結果が従属項前提部である場合は主辞の体言の冠詞を定冠詞で訳出するステップと
    を有することを特徴とする請求項22に記載の機械翻訳方法。
  24. 前記構成要素部を構成する基本要素機能は、体言句が主辞となっている体言構成要素部と、用言句が主辞となっている用言構成要素部とに分類されることを特徴とする請求項19に記載の機械翻訳方法。
  25. 翻訳するステップは、認定結果が体言構成要素部か用言構成要素部かによって構成要素部の訳出を制御するステップを有することを特徴とする請求項24に記載の機械翻訳方法。
  26. 制御するステップは、認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言が特定の文字列で終わっているか否かによって構成要素部の訳出を制御するステップを有することを特徴とする請求項25に記載の機械翻訳方法。
  27. 前記特定の文字列は「手段」、「工程」、「ステップ」のいずれかを少なくとも含んでいることを特徴とする請求項26に記載の機械翻訳方法。
  28. 制御するステップは、認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出するステップを有することを特徴とする請求項25に記載の機械翻訳方法。
  29. 制御するステップは、認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出し、その他の体言を定冠詞で訳出するステップを有することを特徴とする請求項25に記載の機械翻訳方法。
  30. 認定するステップは、品詞によって条件を指定する変数部と表層文字列を指定する固定部とを含むパターンによるパターンマッチングを用いて基本要素機能の種類を認定するステップを有することを特徴とする請求項17に記載の機械翻訳方法。
  31. 出願国を受け付けるステップをさらに含み、
    翻訳するステップは、受け付けられた出願国に応じて翻訳の仕方を変えるステップを有することを特徴とする請求項17に記載の機械翻訳方法。
  32. 受け付けるステップは、出願国として米国と欧州の何れか一方を選択的に受け付けるステップを有することを特徴とする請求項31に記載の機械翻訳方法。
  33. 原言語で記述された請求項を目的言語に変換する機械翻訳装置を構成するコンピュータを、
    入力の原文テキストの少なくとも一部分が請求項の記載形式を構成する基本要素機能として予め定義された複数種類の基本要素機能のうちの何れの基本要素機能であるかを認定する機能認定手段を有し、基本要素機能の単位で原文テキストを出力する前処理手段、
    前記前処理手段から出力された原文テキストの基本要素機能の種類に応じて翻訳の仕方を変える翻訳手段
    として機能させるための機械翻訳プログラム。
  34. 前記前処理手段は、前記機能認定手段を用いて入力の原文テキストを基本要素機能の単位に分割する分割手段をさらに有することを特徴とする請求項33に記載の機械翻訳プログラム。
  35. 前記基本要素機能は、発明の前提を記述した部分である前提部を構成する基本要素機能と、発明の構成要素を記述した部分である構成要素部を構成する基本要素機能と、既出の構成要素に対して付加的な説明を加える部分である付加説明部を構成する基本要素機能との内の少なくとも1つの基本要素機能を含むことを特徴とする請求項33に記載の機械翻訳プログラム。
  36. 前記翻訳手段は、前記機能認定手段の認定結果が前提部である場合は先頭単語の先頭文字の大文字化を行い、その他の場合は先頭単語の先頭文字の大文字化を行わないことを特徴とする請求項35に記載の機械翻訳プログラム。
  37. 前記前提部を構成する基本要素機能は、独立項の前提部である独立項前提部と、従属項の前提部である従属項前提部とに分類されることを特徴とする請求項35に記載の機械翻訳プログラム。
  38. 前記翻訳手段は、前記機能認定手段の認定結果が前提部である場合、独立項前提部か従属項前提部かによって前提部の訳出を制御することを特徴とする請求項37に記載の機械翻訳プログラム。
  39. 前記翻訳手段は、前記機能認定手段の認定結果が独立項前提部である場合は主辞の体言の冠詞を不定冠詞で訳出し、従属項前提部である場合は主辞の体言の冠詞を定冠詞で訳出することを特徴とする請求項38に記載の機械翻訳プログラム。
  40. 前記構成要素部を構成する基本要素機能は、体言句が主辞となっている体言構成要素部と、用言句が主辞となっている用言構成要素部とに分類されることを特徴とする請求項35に記載の機械翻訳プログラム。
  41. 前記翻訳手段は、前記機能認定手段の認定結果が構成要素部である場合、体言構成要素部か用言構成要素部かによって構成要素部の訳出を制御することを特徴とする請求項40に記載の機械翻訳プログラム。
  42. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言が特定の文字列で終わっているか否かによって構成要素部の訳出を制御することを特徴とする請求項41に記載の機械翻訳プログラム。
  43. 前記特定の文字列は「手段」、「工程」、「ステップ」のいずれかを少なくとも含んでいることを特徴とする請求項42に記載の機械翻訳プログラム。
  44. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出することを特徴とする請求項41に記載の機械翻訳プログラム。
  45. 前記翻訳手段は、前記機能認定手段の認定結果が体言構成要素部である場合、主辞の位置にある構成要素を表す体言を不定冠詞で訳出し、その他の体言を定冠詞で訳出することを特徴とする請求項41に記載の機械翻訳プログラム。
  46. 前記機能認定手段は、品詞によって条件を指定する変数部と表層文字列を指定する固定部とを含むパターンによるパターンマッチングを用いて基本要素機能の種類を認定することを特徴とする請求項33に記載の機械翻訳プログラム。
  47. 前記コンピュータを、さらに、出願国を受け付ける出願国受付手段として機能させ、かつ、
    前記翻訳手段は、前記出願国受付手段で受け付けられた出願国に応じて翻訳の仕方を変えることを特徴とする請求項33に記載の機械翻訳プログラム。
  48. 前記出願国受付手段は、出願国として米国と欧州の何れか一方を選択的に受け付けることを特徴とする請求項47に記載の機械翻訳プログラム。
JP2009548963A 2008-01-10 2009-01-09 機械翻訳装置および機械翻訳方法 Active JP5423398B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009548963A JP5423398B2 (ja) 2008-01-10 2009-01-09 機械翻訳装置および機械翻訳方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008002811 2008-01-10
JP2008002811 2008-01-10
PCT/JP2009/050195 WO2009088067A1 (ja) 2008-01-10 2009-01-09 機械翻訳装置および機械翻訳方法
JP2009548963A JP5423398B2 (ja) 2008-01-10 2009-01-09 機械翻訳装置および機械翻訳方法

Publications (2)

Publication Number Publication Date
JPWO2009088067A1 true JPWO2009088067A1 (ja) 2011-05-26
JP5423398B2 JP5423398B2 (ja) 2014-02-19

Family

ID=40853176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009548963A Active JP5423398B2 (ja) 2008-01-10 2009-01-09 機械翻訳装置および機械翻訳方法

Country Status (3)

Country Link
US (1) US20100292983A1 (ja)
JP (1) JP5423398B2 (ja)
WO (1) WO2009088067A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140281A (ja) * 2020-03-02 2021-09-16 日本特許翻訳株式会社 翻訳支援システム及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9002696B2 (en) * 2010-11-30 2015-04-07 International Business Machines Corporation Data security system for natural language translation
US20190180396A1 (en) * 2016-09-01 2019-06-13 Goldip Inc. Intellectual property support system, intellectual property support method and computer readable medium storing intellectual property support program

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
JP3038079B2 (ja) * 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
US5623406A (en) * 1995-03-06 1997-04-22 Jean D. Ichbiah Method and system for entering text in computer equipment
JP3437710B2 (ja) * 1996-04-22 2003-08-18 エイディシーテクノロジー株式会社 機械翻訳装置
JP3302260B2 (ja) * 1996-05-21 2002-07-15 沖電気工業株式会社 文書処理システム
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US7296015B2 (en) * 2002-10-17 2007-11-13 Poltorak Alexander I Apparatus and method for identifying and/or for analyzing potential patent infringement
US20050144177A1 (en) * 2003-11-26 2005-06-30 Hodes Alan S. Patent analysis and formulation using ontologies
EP1913465A4 (en) * 2005-07-27 2010-09-22 Schwegman Lundberg & Woessner MATCHING PATENTS
US20070174039A1 (en) * 2006-01-17 2007-07-26 Shengfu Lin Method of automatically analyzing claims in patents
US9146985B2 (en) * 2008-01-07 2015-09-29 Novell, Inc. Techniques for evaluating patent impacts

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140281A (ja) * 2020-03-02 2021-09-16 日本特許翻訳株式会社 翻訳支援システム及びプログラム

Also Published As

Publication number Publication date
WO2009088067A1 (ja) 2009-07-16
JP5423398B2 (ja) 2014-02-19
US20100292983A1 (en) 2010-11-18

Similar Documents

Publication Publication Date Title
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
EP1306775A1 (en) Machine translation
JP2008515078A (ja) 自動テキスト訂正
US9984689B1 (en) Apparatus and method for correcting pronunciation by contextual recognition
JP5525529B2 (ja) 機械翻訳装置および翻訳プログラム
EP1525539A2 (en) Machine translation
JP5423398B2 (ja) 機械翻訳装置および機械翻訳方法
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
JP5342760B2 (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
WO2003032191A1 (fr) Systeme de traduction
CN104641367B (zh) 用于格式化电子字符序列的格式化模块、系统和方法
JP3825645B2 (ja) 表現変換方法及び表現変換装置
Koskenniemi Finite-state relations between two historically closely related languages
JPH096790A (ja) 自然言語対話装置
JPH0748217B2 (ja) 文書要約装置
JP3737817B2 (ja) 表現変換方法及び表現変換装置
JPH06295309A (ja) 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JP4986549B2 (ja) 電子機器、その制御方法、および、翻訳文出力用プログラム
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
Isaac Incremental parsing algorithms for speech-editing mathematics and computer code
JPH11265381A (ja) 言語変換方法ならびに装置及び同方法がプログラムされ記録される記録媒体
JPH09146951A (ja) 言語解析システムおよび方法
KR100839036B1 (ko) 문장 축소 시스템
JPH10326276A (ja) 機械翻訳システム用辞書・ルール学習方法及びシステム及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP2003296323A (ja) 形態素解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130920

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20131007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131111

R150 Certificate of patent or registration of utility model

Ref document number: 5423398

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150