JP2007004757A

JP2007004757A - 特許文書翻訳装置及びプログラム

Info

Publication number: JP2007004757A
Application number: JP2005213410A
Authority: JP
Inventors: Hiroshi Kida; 博木田
Original assignee: Individual
Current assignee: Individual
Priority date: 2005-06-24
Filing date: 2005-06-24
Publication date: 2007-01-11

Abstract

【課題】作業負担を効率的に低減できる特許文書翻訳装置等を提供する。
【解決手段】本発明は、第１の言語で記載された特許請求の範囲及び明細書を含む所与の文書（以下、「原特許文書」という）のテキストデータに基づいて、該原特許文書のフォーマットとは異なる所定フォーマットの文書（以下、「新特許文書」という）のテキストデータを作成する特許文書翻訳装置において、前記原特許文書のテキストデータを、セクション前に付される特定キーワードで区切られる複数の文章セクションに分離し、各文書セクション内のテキストデータを、それぞれの対応する特定キーワードに応じた順序に並び替えると共に、並び替えた各文書セクションのテキストデータの先頭部に、前記それぞれの対応する特定キーワードに代えて、各特定キーワードに対応した第２の言語のキーワードをそれぞれ付与することで、前記新特許文書の最終テキストデータ又はその中間生成データを生成することを特徴とする。
【選択図】図１

Description

本発明は、特許文書翻訳装置及びプログラムに関する。

従来から、入力された原文テクストを目標言語に変換して翻訳文を出力する機械翻訳装置において、原文特許明細書におけるクレームのパターンを格納するパターン格納手段と、上記パターン格納手段に格納されたパターンと入力された原文クレームとを照合するパターン照合手段と、上記パターン照合手段で照合されたパターンに合わせて、上記原文クレームを整形し、該原文クレームの修飾構造から階層化処理して、階層データをつくる階層化手段と、上記階層データから原文クレームの修飾関係を示すデータを作成して出力する階層データ出力手段と、上記階層データを逆転して新たな逆転階層データをつくる階層データ逆転手段と、上記逆転階層データを各階層ごとに翻訳して、該翻訳した文を結合する翻訳結合手段とを備えた機械翻訳装置が知られている（例えば、特許文献１参照）。
特開２００１−３０６５６１号公報

ところで、複数の国に特許出願する場合、第１国で作成された特許請求の範囲及び明細書を含む文書（特許文書）をベースにして、第２国で指定された言語及びフォーマットで新たな特許文書を作成するのであるが、この作業は、翻訳を伴い非常に高コストであり、特に外国への出願が多い企業にとって大きな負担である。

そこで、本発明は、かかる負担を効率的に低減できる特許文書翻訳装置等を提供する。

上記課題は、特許請求の範囲に記載した構成により達成される。

本発明によれば、作業負担を効率的に低減できる特許文書翻訳装置等が得られる。

図１は、本発明に係る特許文書翻訳装置の一例を示す機能ブロック図である。本発明に係る特許文書翻訳装置１０は、以下説明する機能を実現するソフトウェアを、コンピューター内のメモリ２６内にインストールする等することで構成され、コンピューター上で同ソフトウェアを作動させることで、実施される。以下、本発明に係る特許文書翻訳装置の実現するソフトウェアの機能を説明していく。ソフトウェアは、ＤＶＤなどの記録媒体からインストールされてよいし、特定のサーバーなどからダウンロードされてもよい。

本発明に係る特許文書翻訳装置は、第１の言語で記載された特許請求の範囲及び明細書を含む所与の文書（本例では、要約書を含む。）（以下、「原特許文書」という）のテキストデータに基づいて、該原特許文書のフォーマットとは異なる所定フォーマットの文書（以下、「新特許文書」という）のテキストデータを作成する。即ち、原特許文書の電子データが、原特許文書取得部２０で取得され、文書再構成／翻訳部２２に入力され、そこで所定の処理を受け、新特許文書として新特許文書出力部２４により出力される。尚、原特許文書取得部２０に関して、原特許文書の電子データは、ユーザの所持する記録媒体（例えばメモリカード）から入力されてよく、或いは、コンピューター内のハードディスク等に記憶されているものであってもよく、或いは、コンピューターに接続されているネットワークを介して外部から取得されてよい。新特許文書出力部２４により出力は、典型的には、ディスプレイ上で表示出力である。

図２は、第１の言語で記載された原特許文書の一例として、日本出願用の日本語で記載された原特許文書を示す。図３は、米国出願用の新特許文書の一例を示す。尚、図２及び図３では、図の下側の先頭ページから始まるそれぞれ計３ページで示されているが、より多くのページ数であってもよいことは当然である。

図２と図３とを対比して分かるように、原特許文書の各文章セクションＡ〜Ｋのテキストデータが、新特許文書内に所定のレイアウトに従った各セクションに組み込まれている。尚、図３では、原特許文書における各文章セクションＡ〜Ｋが組み込まれている箇所を、同一記号に“＊”を付して示している。

この組み込み処理は、例えば、原特許文書のテキストデータを、セクション前に付される特定キーワードで区切られる複数の文章セクションＡ〜Ｋに分離し、各文書セクションＡ〜Ｋ内のテキストデータを、それぞれの対応する特定キーワードに応じた順序に並び替えることで実現される。尚、特定キーワードは、日本語の場合、図２に示すように、特許請求の範囲、発明を実施するための最良の形態等の各欄を示すキーワードである。

また、上記並び替え処理に加えて、並び替えた各文書セクションのテキストデータの先頭部に、前記それぞれの対応する特定キーワードに代えて、各特定キーワードに対応した第２の言語のキーワードがテキストデータでそれぞれ付与されている。例えば、特定キーワード‘特許請求の範囲’に関しては、文書セクションＡ＊の先頭部に、‘特許請求の範囲’に代えて、‘特許請求の範囲’に対応する英語のキーワード‘ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ’がテキストデータで付与されている。同様に、特定キーワード‘発明を実施するための最良の形態’に関しては、文書セクションＨ＊の先頭部に、‘特許請求の範囲’に代えて、‘特許請求の範囲’に対応する英語のキーワード‘ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ’が付与されている。（尚、これらの英語のキーワード‘ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ’等は、原特許文書が米国出願用の場合は‘特定キーワード’となる。）
これらの処理（並び替え及びキーワード付与）は、多様な態様で実現可能であるが、以下では、一例として、新特許文書用に予め準備された空ファイルを用いる方法を代表させる。新特許文書用の空ファイルとは、コンピューターに入っているＯＳによるが、例えばマイクロソフト社のＷｏｒｄ（登録商標）やジャストシステム社の一太郎（登録商標）等の適切なテキストファイルで作成され、各キーワードに対応するテキストデータ（例えば、新特許文書が米国用の場合、ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ等）や、必要に応じてその他の有用テキストデータ（後述）を予め適切な箇所に含み（その都度含めてもよい。）、各キーワード以下の各セクション内のテキストデータが無いファイル（テキストデータが空のファイル）である。尚、空ファイルは、出願データとして適切なフォントやページ設定（余白の大きさ等）で生成され、変換バリーエーション（例えば、米国出願用から日本出願用、日本出願用から中国出願用、日本出願用からＥＰＣ出願用、日本出願用からＰＣＴ出願用（英語）等）に応じた数だけ準備・作成される。

この場合、上述の並び替え及びキーワード付与処理は、例えば、原特許文書のテキストデータを上からスキャニングし、先ず、特定キーワード‘特許請求の範囲’と例えば‘明細書’とで区切られる文章セクションＡのテキストデータを認識・抽出して、当該文章セクションＡのテキストデータを、新特許文書用空ファイル中のキーワード‘ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ’に係るセクションに挿入し、以下同様に、文書セクションＢ〜Ｋの各テキストデータを、新特許文書用空ファイル中の対応する各キーワードに係るセクションに挿入していくことで、実現できる。これにより、新特許文書用空ファイルに、原特許文書のテキストデータが適切に組み込まれ、新特許文書用ファイルが出来上がる。

尚、上述の実施例において、特定キーワード及びそれに対応する第２の言語のキーワード、及び／又は、それらの対応関係は、ユーザにより変更可能とされてよい。これは、各国における出願形式に関して法・規則改正や運用の変更等に機動的に対応できるようにするためである。例えば、これは、特定キーワード及びそれに対応する第２の言語のキーワードの対応表を、ユーザがユーザインターフェース２８を介して編集可能とすることで実現されてよい。また、第２の言語のキーワードの変更は、上述の新特許文書用空ファイルをユーザが編集可能とすることで実現されてよい。

また、各セクション内のテキストデータは、段落毎に、適切なタブやスペースで規定された行開始位置から挿入されてよい。例えば、特定キーワード‘図面の簡単な説明’に係る文章セクションＩ内の各サブセクションＩ１，Ｉ２内のテキストデータは、それぞれタブが入った適切な行開始位置から挿入されてよい。

ここで、上述の実施例をベースとして利用する好ましい実施例について幾つか説明する。先ず、１つ目として、クレームについては、クレーム毎に新特許文書への組み込みが実行される。例えば、図２及び図３に示すように、キーワード‘請求項１’からキーワード‘請求項２’までのサブセクションＡ１内のテキストデータ（即ち、請求項１のテキストデータ）を、‘ＷＨＡＴＩＳＣＬＡＩＭＥＤＩＳ’以下のセクションにおけるクレーム番号１からクレーム番号２までのサブセクションＡ１＊に挿入され、以下、同様に各請求項に係るデータがそれぞれのサブセクションに組み込まれる。

２つ目の好ましい実施例として、各国特有の決まり文句がある場合等には、原特許文書にそれが無い場合でも、当該決まり文句が適切な箇所に組み込まれてよい。例えば、米国出願用では、文章セクションＩ内の各サブセクションＩ０に、‘Ｏｔｈｅｒｏｂｊｅｃｔｓ，ａｄｖａｎｔａｇｅｓ，ａｎｄｆｕｒｔｈｅｒｆｅａｔｕｒｅｓｏｆｔｈｅｐｒｅｓｅｎｔｉｎｖｅｎｔｉｏｎｗｉｌｌｂｅｃｏｍｅｍｏｒｅａｐｐａｒｅｎｔａｓｔｈｅｄｅｓｃｒｉｐｔｉｏｎｐｒｏｃｅｅｄｓｔａｋｅｎｉｎｃｏｎｊｕｎｃｔｉｏｎｗｉｔｈｔｈｅａｃｃｏｍｐａｎｙｉｎｇｄｒａｗｉｎｇｓｉｎｗｈｉｃｈ：’なる文章が組み込まれてよい。これらの決まり文句は、上述の空ファイルに有用テキストデータとしてユーザにより組み込まれてよく、或いは、予め組み込まれユーザによる編集が可能とされてよい。

３つ目の好ましい実施例として、原特許文書のテキストデータのうち、組み込み先が判断不能なテキストデータを、新特許文書内の所定箇所に組み込み、その旨が分かるように強調表示させてもよい（例えば、赤字などにより）。例えば、図２，３に示す例では、原特許文書の特定キーワード‘発明の効果’に係るセクションＧ内のテキストデータは、新特許文書内におけるキーワード‘ＳＵＭＭＡＲＹＯＦＴＨＥＩＮＶＥＮＴＩＯＮ’に係るセクション内に、原特許文書の特定キーワード‘課題を解決するための手段’に係るセクションＦ内のテキストデータの挿入箇所に後に挿入されるが、かかる箇所への挿入を行わず、組み込み先が判断不能なデータが挿入される箇所に挿入されてよい。これは、必ずしも全ての原特許文書のテキストデータを新特許文書内に組み込む必要が無い場合もあり、その一方で、組み込まれない部分についてはユーザに知らせる必要性が高いためである。
但し、図２における文章セクションＪ、文章セクションＫ内のサブセクションＫ１，Ｋ３内のテキストデータのように、新特許文書内に組み込む必要が確実にない場合には、組み込み先が判断不能なデータが挿入される箇所にも挿入されないこととしてよい。また、日本出願用にある墨付き括弧（典型的には、特定キーワード、段落番号に付される）についても新特許文書内へ組み込みされないこととしてよい。

以上のように本実施例によれば、ユーザは、ユーザインターフェース２８を介して変換バリーエーション（本例の場合、日本出願用から米国出願用）を指定して、新特許文書作成の基になる原特許文書を、入力データとして特許文書翻訳装置に与えるだけで、第２国出願用の新特許文書を得ることができ、しかも、かくして得られる新特許文書は、第２国出願用に既にレイアウトが整えられているので、ユーザは、直ぐにそのまま翻訳を開始することが可能となる。これにより、第２国出願用の新特許文書の作成負担を効率的に低減できる。

尚、上述の実施例では、原特許文書のテキストデータ自体は、そのままの状態で、新特許文書内に組み込まれているが、中間生成データとして利用されてよい。典型的には、原特許文書の各文章セクションのテキストデータは、自動翻訳されてから新特許文書用空ファイルに上述の如く組み込まれてもよいし、新特許文書用空ファイルに上述の如く組み込まれてから自動翻訳されてもよい。この自動翻訳機能は、適切な任意の自動翻訳技術を用いて実現されてよい。この場合、文書再構成／翻訳部２２では、上述の並び替え等の処理に加えて、自動翻訳処理が実行され、これらの処理がなされた段階で、新特許文書として新特許文書出力部２４により出力されることになる。また、この場合、出力された新特許文書をそのまま出願することが究極的には可能となるように、翻訳後のテキストデータは、好ましくは、出願用データとして適切なフォント等で生成される。尚、使用する辞書・翻訳エンジンの能力・精度によるが、現実的には、出力された最終の新特許文書に対して、ユーザによる翻訳の手直しが入る。また、自動翻訳機能は、ユーザの選択によりオン／オフできるようにしてよい（例えば、対話式翻訳等を好みユーザは、自動翻訳機能をオフにすればよい。なお、その場合、そのユーザにとっては、自動翻訳されない新特許文書が最終文書データとなる）。また、当然ながら、本実施例による上述の並び替え等の機能は、自動翻訳ソフトウェアに組み込まれた同一のパッケージ商品として実現することが可能である。

以上、本発明の好ましい実施例について詳説したが、本発明は、上述した実施例に制限されることはなく、本発明の範囲を逸脱することなく、上述した実施例に種々の変形及び置換を加えることができる。

本発明に係る特許文書翻訳装置の一例を示す機能ブロック図である。原特許文書の一例を示す図である。図２の原特許文書をベースに得られる新特許文書の一例を示す図である。

符号の説明

１０特許文書翻訳装置
２２文書再構成／翻訳部

Claims

第１の言語で記載された特許請求の範囲及び明細書又はその類を含む所与の文書（以下、「原特許文書」という）のテキストデータに基づいて、該原特許文書のフォーマットとは異なる新たな所定フォーマットの文書（以下、「新特許文書」という）のテキストデータを作成する特許文書翻訳装置において、
前記原特許文書のテキストデータを、セクション前に付される特定キーワードで区切られる複数の文章セクションに分離し、各文書セクション内のテキストデータを、それぞれの対応する特定キーワードに応じた所定の順序に並び替えると共に、並び替えた各文書セクションのテキストデータの先頭部に、前記それぞれの対応する特定キーワードに代えて、各特定キーワードに対応した第２の言語の所定キーワードをそれぞれ付与することで、前記新特許文書の最終テキストデータ又はその中間生成データを生成することを特徴とする、特許文書翻訳装置。
前記並び替えられる各文書セクションのテキストデータを、第２の言語に自動翻訳することで、前記新特許文書の最終テキストデータを生成する、請求項１に記載の特許文書翻訳装置。
前記特定キーワードは、少なくとも、‘特許請求の範囲’又はそれに相当する文章セクションの始まりを示すキーワード、‘発明を実施するための最良の形態’又はそれに相当する文章セクションの始まりを示すキーワード、及び、‘図面の簡単な説明’又はそれに相当する文章セクションの始まりを示すキーワードを含む、請求項１又は２に記載の特許文書翻訳装置。
前記特定キーワードは、‘特許請求の範囲’又はそれに相当する文章セクションの始まりを示すキーワード、‘発明を実施するための最良の形態’又はそれに相当する文章セクションの始まりを示すキーワード、及び、‘図面の簡単な説明’又はそれに相当する文章セクションの始まりを示すキーワード、‘技術分野’又はそれに相当する段落の始まりを示すキーワード、‘課題を解決するための手段’又はそれに相当する文章セクションの始まりを示すキーワードを含む、請求項１又は２に記載の特許文書翻訳装置。
前記特定キーワード及びそれに対応する第２の言語の所定キーワード、及び／又は、それらキーワード同士の対応関係は、ユーザにより変更可能とされる、請求項１〜４の何れか１項に記載の特許文書翻訳装置。
請求項１〜５の何れか１項に記載の特許文書翻訳装置としてコンピューターを機能させるためのコンピューター読み取り可能なプログラム。