JP2008084078A

JP2008084078A - 和英規格変換方法及びシステム並びに和英規格変換プログラム

Info

Publication number: JP2008084078A
Application number: JP2006264412A
Authority: JP
Inventors: Tadashi Ohashi; 正大橋
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-09-28
Filing date: 2006-09-28
Publication date: 2008-04-10

Abstract

【課題】本発明は和英規格変換方法及びシステム並びに和英規格変換プログラムに関し、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる和英規格変換方法及びシステム並びに和英規格変換プログラムを提供することを目的としている。
【解決手段】翻訳システムにおいて、原文から単語を抽出する手段と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する手段と、用語集を参照して各単語に適用する手段と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段とから構成される。
【選択図】図３

Description

本発明は和英規格変換方法及びシステム並びに和英規格変換プログラムに関する。

文書ツールを用いた単語検索による辞書変換方法は既にある。例えば、Ｗｏｒｄ製品に使用されている辞書変換方式がそれである。この場合において、辞書の提供は、ＣＤ−ＲＯＭかＷｅｂによる一方向提供のものであり、利用者の利用習熟度を学習できないという問題がある。この場合に使用される各種の専門辞書は、あくまでも一般的な使用頻度での単語出現順位となっている。

図９は従来技術の説明図である。図において、１は和英辞書で、例えばマイクロソフトのワード（Ｗｏｒｄ）の埋め込み辞書が考えられる。そして、ＺＮ規格の例を示している。和文は“あいうえお”順に並べられており、例えば、和文が「あ」行の「暗号」であった場合、対応する英文としては、暗号を示す「ｃｉｐｈｅｒ」が記憶されている。図９に原文（日本語）と訳文（英語）の例を示している。一般文字変換の場合は利用者のスキルに大きく依存する技術レベル方式である。また、従来の技術は、変換エリア指定の一括翻訳しない方式であるため、連語の一括変換ができない。

従来のこの種のシステムとしては、翻訳サーバがインターネットを介して２台接続されたシステムにおいて、第１の翻訳サーバがテキスト情報を取得し、所定の言語単位に分割しし、日本語データベースを照会して該当するコード情報を第２の翻訳サーバに送信し、第２の翻訳サーバは、取得したコード情報を検索手段により英語のテキスト情報を得るシステムが知られている（例えば特許文献１参照）。また、処理するテキストについて少なくともその対象とする分野及び文の種類等の情報を蓄積するステップと、辞書検索時に、該蓄積情報を利用するステップからなるシステムが知られている（例えば特許文献２参照）。

また、優先表示分野設定画面において、分野“コンピュータ”を選択して訳／決定キーを押下すると、優先表示分野を“コンピュータ”に指定して優先表示分野格納領域を更新するようにしたシステムが知られている（例えば特許文献３参照）。また、英語と日本語とが対応付けられた複数の辞書データを記録した辞書データベースと、英語と日本語とが対応付けられた複数の用例集データを記録した用例データベースと、英語の語句の入力を受け付ける入力部と、入力された英語の語句を構成する各単語に対応する日本語の訳を辞書データベースから検索するようにした装置が知られている（例えば特許文献４参照）。
特開２００２−９１９６９号公報（段落００１７〜００３２、図１〜図３）特開昭６３−３７４７４号公報（第３頁左上欄第１行〜同頁左下欄第２０行、第１図、第２図）特開２００６−３１３５１号公報（段落００３６〜００４９、図３〜図８）特開２００５−１４１６３０号公報（段落００１０〜００２５、図１〜図４）

現在、文書には和英併記のドキュメントの様式が様々存在する。ページ単位混在型、単ページ混在型、左右ページ分類型等がある。この場合でも和単語を和英変換するが、最適な用語の選択は専ら利用者のスキルに委ねられている。即ち、和文の単語の内容が全て利用者の知識に依拠している。従来の場合、用語変換辞書を具備しており、分野別の辞書が必要である。用語が全て「あいうえお」順に配列されているので、シーケンシャルに単語を捜す必要があり、時間がかかるという問題がある。

また、単語の区切りを人間が判断し、単語体での変換を行なうので手間がかかるという問題がある。また、和文を単語節に自動分解することができず、単語のみ取り出すことができない。また、パラグラフのように一つの塊を一括変換ができないという問題がある。この場合、和文を単語節に自動分解できないので、単語のみを取り出すことができない。更に、過去の訳例を引用することができないという問題がある。

本発明はこのような課題に鑑みてなされたものであって、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる和英規格変換方法及びシステム並びに和英規格変換プログラムを提供することを目的としている。

（１）請求項１記載の発明は、翻訳システムにおいて、原文から単語を抽出する工程と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、用語集を参照して各単語に適用する工程と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程とから構成されることを特徴とする和英規格変換方法。
（２）請求項２記載の発明は、翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル（所属，担当業務，専門分野等）として登録した情報を元に訳例検索時の優先度を設定する手段と、用語集を参照して各単語に適用する手段と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、から構成されることを特徴とする。
（３）請求項３記載の発明は、和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が１００％でない場合には、このテーブルに作業者のプロファイル（所属，担当業務，専門分野等）に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする。
（４）請求項４記載の発明は、和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする。
（５）請求項５記載の発明は、前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする。
（６）請求項６記載の発明は、類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする。
（７）請求項７記載の発明は、和英／英和翻訳ルートを複数通り設けることを特徴とする。
（８）請求項８記載の発明は、過去に累積した訳例を元に類似文章から利用者のプロファイル（所属，担当業務，専門分野等）に合わせて最適な訳を照合することを特徴とする。
（９）請求項９記載の発明は、原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする。
（１０）請求項１０記載の発明は、代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする。
１１．また、この発明は、類似度が低かった場合は、類似語グループの中で一番頻度の高い用語を訳例として代替するようにしたことを特徴とする。
１２、また、この発明は、前記翻訳時に、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することを特徴とする。
１３．また、この発明は、類似語は、訳例の用語抽出で原文語と訳例語の一致させている組み合わせで決定することを特徴とする。
１４．また、この発明は、設計者の作業プロファイルにより訳例検索する際に、優先度選択を行ない、翻訳処理を行なうことを特徴とする。
１５．また、この発明は、和英変換と英和変換は規格限定構文を用いて、作業者プロファイル、用語の種類、頻度で行なうことを特徴とする。
１６．また、この発明は、翻訳システムにおいて、原文から単語を抽出する工程と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、用語集を参照して各単語に適用する工程と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程とをコンピュータで実行することを特徴とする。

（１）請求項１記載の発明によれば、原文から抽出した単語と、訳例とを対比させ、その類似度を算出して最も類似した訳例を選択することにより、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる
（２）請求項２記載の発明によれば、原文から抽出した単語と、訳例とを対比させ、その類似度を算出して最も類似した訳例を選択することにより、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる。
（３）請求項３記載の発明によれば、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が１００％でない場合に、テーブルに類似度を算出した訳文を訳例として蓄積していくことにより、翻訳時の学習機能を持たせることができる。
（４）請求項４記載の発明によれば、原文と訳例とのパターンマッチングを行なって類似度を求め、この類似度を用いて誤差を算出し、算出した誤差が最も小さい訳例を変換用語として用いることにより、正確な翻訳を行なうことができる。
（５）請求項５記載の発明によれば、日本語で原文と訳文のパターンマッチングを行ない、訳文が決定されたら、その訳文と対応付けられている英語を翻訳単語として決定することで、日本語から英語への変換をスムーズに行なうことができる。
（６）請求項７記載の発明によれば、類似度が低かった場合、日本語から英語、又は英語から日本語への変換のパスを切り替えて翻訳を行なうことにより、類似度の高い翻訳を行なうことができる。
（７）請求項７記載の発明によれば、和英／英和翻訳ルートを複数通り設けることにより、翻訳結果の誤差が多い場合に、最も翻訳誤差の少ないルートを採用することで、正確な翻訳を実行することができる。
（８）請求項８記載の発明によれば、過去に累積した訳例を元に類似文章から利用者のプロファイルに合わせて最適な訳を用いるので、正確な翻訳を行なうことができる。
（９）請求項９記載の発明によれば、原文と訳例から両者の類似度を算出し、この類似度を用いた所定の演算により誤差が最小となる訳例の単語を検索していくので、正確な翻訳が可能となる。
（１０）請求項１０記載の発明によれば、代替した訳語が気に入らない場合に、設計者が操作部から最も好ましい訳語を入力することができるので、文章全体として正確な翻訳を行なうことができる。
１１．また、この発明によれば、類似度が低かった場合は、代替類似語クラスタリングの中で一番頻度の高い用語を訳例として用いることで、最も適当と思われる翻訳を行なうことができる。
１２．また、この発明によれば、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することができる。
１３．また、この発明によれば、類似語を原文語と訳例語の組み合わせで決定することができる。
１４．また、この発明によれば、設計者の作業プロファイルにより訳例検索する際に優先度選択を行なうことにより、設計者の専門分野における最適な翻訳を行なうことができる。
１５．また、この発明によれば、翻訳に規格限定構文を用いることで、より最適な翻訳を行なうことができる。
１６．また、この発明によれば、上述した一連の翻訳作業をコンピュータで実行することができる。

以下、図面を参照して本発明の実施の形態例を詳細に説明する。図１は本発明の解決手段の説明図である。２はデータベーステーブルとして記憶されている記憶部である。図に示す構成は、テーブルの中身であり、和文／英文作成済み、又は作成中規格により和／英用語と引例規格番号、規格名称、分野、頻度を記憶するようになっている。図に示す例の場合、和用語の一例を示す、例えば「解析」に対して、複数英語の用語が対応付けられている。ここでは、ｗｏｒｄ_x，ｗｏｒｄ_yが対応付けられている。ｗｏｒｄ_xの場合には、規格番号として１００１，１００３，１００９が記憶されている。ここで、「用語」とは、ある特定の専門分野における特化した単語のことである。

そして、規格番号１００１に対する規格名称はＸＸＸＸＸであり、分野はＤＤＤＤＤである。つまり、分野ＤＤＤＤＤにおける和文の「解析」に対応する最適な英用語はｗｏｒｄ_xであるということになる。規格番号１００３に対する規格名称はＹＹＹＹＹであるが、この場合はまだ分野が決まっていないことを示す。規格番号１００９に対する規格名称はＺＺＺＺＺであり、分野はＶＶＶＶＶである。

また、和用語「解析」に対する英用語ｗｏｒｄ_yの規格番号は２００１、規格名称はＡＡＡＡＡであり、分野はまだ決まっていない。このような規格番号、規格名称、分野、頻度は、プロファイル適合抽出に利用される。図２は本発明の動作説明図である。３はデータベースに記憶されているテーブルである。このテーブル３には、原文ｔ（ｔはｔ0からｔｎまで）と、対応する頻度と、訳例ｗ（ｗはｗ0からｗｎまで）と対応する頻度と、類似度ｓと誤差ｅが記憶されている。ここで、「訳例」とは翻訳処理によって作成され、蓄積される単語のことである。翻訳用語を決定する場合、先ず用語集を参照して原文の単語を抽出し、訳例と対比する用語を求める。そして、抽出した原文の用語と、記憶部２に記憶されている訳例ｗとからパターンマッチングを行ない、類似度ｓが算出される。そして、この算出した類似度ｓを元に、誤差ｅを算出する。この誤差ｅが所定の閾値より大きいか小さいかが判断される。誤差ｅが閾値より大きい場合には、次の訳例をテーブル３から読み出し、類似度ｓを算出する。そして、この類似度ｓに基づいて算出した誤差ｅが所定の閾値より大きい場合には、類似度算出の工程に戻り、同じ処理を繰り返す。そして、求めた誤差ｅが所定の閾値よりも小さい場合には、その訳例ｗを変換用語として決定する。この訳例は、テーブル３の該当領域の訳例の頻度記憶領域に記憶され、頻度が＋１だけ更新される。いま、原文ｔ2の翻訳時にエラーｅが出たものとすると、この時の原文ｔ2は固定して訳例ｗを先に検索をすすめ、ｔ2との一致を示す訳例を探すことになる。

このように、本発明によれば、原文から抽出した単語と訳例とを対比させ、その類似度を算出して最も類似した訳例を選択することにより、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる。また、本発明によれば、原文と訳例とのパターンマッチングを行なって類似度を求め、この類似度を用いて誤差を算出し、算出した誤差が最も小さい訳例を変換用語として用いることにより、正確な翻訳を行なうことができる。

また、本発明によれば、過去に累積した訳例を元に類似文章から利用者のプロファイルに合わせて最適な訳を用いるので、正確な翻訳を行なうことができる。また、原文と訳例から両者の類似度を算出し、この類似度を用いた所定の演算により誤差が最小となる訳例の用語を検索していくので、正確な翻訳が可能となる。

図３は本発明の具体的な動作説明図である。例１は和英変換時に原文と訳例文との類似が多少ずれている例を示している。図において、５は和／英両方の用語が記憶された用語集、６は和／英両方の訳例が記憶された訳例集である。例１では、和文同士の比較を行なっている。原文１０が「画像解析システムはプリント回路板にデジタル信号処理プロセッサーを実装する」というものであったものとする。この文章を、用語集５を参照して用語抽出文１１に変換すると、「画像解析システムは，プリント回路板に，デジタル信号処理プロセッサーを，実装する」となる。ここで、コンマ“，”は用語の区切りを示す。

これに対して、対比すべき用語集１２は、「画像解析システムは，暗号アルゴリズムを，ＤＳＰの浮動小数点演算を，駆使して，高速に，処理する」である。用語抽出された和文と、訳例和文との間に用語の違いがみられる。１３は用語集１２に対応した英語の訳例であり、「Image analysis system performs the high speed coding algorithm using floating point arithmetic of DSP operation」となる。１５は訳例１３と対応した和文であり、用語抽出文１１と対比させられるペアである。１４は訳例１３と対応する英文である。このように構成されたシステムにおいて、用語抽出文１１と用語集１２との類似度が判定され、類似語に対応した英文が選択され、出力される。

例２は例１と異なり、英文同士の類似度を判定する場合を示している。１６は英文の原文であり、この原文から用語抽出すると、１７に示すような用語抽出文が得られる。この用語抽出文１７と訳例１４との類似度を対比する。対比の結果、用語集１４の用語は類似度に応じて他の最適な用語に置き換わる。置き換わった英文は、それに対応する和用語がデータベースに記憶されているので、対応する和用語に置き換えられ、置き換えられた文章が出力されることになる。

なお、この実施の形態例において、翻訳作業で和文の原文と訳例との類似度を参照し、類似度が１００％でない場合には、テーブルに類似度を算出した訳文を訳例として蓄積していくことにより、翻訳時の学習機能を持たせることができる。

また、この実施の形態例によれば、日本語で原文と訳文のパターンマッチングを行ない、訳文が決定されたら、その訳文と対応付けられている英語を翻訳単語として決定することにより、日本語から英語への変換をスムーズに行なうことができる。

また、本発明によれば、設計者の作業プロファイルにより訳例検索する際に優先度選択を行なうことにより、設計者の専門分野における最適な翻訳を行なうことができる。また、本発明によれば、類似度が低かった場合には、日本語から英語、又は英語から日本語への変換のパスを切り替えて翻訳を行なうようにすることができる。例えば、図３に示すように、作業者ファイル１８のファイルの内容に従って、和英変換部１９で和英変換を行ない、用語抽出文１７を得ると共に、英和変換部２０により英和変換を行ない、用語抽出文１１とする。このようにすれば、類似度が低かった場合、日本語から英語、又は英語から日本語への変換のパスを切り替えて翻訳を行なうことにより、類似度の高い翻訳を行なうことができる。

また、本発明によれば、類似度が低かった場合、類似語グループの中で一番頻度の高い用語を訳例として用いることができる。このようにすれば、最も適当と思われる翻訳を行なうことができる。また、本発明によれば、類似単語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することができる。

図４は翻訳時における誤差算出の説明図である。例１は原文と訳例が完全に一致している例を示している。原文の用語はｔ0〜ｔ3まで４個ある。これに対して、訳例はｗ0〜ｗ3まで４個ある。これらｔｉとｗｉ（ｉ＝０〜３）との類似度を求めると、ｔｉとｗｉの全てが一致しており、類似度は全て１である。この時の誤差ｅを求める。誤差ｅは原文の用語の個数をＴｉ、一致した訳例の個数をＷｉとして
ｅ＝１−（Ｗｉ／Ｔｉ）ｏｎｌｙｉｆ（Ｔｉ−Ｗｉ＝０）（１）
となる。

例１の場合、原文と訳例４個の全てが一致しているから、
ｅ＝１−（４／４）＝０
となる。次に、例２について考える。この場合には、４個の用語のうち、１語に若干の相違がある場合である。即ち、ｔ1とｗ1に若干の相違がある。例えば、ｔ1は“プリント回路板”であり、ｗ1は“プリント回路ボード”である。この２つの用語は表現が異なるものの実質的に同一のものを示しているから、類似度１とする。即ち一致したものとみなす。この結果、例１の場合と同様に、双方の文の誤差ｅは０となる。

次に、例３の場合について考える。この場合は、４個の用語の内３個は一致しているが、残りの１個が不一致の場合を示している。不一致の用語はｔ1とｗ1である。ｔ1は“プリント回路板”であり、ｗ1は“電源供給ユニット”であり、明らかに異なる。この場合は、類似度は０となる。ｔｉとｗｉを（１）式に代入して誤差ｅを求めると、
ｅ＝１−３／４＝０．２５
となる。

次に、例４の場合について考える。例４の場合は用語の数に不一致がある場合である。この場合、一致した数をＭｉとして誤差ｅは次式で表される。
ｅ＝｛１−（Ｍｉ／Ｔｉ）｝×（Ｗｉ−Ｔｉ）（Ｔｉ≠Ｗｉ）（２）
例４の場合に誤差ｅを求めてみると、Ｍｉ＝１、Ｔｉ＝４、Ｗｉ＝６であるから、（２）式に代入すると、
ｅ＝｛１−（１／４）｝×（６−４）＝１．５
となる。

次に、例５の場合について考える。この場合は、用語の数に不一致がある場合で、かつＷｉ＜Ｔｉの場合である。それぞれの値を（２）式に代入すると、
ｅ＝｛１−１／４｝×（２−４）＝−１．５
となる。

以上のような誤差の算出を行ない、翻訳用語として採用するかどうかについては、予め誤差に一定の基準を設け、その基準値より誤差が小さい場合にのみ、翻訳用語として採用するようにすればよい。例えば、基準値を０．４とする場合等である。この場合、例１〜例３は翻訳用語として採用され、例４と例５は採用されないことになる。

この実施の形態例によれば、原文と訳例から両者の類似度を算出し、この類似度を用いた所定の演算により誤差が最小となる訳例の用語を検索していくので、正確な翻訳が可能となる。また、本発明によれば、過去に累積した訳例を元に類似文章から利用者のプロファイルに合わせて最適な訳を用いるので、正確な翻訳を行なうことができる。

また、本発明では、類似語は、訳例の用語抽出で原文語と訳例語の一致させている組み合わせで決定することにより、類似語を原文語と訳例語の組み合わせで決定することができる。また、本発明では、翻訳時に、類似英語と利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することを特徴としている。この結果、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することができる。

図５は本発明の動作の一例を示すフローチャートである。先ず、原文の用語抽出を行ない、文の先頭にもってくる（Ｓ１）。ここで、原文をそれぞれｔ00〜ｔｖｗで表す。訳例をそれぞれＷ00〜Ｗｗｎで表す。次に、訳例の用語を抽出し、文の先頭へもってくる（Ｓ２）。そして、用語が一致するかどうかチェックする（Ｓ３）。即ち、ｔｎとｗｎが等しいかどうかチェックする。ステップＳ３で用語が一致した時、原文の用語の頻度をカウントし、１だけ更新する（Ｓ４）。

次に、原文最終用語であるかどうかチェックする（Ｓ５）。最終用語でなかった場合には、原文の次のポイントの用語をもってきて（Ｓ６）、ステップＳ２に戻る。一方、ステップＳ３で不一致だった場合、訳例文の最終用語であるかどうかチェックする（Ｓ７）。最終用語であった場合には、類似語があるかどうかチェックする（Ｓ８）。類似語があった場合、用語集で類似語の高頻度の用語ｔｎ´を原文用語に代替し（Ｓ９）、ステップＳ２に戻る。ステップＳ７において、訳例文の最終用語でなかった場合には、訳例の次のポイントの用語をもってきてステップＳ２に戻る（Ｓ１０）。

ステップＳ５において、原文の最終用語であった場合、誤差が大きいかどうかチェックする（Ｓ１１）。誤差が小さい場合には、全原文が終了したかどうかチェックする（Ｓ１２）。全原文が終了した場合には、翻訳処理で用いた訳例をデータベースに蓄積し（Ｓ１３）、処理を終了する。訳例をデータベースに蓄積することで、以降の翻訳処理に使用することが可能となる。

ステップＳ１１において、誤差が大きい場合、手入力をするかどうか判定する（Ｓ１４）。手入力の場合には、操作部からの手入力により最適な訳例を用いることができる。手入力でない場合には、訳例の先頭に戻り（Ｓ１６）、翻訳パスを変えて（Ｓ１７）、ステップＳ１に戻る。

この実施の形態例によれば、代替した訳語が気に入らない場合に、設計者が操作部から最も好ましい訳語を入力することができるので、文章全体として正確な翻訳を行なうことができる。

次に、規格限定構文について説明する。英／和又は和／英翻訳を行なう場合、文章としては規格限定構文が用いられる。規格限定構文は、名詞（Ｓ）、動詞（Ｖ）、目的語（Ｏ）、助詞（Ｃ）等に着目したテクニカルな技術文書の構文である。図６は規格限定構文の説明図である。それぞれの名詞、動詞、目的語、助詞等の意味は図に示す通りである。文型は第１文型から第５文型までの５つに分かれている。第１文型はＳ＋Ｖよりなる簡単な文であり、第２文型はＳ＋Ｖ＋Ｃからなる文である。第３文型はＳ＋Ｖ＋Ｏよりなる文であり、第４文型はＳ＋Ｖ＋Ｏ＋Ｏよりなる文であり、第５文型はＳ＋Ｖ＋Ｏ＋Ｃよりなる文である。ここで、第４文型の例を示すと、日本語で「画像解析システムは、プリント回路板にデジタル処理プロセッサーを搭載する」は、英語で「Image Analisys System mounts Digital Processer on Printed Circuit Bourd」となる。これら文のＳ，Ｖ，Ｏ，Ｏの関係は図に示した通りである。本発明によれば、翻訳に規格限定構文を用いることで、より最適な翻訳を行なうことができる。

図７は従来技術と本発明との比較説明図である。従来技術と本発明について、辞書関係、単語検索関係、訳例翻訳の精度と質との関係につい比較説明している。これによれば、辞書関係の場合、従来技術では辞書は一般的に高価で複雑なため、プログラムが大きくなりがちである。これに対して、本発明によれば、辞書を用いず用語集を用いるため、安価である。また、例えば、単語検索方式の場合を例にとると、従来技術ではデメリットとして、一般にシーケンシャル検索であり、人手による検索であるため、利用者のスキルに大きく依存するという問題がある。これに対して、本発明では、利用者のプロファイルがあるので、平均した利用効果が期待できるというメリットがある。更に、訳例翻訳の精度と質について比較すると、従来技術は人手による検索のため、利用者のスキルに大きく依存するという問題があるが、本発明によれば、利用者のプロファイルがあるので、平均した利用効果が期待である。そしてまた、訳例ルートを複数（ここでは丸１から丸４までの４通りの場合を示す）設けておくことにより、それぞれのルートにおける訳例精度を求め、最も訳例精度が高いルートを選んで翻訳処理を行なうため、高い翻訳精度が期待できる。

図８は従来技術と本発明との比較説明図である。この図では、従来技術と本発明についての辞書関係、単語検索方式、訳例翻訳の場合について比較説明している。辞書関係について言えば、従来技術の場合は単語辞書と用語辞書を用いている。これに対して、本発明によれば、図に示すようなフォーマットの用語集と訳例集とを用いており（図１参照）、辞書を用いていないので、安価な翻訳システムを構築することができる。次に、単語検索方式について言えば、従来の技術はシーケンシャル検索を行なっている。例えば、マイクロソフト社のワード（Ｗｏｒｄ）埋め込み辞書の場合が考えられる。そして、単語の選択は作業者に一任されているので、改行キーを押しながら最適単語を探すものである。これに対して、本発明は類似度の誤差が常に最小になるように原文語を中心にして検索し、誤差が大きくなった時点で原文語を固定し、訳例用語集を検索する。また、類似翻訳を行なう機能を具備しているので、原文と一致する用語が無い場合でも、原文と単語の代替を行なう必要がない。

また、訳例翻訳について言えば、従来技術では簡単な方式では構文解析をせずに含む単語レベルで原文と訳文を照合している。これに対して、本発明では、翻訳ルートを。丸１〜丸４までの４通り具備しているので、原文（日本語又は英語）と訳文（英語と日本語）相互の照合による類似度は用語の種類と用語の出現頻度が同じであれば、完全な一致とすることができる。

本発明によれば、翻訳システムにおいて、原文から単語を抽出する工程と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、用語集を参照して各単語に適用する工程と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程とをプログラムとして組むことができる。このようにすれば、和英規格変換方法をコンピュータで実行することができる。

（付記１）
翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
から構成されることを特徴とする和英規格変換方法。

（付記２）
翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル（所属，担当業務，専門分野等）として登録した情報を元に訳例検索時の優先度を設定する手段と、
用語集を参照して各単語に適用する手段と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、
から構成されることを特徴とする和英規格変換システム。

（付記３）
和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が１００％でない場合には、このテーブルに作業者のプロファイル（所属，担当業務，専門分野等）に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする付記１記載の和英規格変換方法。

（付記４）
和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする付記３記載の和英規格変換方法。

（付記５）
前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする付記４記載の和英規格変換方法。

（付記６）
類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記７）
和英／英和翻訳ルートを複数通り設けることを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。

（付記８）
過去に累積した訳例を元に類似文章から利用者のプロファイル（所属，担当業務，専門分野等）に合わせて最適な訳を照合することを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記９）
原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記１０）
代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする付記１２記載の和英規格変換方法。

（付記１１）
類似度が低かった場合は、代替類似語クラスタリングの中で一番頻度の高い用語を訳例として代替するようにしたことを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記１２）
前記翻訳時に、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記１３）
類似語は、訳例の用語抽出で原文語と訳例語の一致させている組み合わせで決定することを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記１４）
設計者の作業プロファイルにより訳例検索する際に、優先度選択を行ない、翻訳処理を行なうことを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。（１０）
（付記１５）
和英変換と英和変換は規格限定構文を用いて、作業者プロファイル、用語の種類、頻度で行なうことを特徴とする付記３乃至５の何れかに記載の和英規格変換方法。

（付記１６）
翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
をコンピュータで実行することを特徴とする和英規格変換プログラム。

以上、説明した本発明の効果を列挙すれば、以下の通りである。
１）和英併記のドキュメントの様式が種々存在しても、柔軟に処理ができる。
２）単語を和英変換について、最適な用語を利用者のスキルによらずに実施することができる。
３）用語変換機能を具備しており、分野別変換が可能である。
４）パラグラフ（段落）のように一つの塊を一括変換できる。
５）過去の訳例の引用がいつでもできる。

本発明の解決手段の説明図である。本発明の動作説明図である。本発明の具体的な動作説明図である。誤差算出の説明図である。本発明の動作の一例を示すフローチャートである。規格限定構文の説明図である。従来技術と本発明との比較説明図である。従来技術と本発明との比較説明図である。従来技術の説明図である。

符号の説明

５用語集
６訳例集
１０和文原文
１１用語抽出文
１２用語集
１３訳例
１４英文
１５和文
１６英文原文
１７用語抽出文
１８作業者プロファイル
１９和英変換部
２０英和変換部

Claims

翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
から構成されることを特徴とする和英規格変換方法。
翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル（所属，担当業務，専門分野等）として登録した情報を元に訳例検索時の優先度を設定する手段と、
用語集を参照して各単語に適用する手段と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、
から構成されることを特徴とする和英規格変換システム。
和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が１００％でない場合には、このテーブルに作業者のプロファイル（所属，担当業務，専門分野等）に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする請求項１記載の和英規格変換方法。
和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする請求項３記載の和英規格変換方法。
前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする請求項４記載の和英規格変換方法。
類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。
和英／英和翻訳ルートを複数通り設けることを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。
過去に累積した訳例を元に類似文章から利用者のプロファイル（所属，担当業務，専門分野等）に合わせて最適な訳を照合することを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。
原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。
代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする請求項３乃至５の何れかに記載の和英規格変換方法。