JP3978678B2 - 翻訳支援システム - Google Patents
翻訳支援システム Download PDFInfo
- Publication number
- JP3978678B2 JP3978678B2 JP2003298675A JP2003298675A JP3978678B2 JP 3978678 B2 JP3978678 B2 JP 3978678B2 JP 2003298675 A JP2003298675 A JP 2003298675A JP 2003298675 A JP2003298675 A JP 2003298675A JP 3978678 B2 JP3978678 B2 JP 3978678B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- paragraph
- keyword
- keywords
- missing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
(1)原文の全ての語が目的とする言語に自動的に翻訳されてしまうため、明細書の特許請求の範囲で使用されているような重要な語、又は明細書中で頻繁に使用されている主要な語(以下、これらの語を「キーワード」と呼ぶ)の訳語が、翻訳された英文中で、他の訳語に埋もれてしまい、仮にキーワードが誤訳されていても気づかないことがある。
(2)原文の全てが自動的に翻訳されてしまうため、原文が長文である場合又は悪文である場合(例えばに、文のかかりが不明確な場合)には誤訳される可能性が非常に高くなる。例えば、文節のかかりが間違って解釈されて自動翻訳された場合でも、翻訳された英文はそれなりに読めるため、英文をチェックしても誤訳を見逃すことがある。原文をプリエディットしてから自動翻訳を行う方法もあるが、プリエディットにはそれ程時間をかけられないという時間的制約があり、文のかかり等を勘違いして原文を編集してしまうことが多く、同様の問題が発生する。
(3)自動翻訳によって得られる英文は不自然で分かり難い場合が多く、それを分かり易い自然な発想の英語にするためには大幅な書換えが必要で、最初から手動で翻訳した方が良い英文ができる。しかし、手動による翻訳は効率が悪いため、翻訳及びチェック作業を効率化できるシステムが求められている。
(4)特許明細書の翻訳では、発明に関連の深い重要な記載の抜け、データ(数字や単位)の誤り等が原因で、特許権の取得や権利行使が困難になることがあり、通常の書類に比べて、訳文の厳重なチェックが必要とされる。しかしながら、現状の翻訳システムでは、訳抜けやデータの間違いをチェックする機能がない。なお、自動翻訳システムを用いた場合でも、ポストエディット中に訳文の一部を誤って消したり、データを誤って変更したりすることがあるため、高い品質の翻訳にはチェック作業が不可欠である。
図1は、本発明の一実施形態による翻訳支援システムの全体構成を示す。なお、日本語の特許明細書(以下、ソースドキュメントと呼ぶ)を英語の特許明細書(以下、ターゲットドキュメントと呼ぶ)に翻訳する場合を例にとって説明するが、本発明の翻訳支援方法及びシステムは特許明細書以外の文書の翻訳や別の言語間の翻訳にも使用できるのは勿論である。
先ず、本発明の一実施形態による翻訳支援援システムの動作(即ち、翻訳支援方法)の概要を図2を参照して説明する。翻訳支援システムは、最初のステップS10で、フロッピードライブ5を介して読込まれたソースドキュメントからキーワードを抽出し、次のステップS12で抽出したキーワードのリストを表示装置3上に表示する。ステップS14で、表示されたキーワードの訳語をオペーレータ(翻訳者)がキーボード4から入力する。その後、システムは、ステップS16において、入力された訳語に基づき、ソースドキュメント中のキーワードを英語に一括して置換して、キーワードのみが英語に変換されたソースドキュメントを表示装置3上に表示する。それに続くステップS18で、オペーレータは、ソースドキュメントの残りの部分を手動により翻訳する。最後のステップS20で、システムは、翻訳によって得られたターゲットドキュメントを対象にして訳抜け・数字チェック処理を行う。
〔キーワード抽出〕
ステップS10で抽出するキーワードは、例えば、ソースドキュメントである特許明細書中に所定回数以上出現する語、特許明細書の請求項に含まれる語、又は特許明細書の発明を実施するための最良の形態の章において図面中の番号と組み合わせて使用されている語である。特許明細書中に所定回数以上出現する語をキーワードとして抽出するには、市販の単語抽出プログラムを頻度判定処理と組み合わせて用いる。例えば、http://hp.vector.co.jp/からダウンロードできる「WordExplorer」を単語抽出に利用できる。このプログラムでソースドキュメントから単語を抽出すると、ソースドキュメントに出現した単語と各単語の出現回数を対応させた表のデータが得られる。このようにして得られた、単語の内、出現回数が所定回数以上のもの、例えば出現回数が5回数以上の単語をキーワードとして選択する。特許明細書の請求項に含まれる語をキーワードとして抽出すする場合には、ソースドキュメントから請求項の部分を選択し、請求項を対象として単語抽出を行う。請求項で使用される語は重要度が高いので、抽出された単語の内、例えば出現回数が2回数以上の単語をキーワードとして選択する。発明を実施するための最良の形態の章において図面中の番号、即ち参照符号と組み合わせて使用されている語をキーワードとして選択する場合、最良の形態の章を対象範囲として単語抽出を行い、抽出された単語の内、最良の形態の章において数字と組み合わせて使用されているもの(例えば、抽出された単語が「自動車」である場合、「自動車10」のように単語の直ぐ後に参照数字が続くもの)をキーワードとして選択する。
システムは、このようにして選択されたキーワードを、ステップS12で、図3(a)に示すリストの形式で表示装置3上に表示する。表示されたリストの各行の左側の欄に抽出された「先行車」、「衝突」等のキーワードが表示されており、各行の右側の対訳の欄は空欄になっている。
オペーレータは、ステップS14において、表示装置3上に表示されたキーワードリストの各行の右側の欄に対訳を入力する。この入力はキーボード4を使用して行われれ、例えば、「先行車」の対訳として「preceding vehicle」、「衝突」の対訳として「collision」が入力される。なお、翻訳すべきソースドキュメントに適したタームリスト(日本語の用語とこれに対応する英語での表記を対応付けた表)がデータとして提供されているか又は入手可能な場合がある。このような場合、タームリストに含まれるキーワードについては、タームリストを参照して対訳を自動的に入力するようにしてもよい。図3(b)に対訳が入力された状態のキーワードリストを示す。
システムは、ステップS16において、入力された訳語に基づき、ソースドキュメント中のキーワードを英語に一括して置換する。図4はこの処理の詳細を示し、先ず最初のステップS100において、キーワードリストの行を指定するパラメータKNを1に設定する。その後、ステップS102へ移行し、パラメータKNによって指定された行(この場合、キーワードリストの第1行目)からキーワードと対訳を読みだす。ステップS104において、ソースドキュメントの全体を対象にして、キーワードを検索し、これを対訳に置換する。なお、この全文置換処理は、ソースドキュメントを画面上に表示した状態で行うのが好ましい。ステップS106において、現在のキーワードがキーワードリスト内の最後のキーワードであるか否かを判定する。最後のキーワードでない場合、ステップS108でパラメータKNの値に1を加えた後、ステップS102戻り、ステップS102〜106の処理を繰り返す。これにより、キーワードリストの第2行目以後に列挙されてキーワードについて、対訳への全文置換が行われる。ステップS106において、現在のキーワードがキーワードリスト内の最後のキーワードであると判定されると、システムは図4の処理を終了し、図2のステップS18へ移行する。ステップS18は手動による翻訳ステップであるため、システムは、手動による翻訳が終わるまで待機状態となる。
現時点では、キーワードのみが翻訳されたソースドキュメントが表示装置3上に表示されているため、オペーレータは、ソースドキュメントの残りの部分を手動により翻訳する。この翻訳作業はキーボード4と、ワードプロセッサプログラムに付属している公知の文書編集機能とを用いて従来と同様な方法で行われる。
翻訳作業が終了した後、オペーレータは、キーボード4から特定のコマントを入力するか、キーボード4の特定のファンクションキーを操作する。システムは、これに応答して図2のステップS20の訳抜け数字チェック処理を開始する。図5はこの処理の詳細を示し、ステップS200〜S208がターゲットドキュメント中における段落抜けをチェックする処理で、ステップS214とS216が段落毎に数字抜け又は数字の誤りと、キーワードの抜けをチェックする処理である。
2:ハードディスクユニット
3:表示装置
4:キーボード
5:フロッピードライブ
Claims (6)
- 原文を目標の言語に翻訳する作業を支援するための翻訳支援システムであって、
翻訳すべき原文から複数のキーワードを抽出し、抽出された複数のキーワードを一覧表の形式で表示するキーワード抽出手段と、
抽出された複数のキーワードに対応する訳語を入力するためのデータ入力手段と、
入力された訳語に基づき、原文中のキーワードのみを目標の言語に一括して置換する一括置換手段と、
キーワードのみが目標の言語に置換された原文を表示する表示手段とを有することを特徴とするシステム。 - 前記キーワードは、原文中に所定回数以上出現する語であることを特徴とする、請求項1に記載の翻訳支援システム。
- 前記原文は特許出願用明細書であり、前記キーワードは、請求項に含まれる語であることを特徴とする、請求項1に記載の翻訳支援システム。
- 前記原文は特許出願用明細書であり、前記キーワードは、発明を実施するための最良の形態の章において図面中の番号と組み合わせて使用されている語であることを特徴とする、請求項1に記載の翻訳支援システム。
- 目的とする言語に翻訳された訳文の訳抜けをチェックする訳抜けチェック手段を更に含み、この訳抜けチェック手段は、原文の各段落に対応する段落が訳文中に存在するか否かに基づいて、訳文に段落抜けがあるか否かを判定することを特徴とする、請求項1に記載の翻訳支援システム。
- 目的とする言語に翻訳された訳文の訳抜けをチェックする訳抜けチェック手段を更に含み、この訳抜けチェック手段は、原文の各段落における各数字又は前記キーワード抽出手段によって抽出された各キーワードの数と、訳文中の対応する段落における対応する数字又はキーワードの数とを比較し、訳文中の各段落における各数字又はキーワードの数が原文の対応する段落における対応する数字又はキーワードの数と異なる場合に訳抜けがあると判定することを特徴とする、請求項1に記載の翻訳支援システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003298675A JP3978678B2 (ja) | 2003-08-22 | 2003-08-22 | 翻訳支援システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003298675A JP3978678B2 (ja) | 2003-08-22 | 2003-08-22 | 翻訳支援システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005071017A JP2005071017A (ja) | 2005-03-17 |
JP3978678B2 true JP3978678B2 (ja) | 2007-09-19 |
Family
ID=34404111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003298675A Expired - Fee Related JP3978678B2 (ja) | 2003-08-22 | 2003-08-22 | 翻訳支援システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3978678B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102439587A (zh) * | 2009-04-23 | 2012-05-02 | 托马斯·F.·小奎恩 | 用于提交法律文件的系统和方法 |
KR20170122505A (ko) * | 2016-04-27 | 2017-11-06 | 삼성전자주식회사 | 부가 정보를 제공하는 단말 장치 및 제공 방법 |
CN109522563B (zh) * | 2018-10-15 | 2023-05-23 | 语联网(武汉)信息技术有限公司 | 自动判断语句翻译完毕的方法及装置 |
JP7396608B2 (ja) * | 2019-01-31 | 2023-12-12 | 株式会社椿知財サービス | 翻訳装置、翻訳装置の制御プログラム、および翻訳装置を用いた翻訳方法 |
JP2021026590A (ja) * | 2019-08-07 | 2021-02-22 | 株式会社椿知財サービス | 翻訳装置、翻訳装置の制御プログラム、および翻訳装置を用いた翻訳評価方法 |
JP7165163B2 (ja) * | 2019-09-06 | 2022-11-02 | 国人 小林 | 発明文書分析システム及び発明文書分析処理プログラム |
CN112417898A (zh) * | 2020-11-24 | 2021-02-26 | 掌阅科技股份有限公司 | 基于关键词提示的文本翻译方法、计算设备及存储介质 |
-
2003
- 2003-08-22 JP JP2003298675A patent/JP3978678B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005071017A (ja) | 2005-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4962452A (en) | Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence | |
US8209166B2 (en) | Apparatus, method, and computer program product for machine translation | |
US8219381B2 (en) | Dictionary registration apparatus, dictionary registration method, and computer product | |
JP3978678B2 (ja) | 翻訳支援システム | |
JP2004220616A (ja) | 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 | |
EP1037153A2 (en) | Natural language translation | |
JP5091549B2 (ja) | 文書データ処理装置 | |
JPS6118074A (ja) | プレ・エデイツト方式 | |
JP3005634B2 (ja) | 機械翻訳対訳表示装置 | |
JP2019087233A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JPH06266770A (ja) | 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置 | |
JP2893239B2 (ja) | 翻訳支援辞書検索表示システム | |
JP2007316834A (ja) | 日本語文章修正装置、日本語文章修正方法および日本語文章修正のためのプログラム | |
JP3964910B2 (ja) | 機械翻訳装置 | |
JP2009146196A (ja) | 翻訳支援システム、翻訳支援方法および翻訳支援用プログラム | |
JPS62203268A (ja) | 機械翻訳システム | |
JPH03260764A (ja) | 翻訳用辞書登録方式 | |
JP3014746B2 (ja) | 機械翻訳装置 | |
JP3999771B2 (ja) | 翻訳支援プログラム、翻訳支援装置、翻訳支援方法 | |
JP2003006190A (ja) | 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法 | |
JP2965578B2 (ja) | 文書作成支援方法 | |
JP2002183134A (ja) | 翻訳装置 | |
JPH08287072A (ja) | 機械翻訳装置 | |
JPH07200588A (ja) | 翻訳装置 | |
JPH04158477A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070227 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070613 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100706 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100706 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120706 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |