JP2004062384A - 対訳候補表示装置および対訳候補表示プログラム - Google Patents

対訳候補表示装置および対訳候補表示プログラム Download PDF

Info

Publication number
JP2004062384A
JP2004062384A JP2002217968A JP2002217968A JP2004062384A JP 2004062384 A JP2004062384 A JP 2004062384A JP 2002217968 A JP2002217968 A JP 2002217968A JP 2002217968 A JP2002217968 A JP 2002217968A JP 2004062384 A JP2004062384 A JP 2004062384A
Authority
JP
Japan
Prior art keywords
bilingual
translation
sentence
candidate
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002217968A
Other languages
English (en)
Other versions
JP2004062384A5 (ja
JP4050950B2 (ja
Inventor
Hide Fuji
富士 秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002217968A priority Critical patent/JP4050950B2/ja
Priority to EP03254164A priority patent/EP1385095A3/en
Priority to US10/608,150 priority patent/US20040030542A1/en
Publication of JP2004062384A publication Critical patent/JP2004062384A/ja
Publication of JP2004062384A5 publication Critical patent/JP2004062384A5/ja
Application granted granted Critical
Publication of JP4050950B2 publication Critical patent/JP4050950B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】翻訳作業者が効率良く翻訳作業を進めること。
【解決手段】対訳候補表示装置10は、例文としての原文に含まれる各単語ごとに、例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文データベース15と、対訳例文データベース15によって対応付けて記憶された各単語の対訳を参照して、翻訳対象の単語に対応する対訳の一覧を作成し、この対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて対訳候補として抽出する対訳集計部19と、対訳集計部19によって集計されて抽出された各対訳候補を、翻訳対象の単語とともに出力部12に表示するように制御する表示制御部20とを備える。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
この発明は、所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる各単語を含んだ例文を表示する対訳候補表示装置および対訳候補表示プログラムに関し、特に、翻訳作業者が効率良く翻訳作業を進めることができる対訳候補表示装置および対訳候補表示プログラムに関する。
【0002】
【従来の技術】
従来より、産業翻訳の分野では、様々な訳語に翻訳され得る原文の単語を均等な品質で翻訳することが求められている。つまり、翻訳作業によって作成された訳文の用語や表現が当該訳文内で統一されていること、さらには、過去に翻訳された同内容の訳文とも一貫していることが要求されている。このような要求を背景にして、産業翻訳の分野においては、過去に翻訳された原文および訳文を例文として蓄積し、この例文を参照しながら翻訳作業を進めることができるようにした翻訳支援システムが開発されている。
【0003】
かかる翻訳支援システムの代表的なものとしては、図12に示す対訳候補表示装置(いわゆる、翻訳メモリシステム)がある。この対訳候補表示装置は、概略的には、過去に翻訳された所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる各単語を含んだ例文を表示するというものである。
【0004】
これを具体的に説明すると、図12に示す対訳候補表示装置30において、翻訳メモリデータベース33には、過去に翻訳された所定の文章に係る原文および訳文が例文として一文ずつ対応付けられて記憶される。そして、翻訳対象である原文が入力部31を介して入力されると、検索部34は、この原文に含まれる各単語を含んだ文章を、翻訳メモリデータベース33から検索し、表示制御部35は、翻訳メモリデータベース33から検索された文章の原文および訳文を出力部32(モニタ)を介して出力する。すなわち、例えば、翻訳対象である原文が「I saw a girl.」であったとすると、「saw」や「girl」を含んだ文章が翻訳メモリデータベース33から検索され、図13に示すように、「saw」や「girl」を含んだ文章の原文および訳文がモニタ(出力部32)に表示される。
【0005】
一方、翻訳作業者は、出力部32に表示された原文および訳文を参照しつつ、翻訳対象である原文の訳文を決定し、この訳文を入力部31を介して入力する。これに続いて、翻訳文編集部36は、入力部31を介して入力された訳文および原文を対応付けて翻訳メモリデータベース33に新たに格納する。つまり、上記の例で言えば、「I saw a girl」と言う原文と、翻訳作業者によって入力部31から入力された訳文とが、新たに対応付けられて翻訳メモリデータベース33に記憶される。
【0006】
【発明が解決しようとする課題】
しかしながら、上記の従来技術は、翻訳作業者が対訳を決定するまでに手間と時間がかかってしまい、効率良く翻訳作業を進めることが困難であるという問題点があった。すなわち、上記の従来技術では、図13に示すように、翻訳対象である原文に含まれる各単語を含んだ文章の原文および訳文が列挙されるに過ぎないため、翻訳作業者は、列挙された原文および訳文をそれぞれ細かく検討してから、対訳を決定しなければならない。
【0007】
つまり、上記の例で言えば、「girl」の対訳を決定しようとする場合、翻訳作業者は、「girl」を含んだ原文を順次探し出し、探し出した各原文に対応する訳文を順次参照した上で、「girl」の対訳としてはどのような対訳があるか、各対訳の割合はどの程度であるか、などを検討する必要がある。このような状況では、翻訳作業者が対訳を決定するまでに手間と時間がかかってしまい、効率良く翻訳作業を進めることは困難であった。
【0008】
そこで、この発明は、上述した従来技術による問題点を解消するためになされたものであり、翻訳作業者が効率良く翻訳作業を進めることができる対訳候補表示装置および対訳候補表示プログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、本発明は、例文としての原文に含まれる各単語ごとに、例文としての訳文に含まれる当該単語の対訳を対応付けて記憶し、対応付けて記憶された各単語の対訳のうち、翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して対訳候補を抽出し、所定の単語とともに表示するように制御する。
【0010】
したがって、本発明によれば、例文として記憶された内容を翻訳対象である原文とともに表示する際に、所定の単語に対して対訳候補としてどのような対訳があるかを表示するので、翻訳作業者が効率良く翻訳作業を進めることが可能になる。
【0011】
また、本発明は、対応付けて記憶された各単語の対訳を参照して、所定の単語に対応する対訳の一覧を作成し、対訳の一覧のなかから、他の対訳と重複しない対訳は、そのまま対訳候補として抽出する一方、他の対訳と重複する対訳は、各対訳を一つにまとめて対訳候補として抽出する。そして、抽出された各対訳候補を、所定の単語とともに表示するように制御する。
【0012】
したがって、本発明によれば、他の対訳と重複しない対訳は、そのまま対訳候補として抽出し、他の対訳と重複する対訳は、各対訳を一つにまとめて対訳候補として表示することにより、翻訳作業者は、どのような対訳があるか一目で把握できるので、効率良く翻訳作業を進めることが可能になる。
【0013】
また、本発明は、抽出された各対訳候補ごとに、対訳の一覧を参照して、対訳候補に該当する対訳の個数を算出し、対訳候補の表示に際し、算出された対訳の個数についても、対訳候補ごとに表示するように制御する。
【0014】
したがって、本発明によれば、所定の単語の対訳候補について各対訳の用いられる割合を表示することにより、翻訳作業者は、どのような対訳があるか、さらには、各対訳の割合はどの程度であるか、を一目で把握できるので、効率良く翻訳作業を進めることが可能になる。
【0015】
また、本発明は、抽出された対訳候補の個数を算出し、所定の単語の表示に際し、算出された対訳候補の個数に応じて、表示態様を区別して表示するように制御する。
【0016】
したがって、本発明によれば、対訳候補数によって、翻訳対象である原文の各単語の表示態様を区別することにより、一目で翻訳対象である原文の各単語についての対訳候補数が判別できるので、翻訳作業者が効率良く翻訳作業を進めることが可能になる。
【0017】
また、本発明は、対訳候補の表示に際し、記憶された原文および訳文のなかから、対訳候補となった対訳が含まれる訳文および/または訳文に対応する原文についても、対訳候補ごとに表示するように制御する。
【0018】
したがって、本発明によれば、対訳候補とともに、その対訳を含む例文の原文および訳文を表示するので、翻訳作業者は、対訳候補の対訳について例文の文意も参酌して、翻訳対象である原文にふさわしい対訳を決定することが可能になる。
【0019】
また、本発明は、所定の文章ごとに、文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日を関連付けて記憶するものであって、対訳候補の表示に際し、対訳候補となった対訳が含まれる訳文に関して、関連付けて記憶された分野、作業者および/または年月日についても、対訳候補ごとに表示するように制御する。
【0020】
したがって、本発明によれば、対訳候補とともに、過去に翻訳された例文において、文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日を表示することにより、過去の分野および作業者と文章の整合性を取ることができるので、様々な訳語に翻訳され得る原文の単語を均等な品質で翻訳することが可能になる。
【0021】
また、本発明は、所定の文章ごとに、文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日を関連付けて記憶するものであって、関連付けて記憶された分野、作業者および/または年月日を、利用者から検索条件として受け付けて、対応付けて記憶された各単語の対訳のうち、受け付けられた検索条件を具備する対訳に基づいて、所定の単語に対応する対訳を集計して対訳候補を抽出する。
【0022】
したがって、本発明によれば、例文から対訳を検索して対訳候補を抽出する際に、例文に関連付けて記憶された情報(文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日)を検索条件にすることにより、実際に翻訳する文章により近い文章を参考にすることができるので、様々な訳語に翻訳され得る原文の単語を均等な品質にかつ効率的に翻訳することが可能である。
【0023】
また、本発明は、翻訳対象である原文に含まれる複数の単語を解析し、解析された各単語ごとに、各単語に対応する対訳を集計して対訳候補を抽出し、解析された各単語ごとに、集計されて抽出された対訳候補を表示するように制御する。
【0024】
したがって、本発明によれば、翻訳対象である原文に含まれる複数の単語を解析し、各単語ごとに対応する対訳を集計して対訳候補を抽出するので、各単語にどのような対訳があるかが一目で把握できる。これにより、翻訳作業者が効率的に翻訳することが可能になる。
【0025】
また、本発明は、表示された対訳候補のなかから、所定の単語の対訳として採用すべき対訳候補を、利用者による選択によって受け付けて、所定の単語と受け付けた対訳候補とを対応付け、例文として新たに記憶する。
【0026】
したがって、本発明によれば、翻訳作業者が対訳候補のなかから所定の対訳を決定した際に、翻訳対象である原文の所定の単語と翻訳作業者によって決定された対訳候補とを対応付けて記憶することにより、対訳候補の基になる例文の対応付けが効率的に記憶され、類似文を翻訳する際に、一層効率的に翻訳することが可能になる。
【0027】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る対訳候補表示装置および対訳候補表示プログラムの好適な実施の形態を詳細に説明する。なお、下記に示す実施の形態1では、本発明に係る対訳候補表示装置(対訳候補表示方法)を説明し、また実施の形態2では、本発明に係る対訳候補表示プログラムを実行するコンピュータシステムを説明し、最後に、他の実施の形態として種々の変形例を説明することとする。
【0028】
(実施の形態1)
実施の形態1では、本発明に係る対訳候補表示装置(対訳候補表示方法)を説明する。なお、ここでは、本実施の形態1に係る対訳候補表示装置の概要および主たる特徴を説明した後に、この対訳候補表示装置の構成を説明し、最後に、対訳候補表示装置による各種処理の手順を説明する。
【0029】
[概要および主たる特徴]
まず最初に、本実施の形態1に係る対訳候補表示装置の概要および主たる特徴を説明する。図1は、本実施の形態1に係る対訳候補表示装置の構成を示すブロック図である。同図に示す対訳候補表示装置10は、概略的には、所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、例文として記憶された訳文の内容を単語の対訳候補として表示するものである。
【0030】
ここで、この対訳候補表示装置10は、翻訳対象である原文に含まれる所定の単語とともに表示される対訳候補の表示処理に主たる特徴があり、かかる対訳候補表示処理によって、対訳候補を参照する翻訳作業者が、効率良く翻訳作業を進めることができるようにしている。
【0031】
この主たる特徴を具体的に説明すると、対訳候補表示装置10において、対訳例文データベース15は、過去に翻訳された所定の文章に係る原文および訳文を例文として記憶するものであるが、例文としての原文に含まれる各単語ごとに、例文としての訳文に含まれる当該単語の対訳を対応付けて記憶している(図2参照)。
【0032】
そして、翻訳作業者による翻訳作業に際して、対訳集計部19は、対訳例文データベース15によって対応付けて記憶された各単語の対訳のうち、翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して対訳候補を抽出する。つまり、対訳例文データベース15によって対応付けて記憶された各単語の対訳を参照して、翻訳対象の単語に対応する対訳の一覧を作成し(図5および図6参照)、この対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて対訳候補として抽出する(図7参照)。
【0033】
これに続いて、表示制御部20は、対訳集計部19によって集計されて抽出された各対訳候補を、翻訳対象の単語とともに出力部12に表示するように制御する。つまり、図13に示した従来技術のように、翻訳対象である原文に含まれる各単語を含んだ文章の原文および訳文を出力部12に列挙表示するのではなく、この対訳候補表示装置10では、対訳集計部19によって集計されて抽出された各対訳候補を出力部12に表示する(図8(b)参照)。
【0034】
したがって、この対訳候補を参照する翻訳作業者は、上記した従来技術の例で言えば、「girl」を含んだ原文を順次探し出し、探し出した各原文に対応する訳文を順次参照する必要がなく、さらに、「girl」の対訳としてはどのような対訳があるかなどを検討する必要もなく、対訳候補を参照するだけで、「girl」の対訳として「少女」と「女の子」とがあることを直ちに把握することができる。これによって、翻訳作業者が対訳を決定するまでの手間と時間が省かれ、上記した主たる特徴のように、翻訳作業者は効率良く翻訳作業が進めることが可能になる。
【0035】
なお、本実施の形態1に係る対訳候補表示装置10は、上記の主たる特徴に関連した処理として、上記した対訳候補表示処理に先立って(すなわち、翻訳作業者による翻訳作業とは別の処理として)、対訳例文データベース15を作成する事前解析データ処理をも実行する。つまり、過去に翻訳された所定の文章に係る原文および訳文を例文について、原文に含まれる各単語ごとに、訳文に含まれる当該単語の対訳を対応付けて記憶する処理も実行する。
【0036】
[対訳候補表示装置の構成]
次に、本実施の形態1に係る対訳候補表示装置10における各部の構成を説明する。この対訳候補表示装置10は、図1に示すように、入力部11と、出力部12と、事前解析データベース13と、翻訳対象文データベース14と、対訳例文データベース15と、事前処理解析部16と、対応付け部17と、入力文解析部18と、対訳集計部19と、表示制御部20と、翻訳文編集部21とから構成される。
【0037】
このうち、入力部11は、各種の情報を入力するキーボードやマウスなどの指示入力手段であり、主に翻訳作業者からの所定の指示入力を受け付ける。具体的には、翻訳対象である原文を翻訳対象文データベース14から選択する指示や、翻訳対象である原文の所定の単語に対する対訳(翻訳文)の選択を受け付け(図8(c)参照)、対訳例文データベース15における検索範囲(後述するタイトル、分野、作業者および年月日に関する検索条件)の受け付けなどおこなう。
【0038】
出力部12は、各種の情報を出力するモニタなどの出力表示手段であり、具体的には、翻訳対象である原文の所定の単語とともに、対訳集計部19の処理にしたがって抽出された対訳候補を出力する(図8(b)参照)。また、対訳候補を表示する際に、対訳例文データベース15に基づいて、対訳候補になった対訳が含まれる訳文および訳文に対応する原文についても、対訳候補ごとに出力する(図8(c)参照)。
【0039】
事前解析データベース13は、過去に翻訳された所定の文章に係る原文および訳文を例文として記憶する記憶手段である。具体的には、対訳例文データベース15を作成する事前解析データ処理を実行する際の情報源として、過去に翻訳された所定の文章に係る原文を事前解析データベース13の原文13aに、また、当該所定の文章に係る訳文を事前解析データベース13の訳文13bに記憶している。
【0040】
翻訳対象文データベース14は、翻訳対象である原文を記憶する記憶手段である。なお、翻訳作業者は、この翻訳対象文データベース14に記憶された原文のなかから、入力部11を介して翻訳対象である原文を選択して指示入力することとなる。
【0041】
対訳例文データベース15は、所定の文章に係る原文および訳文を例文として記憶する記憶手段である。具体的には、事前解析データ処理の結果として、事前解析データベース13に記憶された例文について、原文に含まれる各単語ごとに、例文としての訳文に含まれる単語の対訳を対応付けて記憶する(図2参照)。さらに、対訳例文データベース15は、対訳集計部19によって検索される際の検索条件である情報(例文となる文章のタイトル、分野、例文となる訳文を翻訳した翻訳作業者およびその年月日)についても、関連付けて記憶する(図2参照)。なお、この対訳例文データベース15には、後述する翻訳文編集部21によって対応付けられた原文および訳文も、例文として新たに記憶される。
【0042】
事前処理解析部16および対応付け部17は、上記した事前解析データ処理として、事前解析データベース13に記憶された例文を解析して、対訳例文データベース15に格納する処理部である。具体的には、事前処理解析部16は、事前解析データベース13に記憶された所定の文章に係る原文および訳文を解析して各単語ごとに分解する。そして、対応付け部17は、事前処理解析部16による解析に基づいて分解された各単語について、翻訳作業者による入力部11を介した対応付け指示にしたがって、原文の各単語ごとに訳文の各単語(対訳)を対応付ける。なお、この対応付けは、上記した対訳例文データベース15に格納される(図2参照)。
【0043】
入力文解析部18は、翻訳対象文データベース14から選択された翻訳対象である原文(入力文)を解析する原文解析手段である。具体的には、翻訳対象である原文が「I saw a girl」という原文である場合には、「I/saw/a/girl」のように、各単語を分解する。
【0044】
対訳集計部19は、対訳例文データベース15によって対応付けて記憶された各単語の対訳のうち、翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して対訳候補を抽出する処理部であり、機能概念的に、対訳例文検索部19aと、対訳一覧作成部19bと、対訳候補抽出部19cと、対訳個数算出部19dと、対訳候補数算出部19eとから構成される。
【0045】
このうち、対訳例文検索部19aは、翻訳対象である原文の各単語ごとに、対訳例文データベース15に基づいて、所定の単語の対訳を含む例文の原文および訳文を検索する処理部である。具体的には、図5に示すように、「I」、「saw」、および「girl」という各単語ごとに、各単語を含んだ原文および訳文を検索する。また、この対訳例文検索部19aは、入力部11を介して検索条件(具体的には、タイトル、分野、翻訳作業者および年月日)を受け付けた場合には、この検索条件を具備する例文の範囲から、翻訳対象である原文の各単語の対訳を含む例文を検索する。
【0046】
対訳一覧作成部19bは、対訳例文検索部19aによる検索結果に基づいて、翻訳対象である原文に含まれる所定の単語に対応する対訳の一覧を作成する処理部である。具体的には、図6に示すように、翻訳対象である原文の各単語ごとの対訳を含む例文の原文および訳文(図5参照)を参照して、翻訳対象である原文の各単語ごとに対訳を取り出して、対訳の一覧を作成する。なお、図6は、「saw」の対訳として、「見かけた」を二つ取り出して作成された一覧を示し、また、「girl」の対訳として、「少女」を五つ取り出すとともに、「女の子」を五つ取り出して作成された一覧を示している。
【0047】
対訳候補抽出部19cは、対訳一覧作成部19bによって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、そのまま対訳候補として抽出する一方、他の対訳と重複する対訳は、重複する対訳を一つにまとめて対訳候補として抽出する処理部である。具体的には、図7に示すように、「saw」については、二つの「見かけた」を一つにまとめて対訳候補として抽出し、また、「girl」については、五つの「少女」を一つにまとめて対訳候補として抽出するとともに、五つの「女の子」を一つにまとめて対訳候補として抽出する。
【0048】
対訳個数算出部19dは、対訳候補抽出部19cによって抽出された各対訳候補ごとに、対訳一覧作成部19bによって作成された対訳の一覧を参照して、対訳候補に該当する対訳の個数を算出する処理部である。例えば、図6に示す対訳の一覧の「girl」については、「少女」の対訳の個数として五個を算出するとともに、「女の子」の対訳の個数として五個を算出し、さらに、この個数に基づいて、図7に示すように、「実際存在した個数/全体の個数」(つまり頻度)を算出する。
【0049】
対訳候補数算出部19eは、翻訳対象である原文の各単語ごとに、対訳候補抽出部19cによって抽出された対訳候補の個数をそれぞれ算出する処理部である。例えば、図7に示した例について言えば、「I」についてはゼロ個、「saw」については一個、「girl」については二個というように、対訳候補の個数を算出する。
【0050】
表示制御部20は、対訳集計部19による処理結果を、出力部12で出力するために、表示画面を作成する表示制御手段である。具体的には、翻訳対象である原文の所定の単語とともに、対訳集計部19によって集計されて抽出された対訳候補を出力部12に表示するように制御する(図8(b)参照)。さらに、この表示に際して、対訳集計部19の対訳個数算出部19dの結果に基づいて、翻訳対象である原文の所定の単語の対訳候補の頻度を表示するように制御したり、対訳集計部19の対訳候補数算出部19eの結果に基づいて(翻訳対象である原文の各単語の対訳候補の個数に応じて)、翻訳対象である原文の各単語における表示態様を区別して表示(例えば、書体や色などによる区別表示)するように制御する。また、入力部11を介して所定の対訳候補が選択された場合には、その対訳ごとの例文(原文および訳文)、その例文の文章のタイトル、分野、その例文の訳文を翻訳した翻訳作業者およびその年月日を表示するように制御する(図8(c)参照)。
【0051】
翻訳文編集部21は、翻訳対象である原文の翻訳文を編集する処理部である。具体的には、出力部12に出力された原文の各単語と、入力部11から受け付けた対訳候補とを対応付ける編集をおこなう。なお、翻訳文編集部21によって対応付けられた単語(翻訳対象である原文に含まれる単語)および対訳は、対訳例文データベース15に新たに例文として格納される。
【0052】
[各種の処理の手順]
次に、本実施の形態1に係る対訳候補表示装置10による各種処理の手順を説明する。なお、ここでは、主たる特徴に関連した処理として、上記した対訳候補表示処理とは別に、先立っておこなわれる(1)事前解析データ処理を説明した後に、主たる特徴である(2)対訳候補表示処理を説明する。
【0053】
(1)事前解析データ処理
図3は、事前解析データ処理の手順を示すフローチャートである。同図に示すように、事前処理解析部16は、事前解析データベース13の原文13aから、過去に翻訳された所定の文章に係る原文を一文取り出し、各単語に分解し(ステップS301)、同様にして、先に取り出した原文に対応する訳文を、事前解析データベース13の訳文13bより一文取り出し、各単語に分解する(ステップS302)。
【0054】
そして、対応付け部17は、事前処理解析部16による解析に基づいて分解された各単語について、翻訳作業者による入力部11を介した対応付け指示にしたがって、原文の各単語ごとに訳文の各単語(対訳)を対応付ける(ステップS303)。これに続いて、対応付け部17によりおこなわれた対応付けは、対訳例文データベース15に蓄積される(ステップS304)。
【0055】
この後に、事前処理解析部16は、当該処理文が最後の文であるか否かを判定する(ステップS305)。そして、その処理文が最後の文である場合には(ステップS305肯定)、処理を完了する。一方、まだ処理文が残っている場合(ステップS305否定)、事前処理解析部16は、事前解析データベース13の原文aから新たに処理文を一文取り出して、各単語に分解し(ステップS301)、上記したステップS302〜S304の処理を実行する。
【0056】
上記した一連の処理を経て、対訳例文データベース15には、例文としての原文に含まれる各単語ごとに、例文としての訳文に含まれる単語の対訳が対応付けて記憶されることとなる(図2参照)。
【0057】
(2)対訳候補表示処理
次に、対訳候補表示処理について説明する。図4は、対訳候補表示処理の手順を示すフローチャートである。同図に示すように、入力部11は、翻訳対象文データベース14に記憶された翻訳対象である文章のなかから、翻訳対象である原文(一文)の選択に対する指示入力を受け付ける(ステップS401)。つまり、図8(a)に示すように、翻訳作業者は、翻訳対象文データベース14から翻訳対象である原文「I saw a girl.」を、入力部11を介して選択する。
【0058】
そして、入力文解析部18は、翻訳対象文データベース14から選択された翻訳対象である原文(入力文)を解析する(ステップS402)。具体的には、入力文解析部18は、翻訳対象である原文「I saw a girl.」を解析し、「I/saw/a/girl」のように、各単語に分解する。
【0059】
続いて、対訳集計部19の対訳例文検索部19aは、翻訳対象である原文の各単語ごとに、対訳例文データベース15に基づいて、所定の単語の対訳を含む例文の原文を検索し(ステップS403)、また、その訳文も検索する(ステップS404)。具体的には、対訳例文検索部19aは、図5に示すように、翻訳対象である原文の各単語である「I」、「saw」および「girl」をキーワードとして、対訳例文データベース15のなかから、翻訳対象である原文の各単語を含んだ原文を検索し、そして、その訳文も検索する。
【0060】
その後、対訳集計部19の対訳一覧作成部19bは、対訳例文検索部19aによる検索結果(図5参照)に基づいて、図6に示すように、翻訳対象である原文の各単語ごとに対訳を取り出して、対訳の一覧を作成する(ステップS405)。なお、図6は、「saw」の対訳として、「見かけた」を二つ取り出して作成された一覧を示し、また、「girl」の対訳として、「少女」を五つ取り出すとともに「女の子」を五つ取り出して作成された一覧を示している。
【0061】
そして、対訳集計部19の対訳候補抽出部19cは、対訳一覧作成部19bによって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、そのまま対訳候補として抽出する一方、他の対訳と重複する対訳は、重複する対訳を一つにまとめて対訳候補として抽出する(ステップS406)。つまり、対訳の一覧(図6参照)のなかから、「saw」については、二つの「見かけた」を一つにまとめて対訳候補として抽出し(図7参照)、また、「girl」については、五つの「少女」を一つにまとめて対訳候補として抽出するとともに、五つの「女の子」をひとつにまとめて対訳候補として抽出する。(図7参照)
【0062】
続いて、対訳集計部19の対訳個数算出部19dは、対訳候補抽出部19cによって抽出された各対訳候補ごとに、対訳一覧作成部19bによって作成された対訳の一覧を参照して、対訳候補に該当する対訳の個数を算出する(ステップS407)。例えば、図6に示す対訳の一覧の「girl」については、「少女」の対訳の個数として五個を算出するとともに、「女の子」の対訳の個数として五個を算出し、さらに、この個数に基づいて、図7に示すように、「実際存在した個数/全体の個数」(つまり頻度)を算出する。
【0063】
その後、対訳集計部19における対訳候補数算出部19eは、翻訳対象である原文の各単語ごとに、対訳候補抽出部19cによって抽出された対訳候補の個数をそれぞれ算出する(ステップS408)。例えば、図7に示した例について言えば、「I」についてはゼロ個、「saw」については一個、「girl」については二個というように、対訳候補の個数を算出する。
【0064】
そして、表示制御部20は、対訳集計部19による処理結果を、出力部12で出力するために、表示画面を作成する(ステップS409)。続いて、出力部12は、図8(c)に示すように、対訳集計部19の処理を通して、表示制御部20において作成された画面を、出力手段(モニタなど)で出力する(ステップS410)。具体的には、翻訳対象である原文の所定の単語「girl」とともに、対訳集計部19によって集計されて抽出された対訳候補(「少女」および「女の子」)を出力部12に表示するように制御する(図8(b)参照)。
【0065】
さらに、この表示に際して、対訳集計部19の対訳個数算出部19dの結果に基づいて、翻訳対象である原文の所定の単語「girl」の対訳候補(「少女」および「女の子」)の頻度(「実際存在した個数/全体の個数」)を表示するように制御したり(図8(b)参照)、対訳集計部19の対訳候補数算出部19eの結果に基づいて(翻訳対象である原文の各単語の対訳候補の個数に応じて)、表示態様を区別して表示(例えば、書体や色などによる区別表示)するように制御する(図8(b)参照)。また、入力部11を介して所定の対訳候補が選択された場合には、その対訳(つまり「少女」または「女の子」)ごとの例文(原文および訳文)、その例文の文章のタイトル、分野、その例文の訳文を翻訳した翻訳作業者およびその年月日を表示するように制御する(図8(c)参照)。
【0066】
続いて、入力部11は、対訳集計部19の対訳例文検索部19aが、対訳例文データベース15から例文(原文および訳文)を検索する際の検索範囲(タイトル、分野、翻訳作業者および年月日)の指定について、受け付けをおこなう(ステップS411)。
【0067】
ここで、入力部11が検索条件を受け付けた場合には(ステップS411肯定)、対訳集計部19の対訳例文検索部aは、検索条件を具備する例文の範囲から、翻訳対象である原文の各単語の対訳を含む例文を検索し(ステップS403)、この検索結果に基づいて、上記のステップS404〜S410の処理を実行する。なお、図9(a)は、作業者を「本人」と指定して検索した場合を示し、同図(b)は、分野を「△△」と指定して検索した場合を示し、同図(c)は、作業者を「本人」ならびに分野を「△△」と指定した場合を示している。
【0068】
そして、入力部11は、図8(c)または図9に示した画面上で、翻訳対象である原文の各単語に対する対訳の選択を受け付ける(ステップS412)。この受け付けによって、対訳が決定されると(ステップS413肯定)、翻訳文編集部21は、出力部12に出力された原文の各単語を、入力部11から受け付けた対訳候補に対応付ける編集をおこない、対応付けられた単語(翻訳対象である原文に含まれる単語)および対訳は、対訳例文データベース15に新たに例文として格納される(ステップS414)。例えば、翻訳対象である原文の所定の単語「girl」と選択された対訳候補の対訳(例えば「少女」)とを対応付けて、対訳例文データベース15に蓄積する。
【0069】
最後に、当該処理文が最後の翻訳対象文である場合(ステップS415肯定)は、処理を終了する。また、まだ翻訳対象文が残っている場合(ステップS415否定)には、ステップS401に戻って、新たな翻訳対象文の翻訳を開始する。
【0070】
上述してきたように、本実施の形態1に係る対訳候補表示装置10は、翻訳対象である原文の所定の単語とともに対訳候補を表示し、さらに、対訳候補の選定を判断する際の情報(対訳候補の選定頻度、対訳候補の例文(原文および訳文)、その例文のタイトル、分野、その例文の訳文を翻訳した翻訳作業者およびその年月日)を出力する。また、翻訳対象である原文の対訳候補の個数により原文の表示態様を区別して表示する。このように、翻訳作業において効率的な情報を提示することによって、翻訳作業者が効率良く翻訳作業を進めることが可能になる。
【0071】
(実施の形態2)
ところで、上記実施の形態1で説明した対訳候補表示装置は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、本実施の形態2では、上記実施の形態1で説明した対訳候補表示装置と同様の機能を有する対訳候補表示プログラムを実行するコンピュータシステムについて説明する。
【0072】
図10は、本実施の形態2に係るコンピュータシステムの構成を示すシステム構成図であり、図11は、このコンピュータシステムにおける本体部の構成を示すブロック図である。図10に示すように、本実施の形態2に係るコンピュータシステム100は、本体部101と、本体部101からの指示によって表示画面102aに画像などの情報を表示するためのディスプレイ102と、このコンピュータシステム100に種々の情報を入力するためのキーボード103と、ディスプレイ102の表示画面102a上の任意の位置を指定するためのマウス104とを備える。
【0073】
また、このコンピュータシステム100における本体部101は、図11に示すように、CPU121と、RAM122と、ROM123と、ハードディスクドライブ(HDD)124と、CD−ROM109を受け入れるCD−ROMドライブ125と、フレキシブルディスク(FD)108を受け入れるFDドライブ126と、ディスプレイ102、キーボード103並びにマウス104を接続するI/Oインターフェース127と、ローカルエリアネットワークまたは広域エリアネットワーク(LAN/WAN)106に接続するLANインターフェース128とを備える。
【0074】
さらに、このコンピュータシステム100には、インターネットなどの公衆回線107に接続するためのモデム105が接続されるとともに、LANインターフェース128およびLAN/WAN106を介して、他のコンピュータシステム(PC)111、サーバ112並びにプリンタ113などが接続される。
【0075】
そして、このコンピュータシステム100は、所定の記録媒体に記録された対訳候補表示プログラムを読み出して実行することで対訳候補表示装置を実現する。ここで、所定の記録媒体とは、フレキシブルディスク(FD)108、CD−ROM109、MOディスク、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」の他に、コンピュータシステム100の内外に備えられるハードディスクドライブ(HDD)124や、RAM122、ROM123などの「固定用の物理媒体」、さらに、モデム105を介して接続される公衆回線107や、他のコンピュータシステム111並びにサーバ112が接続されるLAN/WAN106などのように、プログラムの送信に際して短期にプログラムを保持する「通信媒体」など、コンピュータシステム100によって読み取り可能な対訳候補表示プログラムを記録する、あらゆる記録媒体を含むものである。
【0076】
すなわち、対訳候補表示プログラムは、上記した「可搬用の物理媒体」、「固定用の物理媒体」、「通信媒体」などの記録媒体に、コンピュータ読み取り可能に記録されるものであり、コンピュータシステム100は、このような記録媒体から対訳候補表示プログラムを読み出して実行することで対訳候補表示装置を実現する。なお、対訳候補表示プログラムは、コンピュータシステム100によって実行されることに限定されるものではなく、他のコンピュータシステム111またはサーバ112が対訳候補表示プログラムを実行する場合や、これらが協働して対訳候補表示プログラムを実行するような場合にも、本発明を同様に適用することができる。
【0077】
(他の実施の形態)
さて、これまで本発明の実施の形態について説明したが、本発明は上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてもよいものである。
【0078】
例えば、本実施の形態では、翻訳対象である言語が英文で、訳文の言語が日本文である場合の対訳候補表示処理の実施形態を説明したが、本発明はこれに限定されるものではなく、例えば、翻訳対象である言語が仏文で、訳文の言語が英文である場合や、翻訳対象である言語が中国文で、訳文の言語が日本文である場合など、あらゆる言語間で同様に適用することができる。
【0079】
また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0080】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0081】
(付記1)所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、前記例文として記憶された訳文の内容を前記単語の対訳候補として表示する対訳候補表示装置であって、
前記例文としての原文に含まれる各単語ごとに、前記例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文記憶手段と、
前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳のうち、前記翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して前記対訳候補を抽出する対訳集計手段と、
前記対訳集計手段によって集計されて抽出された前記対訳候補を、前記所定の単語とともに表示するように制御する表示制御手段と、
を備えたことを特徴とする対訳候補表示装置。
【0082】
(付記2)前記対訳集計手段は、
前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳を参照して、前記所定の単語に対応する対訳の一覧を作成する対訳一覧作成手段と、
前記対訳一覧作成手段によって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま前記対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて前記対訳候補として抽出する対訳候補抽出手段と、を備え、
前記表示制御手段は、前記対訳候補抽出手段によって抽出された各対訳候補を、前記所定の単語とともに表示するように制御することを特徴とする付記1に記載の対訳候補表示装置。
【0083】
(付記3)前記対訳集計手段は、前記対訳候補抽出手段によって抽出された各対訳候補ごとに、前記対訳一覧作成手段によって作成された対訳の一覧を参照して、当該対訳候補に該当する対訳の個数を算出する対訳個数算出手段をさらに備え、
前記表示制御手段は、前記対訳候補の表示に際し、前記対訳個数算出手段によって算出された対訳の個数についても、前記対訳候補ごとに表示するように制御することを特徴とする付記2に記載の対訳候補表示装置。
【0084】
(付記4)前記対訳集計手段は、前記対訳候補抽出手段によって抽出された対訳候補の個数を算出する対訳候補数算出手段をさらに備え、
前記表示制御手段は、前記所定の単語の表示に際し、前記対訳候補数算出手段によって算出された対訳候補の個数に応じて、表示態様を区別して表示するように制御することを特徴とする付記2または3に記載の対訳候補表示装置。
【0085】
(付記5)前記表示制御手段は、前記対訳候補の表示に際し、前記対訳例文記憶手段によって記憶された前記原文および訳文のなかから、前記対訳候補となった対訳が含まれる訳文および/または当該訳文に対応する原文についても、前記対訳候補ごとに表示するように制御することを特徴とする付記1〜4のいずれか一つに記載の対訳候補表示装置。
【0086】
(付記6)前記対訳例文記憶手段は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記表示制御手段は、前記対訳候補の表示に際し、前記対訳候補となった対訳が含まれる訳文に関して、前記対訳例文記憶手段によって関連付けて記憶された前記分野、作業者および/または年月日についても、前記対訳候補ごとに表示するように制御することを特徴とする付記1〜5のいずれか一つに記載の対訳候補表示装置。
【0087】
(付記7)前記対訳例文記憶手段は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記対訳例文記憶手段によって関連付けて記憶された前記分野、作業者および/または年月日を、利用者から検索条件として受け付ける検索条件受付手段をさらに備え、
前記対訳集計手段は、前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳のうち、前記受付手段によって受け付けられた検索条件を具備する対訳に基づいて、前記所定の単語に対応する対訳を集計して前記対訳候補を抽出することを特徴とする付記1〜6のいずれか一つに記載の対訳候補表示装置。
【0088】
(付記8)前記翻訳対象である原文から当該原文に含まれる複数の単語を解析する原文解析手段をさらに備え、
前記対訳集計手段は、前記原文解析手段によって解析された各単語ごとに、各単語に対応する対訳を集計して前記対訳候補を抽出し、
前記表示制御手段は、前記原文解析手段によって解析された各単語ごとに、前記対訳集計手段によって集計されて抽出された対訳候補を表示するように制御することを特徴とする付記1〜7のいずれか一つに記載の対訳候補表示装置。
【0089】
(付記9)前記表示制御手段によって表示された対訳候補のなかから、前記所定の単語の対訳として採用すべき対訳候補を、利用者による選択によって受け付ける対訳受付手段をさらに備え、
前記対訳例文記憶手段は、前記所定の単語と、前記対訳受付手段によって受け付けた対訳候補とを対応付け、前記例文として新たに記憶することを特徴とする付記1〜8のいずれか一つに記載の対訳候補表示装置。
【0090】
(付記10)所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、前記例文として記憶された訳文の内容を前記単語の対訳候補として表示する対訳候補表示方法であって、
前記例文としての原文に含まれる各単語ごとに、前記例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文記憶工程と、
前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳のうち、前記翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して前記対訳候補を抽出する対訳集計工程と、
前記対訳集計工程によって集計されて抽出された前記対訳候補を、前記所定の単語とともに表示するように制御する表示制御工程と、
を含んだことを特徴とする対訳候補表示方法。
【0091】
(付記11)前記対訳集計工程は、
前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳を参照して、前記所定の単語に対応する対訳の一覧を作成する対訳一覧作成工程と、
前記対訳一覧作成工程によって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま前記対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて前記対訳候補として抽出する対訳候補抽出工程と、を含み、
前記表示制御工程は、前記対訳候補抽出工程によって抽出された各対訳候補を、前記所定の単語とともに表示するように制御することを特徴とする付記10に記載の対訳候補表示方法。
【0092】
(付記12)前記対訳集計工程は、前記対訳候補抽出工程によって抽出された各対訳候補ごとに、前記対訳一覧作成工程によって作成された対訳の一覧を参照して、当該対訳候補に該当する対訳の個数を算出する対訳個数算出工程をさらに含み、
前記表示制御工程は、前記対訳候補の表示に際し、前記対訳個数算出工程によって算出された対訳の個数についても、前記対訳候補ごとに表示するように制御することを特徴とする付記11に記載の対訳候補表示方法。
【0093】
(付記13)前記対訳集計工程は、前記対訳候補抽出工程によって抽出された対訳候補の個数を算出する対訳候補数算出工程をさらに含み、
前記表示制御工程は、前記所定の単語の表示に際し、前記対訳候補数算出工程によって算出された対訳候補の個数に応じて、表示態様を区別して表示するように制御することを特徴とする付記11または12に記載の対訳候補表示方法。
【0094】
(付記14)前記表示制御工程は、前記対訳候補の表示に際し、前記対訳例文記憶工程によって記憶された前記原文および訳文のなかから、前記対訳候補となった対訳が含まれる訳文および/または当該訳文に対応する原文についても、前記対訳候補ごとに表示するように制御することを特徴とする付記10〜13のいずれか一つに記載の対訳候補表示方法。
【0095】
(付記15)前記対訳例文記憶工程は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記表示制御工程は、前記対訳候補の表示に際し、前記対訳候補となった対訳が含まれる訳文に関して、前記対訳例文記憶工程によって関連付けて記憶された前記分野、作業者および/または年月日についても、前記対訳候補ごとに表示するように制御することを特徴とする付記10〜14のいずれか一つに記載の対訳候補表示方法。
【0096】
(付記16)前記対訳例文記憶工程は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記対訳例文記憶工程によって関連付けて記憶された前記分野、作業者および/または年月日を、利用者から検索条件として受け付ける検索条件受付工程をさらに含み、
前記対訳集計工程は、前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳のうち、前記受付工程によって受け付けられた検索条件を具備する対訳に基づいて、前記所定の単語に対応する対訳を集計して前記対訳候補を抽出することを特徴とする付記10〜15のいずれか一つに記載の対訳候補表示方法。
【0097】
(付記17)前記翻訳対象である原文から当該原文に含まれる複数の単語を解析する原文解析工程をさらに含み、
前記対訳集計工程は、前記原文解析工程によって解析された各単語ごとに、各単語に対応する対訳を集計して前記対訳候補を抽出し、
前記表示制御工程は、前記原文解析工程によって解析された各単語ごとに、前記対訳集計工程によって集計されて抽出された対訳候補を表示するように制御することを特徴とする付記10〜16のいずれか一つに記載の対訳候補表示方法。
【0098】
(付記18)前記表示制御工程によって表示された対訳候補のなかから、前記所定の単語の対訳として採用すべき対訳候補を、利用者による選択によって受け付ける対訳受付工程をさらに含み、
前記対訳例文記憶工程は、前記所定の単語と、前記対訳受付工程によって受け付けた対訳候補とを対応付け、前記例文として新たに記憶することを特徴とする付記10〜17のいずれか一つに記載の対訳候補表示方法。
【0099】
(付記19)所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、前記例文として記憶された訳文の内容を前記単語の対訳候補として表示する方法をコンピュータに実行させる対訳候補表示プログラムであって、
前記例文としての原文に含まれる各単語ごとに、前記例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文記憶工程と、
前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳のうち、前記翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して前記対訳候補を抽出する対訳集計工程と、
前記対訳集計工程によって集計されて抽出された前記対訳候補を、前記所定の単語とともに表示するように制御する表示制御工程と、
をコンピュータに実行させることを特徴とする対訳候補表示プログラム。
【0100】
(付記20)前記対訳集計工程は、
前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳を参照して、前記所定の単語に対応する対訳の一覧を作成する対訳一覧作成工程と、
前記対訳一覧作成工程によって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま前記対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて前記対訳候補として抽出する対訳候補抽出工程と、をコンピュータに実行させ、
前記表示制御工程は、前記対訳候補抽出工程によって抽出された各対訳候補を、前記所定の単語とともに表示するように制御することを特徴とする付記19に記載の対訳候補表示プログラム。
【0101】
(付記21)前記対訳集計工程は、前記対訳候補抽出工程によって抽出された各対訳候補ごとに、前記対訳一覧作成工程によって作成された対訳の一覧を参照して、当該対訳候補に該当する対訳の個数を算出する対訳個数算出工程をさらにコンピュータに実行させ、
前記表示制御工程は、前記対訳候補の表示に際し、前記対訳個数算出工程によって算出された対訳の個数についても、前記対訳候補ごとに表示するように制御することを特徴とする付記20に記載の対訳候補表示プログラム。
【0102】
(付記22)前記対訳集計工程は、前記対訳候補抽出工程によって抽出された対訳候補の個数を算出する対訳候補数算出工程をさらにコンピュータに実行させ、
前記表示制御工程は、前記所定の単語の表示に際し、前記対訳候補数算出工程によって算出された対訳候補の個数に応じて、表示態様を区別して表示するように制御することを特徴とする付記20または21に記載の対訳候補表示プログラム。
【0103】
(付記23)前記表示制御工程は、前記対訳候補の表示に際し、前記対訳例文記憶工程によって記憶された前記原文および訳文のなかから、前記対訳候補となった対訳が含まれる訳文および/または当該訳文に対応する原文についても、前記対訳候補ごとに表示するように制御することを特徴とする付記19〜22のいずれか一つに記載の対訳候補表示プログラム。
【0104】
(付記24)前記対訳例文記憶工程は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記表示制御工程は、前記対訳候補の表示に際し、前記対訳候補となった対訳が含まれる訳文に関して、前記対訳例文記憶工程によって関連付けて記憶された前記分野、作業者および/または年月日についても、前記対訳候補ごとに表示するように制御することを特徴とする付記19〜23のいずれか一つに記載の対訳候補表示プログラム。
【0105】
(付記25)前記対訳例文記憶工程は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
前記対訳例文記憶工程によって関連付けて記憶された前記分野、作業者および/または年月日を、利用者から検索条件として受け付ける検索条件受付工程をさらにコンピュータに実行させ、
前記対訳集計工程は、前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳のうち、前記受付工程によって受け付けられた検索条件を具備する対訳に基づいて、前記所定の単語に対応する対訳を集計して前記対訳候補を抽出することを特徴とする付記19〜24のいずれか一つに記載の対訳候補表示プログラム。
【0106】
(付記26)前記翻訳対象である原文から当該原文に含まれる複数の単語を解析する原文解析工程をさらにコンピュータに実行させ、
前記対訳集計工程は、前記原文解析工程によって解析された各単語ごとに、各単語に対応する対訳を集計して前記対訳候補を抽出し、
前記表示制御工程は、前記原文解析工程によって解析された各単語ごとに、前記対訳集計工程によって集計されて抽出された対訳候補を表示するように制御することを特徴とする付記19〜25のいずれか一つに記載の対訳候補表示プログラム。
【0107】
(付記27)前記表示制御工程によって表示された対訳候補のなかから、前記所定の単語の対訳として採用すべき対訳候補を、利用者による選択によって受け付ける対訳受付工程をさらにコンピュータに実行させ、
前記対訳例文記憶工程は、前記所定の単語と、前記対訳受付工程によって受け付けた対訳候補とを対応付け、前記例文として新たに記憶することを特徴とする付記19〜26のいずれか一つに記載の対訳候補表示プログラム。
【0108】
【発明の効果】
以上説明したように、本発明によれば、例文として記憶された内容を翻訳対象である原文とともに表示する際に、所定の単語に対して対訳候補としてどのような対訳があるかを表示するので、翻訳作業者が効率良く翻訳作業を進めることが可能になる。
【0109】
また、本発明によれば、他の対訳と重複しない対訳は、そのまま対訳候補として抽出し、他の対訳と重複する対訳は、各対訳を一つにまとめて対訳候補として表示することにより、翻訳作業者は、どのような対訳があるか一目で把握できるので、効率良く翻訳作業を進めることが可能になる。
【0110】
また、本発明によれば、所定の単語の対訳候補について各対訳の用いられる割合を表示することにより、翻訳作業者は、どのような対訳があるか、さらには、各対訳の割合はどの程度であるか、を一目で把握できるので、効率良く翻訳作業を進めることが可能になる。
【0111】
また、本発明によれば、対訳候補数によって、翻訳対象である原文の各単語の表示態様を区別することにより、一目で翻訳対象である原文の各単語についての対訳候補数が判別できるので、翻訳作業者が効率良く翻訳作業を進めることが可能になる。
【0112】
また、本発明によれば、対訳候補とともに、その対訳を含む例文の原文および訳文を表示するので、翻訳作業者は、対訳候補の対訳について例文の文意も参酌して、翻訳対象である原文にふさわしい対訳を決定することが可能になる。
【0113】
また、本発明によれば、対訳候補とともに、過去に翻訳された例文において、文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日を表示することにより、過去の分野および作業者と文章の整合性を取ることができるので、様々な訳語に翻訳され得る原文の単語を均等な品質で翻訳することが可能になる。
【0114】
また、本発明によれば、例文から対訳を検索して対訳候補を抽出する際に、例文に関連付けて記憶された情報(文章が属する分野、文章の訳文を作成した作業者および/または訳文が作成された年月日)を検索条件にすることにより、実際に翻訳する文章により近い文章を参考にすることができるので、様々な訳語に翻訳され得る原文の単語を均等な品質にかつ効率的に翻訳することが可能である。
【0115】
また、本発明によれば、翻訳対象である原文に含まれる複数の単語を解析し、各単語ごとに対応する対訳を集計して対訳候補を抽出するので、各単語にどのような対訳があるかが一目で把握できる。これにより、翻訳作業者が効率的に翻訳することが可能になる。
【0116】
また、本発明によれば、翻訳作業者が対訳候補のなかから所定の対訳を決定した際に、翻訳対象である原文の所定の単語と翻訳作業者によって決定された対訳候補とを対応付けて記憶することにより、対訳候補の基になる例文の対応付けが効率的に記憶され、類似文を翻訳する際に、一層効率的に翻訳することが可能になる。
【図面の簡単な説明】
【図1】実施の形態1に係る対訳候補表示装置の構成を示すブロック図である。
【図2】対訳例文データベースに記憶される情報の構成例を示す図である。
【図3】事前解析データ処理の手順を示すフローチャートである。
【図4】対訳候補表示処理の手順を示すフローチャートである。
【図5】対訳例文の検索を説明するための図である。
【図6】対訳一覧の作成を説明するための図である。
【図7】対訳の集計を説明するための図である。
【図8】出力部に表示される画面の構成例を示す図である。
【図9】出力部に表示される画面の構成例を示す図である。
【図10】本実施の形態2に係るコンピュータシステムの構成を示すシステム構成図である。
【図11】図10に示したコンピュータシステムにおける本体部の構成を示すブロック図である。
【図12】従来技術に係る対訳候補表示装置の構成を示すブロック図である。
【図13】出力部に表示される画面の構成例を示す図である。
【符号の説明】
10 対訳候補表示装置
11 入力部
12 出力部
13 事前解析データベース
13a 原文
13b 訳文
14 翻訳対象文データベース
15 対訳例文データベース
16 事前処理解析部
17 対応付け部
18 入力文解析部
19 対訳集計部
19a 対訳例文検索部
19b 対訳一覧作成部
19c 対訳候補抽出部
19d 対訳個数算出部
19e 対訳候補数算出部
20 表示制御部
21 翻訳文編集部

Claims (10)

  1. 所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、前記例文として記憶された訳文の内容を前記単語の対訳候補として表示する対訳候補表示装置であって、
    前記例文としての原文に含まれる各単語ごとに、前記例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文記憶手段と、
    前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳のうち、前記翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して前記対訳候補を抽出する対訳集計手段と、
    前記対訳集計手段によって集計されて抽出された前記対訳候補を、前記所定の単語とともに表示するように制御する表示制御手段と、
    を備えたことを特徴とする対訳候補表示装置。
  2. 前記対訳集計手段は、
    前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳を参照して、前記所定の単語に対応する対訳の一覧を作成する対訳一覧作成手段と、
    前記対訳一覧作成手段によって作成された対訳の一覧のなかから、他の対訳と重複しない対訳は、当該対訳をそのまま前記対訳候補として抽出する一方、他の対訳と重複する対訳は、当該重複する各対訳を一つにまとめて前記対訳候補として抽出する対訳候補抽出手段と、を備え、
    前記表示制御手段は、前記対訳候補抽出手段によって抽出された各対訳候補を、前記所定の単語とともに表示するように制御することを特徴とする請求項1に記載の対訳候補表示装置。
  3. 前記対訳集計手段は、前記対訳候補抽出手段によって抽出された各対訳候補ごとに、前記対訳一覧作成手段によって作成された対訳の一覧を参照して、当該対訳候補に該当する対訳の個数を算出する対訳個数算出手段をさらに備え、
    前記表示制御手段は、前記対訳候補の表示に際し、前記対訳個数算出手段によって算出された対訳の個数についても、前記対訳候補ごとに表示するように制御することを特徴とする請求項2に記載の対訳候補表示装置。
  4. 前記対訳集計手段は、前記対訳候補抽出手段によって抽出された対訳候補の個数を算出する対訳候補数算出手段をさらに備え、
    前記表示制御手段は、前記所定の単語の表示に際し、前記対訳候補数算出手段によって算出された対訳候補の個数に応じて、表示態様を区別して表示するように制御することを特徴とする請求項2または3に記載の対訳候補表示装置。
  5. 前記表示制御手段は、前記対訳候補の表示に際し、前記対訳例文記憶手段によって記憶された前記原文および訳文のなかから、前記対訳候補となった対訳が含まれる訳文および/または当該訳文に対応する原文についても、前記対訳候補ごとに表示するように制御することを特徴とする請求項1〜4のいずれか一つに記載の対訳候補表示装置。
  6. 前記対訳例文記憶手段は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
    前記表示制御手段は、前記対訳候補の表示に際し、前記対訳候補となった対訳が含まれる訳文に関して、前記対訳例文記憶手段によって関連付けて記憶された前記分野、作業者および/または年月日についても、前記対訳候補ごとに表示するように制御することを特徴とする請求項1〜5のいずれか一つに記載の対訳候補表示装置。
  7. 前記対訳例文記憶手段は、前記所定の文章ごとに、当該文章が属する分野、当該文章の訳文を作成した作業者および/または前記訳文が作成された年月日を関連付けて記憶するものであって、
    前記対訳例文記憶手段によって関連付けて記憶された前記分野、作業者および/または年月日を、利用者から検索条件として受け付ける検索条件受付手段をさらに備え、
    前記対訳集計手段は、前記対訳例文記憶手段によって対応付けて記憶された各単語の対訳のうち、前記受付手段によって受け付けられた検索条件を具備する対訳に基づいて、前記所定の単語に対応する対訳を集計して前記対訳候補を抽出することを特徴とする請求項1〜6のいずれか一つに記載の対訳候補表示装置。
  8. 前記翻訳対象である原文から当該原文に含まれる複数の単語を解析する原文解析手段をさらに備え、
    前記対訳集計手段は、前記原文解析手段によって解析された各単語ごとに、各単語に対応する対訳を集計して前記対訳候補を抽出し、
    前記表示制御手段は、前記原文解析手段によって解析された各単語ごとに、前記対訳集計手段によって集計されて抽出された対訳候補を表示するように制御することを特徴とする請求項1〜7のいずれか一つに記載の対訳候補表示装置。
  9. 前記表示制御手段によって表示された対訳候補のなかから、前記所定の単語の対訳として採用すべき対訳候補を、利用者による選択によって受け付ける対訳受付手段をさらに備え、
    前記対訳例文記憶手段は、前記所定の単語と、前記対訳受付手段によって受け付けた対訳候補とを対応付け、前記例文として新たに記憶することを特徴とする請求項1〜8のいずれか一つに記載の対訳候補表示装置。
  10. 所定の文章に係る原文および訳文を例文として記憶し、翻訳対象である原文に含まれる所定の単語とともに、前記例文として記憶された訳文の内容を前記単語の対訳候補として表示する方法をコンピュータに実行させる対訳候補表示プログラムであって、
    前記例文としての原文に含まれる各単語ごとに、前記例文としての訳文に含まれる当該単語の対訳を対応付けて記憶する対訳例文記憶工程と、
    前記対訳例文記憶工程によって対応付けて記憶された各単語の対訳のうち、前記翻訳対象である原文に含まれる所定の単語に対応する対訳を集計して前記対訳候補を抽出する対訳集計工程と、
    前記対訳集計工程によって集計されて抽出された前記対訳候補を、前記所定の単語とともに表示するように制御する表示制御工程と、
    をコンピュータに実行させることを特徴とする対訳候補表示プログラム。
JP2002217968A 2002-07-26 2002-07-26 対訳候補表示装置および対訳候補表示プログラム Expired - Fee Related JP4050950B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002217968A JP4050950B2 (ja) 2002-07-26 2002-07-26 対訳候補表示装置および対訳候補表示プログラム
EP03254164A EP1385095A3 (en) 2002-07-26 2003-06-30 Apparatus, method and computer product for performing translation
US10/608,150 US20040030542A1 (en) 2002-07-26 2003-06-30 Apparatus for and method of performing translation, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002217968A JP4050950B2 (ja) 2002-07-26 2002-07-26 対訳候補表示装置および対訳候補表示プログラム

Publications (3)

Publication Number Publication Date
JP2004062384A true JP2004062384A (ja) 2004-02-26
JP2004062384A5 JP2004062384A5 (ja) 2005-10-27
JP4050950B2 JP4050950B2 (ja) 2008-02-20

Family

ID=29997294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002217968A Expired - Fee Related JP4050950B2 (ja) 2002-07-26 2002-07-26 対訳候補表示装置および対訳候補表示プログラム

Country Status (3)

Country Link
US (1) US20040030542A1 (ja)
EP (1) EP1385095A3 (ja)
JP (1) JP4050950B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226729A (ja) * 2006-02-27 2007-09-06 Fujitsu Ltd 訳語情報出力処理プログラム,処理方法および処理装置
JP2014056492A (ja) * 2012-09-13 2014-03-27 Nec Corp 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143616A (ja) 1997-11-10 1999-05-28 Sega Enterp Ltd 文字通信装置
US7451076B2 (en) * 2003-06-30 2008-11-11 Casio Computer Co., Ltd. Information display control apparatus, server, and program which display example sentences with respect to input or selected words and addition words
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
TW201020816A (en) * 2008-11-25 2010-06-01 Univ Nat Taiwan Information retrieval oriented translation apparatus and methods, and storage media
JP5058280B2 (ja) * 2010-03-12 2012-10-24 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
US9767095B2 (en) 2010-05-21 2017-09-19 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
DE102010055050A1 (de) * 2010-12-17 2012-06-21 Albert Eskenazy Verfahren und System zur rechnergestützten Durchführung eines Lektoratsprozesses bei der Erstellung von Übersetzungen
JP5847807B2 (ja) * 2011-04-18 2016-01-27 キヤノン株式会社 データ処理装置、データ処理装置の制御方法、及びプログラム
US9323746B2 (en) * 2011-12-06 2016-04-26 At&T Intellectual Property I, L.P. System and method for collaborative language translation
WO2013102052A1 (en) * 2011-12-28 2013-07-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US8954314B2 (en) * 2012-03-01 2015-02-10 Google Inc. Providing translation alternatives on mobile devices by usage of mechanic signals
US9081762B2 (en) 2012-07-13 2015-07-14 Enyuan Wu Phrase-based dictionary extraction and translation quality evaluation
JP5449633B1 (ja) * 2013-03-22 2014-03-19 パナソニック株式会社 広告翻訳装置、広告表示装置、および広告翻訳方法
US10114817B2 (en) 2015-06-01 2018-10-30 Microsoft Technology Licensing, Llc Data mining multilingual and contextual cognates from user profiles
US9747281B2 (en) * 2015-12-07 2017-08-29 Linkedin Corporation Generating multi-language social network user profiles by translation
KR20170122505A (ko) * 2016-04-27 2017-11-06 삼성전자주식회사 부가 정보를 제공하는 단말 장치 및 제공 방법
US10824719B1 (en) * 2017-08-01 2020-11-03 Rodney E. Otts Anti-malware computer systems and method
US11106873B2 (en) * 2019-01-22 2021-08-31 Sap Se Context-based translation retrieval via multilingual space
CN111611811B (zh) * 2020-05-25 2023-01-13 腾讯科技(深圳)有限公司 翻译方法、装置、电子设备及计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689302A (ja) * 1992-09-08 1994-03-29 Hitachi Ltd 辞書メモリ
US5850561A (en) * 1994-09-23 1998-12-15 Lucent Technologies Inc. Glossary construction tool
WO1996041281A1 (en) * 1995-06-07 1996-12-19 International Language Engineering Corporation Machine assisted translation tools
ITUD980032A1 (it) * 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
IT1315160B1 (it) * 2000-12-28 2003-02-03 Agostini Organizzazione Srl D Sistema e metodo di traduzione automatica o semiautomatica conposteditazione per la correzione degli errori.
US20020198699A1 (en) * 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus, system and method for providing open source language translation
US20030105621A1 (en) * 2001-12-04 2003-06-05 Philippe Mercier Method for computer-assisted translation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226729A (ja) * 2006-02-27 2007-09-06 Fujitsu Ltd 訳語情報出力処理プログラム,処理方法および処理装置
JP2014056492A (ja) * 2012-09-13 2014-03-27 Nec Corp 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Also Published As

Publication number Publication date
JP4050950B2 (ja) 2008-02-20
EP1385095A2 (en) 2004-01-28
US20040030542A1 (en) 2004-02-12
EP1385095A3 (en) 2006-04-19

Similar Documents

Publication Publication Date Title
JP4050950B2 (ja) 対訳候補表示装置および対訳候補表示プログラム
US8489602B2 (en) Systems and methods for determining exclusion efficiencies of a plurality of keywords appearing in a search result
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US20100256991A1 (en) Medical diagnosis support apparatus
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2010003015A (ja) 文書検索システム
JP2002123409A (ja) Gui評価システムとそのgui評価方法、及びgui評価プログラムを記録した記録媒体
JP6529698B2 (ja) データ分析装置およびデータ分析方法
TW201421387A (zh) 文件管理系統及文件管理方法以及文件管理程式
JP2002183117A (ja) 文書校正支援装置、文書校正支援方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20090249197A1 (en) Document proofreading support method and document proofreading support apparatus
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP2838984B2 (ja) 汎用参照装置
JP2001297080A (ja) 読取支援装置
JPH1115826A (ja) 文書解析装置及び方法
JP4135467B2 (ja) 情報処理装置、システムおよびプログラム
JP2011134270A (ja) 単体試験支援装置、方法及びプログラム
JP5126592B2 (ja) 文書処理装置及び文書処理プログラム
JP2006172489A (ja) 文書の参照理由を用いて情報検索を行なう装置
JPH05158969A (ja) 言語処理システム
Onnasch et al. Break it down! a Practitioners’ software tool for human factors task analysis and human error identification
JPH08314706A (ja) ソフトウェアの開発支援システム
JP4405187B2 (ja) 辞書評価プログラム及びシステム並びに方法
JP2003223466A (ja) 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体
JP2000293410A (ja) プロファイラ

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050725

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070918

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees