JP3379090B2 - 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム - Google Patents

機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム

Info

Publication number
JP3379090B2
JP3379090B2 JP2001059031A JP2001059031A JP3379090B2 JP 3379090 B2 JP3379090 B2 JP 3379090B2 JP 2001059031 A JP2001059031 A JP 2001059031A JP 2001059031 A JP2001059031 A JP 2001059031A JP 3379090 B2 JP3379090 B2 JP 3379090B2
Authority
JP
Japan
Prior art keywords
word
search
translated
computer
unknown word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001059031A
Other languages
English (en)
Other versions
JP2002259375A (ja
Inventor
浩 伊藤
知博 宮平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2001059031A priority Critical patent/JP3379090B2/ja
Priority to US10/085,379 priority patent/US7318021B2/en
Publication of JP2002259375A publication Critical patent/JP2002259375A/ja
Application granted granted Critical
Publication of JP3379090B2 publication Critical patent/JP3379090B2/ja
Priority to US11/861,733 priority patent/US7769578B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、辞書を使って第1
の言語の文章を第2の言語の文章へ翻訳する機械翻訳シ
ステム、方法、及びプログラムに関し、詳しくは辞書に
登録されていない語が原文に含まれているときに適切に
対処できる機械翻訳システム、方法、及びプログラムに
関するものである。
【0002】
【従来の技術】本出願人が日本で販売している英日翻訳
ソフト「インターネット翻訳の王様(登録商標第414
5742号)」は、システム(基本)辞書の他に、「ス
ポーツ」、「アート」、「政治」、「ビジネス」、「エ
ンターテイメント」、及び「インターネット」の6個の
分野別辞書、及びユーザにより適宜、訳語編集自在のユ
ーザー辞書を装備し、これら辞書の訳語を利用して、英
語の文章を日本語の文章へ翻訳している。
【0003】一方、分野別辞書を自動切換えする機械翻
訳システムとして幾つかの技術が公知になっている。例
えば特開平6−60117号公報の機械翻訳システムで
は、原文を構文解析して、構文ごとの訳語が各専門用語
辞書のそれぞれに存在するか否かを調べ、訳語の存在し
た辞書に対応する訳語チェックカウンタをカウントアッ
プさせ、この訳語チェックカウンタにおけるカウントデ
ータの大小に応じて専門用語辞書の選択順位を設定して
いる。また、特開平10−21222号公報の機械翻訳
システムでは、第1の言語の文書にアクセスする際に、
その文書を特定するために用いる文書識別情報を基にし
て、翻訳処理の基となる所定の条件を設定し、その一実
施例によれば、インターネットのURLを文書識別情報
として用いて、専門分野を決定し、それに対応する専門
用語辞書を選択する。
【0004】
【発明が解決しようとする課題】従来の機械翻訳システ
ムでは、辞書に登録されていない語(以下、適宜、「未
知語」と言う。)があったとき、該未知語については翻
訳不能となるとともに、ユーザは、例えば書籍の辞書で
未知語についての適切な訳語を調べており、訳語探索の
能率が悪く、不便となっている。
【0005】本発明の目的は、機械翻訳システムに装備
の辞書に登録されていない語があったときに、ユーザが
その訳語を能率的に探し出せるようにした機械翻訳シス
テム、方法、及びプログラムを提供することである。本
発明の他の目的は、原文の未知語についての訳語をユー
ザが見つけたときに辞書への訳語登録を改善できる機械
翻訳システム、方法、及びプログラムを提供することで
ある。
【0006】
【課題を解決するための手段】第1の発明の機械翻訳シ
ステムは、第1の言語の文章(以下、「原文」と言
う。)を第2の言語の文章(以下、「翻訳文」と言
う。)へ辞書を用いて翻訳する。そして、該機械翻訳シ
ステムは次のものを有している。 ・辞書に登録されていない語(以下、「未知語」と言
う。)は原語のままにして原文を第2の言語へ翻訳した
翻訳文を作成する翻訳文作成手段 ・翻訳文作成手段により生成された翻訳文を表示する翻
訳文表示手段 ・表示手段の表示する翻訳文における原語表記の未知語
に対してユーザにより指示のあった場合には第1の言語
に係る所定のインターネット接続検索エンジンにおける
検索語として該未知語を検索するように該原語表記の未
知語にリンクを設定するリンク設定手段
【0007】第1の言語及び第2の言語は、例えばそれ
ぞれ英語及び日本語であるが、これに限定されないこと
は言うまでもない。英語の代表的なインターネット接続
検索エンジンとして、例えば「Yahoo!」及び「A
ltaVista」が存在する。原語表記の未知語の部
分のインターネット接続検索エンジンへのリンク設定に
は、例えば検索エンジンCGIに未知語を指定して検索
を行わせるanchorタグが記述される。未知語に
は、単語だけでなく、複合語も含まれるものとする。原
文のソースは、インターネットウェブページに限定され
ない。ソースは、パーソナルコンピュータの記憶装置に
格納されているファイル、及び文字認識装置や音声認識
装置から入力であってもよい。
【0008】ユーザは、原語表記の未知語について、ク
リック等により検索実行の指示を出せば、該未知語につ
いての検索がインターネット接続検索エンジンにおいて
実施され、該未知語の訳語についての情報を入手でき
る。こうして、ユーザは、機械翻訳システムの辞書にお
ける未知語を、一々、書籍の辞書で訳語を探すことな
く、能率的に、適切な訳語を見つけることができる。
【0009】第2の発明の機械翻訳システムは、第1の
発明の機械翻訳システムにおいて、次のものを有してい
る。 ・原文の主題に関連する分野を検出する分野検出手段 ・複数の検索分野をもつインターネット接続検索エンジ
ンの検索分野でかつ分野検出手段の検出した分野に対応
する検索分野において未知語の検索を実行するように原
語表記の未知語にリンクを設定するリンク設定手段
【0010】通常のインターネット接続検索エンジンで
は、効率の良い検索を可能にするために、分野別検索が
可能になっている。例えば、英語のインターネット接続
検索エンジンの「Yahoo!」は、2001年2月現
在、「スポーツ(Sports)」、「アート(Art
s)」、「政府(Goverment)」、「ビジネス
(Business)」、「エンターテイメント(En
tertainment)」、「コンピュータ(Com
puter)」、「インターネット(Interne
t)」などの検索分野を持っている。また、「Alta
Vista」では、2001年2月現在、「スポーツ
(Sports)」、「アート(Arts)」、「文化
(Culture)」、「政府(Govermen
t)」、「政治(Politics)」、「仕事(Wo
rk)」、「金融(Money)」、「エンターテイメ
ント(Entertainment)」、「コンピュー
ティング(Computing)」などの検索分野を持
っている。
【0011】原文の主題に関連する分野を検出する方法
としては、前述の特開平6−60117号公報及び特開
平10−21222号公報に開示された方法だけでな
く、本出願人の出願である特願平11−270212号
の技術を用いることができる。該技術では、原文に使用
されている複合語を調べ、該複合語がどの分野別辞書に
登録されているかを調べ、該複合語が登録されている分
野別辞書の分野を原文の分野としている。機械翻訳シス
テムの装備する分野別辞書の各分野の名前が、インター
ネット接続検索エンジンの検索分野の名前と一致しない
ときは、分野別辞書の各分野を実質的に含むインターネ
ット接続検索エンジンの検索分野へ、原語表記の未知語
のリンクを設定する。
【0012】未知語は、それを使用している原文の主題
に関連する分野に対応する検索分野でインターネット接
続検索エンジンにおいて検索されるので、より有効な訳
語を能率的に見つけることができる。
【0013】第3の発明の機械翻訳システムは、第1又
は第2の発明の機械翻訳システムにおいて、リンク設定
手段がリンクを設定するインターネット接続検索エンジ
ンをユーザ指示により切替える検索エンジン切替手段を
有している。
【0014】インターネット接続検索エンジンは現在、
多数、存在し、ユーザは、適切な訳語を能率的に見出す
ことのできるインターネット接続検索エンジンがどれか
の情報を知っていて、リンクを設定するインターネット
接続検索エンジンを適宜、変更したい希望をもつことが
ある。これに対処して、ユーザが、未知語について検索
を実行させるインターネット接続検索エンジンを検索エ
ンジン設定手段により変更できるようにし、結果、より
適切な訳語を能率的に探し出すことができるようにな
る。なお、ユーザにより設定されるインターネット接続
検索エンジンは、例えば分野Aについてはインターネッ
ト接続検索エンジンのX社、分野Bについてはインター
ネット接続検索エンジンのY社等、分野ごとに、ユーザ
が設定できるようにすることが有利である。
【0015】第4の発明の機械翻訳システムは、第2の
発明の機械翻訳システムにおいて、分野検出手段の検出
した分野ごとにどの未知語検索の実行用のインターネッ
ト接続検索エンジンを使用するかの設定を保存してある
リンク設定手段を有している。
【0016】分野別の検索のできるインターネット接続
検索エンジンは現在、多数、存在し、それらインターネ
ット接続検索エンジンにおいて、検索分野ごとに検索能
力のばらつきがあることがある。したがって、検索分野
ごとに検索の強いインターネット接続検索エンジンに未
知語の検索を実行させることは、適切な訳語発見上、有
利である。このように、翻訳文中の原語表記の未知語に
対して、その分野の訳語発見に最適のインターネット接
続検索エンジンへのリンクを設定することにより、翻訳
作業能率を高めることができる。
【0017】第5の発明の機械翻訳システムは、第1〜
第4の発明の機械翻訳システムにおいて、次のものを有
している。 ・リンク設定手段によりリンク設定された未知語につい
ての検索実行のユーザ指示に対してインターネット接続
検索エンジンによる未知語関連のウェブページのリスト
を表示する検索結果リスト表示手段 ・検索結果リストからユーザ選択のあったウェブページ
を表示する未知語関連ウェブページ表示手段 ・未知語についての訳語をユーザに編集させて登録させ
るための訳語登録用画面を生成するとともに該未知語に
ついての訳語を辞書に登録する訳語登録手段
【0018】こうして、ユーザは未知語の訳語を辞書に
能率的に登録することができる。この登録以降の翻訳に
ついては、登録前では未知語であった語は、既知語とし
て翻訳されることになる。ユーザは、訳語登録後、適
宜、原文の再翻訳を指示して、未知語の少ない翻訳文を
入手できる。
【0019】第6の発明の機械翻訳システムは、第2又
は第4の発明の機械翻訳システムにおいて、次のものを
有している。 ・リンク設定手段によりリンク設定された未知語につい
ての検索実行のユーザ指示に対してインターネット接続
検索エンジンによる未知語関連のウェブページのリスト
を表示する検索結果リスト表示手段 ・検索結果リストからユーザ選択のあったウェブページ
を表示する未知語関連ウェブページ表示手段 ・未知語についての訳語をユーザに編集させて登録させ
るための訳語登録用画面を生成するとともに訳語を、該
未知語の含まれている原文の主題に関連する分野に対応
付けて、辞書に登録する訳語登録手段
【0020】翻訳文の品質を向上するために、原文の分
野に応じた分野別辞書を使用する機械翻訳システムで
は、分野別辞書の選択のために、翻訳範囲の主題関連分
野を検出するようになっているので(例:特開平6−6
0117号公報、特開平10−21222号公報、及び
特願平11−270212号等)、未知語の含まれてい
る原文の主題に関連する分野は、機械翻訳システムが現
在使用している分野別辞書がどれかを調べることにより
容易に検出することができる。
【0021】各未知語についての訳語を、該未知語の含
まれている原文の主題に関連する分野に対応付けて、辞
書に登録するときの辞書は、新規な単語や複合語につい
ての訳語をユーザ編集可能な辞書として用意されてお
り、該ユーザ編集可能な辞書は、(a)分野別に用意さ
れる複数個のユーザ辞書であっても、また、(b)原語
及び訳語と共に、原語又は訳語と分野との対応付け情報
も登録できる1個の辞書であってもよいとする。
【0022】例えば、同一の言語に対する適切な訳語
が、分野によって相違することがあるので、未知語の訳
語は、分野別に登録されるので、分野を特定せずに辞書
へ登録する場合に比して、翻訳の質を向上させることが
できる。
【0023】第7の発明の機械翻訳システムは、第5又
は第6の発明の機械翻訳システムにおいて、未知語関連
ウェブページ表示手段により表示されるウェブページを
ユーザ指示により第2の言語へ翻訳する未知語関連ウェ
ブページ翻訳手段を有している。
【0024】ユーザが、第2の言語を母国語としている
ときは、未知語関連ウェブページ表示により表示される
ウェブページを、精通しない第1の言語で読むよりは、
母国語の第2の言語で読んだときの方が能率的なことが
ある。第7の発明はこれに対処できる。
【0025】第8の発明の機械翻訳システムは、第5又
は第6の発明において、訳語登録手段による訳語登録後
に、該訳語登録に係る原語を含んでいた原文の再翻訳を
指示する再翻訳制御手段を有している。
【0026】辞書への未知語の登録が済みしだい、該未
知語を含んでいた原文が再翻訳され、その際、該未知語
は既知語として取り扱われ、翻訳文が再作成されること
になる。これにより、ユーザは翻訳文を能率的に入手す
ることができる。
【0027】第9の発明の機械翻訳方法は、第1の言語
の文章(以下、「原文」と言う。)を第2の言語の文章
(以下、「翻訳文」と言う。)へ辞書を用いて翻訳す
る。該機械翻訳方法は次にステップを有している。 ・辞書に登録されていない語(以下、「未知語」と言
う。)は原語のままにして原文を第2の言語へ翻訳した
翻訳文を作成する翻訳文作成ステップ ・翻訳文作成ステップにおいて生成された翻訳文を表示
する翻訳文表示ステップ ・表示ステップの表示する翻訳文における原語表記の未
知語に対してユーザにより指示のあった場合には第1の
言語に係る所定のインターネット接続検索エンジンにお
ける検索語として該未知語を検索するように該原語表記
の未知語にリンクを設定するリンク設定ステップ
【0028】第10の発明の機械翻訳方法は、第9の発
明の機械翻訳方法において、次のステップを有してい
る。 ・原文の主題に関連する分野を検出する分野検出ステッ
プ ・複数の検索分野をもつインターネット接続検索エンジ
ンの検索分野でかつ分野検出ステップにおいて検出した
分野に対応する検索分野において未知語の検索を実行す
るように原語表記の未知語にリンクを設定するリンク設
定ステップ
【0029】第11の発明の機械翻訳方法は、第9又は
第10の発明の機械翻訳方法において、リンク設定ステ
ップにおいてリンクを設定するインターネット接続検索
エンジンをユーザ指示により切替える検索エンジン切替
ステップを有している。
【0030】第12の発明の機械翻訳方法は、第10の
発明の機械翻訳方法において、分野検出ステップにおい
て検出した分野ごとにどの未知語検索の実行用のインタ
ーネット接続検索エンジンを使用するかの設定を保存し
てあるリンク設定ステップを有している。
【0031】第13の発明の機械翻訳方法は、第9〜第
12の発明の機械翻訳方法において、次のステップを有
している。 ・リンク設定ステップにおいてリンク設定された未知語
についての検索実行のユーザ指示に対してインターネッ
ト接続検索エンジンによる未知語関連のウェブページの
リストを表示する検索結果リスト表示ステップ ・検索結果リストからユーザ選択のあったウェブページ
を表示する未知語関連ウェブページ表示ステップ ・未知語についての訳語をユーザに編集させて登録させ
るための訳語登録用画面を生成するとともに該未知語に
ついての訳語を辞書に登録する訳語登録ステップ
【0032】第14の発明の機械翻訳方法は、第10又
は第12の発明の機械翻訳方法において、次のステップ
を有している。 ・リンク設定ステップにおいてリンク設定された未知語
についての検索実行のユーザ指示に対してインターネッ
ト接続検索エンジンによる未知語関連のウェブページの
リストを表示する検索結果リスト表示ステップ ・検索結果リストからユーザ選択のあったウェブページ
を表示する未知語関連ウェブページ表示ステップ ・未知語についての訳語をユーザに編集させて登録させ
るための訳語登録用画面を生成するとともに訳語を、該
未知語の含まれている原文の主題に関連する分野に対応
付けて、辞書に登録する訳語登録ステップ
【0033】第15の発明の機械翻訳方法は、第13又
は第14の発明の機械翻訳方法において、未知語関連ウ
ェブページ表示ステップにおいて表示されるウェブペー
ジをユーザ指示により第2の言語へ翻訳する未知語関連
ウェブページ翻訳ステップを有している。
【0034】第16の発明の機械翻訳方法は、第13又
は第14の発明において、訳語登録ステップにおける訳
語登録後に、該訳語登録に係る原語を含んでいた原文の
再翻訳を指示する再翻訳制御ステップを有している。
【0035】第17の発明の機械翻訳用プログラムは、
第9〜第16のいずれかの発明の機械翻訳方法のステッ
プをコンピュータに実行させるためのものである。
【0036】
【発明の実施の形態】以下、発明の実施の形態について
図面を参照して説明する。図1はユーザ15がインターネ
ットの英語のウェブページを機械翻訳システムに翻訳さ
せている状況の説明図である。PC(パーソナルコンピ
ュータ)10は、コンピュータ本体11、並びにコンピュー
タ本体11へ接続されているディスプレイ12、キーボード
13、及びマウス14を有し、コンピュータ本体11には、ウ
ェブブラウザソフトとともに、英日翻訳ソフト、例えば
本出願人が日本で販売する「インターネット翻訳の王
様」がインストールされている。ユーザ15は、ディスプ
レイ12の表示画面を見つつ、キーボード13及びマウス14
の操作によりPC10への入力及び指示を行う。以降、ユ
ーザ15は日本人であるとして、発明の実施の形態につい
て説明する。
【0037】図2はインターネット20の概略図である。
PC10は、モデム(図示せず)などを介してインターネ
ット20へ接続される。インターネット20には、検索エン
ジンサーバ21,22・・・を含む種々のサーバが接続され
ている。
【0038】図3は英日翻訳システムとしての「インタ
ーネット翻訳の王様(以下、適宜、「当該英日翻訳シス
テム」と言う。」の各分野別辞書に割り当てられた分野
と2個の検索エンジンの検索分野との対応関係を示して
いる。当該英日翻訳システムでは、図3の第1列に記載
のように、「スポーツ」、「アート」、「政治」、「ビ
ジネス」、「エンターテイメント」、及び「インターネ
ット」の英日分野別辞書を備えている。これに対して、
図3の第2列及び第3列には2個の仮定的な英語検索エ
ンジンについてそれらがもつ検索分野を例示しており、
検索エンジン1,2の検索分野は、独自に設定されてい
るものの、内容的に当該英日翻訳システムの分野別辞書
の各分野と一致させる対応付けが可能であり、図3にお
いて同一行の、当該英日翻訳システムの分野へ対応付け
を設定される。すなわち、分野の対応付けは次のように
なっている。当該英日翻訳システムの「スポーツ」=検
索エンジン1の「スポーツ(Sports)」=検索エ
ンジン2の「スポーツ(Sports)」。当該英日翻
訳システムの「アート」=検索エンジン1の「アート
(Arts)」=検索エンジン2の「アート及び文化
(Arts & Culture)」。当該英日翻訳シ
ステムの「政治」=検索エンジン1の「政府(Gove
rment)」=検索エンジン2の「図書/政府及び政
治(Libraty/Goverments & Po
liics)」。当該英日翻訳システムの「ビジネス」
=検索エンジン1の「ビジネス(Business)」
=検索エンジン2の「労働及び金融(Work + M
oney)」。当該英日翻訳システムの「エンターテイ
メント」=検索エンジン1の「エンターテイメント(E
ntertainment)=検索エンジン2の「エン
ターテイメント(Entertainment)」。当
該英日翻訳システムの「インターネット一般」=検索エ
ンジン1の「コンピュータ及びインターネット(Com
puter + Internet)」=検索エンジン
2のコンピューティング(Computing)」。
【0039】図4はディスプレイ12において英語のウェ
ブページの一例を表示した画面を示している。英文は下
記のようになっている。 「Golf NewsHiro Itoh Won Golf ChampionshipGreenlak
e, Scotland, Jan. 26 -- Hiro Itoh won the 38th Gol
f Championshipwith the best record of 18-shot runa
way. At the final 7-holes, Itoh hadincredible 5 bi
rdies and 2 eagles, while Tomo Miyahira and Masa S
uzukihad only 3 birdies respectively.」 ユーザ15はこの英文を翻訳する指示を出すときは、画面
右上の翻訳実行ボタン27をマウス14によりクリックす
る。これにより、図4の英文が英日翻訳システムにより
翻訳されて、翻訳結果としての翻訳文を記載した図5の
ウィンドウが図4の表示に対してフォアグランドでディ
スプレイ12に表示される。
【0040】図5のウィンドウの表示文は次のとおりで
ある。当該英日翻訳システムの処理によるウィンドウで
は、ハイパーテキストには、それをユーザ15に知らせる
ためのアンダラインが付される。 「ゴルフ・ニュース ヒロ伊藤、ゴルフ選手権優勝 Greenlake, スコットランド, 1月26日 -- ヒロ伊藤
が第38回ゴルフ選手権で18打差で優勝しました。最
後の7ホールで、Tomo Miyahiraと Masa Suzuki はそれ
ぞれ僅か3バーディだったにもかかわらず、伊藤は、驚
異的な5バーディ2イーグルでした。」
【0041】当該英日翻訳システムは、翻訳の品質を高
めるために、原文の主題に関係する分野(図3の第1
列)を所定のアルゴリズムに従い、検出し、該検出した
分野の分野別辞書を、一般的な訳語、文法規則及び用例
が登録されているシステム(基本)辞書より優先して使
用して、原文を翻訳する。当該英日翻訳システムは、図
14で後述するように、システム辞書48a、分野別辞書4
8b、及びユーザ辞書48cを装備し、翻訳開始時には分野
が特定できていないので、優先順位をユーザ辞書48c、
システム辞書48a、及び分野別辞書48bとして、原文の翻
訳を開始する。原文の翻訳範囲の主題に関係する分野を
検出する方法として、例えば複合語に着目したものがあ
る。ここで、図4の原文における「Hiro Itoh」は、世
界的に著名なゴルフプレーヤと仮定する。当該英日翻訳
システムは、英文から複合語としての「Hiro Itoh」を
抽出し、該複合語がどの分野別辞書に登録されているか
を調査し、それがスポーツの分野別辞書に登録されてい
ることを知る。こうして、英日翻訳システムは、原文の
専門分野がスポーツであると特定できた時点で、スポー
ツの分野別辞書に登録されている既知語をシステム辞書
よりも優先的に使用するように、辞書の使用優先順位を
変更して、図4の英文を日本文へ翻訳することになる。
図5の翻訳例では、該英日翻訳システムのスポーツの分
野別辞書には、28a,28b,28cは現翻訳時点では登録さ
れていないと仮定する。この結果、図5に示されるよう
に、それらは、翻訳されず、原語表記のまま、図5のウ
ィンドウに表示されることになる。ユーザ15は、図3の
ウィンドウにおける原語表記から、未知語28a,28b,28
cが当該英日翻訳システムの辞書に登録されていないこ
とを知る。一方、これら未知語28a,28b,28cには、
所定のリンクが設定される。このリンクでは、所定のイ
ンターネット接続検索エンジンの検索分野が、今回の原
文の翻訳に使用した分野別辞書の分野に、例えば図3の
対応表に従い、対応付けられている。翻訳文においてリ
ンクの設定された未知語には、それにリンクが設定され
ていることを意味するアンダラインが施され、ユーザに
リンク設定を分からせるようになっている。前述のよう
に、リンク設定には、検索エンジンCGIに未知語を指
定して検索を行わせるanchorタグが記述される
が、例えば、未知語28bの「Tomo Miyahira」の場合は次
のようなリンク設定になる:<Ahref="http://search.
○○○.com/bin/search?p=%22Tomo%20Miyahira%22&r=Sp
orts">Tomo Miyahira</A>。一般的なリンクでは、未
知語に対するリンク先のインターネット接続検索エンジ
ンは、分野に関係なく、例えば図3の検索エンジン1又
は検索エンジン2等へ固定されているが、分野ごとに異
なる検索エンジンとすることも可能である。図5の翻訳
文表示ウィンドウでは、未知語が計3個存在し、ユーザ
15は、任意の順番で原語表記の未知語をクリックするこ
とができ、各未知語をクリックすることにより、該未知
語にリンク設定されたインターネット接続検索エンジン
の対応検索分野において該未知語についての検索が行わ
れ、その検索結果リストが表示される。ユーザ15は、図
5のウィンドウにおいて未知語28bの「Tomo Miyahira」
をクリックしたとすると、図6の検索結果リストウィン
ドウがフォアグランドでディスプレイ12に表示される。
【0042】検索語に関連する複数のウェブページのU
RLが、関連性の高い順でリスト表示される。図6のウ
ィンドウの表示文は次のとおりである。 「Search Result: 「Tomo Miyahira」 1. Sports − Golf News Sports news about golf URL http://www.○○○.com/person/miyahira 2. Who's Who in Sports Who's who in sports area URL http://www.□□□.com/sports/golf/ 3. Learn about Golf All books about golf URL http://www.△△△.com/golf next ->」
【0043】図6のウィンドウにおいて、ユーザ15は、
任意のURLをクリックすることができるが、ここで
は、検索順位のトップのURLをクリックしたと仮定し
て、以降の説明を行う。この結果、図7のウェブページ
のウィンドウがフォアグランドでディスプレイ12に表示
される。図7のウェブページは、「Tomo Miyahira」に
ついて英語で所定の説明を行っている。図7のウィンド
ウの表示文は次のとおりである。 「Sports news about golf Today's news … … … ★. Tomo Miyahira: He is one of the best golf players in the world fr
om 1990's. Born in Japan in 1970 and now staying in t
he United States to participate in US PGA tour. Main first prizes he took are … His URL ->http://www.○○○.com/miyahira/ … …」
【0044】図4のウィンドウから図7までの一連の全
部のウィンドウには、翻訳実行ボタン27がウィンドウの
アイコンバー部に表示されており、ウィンドウに表示中
の英文は、ユーザ15が翻訳実行ボタン27を適宜、クリッ
クして、当該英日翻訳システムに翻訳指示を出すことに
より、日本文へ翻訳される。ユーザ15は、図7のウィン
ドウに表示の英文についての日本語の翻訳を得るため
に、翻訳実行ボタン27をクリックすると、図8の日本文
のウィンドウがフォアグランドでディスプレイ12に表示
される。図8のウィンドウの表示文は次のとおりであ
る。 「ゴルフ関連のスポーツニュース 今日のニュース … … … ★. Tomo Miyahira:彼は、1990年代から台頭した、世
界でもっとも優れたゴルフプレーヤーの一人。1970年に
日本で生まれ、現在は、USのPGAツアーに参加するた
め、米国に在住している。主な優勝歴は、… 彼のURLは ->http://www.○○○.com/miyahira/ … …」
【0045】英日翻訳システムのスポーツ分野の分野別
辞書には、なお、「Tomo Miyahira」が登録されていな
いので、図8のウィンドウの日本文においても、「Tomo
Miyahira」は未知語として原語表記のままとなってい
る。ユーザ15は、図8のウィンドウの日本文より、「To
mo Miyahira」は日本人の名前で、彼のURLが存在す
ることを知る。翻訳文中のURLには、それがハイパー
リンク付きURL30であることを知らせるアンダーライ
ンが施されている。ユーザ15がハイパーリンク付きUR
L30をクリックすると、図9のウェブページのウィンド
ウがフォアグランドで表示される。図9のウィンドウの
表示文は次のとおりである。 「宮平知博のHPページにようこそ ★今日のツアーの結果だよ ★プロフィール ★僕の住んでいる家の写真 ★掲示板です ★メールをください ★リンク … … … …」
【0046】図8のURL30からリンクされる図9の
ウェブページは日本語のウェブページであった。ユーザ
15は図9のウェブページより「Tomo Miyahira」が「宮
平知博」なる名前の人間であることを知り、「Tomo Miy
ahira」の訳語は「宮平知博」と判断する。そこで、ユ
ーザ15は、図9のウィンドウの「宮平知博」の文字を選
択してから、マウス14の右ボタンをクリックする。この
右クリックに伴い、図10に示すように、ポップアップ
メニュー32がポップアップされる。ポップアップメニュ
ー32では、本来的には、訳語編集の開始(S)、切り取
り(T)、コピー(C)、貼り付け(P)、すべて選択
(A)、又は印刷(P)の選択ができることになってい
るが、図9のウィンドウから処理不能の指示、すなわち
切り取り(T)及び貼り付け(P)は選択できない。実
際のハイパーリンク付きURL30では、これら選択不能
の指示は、薄い色で示されるが、図10では、明瞭性の
ために、斜体で示している。
【0047】ユーザ15は、訳語編集を能率化するため
に、最初に、図10のポップアップメニュー32におい
て、「訳語編集の開始」を選択する。これに伴い、ポッ
プアップメニュー32は消えて、図11に示されるよう
に、代わりに、訳語編集ボックス33がポップアップされ
る。
【0048】図11の訳語編集ボックス33には、編集ボ
ックス部分としてカテゴリ辞書名入力部34、原語入力部
35、及び訳語入力部36が存在し、また、指示部分として
OKボタン37a及びキャンセルボタン37bが存在する。
しかしながら、当該英日翻訳システムは、図5の翻訳文
を作成したときのスポーツの分野の分野別辞書を現在使
用しており、カテゴリ辞書名入力部34には、スポーツ辞
書が自動的に入力される。また、当該英日翻訳システム
は、図5のウィンドウにおいてユーザ15が「Tomo Miyah
ira」を選択したことを把握しており、原語入力部35に
は、自動的に「Tomo Miyahira」が入力される。カテゴ
リ辞書名入力部34及び原語入力部35において、入力文字
が斜体になっているのは、それがユーザ15の入力にかか
るものではなく、自動入力に係るものであることを意味
している。自動入力の文字は、実際の訳語編集ボックス
33では、薄い色で示されるが、明瞭性のために、図11
では、斜体で表現している。当該英日翻訳システムは、
図14で後述するように、辞書48として、システム(基
本)辞書48a、分野別辞書48b、及びユーザ辞書48cを装
備し、システム辞書48a及び分野別辞書48bはユーザによ
る内容変更は認められず、ユーザ辞書48cのみがユーザ
による編集可能になっている。注意すべきは、カテゴリ
辞書名入力部34にはスポーツ辞書と入力されているもの
の、訳語入力部36に入力される訳語は、当該英日翻訳シ
ステムでは、分野別辞書48bの中のスポーツ辞書に登録
されるのではなく、ユーザ辞書48cに登録されることで
ある。当該英日翻訳システムでは、複数のユーザ辞書48
cを作成、装備可能であるので、ユーザ辞書48cを分野別
に用意し、その中のスポーツ分野のユーザ辞書48cに訳
語入力部36の訳語を登録してもよいし、また、1個のユ
ーザ辞書48cには、原語及び訳語と共に、該訳語と分野
との対応関係の情報も登録できるようにしておき、その
ユーザ辞書48cに訳語編集ボックス33kの編集内容を登
録できるようにさせてもよい。訳語入力部36には「宮平
知博」が選択文字列として自動的に貼り付けられる。ユ
ーザ15は訳語編集ボックス33の編集を終了すると、OK
ボタン37aを左クリックする。訳語編集ボックス33によ
るユーザ辞書への訳語登録に伴い、当該英日翻訳システ
ムは、図4の原文を再翻訳するか、図5の「Tomo Miyah
ira」のみを再翻訳し、図6のウィンドウを閉じるとと
もに、図12の翻訳文表示ウィンドウをフォアグランド
でディスプレイ12に表示する。図12のウィンドウの表
示文は次のとおりである。 「ゴルフ・ニュース ヒロ伊藤、ゴルフ選手権優勝 Greenlake, スコットランド, 1月26日 -- ヒロ伊藤
が第38回ゴルフ選手権で18打差で優勝しました。最
後の7ホールで、宮平知博と Masa Suzukiはそれぞ
れ僅か3バーディだったにもかかわらず、伊藤は、驚異
的な5バーディ2イーグルでした。」
【0049】「Tomo Miyahira」についての訳語登録の
結果、図12の翻訳文では、図5の翻訳文における未知
語28bが消え、「宮平知博」が既知語38として表示され
ている。ユーザ15は、未知語28a,28cについても未知語
28bの場合と同様な処理により適切な訳語を探索し、そ
れを訳語登録し、その後、当該英日翻訳システムへ再翻
訳を指示することにより、翻訳文における未知語を順次
減少させていくことができる。
【0050】図13はユーザ15が英語の別のウェブペー
ジを、当該英日翻訳システムを使って、翻訳させたとき
の翻訳文のウィンドウの内容を示している。英日翻訳シ
ステムは、今回、ユーザ15により翻訳指示された英文の
主題関連分野をスポーツとは別の分野としてのビジネス
と把握した。ユーザー辞書のビジネス分野では、「Tomo
Miyahira」はなお未知語であるので、図13の画面で
は、「Tomo Miyahira」は未知語39として表示される。
ユーザ15は、未知語28bの場合の操作と同様に、未知語3
9をクリックして、「Tomo Miyahira」の適切な訳語を検
索エンジンの分野別検索を利用して、探索し、ユーザ辞
書においてビジネス分野に対応付けて「Tomo Miyahir
a」の訳語を登録することになる。ビジネス分野では、
「Tomo Miyahira」なる人物の漢字表記が「宮平知博」
とは異なり「宮平智和」であるかもしれない。
【0051】図14は機械翻訳システム40の機能ブロッ
ク図である。翻訳指示手段41は、ユーザからの指示又は
所定の場面(シーン)では自動的に翻訳文作成手段45へ
英文からに本文への翻訳指示を翻訳文作成手段45へ出
す。原文入力手段42は、ウェブページ以外に、キーボー
ド13、文字認識装置、又は音声認識装置等、原文として
の英語テキストを翻訳文作成手段45へ入力できるもので
あれば、どのようなものであってもよい。翻訳文作成手
段45は分野検出手段46及び辞書48等を用いて、英語テキ
ストから日本語テキストへの変換、すなわち日本語の翻
訳文を作成する。辞書48は1個のシステム辞書48a、複
数個の分野別辞書48b、及び1個又は複数個のユーザ辞
書48cを装備している。ユーザは、システム辞書48a及び
分野別辞書48bについては書き換え及び追加等の編集は
できないのに対し、ユーザ辞書48cについては適宜編集
自在になっている。システム辞書48a、分野別辞書48b、
及びユーザ辞書48cにおける登録内容には、訳語、文
法、及び言い回し等の情報が含まれる。翻訳文作成手段
45は、翻訳指示手段41から翻訳指示を受けると、原文入
力手段42からの入力テキストを分野検出手段46へ送っ
て、分野検出手段46に入力テキストの主題関連分野を検
出させ、その検出結果を受け取る。分野検出手段46の検
出する主題関連分野は、後述の分野別辞書48bの各分野
に一意に対応している。翻訳文作成手段45は、次に、分
野検出手段46の検出した主題関連分野に分野の一致する
分野別辞書48bを今回の翻訳処理における分野別辞書と
して選択し、その分野別辞書48bの優先度をシステム辞
書48aより高くする。翻訳文作成手段45が翻訳処理に使
用する辞書48の優先度は、ユーザ辞書48c、主題関連分
野の分野別辞書48b、及びシステム辞書48aの順番であ
り、原文の単語、複合語、文法、及び言い回しについて
優先度の上位の辞書から照合し、対応のものが見つかれ
ばそれを使用し、見つからなければ、照合対象辞書を下
位の辞書へ変更する。翻訳文作成手段45は、ユーザ辞書
48c、選択中の分野別辞書48b、及びシステム辞書48aの
どれにも原語(単語及び複合語の両方を含む。)の訳語
が存在しないときは、該原語については翻訳を中止し
て、翻訳文を作成する。翻訳文表示手段51は、翻訳文作
成手段45の作成した日本語翻訳文をディスプレイ12に表
示し、該表示される翻訳文では、翻訳文作成手段45が翻
訳しなかった原語は原語表記のままになっている。リン
ク設定手段52は、翻訳文表示手段51から現在使用中の分
野別辞書48bの分野(以下、「主題関連分野」と言
う。)についての情報を入力される。そして、翻訳文表
示手段51に表示される翻訳文中の原語表記のものについ
て、所定のインターネット接続検索エンジンに係る検索
分野でかつ主題関連分野に対応する検索分野の検索を実
行させるリンクを設定する。該リンクを設定するインタ
ーネット接続検索エンジンは、主題関連分野に関係なく
固定されていても、主題関連分野ごとに異なるインター
ネット接続検索エンジンに設定されていてもよいとす
る。訳語登録手段53は、ユーザ15が図11の訳語編集ボ
ックス33により訳語登録を指示した内容、すなわち原
語、訳語、分野、及びそれらの対応付けを含む情報をユ
ーザ辞書48cに登録する。所定の未知語についての訳語
登録手段53によるユーザ辞書48cへの訳語登録が終了し
た後、ユーザ15が、図4の英文ウィンドウをアクティブ
にしてから、該ウィンドウの翻訳実行ボタン27を再クリ
ックすると、今回の登録訳語が含まれる翻訳文のウィン
ドウ(例:図12)がディスプレイ12にフォアグランド
で表示される。
【0052】図15は機械翻訳システムにおける翻訳ル
ーチンのフローチャートである。S60では、ユーザ15
から翻訳指示が有るか否かを判定し、該判定がYESで
あれば、S61へ進み、NOであれば、該ルーチンを終
了する。S61では、原文の翻訳範囲の主題に関係する
分野を分野検出手段46(図14)により検出する。S6
2では、S61で検出した主題関連分野を受け持つ分野
別辞書48bへ分野別辞書を切替える。切替後の分野別辞
書48bは、システム辞書48aより原文に対する照合の優先
度を高くされ、優先度はユーザ辞書48c、分野別辞書48
b、及びシステム辞書48aの順になる。S63では、辞書
48を使って原文を翻訳し、翻訳文を作成する。S64で
は、訳語が見つからなかった語としての未知語にリンク
を設定する。該リンクは、所定のインターネット接続検
索エンジンの検索分野でかつS61での検出分野に対応
する検索分野へのリンクとなっている。S65では、未
知語に対してリンク設定済みの翻訳文をディスプレイ12
に表示する。なお、ユーザ15は、翻訳したい原文の表示
されているウィンドウをアクティブにした上で、該ウィ
ンドウの翻訳実行ボタン27をクリックすれば、その翻訳
文のウィンドウを表示できる。
【0053】図16は訳語登録ルーチンのフローチャー
トである。S70において、図10のポップアップメニ
ュー32において訳語編集の開始を選択したか否か、すな
わち訳語登録要求を出したか否かを判定し、該判定がY
ESであれば、S71へ進み、NOであれば、該ルーチ
ンを終了する。S71では、機械翻訳システム40が現在
選択している分野別辞書48bの分野を検出する。この分
野は、機械翻訳システムが最後に翻訳した原文の主題に
関連する分野に一致している。S72では、訳語編集ボ
ックス33(図11)をディスプレイ12に表示する。ユー
ザ15は、未知語について訳語編集ボックス33において編
集する。S73では、ユーザ15による訳語編集が終了し
たか否か、すなわちユーザ15が訳語編集ボックス33のO
Kボタン37aをクリックしたか否かを判定し、判定がY
ESになりしだい、S74へ進む。S74では、S71
で検出した分野に対応付けて訳語をユーザ辞書48cに登
録する。
【図面の簡単な説明】
【図1】ユーザがインターネットの英語のウェブページ
を機械翻訳システムに翻訳させている状況の説明図であ
る。
【図2】インターネットの概略図である。
【図3】所定の英日翻訳システムの各分野別辞書に割り
当てられた分野と2個の検索エンジンの検索分野との対
応関係を示す図である。
【図4】ディスプレイにおいて英語のウェブページの一
例を表示した画面を示す図である。
【図5】図4のウィンドウにおいて翻訳実行ボタンをク
リックするとフォアグランドでディスプレイに表示され
るウィンドウを示す図である。
【図6】図5のウィンドウの所定の未知語をクリックす
るとフォアグランドでディスプレイに表示されるウィン
ドウを示す図である。
【図7】図6のウィンドウにおいてユーザが特定のUR
Lをクリックしたときにディスプレイに表示されるウィ
ンドウである。
【図8】図7のウィンドウの英文に対してユーザが英日
翻訳を指示したのに伴いディスプレイに現れるウィンド
ウ表示である。
【図9】図8のウェブページのハイパーテキストをクリ
ックしたのに伴いディスプレイに現れるウィンドウ表示
である。
【図10】図9のウィンドウにおいてマウスの右クリッ
クを実施した後のディスプレイのウィンドウ表示であ
る。
【図11】図10のポップアップメニューから訳語編集
の開始を選択した後のディスプレイのウィンドウ表示で
ある。
【図12】最初の翻訳における未知語について訳語登録
した後に図4の英文を英日翻訳システムに再翻訳させて
ディスプレイに現われる翻訳ウィンドウである。
【図13】ユーザが英語の別のウェブページを、当該英
日翻訳システムを使って、翻訳させたときの翻訳文のウ
ィンドウの内容を示す図である。
【図14】機械翻訳システムの機能ブロック図である。
【図15】機械翻訳システムにおける翻訳ルーチンのフ
ローチャートである。
【図16】訳語登録ルーチンのフローチャートである。
【符号の説明】
10 PC 12 ディスプレイ 15 ユーザ 20 インターネット 21,22 検索エンジンサーバ 40 機械翻訳システム 42 原文入力手段 45 翻訳文作成手段 46 分野検出手段 48a システム辞書 48b 分野別辞書 48c ユーザ辞書 51 翻訳文表示手段 52 リンク設定手段 53 訳語登録手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮平 知博 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 大和事業所 内 (56)参考文献 特開 平9−305581(JP,A) 特開 平9−114832(JP,A) 特開 平6−243164(JP,A) 特開 平10−198680(JP,A) 特開 平3−53377(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/30 JICSTファイル(JOIS)

Claims (24)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の言語の文章(以下、「原文」と言
    う。)を第2の言語の文章(以下、「翻訳文」と言
    う。)へ辞書を用いて翻訳する機械翻訳システムにおい
    て、 辞書に登録されていない語(以下、「未知語」と言
    う。)は原語のままにして原文を前記第2の言語へ翻訳
    した翻訳文を作成する翻訳文作成手段、 前記翻訳文作成手段により生成された翻訳文を表示する
    翻訳文表示手段、及び前記表示手段の表示する翻訳文に
    おける原語表記の未知語に対してユーザにより指示のあ
    った場合には第1の言語に係る所定のインターネット接
    続検索エンジンにおける検索語として該未知語を検索す
    るように該原語表記の未知語にリンクを設定するリンク
    設定手段、 を有していることを特徴とする機械翻訳システム。
  2. 【請求項2】 原文の主題に関連する分野を検出する分
    野検出手段、及び複数の検索分野をもつインターネット
    接続検索エンジンの検索分野でかつ前記分野検出手段の
    検出した分野に対応する検索分野において前記未知語の
    検索を実行するように前記原語表記の未知語にリンクを
    設定する前記リンク設定手段、を有していることを特徴
    とする請求項1記載の機械翻訳システム。
  3. 【請求項3】 前記リンク設定手段がリンクを設定する
    インターネット接続検索エンジンをユーザ指示により切
    替える検索エンジン切替手段、 を有していることを特徴とする請求項1又は2記載の機
    械翻訳システム。
  4. 【請求項4】 前記分野検出手段の検出した分野ごとに
    どの未知語検索の実行用のインターネット接続検索エン
    ジンを使用するかの設定を保存してある前記リンク設定
    手段、 を有していることを特徴とする請求項2記載の機械翻訳
    システム。
  5. 【請求項5】 前記リンク設定手段によりリンク設定さ
    れた未知語についての検索実行のユーザ指示に対してイ
    ンターネット接続検索エンジンによる前記未知語関連の
    ウェブページのリストを表示する検索結果リスト表示手
    段、 前記検索結果リストからユーザ選択のあったウェブペー
    ジを表示する未知語関連ウェブページ表示手段、及び未
    知語についての訳語をユーザに編集させて登録させるた
    めの訳語登録用画面を生成するとともに該未知語につい
    ての訳語を辞書に登録する訳語登録手段、を有している
    ことを特徴とする請求項1記載の機械翻訳システム。
  6. 【請求項6】 前記リンク設定手段によりリンク設定さ
    れた未知語についての検索実行のユーザ指示に対してイ
    ンターネット接続検索エンジンによる前記未知語関連の
    ウェブページのリストを表示する検索結果リスト表示手
    段、 前記検索結果リストからユーザ選択のあったウェブペー
    ジを表示する未知語関連ウェブページ表示手段、及び未
    知語についての訳語をユーザに編集させて登録させるた
    めの訳語登録用画面を生成するとともに訳語を、該未知
    語の含まれている原文の主題に関連する分野に対応付け
    て、辞書に登録する訳語登録手段、 を有していることを特徴とする請求項2記載の機械翻訳
    システム。
  7. 【請求項7】 前記未知語関連ウェブページ表示手段に
    より表示されるウェブページをユーザ指示により第2の
    言語へ翻訳する未知語関連ウェブページ翻訳手段、 を有していることを特徴とする請求項5又は6記載の機
    械翻訳システム。
  8. 【請求項8】 前記訳語登録手段による訳語登録後に、
    該訳語登録に係る原語を含んでいた原文の再翻訳を指示
    する再翻訳制御手段、 を有していることを特徴とする請求項5又は6記載の機
    械翻訳システム。
  9. 【請求項9】 コンピュータを用いて、第1の言語の文
    章(以下、「原文」と言う。)を第2の言語の文章(以
    下、「翻訳文」と言う。)へ辞書を用いて翻訳する機械
    翻訳方法において、前記コンピュータの翻訳文作成手段が、 辞書に登録され
    ていない語(以下、「未知語」と言う。)は原語のまま
    にして原文を前記第2の言語へ翻訳した翻訳文を作成す
    る翻訳文作成ステップ、前記コンピュータの翻訳文表示手段が、 前記翻訳文作成
    ステップにおいて生成された翻訳文を表示する翻訳文表
    示ステップ、及び前記コンピュータのリンク設定手段
    が、前記表示ステップの表示する翻訳文における原語表
    記の未知語に対してユーザにより指示のあった場合には
    第1の言語に係る所定のインターネット接続検索エンジ
    ンにおける検索語として該未知語を検索するように該原
    語表記の未知語にリンクを設定するリンク設定ステッ
    プ、を有していることを特徴とする機械翻訳方法。
  10. 【請求項10】 前記コンピュータの分野検出手段が、
    原文の主題に関連する分野を検出する分野検出ステッ
    プ、及び前記コンピュータの前記リンク設定手段が、
    数の検索分野をもつインターネット接続検索エンジンの
    検索分野でかつ前記分野検出ステップにおいて検出した
    分野に対応する検索分野において前記未知語の検索を実
    行するように前記原語表記の未知語にリンクを設定する
    前記リンク設定ステップ、 を有していることを特徴とする請求項9記載の機械翻訳
    方法。
  11. 【請求項11】 前記コンピュータの検索エンジン切替
    手段が、前記リンク設定ステップにおいてリンクを設定
    するインターネット接続検索エンジンをユーザ指示によ
    り切替える検索エンジン切替ステップ、 を有していることを特徴とする請求項9又は10記載の
    機械翻訳方法。
  12. 【請求項12】 前記コンピュータの前記リンク設定手
    段が、前記分野検出ステップにおいて検出した分野ごと
    にどの未知語検索の実行用のインターネット接続検索エ
    ンジンを使用するかの設定を保存してある前記リンク設
    定ステップ、を有していることを特徴とする請求項10
    記載の機械翻訳方法。
  13. 【請求項13】 前記コンピュータの検索結果リスト表
    示手段が、前記リンク設定ステップにおいてリンク設定
    された未知語についての検索実行のユーザ指示に対して
    インターネット接続検索エンジンによる前記未知語関連
    のウェブページのリストを表示する検索結果リスト表示
    ステップ、前記コンピュータの未知語関連ウェブページ表示手段
    が、 前記検索結果リストからユーザ選択のあったウェブ
    ページを表示する未知語関連ウェブページ表示ステッ
    プ、及び前記コンピュータの訳語登録手段が、未知語に
    ついての訳語をユーザに編集させて登録させるための訳
    語登録用画面を生成するとともに該未知語についての訳
    語を辞書に登録する訳語登録ステップ、 を有していることを特徴とする請求項9記載の機械翻訳
    方法。
  14. 【請求項14】 前記コンピュータの検索結果リスト表
    示手段が、前記リンク設定ステップにおいてリンク設定
    された未知語についての検索実行のユーザ指示に対して
    インターネット接続検索エンジンによる前記未知語関連
    のウェブページのリストを表示する検索結果リスト表示
    ステップ、前記コンピュータの未知語関連ウェブページ表示手段
    が、 前記検索結果リストからユーザ選択のあったウェブ
    ページを表示する未知語関連ウェブページ表示ステッ
    プ、及び前記コンピュータの訳語登録手段が、未知語に
    ついての訳語をユーザに編集させて登録させるための訳
    語登録用画面を生成するとともに訳語を、該未知語の含
    まれている原文の主題に関連する分野に対応付けて、辞
    書に登録する訳語登録ステップ、 を有していることを特徴とする請求項10記載の機械翻
    訳方法。
  15. 【請求項15】 前記コンピュータの未知語関連ウェブ
    ページ翻訳手段が、前記未知語関連ウェブページ表示ス
    テップにおいて表示されるウェブページをユーザ指示に
    より第2の言語へ翻訳する未知語関連ウェブページ翻訳
    ステップ、を有していることを特徴とする請求項13又
    は14記載の機械翻訳方法。
  16. 【請求項16】 前記コンピュータの再翻訳制御手段
    が、前記訳語登録ステップにおける訳語登録後に、該訳
    語登録に係る原語を含んでいた原文の再翻訳を指示する
    再翻訳制御ステップ、 を有していることを特徴とする請求項13又は14記載
    の機械翻訳方法。
  17. 【請求項17】 コンピュータを用いて、第1の言語の
    文章(以下、「原文」と言う。)を第2の言語の文章
    (以下、「翻訳文」と言う。)へ辞書を用いて翻訳する
    機械翻訳方法において、前記コンピュータの翻訳文作成手段が、 辞書に登録され
    ていない語(以下、「未知語」と言う。)は原語のまま
    にして原文を前記第2の言語へ翻訳した翻訳文を作成す
    る翻訳文作成ステップ、前記コンピュータの翻訳文表示手段が、 前記翻訳文作成
    ステップにおいて生成された翻訳文を表示する翻訳文表
    示ステップ、及び前記コンピュータのリンク設定手段
    が、前記表示ステップの表示する翻訳文における原語表
    記の未知語に対してユーザにより指示のあった場合には
    第1の言語に係る所定のインターネット接続検索エンジ
    ンにおける検索語として該未知語を検索するように該原
    語表記の未知語にリンクを設定するリンク設定ステッ
    プ、を有している機械翻訳方法の各ステップをコンピュ
    ータに実行させることを特徴とする機械翻訳用プログラ
    ム。
  18. 【請求項18】 前記コンピュータの分野検出手段が、
    原文の主題に関連する分野を検出する分野検出ステッ
    プ、及び前記コンピュータの前記リンク設定手段が、
    数の検索分野をもつインターネット接続検索エンジンの
    検索分野でかつ前記分野検出ステップにおいて検出した
    分野に対応する検索分野において前記未知語の検索を実
    行するように前記原語表記の未知語にリンクを設定する
    前記リンク設定ステップ、を有している機械翻訳方法の
    各ステップをコンピュータに実行させることを特徴とす
    る請求項17記載の機械翻訳用プログラム。
  19. 【請求項19】 前記コンピュータの検索エンジン切替
    手段が、前記リンク設定ステップにおいてリンクを設定
    するインターネット接続検索エンジンをユーザ指示によ
    り切替える検索エンジン切替ステップ、を有している機械翻訳方法の各ステップを コンピュータ
    に実行させることを特徴とする請求項17又は18記載
    の機械翻訳用プログラム。
  20. 【請求項20】 前記コンピュータの前記リンク設定手
    段が、前記分野検出ステップにおいて検出した分野ごと
    にどの未知語検索の実行用のインターネット接続検索エ
    ンジンを使用するかの設定を保存してある前記リンク設
    定ステップ、を有している機械翻訳方法の各ステップを
    コンピュータに実行させることを特徴とする請求項18
    記載の機械翻訳用プログラム。
  21. 【請求項21】 前記コンピュータの検索結果リスト表
    示手段が、前記リンク設定ステップにおいてリンク設定
    された未知語についての検索実行のユーザ指示に対して
    インターネット接続検索エンジンによる前記未知語関連
    のウェブページのリストを表示する検索結果リスト表示
    ステップ、前記コンピュータの未知語関連ウェブページ表示手段
    が、 前記検索結果リストからユーザ選択のあったウェブ
    ページを表示する未知語関連ウェブページ表示ステッ
    プ、及び前記コンピュータの訳語登録手段が、未知語に
    ついての訳語をユーザに編集させて登録させるための訳
    語登録用画面を生成するとともに該未知語についての訳
    語を辞書に登録する訳語登録ステップ、を有している機械翻訳方法の各ステップを コンピュータ
    に実行させることを特徴とする請求項17記載の機械翻
    訳用プログラム。
  22. 【請求項22】 前記コンピュータの検索結果リスト表
    示手段が、前記リンク設定ステップにおいてリンク設定
    された未知語についての検索実行のユーザ指示に対して
    インターネット接続検索エンジンによる前記未知語関連
    のウェブページのリストを表示する検索結果リスト表示
    ステップ、前記コンピュータの未知語関連ウェブページ表示手段
    が、 前記検索結果リストからユーザ選択のあったウェブ
    ページを表示する未知語関連ウェブページ表示ステッ
    プ、及び前記コンピュータの訳語登録手段が、未知語に
    ついての訳語をユーザに編集させて登録させるための訳
    語登録用画面を生成するとともに訳語を、該未知語の含
    まれている原文の主題に関連する分野に対応付けて、辞
    書に登録する訳語登録ステップ、を有している機械翻訳方法の各ステップを コンピュータ
    に実行させることを特徴とする請求項18記載の機械翻
    訳用プログラム。
  23. 【請求項23】 前記コンピュータの未知語関連ウェブ
    ページ翻訳手段が、前記未知語関連ウェブページ表示ス
    テップにおいて表示されるウェブページをユーザ指示に
    より第2の言語へ翻訳する未知語関連ウェブページ翻訳
    ステップ、を有している機械翻訳方法の各ステップを
    ンピュータに実行させることを特徴とする請求項21又
    は22記載の機械翻訳用プログラム。
  24. 【請求項24】 前記コンピュータの再翻訳制御手段
    が、前記訳語登録ステップにおける訳語登録後に、該訳
    語登録に係る原語を含んでいた原文の再翻訳を指示する
    再翻訳制御ステップ、を有している機械翻訳方法の各ステップを コンピュータ
    に実行させることを特徴とする請求項21又は22記載
    の機械翻訳用プログラム。
JP2001059031A 2001-03-02 2001-03-02 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム Expired - Fee Related JP3379090B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001059031A JP3379090B2 (ja) 2001-03-02 2001-03-02 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US10/085,379 US7318021B2 (en) 2001-03-02 2002-02-28 Machine translation system, method and program
US11/861,733 US7769578B2 (en) 2001-03-02 2007-09-26 Machine translation system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001059031A JP3379090B2 (ja) 2001-03-02 2001-03-02 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム

Publications (2)

Publication Number Publication Date
JP2002259375A JP2002259375A (ja) 2002-09-13
JP3379090B2 true JP3379090B2 (ja) 2003-02-17

Family

ID=18918659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001059031A Expired - Fee Related JP3379090B2 (ja) 2001-03-02 2001-03-02 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム

Country Status (2)

Country Link
US (2) US7318021B2 (ja)
JP (1) JP3379090B2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706747B2 (en) * 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
JP3452558B2 (ja) * 2001-09-25 2003-09-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
US6965972B2 (en) * 2002-09-25 2005-11-15 International Business Machines Corporation Real time emulation of coherence directories using global sparse directories
US20040230898A1 (en) * 2003-05-13 2004-11-18 International Business Machines Corporation Identifying topics in structured documents for machine translation
US7149971B2 (en) * 2003-06-30 2006-12-12 American Megatrends, Inc. Method, apparatus, and system for providing multi-language character strings within a computer
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US20050234700A1 (en) * 2004-04-15 2005-10-20 International Business Machines Corporation Autonomic method, system and program product for translating content
US7672845B2 (en) * 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
ATE400047T1 (de) * 2005-02-17 2008-07-15 Loquendo Spa Verfahren und system zum automatischen bereitstellen linguistischer formulierungen, die ausserhalb einer erkennungsdomäne eines automatischen spracherkennungssystems liegen
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
US20060253205A1 (en) * 2005-05-09 2006-11-09 Michael Gardiner Method and apparatus for tabular process control
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
JP2007220045A (ja) * 2006-02-20 2007-08-30 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US20080168049A1 (en) * 2007-01-08 2008-07-10 Microsoft Corporation Automatic acquisition of a parallel corpus from a network
US20080172219A1 (en) * 2007-01-17 2008-07-17 Novell, Inc. Foreign language translator in a document editor
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US20080255846A1 (en) * 2007-04-13 2008-10-16 Vadim Fux Method of providing language objects by indentifying an occupation of a user of a handheld electronic device and a handheld electronic device incorporating the same
US20090299732A1 (en) * 2008-05-29 2009-12-03 Nokia Corporation Contextual dictionary interpretation for translation
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
WO2010061733A1 (ja) * 2008-11-27 2010-06-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 誤訳の検出を支援する装置及び方法
US8874426B2 (en) * 2009-06-30 2014-10-28 International Business Machines Corporation Method for translating computer generated log files
WO2011146934A2 (en) 2010-05-21 2011-11-24 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
US20120209589A1 (en) * 2011-02-11 2012-08-16 Samsung Electronics Co. Ltd. Message handling method and system
US20120239381A1 (en) * 2011-03-17 2012-09-20 Sap Ag Semantic phrase suggestion engine
US20120253784A1 (en) * 2011-03-31 2012-10-04 International Business Machines Corporation Language translation based on nearby devices
US20130018650A1 (en) * 2011-07-11 2013-01-17 Microsoft Corporation Selection of Language Model Training Data
US8935230B2 (en) 2011-08-25 2015-01-13 Sap Se Self-learning semantic search engine
US9201561B2 (en) * 2012-05-12 2015-12-01 Roland Wescott Montague Rotatable object system for visual communication and analysis
US9678948B2 (en) * 2012-06-26 2017-06-13 International Business Machines Corporation Real-time message sentiment awareness
WO2014098640A1 (en) * 2012-12-19 2014-06-26 Abbyy Infopoisk Llc Translation and dictionary selection by context
US9690775B2 (en) 2012-12-27 2017-06-27 International Business Machines Corporation Real-time sentiment analysis for synchronous communication
US8914395B2 (en) 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system
US9892115B2 (en) * 2013-06-11 2018-02-13 Facebook, Inc. Translation training with cross-lingual multi-media support
US9678953B2 (en) 2013-06-11 2017-06-13 Facebook, Inc. Translation and integration of presentation materials with cross-lingual multi-media support
JP6203083B2 (ja) * 2014-03-06 2017-09-27 株式会社Nttドコモ 未知語抽出装置及び未知語抽出方法
WO2019123854A1 (ja) 2017-12-18 2019-06-27 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
JP7180317B2 (ja) * 2018-11-26 2022-11-30 株式会社富士通ゼネラル 入力支援装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0353377A (ja) * 1989-07-21 1991-03-07 Hitachi Ltd 分散階層型翻訳システム
JPH0660117A (ja) 1992-08-11 1994-03-04 Toshiba Corp 機械翻訳システムにおける訳語選択装置
JPH06243164A (ja) * 1993-02-12 1994-09-02 Sharp Corp 機械翻訳における文字検索装置
JPH09114832A (ja) * 1995-10-23 1997-05-02 Oki Electric Ind Co Ltd 機械翻訳通信システム
US6993471B1 (en) * 1995-11-13 2006-01-31 America Online, Inc. Integrated multilingual browser
JPH09305581A (ja) * 1996-05-14 1997-11-28 Oki Electric Ind Co Ltd 文書表示システム
JP3450598B2 (ja) 1996-06-28 2003-09-29 株式会社東芝 専門用語辞書選択装置
US6615168B1 (en) * 1996-07-26 2003-09-02 Sun Microsystems, Inc. Multilingual agent for use in computer systems
JP3121548B2 (ja) * 1996-10-15 2001-01-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 機械翻訳方法及び装置
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
JP3556425B2 (ja) * 1997-03-18 2004-08-18 株式会社東芝 共有辞書更新方法および辞書サーバ
US5991713A (en) * 1997-11-26 1999-11-23 International Business Machines Corp. Efficient method for compressing, storing, searching and transmitting natural language text
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US6772139B1 (en) * 1998-10-05 2004-08-03 Smith, Iii Julius O. Method and apparatus for facilitating use of hypertext links on the world wide web
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
JP2001101185A (ja) 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US20020116420A1 (en) * 2000-09-28 2002-08-22 Allam Scott Gerald Method and apparatus for displaying and viewing electronic information
US20020099533A1 (en) * 2001-01-23 2002-07-25 Evan Jaqua Data processing system for searching and communication
US6993473B2 (en) * 2001-08-31 2006-01-31 Equality Translation Services Productivity tool for language translators

Also Published As

Publication number Publication date
US20020161569A1 (en) 2002-10-31
US7769578B2 (en) 2010-08-03
US7318021B2 (en) 2008-01-08
JP2002259375A (ja) 2002-09-13
US20080021698A1 (en) 2008-01-24

Similar Documents

Publication Publication Date Title
JP3379090B2 (ja) 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
JP4960461B2 (ja) ウェブベースのコロケーション誤りの校正
US9477656B1 (en) Cross-lingual indexing and information retrieval
JP4664076B2 (ja) 言語間検索結果をハイライト化する注釈コールアウトの点滅
US7516154B2 (en) Cross language advertising
EP1315084A1 (en) Method and apparatus for localizing software
US20030115552A1 (en) Method and system for automatic creation of multilingual immutable image files
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
US20060122997A1 (en) System and method for text searching using weighted keywords
JPH11250105A (ja) 多言語情報検索方法およびシステム
JP2004516527A (ja) クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法
Fletcher Concordancing the web with KWiCFinder
JP3143345B2 (ja) 文字列検索装置
US6760408B2 (en) Systems and methods for providing a user-friendly computing environment for the hearing impaired
EP1315085B1 (en) Automatic image-button creation process
JP2007072594A (ja) 翻訳装置、翻訳方法および翻訳プログラム、媒体
Evans et al. A platform for multilingual news summarization
JP3766406B2 (ja) 機械翻訳装置
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP2570681B2 (ja) ワード・プロセッサ
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH04174069A (ja) 言語理解支援装置
Getao et al. Automatic construction of a kiswahili corpus from the world wide web
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2002024213A (ja) 翻訳支援装置、翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees