JPH1083398A - 文書翻訳方法、文書翻訳システム及び機械読み取り可能媒体 - Google Patents

文書翻訳方法、文書翻訳システム及び機械読み取り可能媒体

Info

Publication number
JPH1083398A
JPH1083398A JP9136483A JP13648397A JPH1083398A JP H1083398 A JPH1083398 A JP H1083398A JP 9136483 A JP9136483 A JP 9136483A JP 13648397 A JP13648397 A JP 13648397A JP H1083398 A JPH1083398 A JP H1083398A
Authority
JP
Japan
Prior art keywords
document
translation
resource
translating
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9136483A
Other languages
English (en)
Other versions
JP3905179B2 (ja
Inventor
Tetsuro Motoyama
モトヤマ テツロウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH1083398A publication Critical patent/JPH1083398A/ja
Application granted granted Critical
Publication of JP3905179B2 publication Critical patent/JP3905179B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文書中に使用できる語句を極端に制限するこ
となく、より精度のよい機械翻訳を実現する。 【解決手段】 文書又は文書の部分に応じ異なる翻訳資
源を翻訳に利用する。翻訳される原文書に、その翻訳に
利用すべき辞書又は翻訳規則を指示する情報が含められ
る。この情報は例えば、図2に例を示すように標準一般
化マークアップ言語(SGML)タグを用いてエンコー
ドされる。また、ユーザが原文書とその翻訳文書を容易
に比較し必要な修正をすることができるように、原文書
と翻訳文書が画面上に並べて表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、辞書や規則データ
ベースのような資源を利用する文書の機械翻訳に関す
る。
【0002】
【従来の技術】ある人間言語から別の人間言語へ文書を
翻訳する機械翻訳の概念は、広範に研究されてきた。1
940年代はじめの機械翻訳の揺籃期に、ロックフェラ
ー財団のWarren Weaverは、翻訳の概念を一対一置換
の方法によるデコーディングと類似すると考えた。しか
し、これはあまりに単純な類推で、翻訳システムの開発
にあたっては人間の言語の微妙な点が考慮されねばなら
ないことが、まもなく分かった。例えば、特定のフレー
ズは、その個々の語からは分からないような意味を持つ
ことがあり、また、文脈によって意味が異なる語もある
ので、文脈中で語の意味を決定しなければならない。
【0003】文書機械翻訳を改良する一つの方法は、翻
訳対象のソース文書を、厳格な規則を課した語句によっ
て作成する方法である。そうすれば、完璧な翻訳を得ら
れるかも知れないが、著者が言い得ることが極端に制限
されるという犠牲をともなう。翻訳しようとするソース
文書に使用し得る言語を制限するという基本的な考え方
は、”缶詰の”表現用例集をユーザに提供する、旅行者
に多用される翻訳表現集を利用するのに似ている。この
方法は、その”缶詰”表現集にユーザの言いたいことが
含まれているならば問題はないが、含まれていない方が
多い。
【0004】
【発明が解決しようとする課題】したがって、本発明の
一つの目的は、従来の機械翻訳システムよりも正確な訳
文をもたらすが、ソース文書に含まれる語又はフレーズ
を極端に制限しない、改良した機械翻訳システム及び方
法を提供することである。本発明のもう一つの目的は、
文書の異なる部分に対し異なる辞書や規則データベース
等の翻訳資源を利用することにより、より正確な訳文を
作成するとともに翻訳後編集を最小限にする機械翻訳シ
ステム及び方法を提供することである。本発明の他の目
的は、機械翻訳プロセスに使用すべき辞書及び/又は規
則を選択するため、SGMLタグのようなタグを使って
翻訳しようとする文書の構造を定義することである。本
発明のもう一つの目的は、ユーザがソース文書とその機
械翻訳文書を並べて表示させ、機械翻訳文書を対話的に
修正して、より良好な訳文を得ることができる対話型翻
訳システムを提供することである。本発明の別の目的
は、自動翻訳結果に対しユーザが行った修正に基づい
て、辞書及び/又は翻訳規則データベースを更新するこ
とである。
【0005】
【課題を解決するための手段】本発明による文書翻訳方
法又はシステムは、文書に含まれている情報を解析して
解析結果を生成する解析ステップ又は手段と、該解析結
果に従って該文書を翻訳するときに利用する翻訳資源を
選択する翻訳資源選択ステップ又は手段と、該選択され
た翻訳資源を利用して該文書を第1の言語から第2の言
語へ翻訳する翻訳ステップ又は手段とからなる。
【0006】請求項2又は14の発明によれば、該翻訳
資源選択ステップ又は手段は、文書の第1の部分には第
1の翻訳資源を選択し、該文書の第2の部分には第2の
翻訳資源を選択するものであり、該翻訳ステップ又は手
段は、該第1の翻訳資源を利用して該文書の第1の部分
を翻訳し、該第2の翻訳資源を利用して該文書の第2の
部分を翻訳するものである。
【0007】請求項3又は15の発明によれば、該解析
ステップ又は手段は該文書に含まれている構造情報を解
析するものである。より具体的には、請求項4,5,1
6又は17の発明によれば、該解析ステップ又は手段
は、該文書に含まれているタグ、例えば標準一般化マー
クアップ言語のタグを解析するものである。
【0008】請求項6,7,8,18,19又は20の
発明によれば、該翻訳資源選択ステップ又は手段は該文
書を翻訳するときに利用する辞書情報及び/又は規則情
報を選択するものであり、また、請求項9又は21の発
明によれば、該翻訳資源選択ステップ又は手段は該文書
を翻訳するときに利用する翻訳資源の位置を定義するデ
ータ構造を選択するものである。
【0009】請求項10又は22の発明によれば、該解
析ステップ又は手段は、翻訳に利用される翻訳資源の場
所を定義するデータ構造を指示するキーを含む解析結果
を生成するものであり、該翻訳資源選択ステップ又は手
段は、該文書を翻訳するときに利用する翻訳資源の場所
を定義する該キーを含むデータ構造を選択するものであ
る。
【0010】請求項11又は23の発明によれば、文書
翻訳方法又はシステムは、該第1の言語の該文書の部分
と該第2の言語に翻訳された該文書の対応部分を同時に
表示する表示ステップをさらに有し、請求項12又は2
4の発明によれば、文書翻訳方法又はシステムはさら
に、該第2の言語に翻訳された該文書の部分を該表示ス
テップの後に変更するステップを有する。
【0011】
【発明の実施の形態】以下に詳述する本発明の文書翻訳
システムの概略を述べれば、翻訳プロセスにおいて、文
書の異なる部分に対し、異なる翻訳資源もしくは翻訳情
報(辞書や翻訳規則等)を利用する。文書の部分部分
は、タグを使って指示される。これらタグは、好ましく
は、標準一般化マークアップ言語(SGML)に準拠し
て生成されるタグである。
【0012】翻訳を実行できるようにするには、それに
先だって、受入れ可能なタグと受入れ可能な文書の構造
を定義する文書タイプ定義(DTD)が生成されなけれ
ばならない。このDTDは、受入れ可能な文書の構造と
階層を定義する。例えば、スキャナ等の装置を記述する
文書は、概要、ハードウエアの説明、使用ソフトウエア
の説明、及び使用可能なアクセサリもしくはオプション
といった主要部分を有するであろう。概要部分には、装
置の名称や説明、装置を表す図面、装置の機能の一覧表
が含まれているであろう。
【0013】文書タイプ定義が作成された後、翻訳プロ
セスに使用される辞書及び規則データベースが定義され
なければならない。文書の様々な部分の翻訳に利用され
る辞書及び規則を生成する一方法は、既に翻訳された文
書を入力することである。こうすることにより、システ
ムは、その文書を翻訳して、その適切な既知の訳文が得
られるように、辞書及び規則を自動構築することができ
る。既知文書を翻訳するとともに、又はそれに代えて、
ユーザが文書を手作業で翻訳してもよく、辞書及び規則
はユーザの入力に基づいて構築される。さらに、自動と
手作業の翻訳を組み合わせて行ってもよく、ユーザは自
動翻訳結果を修正することができるため、最終的な訳文
はより正確なものになる。さらに別の方法では、規則及
び辞書は手作業で作られる。
【0014】本発明の好ましい動作では、文書の異なる
部分毎に別々のデータ構造を利用する。このデータ構造
は、文書の対応した部分又は他の部分で利用可能な辞書
及び規則の名称及び位置等の情報を指示する情報を格納
する。このデータ構造を辞書及び規則の管理に用いる
と、様々な辞書及び規則を文書構造の階層と同じような
階層に編成することができる。
【0015】翻訳システムの開発とトレーニングが十分
になされたならば、翻訳プロセスは自動化が可能にな
り、文書の特定の部分に対し対応した特定の辞書情報及
び翻訳規則を利用する。文書の異なる部分に対し、それ
ぞれ特定の辞書情報及び規則を利用することにより、翻
訳はより正確になりソース文書と翻訳文書との間が一対
一対応に近づき、”缶詰”表現しか利用できない翻訳シ
ステムを利用したときに生じる負担や困難を伴わない。
【0016】以下、添付図面を参照し、本発明の実施例
について説明する。なお、複数の図面を通し同様の参照
数字は同一部分又は対応部分を示す。
【0017】図1に、翻訳の対象となる典型的文書の構
造が示されている。図1に示した文書の構造は、コピ
ア、ファクシミリ装置、プリンタ、スキャナ等々の装置
に利用できる。文書30は4つの主要部分、すなわち文
書中に記述された装置に関する概要部分32、該装置に
使用されるハードウェアに関する説明部分40、該装置
に使用されるソフトウエアに関する説明部分42、及
び、該装置のアクセサリ又はオプションの説明部分44
からなる。これらの各主要部分は、必要に応じ、文書を
より細かな部分に分割した小部分を含んでもよい。例え
ば、概要部分32は、装置の短い説明を内容とする装置
部分34、装置のイラストを含む図36及び装置の機能
一覧表38からなる。
【0018】本発明は図に含まれている情報は翻訳しな
い。ただし、翻訳文書において、翻訳された言語にとっ
てよりふさわしい画像を含む別の図に置き換えることは
可能である。例えば、米国で使用予定の自動車の図は米
国で用いるべき名称を表すが、日本で使用される対応図
は日本で用いるべき名称を表す。また、別言語の文章を
含む図も使用できる。
【0019】図1に示した様々な構造部分を持つ文書が
どのように翻訳されるか説明する前に、翻訳対象のソー
ス文書の一例を図2に関連して説明する。図2に、翻訳
すべき文書の一部分の構造と内容が示されている。この
文書はタグ(例えば、標準一般化マークアップ言語(S
GML)に準拠して生成されるタグ)を用いてエンコー
ドされているが、これは公知のエンコーディング法であ
り、国際標準ISO8879:1986「標準一般化マークアッ
プ言語(SGML)」及び書籍 ”The SGML Hand
book”(C.F.Goldfarb著,Clarendon Press発行,
1990)に詳細に述べられている。しかしながら、本発明
はSGMLタグしか使用できないわけではなく、翻訳シ
ステムにハイパーテキスト・マークアップ言語(HTM
L)等に準拠して生成されるタグのような他のフォーマ
ット方法や、異なる翻訳資源を利用するために異なる構
造部分を指示するエンコーディング方法又は文書マーキ
ング方法を利用してもよい。書式を使う文書システム
は、書式の各部分をタグ付けされた要素の同等物として
処理させることにより、本発明を利用できる。SGML
によれば、タグは通常、より小さいことを表す不等号
(<)で始まり、タグの名称が続き、より大きいことを
表す不等号(>)で終わる。図2中の、より小さいこと
を表す不等号で始まり、より大きいことを表す不等号で
終わる要素はそれぞれタグである。タグは、タグを説明
するデータを伴うことがある。例えば、図2の第3行の
タグ<LANG>は、文書が英語で書かれていることを
表す語”English”が後に続いている。
【0020】タグは、その後に、もしタグを説明するデ
ータがあればその後に、終了タグが続き、あるいは、明
示の終了タグを持たず、次のタグの始まりによる暗黙的
に終了する。タグの省略が許されるのは、DTDで定義
された文書構造のシンタックスが多義的でなくタグ省略
を許す場合だけである。終了タグは、より小さいことを
表す不等号で始まり、スラッシュ(/)が続き、その後
にタグの名称が続き、より大きいことを表す不等号で終
わる(</...>)。タグの暗黙の終了は図2の全体
に見られる。例えば第3行及び第4行では、タグ<LA
NG>の後に文書が英語で書かれていることを示すデー
タ”English”が続いている。この開始タグ<LANG
>に対する明示の終了タグはなく、第4行は文書の発行
元である会社の部署を示すために用いられる新たなタグ
<DIVISION>で始まる。この<DIVISIO
N>の出現が、タグ<LANG>が終了したことを暗黙
的に示している。
【0021】図2の第1行は文書の!DOCTYPE記
述で始まる。この!DOCTYPEは、翻訳対象の文書
が予め定義された文書タイプ定義(DTD)のいずれに
属しているかを宣言する。第1行中のOURDOCは、
文書要素の包括的識別子である。引用符で囲まれた情報
は、SGMLパーサに対し該DTDの場所を指示する。
これは、文書タイプを指示するために使われる標準的な
SGMLシンタックスである。図2の第2行は文書の始
まりを示すタグであり、第3行は文書の言語が英語であ
ることを示し、第4行は会社のXYZ部から出た文書で
あることを示す。本発明は、特定書式の文書を定期的に
翻訳する必要がある国際的な会社にとって非常に有益で
ある。必要ならば、文書は、その発行元の部署又は製品
を出した部署を指示できるだけでなく、会社の識別情報
を含むこともできる。
【0022】図2の第5行は、説明されている装置の種
類がスキャナであることを示す。これは、文書の翻訳に
利用される辞書及び翻訳規則データベースを、スキャナ
に関し使われる辞書及び翻訳規則に絞り込むのに役立
つ。第6行は文書が製品仕様書であることを示し、第7
行は文書のタイトルでもあるスキャナの名称又はモデル
番号がRS2200−EFであることを示す。
【0023】第8行は、文書の概要部分すなわち図1の
階層構造中に32として示された部分の始まりを示す。
この概要部分は第9行の装置説明で始まり、この装置説
明は”This scanner...”なる言い回しで始まるパラグ
ラフ(<p>)である。第10行は、次に図が含まれて
いて、それが図1の構造中の図36に対応することを示
す。次に、第11行は装置の機能が後に続くことを示
し、第12行は機能が一覧表にされていることを示し、
その後に、その一覧表の項目(<IT>)が第13行、
第14行及び第15行に記載されている。文書はさらに
続くであろうが、その詳細は重要ではないので、簡略化
のため、及び、あまりに具体的な例を提示することによ
る読み手の混乱を避けるため省略する。
【0024】図3は、図2に示した文書の英語版を示す
領域52Aと、その右側にある同文書の翻訳版の領域5
2Bとを含む画面表示50を示す。図3の左側を見る
と、図2の文書が印刷されるかCRTやLCDディスプ
レイ等の電子的ディスプレイ上に生成される時に、タグ
がすべて表示されるわけでないことが分かる。領域52
A内において、タイトルもしくは装置名が54Aで示さ
れ、見出し”DeviceOverview”56Aが続き、情報を
記述するパラグラフ58Aがその後に続く。次に、領域
60Aに図が表示され、その後に機能の一覧表62A,
64A,66Aが続く。本発明の動作中、文書の原語書
式と翻訳書式を並べて表示させることができ、これによ
りユーザは容易に翻訳文書を原文書とを比較し、必要に
応じ変更することができる。
【0025】翻訳文書の領域52Bは、斜線でハッチン
グを施した矩形領域が入っているが、本発明の実際の動
作中に原文書(52A)の実際の訳文が入るであろう。
しかし、領域52Bには訳文が示されていない。訳文は
本発明を理解するのに必要ではなく、また、例えば外国
語の単語又は文字列を領域52Bに含めると混乱する恐
れがあるためである。
【0026】すべてのタグ又はデータが本発明により翻
訳されねばならない、というものではない。例えば、タ
イトル又はスキャナの名称は54Aによって示されてい
るが、これは外国語のタイトルもしくは名称と同じであ
るかもしれない。見出し”Device Overview”56A
は、図2の第8行のタグ<OVERVIEW>を翻訳す
ることにより得られる。見出し”Device Overview”
は、そのタグの直接的訳文(direct translation)であ
り、タグ<OVERVIEW>にどんな見出しを用いる
べきかを指示する文書タイプ定義に関連した辞書又はテ
ーブルに格納しておくことができる。図2のタグ<LA
NG>のようにタグが表示されない時には、そのタグを
翻訳する必要はない。ただし、望むなら翻訳してもよ
い。
【0027】図3は、同じ図が原文書領域52Aと翻訳
文書領域52Bの両方に含まれることを示している。し
かし、望むならば、ユーザによって又は自動的に指定さ
れた、翻訳後言語に対応した別の図が使われてもよい。
領域58A,62A,64A,66Aに含まれている情
報は、適切な辞書及び規則データベースを使って翻訳さ
れる。
【0028】本発明により実行される翻訳動作は主に英
語、日本語、ドイツ語、フランス語、スペイン語、中国
語、ロシア語その他の異なる人間言語間の相互翻訳に関
するものである。しかし、本明細書で教示したことか
ら、他の種類の言語又は情報に適用することも、例えば
異なったコンピュータ言語間の翻訳に適用することも可
能である。
【0029】図3の領域58Aに示される文章のような
文章部分が翻訳される時に、語彙を収容した辞書と、文
法及び言語規則を含む翻訳規則が利用される。翻訳プロ
セスで辞書と言語規則を利用するのは従来から行われて
いることである。従来の機械翻訳がどのように動作する
かについての情報源が書籍”Machine Translation,An
Introductry Guide ”(D.Arnoldほか著、Black
well Publishers発行,1994)に掲載されている。
本書は、機械翻訳の優れた入門書であるとともに、従来
の機械翻訳の動作について述べた様々な情報源を列挙し
ている。本書とその引用資料に記載されたシステムには
ない、本発明の優れた特徴としては、文書のどの部分又
はどのタイプの文書を翻訳するかによって、特定の辞書
もしくは辞書の特定の部分を利用し、及び/又は、特定
の規則データベースもしくは規則データベースの特定の
部分を利用することである。
【0030】図4は、本発明に利用できる典型的な辞書
を示す。図4に、コピア辞書72、スキャナ辞書84、
プリンタ辞書86及び一般英日語彙辞書88の4部分を
有する英和/和英辞書70がある。コピア辞書72は、
コピアについて記述した文書の翻訳時に利用される。さ
らに、その文書の翻訳しようとする部分がコピアのユー
ザマニュアルに関するものである時に、コピア辞書72
の部分74が利用される。コピアの技術的説明の翻訳時
には技術仕様部分76が利用される。この技術仕様部分
76は、コピア記述文書のソフトウエア、ハードウェ
ア、機械的特徴に関する辞書情報を格納した細目部7
8,80,82を含む。スキャナ辞書84及びプリンタ
辞書86は、その細部は図示されていないが、コピア辞
書72と同じように分割されるであろう。さらに、一般
英日語彙辞書88は、他の辞書の一つに特有なものでな
い又は収容されていない一般的な語の翻訳に利用され
る。
【0031】辞書及び規則データベースは、最も高い階
層レベルで様々な分野に分割されてもよい。例えば、コ
ピア分野、スキャナ分野、プリンタ分野があってよい。
翻訳される文書が、これら分野の一つに含まれる場合、
その翻訳の実行に利用される辞書及び規則は対応分野よ
り選ばれる。
【0032】辞書及びその細目辞書部に収容されている
情報は、必要なら従来の方法を含め任意の所望の方法に
より記憶される。本発明の重要な特徴は、異なるタイプ
の文書の異なる部分に対し異なる辞書情報を使用するこ
とである。しかし、図4に示したものとは違う辞書構成
を使用してもよい。例えば、異なった部分又は異なった
タイプの文書に対し別々の辞書を使用してもよいが、異
なったタイプの文書で一つの辞書を共有し、その同じ辞
書の異なった部分を必要時に利用することも可能であ
る。その異なった辞書又はその部分の選択は、どの辞書
が用いられるべきか指示するポインタを使って行ってよ
い。さらに、辞書の生成時、修正時、又は利用時に、必
要に応じ、ある辞書の情報を別の辞書にコピーしてもよ
い。
【0033】図5は、本発明の翻訳プロセスに利用され
る文法・言語規則データベース90の典型的構成を示
す。この文法・言語規則データベース90には日本語文
法・言語規則92が収容されている。この日本語文法・
言語規則92は、会社の指針及び規則の翻訳に使われる
文法・言語規則94と、ユーザーマニュアルの翻訳時に
使用される文法・言語規則96を含んでいる。ユーザー
マニュアルには、プリンタ用、スキャナ用、コピー用の
ものがあり、それぞれに固有の規則98,100,10
2がある。日本語文法・言語規則92は、技術文書の翻
訳に利用される文法・言語規則104も含み、技術文書
にはプリンタ用、スキャナ用及びプリンタ用のものがあ
り、それぞれ固有の規則106,108,110があ
る。日本語文法・言語規則データベース90は英語文法
・言語規則120も含む。この英語文法・言語規則12
0も、会社の指針及び規則の翻訳のための規則122
と、プリンタ、スキャナ、コピアのユーザーマニュアル
の翻訳用の規則126,128,130からなるユーザ
ーマニュアル翻訳用規則124と、プリンタ、スキャ
ナ、コピアに関する技術文書の翻訳のための規則13
4,136,138からなる技術文書翻訳用規則132
を含んでいる。
【0034】データベース90に格納される文法・言語
規則は、従来の機械翻訳の文法・言語規則であるので、
当業者はそのような規則の作成方法を知っているであろ
う。ただ、これらの規則は本発明に適合するように特別
に作られており、文書の様々な部分の翻訳のための様々
な部分又は様々な特殊規則を持っている。
【0035】図6は、辞書及び規則データベースを文書
の様々な部分で容易に選択利用できるように、辞書及び
規則データベースの場所及び階層構造に関する情報を格
納する好ましい方法を示す。データ構造150A〜15
0Gはそれぞれ同じ構造であるので、データ構造150
B〜150Gの詳細なフィールドは図示されていない。
キー・フィールド152は当該データ構造の固有の識別
子である。例えば、キーは単に番号でもよいが、名称で
もよい。最高の階層レベルのデータ構造150Aについ
ては、必ずしもキーを持たなくともよく、また、そのキ
ーをヌルに設定してよい。図6に示すデータ構造の階層
ツリーを容易にさかのぼることができるように、データ
構造150Aは親データ構造を指すポインタ154を持
つ。しかし、データ構造150Aは、最高の階層レベル
にあるので親がないため、親データ構造を指すポインタ
154はヌルに設定される。文書の対応した階層レベル
の翻訳に利用される辞書は、辞書フィールドを指すポイ
ンタ・フィールド156内に格納されているアドレスに
置かれている。同様に、文書の対応した部分の翻訳に利
用される規則データベースは、規則データベースを指す
ポインタのフィールド158に対応したアドレスに置か
れている。
【0036】フィールド160はキー情報を指すポイン
タを格納している。このポインタは、フィールド152
内のキー要素の構造に相当するキー及び入力情報用の別
のフィールドを含むテーブルを指すポインタとしてよ
い。例えば、下記の表1は、辞書及び規則の選択を生じ
させるタグの名称を記述した入力情報の欄と、その入力
情報に対応したキーが入っている欄を含む。
【0037】
【表1】
【0038】データ構造150Aはさらに、子データ構
造の数が入るフィールド162を含む。例えば、データ
構造150Aは4個の子データ構造150B,150
C,150D,150Eを持つ。最後に、フィールド1
64は、その種々の子データ構造を指すポインタの配列
が入っている。
【0039】階層の1つ下のレベルへ行く必要がある時
に、翻訳中の文書内にある、使用すべき辞書及び規則デ
ータベースを指定するタグが読まれる。例えば、文書が
スキャナを説明していることを示す図2の第5行の処理
時に、表1が検索され、12というキーを持つスキャナ
のエントリーが見つかる。12というキーを持つ辞書の
位置を突き止めるため、子データ構造の数及び子データ
構造へのポインタの配列を利用して1つ下の階層レベル
にあるデータ構造が検索される。このようにして、翻訳
している文書の階層構造及びタイプに対応した辞書及び
規則データベース情報を容易に検索追跡することができ
る。
【0040】本発明は、様々な部分が文書のどの階層レ
ベルであるかの指示を含んだ文書を翻訳する。機械翻訳
システムが各部分もしくは階層レベルがいつ始まり又は
いつ終わるかを認識するために、翻訳対象の文書は各部
分の始まりを指示するものを含んでいなければならな
い。文書の様々な部分を指示する一般的な方法は、タグ
を使う方法である。そのタグは、標準一般化マークアッ
プ言語(SGML)に準拠するのが好ましいが、望むな
らば文書の様々な部分を指示する他の任意の方法を利用
してよい。本発明で様々な部分を指示するために用いら
れるSGLMタグは、SGMLの規則に従った特定の文
書タイプ定義(DTD)に適合する必要がある。本発明
が効果的に作用するためには、新たなDTDを生成しな
ければならないだろう。既知のDTDがあり、その知識
に基づき当業者はむやみに実験をしなくとも新たなDT
Dを作ることができるであろう。本発明にそのまま使用
できないかもしれないが、DTDを作成する方法を教え
てくれる典型的なSGML文書タイプ定義は、国際規格
ISO 8879-1986(E)の136ページから始まる付録Eの
DTDである。
【0041】図7は、文書タイプ定義を生成するプロセ
スを示す。このプロセスが開始すると、ステップ172
で同じ分野に属する複数の文書の構造を分析する。これ
は、自動的に行っても、人間が行っても、機械と人間の
協同によって行ってもよい。次にステップ174で、そ
れら様々な文書の共通の構造要素(セマンティクスも含
めて)と特有の構造要素を見つける。その共通構造要素
及び特有構造要素並びにセマンティクスに基づいて、ス
テップ176で該分野のための文書タイプ定義である新
たな構造を定義する。一例を挙げれば、スキャナを説明
する文書の構造は、図1に示すように4つの主要部分、
すなわち概要部分32、ハードウエア説明部分40、ソ
フトウエア説明部分42及びアクセサリ説明部分44を
持つであろう。さらに、概要部分32は装置の定義部、
図及び機能一覧表を含むであろう。次にステップ178
で、定義した新たな構造(例えばDTD)が当該分野の
条件を満たすか、すなわち、それら文書をそのDTDに
よって表現できるか判定する。満たさないときには、ス
テップ176に戻り、DTDを定義しなおすか変更す
る。その構造が問題がなく当該分野の条件を満足すると
きには、ステップ180で、その構造をSGML文書タ
イプ定義に書き込み、図7のプロセスは終了する。
【0042】図8は、本発明の全体的動作を表すデータ
フロー図である。図8及び図18のデータフロー図にお
いて、円はプロセスを示し、2本の横線の間にある情報
はデータのタイプを示し、枠つまり正方形はある操作を
行うユーザ又は他の装置を示す。図8のデータフロー図
において、文書作成者202は文書編集/生成プロセス
204を利用して文書を作成する。文書作成者202か
らの入力は、予め生成された文書タイプ定義206とと
もに文書編集/生成プロセス204で利用される。文書
編集/生成プロセス204が作成中もしくは編集中の文
書に関し問題を検出すると、文書作成者202へフィー
ドバックが与えられる。問題の例としては、会社指針違
反と曖昧な言い回しがある。文書編集/生成プロセス2
04の結果が文書原文208である。
【0043】図8のデータフロー図には、翻訳及び辞書
規則の作成のために利用される翻訳・システムトレーナ
ー(trainer)210が含まれている。辞書・規則作成プ
ロセス212は、文書タイプ定義206、文書原文20
8及びトレーナー210からの入力を受け取り、辞書デ
ータベース及び規則データベースを作成する。文書原文
208は、ディスク、RAM又はその他の記憶媒体か
ら、あるいは、ネットワーク等の通信回線もしくはモデ
ムより、辞書・規則作成プロセス212、及び/又はト
ランスレータ(translator)214へ入力される。さら
に、辞書・規則作成プロセス212は、翻訳・システム
トレーナー210へフィードバックを与える。トレーニ
ング・プロセス時に、及び必要ならば翻訳プロセス時
に、辞書・規則作成プロセス212は、翻訳文書220
を生成するために辞書データベース216及び規則デー
タベース218を利用する。翻訳プロセスに利用される
辞書及び/又は規則データベースは、翻訳情報又は翻訳
資源とみなされる。しかし、翻訳情報又は翻訳資源は辞
書と規則データベースに限定されるものではなく、翻訳
プロセスを助け又は実行する他の資源又は情報も翻訳情
報又は翻訳資源である。
【0044】図8のデータフロー図には自動トランスレ
ータ214も含まれている。この自動トランスレータ2
14は、文書タイプ定義206、文書原文208、辞書
データベース216及び規則データベース218を利用
し、翻訳文書220を自動的に生成する。翻訳文書22
0は、ディスク、RAM、その他の任意の種類のメモリ
に保存され、プリンタで印刷され、及び/又は、ネット
ワーク、モデム又は他の通信回線を介し他のコンピュー
タへ出力される。
【0045】図9乃至図12は、図8に示した辞書・規
則作成プロセス212に対応するプロセスを示す。この
プロセスは、辞書及び規則の作成のために利用されるだ
けはなく、翻訳プロセスの実行のためにも利用してよ
い。図9において、スタート後、ステップ230で翻訳
すべき文書の次のトークンを読む。初めてスタートした
時には、このトークンは文書の最初のトークンであり、
翻訳すべきタグ又はデータの一部分である。次にステッ
プ232で、そのトークンがタグであるか判定する。タ
グならば、ステップ234へ進み、そのトークンが開始
タグであるか判定する。そのトークンが開始タグなら
ば、ステップ240で、文書の前階層レベルが終了タグ
無しで終了したか判定する。前述のように、終了タグの
省略が可能であり、文書タイプ定義が分かっていれば特
定のタグの終わりを自動検出可能である。したがって、
ステップ240で前階層レベルが終了タグ無しで終了し
たと判定したときには、ちょうど今検出した開始タグ
は、その前の1つ又は複数のタグが終わったことを意味
するので、ステップ242が実行され、階層レベルを1
レベル又は数レベル繰り上げる。ステップ240の判定
結果が否定の時に、又はステップ242を実行した後
に、図10に示すプロセスBへ進む。
【0046】図10において、ステップ248で、その
開始タグの付属情報があるならば、それを調べるため同
開始タグを処理する。例えば、図2の第4行、第10行
等を見られたい。ステップ250で、階層レベルを繰り
下げるための図12に示すプロセスを呼び出す。翻訳中
の文書は様々な階層レベルに配置され、新たな開始タグ
で指示される新たな階層レベルに検出した時には、適当
な辞書及び規則データベースが必要なら生成されて利用
されるよう、図6に示したデータ構造のようにデータ構
造を調整する必要がある。
【0047】図12において、スタート後、ステップ2
80で当該階層レベル及び構造タグを初めて使用するの
か判定する。例えば、そのタグが一度も使用されていな
い時には、使用すべき辞書及び規則を示す階層情報を格
納するための、図6に示すようなデータ構造を生成する
必要がある。その階層レベル又はタグを以前使用したた
ときには、割り当て済みであるからその新たなデータ構
造を重ねて割り当てる必要はない。ステップ280で、
その階層レベルが初めて使用されようとしていると判定
したときには、図6に示したデータ構造150Aのよう
な、辞書及び翻訳規則の情報を格納するための1つのデ
ータ構造を割り当てる(ステップ282)。ステップ2
84で、必要情報を保持するようにこの生成されたデー
タ構造のフィールドを初期設定する。例えば、キー(1
52)としての固有の識別子を生成しなければならず、
辞書へのポインタ(154)及び規則データベースへの
ポインタ(158)を設定しなければならず、利用され
る新たな辞書及び規則データベースを生成又はコピーし
なければならず、また、将来、キーを決定できるようキ
ー情報へのポインタ(160)を初期設定しなければな
らない。そのキーとキー情報を含んでいるテーブルも更
新する必要がある。さらに、1つ上の階層レベル内の親
データ構造を指すように親データ構造へのポインタ(1
54)を設定しなければならず、この時点では新たに生
成されたデータ構造には子がまったくないので、子デー
タ構造の数(162)は0に、子データ構造へのポイン
タの配列(164)はヌルを指すように設定しなければ
ならない。ステップ286において、親データ構造は、
子データ構造の数及び子データ構造へのポインタの配列
を新たな辞書の生成を正しく反映するように更新しなけ
ればならない。
【0048】ステップ280で、その階層レベルが今回
初めて使われるのではないと判定したときには、ステッ
プ288でタグよりキー情報を取得する。キー情報が分
かったならば、表1のようなテーブルを利用してキーを
見つけることができる。次に、ステップ290で、キー
情報に対応したデータ構造、すなわちキー情報に対応し
たキーを持つデータ構造を見つける。このデータ構造
は、カレント・タグの翻訳プロセスに利用されるカレン
ト・データ構造として設定される。ステップ290及び
ステップ286より、呼び出しプロセスへ戻る。当該ケ
ースでは図10のステップ252へ戻る。
【0049】図10のステップ252において、タグが
翻訳指示を持っているか判定される。タグが翻訳指示を
持っていないときには、そのタグはユーザに表示される
ことはないので、翻訳する必要はないであろう。そのタ
グは文書構造化のために利用されるであろうが、実際に
表示されないので、文書を表示するためのプロセスがそ
のタグの種類を認識する限り、そのタグはどんな言語で
書かれていようと構わない。タグが翻訳指示を持たない
場合には、呼び出しプロセスに戻る。その後、文書の次
のトークンを読むため図9のプロセスを繰り返すことが
できる。
【0050】図10のステップ252で、タグが翻訳指
示を持つと判定したときには、そのタグはカレント階層
レベルの辞書及び規則を用いて翻訳される。あるいは、
タグの訳文をDTDに関連したテーブル内に定義してお
き、このタグを使って単純な1対1対応形式で翻訳して
もよい。あるいはまた、文書の以前の翻訳からタグの訳
文を取得し、システムのトレーニングに利用してもよ
い。次に、ステップ256で、タグをその原言語で表示
するとともに、その訳も表示する。これは、図3に示す
領域56A,56Bの表示に対応する。ステップ258
において、ユーザは訳文を変更したいか問われる。訳文
を変更したいときには、以後の翻訳にユーザの要望を反
映させるため、辞書及び規則が必要に応じ更新される。
次に、文書に含まれる他の情報により翻訳及びトレーニ
ングをするため、呼び出しプロセスに戻る。
【0051】図9において、ステップ234で処理して
いるトークンが開始タグではないと判定したときには、
ステップ236で、そのトークンが終了タグであるか判
定する。終了タグでなければ、エラーが表示される。な
ぜなら、このトークンは、ステップ232でタグである
と判定されており、開始タグか終了タグのどちらかでな
ければならないからである。ステップ236でトークン
を終了タグであると判定したときには、ステップ238
で以後の翻訳に適切なデータ構造が使用されるように図
6に示した階層構造を調整する。文書の階層レベルを1
レベル又は複数レベル繰り上げることにより、図6のペ
ージの上端へ向かって次に最も高いところにあるデータ
構造が選ばれる。終了タグ(又はその省略)が2階層レ
ベル以上が終了したことを示す時には、それにふさわし
い階層レベル数だけ繰り上げられる。そして呼び出しプ
ロセスに戻り、文書に他の情報があれば、図9乃至図1
1のプロセスを繰り返すことによって、その情報をトレ
ーニングに利用しかつ翻訳することができる。
【0052】ステップ232でトークンがタグでないと
判定したときには、そのトークンはデータに違いないの
で、図11に示されたプロセスAに進む。図11におい
て、ステップ264で、そのデータが階層を操作するか
判定する。階層を操作するデータの一例は図2の第5行
に見られ、ここではデータは”Scanner”である。この
データ”Scanner”は、使用されるべき階層がスキャナ
分野のものであること示す。データが階層を操作すると
きには、ステップ266に進み、1階層レベル繰り下げ
られるが、これは図12のプロセスにより行われる。図
12は、図10のステップ250に関連して説明済みで
あるので、重複を避けるため説明しない。ステップ26
6の次に、又はデータが階層を操作しない場合に、ステ
ップ268で翻訳しようとしている原文が強調表示され
る(例えば、図3に示すように表示され、かつ強調表示
される)。ステップ270で、カレント階層レベルの辞
書及び規則による強調表示文の訳文も表示される。その
結果、図3に示す領域58A,58Bのように、原情報
と翻訳情報とが隣り合って表示される。
【0053】次にステップ272で、ユーザがその訳文
の変更を希望するか判定する。ユーザが変更を望まない
ときには、原文書中のほかの情報を翻訳できるようリタ
ーンする。ユーザが訳文の変更を望むときには、ステッ
プ274でユーザは新たに伝えるべき情報を入力し、そ
して、ユーザの希望する訳文と自動的になされた訳文と
の違いを確認するため、原文と前に翻訳された文とが分
析される。次にステップ276で、同じ又は類似のフレ
ーズを今後翻訳したときに希望の訳文が得られるよう
に、カレント階層レベルの辞書及び規則が更新される。
そして図11のプロセスから呼び出しプロセスへ戻る。
【0054】ステップ270の実行時に辞書及び翻訳規
則が存在しないか完全でない場合、完全な又は適切な翻
訳を実行するためには必ず訳文を表示しなければならな
いというわけではなく、十分な情報がなく翻訳を実行で
きない旨が表示されてもよいことに注意されたい。さら
に、翻訳対象の原文書及び同文書のそれまでに生成され
た訳文を利用しトランスレータのトレーニング・プロセ
スが実行される時に、ステップ270は、それまでに生
成された訳文を表示し、ユーザがその訳文の変更を望ま
なければ、カレント階層レベルの辞書及び規則が再吟味
され、この原文書を将来翻訳したときに同じ訳文が得ら
れるようにするため、必要ならば更新される。
【0055】図9乃至図12のフローチャートに従って
トレーニングを実行中に、文書の各タグ毎又は各階層レ
ベル毎に図6に示すようなデータ構造が作られてもよ
い。こうすると、非常に多くのデータ構造と対応した辞
書及び規則データベースが作られる。しかし、データ構
造150の数及び辞書及び規則データベースの数を減ら
すため、本発明は、望むならば、辞書相互及び規則デー
タベース相互を比較し、その類似点を見つける。類似点
が見つかったならば、そのデータ構造、及び/又は、辞
書と規則データベースが統合される。単に辞書及び規則
データベースの数を減らすため、それらを併合すること
も可能である。異なった辞書及び規則データベースの併
合も、それぞれのエントリー数が少なく、それが他の翻
訳資源と矛盾もしくは相違しない時には好ましいだろ
う。辞書を併合することにより、辞書及び規則データベ
ースの数、及び辞書を管理するために用いられるデータ
構造の数が減るであろう。辞書及び規則データベースの
数が減れば、階層構造も統合、単純化することができ
る。しかし、望まないならば、データ構造を含め異なっ
た翻訳資源を併合する必要はない。文書の異なった部分
に対し特定の辞書情報及び規則を用いることにより、”
缶詰”表現しか使用できない翻訳システムを利用すると
きに生じる負担又は困難を伴うことなく、翻訳はより正
確になり、ソース文書と翻訳文書とが1対1対応に近づ
く。
【0056】図13は、図8の自動トランスレータ21
4によって実行されるプロセスを示す。まずステップ2
94で、文書の受入れ可能な構造を定義する文書タイプ
定義(DTD)を読む。次にステップ296で、翻訳す
べき文書中の次のトークンを読む。このトーンは翻訳す
べきタグ又はデータである。ステップ298で、文書の
終わりに達したか判定する。文書の終わりに達したとき
には、自動翻訳プロセスは終了する。まだ終わりまで達
していなければ、ステップ300で、そのトークンがタ
グか判定する。タグでなければ、そのトークンはデータ
であるので、カレント・データ構造例えば図6に示され
たデータ構造の一つを利用して決定されるカレントの辞
書及び規則データベースを利用し、トークンは翻訳され
る。そのトークンがタグであれば、ステップ300より
ステップ304へ進み、図14に示すタグ・プロセッサ
を呼び出す。
【0057】図14において、ステップ310で、この
タグの翻訳指示が必要か判定する。翻訳指示が必要とな
るのは、翻訳されたタグが文書中に表示され、かつ単に
文書の構造化のためのものではない場合である。訳文が
必要とされるならば、ステップ312で翻訳指示がある
か判定する。それが存在するならば、そのタグはカレン
トの辞書及び規則データベースを使って翻訳される。翻
訳指示が存在しないときには、必要な情報が存在しない
ので翻訳は実行されない。この時、望むならば、ユーザ
に対し、翻訳指示が存在しない旨のエラー通知が表示さ
れてもよい。ステップ316で、タグがDTDの適切な
順番に位置しているか判定する。そうでなければ、エラ
ー処理ルーチンがステップ318で呼び出され、プロセ
スは終了する。適切な順番であれば、ステップ320
で、図15に示される階層プロセッサを呼び出し必要な
タグ情報を渡す。
【0058】階層プロセッサを示す図15において、ス
テップ330で文書のもっと高い階層レベルが処理され
るべきか判定する。図6に示されるように、高い階層レ
ベルほど図6の上端へ近づく。もっと高い階層レベルが
処理されるべきでない時は、プロセスは階層のもっと下
へ進むことを意味し、ステップ332へ進み、利用すべ
き新たな階層レベル(それがあるならば)を決定する。
例えば、図2の第5行にあるタグ<DEVTYPE>の
場合、階層レベルが変更されるべきであることを示し、
その後に続くデータ”Scanner”は、その階層レベルが
スキャナ用であることを示す。スキャナに対応したキー
を見つけるため、キー情報が検索される。タグ単独で検
索すべきキー情報を指示する場合にも同様のプロセスが
実行される。タグは新たな階層レベルが存在することを
示さないかもしれない。その後、新たなキー、又はキー
変更無し指示が返される。
【0059】ステップ330で辞書及び規則を含む翻訳
情報もしくは資源を管理するために利用される新たなデ
ータ構造が階層のもっと上にあると判定したときには、
ステップ334で、タグ及び文書情報を利用し、いくつ
階層レベルを上げるべきか決定する。その後、上げるべ
き階層レベル数が返される。対応した終了タグが省略さ
れた開始タグに出会った時には、システムはまずステッ
プ330,334を実行して階層を上り、次にステップ
330,332を実行して階層を下ることもある。そし
て、図14及び図15のプロセスは終了する。
【0060】本発明は、ここに示した通りにプログラム
された汎用コンピュータ上で作動し、又は、専用コンピ
ュータ等の他の種類のマシンを使って作動する。本発明
を実施するコンピュータは、図16に示すワークステー
ション348で示すようなワークステーションである。
このワークステーション348は、CPU350、RA
M352、プログラム情報格納用ROM354及びキー
ボード358とマウス360とを接続し入力コントロー
ラ356を有する。さらに、ビデオ制御信号に使ってプ
リンタのような印刷エンジン362を制御する印刷エン
ジンインターフェイス364を備えている。システムバ
ス366は、ワークステーション348内の種々の要素
を接続する。フロッピー・ドライブ370及びハードデ
ィスク・ドライブ368と接続されたディスク・コント
ローラ372を備えている。通信コントローラ374は
ネットワーク375、例えばEthernetネットワークに
接続されている。I/Oコントローラ376は、SCS
Iバスを介し外部ハードディスク・ドライブ等のハード
ディスク・ドライブ380と接続されている。I/Oコ
ントローラ376は、RS−232接続あるいはパラレ
ル接続によりプリンタ378にも接続されている。ワー
クステーション348はディスプレイ・コントローラ3
82も含み、これはCRT348又は他のディスプレイ
装置と接続されている。
【0061】図17は本発明に用いられるソフトウエア
の構成要素を示す。システムコントロール・モジュール
402は、各ソフトウエア構成要素の動作及び相互通信
を制御するために利用される。SGMLパーサ(parse
r)404は原文書の構文解析に利用される。SGML
パーサ404に加えて、原言語パーサ/シンタックス・
アナライザー422、及びターゲット言語パーサ/シン
タックス・アナライザー418も備えている。辞書マネ
ージャ406は本発明に利用される多くの辞書を管理
し、同様に、翻訳規則マネージャ416は本発明に利用
される様々な翻訳規則データを管理する。これらマネー
ジャによる管理には、DTDに関連したシンタックスと
セマンティクス間の対応のモニタリングも含まれる。語
彙ビルダー(builder)408は、原言語及びターゲッ
ト言語の単語のペアからなる語彙を作成する。このペア
のターゲット言語部分は、一つの原言語単語に関係した
複数の単語を処理するための連結リストであってもよ
い。異なる辞書が同じ単語を共有するので、各辞書はそ
れらペアを指すポインタを含むように作られてもよい。
辞書選択規則ビルダー410及び言語翻訳規則ビルダー
420は、本明細書に述べたプロセスに従って翻訳を実
行するために利用される規則を構築する。入力マネージ
ャ412及びディスプレイ・マネージャ414はユーザ
との会話を処理をする。
【0062】図18は自動翻訳プロセスで利用される本
発明の別のデータフロー図を示す。このデータフロー図
において、SGMLプロセッサ456はDTD452と
共に原文書454を読み、文書階層情報458を生成
し、また原文書454のタグ460とデータ462を分
離する。分野マッピング・プロセス464はタグ460
とデータ462を読み、対象分野466を生成する。こ
の対象分野は、例えば、翻訳中の文書の内容がスキャナ
に関するものか、プリンタに関するものか、あるいは技
術文書か、ユーザマニュアルか、その他の対象分野かを
示す。対象分野は、望むならば、より細分化されてもよ
い。翻訳規則マネージャ468は、文書階層情報45
8、タグ460、対象分野466、及び、必要ならばデ
ータ462を利用し、使用すべき特定の辞書及び翻訳規
則を指示する選択規則472を生成する。選択プロセス
476は、選択規則472を受け取り、辞書データベー
ス470及び翻訳規則データベース474から適切な辞
書情報及び翻訳規則情報を選択して、トランスレータ4
80に利用される辞書及び翻訳規則を生成(又はコピ
ー)する。トランスレータ480は、文書のタグ460
とデータ462、選択された辞書及び翻訳規則478を
読み、本発明のプロセスに従って翻訳文書を生成する。
【0063】本発明が的確にトレーニングされて翻訳処
理をした後、不明瞭な入力を問い合わせるために、辞書
データベース及び翻訳規則を使って入力原言語文書を解
析してもよい。例えば、自動翻訳システムが文書をうま
く翻訳できないときに、原言語文書の誤りの可能性を指
摘するメッセージが表示されてもよい。翻訳が困難な日
本語文書を作成する日本人が大勢いる。この困難さの一
つの理由は日本語の意味そのものが明瞭でないことであ
る。原言語文書の意味が明瞭でなければ、マシンを利用
して明確な翻訳を得ることは困難又は不可能であろう。
入力文書を解析することによって、文書の作成者又は他
の人に対し、問題点を指摘し、及び/又は原言語文書の
明瞭化を要求することができる。
【0064】本発明は、ここに示した通りにプログラム
された普通の汎用デジタルコンピュータ又はマイクロプ
ロセッサを利用し支障なく実施し得ることは、コンピュ
ータ技術分野の当業者には明らかであろう。熟練したプ
ログラマによれば、ここに述べられたことに基づいて適
当なソフトウエア・プログラムを容易に作成できること
は、ソフトウエア技術分野の当業者には明らかであろ
う。特定用途向け集積回路を用意し、あるいは、一般的
な要素回路からなる適当な回路網を相互接続することに
よっても本発明を実施し得ることは、当業者には明らか
であろう。
【0065】タグを使って異なった翻訳資源を利用する
文書の異なった部分を指示するものとして本発明を説明
した。しかしながら、コンピュータの性能が向上し、ソ
フトウエアが高度化するにつれ、タグを使って文書の様
々な部分を指示するのではなく、文書の内容に基づいて
文書の様々な部分又は様々な文書タイプを自動的に決定
することが可能になろう。例えば、ソース文書に含まれ
ているセクションのタイプを決定するために文書中の単
語又はフレーズを解析できるようになるかもしれない。
【0066】本発明は、そのプロセスを実行させるよう
にコンピュータをプログラムするために利用できる命令
群を収容した記憶媒体を包含する。この記憶媒体は、フ
ロッピーディスク、光ディスク、CD−ROM、光磁気
ディスク等の任意の種類のディスク、ROM、RAM、
EPROM、EEPROM、磁気又は光カード、その他
の電子命令の格納に適した任意の種類の媒体でよいが、
それらに限定されるわけではない。
【0067】
【発明の効果】以上、詳細に説明した如く、本発明によ
れば、翻訳しようとする文書又はその部分に応じて適切
な辞書、規則等の翻訳資源を選択して翻訳処理に利用す
ることにより、翻訳対象の文書に使用できる語句を極端
に制限することなく、従来よりも正確な機械翻訳を実現
でき、したがって必要な翻訳後編集も減らすことができ
る。SGMLタグのようなタグを使って文書の構造を定
義することにより、翻訳プロセスに使用すべき翻訳資源
の選択を容易かつ確実に行うことができる。また、ユー
ザは、翻訳対象の文書とその翻訳結果とを画面上で容易
に対比し、必要に応じて翻訳結果を修正し、より正確な
翻訳を得ることができる、等々の効果を得られる。
【図面の簡単な説明】
【図1】典型的文書の階層構造を示す図である。
【図2】SGMLタグによる文書の一部分のエンコーデ
ィング例を示す図である。
【図3】ソース文書とその翻訳文書を並べて表示する画
面の例を示す図である。
【図4】本発明に利用される辞書の例を示す図である。
【図5】本発明に利用される文法・言語規則データベー
スの例を示す図である。
【図6】文書の様々な部分に利用される辞書及び規則デ
ータベースを選択するために用いられるデータ構造の階
層の構成を示す図である。
【図7】文書タイプ定義生成プロセスのフローチャート
である。
【図8】本発明の全体的動作を示すデータフロー図であ
る。
【図9】システムのトレーニング及び翻訳実行のための
プロセスの部分フローチャートである。
【図10】システムのトレーニング及び翻訳実行のため
のプロセスの部分フローチャートである。
【図11】システムのトレーニング及び翻訳実行のため
のプロセスの部分フローチャートである。
【図12】辞書及び規則データベースの情報を格納する
ためのデータ構造の更新ためのプロセスのフローチャー
トである。
【図13】自動翻訳実行プロセスのフローチャートであ
る。
【図14】文書のタグの翻訳プロセスのフローチャート
である。
【図15】文書内での階層レベル変更プロセスのフロー
チャートである。
【図16】本発明の実施に使用できるワークステーショ
ンのブロック図である。
【図17】本発明を実施するためのソフトウエアの概念
的ブロック図である。
【図18】本発明の動作に係わる詳細データフロー図で
ある。
【符号の説明】
70 英和/和英辞書 72 コピア辞書 84 スキャナ辞書 86 プリンタ辞書 88 一般英日語彙辞書 90 文法・言語規則データベース 92 日本語文法・言語規則 120 英語文法・言語規則 150A〜150G データ構造 152 キーのフィールド 154 親データ構造へのポインタのフィールド 156 辞書へのポインタのフィールド 158 規則データベースへのポインタのフィールド 160 キー情報へのポインタのフィールド 162 子データ構造の数のフィールド 164 子データ構造へのポインタの配列のフィールド 202 文書作成者 204 文書編集/生成プロセス 206 文書タイプ定義(DTD) 208 文書原文 210 翻訳・システムトレーナー 212 辞書・規則作成プロセス 214 自動トランスレータ 216 辞書データベース 218 規則データベース 220 翻訳文書 402 システムコントロール・モジュール 404 SGMLパーサ 406 辞書マネージャ 408 語彙ビルダー 410 辞書選択規則ビルダー 412 入力マネージャ 414 ディスプレイマネージャ 416 翻訳規則マネージャ 418 ターゲット言語パーサ/シンタックス・アナラ
イザー 420 言語翻訳規則ビルダー 422 原言語パーサ/シンタックス・アナライザー 452 文書タイプ定義(DTD) 454 原文書 456 SGMLプロセッサ 458 文書階層情報 460 タグ 462 データ 464 分野マッピング・プロセス 466 対象分野 468 翻訳規則マネージャ 470 辞書データベース 472 選択規則 474 翻訳規則データベース 476 選択プロセス 478 辞書及び翻訳規則 480 トランスレータ 482 翻訳文書

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 第1の言語の文書を入力するステップ、 該文書に含まれている情報を解析して解析結果を生成す
    る解析ステップ、 該解析結果に従って該文書を翻訳するときに利用する翻
    訳資源を選択する翻訳資源選択ステップ、及び該選択さ
    れた翻訳資源を利用して該文書を該第1の言語から第2
    の言語へ翻訳する翻訳ステップからなる、文書を第1の
    言語から第2の言語へ翻訳するためのコンピュータによ
    り実施される文書翻訳方法。
  2. 【請求項2】 請求項1記載の文書翻訳方法において、
    該翻訳資源選択ステップは、文書の第1の部分には第1
    の翻訳資源を選択し、かつ、該文書の第2の部分には第
    2の翻訳資源を選択し、該翻訳ステップは、該第1の翻
    訳資源を利用して該文書の第1の部分を翻訳し、かつ、
    該第2の翻訳資源を利用して該文書の第2の部分を翻訳
    する、ことを特徴する文書翻訳方法。
  3. 【請求項3】 請求項1記載の文書翻訳方法において、
    該解析ステップは該文書に含まれている構造情報を解析
    する、ことを特徴する文書翻訳方法。
  4. 【請求項4】 請求項1記載の文書翻訳方法において、
    該解析ステップは該文書に含まれているタグを解析す
    る、ことを特徴する文書翻訳方法。
  5. 【請求項5】 請求項4記載の文書翻訳方法において、
    該解析ステップは該文書に含まれている標準一般化マー
    クアップ言語のタグを解析する、ことを特徴とする文書
    翻訳方法。
  6. 【請求項6】 請求項1記載の文書翻訳方法において、
    該翻訳資源選択ステップは該文書を翻訳するために利用
    される辞書情報を選択する、ことを特徴する文書翻訳方
    法。
  7. 【請求項7】 請求項1記載の文書翻訳方法において、
    該翻訳資源選択ステップは該文書を翻訳するときに利用
    する規則情報を選択する、ことを特徴する文書翻訳方
    法。
  8. 【請求項8】 請求項1記載の文書翻訳方法において、
    該翻訳資源選択ステップは該文書を翻訳するときに利用
    する辞書情報及び規則情報を選択する、ことを特徴する
    文書翻訳方法。
  9. 【請求項9】 請求項1記載の文書翻訳方法において、
    該翻訳資源選択ステップは該文書を翻訳するときに利用
    する翻訳資源の場所を定義するデータ構造を選択する、
    ことを特徴する文書翻訳方法。
  10. 【請求項10】 請求項1記載の文書翻訳方法におい
    て、該解析ステップは翻訳に利用される翻訳資源の場所
    を定義するデータ構造を指示するキーを含む解析結果を
    生成し、該翻訳資源選択ステップは該文書を翻訳すると
    きに利用する翻訳資源の場所を定義する該キーを含むデ
    ータ構造を選択する、ことを特徴する文書翻訳方法。
  11. 【請求項11】 該第1の言語の該文書の部分と該第2
    の言語に翻訳された該文書の対応部分を同時に表示する
    表示ステップをさらに有することを特徴とする請求項1
    記載の文書翻訳方法。
  12. 【請求項12】 該第2の言語に翻訳された該文書の部
    分を、該表示ステップの後に変更するステップをさらに
    有することを特徴とする請求項11記載の文書翻訳方
    法。
  13. 【請求項13】 文書を第1の言語から第2の言語へ翻
    訳する文書翻訳システムであって、 該文書に含まれている情報を解析し解析結果を生成する
    解析手段、 該解析結果に従って該文書を翻訳するときに利用する翻
    訳資源を選択する翻訳資源選択手段、及び該選択された
    翻訳資源を利用して該文書を該第1の言語から該第2の
    言語へ翻訳する翻訳手段、からなる文書翻訳システム。
  14. 【請求項14】 請求項13記載の文書翻訳システムに
    おいて、該翻訳資源選択手段は、文書の第1の部分には
    第1の翻訳資源を選択し、かつ、該文書の第2の部分に
    は第2の翻訳資源を選択する手段からなり、該翻訳手段
    は、該第1の翻訳資源を利用して該文書の該第1の部分
    を翻訳する手段、及び、該第2の翻訳資源を利用して該
    文書の該第2の部分を翻訳する手段からなる、ことを特
    徴とする文書翻訳システム。
  15. 【請求項15】 請求項13記載の文書翻訳システムに
    おいて、該解析手段は該文書に含まれている構造情報を
    解析する手段からなる、ことを特徴とする文書翻訳シス
    テム。
  16. 【請求項16】 請求項13記載の文書翻訳システムに
    おいて、該解析手段は該文書に含まれているタグを解析
    する手段からなる、ことを特徴とする文書翻訳システ
    ム。
  17. 【請求項17】 請求項16記載の文書翻訳システムに
    おいて、該解析手段は該文書に含まれている標準一般化
    マークアップ言語タグを解析する手段からなる、ことを
    特徴とする文書翻訳システム。
  18. 【請求項18】 請求項13記載の文書翻訳システムに
    おいて、該翻訳資源選択手段は該文書を翻訳するときに
    利用する辞書情報を選択する手段からなる、ことを特徴
    とする文書翻訳システム。
  19. 【請求項19】 請求項13記載の文書翻訳システムに
    おいて、該翻訳資源選択手段は該文書を翻訳するときに
    利用する規則情報を選択する手段からなる、ことを特徴
    とする文書翻訳システム。
  20. 【請求項20】 請求項13記載の文書翻訳システムに
    おいて、該翻訳資源選択手段は該文書を翻訳するときに
    利用する辞書情報及び規則情報を選択する手段からな
    る、ことを特徴とする文書翻訳システム。
  21. 【請求項21】 請求項13記載の文書翻訳システムに
    おいて、該選択手段は該文書を翻訳するときに利用する
    翻訳資源の場所を定義するデータ構造を選択する手段か
    らなる、ことを特徴とする文書翻訳システム。
  22. 【請求項22】 請求項13記載の文書翻訳システムに
    おいて、該解析手段は翻訳に利用される翻訳資源の場所
    を定義するデータ構造を指示するキーを含む解析結果を
    生成し、該翻訳資源選択手段は該文書を翻訳するときに
    利用する翻訳資源の場所を定義する該キーを含むデータ
    構造を選択する手段からなる、ことを特徴とする文書翻
    訳システム。
  23. 【請求項23】 該第1の言語の該文書の部分と該第2
    の言語に翻訳された該文書の対応部分を同時に表示する
    手段をさらに有する、ことを特徴とする請求項13記載
    の文書翻訳システム。
  24. 【請求項24】 該第2の言語に翻訳された該文書の部
    分を変更する手段をさらに有する、ことを特徴とする請
    求項23記載の文書翻訳システム。
  25. 【請求項25】 文書に含まれている情報を解析し解析
    結果を生成する解析手段、 該解析結果に従って該文書を翻訳するときに利用する翻
    訳資源を選択する翻訳資源選択手段、及び該選択された
    翻訳資源を利用して該文書を第1の言語から第2の言語
    へ翻訳する翻訳手段としてコンピュータを機能させるた
    めのプログラムを記録した機械読み取り可能媒体。
  26. 【請求項26】 請求項25記載の機械読み取り可能媒
    体において、該翻訳資源選択手段は文書の第1の部分に
    は第1の翻訳資源を選択し、かつ、該文書の第2の部分
    には第2の翻訳資源を選択する手段からなり、該翻訳手
    段は、該第1の翻訳資源を利用して該文書の該第1の部
    分を翻訳する手段、及び、該第2の翻訳資源を利用して
    該文書の該第2の部分を翻訳する手段からなる、ことを
    特徴とする機械読み取り可能媒体。
  27. 【請求項27】 請求項25記載の機械読み取り可能媒
    体において、該解析手段は該文書に含まれている構造情
    報を解析する手段からなる、ことを特徴とする機械読み
    取り可能媒体。
  28. 【請求項28】 請求項25記載の機械読み取り可能媒
    体において、該解析手段は該文書に含まれているタグを
    解析する手段からなる、ことを特徴とする機械読み取り
    可能媒体。
  29. 【請求項29】 請求項28記載の機械読み取り可能媒
    体において、該解析手段は該文書に含まれている標準一
    般化マークアップ言語タグを解析する手段からなる、こ
    とを特徴とする機械読み取り可能媒体。
JP13648397A 1996-05-28 1997-05-27 文書翻訳装置及び機械読み取り可能媒体 Expired - Lifetime JP3905179B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/654,207 US5848386A (en) 1996-05-28 1996-05-28 Method and system for translating documents using different translation resources for different portions of the documents
US08/654207 1996-05-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004060677A Division JP2004265423A (ja) 1996-05-28 2004-03-04 文書翻訳方法

Publications (2)

Publication Number Publication Date
JPH1083398A true JPH1083398A (ja) 1998-03-31
JP3905179B2 JP3905179B2 (ja) 2007-04-18

Family

ID=24623898

Family Applications (2)

Application Number Title Priority Date Filing Date
JP13648397A Expired - Lifetime JP3905179B2 (ja) 1996-05-28 1997-05-27 文書翻訳装置及び機械読み取り可能媒体
JP2004060677A Pending JP2004265423A (ja) 1996-05-28 2004-03-04 文書翻訳方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2004060677A Pending JP2004265423A (ja) 1996-05-28 2004-03-04 文書翻訳方法

Country Status (3)

Country Link
US (2) US5848386A (ja)
JP (2) JP3905179B2 (ja)
DE (1) DE19709968C2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120863B1 (en) 1999-11-15 2006-10-10 International Business Machines Corporation Method, system, and program for interfacing with elements in a document

Families Citing this family (338)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020004812A1 (en) * 1997-06-26 2002-01-10 Tetsuro Motoyama Method and system for diagnosis and control of machines using connectionless modes having delivery monitoring and an alternate communication mode
US7131070B1 (en) 1999-05-13 2006-10-31 Ricoh Company, Ltd. Application unit monitoring and reporting system and method
US5819110A (en) * 1995-06-05 1998-10-06 Ricoh Company, Ltd. System for determining whether connection or connectionless modes of communication should be used to transmit information between devices in accordance with priorities of events
US5818603A (en) 1996-03-29 1998-10-06 Ricoh Company, Ltd. Method and system for controlling and communicating with machines using multiple communication formats
US6044205A (en) * 1996-02-29 2000-03-28 Intermind Corporation Communications system for transferring information between memories according to processes transferred with the information
US6700958B2 (en) * 1995-04-10 2004-03-02 Starguide Digital Networks, Inc. Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth
US7185080B1 (en) 1995-06-05 2007-02-27 Ricoh Company, Ltd. Method and system for diagnosis and control of machines using connection and connectionless modes of communication
US6049551A (en) * 1995-08-16 2000-04-11 Starguide Digital Networks, Inc. Method and apparatus for dynamic allocation of transmission bandwidth resources and for transmission of multiple audio signals with a video signal
WO1997009801A1 (en) * 1995-09-01 1997-03-13 Starguide Digital Networks, Inc. Audio file distribution and production system
US6073143A (en) * 1995-10-20 2000-06-06 Sanyo Electric Co., Ltd. Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request
US6546406B1 (en) * 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
BR9712983A (pt) * 1996-10-09 2002-01-15 Starguide Digital Networks Sistema de produção e exibição de informação agregada
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
IL121071A0 (en) * 1997-03-27 1997-11-20 El Mar Software Ltd Automatic conversion server
IL121457A (en) * 1997-08-03 2004-06-01 Guru Internat Inc Computerized dictionary and thesaurus applications
US6154754A (en) * 1997-09-25 2000-11-28 Siemens Corporate Research, Inc. Automatic synthesis of semantic information from multimedia documents
US5960080A (en) * 1997-11-07 1999-09-28 Justsystem Pittsburgh Research Center Method for transforming message containing sensitive information
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6321244B1 (en) * 1997-12-04 2001-11-20 Siemens Corporate Research, Inc. Style specifications for systematically creating card-based hypermedia manuals
JPH11175527A (ja) * 1997-12-15 1999-07-02 Fujitsu Ltd 出力制御装置及び出力制御方法
US6009436A (en) * 1997-12-23 1999-12-28 Ricoh Company, Ltd. Method and apparatus for mapping structured information to different structured information
US10541974B2 (en) * 1998-02-23 2020-01-21 Transperfect Global, Inc. Intercepting web server requests and localizing content
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
US7194757B1 (en) 1998-03-06 2007-03-20 Starguide Digital Network, Inc. Method and apparatus for push and pull distribution of multimedia
US8284774B2 (en) 1998-04-03 2012-10-09 Megawave Audio Llc Ethernet digital storage (EDS) card and satellite transmission system
US6160797A (en) 1998-04-03 2000-12-12 Starguide Digital Networks, Inc. Satellite receiver/router, system, and method of use
US7191393B1 (en) * 1998-09-25 2007-03-13 International Business Machines Corporation Interface for providing different-language versions of markup-language resources
US7281203B2 (en) * 1998-09-29 2007-10-09 Netscape Communications Corporation Selecting a DTD for transforming malformed layout expressions into wellformed ones
US6336214B1 (en) * 1998-11-10 2002-01-01 International Business Machines Corporation System and method for automatically generating browsable language grammars
US7376728B1 (en) 2000-07-25 2008-05-20 Ricoh Company, Ltd. Method and system for monitoring, collecting information, diagnosing and servicing a remote system
US6964011B1 (en) * 1998-11-26 2005-11-08 Canon Kabushiki Kaisha Document type definition generating method and apparatus, and storage medium for storing program
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
US6480860B1 (en) * 1999-02-11 2002-11-12 International Business Machines Corporation Tagged markup language interface with document type definition to access data in object oriented database
US7287219B1 (en) 1999-03-11 2007-10-23 Abode Systems Incorporated Method of constructing a document type definition from a set of structured electronic documents
WO2000057320A2 (en) * 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
US20020105955A1 (en) * 1999-04-03 2002-08-08 Roberts Roswell R. Ethernet digital storage (EDS) card and satellite transmission system including faxing capability
US6986101B2 (en) * 1999-05-06 2006-01-10 International Business Machines Corporation Method and apparatus for converting programs and source code files written in a programming language to equivalent markup language files
US6490548B1 (en) 1999-05-14 2002-12-03 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use
WO2000077609A1 (en) 1999-06-14 2000-12-21 The Thomson Corporation System for converting data to a markup language
US6901361B1 (en) * 1999-07-09 2005-05-31 Digital Esperanto, Inc. Computerized translator of languages utilizing indexed databases of corresponding information elements
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
US7533344B1 (en) 1999-09-10 2009-05-12 Ricoh Company, Ltd. Application unit monitoring and reporting system and method
US6598015B1 (en) * 1999-09-10 2003-07-22 Rws Group, Llc Context based computer-assisted language translation
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US6662225B1 (en) 1999-11-16 2003-12-09 Ricoh Company, Ltd. Remote system usage monitoring with flexible packaging of data
US7743133B1 (en) 1999-11-16 2010-06-22 Ricoh Company, Ltd. Remote system usage monitoring with flexible encoding and decoding objects
US6948175B1 (en) 1999-11-16 2005-09-20 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library
US7054952B1 (en) * 1999-12-09 2006-05-30 International Business Machines Corp. Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support
JP2001195115A (ja) 2000-01-06 2001-07-19 Canon Inc 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
JP2001256333A (ja) * 2000-01-06 2001-09-21 Canon Inc 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体
JP2001195462A (ja) * 2000-01-06 2001-07-19 Canon Inc 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム
JP2001195463A (ja) * 2000-01-06 2001-07-19 Canon Inc 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
US6915342B1 (en) 2000-02-04 2005-07-05 Ricoh Company Limited Method and system for maintaining the business office appliance through log files
US6915337B1 (en) 2000-03-07 2005-07-05 Ricoh Co. Ltd. Method and system for updating the device driver of a business office appliance
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
EP1139231A1 (en) * 2000-03-31 2001-10-04 Fujitsu Limited Document processing apparatus and method
US6785711B1 (en) 2000-04-04 2004-08-31 Ricoh Co., Ltd. Method and system for displaying various messages while performing tasks or while idling
JP4028154B2 (ja) 2000-04-07 2007-12-26 富士通株式会社 磁気記録媒体及び磁気記憶装置
US7287085B1 (en) * 2000-05-17 2007-10-23 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent formatter
US7120674B1 (en) 2000-05-17 2006-10-10 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent protocol processor
US6988141B1 (en) 2000-05-17 2006-01-17 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with restriction on protocol
FR2809509B1 (fr) * 2000-05-26 2003-09-12 Bull Sa Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique
US6519557B1 (en) * 2000-06-06 2003-02-11 International Business Machines Corporation Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity
US7130885B2 (en) * 2000-09-05 2006-10-31 Zaplet, Inc. Methods and apparatus providing electronic messages that are linked and aggregated
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US6857016B1 (en) 2000-09-25 2005-02-15 Ricoh Company Limited Method and system of data collection and mapping from a remote position reporting device
WO2002029622A1 (en) * 2000-10-02 2002-04-11 Vialanguage, Inc. Machine editing system incorporating dynamic rules database
US6782384B2 (en) 2000-10-04 2004-08-24 Idiom Merger Sub, Inc. Method of and system for splitting and/or merging content to facilitate content processing
WO2002029621A1 (en) * 2000-10-04 2002-04-11 Idiom Technologies, Incorporated Method of and system for splitting and/or merging content to facilitate content processing
US9311499B2 (en) * 2000-11-13 2016-04-12 Ron M. Redlich Data security system and with territorial, geographic and triggering event protocol
US7669051B2 (en) * 2000-11-13 2010-02-23 DigitalDoors, Inc. Data security system and method with multiple independent levels of security
WO2002046878A2 (en) * 2000-12-06 2002-06-13 American Express Travel Related Services Company, Inc. Layout generator system and method
DE50111786D1 (de) * 2000-12-15 2007-02-15 Siemens Ag Verschlüsselung von Steuerungsprogrammen
US20020099745A1 (en) * 2001-01-23 2002-07-25 Neo-Core, L.L.C. Method and system for storing a flattened structured data document
US20020103632A1 (en) * 2001-01-31 2002-08-01 International Business Machines Corporation Method, program, and tool for updating the national language versions of documents
US7533333B2 (en) 2001-02-14 2009-05-12 Ricoh Co., Ltd. Object-oriented method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols
US7392307B2 (en) * 2001-02-14 2008-06-24 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using a shared resource
US7047293B2 (en) * 2001-02-14 2006-05-16 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with delegating protocol processor
US7171670B2 (en) 2001-02-14 2007-01-30 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with verification of formats and protocols
AUPR329501A0 (en) 2001-02-22 2001-03-22 Worldlingo, Inc Translation information segment
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
JP3475186B2 (ja) * 2001-03-21 2003-12-08 株式会社ニチベイ ブラインド、ブラインド用スラット、その製造方法及びその成形加工機
US20020147749A1 (en) * 2001-04-06 2002-10-10 Ortiz C. Enrique Mobile presentation system
WO2002082289A1 (en) * 2001-04-06 2002-10-17 Agea Corporation Mobile presentation system
US20030023584A1 (en) * 2001-04-27 2003-01-30 Brandin Christopher Lockton Universal information base system
JP2003022125A (ja) * 2001-05-02 2003-01-24 Ricoh Co Ltd 機器の定期診断装置及び機器の定期診断方法ならびに定期診断される顧客に配置された機器
US6993474B2 (en) 2001-05-17 2006-01-31 Curry David G Interactive conversational speech communicator method and system
US20030004703A1 (en) * 2001-06-28 2003-01-02 Arvind Prabhakar Method and system for localizing a markup language document
US7016963B1 (en) 2001-06-29 2006-03-21 Glow Designs, Llc Content management and transformation system for digital content
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US7100108B2 (en) * 2001-08-31 2006-08-29 International Business Machines Corporation Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes
US7302469B2 (en) * 2001-09-17 2007-11-27 Ricoh Company, Ltd. System, method, and computer program product for transferring remote device support data to a monitor using e-mail
US7536450B2 (en) * 2001-09-17 2009-05-19 Ricoh Company, Ltd. System, method, and computer program product for sending remote device configuration information to a monitor using e-mail
US7490146B1 (en) 2001-09-17 2009-02-10 Ricoh Company, Ltd. System, method, and computer program product for collecting and sending various types of information to a monitor using e-mail
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP3452558B2 (ja) * 2001-09-25 2003-09-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
US8438004B2 (en) * 2001-10-03 2013-05-07 Hewlett-Packard Development Company L.P. System and methods for language translation printing
US6839717B1 (en) 2001-10-15 2005-01-04 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, extracting data from different types of email messages, and storing data according to data structures determined by the message types
US6925571B1 (en) 2001-10-15 2005-08-02 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, using POP3 and decryption using virtual function
US7343407B2 (en) * 2001-10-15 2008-03-11 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, including handling Email messages having message types specified within the Email message
US20030101046A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
US20030105621A1 (en) * 2001-12-04 2003-06-05 Philippe Mercier Method for computer-assisted translation
US20030131316A1 (en) * 2002-01-07 2003-07-10 Kyle Brown Internationalizing SGML documents
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US20030212962A1 (en) * 2002-05-08 2003-11-13 Amikai, Inc. Thin client-server architecture for automated machine translation
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
US7185271B2 (en) * 2002-08-20 2007-02-27 Hewlett-Packard Development Company, L.P. Methods and systems for implementing auto-complete in a web page
US7113960B2 (en) * 2002-08-22 2006-09-26 International Business Machines Corporation Search on and search for functions in applications with varying data types
US20040078762A1 (en) * 2002-10-17 2004-04-22 Taiwan Semiconductor Manufacturing Co., Ltd. Multi-lingual information server apparatus and method for operation thereof
US20060277332A1 (en) * 2002-12-18 2006-12-07 Yukihisa Yamashina Translation support system and program thereof
US7428699B1 (en) 2003-01-15 2008-09-23 Adobe Systems Incorporated Configurable representation of structured data
FR2850473A1 (fr) * 2003-01-28 2004-07-30 France Telecom Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
US8170863B2 (en) * 2003-04-01 2012-05-01 International Business Machines Corporation System, method and program product for portlet-based translation of web content
US20040230898A1 (en) * 2003-05-13 2004-11-18 International Business Machines Corporation Identifying topics in structured documents for machine translation
US7558841B2 (en) * 2003-05-14 2009-07-07 Microsoft Corporation Method, system, and computer-readable medium for communicating results to a data query in a computer network
JP3765798B2 (ja) * 2003-05-27 2006-04-12 沖電気工業株式会社 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム
US20100070265A1 (en) * 2003-05-28 2010-03-18 Nelson David D Apparatus, system, and method for multilingual regulation management
US20040243391A1 (en) * 2003-05-28 2004-12-02 Nelson David D. Apparatus, system, and method for multilingual regulation management
JP2004362249A (ja) * 2003-06-04 2004-12-24 Advanced Telecommunication Research Institute International 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7657832B1 (en) 2003-09-18 2010-02-02 Adobe Systems Incorporated Correcting validation errors in structured documents
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7853473B2 (en) 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
DE202005022113U1 (de) 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
WO2006081428A2 (en) 2005-01-27 2006-08-03 Symyx Technologies, Inc. Parser for generating structure data
JP4311365B2 (ja) * 2005-03-25 2009-08-12 富士ゼロックス株式会社 文書処理装置およびプログラム
JP2006276915A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳処理方法、文書翻訳装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US9245032B2 (en) * 2005-06-02 2016-01-26 Oracle International Corporation Globalization framework for providing locale-specific services using client-side scripting languages
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US20070010989A1 (en) * 2005-07-07 2007-01-11 International Business Machines Corporation Decoding procedure for statistical machine translation
US20070043553A1 (en) * 2005-08-16 2007-02-22 Microsoft Corporation Machine translation models incorporating filtered training data
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070067154A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Language translation system
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US9411781B2 (en) 2006-01-18 2016-08-09 Adobe Systems Incorporated Rule-based structural expression of text and formatting attributes in documents
KR101431194B1 (ko) 2006-02-17 2014-08-18 구글 인코포레이티드 분산형 모델의 인코딩 및 적응성 및 확장성 액세싱
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
WO2007124109A2 (en) * 2006-04-21 2007-11-01 Scomm, Inc. Interactive conversational speech communicator method and system
US7873641B2 (en) * 2006-07-14 2011-01-18 Bea Systems, Inc. Using tags in an enterprise search system
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) * 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
JP2008165415A (ja) * 2006-12-27 2008-07-17 Oki Electric Ind Co Ltd 文書処理装置、文書処理方法およびプログラム
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8326598B1 (en) 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US20080288239A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Localization and internationalization of document resources
US10296588B2 (en) * 2007-05-31 2019-05-21 Red Hat, Inc. Build of material production system
US9361294B2 (en) * 2007-05-31 2016-06-07 Red Hat, Inc. Publishing tool for translating documents
US8205151B2 (en) * 2007-05-31 2012-06-19 Red Hat, Inc. Syndication of documents in increments
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20080313291A1 (en) * 2007-06-12 2008-12-18 Smartmicros Usa, Llc Method and apparatus for encoding data
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
JP5105513B2 (ja) * 2007-07-20 2012-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 処理対象として適切なテキストを選択する技術
US9418061B2 (en) * 2007-12-14 2016-08-16 International Business Machines Corporation Prioritized incremental asynchronous machine translation of structured documents
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US20100292983A1 (en) * 2008-01-10 2010-11-18 Takashi Onishi Machine translation apparatus and machine translation method
US8849665B2 (en) * 2008-01-30 2014-09-30 At&T Intellectual Property I, L.P. System and method of providing machine translation from a source language to a target language
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
DE102009009123A1 (de) 2009-02-16 2010-08-19 Marius Gevers Verfahren und ein System zum Übersetzen eines Textes aus einer ersten Sprache in zumindest eine weitere Sprache sowie ein Computer-Programm-Produkt
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
JP4935869B2 (ja) * 2009-08-07 2012-05-23 カシオ計算機株式会社 電子機器及びプログラム
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US8508787B2 (en) * 2009-11-23 2013-08-13 Xerox Corporation System and method for automatic translation of documents scanned by multifunctional printer machines
AU2010336005A1 (en) * 2009-12-22 2012-08-09 Health Ewords Pty Ltd Method and system for classification of clinical information
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8280954B2 (en) 2010-03-25 2012-10-02 Scomm, Inc. Method and system for providing live real-time communication via text between mobile user devices
US9767095B2 (en) 2010-05-21 2017-09-19 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US9002696B2 (en) 2010-11-30 2015-04-07 International Business Machines Corporation Data security system for natural language translation
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8948892B2 (en) 2011-03-23 2015-02-03 Audible, Inc. Managing playback of synchronized content
US9706247B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Synchronized digital content samples
US9760920B2 (en) 2011-03-23 2017-09-12 Audible, Inc. Synchronizing digital content
US8862255B2 (en) 2011-03-23 2014-10-14 Audible, Inc. Managing playback of synchronized content
US8855797B2 (en) 2011-03-23 2014-10-07 Audible, Inc. Managing playback of synchronized content
US9734153B2 (en) 2011-03-23 2017-08-15 Audible, Inc. Managing related digital content
US9703781B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Managing related digital content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8538742B2 (en) * 2011-05-20 2013-09-17 Google Inc. Feed translation for a social network
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US9075760B2 (en) 2012-05-07 2015-07-07 Audible, Inc. Narration settings distribution for content customization
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9317500B2 (en) * 2012-05-30 2016-04-19 Audible, Inc. Synchronizing translated digital content
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9141257B1 (en) 2012-06-18 2015-09-22 Audible, Inc. Selecting and conveying supplemental content
US8972265B1 (en) 2012-06-18 2015-03-03 Audible, Inc. Multiple voices in audio content
US9536439B1 (en) 2012-06-27 2017-01-03 Audible, Inc. Conveying questions with content
US9679608B2 (en) 2012-06-28 2017-06-13 Audible, Inc. Pacing content
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10109278B2 (en) 2012-08-02 2018-10-23 Audible, Inc. Aligning body matter across content formats
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9367196B1 (en) 2012-09-26 2016-06-14 Audible, Inc. Conveying branched content
US9632647B1 (en) 2012-10-09 2017-04-25 Audible, Inc. Selecting presentation positions in dynamic content
US9223830B1 (en) 2012-10-26 2015-12-29 Audible, Inc. Content presentation analysis
US9619463B2 (en) 2012-11-14 2017-04-11 International Business Machines Corporation Document decomposition into parts based upon translation complexity for translation assignment and execution
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9280906B2 (en) 2013-02-04 2016-03-08 Audible. Inc. Prompting a user for input during a synchronous presentation of audio content and textual content
US9472113B1 (en) 2013-02-05 2016-10-18 Audible, Inc. Synchronizing playback of digital content with physical content
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9317486B1 (en) 2013-06-07 2016-04-19 Audible, Inc. Synchronizing playback of digital content with captured physical content
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9489360B2 (en) 2013-09-05 2016-11-08 Audible, Inc. Identifying extra material in companion content
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9514377B2 (en) * 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
US9514376B2 (en) 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
CN104933041B (zh) * 2015-06-25 2017-09-01 武汉传神信息技术有限公司 一种利于翻译工作的文件抽取和还原方法
US11803918B2 (en) 2015-07-07 2023-10-31 Oracle International Corporation System and method for identifying experts on arbitrary topics in an enterprise social network
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2017174300A (ja) * 2016-03-25 2017-09-28 富士ゼロックス株式会社 情報処理装置、情報処理方法およびプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10628522B2 (en) * 2016-06-27 2020-04-21 International Business Machines Corporation Creating rules and dictionaries in a cyclical pattern matching process
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US10540452B1 (en) * 2018-06-21 2020-01-21 Amazon Technologies, Inc. Automated translation of applications
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57150071A (en) * 1981-03-12 1982-09-16 Sharp Corp Electronic type interpreter
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
US5029114A (en) * 1986-07-22 1991-07-02 Kabushiki Kaisha Toshiba Method of displaying reduced-layout and apparatus for embodying the method
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
GB2199170A (en) * 1986-11-28 1988-06-29 Sharp Kk Translation apparatus
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
JPS63223962A (ja) 1987-03-13 1988-09-19 Hitachi Ltd 翻訳装置
US4980289A (en) * 1987-04-27 1990-12-25 Wisconsin Alumni Research Foundation Promoter deficient retroviral vector
JPH01279368A (ja) * 1988-04-30 1989-11-09 Sharp Corp キャラクタデータの転送方式
EP0366142B1 (en) * 1988-10-28 1997-08-06 Kabushiki Kaisha Toshiba Method and apparatus of machine translation
JPH02254564A (ja) * 1989-03-29 1990-10-15 Ricoh Co Ltd 翻訳用辞書編集装置
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
JP3266246B2 (ja) * 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5418717A (en) * 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5466072A (en) * 1992-01-17 1995-11-14 Stenograph Corporation Method and apparatus for recording and translating shorthand notes
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
JP2745370B2 (ja) * 1993-02-23 1998-04-28 日本アイ・ビー・エム株式会社 機械翻訳方法及び機械翻訳装置
JP3408291B2 (ja) * 1993-09-20 2003-05-19 株式会社東芝 辞書作成支援装置
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
US5659765A (en) * 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
JPH08101837A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
US5983169A (en) * 1995-11-13 1999-11-09 Japan Science And Technology Corporation Method for automated translation of conjunctive phrases in natural languages
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120863B1 (en) 1999-11-15 2006-10-10 International Business Machines Corporation Method, system, and program for interfacing with elements in a document

Also Published As

Publication number Publication date
JP2004265423A (ja) 2004-09-24
US5848386A (en) 1998-12-08
DE19709968A1 (de) 1997-12-04
DE19709968C2 (de) 2003-04-30
US6208956B1 (en) 2001-03-27
JP3905179B2 (ja) 2007-04-18

Similar Documents

Publication Publication Date Title
JP3905179B2 (ja) 文書翻訳装置及び機械読み取り可能媒体
AU696867B2 (en) Integrated authoring and translation system
US4821230A (en) Machine translation system
JP3220560B2 (ja) 機械翻訳装置
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5111398A (en) Processing natural language text using autonomous punctuational structure
Alexa et al. A review of software for text analysis
GB2295470A (en) Machine translation system
JPS62271064A (ja) 機械翻訳システム
Kugler et al. Translator’s workbench: Tools and terminology for translation and text processing
Abolhassani et al. Information extraction and automatic markup for XML documents
Hirakawa et al. EJ/JE Machine Translation System ASTRANSAC—Extensions toward Personalization
JPH0332106B2 (ja)
JP2626722B2 (ja) 日本語生成装置
JPH052605A (ja) 機械翻訳方式
Taylor et al. Integrating natural language understanding with document structure analysis
JP2521435B2 (ja) 日本語生成装置
Bernth et al. Terminology extraction for global content management
JP3233800B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP3316884B2 (ja) 言語翻訳装置
Fresno-Fernández et al. eXitor: A Tool for the Assisted Edition of XML Documents.
JPH04130577A (ja) 自然言語処理装置
Jones et al. Describing the Structure of Documents
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040405

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040615

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140119

Year of fee payment: 7

EXPY Cancellation because of completion of term