JP2004265423A - 文書翻訳方法 - Google Patents
文書翻訳方法 Download PDFInfo
- Publication number
- JP2004265423A JP2004265423A JP2004060677A JP2004060677A JP2004265423A JP 2004265423 A JP2004265423 A JP 2004265423A JP 2004060677 A JP2004060677 A JP 2004060677A JP 2004060677 A JP2004060677 A JP 2004060677A JP 2004265423 A JP2004265423 A JP 2004265423A
- Authority
- JP
- Japan
- Prior art keywords
- document
- translation
- translating
- language
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
【課題】文書中に使用できる語句を極端に制限することなく、より精度のよい機械翻訳を実現する。
【解決手段】翻訳対象の文書が予め定義された文書タイプ定義のいずれかに属するか判断し、特定された文書タイプ定義ごとに適合する辞書を選択して翻訳を実施する。すなわち、辞書の内部に各文書タイプ定義ごとの文書構造に適合した部分を作成し、領域ごとに適合する辞書が選択されたときに、当該領域内の文書が特定書式の文書構造と一致している部分があるときは、辞書内部の特定分野の文書構造に適合した部分を使って翻訳する。
【選択図】図8
【解決手段】翻訳対象の文書が予め定義された文書タイプ定義のいずれかに属するか判断し、特定された文書タイプ定義ごとに適合する辞書を選択して翻訳を実施する。すなわち、辞書の内部に各文書タイプ定義ごとの文書構造に適合した部分を作成し、領域ごとに適合する辞書が選択されたときに、当該領域内の文書が特定書式の文書構造と一致している部分があるときは、辞書内部の特定分野の文書構造に適合した部分を使って翻訳する。
【選択図】図8
Description
本発明は、辞書や規則データベースのような資源を利用する文書の機械翻訳に関する。
ある人間言語から別の人間言語へ文書を翻訳する機械翻訳の概念は、広範に研究されてきた。1940年代はじめの機械翻訳の揺籃期に、ロックフェラー財団のWarren Weaverは、翻訳の概念を一対一置換の方法によるデコーディングと類似すると考えた。しかし、これはあまりに単純な類推で、翻訳システムの開発にあたっては人間の言語の微妙な点が考慮されねばならないことが、まもなく分かった。例えば、特定のフレーズは、その個々の語からは分からないような意味を持つことがあり、また、文脈によって意味が異なる語もあるので、文脈中で語の意味を決定しなければならない。
文書機械翻訳を改良する一つの方法は、翻訳対象のソース文書を、厳格な規則を課した語句によって作成する方法である。そうすれば、完璧な翻訳を得られるかも知れないが、著者が言い得ることが極端に制限されるという犠牲をともなう。翻訳しようとするソース文書に使用し得る言語を制限するという基本的な考え方は、”缶詰の”表現用例集をユーザに提供する、旅行者に多用される翻訳表現集を利用するのに似ている。この方法は、その”缶詰”表現集にユーザの言いたいことが含まれているならば問題はないが、含まれていない方が多い。
したがって、本発明の主要な目的は、文書タイプ定義ごとに適合する辞書を選択して翻訳する文書翻訳方法を提供することにある。具体的には、文書の異なる部分に対し異なる辞書や規則データベース等の翻訳資源を利用することにより、より正確な訳文を作成するとともに翻訳後編集を最小限にする機械翻訳システムを提供することである。
本発明による文書翻訳方法は、翻訳対象の文書が予め定義された文書タイプ定義のいずれかに属するか判断し、特定された文書タイプ定義ごとに適合する辞書を選択して翻訳を実施するにあたり、辞書の内部に各文書タイプ定義ごとの文書構造に適合した部分を作成し、領域ごとに適合する辞書が選択されたときに、当該領域内の文書が特定書式の文書構造と一致している部分があるときは、辞書内部の特定分野の文書構造に適合した部分を使って翻訳する。
以上、本発明によれば、翻訳しようとする文書又はその部分に応じて適切な辞書、規則等の翻訳資源を選択して翻訳処理に利用することにより、翻訳対象の文書に使用できる語句を極端に制限することなく、従来よりも正確な機械翻訳を実現でき、したがって必要な翻訳後編集も減らすことができる。
以下に詳述する本発明の文書翻訳システムの概略を述べれば、翻訳プロセスにおいて、文書の異なる部分に対し、異なる翻訳資源もしくは翻訳情報(辞書や翻訳規則等)を利用する。文書の部分部分は、タグを使って指示される。これらタグは、好ましくは、標準一般化マークアップ言語(SGML)に準拠して生成されるタグである。
翻訳を実行できるようにするには、それに先だって、受入れ可能なタグと受入れ可能な文書の構造を定義する文書タイプ定義(DTD)が生成されなければならない。このDTDは、受入れ可能な文書の構造と階層を定義する。例えば、スキャナ等の装置を記述する文書は、概要、ハードウエアの説明、使用ソフトウエアの説明、及び使用可能なアクセサリもしくはオプションといった主要部分を有するであろう。概要部分には、装置の名称や説明、装置を表す図面、装置の機能の一覧表が含まれているであろう。
文書タイプ定義が作成された後、翻訳プロセスに使用される辞書及び規則データベースが定義されなければならない。文書の様々な部分の翻訳に利用される辞書及び規則を生成する一方法は、既に翻訳された文書を入力することである。こうすることにより、システムは、その文書を翻訳して、その適切な既知の訳文が得られるように、辞書及び規則を自動構築することができる。既知文書を翻訳するとともに、又はそれに代えて、ユーザが文書を手作業で翻訳してもよく、辞書及び規則はユーザの入力に基づいて構築される。さらに、自動と手作業の翻訳を組み合わせて行ってもよく、ユーザは自動翻訳結果を修正することができるため、最終的な訳文はより正確なものになる。さらに別の方法では、規則及び辞書は手作業で作られる。
本発明の好ましい動作では、文書の異なる部分毎に別々のデータ構造を利用する。このデータ構造は、文書の対応した部分又は他の部分で利用可能な辞書及び規則の名称及び位置等の情報を指示する情報を格納する。このデータ構造を辞書及び規則の管理に用いると、様々な辞書及び規則を文書構造の階層と同じような階層に編成することができる。
翻訳システムの開発とトレーニングが十分になされたならば、翻訳プロセスは自動化が可能になり、文書の特定の部分に対し対応した特定の辞書情報及び翻訳規則を利用する。文書の異なる部分に対し、それぞれ特定の辞書情報及び規則を利用することにより、翻訳はより正確になりソース文書と翻訳文書との間が一対一対応に近づき、”缶詰”表現しか利用できない翻訳システムを利用したときに生じる負担や困難を伴わない。
以下、添付図面を参照し、本発明の実施例について説明する。なお、複数の図面を通し同様の参照数字は同一部分又は対応部分を示す。
図1に、翻訳の対象となる典型的文書の構造が示されている。図1に示した文書の構造は、コピア、ファクシミリ装置、プリンタ、スキャナ等々の装置に利用できる。文書30は4つの主要部分、すなわち文書中に記述された装置に関する概要部分32、該装置に使用されるハードウェアに関する説明部分40、該装置に使用されるソフトウエアに関する説明部分42、及び、該装置のアクセサリ又はオプションの説明部分44からなる。これらの各主要部分は、必要に応じ、文書をより細かな部分に分割した小部分を含んでもよい。例えば、概要部分32は、装置の短い説明を内容とする装置部分34、装置のイラストを含む図36及び装置の機能一覧表38からなる。
本発明は図に含まれている情報は翻訳しない。ただし、翻訳文書において、翻訳された言語にとってよりふさわしい画像を含む別の図に置き換えることは可能である。例えば、米国で使用予定の自動車の図は米国で用いるべき名称を表すが、日本で使用される対応図は日本で用いるべき名称を表す。また、別言語の文章を含む図も使用できる。
図1に示した様々な構造部分を持つ文書がどのように翻訳されるか説明する前に、翻訳対象のソース文書の一例を図2に関連して説明する。図2に、翻訳すべき文書の一部分の構造と内容が示されている。この文書はタグ(例えば、標準一般化マークアップ言語(SGML)に準拠して生成されるタグ)を用いてエンコードされているが、これは公知のエンコーディング法であり、国際標準ISO8879:1986「標準一般化マークアップ言語(SGML)」及び書籍“The SGML Handbook”(C.F.Goldfarb著,Clarendon Press発行,1990)に詳細に述べられている。しかしながら、本発明はSGMLタグしか使用できないわけではなく、翻訳システムにハイパーテキスト・マークアップ言語(HTML)等に準拠して生成されるタグのような他のフォーマット方法や、異なる翻訳資源を利用するために異なる構造部分を指示するエンコーディング方法又は文書マーキング方法を利用してもよい。書式を使う文書システムは、書式の各部分をタグ付けされた要素の同等物として処理させることにより、本発明を利用できる。SGMLによれば、タグは通常、より小さいことを表す不等号(<)で始まり、タグの名称が続き、より大きいことを表す不等号(>)で終わる。図2中の、より小さいことを表す不等号で始まり、より大きいことを表す不等号で終わる要素はそれぞれタグである。タグは、タグを説明するデータを伴うことがある。例えば、図2の第3行のタグ<LANG>は、文書が英語で書かれていることを表す語”English”が後に続いている。
タグは、その後に、もしタグを説明するデータがあればその後に、終了タグが続き、あるいは、明示の終了タグを持たず、次のタグの始まりによる暗黙的に終了する。タグの省略が許されるのは、DTDで定義された文書構造のシンタックスが多義的でなくタグ省略を許す場合だけである。終了タグは、より小さいことを表す不等号で始まり、スラッシュ(/)が続き、その後にタグの名称が続き、より大きいことを表す不等号で終わる(</...>)。タグの暗黙の終了は図2の全体に見られる。例えば第3行及び第4行では、タグ<LANG>の後に文書が英語で書かれていることを示すデータ”English”が続いている。この開始タグ<LANG>に対する明示の終了タグはなく、第4行は文書の発行元である会社の部署を示すために用いられる新たなタグ<DIVISION>で始まる。この<DIVISION>の出現が、タグ<LANG>が終了したことを暗黙的に示している。
図2の第1行は文書の!DOCTYPE記述で始まる。この!DOCTYPEは、翻訳対象の文書が予め定義された文書タイプ定義(DTD)のいずれに属しているかを宣言する。第1行中のOURDOCは、文書要素の包括的識別子である。引用符で囲まれた情報は、SGMLパーサに対し該DTDの場所を指示する。これは、文書タイプを指示するために使われる標準的なSGMLシンタックスである。図2の第2行は文書の始まりを示すタグであり、第3行は文書の言語が英語であることを示し、第4行は会社のXYZ部から出た文書であることを示す。本発明は、特定書式の文書を定期的に翻訳する必要がある国際的な会社にとって非常に有益である。必要ならば、文書は、その発行元の部署又は製品を出した部署を指示できるだけでなく、会社の識別情報を含むこともできる。
図2の第5行は、説明されている装置の種類がスキャナであることを示す。これは、文書の翻訳に利用される辞書及び翻訳規則データベースを、スキャナに関し使われる辞書及び翻訳規則に絞り込むのに役立つ。第6行は文書が製品仕様書であることを示し、第7行は文書のタイトルでもあるスキャナの名称又はモデル番号がRS2200−EFであることを示す。
第8行は、文書の概要部分すなわち図1の階層構造中に32として示された部分の始まりを示す。この概要部分は第9行の装置説明で始まり、この装置説明は”This scanner…”なる言い回しで始まるパラグラフ(<p>)である。第10行は、次に図が含まれていて、それが図1の構造中の図36に対応することを示す。次に、第11行は装置の機能が後に続くことを示し、第12行は機能が一覧表にされていることを示し、その後に、その一覧表の項目(<IT>)が第13行、第14行及び第15行に記載されている。文書はさらに続くであろうが、その詳細は重要ではないので、簡略化のため、及び、あまりに具体的な例を提示することによる読み手の混乱を避けるため省略する。
図3は、図2に示した文書の英語版を示す領域52Aと、その右側にある同文書の翻訳版の領域52Bとを含む画面表示50を示す。図3の左側を見ると、図2の文書が印刷されるかCRTやLCDディスプレイ等の電子的ディスプレイ上に生成される時に、タグがすべて表示されるわけでないことが分かる。領域52A内において、タイトルもしくは装置名が54Aで示され、見出し”Device Overview”56Aが続き、情報を記述するパラグラフ58Aがその後に続く。次に、領域60Aに図が表示され、その後に機能の一覧表62A,64A,66Aが続く。本発明の動作中、文書の原語書式と翻訳書式を並べて表示させることができ、これによりユーザは容易に翻訳文書を原文書とを比較し、必要に応じ変更することができる。
翻訳文書の領域52Bは、斜線でハッチングを施した矩形領域が入っているが、本発明の実際の動作中に原文書(52A)の実際の訳文が入るであろう。しかし、領域52Bには訳文が示されていない。訳文は本発明を理解するのに必要ではなく、また、例えば外国語の単語又は文字列を領域52Bに含めると混乱する恐れがあるためである。
すべてのタグ又はデータが本発明により翻訳されねばならない、というものではない。例えば、タイトル又はスキャナの名称は54Aによって示されているが、これは外国語のタイトルもしくは名称と同じであるかもしれない。見出し”Device Overview”56Aは、図2の第8行のタグ<OVERVIEW>を翻訳することにより得られる。見出し”Device Overview”は、そのタグの直接的訳文(direct translation)であり、タグ<OVERVIEW>にどんな見出しを用いるべきかを指示する文書タイプ定義に関連した辞書又はテーブルに格納しておくことができる。図2のタグ<LANG>のようにタグが表示されない時には、そのタグを翻訳する必要はない。ただし、望むなら翻訳してもよい。
図3は、同じ図が原文書領域52Aと翻訳文書領域52Bの両方に含まれることを示している。しかし、望むならば、ユーザによって又は自動的に指定された、翻訳後言語に対応した別の図が使われてもよい。領域58A,62A,64A,66Aに含まれている情報は、適切な辞書及び規則データベースを使って翻訳される。
本発明により実行される翻訳動作は主に英語、日本語、ドイツ語、フランス語、スペイン語、中国語、ロシア語その他の異なる人間言語間の相互翻訳に関するものである。しかし、本明細書で教示したことから、他の種類の言語又は情報に適用することも、例えば異なったコンピュータ言語間の翻訳に適用することも可能である。
図3の領域58Aに示される文章のような文章部分が翻訳される時に、語彙を収容した辞書と、文法及び言語規則を含む翻訳規則が利用される。翻訳プロセスで辞書と言語規則を利用するのは従来から行われていることである。従来の機械翻訳がどのように動作するかについての情報源が書籍”Machine Translation,An Introductry Guide”(D.Arnoldほか著、Blackwell Publishers発行,1994)に掲載されている。本書は、機械翻訳の優れた入門書であるとともに、従来の機械翻訳の動作について述べた様々な情報源を列挙している。本書とその引用資料に記載されたシステムにはない、本発明の優れた特徴としては、文書のどの部分又はどのタイプの文書を翻訳するかによって、特定の辞書もしくは辞書の特定の部分を利用し、及び/又は、特定の規則データベースもしくは規則データベースの特定の部分を利用することである。
図4は、本発明に利用できる典型的な辞書を示す。図4に、コピア辞書72、スキャナ辞書84、プリンタ辞書86及び一般英日語彙辞書88の4部分を有する英和/和英辞書70がある。コピア辞書72は、コピアについて記述した文書の翻訳時に利用される。さらに、その文書の翻訳しようとする部分がコピアのユーザマニュアルに関するものである時に、コピア辞書72の部分74が利用される。コピアの技術的説明の翻訳時には技術仕様部分76が利用される。この技術仕様部分76は、コピア記述文書のソフトウエア、ハードウェア、機械的特徴に関する辞書情報を格納した細目部78,80,82を含む。スキャナ辞書84及びプリンタ辞書86は、その細部は図示されていないが、コピア辞書72と同じように分割されるであろう。さらに、一般英日語彙辞書88は、他の辞書の一つに特有なものでない又は収容されていない一般的な語の翻訳に利用される。
辞書及び規則データベースは、最も高い階層レベルで様々な分野に分割されてもよい。例えば、コピア分野、スキャナ分野、プリンタ分野があってよい。翻訳される文書が、これら分野の一つに含まれる場合、その翻訳の実行に利用される辞書及び規則は対応分野より選ばれる。
辞書及びその細目辞書部に収容されている情報は、必要なら従来の方法を含め任意の所望の方法により記憶される。本発明の重要な特徴は、異なるタイプの文書の異なる部分に対し異なる辞書情報を使用することである。しかし、図4に示したものとは違う辞書構成を使用してもよい。例えば、異なった部分又は異なったタイプの文書に対し別々の辞書を使用してもよいが、異なったタイプの文書で一つの辞書を共有し、その同じ辞書の異なった部分を必要時に利用することも可能である。その異なった辞書又はその部分の選択は、どの辞書が用いられるべきか指示するポインタを使って行ってよい。さらに、辞書の生成時、修正時、又は利用時に、必要に応じ、ある辞書の情報を別の辞書にコピーしてもよい。
図5は、本発明の翻訳プロセスに利用される文法・言語規則データベース90の典型的構成を示す。この文法・言語規則データベース90には日本語文法・言語規則92が収容されている。この日本語文法・言語規則92は、会社の指針及び規則の翻訳に使われる文法・言語規則94と、ユーザーマニュアルの翻訳時に使用される文法・言語規則96を含んでいる。ユーザーマニュアルには、プリンタ用、スキャナ用、コピー用のものがあり、それぞれに固有の規則98,100,102がある。日本語文法・言語規則92は、技術文書の翻訳に利用される文法・言語規則104も含み、技術文書にはプリンタ用、スキャナ用及びプリンタ用のものがあり、それぞれ固有の規則106,108,110がある。日本語文法・言語規則データベース90は英語文法・言語規則120も含む。この英語文法・言語規則120も、会社の指針及び規則の翻訳のための規則122と、プリンタ、スキャナ、コピアのユーザーマニュアルの翻訳用の規則126,128,130からなるユーザーマニュアル翻訳用規則124と、プリンタ、スキャナ、コピアに関する技術文書の翻訳のための規則134,136,138からなる技術文書翻訳用規則132を含んでいる。
データベース90に格納される文法・言語規則は、従来の機械翻訳の文法・言語規則であるので、当業者はそのような規則の作成方法を知っているであろう。ただ、これらの規則は本発明に適合するように特別に作られており、文書の様々な部分の翻訳のための様々な部分又は様々な特殊規則を持っている。
図6は、辞書及び規則データベースを文書の様々な部分で容易に選択利用できるように、辞書及び規則データベースの場所及び階層構造に関する情報を格納する好ましい方法を示す。データ構造150A〜150Gはそれぞれ同じ構造であるので、データ構造150B〜150Gの詳細なフィールドは図示されていない。キー・フィールド152は当該データ構造の固有の識別子である。例えば、キーは単に番号でもよいが、名称でもよい。最高の階層レベルのデータ構造150Aについては、必ずしもキーを持たなくともよく、また、そのキーをヌルに設定してよい。図6に示すデータ構造の階層ツリーを容易にさかのぼることができるように、データ構造150Aは親データ構造を指すポインタ154を持つ。しかし、データ構造150Aは、最高の階層レベルにあるので親がないため、親データ構造を指すポインタ154はヌルに設定される。文書の対応した階層レベルの翻訳に利用される辞書は、辞書フィールドを指すポインタ・フィールド156内に格納されているアドレスに置かれている。同様に、文書の対応した部分の翻訳に利用される規則データベースは、規則データベースを指すポインタのフィールド158に対応したアドレスに置かれている。
フィールド160はキー情報を指すポインタを格納している。このポインタは、フィールド152内のキー要素の構造に相当するキー及び入力情報用の別のフィールドを含むテーブルを指すポインタとしてよい。例えば、下記の表1は、辞書及び規則の選択を生じさせるタグの名称を記述した入力情報の欄と、その入力情報に対応したキーが入っている欄を含む。
データ構造150Aはさらに、子データ構造の数が入るフィールド162を含む。例えば、データ構造150Aは4個の子データ構造150B,150C,150D,150Eを持つ。最後に、フィールド164は、その種々の子データ構造を指すポインタの配列が入っている。
階層の1つ下のレベルへ行く必要がある時に、翻訳中の文書内にある、使用すべき辞書及び規則データベースを指定するタグが読まれる。例えば、文書がスキャナを説明していることを示す図2の第5行の処理時に、表1が検索され、12というキーを持つスキャナのエントリーが見つかる。12というキーを持つ辞書の位置を突き止めるため、子データ構造の数及び子データ構造へのポインタの配列を利用して1つ下の階層レベルにあるデータ構造が検索される。このようにして、翻訳している文書の階層構造及びタイプに対応した辞書及び規則データベース情報を容易に検索追跡することができる。
本発明は、様々な部分が文書のどの階層レベルであるかの指示を含んだ文書を翻訳する。機械翻訳システムが各部分もしくは階層レベルがいつ始まり又はいつ終わるかを認識するために、翻訳対象の文書は各部分の始まりを指示するものを含んでいなければならない。文書の様々な部分を指示する一般的な方法は、タグを使う方法である。そのタグは、標準一般化マークアップ言語(SGML)に準拠するのが好ましいが、望むならば文書の様々な部分を指示する他の任意の方法を利用してよい。本発明で様々な部分を指示するために用いられるSGLMタグは、SGMLの規則に従った特定の文書タイプ定義(DTD)に適合する必要がある。本発明が効果的に作用するためには、新たなDTDを生成しなければならないだろう。既知のDTDがあり、その知識に基づき当業者はむやみに実験をしなくとも新たなDTDを作ることができるであろう。本発明にそのまま使用できないかもしれないが、DTDを作成する方法を教えてくれる典型的なSGML文書タイプ定義は、国際規格ISO 8879−1986(E)の136ページから始まる付録EのDTDである。
図7は、文書タイプ定義を生成するプロセスを示す。このプロセスが開始すると、ステップ172で同じ分野に属する複数の文書の構造を分析する。これは、自動的に行っても、人間が行っても、機械と人間の協同によって行ってもよい。次にステップ174で、それら様々な文書の共通の構造要素(セマンティクスも含めて)と特有の構造要素を見つける。その共通構造要素及び特有構造要素並びにセマンティクスに基づいて、ステップ176で該分野のための文書タイプ定義である新たな構造を定義する。一例を挙げれば、スキャナを説明する文書の構造は、図1に示すように4つの主要部分、すなわち概要部分32、ハードウエア説明部分40、ソフトウエア説明部分42及びアクセサリ説明部分44を持つであろう。さらに、概要部分32は装置の定義部、図及び機能一覧表を含むであろう。次にステップ178で、定義した新たな構造(例えばDTD)が当該分野の条件を満たすか、すなわち、それら文書をそのDTDによって表現できるか判定する。満たさないときには、ステップ176に戻り、DTDを定義しなおすか変更する。その構造が問題がなく当該分野の条件を満足するときには、ステップ180で、その構造をSGML文書タイプ定義に書き込み、図7のプロセスは終了する。
図8は、本発明の全体的動作を表すデータフロー図である。図8及び図18のデータフロー図において、円はプロセスを示し、2本の横線の間にある情報はデータのタイプを示し、枠つまり正方形はある操作を行うユーザ又は他の装置を示す。図8のデータフロー図において、文書作成者202は文書編集/生成プロセス204を利用して文書を作成する。文書作成者202からの入力は、予め生成された文書タイプ定義206とともに文書編集/生成プロセス204で利用される。文書編集/生成プロセス204が作成中もしくは編集中の文書に関し問題を検出すると、文書作成者202へフィードバックが与えられる。問題の例としては、会社指針違反と曖昧な言い回しがある。文書編集/生成プロセス204の結果が文書原文208である。
図8のデータフロー図には、翻訳及び辞書規則の作成のために利用される翻訳・システムトレーナー(trainer)210が含まれている。辞書・規則作成プロセス212は、文書タイプ定義206、文書原文208及びトレーナー210からの入力を受け取り、辞書データベース及び規則データベースを作成する。文書原文208は、ディスク、RAM又はその他の記憶媒体から、あるいは、ネットワーク等の通信回線もしくはモデムより、辞書・規則作成プロセス212、及び/又はトランスレータ(translator)214へ入力される。さらに、辞書・規則作成プロセス212は、翻訳・システムトレーナー210へフィードバックを与える。トレーニング・プロセス時に、及び必要ならば翻訳プロセス時に、辞書・規則作成プロセス212は、翻訳文書220を生成するために辞書データベース216及び規則データベース218を利用する。翻訳プロセスに利用される辞書及び/又は規則データベースは、翻訳情報又は翻訳資源とみなされる。しかし、翻訳情報又は翻訳資源は辞書と規則データベースに限定されるものではなく、翻訳プロセスを助け又は実行する他の資源又は情報も翻訳情報又は翻訳資源である。
図8のデータフロー図には自動トランスレータ214も含まれている。この自動トランスレータ214は、文書タイプ定義206、文書原文208、辞書データベース216及び規則データベース218を利用し、翻訳文書220を自動的に生成する。翻訳文書220は、ディスク、RAM、その他の任意の種類のメモリに保存され、プリンタで印刷され、及び/又は、ネットワーク、モデム又は他の通信回線を介し他のコンピュータへ出力される。
図9乃至図12は、図8に示した辞書・規則作成プロセス212に対応するプロセスを示す。このプロセスは、辞書及び規則の作成のために利用されるだけはなく、翻訳プロセスの実行のためにも利用してよい。図9において、スタート後、ステップ230で翻訳すべき文書の次のトークンを読む。初めてスタートした時には、このトークンは文書の最初のトークンであり、翻訳すべきタグ又はデータの一部分である。次にステップ232で、そのトークンがタグであるか判定する。タグならば、ステップ234へ進み、そのトークンが開始タグであるか判定する。そのトークンが開始タグならば、ステップ240で、文書の前階層レベルが終了タグ無しで終了したか判定する。前述のように、終了タグの省略が可能であり、文書タイプ定義が分かっていれば特定のタグの終わりを自動検出可能である。したがって、ステップ240で前階層レベルが終了タグ無しで終了したと判定したときには、ちょうど今検出した開始タグは、その前の1つ又は複数のタグが終わったことを意味するので、ステップ242が実行され、階層レベルを1レベル又は数レベル繰り上げる。ステップ240の判定結果が否定の時に、又はステップ242を実行した後に、図10に示すプロセスBへ進む。
図10において、ステップ248で、その開始タグの付属情報があるならば、それを調べるため同開始タグを処理する。例えば、図2の第4行、第10行等を見られたい。ステップ250で、階層レベルを繰り下げるための図12に示すプロセスを呼び出す。翻訳中の文書は様々な階層レベルに配置され、新たな開始タグで指示される新たな階層レベルに検出した時には、適当な辞書及び規則データベースが必要なら生成されて利用されるよう、図6に示したデータ構造のようにデータ構造を調整する必要がある。
図12において、スタート後、ステップ280で当該階層レベル及び構造タグを初めて使用するのか判定する。例えば、そのタグが一度も使用されていない時には、使用すべき辞書及び規則を示す階層情報を格納するための、図6に示すようなデータ構造を生成する必要がある。その階層レベル又はタグを以前使用したときには、割り当て済みであるからその新たなデータ構造を重ねて割り当てる必要はない。ステップ280で、その階層レベルが初めて使用されようとしていると判定したときには、図6に示したデータ構造150Aのような、辞書及び翻訳規則の情報を格納するための1つのデータ構造を割り当てる(ステップ282)。ステップ284で、必要情報を保持するようにこの生成されたデータ構造のフィールドを初期設定する。例えば、キー(152)としての固有の識別子を生成しなければならず、辞書へのポインタ(154)及び規則データベースへのポインタ(158)を設定しなければならず、利用される新たな辞書及び規則データベースを生成又はコピーしなければならず、また、将来、キーを決定できるようキー情報へのポインタ(160)を初期設定しなければならない。そのキーとキー情報を含んでいるテーブルも更新する必要がある。さらに、1つ上の階層レベル内の親データ構造を指すように親データ構造へのポインタ(154)を設定しなければならず、この時点では新たに生成されたデータ構造には子がまったくないので、子データ構造の数(162)は0に、子データ構造へのポインタの配列(164)はヌルを指すように設定しなければならない。ステップ286において、親データ構造は、子データ構造の数及び子データ構造へのポインタの配列を新たな辞書の生成を正しく反映するように更新しなければならない。
ステップ280で、その階層レベルが今回初めて使われるのではないと判定したときには、ステップ288でタグよりキー情報を取得する。キー情報が分かったならば、表1のようなテーブルを利用してキーを見つけることができる。次に、ステップ290で、キー情報に対応したデータ構造、すなわちキー情報に対応したキーを持つデータ構造を見つける。このデータ構造は、カレント・タグの翻訳プロセスに利用されるカレント・データ構造として設定される。ステップ290及びステップ286より、呼び出しプロセスへ戻る。当該ケースでは図10のステップ252へ戻る。
図10のステップ252において、タグが翻訳指示を持っているか判定される。タグが翻訳指示を持っていないときには、そのタグはユーザに表示されることはないので、翻訳する必要はないであろう。そのタグは文書構造化のために利用されるであろうが、実際に表示されないので、文書を表示するためのプロセスがそのタグの種類を認識する限り、そのタグはどんな言語で書かれていようと構わない。タグが翻訳指示を持たない場合には、呼び出しプロセスに戻る。その後、文書の次のトークンを読むため図9のプロセスを繰り返すことができる。
図10のステップ252で、タグが翻訳指示を持つと判定したときには、そのタグはカレント階層レベルの辞書及び規則を用いて翻訳される。あるいは、タグの訳文をDTDに関連したテーブル内に定義しておき、このタグを使って単純な1対1対応形式で翻訳してもよい。あるいはまた、文書の以前の翻訳からタグの訳文を取得し、システムのトレーニングに利用してもよい。次に、ステップ256で、タグをその原言語で表示するとともに、その訳も表示する。これは、図3に示す領域56A,56Bの表示に対応する。ステップ258において、ユーザは訳文を変更したいか問われる。訳文を変更したいときには、以後の翻訳にユーザの要望を反映させるため、辞書及び規則が必要に応じ更新される。次に、文書に含まれる他の情報により翻訳及びトレーニングをするため、呼び出しプロセスに戻る。
図9において、ステップ234で処理しているトークンが開始タグではないと判定したときには、ステップ236で、そのトークンが終了タグであるか判定する。終了タグでなければ、エラーが表示される。なぜなら、このトークンは、ステップ232でタグであると判定されており、開始タグか終了タグのどちらかでなければならないからである。ステップ236でトークンを終了タグであると判定したときには、ステップ238で以後の翻訳に適切なデータ構造が使用されるように図6に示した階層構造を調整する。文書の階層レベルを1レベル又は複数レベル繰り上げることにより、図6のページの上端へ向かって次に最も高いところにあるデータ構造が選ばれる。終了タグ(又はその省略)が2階層レベル以上が終了したことを示す時には、それにふさわしい階層レベル数だけ繰り上げられる。そして呼び出しプロセスに戻り、文書に他の情報があれば、図9乃至図11のプロセスを繰り返すことによって、その情報をトレーニングに利用しかつ翻訳することができる。
ステップ232でトークンがタグでないと判定したときには、そのトークンはデータに違いないので、図11に示されたプロセスAに進む。図11において、ステップ264で、そのデータが階層を操作するか判定する。階層を操作するデータの一例は図2の第5行に見られ、ここではデータは”Scanner”である。このデータ”Scanner”は、使用されるべき階層がスキャナ分野のものであること示す。データが階層を操作するときには、ステップ266に進み、1階層レベル繰り下げられるが、これは図12のプロセスにより行われる。図12は、図10のステップ250に関連して説明済みであるので、重複を避けるため説明しない。ステップ266の次に、又はデータが階層を操作しない場合に、ステップ268で翻訳しようとしている原文が強調表示される(例えば、図3に示すように表示され、かつ強調表示される)。ステップ270で、カレント階層レベルの辞書及び規則による強調表示文の訳文も表示される。その結果、図3に示す領域58A,58Bのように、原情報と翻訳情報とが隣り合って表示される。
次にステップ272で、ユーザがその訳文の変更を希望するか判定する。ユーザが変更を望まないときには、原文書中のほかの情報を翻訳できるようリターンする。ユーザが訳文の変更を望むときには、ステップ274でユーザは新たに伝えるべき情報を入力し、そして、ユーザの希望する訳文と自動的になされた訳文との違いを確認するため、原文と前に翻訳された文とが分析される。次にステップ276で、同じ又は類似のフレーズを今後翻訳したときに希望の訳文が得られるように、カレント階層レベルの辞書及び規則が更新される。そして図11のプロセスから呼び出しプロセスへ戻る。
ステップ270の実行時に辞書及び翻訳規則が存在しないか完全でない場合、完全な又は適切な翻訳を実行するためには必ず訳文を表示しなければならないというわけではなく、十分な情報がなく翻訳を実行できない旨が表示されてもよいことに注意されたい。さらに、翻訳対象の原文書及び同文書のそれまでに生成された訳文を利用しトランスレータのトレーニング・プロセスが実行される時に、ステップ270は、それまでに生成された訳文を表示し、ユーザがその訳文の変更を望まなければ、カレント階層レベルの辞書及び規則が再吟味され、この原文書を将来翻訳したときに同じ訳文が得られるようにするため、必要ならば更新される。
図9乃至図12のフローチャートに従ってトレーニングを実行中に、文書の各タグ毎又は各階層レベル毎に図6に示すようなデータ構造が作られてもよい。こうすると、非常に多くのデータ構造と対応した辞書及び規則データベースが作られる。しかし、データ構造150の数及び辞書及び規則データベースの数を減らすため、本発明は、望むならば、辞書相互及び規則データベース相互を比較し、その類似点を見つける。類似点が見つかったならば、そのデータ構造、及び/又は、辞書と規則データベースが統合される。単に辞書及び規則データベースの数を減らすため、それらを併合することも可能である。異なった辞書及び規則データベースの併合も、それぞれのエントリー数が少なく、それが他の翻訳資源と矛盾もしくは相違しない時には好ましいだろう。辞書を併合することにより、辞書及び規則データベースの数、及び辞書を管理するために用いられるデータ構造の数が減るであろう。辞書及び規則データベースの数が減れば、階層構造も統合、単純化することができる。しかし、望まないならば、データ構造を含め異なった翻訳資源を併合する必要はない。文書の異なった部分に対し特定の辞書情報及び規則を用いることにより、”缶詰”表現しか使用できない翻訳システムを利用するときに生じる負担又は困難を伴うことなく、翻訳はより正確になり、ソース文書と翻訳文書とが1対1対応に近づく。
図13は、図8の自動トランスレータ214によって実行されるプロセスを示す。まずステップ294で、文書の受入れ可能な構造を定義する文書タイプ定義(DTD)を読む。次にステップ296で、翻訳すべき文書中の次のトークンを読む。このトーンは翻訳すべきタグ又はデータである。ステップ298で、文書の終わりに達したか判定する。文書の終わりに達したときには、自動翻訳プロセスは終了する。まだ終わりまで達していなければ、ステップ300で、そのトークンがタグか判定する。タグでなければ、そのトークンはデータであるので、カレント・データ構造例えば図6に示されたデータ構造の一つを利用して決定されるカレントの辞書及び規則データベースを利用し、トークンは翻訳される。そのトークンがタグであれば、ステップ300よりステップ304へ進み、図14に示すタグ・プロセッサを呼び出す。
図14において、ステップ310で、このタグの翻訳指示が必要か判定する。翻訳指示が必要となるのは、翻訳されたタグが文書中に表示され、かつ単に文書の構造化のためのものではない場合である。訳文が必要とされるならば、ステップ312で翻訳指示があるか判定する。それが存在するならば、そのタグはカレントの辞書及び規則データベースを使って翻訳される。翻訳指示が存在しないときには、必要な情報が存在しないので翻訳は実行されない。この時、望むならば、ユーザに対し、翻訳指示が存在しない旨のエラー通知が表示されてもよい。ステップ316で、タグがDTDの適切な順番に位置しているか判定する。そうでなければ、エラー処理ルーチンがステップ318で呼び出され、プロセスは終了する。適切な順番であれば、ステップ320で、図15に示される階層プロセッサを呼び出し必要なタグ情報を渡す。
階層プロセッサを示す図15において、ステップ330で文書のもっと高い階層レベルが処理されるべきか判定する。図6に示されるように、高い階層レベルほど図6の上端へ近づく。もっと高い階層レベルが処理されるべきでない時は、プロセスは階層のもっと下へ進むことを意味し、ステップ332へ進み、利用すべき新たな階層レベル(それがあるならば)を決定する。例えば、図2の第5行にあるタグ<DEVTYPE>の場合、階層レベルが変更されるべきであることを示し、その後に続くデータ”Scanner”は、その階層レベルがスキャナ用であることを示す。スキャナに対応したキーを見つけるため、キー情報が検索される。タグ単独で検索すべきキー情報を指示する場合にも同様のプロセスが実行される。タグは新たな階層レベルが存在することを示さないかもしれない。その後、新たなキー、又はキー変更無し指示が返される。
ステップ330で辞書及び規則を含む翻訳情報もしくは資源を管理するために利用される新たなデータ構造が階層のもっと上にあると判定したときには、ステップ334で、タグ及び文書情報を利用し、いくつ階層レベルを上げるべきか決定する。その後、上げるべき階層レベル数が返される。対応した終了タグが省略された開始タグに出会った時には、システムはまずステップ330,334を実行して階層を上り、次にステップ330,332を実行して階層を下ることもある。そして、図14及び図15のプロセスは終了する。
本発明は、ここに示した通りにプログラムされた汎用コンピュータ上で作動し、又は、専用コンピュータ等の他の種類のマシンを使って作動する。本発明を実施するコンピュータは、図16に示すワークステーション348で示すようなワークステーションである。このワークステーション348は、CPU350、RAM352、プログラム情報格納用ROM354及びキーボード358とマウス360とを接続し入力コントローラ356を有する。さらに、ビデオ制御信号に使ってプリンタのような印刷エンジン362を制御する印刷エンジンインターフェイス364を備えている。システムバス366は、ワークステーション348内の種々の要素を接続する。フロッピー・ドライブ370及びハードディスク・ドライブ368と接続されたディスク・コントローラ372を備えている。通信コントローラ374はネットワーク375、例えばEthernetネットワークに接続されている。I/Oコントローラ376は、SCSIバスを介し外部ハードディスク・ドライブ等のハードディスク・ドライブ380と接続されている。I/Oコントローラ376は、RS−232接続あるいはパラレル接続によりプリンタ378にも接続されている。ワークステーション348はディスプレイ・コントローラ382も含み、これはCRT348又は他のディスプレイ装置と接続されている。
図17は本発明に用いられるソフトウエアの構成要素を示す。システムコントロール・モジュール402は、各ソフトウエア構成要素の動作及び相互通信を制御するために利用される。SGMLパーサ(parser)404は原文書の構文解析に利用される。SGMLパーサ404に加えて、原言語パーサ/シンタックス・アナライザー422、及びターゲット言語パーサ/シンタックス・アナライザー418も備えている。辞書マネージャ406は本発明に利用される多くの辞書を管理し、同様に、翻訳規則マネージャ416は本発明に利用される様々な翻訳規則データを管理する。これらマネージャによる管理には、DTDに関連したシンタックスとセマンティクス間の対応のモニタリングも含まれる。語彙ビルダー(builder)408は、原言語及びターゲット言語の単語のペアからなる語彙を作成する。このペアのターゲット言語部分は、一つの原言語単語に関係した複数の単語を処理するための連結リストであってもよい。異なる辞書が同じ単語を共有するので、各辞書はそれらペアを指すポインタを含むように作られてもよい。辞書選択規則ビルダー410及び言語翻訳規則ビルダー420は、本明細書に述べたプロセスに従って翻訳を実行するために利用される規則を構築する。入力マネージャ412及びディスプレイ・マネージャ414はユーザとの会話を処理をする。
図18は自動翻訳プロセスで利用される本発明の別のデータフロー図を示す。このデータフロー図において、SGMLプロセッサ456はDTD452と共に原文書454を読み、文書階層情報458を生成し、また原文書454のタグ460とデータ462を分離する。分野マッピング・プロセス464はタグ460とデータ462を読み、対象分野466を生成する。この対象分野は、例えば、翻訳中の文書の内容がスキャナに関するものか、プリンタに関するものか、あるいは技術文書か、ユーザマニュアルか、その他の対象分野かを示す。対象分野は、望むならば、より細分化されてもよい。翻訳規則マネージャ468は、文書階層情報458、タグ460、対象分野466、及び、必要ならばデータ462を利用し、使用すべき特定の辞書及び翻訳規則を指示する選択規則472を生成する。選択プロセス476は、選択規則472を受け取り、辞書データベース470及び翻訳規則データベース474から適切な辞書情報及び翻訳規則情報を選択して、トランスレータ480に利用される辞書及び翻訳規則を生成(又はコピー)する。トランスレータ480は、文書のタグ460とデータ462、選択された辞書及び翻訳規則478を読み、本発明のプロセスに従って翻訳文書を生成する。
本発明が的確にトレーニングされて翻訳処理をした後、不明瞭な入力を問い合わせるために、辞書データベース及び翻訳規則を使って入力原言語文書を解析してもよい。例えば、自動翻訳システムが文書をうまく翻訳できないときに、原言語文書の誤りの可能性を指摘するメッセージが表示されてもよい。翻訳が困難な日本語文書を作成する日本人が大勢いる。この困難さの一つの理由は日本語の意味そのものが明瞭でないことである。原言語文書の意味が明瞭でなければ、マシンを利用して明確な翻訳を得ることは困難又は不可能であろう。入力文書を解析することによって、文書の作成者又は他の人に対し、問題点を指摘し、及び/又は原言語文書の明瞭化を要求することができる。
本発明は、ここに示した通りにプログラムされた普通の汎用デジタルコンピュータ又はマイクロプロセッサを利用し支障なく実施し得ることは、コンピュータ技術分野の当業者には明らかであろう。熟練したプログラマによれば、ここに述べられたことに基づいて適当なソフトウエア・プログラムを容易に作成できることは、ソフトウエア技術分野の当業者には明らかであろう。特定用途向け集積回路を用意し、あるいは、一般的な要素回路からなる適当な回路網を相互接続することによっても本発明を実施し得ることは、当業者には明らかであろう。
タグを使って異なった翻訳資源を利用する文書の異なった部分を指示するものとして本発明を説明した。しかしながら、コンピュータの性能が向上し、ソフトウエアが高度化するにつれ、タグを使って文書の様々な部分を指示するのではなく、文書の内容に基づいて文書の様々な部分又は様々な文書タイプを自動的に決定することが可能になろう。例えば、ソース文書に含まれているセクションのタイプを決定するために文書中の単語又はフレーズを解析できるようになるかもしれない。
本発明は、そのプロセスを実行させるようにコンピュータをプログラムするために利用できる命令群を収容した記憶媒体を包含する。この記憶媒体は、フロッピーディスク、光ディスク、CD−ROM、光磁気ディスク等の任意の種類のディスク、ROM、RAM、EPROM、EEPROM、磁気又は光カード、その他の電子命令の格納に適した任意の種類の媒体でよいが、それらに限定されるわけではない。
70 英和/和英辞書
72 コピア辞書
84 スキャナ辞書
86 プリンタ辞書
88 一般英日語彙辞書
90 文法・言語規則データベース
92 日本語文法・言語規則
120 英語文法・言語規則
150A〜150G データ構造
152 キーのフィールド
154 親データ構造へのポインタのフィールド
156 辞書へのポインタのフィールド
158 規則データベースへのポインタのフィールド
160 キー情報へのポインタのフィールド
162 子データ構造の数のフィールド
164 子データ構造へのポインタの配列のフィールド
202 文書作成者
204 文書編集/生成プロセス
206 文書タイプ定義(DTD)
208 文書原文
210 翻訳・システムトレーナー
212 辞書・規則作成プロセス
214 自動トランスレータ
216 辞書データベース
218 規則データベース
220 翻訳文書
402 システムコントロール・モジュール
404 SGMLパーサ
406 辞書マネージャ
408 語彙ビルダー
410 辞書選択規則ビルダー
412 入力マネージャ
414 ディスプレイマネージャ
416 翻訳規則マネージャ
418 ターゲット言語パーサ/シンタックス・アナライザー
420 言語翻訳規則ビルダー
422 原言語パーサ/シンタックス・アナライザー
452 文書タイプ定義(DTD)
454 原文書
456 SGMLプロセッサ
458 文書階層情報
460 タグ
462 データ
464 分野マッピング・プロセス
466 対象分野
468 翻訳規則マネージャ
470 辞書データベース
472 選択規則
474 翻訳規則データベース
476 選択プロセス
478 辞書及び翻訳規則
480 トランスレータ
482 翻訳文書
72 コピア辞書
84 スキャナ辞書
86 プリンタ辞書
88 一般英日語彙辞書
90 文法・言語規則データベース
92 日本語文法・言語規則
120 英語文法・言語規則
150A〜150G データ構造
152 キーのフィールド
154 親データ構造へのポインタのフィールド
156 辞書へのポインタのフィールド
158 規則データベースへのポインタのフィールド
160 キー情報へのポインタのフィールド
162 子データ構造の数のフィールド
164 子データ構造へのポインタの配列のフィールド
202 文書作成者
204 文書編集/生成プロセス
206 文書タイプ定義(DTD)
208 文書原文
210 翻訳・システムトレーナー
212 辞書・規則作成プロセス
214 自動トランスレータ
216 辞書データベース
218 規則データベース
220 翻訳文書
402 システムコントロール・モジュール
404 SGMLパーサ
406 辞書マネージャ
408 語彙ビルダー
410 辞書選択規則ビルダー
412 入力マネージャ
414 ディスプレイマネージャ
416 翻訳規則マネージャ
418 ターゲット言語パーサ/シンタックス・アナライザー
420 言語翻訳規則ビルダー
422 原言語パーサ/シンタックス・アナライザー
452 文書タイプ定義(DTD)
454 原文書
456 SGMLプロセッサ
458 文書階層情報
460 タグ
462 データ
464 分野マッピング・プロセス
466 対象分野
468 翻訳規則マネージャ
470 辞書データベース
472 選択規則
474 翻訳規則データベース
476 選択プロセス
478 辞書及び翻訳規則
480 トランスレータ
482 翻訳文書
Claims (29)
- 第1の言語の文書を入力するステップ、
該文書に含まれている情報を解析して解析結果を生成する解析ステップ、
該解析結果に従って該文書を翻訳するときに利用する翻訳資源を選択する翻訳資源選択ステップ、及び
該選択された翻訳資源を利用して該文書を該第1の言語から第2の言語へ翻訳する翻訳ステップからなる、文書を第1の言語から第2の言語へ翻訳するためのコンピュータにより実施される文書翻訳方法。 - 請求項1記載の文書翻訳方法において、該翻訳資源選択ステップは、文書の第1の部分には第1の翻訳資源を選択し、かつ、該文書の第2の部分には第2の翻訳資源を選択し、該翻訳ステップは、該第1の翻訳資源を利用して該文書の第1の部分を翻訳し、かつ、該第2の翻訳資源を利用して該文書の第2の部分を翻訳する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該解析ステップは該文書に含まれている構造情報を解析する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該解析ステップは該文書に含まれているタグを解析する、ことを特徴する文書翻訳方法。
- 請求項4記載の文書翻訳方法において、該解析ステップは該文書に含まれている標準一般化マークアップ言語のタグを解析する、ことを特徴とする文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該翻訳資源選択ステップは該文書を翻訳するために利用される辞書情報を選択する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該翻訳資源選択ステップは該文書を翻訳するときに利用する規則情報を選択する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該翻訳資源選択ステップは該文書を翻訳するときに利用する辞書情報及び規則情報を選択する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該翻訳資源選択ステップは該文書を翻訳するときに利用する翻訳資源の場所を定義するデータ構造を選択する、ことを特徴する文書翻訳方法。
- 請求項1記載の文書翻訳方法において、該解析ステップは翻訳に利用される翻訳資源の場所を定義するデータ構造を指示するキーを含む解析結果を生成し、該翻訳資源選択ステップは該文書を翻訳するときに利用する翻訳資源の場所を定義する該キーを含むデータ構造を選択する、ことを特徴する文書翻訳方法。
- 該第1の言語の該文書の部分と該第2の言語に翻訳された該文書の対応部分を同時に表示する表示ステップをさらに有することを特徴とする請求項1記載の文書翻訳方法。
- 該第2の言語に翻訳された該文書の部分を、該表示ステップの後に変更するステップをさらに有することを特徴とする請求項11記載の文書翻訳方法。
- 文書を第1の言語から第2の言語へ翻訳する文書翻訳システムであって、
該文書に含まれている情報を解析し解析結果を生成する解析手段、
該解析結果に従って該文書を翻訳するときに利用する翻訳資源を選択する翻訳資源選択手段、及び
該選択された翻訳資源を利用して該文書を該第1の言語から該第2の言語へ翻訳する翻訳手段、からなる文書翻訳システム。 - 請求項13記載の文書翻訳システムにおいて、該翻訳資源選択手段は、文書の第1の部分には第1の翻訳資源を選択し、かつ、該文書の第2の部分には第2の翻訳資源を選択する手段からなり、該翻訳手段は、該第1の翻訳資源を利用して該文書の該第1の部分を翻訳する手段、及び、該第2の翻訳資源を利用して該文書の該第2の部分を翻訳する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該解析手段は該文書に含まれている構造情報を解析する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該解析手段は該文書に含まれているタグを解析する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項16記載の文書翻訳システムにおいて、該解析手段は該文書に含まれている標準一般化マークアップ言語タグを解析する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該翻訳資源選択手段は該文書を翻訳するときに利用する辞書情報を選択する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該翻訳資源選択手段は該文書を翻訳するときに利用する規則情報を選択する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該翻訳資源選択手段は該文書を翻訳するときに利用する辞書情報及び規則情報を選択する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該選択手段は該文書を翻訳するときに利用する翻訳資源の場所を定義するデータ構造を選択する手段からなる、ことを特徴とする文書翻訳システム。
- 請求項13記載の文書翻訳システムにおいて、該解析手段は翻訳に利用される翻訳資源の場所を定義するデータ構造を指示するキーを含む解析結果を生成し、該翻訳資源選択手段は該文書を翻訳するときに利用する翻訳資源の場所を定義する該キーを含むデータ構造を選択する手段からなる、ことを特徴とする文書翻訳システム。
- 該第1の言語の該文書の部分と該第2の言語に翻訳された該文書の対応部分を同時に表示する手段をさらに有する、ことを特徴とする請求項13記載の文書翻訳システム。
- 該第2の言語に翻訳された該文書の部分を変更する手段をさらに有する、ことを特徴とする請求項23記載の文書翻訳システム。
- 文書に含まれている情報を解析し解析結果を生成する解析手段、
該解析結果に従って該文書を翻訳するときに利用する翻訳資源を選択する翻訳資源選択手段、及び
該選択された翻訳資源を利用して該文書を第1の言語から第2の言語へ翻訳する翻訳手段としてコンピュータを機能させるためのプログラムを記録した機械読み取り可能媒体。 - 請求項25記載の機械読み取り可能媒体において、該翻訳資源選択手段は文書の第1の部分には第1の翻訳資源を選択し、かつ、該文書の第2の部分には第2の翻訳資源を選択する手段からなり、該翻訳手段は、該第1の翻訳資源を利用して該文書の該第1の部分を翻訳する手段、及び、該第2の翻訳資源を利用して該文書の該第2の部分を翻訳する手段からなる、ことを特徴とする機械読み取り可能媒体。
- 請求項25記載の機械読み取り可能媒体において、該解析手段は該文書に含まれている構造情報を解析する手段からなる、ことを特徴とする機械読み取り可能媒体。
- 請求項25記載の機械読み取り可能媒体において、該解析手段は該文書に含まれているタグを解析する手段からなる、ことを特徴とする機械読み取り可能媒体。
- 請求項28記載の機械読み取り可能媒体において、該解析手段は該文書に含まれている標準一般化マークアップ言語タグを解析する手段からなる、ことを特徴とする機械読み取り可能媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/654,207 US5848386A (en) | 1996-05-28 | 1996-05-28 | Method and system for translating documents using different translation resources for different portions of the documents |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13648397A Division JP3905179B2 (ja) | 1996-05-28 | 1997-05-27 | 文書翻訳装置及び機械読み取り可能媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004265423A true JP2004265423A (ja) | 2004-09-24 |
Family
ID=24623898
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13648397A Expired - Lifetime JP3905179B2 (ja) | 1996-05-28 | 1997-05-27 | 文書翻訳装置及び機械読み取り可能媒体 |
JP2004060677A Pending JP2004265423A (ja) | 1996-05-28 | 2004-03-04 | 文書翻訳方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13648397A Expired - Lifetime JP3905179B2 (ja) | 1996-05-28 | 1997-05-27 | 文書翻訳装置及び機械読み取り可能媒体 |
Country Status (3)
Country | Link |
---|---|
US (2) | US5848386A (ja) |
JP (2) | JP3905179B2 (ja) |
DE (1) | DE19709968C2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165415A (ja) * | 2006-12-27 | 2008-07-17 | Oki Electric Ind Co Ltd | 文書処理装置、文書処理方法およびプログラム |
Families Citing this family (338)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020004812A1 (en) * | 1997-06-26 | 2002-01-10 | Tetsuro Motoyama | Method and system for diagnosis and control of machines using connectionless modes having delivery monitoring and an alternate communication mode |
US7131070B1 (en) | 1999-05-13 | 2006-10-31 | Ricoh Company, Ltd. | Application unit monitoring and reporting system and method |
US5819110A (en) * | 1995-06-05 | 1998-10-06 | Ricoh Company, Ltd. | System for determining whether connection or connectionless modes of communication should be used to transmit information between devices in accordance with priorities of events |
US5818603A (en) | 1996-03-29 | 1998-10-06 | Ricoh Company, Ltd. | Method and system for controlling and communicating with machines using multiple communication formats |
US6044205A (en) * | 1996-02-29 | 2000-03-28 | Intermind Corporation | Communications system for transferring information between memories according to processes transferred with the information |
US6700958B2 (en) * | 1995-04-10 | 2004-03-02 | Starguide Digital Networks, Inc. | Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth |
US7185080B1 (en) | 1995-06-05 | 2007-02-27 | Ricoh Company, Ltd. | Method and system for diagnosis and control of machines using connection and connectionless modes of communication |
BR9610270A (pt) * | 1995-08-16 | 1999-07-06 | Starguide Digital Networks Inc | Alocação dinâmica de largura de faixa para transmissão de sinais de audio e um sinal de vídeo |
CN1198862A (zh) * | 1995-09-01 | 1998-11-11 | 斯塔盖德数字网络有限公司 | 对比资料及通过引用加入的软件 |
US6073143A (en) * | 1995-10-20 | 2000-06-06 | Sanyo Electric Co., Ltd. | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request |
US6546406B1 (en) * | 1995-11-03 | 2003-04-08 | Enigma Information Systems Ltd. | Client-server computer system for large document retrieval on networked computer system |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
US6061697A (en) * | 1996-09-11 | 2000-05-09 | Fujitsu Limited | SGML type document managing apparatus and managing method |
CA2268303A1 (en) * | 1996-10-09 | 1998-04-16 | Starguide Digital Networks | Aggregate information production and display system |
JPH10198680A (ja) * | 1997-01-07 | 1998-07-31 | Hitachi Ltd | 分散辞書管理方法及びそれを用いた機械翻訳方法 |
IL121071A0 (en) * | 1997-03-27 | 1997-11-20 | El Mar Software Ltd | Automatic conversion server |
IL121457A (en) * | 1997-08-03 | 2004-06-01 | Guru Internat Inc | Computerized dictionary and thesaurus applications |
US6154754A (en) * | 1997-09-25 | 2000-11-28 | Siemens Corporate Research, Inc. | Automatic synthesis of semantic information from multimedia documents |
US5960080A (en) * | 1997-11-07 | 1999-09-28 | Justsystem Pittsburgh Research Center | Method for transforming message containing sensitive information |
US6161082A (en) * | 1997-11-18 | 2000-12-12 | At&T Corp | Network based language translation system |
US6321244B1 (en) * | 1997-12-04 | 2001-11-20 | Siemens Corporate Research, Inc. | Style specifications for systematically creating card-based hypermedia manuals |
JPH11175527A (ja) * | 1997-12-15 | 1999-07-02 | Fujitsu Ltd | 出力制御装置及び出力制御方法 |
US6009436A (en) * | 1997-12-23 | 1999-12-28 | Ricoh Company, Ltd. | Method and apparatus for mapping structured information to different structured information |
US10541973B2 (en) * | 1998-02-23 | 2020-01-21 | Transperfect Global, Inc. | Service of cached translated content in a requested language |
US6526426B1 (en) * | 1998-02-23 | 2003-02-25 | David Lakritz | Translation management system |
US8489980B2 (en) * | 1998-02-23 | 2013-07-16 | Transperfect Global, Inc. | Translation management system |
US7194757B1 (en) | 1998-03-06 | 2007-03-20 | Starguide Digital Network, Inc. | Method and apparatus for push and pull distribution of multimedia |
US6160797A (en) | 1998-04-03 | 2000-12-12 | Starguide Digital Networks, Inc. | Satellite receiver/router, system, and method of use |
US8284774B2 (en) | 1998-04-03 | 2012-10-09 | Megawave Audio Llc | Ethernet digital storage (EDS) card and satellite transmission system |
US7191393B1 (en) * | 1998-09-25 | 2007-03-13 | International Business Machines Corporation | Interface for providing different-language versions of markup-language resources |
US7281203B2 (en) * | 1998-09-29 | 2007-10-09 | Netscape Communications Corporation | Selecting a DTD for transforming malformed layout expressions into wellformed ones |
US6336214B1 (en) * | 1998-11-10 | 2002-01-01 | International Business Machines Corporation | System and method for automatically generating browsable language grammars |
US7376728B1 (en) | 2000-07-25 | 2008-05-20 | Ricoh Company, Ltd. | Method and system for monitoring, collecting information, diagnosing and servicing a remote system |
US6964011B1 (en) * | 1998-11-26 | 2005-11-08 | Canon Kabushiki Kaisha | Document type definition generating method and apparatus, and storage medium for storing program |
US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
US6363337B1 (en) * | 1999-01-19 | 2002-03-26 | Universal Ad Ltd. | Translation of data according to a template |
US6480860B1 (en) * | 1999-02-11 | 2002-11-12 | International Business Machines Corporation | Tagged markup language interface with document type definition to access data in object oriented database |
US7287219B1 (en) | 1999-03-11 | 2007-10-23 | Abode Systems Incorporated | Method of constructing a document type definition from a set of structured electronic documents |
EP2336899A3 (en) * | 1999-03-19 | 2014-11-26 | Trados GmbH | Workflow management system |
US20020105955A1 (en) * | 1999-04-03 | 2002-08-08 | Roberts Roswell R. | Ethernet digital storage (EDS) card and satellite transmission system including faxing capability |
US6986101B2 (en) * | 1999-05-06 | 2006-01-10 | International Business Machines Corporation | Method and apparatus for converting programs and source code files written in a programming language to equivalent markup language files |
US6490548B1 (en) | 1999-05-14 | 2002-12-03 | Paterra, Inc. | Multilingual electronic transfer dictionary containing topical codes and method of use |
WO2000077609A1 (en) * | 1999-06-14 | 2000-12-21 | The Thomson Corporation | System for converting data to a markup language |
US6901361B1 (en) * | 1999-07-09 | 2005-05-31 | Digital Esperanto, Inc. | Computerized translator of languages utilizing indexed databases of corresponding information elements |
US6993476B1 (en) * | 1999-08-26 | 2006-01-31 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
US6598015B1 (en) * | 1999-09-10 | 2003-07-22 | Rws Group, Llc | Context based computer-assisted language translation |
US7533344B1 (en) | 1999-09-10 | 2009-05-12 | Ricoh Company, Ltd. | Application unit monitoring and reporting system and method |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7120863B1 (en) | 1999-11-15 | 2006-10-10 | International Business Machines Corporation | Method, system, and program for interfacing with elements in a document |
US6948175B1 (en) | 1999-11-16 | 2005-09-20 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library |
US7743133B1 (en) | 1999-11-16 | 2010-06-22 | Ricoh Company, Ltd. | Remote system usage monitoring with flexible encoding and decoding objects |
US6662225B1 (en) * | 1999-11-16 | 2003-12-09 | Ricoh Company, Ltd. | Remote system usage monitoring with flexible packaging of data |
US7054952B1 (en) * | 1999-12-09 | 2006-05-30 | International Business Machines Corp. | Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support |
JP2001256333A (ja) * | 2000-01-06 | 2001-09-21 | Canon Inc | 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体 |
JP2001195462A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム |
JP2001195115A (ja) | 2000-01-06 | 2001-07-19 | Canon Inc | 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
JP2001195463A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
US6915342B1 (en) | 2000-02-04 | 2005-07-05 | Ricoh Company Limited | Method and system for maintaining the business office appliance through log files |
US6915337B1 (en) | 2000-03-07 | 2005-07-05 | Ricoh Co. Ltd. | Method and system for updating the device driver of a business office appliance |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
EP1139231A1 (en) * | 2000-03-31 | 2001-10-04 | Fujitsu Limited | Document processing apparatus and method |
US6785711B1 (en) | 2000-04-04 | 2004-08-31 | Ricoh Co., Ltd. | Method and system for displaying various messages while performing tasks or while idling |
JP4028154B2 (ja) | 2000-04-07 | 2007-12-26 | 富士通株式会社 | 磁気記録媒体及び磁気記憶装置 |
US7120674B1 (en) | 2000-05-17 | 2006-10-10 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent protocol processor |
US6988141B1 (en) | 2000-05-17 | 2006-01-17 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with restriction on protocol |
US7287085B1 (en) * | 2000-05-17 | 2007-10-23 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent formatter |
FR2809509B1 (fr) * | 2000-05-26 | 2003-09-12 | Bull Sa | Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique |
US6519557B1 (en) * | 2000-06-06 | 2003-02-11 | International Business Machines Corporation | Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity |
WO2002021413A2 (en) * | 2000-09-05 | 2002-03-14 | Zaplet, Inc. | Methods and apparatus providing electronic messages that are linked and aggregated |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
US6857016B1 (en) | 2000-09-25 | 2005-02-15 | Ricoh Company Limited | Method and system of data collection and mapping from a remote position reporting device |
US20020083103A1 (en) * | 2000-10-02 | 2002-06-27 | Ballance Chanin M. | Machine editing system incorporating dynamic rules database |
AU2001296441A1 (en) * | 2000-10-04 | 2002-04-15 | Idiom Technologies, Incorporated | Method of and system for splitting and/or merging content to facilitate content processing |
US6782384B2 (en) | 2000-10-04 | 2004-08-24 | Idiom Merger Sub, Inc. | Method of and system for splitting and/or merging content to facilitate content processing |
US9311499B2 (en) * | 2000-11-13 | 2016-04-12 | Ron M. Redlich | Data security system and with territorial, geographic and triggering event protocol |
US7669051B2 (en) * | 2000-11-13 | 2010-02-23 | DigitalDoors, Inc. | Data security system and method with multiple independent levels of security |
AU2002233991A1 (en) * | 2000-12-06 | 2002-06-18 | American Express Travel Related Services Company, Inc. | Layout generator system and method |
DE50111786D1 (de) * | 2000-12-15 | 2007-02-15 | Siemens Ag | Verschlüsselung von Steuerungsprogrammen |
US20020099745A1 (en) * | 2001-01-23 | 2002-07-25 | Neo-Core, L.L.C. | Method and system for storing a flattened structured data document |
US20020103632A1 (en) * | 2001-01-31 | 2002-08-01 | International Business Machines Corporation | Method, program, and tool for updating the national language versions of documents |
US7047293B2 (en) * | 2001-02-14 | 2006-05-16 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with delegating protocol processor |
US7392307B2 (en) | 2001-02-14 | 2008-06-24 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using a shared resource |
US7533333B2 (en) | 2001-02-14 | 2009-05-12 | Ricoh Co., Ltd. | Object-oriented method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols |
US7171670B2 (en) | 2001-02-14 | 2007-01-30 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with verification of formats and protocols |
AUPR329501A0 (en) * | 2001-02-22 | 2001-03-22 | Worldlingo, Inc | Translation information segment |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
JP3475186B2 (ja) * | 2001-03-21 | 2003-12-08 | 株式会社ニチベイ | ブラインド、ブラインド用スラット、その製造方法及びその成形加工機 |
US20020147749A1 (en) * | 2001-04-06 | 2002-10-10 | Ortiz C. Enrique | Mobile presentation system |
WO2002082289A1 (en) * | 2001-04-06 | 2002-10-17 | Agea Corporation | Mobile presentation system |
US20030023584A1 (en) * | 2001-04-27 | 2003-01-30 | Brandin Christopher Lockton | Universal information base system |
JP2003022125A (ja) * | 2001-05-02 | 2003-01-24 | Ricoh Co Ltd | 機器の定期診断装置及び機器の定期診断方法ならびに定期診断される顧客に配置された機器 |
US6993474B2 (en) * | 2001-05-17 | 2006-01-31 | Curry David G | Interactive conversational speech communicator method and system |
US20030004703A1 (en) * | 2001-06-28 | 2003-01-02 | Arvind Prabhakar | Method and system for localizing a markup language document |
US7016963B1 (en) | 2001-06-29 | 2006-03-21 | Glow Designs, Llc | Content management and transformation system for digital content |
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
US7100108B2 (en) * | 2001-08-31 | 2006-08-29 | International Business Machines Corporation | Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes |
US7490146B1 (en) | 2001-09-17 | 2009-02-10 | Ricoh Company, Ltd. | System, method, and computer program product for collecting and sending various types of information to a monitor using e-mail |
US7302469B2 (en) * | 2001-09-17 | 2007-11-27 | Ricoh Company, Ltd. | System, method, and computer program product for transferring remote device support data to a monitor using e-mail |
US7536450B2 (en) * | 2001-09-17 | 2009-05-19 | Ricoh Company, Ltd. | System, method, and computer program product for sending remote device configuration information to a monitor using e-mail |
JP2003091344A (ja) * | 2001-09-19 | 2003-03-28 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム |
JP3452558B2 (ja) * | 2001-09-25 | 2003-09-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム |
US8438004B2 (en) * | 2001-10-03 | 2013-05-07 | Hewlett-Packard Development Company L.P. | System and methods for language translation printing |
US6925571B1 (en) | 2001-10-15 | 2005-08-02 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, using POP3 and decryption using virtual function |
US7343407B2 (en) * | 2001-10-15 | 2008-03-11 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, including handling Email messages having message types specified within the Email message |
US6839717B1 (en) | 2001-10-15 | 2005-01-04 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, extracting data from different types of email messages, and storing data according to data structures determined by the message types |
US20030101046A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
US20030105621A1 (en) * | 2001-12-04 | 2003-06-05 | Philippe Mercier | Method for computer-assisted translation |
US20030131316A1 (en) * | 2002-01-07 | 2003-07-10 | Kyle Brown | Internationalizing SGML documents |
AU2003269808A1 (en) | 2002-03-26 | 2004-01-06 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US20030212962A1 (en) * | 2002-05-08 | 2003-11-13 | Amikai, Inc. | Thin client-server architecture for automated machine translation |
US7209915B1 (en) | 2002-06-28 | 2007-04-24 | Microsoft Corporation | Method, system and apparatus for routing a query to one or more providers |
US7185271B2 (en) * | 2002-08-20 | 2007-02-27 | Hewlett-Packard Development Company, L.P. | Methods and systems for implementing auto-complete in a web page |
US7113960B2 (en) * | 2002-08-22 | 2006-09-26 | International Business Machines Corporation | Search on and search for functions in applications with varying data types |
US20040078762A1 (en) * | 2002-10-17 | 2004-04-22 | Taiwan Semiconductor Manufacturing Co., Ltd. | Multi-lingual information server apparatus and method for operation thereof |
US20060277332A1 (en) * | 2002-12-18 | 2006-12-07 | Yukihisa Yamashina | Translation support system and program thereof |
US7428699B1 (en) | 2003-01-15 | 2008-09-23 | Adobe Systems Incorporated | Configurable representation of structured data |
FR2850473A1 (fr) * | 2003-01-28 | 2004-07-30 | France Telecom | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
US8170863B2 (en) * | 2003-04-01 | 2012-05-01 | International Business Machines Corporation | System, method and program product for portlet-based translation of web content |
US20040230898A1 (en) * | 2003-05-13 | 2004-11-18 | International Business Machines Corporation | Identifying topics in structured documents for machine translation |
US7558841B2 (en) * | 2003-05-14 | 2009-07-07 | Microsoft Corporation | Method, system, and computer-readable medium for communicating results to a data query in a computer network |
JP3765798B2 (ja) * | 2003-05-27 | 2006-04-12 | 沖電気工業株式会社 | 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム |
US20040243391A1 (en) * | 2003-05-28 | 2004-12-02 | Nelson David D. | Apparatus, system, and method for multilingual regulation management |
US20100070265A1 (en) * | 2003-05-28 | 2010-03-18 | Nelson David D | Apparatus, system, and method for multilingual regulation management |
JP2004362249A (ja) * | 2003-06-04 | 2004-12-24 | Advanced Telecommunication Research Institute International | 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体 |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7657832B1 (en) | 2003-09-18 | 2010-02-02 | Adobe Systems Incorporated | Correcting validation errors in structured documents |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7853473B2 (en) * | 2004-08-31 | 2010-12-14 | Revionics, Inc. | Market-based price optimization system |
WO2006042321A2 (en) | 2004-10-12 | 2006-04-20 | University Of Southern California | Training for a text-to-text application which uses string to tree conversion for training and decoding |
US7680646B2 (en) * | 2004-12-21 | 2010-03-16 | Xerox Corporation | Retrieval method for translation memories containing highly structured documents |
WO2006081428A2 (en) | 2005-01-27 | 2006-08-03 | Symyx Technologies, Inc. | Parser for generating structure data |
JP2006276915A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 翻訳処理方法、文書翻訳装置およびプログラム |
JP4311365B2 (ja) * | 2005-03-25 | 2009-08-12 | 富士ゼロックス株式会社 | 文書処理装置およびプログラム |
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
US9245032B2 (en) * | 2005-06-02 | 2016-01-26 | Oracle International Corporation | Globalization framework for providing locale-specific services using client-side scripting languages |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US20070010989A1 (en) * | 2005-07-07 | 2007-01-11 | International Business Machines Corporation | Decoding procedure for statistical machine translation |
US20070043553A1 (en) * | 2005-08-16 | 2007-02-22 | Microsoft Corporation | Machine translation models incorporating filtered training data |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070067154A1 (en) * | 2005-09-22 | 2007-03-22 | International Business Machines Corporation | Language translation system |
US7992085B2 (en) | 2005-09-26 | 2011-08-02 | Microsoft Corporation | Lightweight reference user interface |
US7788590B2 (en) | 2005-09-26 | 2010-08-31 | Microsoft Corporation | Lightweight reference user interface |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US9411781B2 (en) | 2006-01-18 | 2016-08-09 | Adobe Systems Incorporated | Rule-based structural expression of text and formatting attributes in documents |
US8296123B2 (en) | 2006-02-17 | 2012-10-23 | Google Inc. | Encoding and adaptive, scalable accessing of distributed models |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
WO2007124109A2 (en) * | 2006-04-21 | 2007-11-01 | Scomm, Inc. | Interactive conversational speech communicator method and system |
US7873641B2 (en) * | 2006-07-14 | 2011-01-18 | Bea Systems, Inc. | Using tags in an enterprise search system |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) * | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8326598B1 (en) | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US20080288239A1 (en) * | 2007-05-15 | 2008-11-20 | Microsoft Corporation | Localization and internationalization of document resources |
US8205151B2 (en) * | 2007-05-31 | 2012-06-19 | Red Hat, Inc. | Syndication of documents in increments |
US9361294B2 (en) * | 2007-05-31 | 2016-06-07 | Red Hat, Inc. | Publishing tool for translating documents |
US10296588B2 (en) * | 2007-05-31 | 2019-05-21 | Red Hat, Inc. | Build of material production system |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US20080313291A1 (en) * | 2007-06-12 | 2008-12-18 | Smartmicros Usa, Llc | Method and apparatus for encoding data |
US20090013268A1 (en) * | 2007-07-02 | 2009-01-08 | Universal Ad Ltd. | Creation Of Visual Composition Of Product Images |
JP5105513B2 (ja) * | 2007-07-20 | 2012-12-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 処理対象として適切なテキストを選択する技術 |
US9418061B2 (en) * | 2007-12-14 | 2016-08-16 | International Business Machines Corporation | Prioritized incremental asynchronous machine translation of structured documents |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100292983A1 (en) * | 2008-01-10 | 2010-11-18 | Takashi Onishi | Machine translation apparatus and machine translation method |
US8849665B2 (en) * | 2008-01-30 | 2014-09-30 | At&T Intellectual Property I, L.P. | System and method of providing machine translation from a source language to a target language |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
DE102009009123A1 (de) | 2009-02-16 | 2010-08-19 | Marius Gevers | Verfahren und ein System zum Übersetzen eines Textes aus einer ersten Sprache in zumindest eine weitere Sprache sowie ein Computer-Programm-Produkt |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
GB2468278A (en) | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
JP4935869B2 (ja) * | 2009-08-07 | 2012-05-23 | カシオ計算機株式会社 | 電子機器及びプログラム |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US8508787B2 (en) * | 2009-11-23 | 2013-08-13 | Xerox Corporation | System and method for automatic translation of documents scanned by multifunctional printer machines |
US20130046529A1 (en) * | 2009-12-22 | 2013-02-21 | Health Ewords Pty Ltd. | Method and System for Classification of Clinical Information |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8280954B2 (en) | 2010-03-25 | 2012-10-02 | Scomm, Inc. | Method and system for providing live real-time communication via text between mobile user devices |
US9767095B2 (en) | 2010-05-21 | 2017-09-19 | Western Standard Publishing Company, Inc. | Apparatus, system, and method for computer aided translation |
US9002696B2 (en) * | 2010-11-30 | 2015-04-07 | International Business Machines Corporation | Data security system for natural language translation |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9706247B2 (en) | 2011-03-23 | 2017-07-11 | Audible, Inc. | Synchronized digital content samples |
US8948892B2 (en) | 2011-03-23 | 2015-02-03 | Audible, Inc. | Managing playback of synchronized content |
US9760920B2 (en) | 2011-03-23 | 2017-09-12 | Audible, Inc. | Synchronizing digital content |
US8862255B2 (en) | 2011-03-23 | 2014-10-14 | Audible, Inc. | Managing playback of synchronized content |
US8855797B2 (en) | 2011-03-23 | 2014-10-07 | Audible, Inc. | Managing playback of synchronized content |
US9734153B2 (en) | 2011-03-23 | 2017-08-15 | Audible, Inc. | Managing related digital content |
US9703781B2 (en) | 2011-03-23 | 2017-07-11 | Audible, Inc. | Managing related digital content |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8538742B2 (en) * | 2011-05-20 | 2013-09-17 | Google Inc. | Feed translation for a social network |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8706472B2 (en) * | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US9075760B2 (en) | 2012-05-07 | 2015-07-07 | Audible, Inc. | Narration settings distribution for content customization |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9317500B2 (en) * | 2012-05-30 | 2016-04-19 | Audible, Inc. | Synchronizing translated digital content |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9141257B1 (en) | 2012-06-18 | 2015-09-22 | Audible, Inc. | Selecting and conveying supplemental content |
US8972265B1 (en) | 2012-06-18 | 2015-03-03 | Audible, Inc. | Multiple voices in audio content |
US9536439B1 (en) | 2012-06-27 | 2017-01-03 | Audible, Inc. | Conveying questions with content |
US9679608B2 (en) | 2012-06-28 | 2017-06-13 | Audible, Inc. | Pacing content |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9099089B2 (en) | 2012-08-02 | 2015-08-04 | Audible, Inc. | Identifying corresponding regions of content |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9367196B1 (en) | 2012-09-26 | 2016-06-14 | Audible, Inc. | Conveying branched content |
US9632647B1 (en) | 2012-10-09 | 2017-04-25 | Audible, Inc. | Selecting presentation positions in dynamic content |
US9223830B1 (en) | 2012-10-26 | 2015-12-29 | Audible, Inc. | Content presentation analysis |
US9619463B2 (en) | 2012-11-14 | 2017-04-11 | International Business Machines Corporation | Document decomposition into parts based upon translation complexity for translation assignment and execution |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9280906B2 (en) | 2013-02-04 | 2016-03-08 | Audible. Inc. | Prompting a user for input during a synchronous presentation of audio content and textual content |
US9472113B1 (en) | 2013-02-05 | 2016-10-18 | Audible, Inc. | Synchronizing playback of digital content with physical content |
CN113470640B (zh) | 2013-02-07 | 2022-04-26 | 苹果公司 | 数字助理的语音触发器 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9317486B1 (en) | 2013-06-07 | 2016-04-19 | Audible, Inc. | Synchronizing playback of digital content with captured physical content |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9489360B2 (en) | 2013-09-05 | 2016-11-08 | Audible, Inc. | Identifying extra material in companion content |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9514377B2 (en) * | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9514376B2 (en) | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
CN104933041B (zh) * | 2015-06-25 | 2017-09-01 | 武汉传神信息技术有限公司 | 一种利于翻译工作的文件抽取和还原方法 |
US11803918B2 (en) | 2015-07-07 | 2023-10-31 | Oracle International Corporation | System and method for identifying experts on arbitrary topics in an enterprise social network |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
JP2017174300A (ja) * | 2016-03-25 | 2017-09-28 | 富士ゼロックス株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10628522B2 (en) * | 2016-06-27 | 2020-04-21 | International Business Machines Corporation | Creating rules and dictionaries in a cyclical pattern matching process |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US10540452B1 (en) * | 2018-06-21 | 2020-01-21 | Amazon Technologies, Inc. | Automated translation of applications |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57150071A (en) * | 1981-03-12 | 1982-09-16 | Sharp Corp | Electronic type interpreter |
US4553261A (en) * | 1983-05-31 | 1985-11-12 | Horst Froessl | Document and data handling and retrieval system |
JPS6244877A (ja) * | 1985-08-22 | 1987-02-26 | Toshiba Corp | 機械翻訳装置 |
US5029114A (en) * | 1986-07-22 | 1991-07-02 | Kabushiki Kaisha Toshiba | Method of displaying reduced-layout and apparatus for embodying the method |
US4916614A (en) * | 1986-11-25 | 1990-04-10 | Hitachi, Ltd. | Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words |
GB2199170A (en) * | 1986-11-28 | 1988-06-29 | Sharp Kk | Translation apparatus |
US4890230A (en) * | 1986-12-19 | 1989-12-26 | Electric Industry Co., Ltd. | Electronic dictionary |
JPS63223962A (ja) | 1987-03-13 | 1988-09-19 | Hitachi Ltd | 翻訳装置 |
US4980289A (en) * | 1987-04-27 | 1990-12-25 | Wisconsin Alumni Research Foundation | Promoter deficient retroviral vector |
JPH01279368A (ja) * | 1988-04-30 | 1989-11-09 | Sharp Corp | キャラクタデータの転送方式 |
DE68928231T2 (de) * | 1988-10-28 | 1998-01-08 | Toshiba Kawasaki Kk | Verfahren und Vorrichtung zur Maschinenübersetzung |
JPH02254564A (ja) * | 1989-03-29 | 1990-10-15 | Ricoh Co Ltd | 翻訳用辞書編集装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
US5466072A (en) * | 1992-01-17 | 1995-11-14 | Stenograph Corporation | Method and apparatus for recording and translating shorthand notes |
GB9209346D0 (en) * | 1992-04-30 | 1992-06-17 | Sharp Kk | Machine translation system |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
US5528491A (en) * | 1992-08-31 | 1996-06-18 | Language Engineering Corporation | Apparatus and method for automated natural language translation |
JP2745370B2 (ja) * | 1993-02-23 | 1998-04-28 | 日本アイ・ビー・エム株式会社 | 機械翻訳方法及び機械翻訳装置 |
JP3408291B2 (ja) * | 1993-09-20 | 2003-05-19 | 株式会社東芝 | 辞書作成支援装置 |
JPH07210558A (ja) * | 1994-01-20 | 1995-08-11 | Fujitsu Ltd | 機械翻訳装置 |
EP0672989A3 (en) * | 1994-03-15 | 1998-10-28 | Toppan Printing Co., Ltd. | Machine translation system |
JPH08101837A (ja) * | 1994-09-30 | 1996-04-16 | Toshiba Corp | 機械翻訳装置における翻訳規則学習方法 |
US5983169A (en) * | 1995-11-13 | 1999-11-09 | Japan Science And Technology Corporation | Method for automated translation of conjunctive phrases in natural languages |
US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
-
1996
- 1996-05-28 US US08/654,207 patent/US5848386A/en not_active Expired - Lifetime
-
1997
- 1997-03-11 DE DE19709968A patent/DE19709968C2/de not_active Expired - Lifetime
- 1997-05-27 JP JP13648397A patent/JP3905179B2/ja not_active Expired - Lifetime
-
1998
- 1998-11-13 US US09/190,460 patent/US6208956B1/en not_active Expired - Lifetime
-
2004
- 2004-03-04 JP JP2004060677A patent/JP2004265423A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165415A (ja) * | 2006-12-27 | 2008-07-17 | Oki Electric Ind Co Ltd | 文書処理装置、文書処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPH1083398A (ja) | 1998-03-31 |
US6208956B1 (en) | 2001-03-27 |
DE19709968A1 (de) | 1997-12-04 |
US5848386A (en) | 1998-12-08 |
JP3905179B2 (ja) | 2007-04-18 |
DE19709968C2 (de) | 2003-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3905179B2 (ja) | 文書翻訳装置及び機械読み取り可能媒体 | |
JP3220560B2 (ja) | 機械翻訳装置 | |
US5111398A (en) | Processing natural language text using autonomous punctuational structure | |
US4821230A (en) | Machine translation system | |
US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
JP3960562B2 (ja) | 機械翻訳の学習方法 | |
US20070011160A1 (en) | Literacy automation software | |
JPS62271064A (ja) | 機械翻訳システム | |
Kugler et al. | Translator’s workbench: Tools and terminology for translation and text processing | |
US5289376A (en) | Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus | |
Abolhassani et al. | Information extraction and automatic markup for XML documents | |
Van Halteren et al. | Linguistic Exploitation of Syntactic Databases: The Use of the Nijmegen LDB Program | |
Hirakawa et al. | EJ/JE Machine Translation System ASTRANSAC—Extensions toward Personalization | |
JPH0332106B2 (ja) | ||
JPH06348751A (ja) | 言語変換装置 | |
JP2838984B2 (ja) | 汎用参照装置 | |
JP2922701B2 (ja) | 言語変換方式 | |
JPH052605A (ja) | 機械翻訳方式 | |
JP2626722B2 (ja) | 日本語生成装置 | |
Bernth et al. | Terminology extraction for global content management | |
JP2521435B2 (ja) | 日本語生成装置 | |
JP3302260B2 (ja) | 文書処理システム | |
JP3233800B2 (ja) | 機械翻訳装置 | |
Fresno-Fernández et al. | eXitor: A Tool for the Assisted Edition of XML Documents. | |
JPH05143345A (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050111 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050201 |