JPH07210558A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH07210558A JPH07210558A JP6004729A JP472994A JPH07210558A JP H07210558 A JPH07210558 A JP H07210558A JP 6004729 A JP6004729 A JP 6004729A JP 472994 A JP472994 A JP 472994A JP H07210558 A JPH07210558 A JP H07210558A
- Authority
- JP
- Japan
- Prior art keywords
- document
- translation
- machine translation
- tag
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 タグを有する翻訳対象の文書を機械翻訳する
機械翻訳装置に関し、翻訳時にオペレータの知識および
常識等を必要とすることなく、正確な翻訳を行うことの
可能な機械翻訳装置の提供を目的とする。 【構成】 タグを有する翻訳対象の文書を機械翻訳する
機械翻訳装置であって、前記タグを機械翻訳の補助情報
に変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳エンジン3とを具備するように構成する。
機械翻訳装置に関し、翻訳時にオペレータの知識および
常識等を必要とすることなく、正確な翻訳を行うことの
可能な機械翻訳装置の提供を目的とする。 【構成】 タグを有する翻訳対象の文書を機械翻訳する
機械翻訳装置であって、前記タグを機械翻訳の補助情報
に変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳エンジン3とを具備するように構成する。
Description
【0001】
【産業上の利用分野】本発明は機械翻訳装置に関し、特
に、タグを有する翻訳対象の文書を機械翻訳する機械翻
訳装置に関する。近年、コンピュータ・システムの進歩
に伴って、該コンピュータ・システムを利用して第1の
言語で記載された文書を第2の言語の文書に自動的に翻
訳する機械翻訳装置が研究・開発されている。しかし、
従来の機械翻訳装置は、翻訳対象としている文書の構造
解析を正確に行うことが困難であるため、現実的に十分
に使用に耐え得るものとは言えず、正確な翻訳が可能な
機械翻訳装置の提供が要望されている。
に、タグを有する翻訳対象の文書を機械翻訳する機械翻
訳装置に関する。近年、コンピュータ・システムの進歩
に伴って、該コンピュータ・システムを利用して第1の
言語で記載された文書を第2の言語の文書に自動的に翻
訳する機械翻訳装置が研究・開発されている。しかし、
従来の機械翻訳装置は、翻訳対象としている文書の構造
解析を正確に行うことが困難であるため、現実的に十分
に使用に耐え得るものとは言えず、正確な翻訳が可能な
機械翻訳装置の提供が要望されている。
【0002】
【従来の技術】従来、コンピュータ・システムを利用し
て第1の言語で記載された文書を第2の言語で記載され
た文書に変換する機械翻訳装置が提案されている。とこ
ろで、現在、機械翻訳が翻訳の対象としている文書は、
版下原稿がそのまま翻訳対象の文書とされているため、
文書の裏情報および補助情報はもちろん、正確な表現を
繰り返すと冗長になる記述も省略されることがある。そ
こで、機械翻訳を行う場合でも、正確な翻訳を行うため
には、オペレータが上記省略部分を考慮したり、文の前
後関係から翻訳を類推するといった処理が不可欠となっ
ているのが実情である。
て第1の言語で記載された文書を第2の言語で記載され
た文書に変換する機械翻訳装置が提案されている。とこ
ろで、現在、機械翻訳が翻訳の対象としている文書は、
版下原稿がそのまま翻訳対象の文書とされているため、
文書の裏情報および補助情報はもちろん、正確な表現を
繰り返すと冗長になる記述も省略されることがある。そ
こで、機械翻訳を行う場合でも、正確な翻訳を行うため
には、オペレータが上記省略部分を考慮したり、文の前
後関係から翻訳を類推するといった処理が不可欠となっ
ているのが実情である。
【0003】そして、従来、翻訳の正確さおよび効率を
向上させる機械翻訳装置としては、特開昭60-124782 号
公報, 特開昭63-276174 号公報, および, 特開平4-423
62号公報等が提案されている。
向上させる機械翻訳装置としては、特開昭60-124782 号
公報, 特開昭63-276174 号公報, および, 特開平4-423
62号公報等が提案されている。
【0004】
【発明が解決しようとする課題】すなわち、現状の機械
翻訳装置では、人間の知識および常識に基づく処理をも
含めて翻訳を行うことは困難であり、単に、1つの文と
して閉じた情報により翻訳するようになっている。その
結果、あいまいな文を翻訳対象としてしまうことが多
く、正確な翻訳を行えない場合が多々ある。
翻訳装置では、人間の知識および常識に基づく処理をも
含めて翻訳を行うことは困難であり、単に、1つの文と
して閉じた情報により翻訳するようになっている。その
結果、あいまいな文を翻訳対象としてしまうことが多
く、正確な翻訳を行えない場合が多々ある。
【0005】また、従来、提案されている機械翻訳装置
も、翻訳の効率等の面においては十分なものとは言えな
かった。すなわち、例えば、特開昭60-124782 号公報に
記載された機械翻訳装置は、書式形態を元に認識基準を
設けるようになっており、また、特開昭63-276174 号公
報に記載された機械翻訳システムは、翻訳する時の補助
情報が一過性のものであり、訳文を作成する時に対話的
に与えるようになっている。さらに、例えば、特開平4
-42362号公報等に記載されている日本語処理方法は、主
語・述語等の省略時において、候補群バッファから利用
するものであり、あくまでも推定しているに過ぎない。
も、翻訳の効率等の面においては十分なものとは言えな
かった。すなわち、例えば、特開昭60-124782 号公報に
記載された機械翻訳装置は、書式形態を元に認識基準を
設けるようになっており、また、特開昭63-276174 号公
報に記載された機械翻訳システムは、翻訳する時の補助
情報が一過性のものであり、訳文を作成する時に対話的
に与えるようになっている。さらに、例えば、特開平4
-42362号公報等に記載されている日本語処理方法は、主
語・述語等の省略時において、候補群バッファから利用
するものであり、あくまでも推定しているに過ぎない。
【0006】本発明は、上述した従来の機械翻訳装置が
有する課題に鑑み、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことの可
能な機械翻訳装置の提供を目的とする。
有する課題に鑑み、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことの可
能な機械翻訳装置の提供を目的とする。
【0007】
【課題を解決するための手段】図1は本発明に係る機械
翻訳装置の原理構成を示すブロック図である。本発明に
よれば、タグを有する翻訳対象の文書を機械翻訳する機
械翻訳装置であって、前記タグを機械翻訳の補助情報に
変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳処理エンジン3とを具備することを特徴とす
る機械翻訳装置が提供される。
翻訳装置の原理構成を示すブロック図である。本発明に
よれば、タグを有する翻訳対象の文書を機械翻訳する機
械翻訳装置であって、前記タグを機械翻訳の補助情報に
変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳処理エンジン3とを具備することを特徴とす
る機械翻訳装置が提供される。
【0008】
【作用】本発明の機械翻訳装置によれば、翻訳補助情報
埋め込み手段2により、定義ファイル1に従って、翻訳
対象におけるタグが翻訳補助情報として文書中に埋め込
まれる。さらに、機械翻訳処理エンジン3により、翻訳
補助情報が埋め込まれた文の機械翻訳が実行される。こ
れにより、翻訳時にオペレータの知識および常識等を必
要とすることなく、正確な翻訳を行うことができる。
埋め込み手段2により、定義ファイル1に従って、翻訳
対象におけるタグが翻訳補助情報として文書中に埋め込
まれる。さらに、機械翻訳処理エンジン3により、翻訳
補助情報が埋め込まれた文の機械翻訳が実行される。こ
れにより、翻訳時にオペレータの知識および常識等を必
要とすることなく、正確な翻訳を行うことができる。
【0009】ここで、本発明の機械翻訳装置が翻訳対象
とするタグを有する文書は、例えば、標準一般化マーク
付け言語の文書であるが、以下に、この標準一般化マー
ク付け言語の文書(以下、SGML文章とも称する)の
説明を行う。標準一般化マーク付け言語(Standard Gen
eralized Markup Language: SGML) は、1986年
に国際標準化機構(International Standardization Or
ganization: ISO)で制定された文書の交換形式に関
する国際規約ISO 8879であり、1992年に我が国(日
本国)においてJIS X4151-1992として国内規約になって
いる。すなわち、SGMLは、パーソナルコンピュータ
(PC)やワードプロセッサ(WP)等によって電子化
される文書の再利用を行い易くするために、文書中に論
理構造を示すマークであるタグ(荷札)および文書構造
の記述方法の国際標準化を図ったものである。
とするタグを有する文書は、例えば、標準一般化マーク
付け言語の文書であるが、以下に、この標準一般化マー
ク付け言語の文書(以下、SGML文章とも称する)の
説明を行う。標準一般化マーク付け言語(Standard Gen
eralized Markup Language: SGML) は、1986年
に国際標準化機構(International Standardization Or
ganization: ISO)で制定された文書の交換形式に関
する国際規約ISO 8879であり、1992年に我が国(日
本国)においてJIS X4151-1992として国内規約になって
いる。すなわち、SGMLは、パーソナルコンピュータ
(PC)やワードプロセッサ(WP)等によって電子化
される文書の再利用を行い易くするために、文書中に論
理構造を示すマークであるタグ(荷札)および文書構造
の記述方法の国際標準化を図ったものである。
【0010】従来、このSGMLを採用することによっ
て、利用者は文書の外観(物理的特徴)からもその意味
および構造を理解することができ、また、文書作成者は
文書本体と体裁編集作業との分離を行うことができ、例
えば、共同執筆時においても文書のスタイルを一定の基
準に揃えることができるといった長所がある。本発明の
機械翻訳装置では、翻訳対象の文書としてSGML文書
のようなタグを有する文書を使用し、そのタグを翻訳補
助情報として利用することにより、正確な機械翻訳を実
現せんとするものである。
て、利用者は文書の外観(物理的特徴)からもその意味
および構造を理解することができ、また、文書作成者は
文書本体と体裁編集作業との分離を行うことができ、例
えば、共同執筆時においても文書のスタイルを一定の基
準に揃えることができるといった長所がある。本発明の
機械翻訳装置では、翻訳対象の文書としてSGML文書
のようなタグを有する文書を使用し、そのタグを翻訳補
助情報として利用することにより、正確な機械翻訳を実
現せんとするものである。
【0011】すなわち、翻訳対象の文書におけるタグを
利用して、文書中に文の裏情報・補助情報・曖昧部分の
補い情報等(α情報)の翻訳補助情報を挿入し、『文+
α情報』により機械翻訳を行う。具体的に、SGML文
書等の構造化文書ではタグを利用することにより、文書
データの他にフォーマット情報・コメント・補足語等を
文書中に持つことができる。そして、本発明の機械翻訳
装置によれば、タグ付文書のこの特質を活かし、例え
ば、フォーマット時には無効で、翻訳時には有効となる
部分をタグでマーキングすることにより、機械翻訳しや
すい文書を記述し、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことが可
能となる。
利用して、文書中に文の裏情報・補助情報・曖昧部分の
補い情報等(α情報)の翻訳補助情報を挿入し、『文+
α情報』により機械翻訳を行う。具体的に、SGML文
書等の構造化文書ではタグを利用することにより、文書
データの他にフォーマット情報・コメント・補足語等を
文書中に持つことができる。そして、本発明の機械翻訳
装置によれば、タグ付文書のこの特質を活かし、例え
ば、フォーマット時には無効で、翻訳時には有効となる
部分をタグでマーキングすることにより、機械翻訳しや
すい文書を記述し、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことが可
能となる。
【0012】
【実施例】以下、図面を参照して本発明に係る機械翻訳
装置の実施例を説明する。図2は本発明の機械翻訳装置
の一実施例の構成を示すブロック図である。同図におい
て、参照符号100 は翻訳対象としてのSGML文書(標
準一般化マーク付け言語の文書)、また、200 は後述す
る翻訳補助情報を組み込んだSGML文書を示してい
る。また、参照符号1はタグを補助情報に変換する定義
ファイル、2はSGML文書の特質を生かした翻訳処理
を行う翻訳処理装置(翻訳補助情報埋め込み手段)、3
は補助情報を認識することができる機械翻訳処理エンジ
ン、そして、4はSGML文書における補助情報の必要
個所をチェックするアラーム機構を示している。
装置の実施例を説明する。図2は本発明の機械翻訳装置
の一実施例の構成を示すブロック図である。同図におい
て、参照符号100 は翻訳対象としてのSGML文書(標
準一般化マーク付け言語の文書)、また、200 は後述す
る翻訳補助情報を組み込んだSGML文書を示してい
る。また、参照符号1はタグを補助情報に変換する定義
ファイル、2はSGML文書の特質を生かした翻訳処理
を行う翻訳処理装置(翻訳補助情報埋め込み手段)、3
は補助情報を認識することができる機械翻訳処理エンジ
ン、そして、4はSGML文書における補助情報の必要
個所をチェックするアラーム機構を示している。
【0013】SGML文書100 は、フォーマット情報・
コメント・補足語等を示すタグを有している。図2に示
すSGML文書100 において、例えば、<P> は段落(PAR
AGRAPH) を示すタグであり、<TITLE> は表題を示すタグ
であり、また、<ITEM>は項目を示すタグである。そし
て、このSGML文書100 はアラーム機構4に入力さ
れ、図4および第3の文書例を参照して後述するような
アラーム処理が行われて、翻訳補助情報が組み込まれ
る。すなわち、SGML文書100 は、アラーム機構4に
より翻訳補助情報が組み込まれたSGML文書200 に変
形され、1文づつ翻訳処理装置2に読み込まれ、定義フ
ァイル1および機械翻訳エンジン3を使用した翻訳処理
(図3および第1,第2の文書例を参照して後述する)
が行われる。図2に示すSGML文書200 において、例
えば、<A>, <B>および<B type=T>は、アラーム機構4に
より追加された翻訳補助情報を示すタグである。
コメント・補足語等を示すタグを有している。図2に示
すSGML文書100 において、例えば、<P> は段落(PAR
AGRAPH) を示すタグであり、<TITLE> は表題を示すタグ
であり、また、<ITEM>は項目を示すタグである。そし
て、このSGML文書100 はアラーム機構4に入力さ
れ、図4および第3の文書例を参照して後述するような
アラーム処理が行われて、翻訳補助情報が組み込まれ
る。すなわち、SGML文書100 は、アラーム機構4に
より翻訳補助情報が組み込まれたSGML文書200 に変
形され、1文づつ翻訳処理装置2に読み込まれ、定義フ
ァイル1および機械翻訳エンジン3を使用した翻訳処理
(図3および第1,第2の文書例を参照して後述する)
が行われる。図2に示すSGML文書200 において、例
えば、<A>, <B>および<B type=T>は、アラーム機構4に
より追加された翻訳補助情報を示すタグである。
【0014】図2に示されるように、機械翻訳エンジン
3は、辞書31, 文法32, および, 翻訳補助情報(例え
ば、<A> および<B>)に対応した専用文法33を構成する各
ファイルを使用して、第1の言語による文書(例えば、
日本語による文書)を第2の言語による文書(例えば、
英語による文書)へ機械翻訳するようになっている。以
下、第1〜第3の文書を例として、翻訳処理およびアラ
ーム処理の一例を詳述する。
3は、辞書31, 文法32, および, 翻訳補助情報(例え
ば、<A> および<B>)に対応した専用文法33を構成する各
ファイルを使用して、第1の言語による文書(例えば、
日本語による文書)を第2の言語による文書(例えば、
英語による文書)へ機械翻訳するようになっている。以
下、第1〜第3の文書を例として、翻訳処理およびアラ
ーム処理の一例を詳述する。
【0015】まず、第1の文書例『コンピュータの開発
と歴史』の一般文書およびSGML文書を比較しつつ、
本発明の機械翻訳装置における全体的な処理の一例を説
明する。 〔一般文書〕:コンピュータの開発と歴史 この一般文書による記載では、『コンピュータ』が『開
発』だけに係るか、或いは、『開発と歴史』に係るかが
不明である。
と歴史』の一般文書およびSGML文書を比較しつつ、
本発明の機械翻訳装置における全体的な処理の一例を説
明する。 〔一般文書〕:コンピュータの開発と歴史 この一般文書による記載では、『コンピュータ』が『開
発』だけに係るか、或いは、『開発と歴史』に係るかが
不明である。
【0016】すなわち、例えば、上記の日本語による文
書を英語の文書に翻訳した場合に、"Develop of a comp
uter and history" と訳されなければならないのか、或
いは、"Develop and history of a computer" と訳され
なければならないのかが明確ではない。 〔SGML文書〕:コンピュータの<MODIFY>開発と歴史
</MODIFY> これに対して、SGML文書による記載では、SGML
文書におけるタグ(<MODIFY> および</MODIFY>)を定義フ
ァイルに従って、補助情報に変換することによって、具
体的に、タグ『<MODIFY>』およびタグ『</MODIFY> 』に
挟まれた語を係り先と定義しておくことによって、『コ
ンピュータ』は『開発と歴史』に係るものと、一意に解
釈することができる。その結果、前述した日本語による
文書を英文に翻訳する場合には、一意的に、"Develop a
nd history of a computer" と訳されることになる。
書を英語の文書に翻訳した場合に、"Develop of a comp
uter and history" と訳されなければならないのか、或
いは、"Develop and history of a computer" と訳され
なければならないのかが明確ではない。 〔SGML文書〕:コンピュータの<MODIFY>開発と歴史
</MODIFY> これに対して、SGML文書による記載では、SGML
文書におけるタグ(<MODIFY> および</MODIFY>)を定義フ
ァイルに従って、補助情報に変換することによって、具
体的に、タグ『<MODIFY>』およびタグ『</MODIFY> 』に
挟まれた語を係り先と定義しておくことによって、『コ
ンピュータ』は『開発と歴史』に係るものと、一意に解
釈することができる。その結果、前述した日本語による
文書を英文に翻訳する場合には、一意的に、"Develop a
nd history of a computer" と訳されることになる。
【0017】ここで、英語に翻訳された文書に対しても
SGML文書のタグを含めるようにしてもよい。具体的
に、"<MODIFY>Develop and history</MODIFY> of a com
puter"と翻訳してもよい。なお、この場合、例えば、印
刷時においては、タグ『<MODIFY>および</MODIFY> 』を
印刷しないようになっている。図3は本発明の機械翻訳
装置における全体的な処理の一例を示すフローチャート
である。
SGML文書のタグを含めるようにしてもよい。具体的
に、"<MODIFY>Develop and history</MODIFY> of a com
puter"と翻訳してもよい。なお、この場合、例えば、印
刷時においては、タグ『<MODIFY>および</MODIFY> 』を
印刷しないようになっている。図3は本発明の機械翻訳
装置における全体的な処理の一例を示すフローチャート
である。
【0018】図3に示されるように、機械翻訳処理が開
始されると、まず、ステップS1において、タグを機械
翻訳の補助情報に変換する補助情報変換定義ファイル
(定義ファイル)を内部形式に展開する。下記の表1
は、タグを機械翻訳の補助情報に変換する補助情報変換
定義ファイル(定義ファイル)の一例を示している。
始されると、まず、ステップS1において、タグを機械
翻訳の補助情報に変換する補助情報変換定義ファイル
(定義ファイル)を内部形式に展開する。下記の表1
は、タグを機械翻訳の補助情報に変換する補助情報変換
定義ファイル(定義ファイル)の一例を示している。
【0019】
【表1】
【0020】次に、ステップS2において、原文を読み
込み、ステップS3に進んで、タグの前処理を行う。こ
こで、ステップS2で読み込む原文としては、例えば、
前述した第1の文書例『コンピュータの<modify>開発と
歴史</modify> 』である。また、ステップS3は、ステ
ップS31およびステップS32を含み、ステップS31で
は、SGML文書中のタグを機械翻訳システムが認識で
きる翻訳補助情報に変換するか、或いは、タグを取りは
ずし、また、ステップS32では、タグの前処理後の原文
を作成する。
込み、ステップS3に進んで、タグの前処理を行う。こ
こで、ステップS2で読み込む原文としては、例えば、
前述した第1の文書例『コンピュータの<modify>開発と
歴史</modify> 』である。また、ステップS3は、ステ
ップS31およびステップS32を含み、ステップS31で
は、SGML文書中のタグを機械翻訳システムが認識で
きる翻訳補助情報に変換するか、或いは、タグを取りは
ずし、また、ステップS32では、タグの前処理後の原文
を作成する。
【0021】さらに、ステップS4に進んで、機械翻訳
処理エンジン3により、第1の言語(例えば、日本語)
で記載された文書を第2の言語(例えば、英語)で記載
された文書に機械翻訳する。このステップS4は、ステ
ップS41およびステップS42を含み、ステップS41で
は、通常の機械翻訳システムに対して、翻訳補助情報に
対応した専用辞書および専用文法を負荷した環境で機械
翻訳処理エンジン3が動作し、また、ステップS42で
は、翻訳結果を出力する。
処理エンジン3により、第1の言語(例えば、日本語)
で記載された文書を第2の言語(例えば、英語)で記載
された文書に機械翻訳する。このステップS4は、ステ
ップS41およびステップS42を含み、ステップS41で
は、通常の機械翻訳システムに対して、翻訳補助情報に
対応した専用辞書および専用文法を負荷した環境で機械
翻訳処理エンジン3が動作し、また、ステップS42で
は、翻訳結果を出力する。
【0022】そして、ステップS5に進んで、タグの後
処理を行う。このステップS5は、ステップS51および
ステップS52を含み、ステップS51では、入力された原
文の中で訳文を残す必要のあるタグを元に戻し、また、
ステップS52では、SGMLによる翻訳文を出力する。
次に、第2の文書例『印刷はプリントステーションを利
用する。』の一般文書およびSGML文書を比較しつ
つ、本発明の機械翻訳装置における機械翻訳処理を説明
する。
処理を行う。このステップS5は、ステップS51および
ステップS52を含み、ステップS51では、入力された原
文の中で訳文を残す必要のあるタグを元に戻し、また、
ステップS52では、SGMLによる翻訳文を出力する。
次に、第2の文書例『印刷はプリントステーションを利
用する。』の一般文書およびSGML文書を比較しつ
つ、本発明の機械翻訳装置における機械翻訳処理を説明
する。
【0023】〔一般文書〕:印刷はプリントステーショ
ンを利用する。この一般文書による記載では、『印刷』
が『利用する』と解釈される可能性がある。すなわち、
例えば、上記の日本語による文書を英文に翻訳した場合
には、"The print uses the print station." と訳され
る可能性がある。〔SGML文書〕:印刷は<rerate ty
pe=purpose> プリントステーションを利用する。
ンを利用する。この一般文書による記載では、『印刷』
が『利用する』と解釈される可能性がある。すなわち、
例えば、上記の日本語による文書を英文に翻訳した場合
には、"The print uses the print station." と訳され
る可能性がある。〔SGML文書〕:印刷は<rerate ty
pe=purpose> プリントステーションを利用する。
【0024】これに対して、SGML文書による記載で
は、SGML文書におけるタグ(<rerate type=purpose
>) を定義ファイルに従って、補助情報に変換すること
によって、具体的に、タグ『<rerate type=purpose
>』により『印刷』が『利用する』の目的であることを
明確にすることができる。すなわち、原文の書き換え例
としては、『印刷するためには、プリントステーション
を利用する。』となり、また、制限言語への書き換え例
としては、『印刷(purpose) プリントステーションを利
用する。』となる。その結果、前述した日本語による文
書を英文に翻訳する場合には、"The print station is
used to print." と訳されることになる。
は、SGML文書におけるタグ(<rerate type=purpose
>) を定義ファイルに従って、補助情報に変換すること
によって、具体的に、タグ『<rerate type=purpose
>』により『印刷』が『利用する』の目的であることを
明確にすることができる。すなわち、原文の書き換え例
としては、『印刷するためには、プリントステーション
を利用する。』となり、また、制限言語への書き換え例
としては、『印刷(purpose) プリントステーションを利
用する。』となる。その結果、前述した日本語による文
書を英文に翻訳する場合には、"The print station is
used to print." と訳されることになる。
【0025】ここで、前述した第1の文書例と同様に、
英語に翻訳された文書に対してもSGML文書のタグを
含めるようにしてもよく、具体的に、 "<rerate type=p
urpose>The print station is used to print." と翻訳
してもよい。なお、この場合も、例えば、印刷時におい
ては、タグ『<rerate type=purpose> 』は印刷されない
ようになっている。
英語に翻訳された文書に対してもSGML文書のタグを
含めるようにしてもよく、具体的に、 "<rerate type=p
urpose>The print station is used to print." と翻訳
してもよい。なお、この場合も、例えば、印刷時におい
ては、タグ『<rerate type=purpose> 』は印刷されない
ようになっている。
【0026】さらに、第3の文書例『ABCシステム
は、文書処理に威力を発揮するシステムである。特徴
は、以下のものである。・文書管理を容易にする。・文
書印刷を高速に処理する。・大量文書から高速に検索す
る。』の一般文書およびSGML文書を比較しつつ、本
発明の機械翻訳装置におけるアラーム処理を説明する。
ここで、アラーム処理は、文書中に書き過ぎると冗長に
なる表現を追記した場合に、補助情報の入力を促された
部分を埋めるために行われる。
は、文書処理に威力を発揮するシステムである。特徴
は、以下のものである。・文書管理を容易にする。・文
書印刷を高速に処理する。・大量文書から高速に検索す
る。』の一般文書およびSGML文書を比較しつつ、本
発明の機械翻訳装置におけるアラーム処理を説明する。
ここで、アラーム処理は、文書中に書き過ぎると冗長に
なる表現を追記した場合に、補助情報の入力を促された
部分を埋めるために行われる。
【0027】〔一般文書〕:ABCシステムは、文書処
理に威力を発揮するシステムである。特徴は、以下のも
のである。 ・文書管理を容易にする。 ・文書印刷を高速に処理する。 ・大量文書から高速に検索する。
理に威力を発揮するシステムである。特徴は、以下のも
のである。 ・文書管理を容易にする。 ・文書印刷を高速に処理する。 ・大量文書から高速に検索する。
【0028】〔アラーム処理の出力結果〕:ABCシス
テムは<relate type=subj>、文書処理に威力を発揮す
るシステムである。<concern></concern> 特徴は<r
elate type=subj>、以下のものである。 ・<subj></subj> 文書管理を容易にする。 ・<subj></subj> 文書印刷を高速に処理する。
テムは<relate type=subj>、文書処理に威力を発揮す
るシステムである。<concern></concern> 特徴は<r
elate type=subj>、以下のものである。 ・<subj></subj> 文書管理を容易にする。 ・<subj></subj> 文書印刷を高速に処理する。
【0029】・<subj></subj> 大量文書から高速に検索
する。ここで、『ABCシステムは<relate type=subj
>、』における『<relate type=subj>』は、助詞
『は』の詳細情報を促す。さらに、『<concern></conce
rn>特徴は<relate type=subj>、』における『<concer
n></concern> 』は、『特徴』は何の特徴かを促し、ま
た、『<relate type=subj>』は、助詞『は』の詳細情
報を促す。そして、『<subj></subj> 文書管理を』等に
おける『<subj></subj> 』は、主語が省略されている
ので、該主語の入力を促す。
する。ここで、『ABCシステムは<relate type=subj
>、』における『<relate type=subj>』は、助詞
『は』の詳細情報を促す。さらに、『<concern></conce
rn>特徴は<relate type=subj>、』における『<concer
n></concern> 』は、『特徴』は何の特徴かを促し、ま
た、『<relate type=subj>』は、助詞『は』の詳細情
報を促す。そして、『<subj></subj> 文書管理を』等に
おける『<subj></subj> 』は、主語が省略されている
ので、該主語の入力を促す。
【0030】〔アラーム処理の出力に応じて補助情報を
追加した文書(機械翻訳の入力となる文書)〕:ABC
システムは<relate type=subj>、文書処理に威力を発
揮するシステムである。 <concern>ABCシステム</
concern>特徴としては、以下のものである。 ・<subj>ABCシステム</subj> 文書管理を容易にす
る。
追加した文書(機械翻訳の入力となる文書)〕:ABC
システムは<relate type=subj>、文書処理に威力を発
揮するシステムである。 <concern>ABCシステム</
concern>特徴としては、以下のものである。 ・<subj>ABCシステム</subj> 文書管理を容易にす
る。
【0031】・<subj>ABCシステム</subj> 文書印刷
を高速に処理する。 ・<subj>ABCシステム</subj> 大量文書から高速に検
索する。 ここで、『ABCシステムは<relate type=subj>、』に
おける『<relate type=subj>』は、助詞『は』が主語
を表すため、修正の必要がない。さらに、『 <concern>
ABCシステム</concern>特徴は<relate type=subj
>、』における『<concern>ABCシステム</concern
>』は、『ABCシステム』に関してであることを明記
し、また、助詞『は』を『としては』に修正する。そ
して、『<subj>ABCシステム</subj> 文書管理を』等
における『<subj>ABCシステム</subj> 』は、主語
が『ABCシステム』であることを追記する。
を高速に処理する。 ・<subj>ABCシステム</subj> 大量文書から高速に検
索する。 ここで、『ABCシステムは<relate type=subj>、』に
おける『<relate type=subj>』は、助詞『は』が主語
を表すため、修正の必要がない。さらに、『 <concern>
ABCシステム</concern>特徴は<relate type=subj
>、』における『<concern>ABCシステム</concern
>』は、『ABCシステム』に関してであることを明記
し、また、助詞『は』を『としては』に修正する。そ
して、『<subj>ABCシステム</subj> 文書管理を』等
における『<subj>ABCシステム</subj> 』は、主語
が『ABCシステム』であることを追記する。
【0032】図4は本発明の機械翻訳装置におけるアラ
ーム処理の一例を示すフローチャートである。アラーム
処理が開始されると、ステップS101 において、原文を
アラーム機構(4)に入力し、ステップS102 に進ん
で、原文の解析を行う。さらに、ステップS103 に進ん
で、文書の必要となる構成要素(主語, 述語)を網羅し
ているかどうかをチェックし、そして、ステップS104
に進む。
ーム処理の一例を示すフローチャートである。アラーム
処理が開始されると、ステップS101 において、原文を
アラーム機構(4)に入力し、ステップS102 に進ん
で、原文の解析を行う。さらに、ステップS103 に進ん
で、文書の必要となる構成要素(主語, 述語)を網羅し
ているかどうかをチェックし、そして、ステップS104
に進む。
【0033】ステップS104 では、機械翻訳が推定して
処理をする部分(曖昧性を含む部分)をチェックする。
さらに、ステップS105 に進んで、チェックされた部分
に補助情報の入力を促すタグを挿入し、ステップS106
に進んで、アラーム文を出力する。ここで、ステップS
103 およびS105 における処理は、例えば、上述した第
3の文書例中、『<subj></subj> 文書管理を容易にす
る。』における『<subj></subj> 』を挿入する処理に対
応する。また、ステップS104 およびS105 における処
理は、例えば、上述した第3の文書例中、『ABCシス
テムは<relate type=subj>、文書処理に威力を発揮する
システムである。』における『<relate type=subj>』を
挿入する処理に対応する。
処理をする部分(曖昧性を含む部分)をチェックする。
さらに、ステップS105 に進んで、チェックされた部分
に補助情報の入力を促すタグを挿入し、ステップS106
に進んで、アラーム文を出力する。ここで、ステップS
103 およびS105 における処理は、例えば、上述した第
3の文書例中、『<subj></subj> 文書管理を容易にす
る。』における『<subj></subj> 』を挿入する処理に対
応する。また、ステップS104 およびS105 における処
理は、例えば、上述した第3の文書例中、『ABCシス
テムは<relate type=subj>、文書処理に威力を発揮する
システムである。』における『<relate type=subj>』を
挿入する処理に対応する。
【0034】上述したように、本実施例の機械翻訳装置
によれば、文書中に書き過ぎると冗長になる表現を、気
にすることなく何度も繰り返して書くことができ、ま
た、機械翻訳エンジンに与えたい情報を文書中に直接書
くこともできる。さらに、機械翻訳エンジンがプログラ
ミング言語に近い言語を定義することも可能となり、こ
れにより、機械翻訳エンジンに正確な文(データ)を渡
すことができ、翻訳率を向上させることもできる。さら
に、機械翻訳用の文と版下文書の一元管理が可能にな
る。
によれば、文書中に書き過ぎると冗長になる表現を、気
にすることなく何度も繰り返して書くことができ、ま
た、機械翻訳エンジンに与えたい情報を文書中に直接書
くこともできる。さらに、機械翻訳エンジンがプログラ
ミング言語に近い言語を定義することも可能となり、こ
れにより、機械翻訳エンジンに正確な文(データ)を渡
すことができ、翻訳率を向上させることもできる。さら
に、機械翻訳用の文と版下文書の一元管理が可能にな
る。
【0035】
【発明の効果】以上、詳述したように、本発明の機械翻
訳装置によれば、翻訳対象におけるタグを翻訳補助情報
として文書中に埋め込んでから機械翻訳を行うことによ
って、翻訳時にオペレータの知識および常識等を必要と
することなく、正確な翻訳を行うことができる。
訳装置によれば、翻訳対象におけるタグを翻訳補助情報
として文書中に埋め込んでから機械翻訳を行うことによ
って、翻訳時にオペレータの知識および常識等を必要と
することなく、正確な翻訳を行うことができる。
【図1】本発明に係る機械翻訳装置の原理構成を示すブ
ロック図である。
ロック図である。
【図2】本発明の機械翻訳装置の一実施例の構成を示す
ブロック図である。
ブロック図である。
【図3】本発明の機械翻訳装置における全体的な処理の
一例を示すフローチャートである。
一例を示すフローチャートである。
【図4】本発明の機械翻訳装置におけるアラーム処理の
一例を示すフローチャートである。
一例を示すフローチャートである。
1…定義ファイル 2…翻訳補助情報埋め込み手段 3…機械翻訳エンジン 4…アラーム機構
Claims (8)
- 【請求項1】 タグを有する翻訳対象の文書を機械翻訳
する機械翻訳装置であって、 前記タグを機械翻訳の補助情報に変換する定義ファイル
(1)と、 該定義ファイルに従って、前記翻訳対象におけるタグを
翻訳補助情報として文書中に埋め込む翻訳補助情報埋め
込み手段(2)と、 該翻訳補助情報が埋め込まれた文を入力して機械翻訳を
実行する機械翻訳処理エンジン(3)とを具備すること
を特徴とする機械翻訳装置。 - 【請求項2】 前記翻訳対象の文書は標準一般化マーク
付け言語の文書であり、該標準一般化マーク付け言語の
文書におけるタグを翻訳補助情報に変換して機械翻訳を
行うことを特徴とする請求項1の機械翻訳装置。 - 【請求項3】 前記機械翻訳装置は、前記標準一般化マ
ーク付け言語の文書を機械翻訳し、標準一般化マーク付
け言語の文書として翻訳された文書を出力するようにな
っていることを特徴とする請求項2の機械翻訳装置。 - 【請求項4】 前記機械翻訳装置は、さらに、前記翻訳
対象の標準一般化マーク付け言語の文書において補助情
報を必要とする個所を検出し、所定のタグを加えてアラ
ーム処理を行うアラーム機構(4)を備えている請求項
1の機械翻訳装置。 - 【請求項5】 タグを有する翻訳対象の文書を機械翻訳
する機械翻訳装置であって、 前記翻訳対象の文書を原文として読み込む原文読み込み
手段と、 該原文におけるタグを機械翻訳装置が認識可能な翻訳補
助情報に変換し、或いは、取り外してタグの前処理を行
うタグ前処理手段と、 該翻訳補助情報が埋め込まれた原文を、該翻訳補助情報
に対応する専用辞書ファイルおよび専用文法ファイルを
参照して機械翻訳を実行する機械翻訳実行手段と、 該機械翻訳された翻訳文に対して、前記原文におけるタ
グに対応したタグを必要に応じて埋め込むようにタグの
後処理を行うタグ後処理手段とを具備する機械翻訳装
置。 - 【請求項6】 前記翻訳対象の文書は標準一般化マーク
付け言語の文書であり、該標準一般化マーク付け言語の
文書におけるタグを翻訳補助情報に変換して機械翻訳を
行うようになっていることを特徴とする請求項5の機械
翻訳装置。 - 【請求項7】 前記機械翻訳装置は、前記標準一般化マ
ーク付け言語の文書を機械翻訳し、標準一般化マーク付
け言語の文書として翻訳された文書を出力するようにな
っていることを特徴とする請求項5の機械翻訳装置。 - 【請求項8】 前記機械翻訳装置は、さらに、前記翻訳
対象の標準一般化マーク付け言語の文書において補助情
報を必要とする個所を検出し、所定のタグを加えてアラ
ーム処理を行うアラーム手段を備え、該アラーム手段に
より処理された文書を前記原文読み込み手段が読み込む
ようになっていることを特徴とする請求項5の機械翻訳
装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6004729A JPH07210558A (ja) | 1994-01-20 | 1994-01-20 | 機械翻訳装置 |
US08/330,849 US5548508A (en) | 1994-01-20 | 1994-10-28 | Machine translation apparatus for translating document with tag |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6004729A JPH07210558A (ja) | 1994-01-20 | 1994-01-20 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07210558A true JPH07210558A (ja) | 1995-08-11 |
Family
ID=11591994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6004729A Pending JPH07210558A (ja) | 1994-01-20 | 1994-01-20 | 機械翻訳装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5548508A (ja) |
JP (1) | JPH07210558A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020020405A (ko) * | 2000-09-08 | 2002-03-15 | 정규석 | 가상번역계층을 갖는 기계번역장치 |
CN111178088A (zh) * | 2019-12-20 | 2020-05-19 | 沈阳雅译网络技术有限公司 | 一种面向xml文档的可配置神经机器翻译方法 |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0830620A (ja) * | 1994-07-19 | 1996-02-02 | Fuji Xerox Co Ltd | 構造検索装置 |
US5987402A (en) * | 1995-01-31 | 1999-11-16 | Oki Electric Industry Co., Ltd. | System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device |
US6073143A (en) * | 1995-10-20 | 2000-06-06 | Sanyo Electric Co., Ltd. | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request |
US6993471B1 (en) * | 1995-11-13 | 2006-01-31 | America Online, Inc. | Integrated multilingual browser |
US5745908A (en) * | 1996-03-29 | 1998-04-28 | Systems Focus International | Method for converting a word processing file containing markup language tags and conventional computer code |
US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
EP0810533B1 (en) * | 1996-05-29 | 2002-04-10 | Matsushita Electric Industrial Co., Ltd. | Document conversion apparatus |
US5987245A (en) | 1996-07-01 | 1999-11-16 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture (#12) for a client-server state machine framework |
US6038590A (en) | 1996-07-01 | 2000-03-14 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server state machine in an interprise computing framework system |
US5999972A (en) | 1996-07-01 | 1999-12-07 | Sun Microsystems, Inc. | System, method and article of manufacture for a distributed computer system framework |
US6266709B1 (en) | 1996-07-01 | 2001-07-24 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server failure reporting process |
US6434598B1 (en) | 1996-07-01 | 2002-08-13 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server graphical user interface (#9) framework in an interprise computing framework system |
US5848246A (en) | 1996-07-01 | 1998-12-08 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server session manager in an interprise computing framework system |
US6424991B1 (en) | 1996-07-01 | 2002-07-23 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server communication framework |
US6272555B1 (en) | 1996-07-01 | 2001-08-07 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server-centric interprise computing framework system |
US6304893B1 (en) | 1996-07-01 | 2001-10-16 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server event driven message framework in an interprise computing framework system |
JP3121548B2 (ja) * | 1996-10-15 | 2001-01-09 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 機械翻訳方法及び装置 |
JPH10134038A (ja) * | 1996-10-29 | 1998-05-22 | Fujitsu Ltd | 文書情報送信装置、文書情報受信装置、および文書情報処理装置 |
JPH10143403A (ja) * | 1996-11-12 | 1998-05-29 | Fujitsu Ltd | 情報管理装置および情報管理プログラム記憶媒体 |
US6081815A (en) * | 1997-10-06 | 2000-06-27 | Motorola, Inc. | Method for processing a hyperlink formatted message to make it compatible with an alphanumeric messaging device |
US6041326A (en) * | 1997-11-14 | 2000-03-21 | International Business Machines Corporation | Method and system in a computer network for an intelligent search engine |
US8489980B2 (en) * | 1998-02-23 | 2013-07-16 | Transperfect Global, Inc. | Translation management system |
US10541973B2 (en) | 1998-02-23 | 2020-01-21 | Transperfect Global, Inc. | Service of cached translated content in a requested language |
US6959318B1 (en) * | 1998-03-06 | 2005-10-25 | Intel Corporation | Method of proxy-assisted predictive pre-fetching with transcoding |
US6356920B1 (en) * | 1998-03-09 | 2002-03-12 | X-Aware, Inc | Dynamic, hierarchical data exchange system |
US6480865B1 (en) | 1998-10-05 | 2002-11-12 | International Business Machines Corporation | Facility for adding dynamism to an extensible markup language |
US6487566B1 (en) * | 1998-10-05 | 2002-11-26 | International Business Machines Corporation | Transforming documents using pattern matching and a replacement language |
US6569207B1 (en) | 1998-10-05 | 2003-05-27 | International Business Machines Corporation | Converting schemas to component models |
US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
WO2000057320A2 (en) * | 1999-03-19 | 2000-09-28 | Trados Gmbh | Workflow management system |
US7139971B1 (en) * | 1999-07-21 | 2006-11-21 | Nec Corporation | Method of searching for and retrieving information from structure documents |
US6993476B1 (en) * | 1999-08-26 | 2006-01-31 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
US6598015B1 (en) * | 1999-09-10 | 2003-07-22 | Rws Group, Llc | Context based computer-assisted language translation |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
JP2001331362A (ja) * | 2000-03-17 | 2001-11-30 | Sony Corp | ファイル変換方法、データ変換装置及びファイル表示システム |
AUPR329501A0 (en) * | 2001-02-22 | 2001-03-22 | Worldlingo, Inc | Translation information segment |
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US20030018668A1 (en) * | 2001-07-20 | 2003-01-23 | International Business Machines Corporation | Enhanced transcoding of structured documents through use of annotation techniques |
FR2833375B1 (fr) * | 2001-12-07 | 2004-06-04 | Amadeus | Procede, dispositif d'adaptation de fichiers numeriques |
AU2003269808A1 (en) | 2002-03-26 | 2004-01-06 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US20040148591A1 (en) * | 2003-01-23 | 2004-07-29 | International Business Machines Corporation | Method, apparatus, and program for automated application context delivery to translators |
US7797626B2 (en) * | 2003-02-12 | 2010-09-14 | Sap Ag | Managing different representations of information |
US20040230898A1 (en) * | 2003-05-13 | 2004-11-18 | International Business Machines Corporation | Identifying topics in structured documents for machine translation |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US20080097837A1 (en) * | 2006-10-23 | 2008-04-24 | Format Dynamics, Llc | Method and system for printing information related to internet advertisements |
US7386791B2 (en) * | 2003-09-24 | 2008-06-10 | Format Dynamics, Llc | Method and systems for creating a digital document altered in response to at least one event |
US20100262621A1 (en) * | 2004-03-05 | 2010-10-14 | Russ Ross | In-context exact (ice) matching |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
DE112005002534T5 (de) | 2004-10-12 | 2007-11-08 | University Of Southern California, Los Angeles | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) * | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
GB2468278A (en) * | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US9262403B2 (en) * | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8775156B2 (en) * | 2010-08-05 | 2014-07-08 | Google Inc. | Translating languages in response to device motion |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0442704B2 (ja) * | 1985-08-22 | 1992-07-14 | Tokyo Shibaura Electric Co | |
JPH0561906A (ja) * | 1991-06-20 | 1993-03-12 | Ricoh Co Ltd | 言語変換方式 |
JPH05307563A (ja) * | 1992-04-28 | 1993-11-19 | Sharp Corp | 翻訳装置 |
JPH05334347A (ja) * | 1992-05-29 | 1993-12-17 | Sharp Corp | 翻訳装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
JPS5896372A (ja) * | 1982-03-29 | 1983-06-08 | Sharp Corp | 電子式翻訳機 |
JPS60124782A (ja) * | 1983-12-09 | 1985-07-03 | Fujitsu Ltd | 機械翻訳装置 |
JP2654001B2 (ja) * | 1986-05-08 | 1997-09-17 | 株式会社東芝 | 機械翻訳方法 |
JPS63276174A (ja) * | 1987-05-07 | 1988-11-14 | Toshiba Corp | 機械翻訳システム |
JPS63316162A (ja) * | 1987-06-18 | 1988-12-23 | Brother Ind Ltd | 文書作成装置 |
US5140521A (en) * | 1989-04-26 | 1992-08-18 | International Business Machines Corporation | Method for deleting a marked portion of a structured document |
JPH0442362A (ja) * | 1990-06-07 | 1992-02-12 | Fujitsu Ltd | 日本語処理方法 |
JP2719453B2 (ja) * | 1991-03-08 | 1998-02-25 | シャープ株式会社 | 機械翻訳装置 |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
US5384700A (en) * | 1992-10-29 | 1995-01-24 | International Business Machines Corporation | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document |
-
1994
- 1994-01-20 JP JP6004729A patent/JPH07210558A/ja active Pending
- 1994-10-28 US US08/330,849 patent/US5548508A/en not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0442704B2 (ja) * | 1985-08-22 | 1992-07-14 | Tokyo Shibaura Electric Co | |
JPH0561906A (ja) * | 1991-06-20 | 1993-03-12 | Ricoh Co Ltd | 言語変換方式 |
JPH05307563A (ja) * | 1992-04-28 | 1993-11-19 | Sharp Corp | 翻訳装置 |
JPH05334347A (ja) * | 1992-05-29 | 1993-12-17 | Sharp Corp | 翻訳装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020020405A (ko) * | 2000-09-08 | 2002-03-15 | 정규석 | 가상번역계층을 갖는 기계번역장치 |
CN111178088A (zh) * | 2019-12-20 | 2020-05-19 | 沈阳雅译网络技术有限公司 | 一种面向xml文档的可配置神经机器翻译方法 |
CN111178088B (zh) * | 2019-12-20 | 2023-06-02 | 沈阳雅译网络技术有限公司 | 一种面向xml文档的可配置神经机器翻译方法 |
Also Published As
Publication number | Publication date |
---|---|
US5548508A (en) | 1996-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07210558A (ja) | 機械翻訳装置 | |
JP2006277103A (ja) | 文書翻訳方法および文書翻訳装置 | |
JPH0644296A (ja) | 機械翻訳装置 | |
JP4947861B2 (ja) | 自然言語処理装置およびその制御方法ならびにプログラム | |
US20040254783A1 (en) | Third language text generating algorithm by multi-lingual text inputting and device and program therefor | |
JP2004220266A (ja) | 機械翻訳装置および機械翻訳方法 | |
JP5107556B2 (ja) | 改善された中国語−英語翻訳ツール | |
JP2003186889A (ja) | 文書に注釈付けし、文書イメージから要約を生成する方法及び装置 | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
JP2006252164A (ja) | 中国語文書処理装置 | |
JPH08212216A (ja) | 自然言語処理装置および自然言語処理方法 | |
JP2004287679A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
KR102661819B1 (ko) | 시간적 관계정보의 컨텍스트 이해를 위한 오픈 도메인 정보 활용 방법 | |
JP4313967B2 (ja) | 自然言語変換システム | |
JP3599563B2 (ja) | ファイル処理制御方法、データ処理装置、コンピュータ読取可能な記録媒体 | |
JP4021813B2 (ja) | 複合語登録プログラムおよび登録装置 | |
JP2000029882A (ja) | 要約文作成装置 | |
JP2972212B2 (ja) | 機械翻訳方法及びシステム | |
JPH11282844A (ja) | 文書作成方法および情報処理装置および記録媒体 | |
JPH10134059A (ja) | Html文書処理装置及びhtml文書処理方法 | |
JP2005038316A (ja) | プログラムソース変換方式および方法ならびにプログラム | |
JP2004248245A (ja) | 文書処理装置 | |
JP3939151B2 (ja) | 訳語選択装置および訳語選択プログラムおよび訳語選択プログラムを記憶した媒体 | |
US8972239B2 (en) | Syntax analysis information generation apparatus, translation apparatus, translation system, syntax analysis information generating method and computer program | |
JP2004086420A (ja) | 文書管理装置および文書登録プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20030930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20040625 |