JPH07210558A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07210558A
JPH07210558A JP6004729A JP472994A JPH07210558A JP H07210558 A JPH07210558 A JP H07210558A JP 6004729 A JP6004729 A JP 6004729A JP 472994 A JP472994 A JP 472994A JP H07210558 A JPH07210558 A JP H07210558A
Authority
JP
Japan
Prior art keywords
document
translation
machine translation
tag
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6004729A
Other languages
English (en)
Inventor
Wataru Nagami
渡 永見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6004729A priority Critical patent/JPH07210558A/ja
Priority to US08/330,849 priority patent/US5548508A/en
Publication of JPH07210558A publication Critical patent/JPH07210558A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 タグを有する翻訳対象の文書を機械翻訳する
機械翻訳装置に関し、翻訳時にオペレータの知識および
常識等を必要とすることなく、正確な翻訳を行うことの
可能な機械翻訳装置の提供を目的とする。 【構成】 タグを有する翻訳対象の文書を機械翻訳する
機械翻訳装置であって、前記タグを機械翻訳の補助情報
に変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳エンジン3とを具備するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳装置に関し、特
に、タグを有する翻訳対象の文書を機械翻訳する機械翻
訳装置に関する。近年、コンピュータ・システムの進歩
に伴って、該コンピュータ・システムを利用して第1の
言語で記載された文書を第2の言語の文書に自動的に翻
訳する機械翻訳装置が研究・開発されている。しかし、
従来の機械翻訳装置は、翻訳対象としている文書の構造
解析を正確に行うことが困難であるため、現実的に十分
に使用に耐え得るものとは言えず、正確な翻訳が可能な
機械翻訳装置の提供が要望されている。
【0002】
【従来の技術】従来、コンピュータ・システムを利用し
て第1の言語で記載された文書を第2の言語で記載され
た文書に変換する機械翻訳装置が提案されている。とこ
ろで、現在、機械翻訳が翻訳の対象としている文書は、
版下原稿がそのまま翻訳対象の文書とされているため、
文書の裏情報および補助情報はもちろん、正確な表現を
繰り返すと冗長になる記述も省略されることがある。そ
こで、機械翻訳を行う場合でも、正確な翻訳を行うため
には、オペレータが上記省略部分を考慮したり、文の前
後関係から翻訳を類推するといった処理が不可欠となっ
ているのが実情である。
【0003】そして、従来、翻訳の正確さおよび効率を
向上させる機械翻訳装置としては、特開昭60-124782 号
公報, 特開昭63-276174 号公報, および, 特開平4-423
62号公報等が提案されている。
【0004】
【発明が解決しようとする課題】すなわち、現状の機械
翻訳装置では、人間の知識および常識に基づく処理をも
含めて翻訳を行うことは困難であり、単に、1つの文と
して閉じた情報により翻訳するようになっている。その
結果、あいまいな文を翻訳対象としてしまうことが多
く、正確な翻訳を行えない場合が多々ある。
【0005】また、従来、提案されている機械翻訳装置
も、翻訳の効率等の面においては十分なものとは言えな
かった。すなわち、例えば、特開昭60-124782 号公報に
記載された機械翻訳装置は、書式形態を元に認識基準を
設けるようになっており、また、特開昭63-276174 号公
報に記載された機械翻訳システムは、翻訳する時の補助
情報が一過性のものであり、訳文を作成する時に対話的
に与えるようになっている。さらに、例えば、特開平4
-42362号公報等に記載されている日本語処理方法は、主
語・述語等の省略時において、候補群バッファから利用
するものであり、あくまでも推定しているに過ぎない。
【0006】本発明は、上述した従来の機械翻訳装置が
有する課題に鑑み、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことの可
能な機械翻訳装置の提供を目的とする。
【0007】
【課題を解決するための手段】図1は本発明に係る機械
翻訳装置の原理構成を示すブロック図である。本発明に
よれば、タグを有する翻訳対象の文書を機械翻訳する機
械翻訳装置であって、前記タグを機械翻訳の補助情報に
変換する定義ファイル1と、該定義ファイル1に従っ
て、前記翻訳対象におけるタグを翻訳補助情報として文
書中に埋め込む翻訳補助情報埋め込み手段2と、該翻訳
補助情報が埋め込まれた文を入力して機械翻訳を実行す
る機械翻訳処理エンジン3とを具備することを特徴とす
る機械翻訳装置が提供される。
【0008】
【作用】本発明の機械翻訳装置によれば、翻訳補助情報
埋め込み手段2により、定義ファイル1に従って、翻訳
対象におけるタグが翻訳補助情報として文書中に埋め込
まれる。さらに、機械翻訳処理エンジン3により、翻訳
補助情報が埋め込まれた文の機械翻訳が実行される。こ
れにより、翻訳時にオペレータの知識および常識等を必
要とすることなく、正確な翻訳を行うことができる。
【0009】ここで、本発明の機械翻訳装置が翻訳対象
とするタグを有する文書は、例えば、標準一般化マーク
付け言語の文書であるが、以下に、この標準一般化マー
ク付け言語の文書(以下、SGML文章とも称する)の
説明を行う。標準一般化マーク付け言語(Standard Gen
eralized Markup Language: SGML) は、1986年
に国際標準化機構(International Standardization Or
ganization: ISO)で制定された文書の交換形式に関
する国際規約ISO 8879であり、1992年に我が国(日
本国)においてJIS X4151-1992として国内規約になって
いる。すなわち、SGMLは、パーソナルコンピュータ
(PC)やワードプロセッサ(WP)等によって電子化
される文書の再利用を行い易くするために、文書中に論
理構造を示すマークであるタグ(荷札)および文書構造
の記述方法の国際標準化を図ったものである。
【0010】従来、このSGMLを採用することによっ
て、利用者は文書の外観(物理的特徴)からもその意味
および構造を理解することができ、また、文書作成者は
文書本体と体裁編集作業との分離を行うことができ、例
えば、共同執筆時においても文書のスタイルを一定の基
準に揃えることができるといった長所がある。本発明の
機械翻訳装置では、翻訳対象の文書としてSGML文書
のようなタグを有する文書を使用し、そのタグを翻訳補
助情報として利用することにより、正確な機械翻訳を実
現せんとするものである。
【0011】すなわち、翻訳対象の文書におけるタグを
利用して、文書中に文の裏情報・補助情報・曖昧部分の
補い情報等(α情報)の翻訳補助情報を挿入し、『文+
α情報』により機械翻訳を行う。具体的に、SGML文
書等の構造化文書ではタグを利用することにより、文書
データの他にフォーマット情報・コメント・補足語等を
文書中に持つことができる。そして、本発明の機械翻訳
装置によれば、タグ付文書のこの特質を活かし、例え
ば、フォーマット時には無効で、翻訳時には有効となる
部分をタグでマーキングすることにより、機械翻訳しや
すい文書を記述し、翻訳時にオペレータの知識および常
識等を必要とすることなく、正確な翻訳を行うことが可
能となる。
【0012】
【実施例】以下、図面を参照して本発明に係る機械翻訳
装置の実施例を説明する。図2は本発明の機械翻訳装置
の一実施例の構成を示すブロック図である。同図におい
て、参照符号100 は翻訳対象としてのSGML文書(標
準一般化マーク付け言語の文書)、また、200 は後述す
る翻訳補助情報を組み込んだSGML文書を示してい
る。また、参照符号1はタグを補助情報に変換する定義
ファイル、2はSGML文書の特質を生かした翻訳処理
を行う翻訳処理装置(翻訳補助情報埋め込み手段)、3
は補助情報を認識することができる機械翻訳処理エンジ
ン、そして、4はSGML文書における補助情報の必要
個所をチェックするアラーム機構を示している。
【0013】SGML文書100 は、フォーマット情報・
コメント・補足語等を示すタグを有している。図2に示
すSGML文書100 において、例えば、<P> は段落(PAR
AGRAPH) を示すタグであり、<TITLE> は表題を示すタグ
であり、また、<ITEM>は項目を示すタグである。そし
て、このSGML文書100 はアラーム機構4に入力さ
れ、図4および第3の文書例を参照して後述するような
アラーム処理が行われて、翻訳補助情報が組み込まれ
る。すなわち、SGML文書100 は、アラーム機構4に
より翻訳補助情報が組み込まれたSGML文書200 に変
形され、1文づつ翻訳処理装置2に読み込まれ、定義フ
ァイル1および機械翻訳エンジン3を使用した翻訳処理
(図3および第1,第2の文書例を参照して後述する)
が行われる。図2に示すSGML文書200 において、例
えば、<A>, <B>および<B type=T>は、アラーム機構4に
より追加された翻訳補助情報を示すタグである。
【0014】図2に示されるように、機械翻訳エンジン
3は、辞書31, 文法32, および, 翻訳補助情報(例え
ば、<A> および<B>)に対応した専用文法33を構成する各
ファイルを使用して、第1の言語による文書(例えば、
日本語による文書)を第2の言語による文書(例えば、
英語による文書)へ機械翻訳するようになっている。以
下、第1〜第3の文書を例として、翻訳処理およびアラ
ーム処理の一例を詳述する。
【0015】まず、第1の文書例『コンピュータの開発
と歴史』の一般文書およびSGML文書を比較しつつ、
本発明の機械翻訳装置における全体的な処理の一例を説
明する。 〔一般文書〕:コンピュータの開発と歴史 この一般文書による記載では、『コンピュータ』が『開
発』だけに係るか、或いは、『開発と歴史』に係るかが
不明である。
【0016】すなわち、例えば、上記の日本語による文
書を英語の文書に翻訳した場合に、"Develop of a comp
uter and history" と訳されなければならないのか、或
いは、"Develop and history of a computer" と訳され
なければならないのかが明確ではない。 〔SGML文書〕:コンピュータの<MODIFY>開発と歴史
</MODIFY> これに対して、SGML文書による記載では、SGML
文書におけるタグ(<MODIFY> および</MODIFY>)を定義フ
ァイルに従って、補助情報に変換することによって、具
体的に、タグ『<MODIFY>』およびタグ『</MODIFY> 』に
挟まれた語を係り先と定義しておくことによって、『コ
ンピュータ』は『開発と歴史』に係るものと、一意に解
釈することができる。その結果、前述した日本語による
文書を英文に翻訳する場合には、一意的に、"Develop a
nd history of a computer" と訳されることになる。
【0017】ここで、英語に翻訳された文書に対しても
SGML文書のタグを含めるようにしてもよい。具体的
に、"<MODIFY>Develop and history</MODIFY> of a com
puter"と翻訳してもよい。なお、この場合、例えば、印
刷時においては、タグ『<MODIFY>および</MODIFY> 』を
印刷しないようになっている。図3は本発明の機械翻訳
装置における全体的な処理の一例を示すフローチャート
である。
【0018】図3に示されるように、機械翻訳処理が開
始されると、まず、ステップS1において、タグを機械
翻訳の補助情報に変換する補助情報変換定義ファイル
(定義ファイル)を内部形式に展開する。下記の表1
は、タグを機械翻訳の補助情報に変換する補助情報変換
定義ファイル(定義ファイル)の一例を示している。
【0019】
【表1】
【0020】次に、ステップS2において、原文を読み
込み、ステップS3に進んで、タグの前処理を行う。こ
こで、ステップS2で読み込む原文としては、例えば、
前述した第1の文書例『コンピュータの<modify>開発と
歴史</modify> 』である。また、ステップS3は、ステ
ップS31およびステップS32を含み、ステップS31で
は、SGML文書中のタグを機械翻訳システムが認識で
きる翻訳補助情報に変換するか、或いは、タグを取りは
ずし、また、ステップS32では、タグの前処理後の原文
を作成する。
【0021】さらに、ステップS4に進んで、機械翻訳
処理エンジン3により、第1の言語(例えば、日本語)
で記載された文書を第2の言語(例えば、英語)で記載
された文書に機械翻訳する。このステップS4は、ステ
ップS41およびステップS42を含み、ステップS41で
は、通常の機械翻訳システムに対して、翻訳補助情報に
対応した専用辞書および専用文法を負荷した環境で機械
翻訳処理エンジン3が動作し、また、ステップS42で
は、翻訳結果を出力する。
【0022】そして、ステップS5に進んで、タグの後
処理を行う。このステップS5は、ステップS51および
ステップS52を含み、ステップS51では、入力された原
文の中で訳文を残す必要のあるタグを元に戻し、また、
ステップS52では、SGMLによる翻訳文を出力する。
次に、第2の文書例『印刷はプリントステーションを利
用する。』の一般文書およびSGML文書を比較しつ
つ、本発明の機械翻訳装置における機械翻訳処理を説明
する。
【0023】〔一般文書〕:印刷はプリントステーショ
ンを利用する。この一般文書による記載では、『印刷』
が『利用する』と解釈される可能性がある。すなわち、
例えば、上記の日本語による文書を英文に翻訳した場合
には、"The print uses the print station." と訳され
る可能性がある。〔SGML文書〕:印刷は<rerate ty
pe=purpose> プリントステーションを利用する。
【0024】これに対して、SGML文書による記載で
は、SGML文書におけるタグ(<rerate type=purpose
>) を定義ファイルに従って、補助情報に変換すること
によって、具体的に、タグ『<rerate type=purpose
>』により『印刷』が『利用する』の目的であることを
明確にすることができる。すなわち、原文の書き換え例
としては、『印刷するためには、プリントステーション
を利用する。』となり、また、制限言語への書き換え例
としては、『印刷(purpose) プリントステーションを利
用する。』となる。その結果、前述した日本語による文
書を英文に翻訳する場合には、"The print station is
used to print." と訳されることになる。
【0025】ここで、前述した第1の文書例と同様に、
英語に翻訳された文書に対してもSGML文書のタグを
含めるようにしてもよく、具体的に、 "<rerate type=p
urpose>The print station is used to print." と翻訳
してもよい。なお、この場合も、例えば、印刷時におい
ては、タグ『<rerate type=purpose> 』は印刷されない
ようになっている。
【0026】さらに、第3の文書例『ABCシステム
は、文書処理に威力を発揮するシステムである。特徴
は、以下のものである。・文書管理を容易にする。・文
書印刷を高速に処理する。・大量文書から高速に検索す
る。』の一般文書およびSGML文書を比較しつつ、本
発明の機械翻訳装置におけるアラーム処理を説明する。
ここで、アラーム処理は、文書中に書き過ぎると冗長に
なる表現を追記した場合に、補助情報の入力を促された
部分を埋めるために行われる。
【0027】〔一般文書〕:ABCシステムは、文書処
理に威力を発揮するシステムである。特徴は、以下のも
のである。 ・文書管理を容易にする。 ・文書印刷を高速に処理する。 ・大量文書から高速に検索する。
【0028】〔アラーム処理の出力結果〕:ABCシス
テムは<relate type=subj>、文書処理に威力を発揮す
るシステムである。<concern></concern> 特徴は<r
elate type=subj>、以下のものである。 ・<subj></subj> 文書管理を容易にする。 ・<subj></subj> 文書印刷を高速に処理する。
【0029】・<subj></subj> 大量文書から高速に検索
する。ここで、『ABCシステムは<relate type=subj
>、』における『<relate type=subj>』は、助詞
『は』の詳細情報を促す。さらに、『<concern></conce
rn>特徴は<relate type=subj>、』における『<concer
n></concern> 』は、『特徴』は何の特徴かを促し、ま
た、『<relate type=subj>』は、助詞『は』の詳細情
報を促す。そして、『<subj></subj> 文書管理を』等に
おける『<subj></subj> 』は、主語が省略されている
ので、該主語の入力を促す。
【0030】〔アラーム処理の出力に応じて補助情報を
追加した文書(機械翻訳の入力となる文書)〕:ABC
システムは<relate type=subj>、文書処理に威力を発
揮するシステムである。 <concern>ABCシステム</
concern>特徴としては、以下のものである。 ・<subj>ABCシステム</subj> 文書管理を容易にす
る。
【0031】・<subj>ABCシステム</subj> 文書印刷
を高速に処理する。 ・<subj>ABCシステム</subj> 大量文書から高速に検
索する。 ここで、『ABCシステムは<relate type=subj>、』に
おける『<relate type=subj>』は、助詞『は』が主語
を表すため、修正の必要がない。さらに、『 <concern>
ABCシステム</concern>特徴は<relate type=subj
>、』における『<concern>ABCシステム</concern
>』は、『ABCシステム』に関してであることを明記
し、また、助詞『は』を『としては』に修正する。そ
して、『<subj>ABCシステム</subj> 文書管理を』等
における『<subj>ABCシステム</subj> 』は、主語
が『ABCシステム』であることを追記する。
【0032】図4は本発明の機械翻訳装置におけるアラ
ーム処理の一例を示すフローチャートである。アラーム
処理が開始されると、ステップS101 において、原文を
アラーム機構(4)に入力し、ステップS102 に進ん
で、原文の解析を行う。さらに、ステップS103 に進ん
で、文書の必要となる構成要素(主語, 述語)を網羅し
ているかどうかをチェックし、そして、ステップS104
に進む。
【0033】ステップS104 では、機械翻訳が推定して
処理をする部分(曖昧性を含む部分)をチェックする。
さらに、ステップS105 に進んで、チェックされた部分
に補助情報の入力を促すタグを挿入し、ステップS106
に進んで、アラーム文を出力する。ここで、ステップS
103 およびS105 における処理は、例えば、上述した第
3の文書例中、『<subj></subj> 文書管理を容易にす
る。』における『<subj></subj> 』を挿入する処理に対
応する。また、ステップS104 およびS105 における処
理は、例えば、上述した第3の文書例中、『ABCシス
テムは<relate type=subj>、文書処理に威力を発揮する
システムである。』における『<relate type=subj>』を
挿入する処理に対応する。
【0034】上述したように、本実施例の機械翻訳装置
によれば、文書中に書き過ぎると冗長になる表現を、気
にすることなく何度も繰り返して書くことができ、ま
た、機械翻訳エンジンに与えたい情報を文書中に直接書
くこともできる。さらに、機械翻訳エンジンがプログラ
ミング言語に近い言語を定義することも可能となり、こ
れにより、機械翻訳エンジンに正確な文(データ)を渡
すことができ、翻訳率を向上させることもできる。さら
に、機械翻訳用の文と版下文書の一元管理が可能にな
る。
【0035】
【発明の効果】以上、詳述したように、本発明の機械翻
訳装置によれば、翻訳対象におけるタグを翻訳補助情報
として文書中に埋め込んでから機械翻訳を行うことによ
って、翻訳時にオペレータの知識および常識等を必要と
することなく、正確な翻訳を行うことができる。
【図面の簡単な説明】
【図1】本発明に係る機械翻訳装置の原理構成を示すブ
ロック図である。
【図2】本発明の機械翻訳装置の一実施例の構成を示す
ブロック図である。
【図3】本発明の機械翻訳装置における全体的な処理の
一例を示すフローチャートである。
【図4】本発明の機械翻訳装置におけるアラーム処理の
一例を示すフローチャートである。
【符号の説明】
1…定義ファイル 2…翻訳補助情報埋め込み手段 3…機械翻訳エンジン 4…アラーム機構

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 タグを有する翻訳対象の文書を機械翻訳
    する機械翻訳装置であって、 前記タグを機械翻訳の補助情報に変換する定義ファイル
    (1)と、 該定義ファイルに従って、前記翻訳対象におけるタグを
    翻訳補助情報として文書中に埋め込む翻訳補助情報埋め
    込み手段(2)と、 該翻訳補助情報が埋め込まれた文を入力して機械翻訳を
    実行する機械翻訳処理エンジン(3)とを具備すること
    を特徴とする機械翻訳装置。
  2. 【請求項2】 前記翻訳対象の文書は標準一般化マーク
    付け言語の文書であり、該標準一般化マーク付け言語の
    文書におけるタグを翻訳補助情報に変換して機械翻訳を
    行うことを特徴とする請求項1の機械翻訳装置。
  3. 【請求項3】 前記機械翻訳装置は、前記標準一般化マ
    ーク付け言語の文書を機械翻訳し、標準一般化マーク付
    け言語の文書として翻訳された文書を出力するようにな
    っていることを特徴とする請求項2の機械翻訳装置。
  4. 【請求項4】 前記機械翻訳装置は、さらに、前記翻訳
    対象の標準一般化マーク付け言語の文書において補助情
    報を必要とする個所を検出し、所定のタグを加えてアラ
    ーム処理を行うアラーム機構(4)を備えている請求項
    1の機械翻訳装置。
  5. 【請求項5】 タグを有する翻訳対象の文書を機械翻訳
    する機械翻訳装置であって、 前記翻訳対象の文書を原文として読み込む原文読み込み
    手段と、 該原文におけるタグを機械翻訳装置が認識可能な翻訳補
    助情報に変換し、或いは、取り外してタグの前処理を行
    うタグ前処理手段と、 該翻訳補助情報が埋め込まれた原文を、該翻訳補助情報
    に対応する専用辞書ファイルおよび専用文法ファイルを
    参照して機械翻訳を実行する機械翻訳実行手段と、 該機械翻訳された翻訳文に対して、前記原文におけるタ
    グに対応したタグを必要に応じて埋め込むようにタグの
    後処理を行うタグ後処理手段とを具備する機械翻訳装
    置。
  6. 【請求項6】 前記翻訳対象の文書は標準一般化マーク
    付け言語の文書であり、該標準一般化マーク付け言語の
    文書におけるタグを翻訳補助情報に変換して機械翻訳を
    行うようになっていることを特徴とする請求項5の機械
    翻訳装置。
  7. 【請求項7】 前記機械翻訳装置は、前記標準一般化マ
    ーク付け言語の文書を機械翻訳し、標準一般化マーク付
    け言語の文書として翻訳された文書を出力するようにな
    っていることを特徴とする請求項5の機械翻訳装置。
  8. 【請求項8】 前記機械翻訳装置は、さらに、前記翻訳
    対象の標準一般化マーク付け言語の文書において補助情
    報を必要とする個所を検出し、所定のタグを加えてアラ
    ーム処理を行うアラーム手段を備え、該アラーム手段に
    より処理された文書を前記原文読み込み手段が読み込む
    ようになっていることを特徴とする請求項5の機械翻訳
    装置。
JP6004729A 1994-01-20 1994-01-20 機械翻訳装置 Pending JPH07210558A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6004729A JPH07210558A (ja) 1994-01-20 1994-01-20 機械翻訳装置
US08/330,849 US5548508A (en) 1994-01-20 1994-10-28 Machine translation apparatus for translating document with tag

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6004729A JPH07210558A (ja) 1994-01-20 1994-01-20 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07210558A true JPH07210558A (ja) 1995-08-11

Family

ID=11591994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6004729A Pending JPH07210558A (ja) 1994-01-20 1994-01-20 機械翻訳装置

Country Status (2)

Country Link
US (1) US5548508A (ja)
JP (1) JPH07210558A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020020405A (ko) * 2000-09-08 2002-03-15 정규석 가상번역계층을 갖는 기계번역장치
CN111178088A (zh) * 2019-12-20 2020-05-19 沈阳雅译网络技术有限公司 一种面向xml文档的可配置神经机器翻译方法

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830620A (ja) * 1994-07-19 1996-02-02 Fuji Xerox Co Ltd 構造検索装置
US5987402A (en) * 1995-01-31 1999-11-16 Oki Electric Industry Co., Ltd. System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device
US6073143A (en) * 1995-10-20 2000-06-06 Sanyo Electric Co., Ltd. Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request
US6993471B1 (en) * 1995-11-13 2006-01-31 America Online, Inc. Integrated multilingual browser
US5745908A (en) * 1996-03-29 1998-04-28 Systems Focus International Method for converting a word processing file containing markup language tags and conventional computer code
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
EP0810533B1 (en) * 1996-05-29 2002-04-10 Matsushita Electric Industrial Co., Ltd. Document conversion apparatus
US5987245A (en) 1996-07-01 1999-11-16 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture (#12) for a client-server state machine framework
US6038590A (en) 1996-07-01 2000-03-14 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server state machine in an interprise computing framework system
US5999972A (en) 1996-07-01 1999-12-07 Sun Microsystems, Inc. System, method and article of manufacture for a distributed computer system framework
US6266709B1 (en) 1996-07-01 2001-07-24 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server failure reporting process
US6434598B1 (en) 1996-07-01 2002-08-13 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server graphical user interface (#9) framework in an interprise computing framework system
US5848246A (en) 1996-07-01 1998-12-08 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server session manager in an interprise computing framework system
US6424991B1 (en) 1996-07-01 2002-07-23 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server communication framework
US6272555B1 (en) 1996-07-01 2001-08-07 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server-centric interprise computing framework system
US6304893B1 (en) 1996-07-01 2001-10-16 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server event driven message framework in an interprise computing framework system
JP3121548B2 (ja) * 1996-10-15 2001-01-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 機械翻訳方法及び装置
JPH10134038A (ja) * 1996-10-29 1998-05-22 Fujitsu Ltd 文書情報送信装置、文書情報受信装置、および文書情報処理装置
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
US6081815A (en) * 1997-10-06 2000-06-27 Motorola, Inc. Method for processing a hyperlink formatted message to make it compatible with an alphanumeric messaging device
US6041326A (en) * 1997-11-14 2000-03-21 International Business Machines Corporation Method and system in a computer network for an intelligent search engine
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US10541973B2 (en) 1998-02-23 2020-01-21 Transperfect Global, Inc. Service of cached translated content in a requested language
US6959318B1 (en) * 1998-03-06 2005-10-25 Intel Corporation Method of proxy-assisted predictive pre-fetching with transcoding
US6356920B1 (en) * 1998-03-09 2002-03-12 X-Aware, Inc Dynamic, hierarchical data exchange system
US6480865B1 (en) 1998-10-05 2002-11-12 International Business Machines Corporation Facility for adding dynamism to an extensible markup language
US6487566B1 (en) * 1998-10-05 2002-11-26 International Business Machines Corporation Transforming documents using pattern matching and a replacement language
US6569207B1 (en) 1998-10-05 2003-05-27 International Business Machines Corporation Converting schemas to component models
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
WO2000057320A2 (en) * 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
US7139971B1 (en) * 1999-07-21 2006-11-21 Nec Corporation Method of searching for and retrieving information from structure documents
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
US6598015B1 (en) * 1999-09-10 2003-07-22 Rws Group, Llc Context based computer-assisted language translation
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
JP2001331362A (ja) * 2000-03-17 2001-11-30 Sony Corp ファイル変換方法、データ変換装置及びファイル表示システム
AUPR329501A0 (en) * 2001-02-22 2001-03-22 Worldlingo, Inc Translation information segment
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US20030018668A1 (en) * 2001-07-20 2003-01-23 International Business Machines Corporation Enhanced transcoding of structured documents through use of annotation techniques
FR2833375B1 (fr) * 2001-12-07 2004-06-04 Amadeus Procede, dispositif d'adaptation de fichiers numeriques
AU2003269808A1 (en) 2002-03-26 2004-01-06 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US20040148591A1 (en) * 2003-01-23 2004-07-29 International Business Machines Corporation Method, apparatus, and program for automated application context delivery to translators
US7797626B2 (en) * 2003-02-12 2010-09-14 Sap Ag Managing different representations of information
US20040230898A1 (en) * 2003-05-13 2004-11-18 International Business Machines Corporation Identifying topics in structured documents for machine translation
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US20080097837A1 (en) * 2006-10-23 2008-04-24 Format Dynamics, Llc Method and system for printing information related to internet advertisements
US7386791B2 (en) * 2003-09-24 2008-06-10 Format Dynamics, Llc Method and systems for creating a digital document altered in response to at least one event
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE112005002534T5 (de) 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) * 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) * 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8775156B2 (en) * 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0442704B2 (ja) * 1985-08-22 1992-07-14 Tokyo Shibaura Electric Co
JPH0561906A (ja) * 1991-06-20 1993-03-12 Ricoh Co Ltd 言語変換方式
JPH05307563A (ja) * 1992-04-28 1993-11-19 Sharp Corp 翻訳装置
JPH05334347A (ja) * 1992-05-29 1993-12-17 Sharp Corp 翻訳装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS5896372A (ja) * 1982-03-29 1983-06-08 Sharp Corp 電子式翻訳機
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置
JP2654001B2 (ja) * 1986-05-08 1997-09-17 株式会社東芝 機械翻訳方法
JPS63276174A (ja) * 1987-05-07 1988-11-14 Toshiba Corp 機械翻訳システム
JPS63316162A (ja) * 1987-06-18 1988-12-23 Brother Ind Ltd 文書作成装置
US5140521A (en) * 1989-04-26 1992-08-18 International Business Machines Corporation Method for deleting a marked portion of a structured document
JPH0442362A (ja) * 1990-06-07 1992-02-12 Fujitsu Ltd 日本語処理方法
JP2719453B2 (ja) * 1991-03-08 1998-02-25 シャープ株式会社 機械翻訳装置
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
US5384700A (en) * 1992-10-29 1995-01-24 International Business Machines Corporation Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0442704B2 (ja) * 1985-08-22 1992-07-14 Tokyo Shibaura Electric Co
JPH0561906A (ja) * 1991-06-20 1993-03-12 Ricoh Co Ltd 言語変換方式
JPH05307563A (ja) * 1992-04-28 1993-11-19 Sharp Corp 翻訳装置
JPH05334347A (ja) * 1992-05-29 1993-12-17 Sharp Corp 翻訳装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020020405A (ko) * 2000-09-08 2002-03-15 정규석 가상번역계층을 갖는 기계번역장치
CN111178088A (zh) * 2019-12-20 2020-05-19 沈阳雅译网络技术有限公司 一种面向xml文档的可配置神经机器翻译方法
CN111178088B (zh) * 2019-12-20 2023-06-02 沈阳雅译网络技术有限公司 一种面向xml文档的可配置神经机器翻译方法

Also Published As

Publication number Publication date
US5548508A (en) 1996-08-20

Similar Documents

Publication Publication Date Title
JPH07210558A (ja) 機械翻訳装置
JP2006277103A (ja) 文書翻訳方法および文書翻訳装置
JPH0644296A (ja) 機械翻訳装置
JP4947861B2 (ja) 自然言語処理装置およびその制御方法ならびにプログラム
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
JP2004220266A (ja) 機械翻訳装置および機械翻訳方法
JP5107556B2 (ja) 改善された中国語−英語翻訳ツール
JP2003186889A (ja) 文書に注釈付けし、文書イメージから要約を生成する方法及び装置
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP2006252164A (ja) 中国語文書処理装置
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP2004287679A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR102661819B1 (ko) 시간적 관계정보의 컨텍스트 이해를 위한 오픈 도메인 정보 활용 방법
JP4313967B2 (ja) 自然言語変換システム
JP3599563B2 (ja) ファイル処理制御方法、データ処理装置、コンピュータ読取可能な記録媒体
JP4021813B2 (ja) 複合語登録プログラムおよび登録装置
JP2000029882A (ja) 要約文作成装置
JP2972212B2 (ja) 機械翻訳方法及びシステム
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH10134059A (ja) Html文書処理装置及びhtml文書処理方法
JP2005038316A (ja) プログラムソース変換方式および方法ならびにプログラム
JP2004248245A (ja) 文書処理装置
JP3939151B2 (ja) 訳語選択装置および訳語選択プログラムおよび訳語選択プログラムを記憶した媒体
US8972239B2 (en) Syntax analysis information generation apparatus, translation apparatus, translation system, syntax analysis information generating method and computer program
JP2004086420A (ja) 文書管理装置および文書登録プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040521

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040625