JPH08501166A - 総合オーサリング及び翻訳システム - Google Patents

総合オーサリング及び翻訳システム

Info

Publication number
JPH08501166A
JPH08501166A JP6507259A JP50725994A JPH08501166A JP H08501166 A JPH08501166 A JP H08501166A JP 6507259 A JP6507259 A JP 6507259A JP 50725994 A JP50725994 A JP 50725994A JP H08501166 A JPH08501166 A JP H08501166A
Authority
JP
Japan
Prior art keywords
language
text
source
editor
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6507259A
Other languages
English (en)
Inventor
ジャイム ジー カーボネル
シャーレーン エル ギャラップ
ティモシー ジェイ ハリス
ジェームズ ダブリュー ヒグドン
デニス エイ ヒル
ディヴィッド シー ハドソン
ディヴィッド ナシレティ
マーヴィン エル レニッチ
ペギー エム アンダーソン
マイケル エム バウアー
ロイ エフ ザ サード バスディッカー
フィリップ ジェイ ヘイズ
アリソン ケイ ヒュットナー
ブルース エム マックラレン
アイリーン ニーレンバーグ
エリック エイチ リーブリング
リンダ エム シュマンド
ジョン エフ スウィート
キャサリン エル ベイカー
ニコラス ディー ブラウンロウ
アレクサンダー エム フランツ
スーザン イー ホーム
ジョン ロバート ラッセル レーヴィット
ダリル ダブリュー ロンズデイレ
テルコ ミタムラ
エリック エイチ ザ サード ニーバーグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Caterpillar Inc
Original Assignee
Caterpillar Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Caterpillar Inc filed Critical Caterpillar Inc
Publication of JPH08501166A publication Critical patent/JPH08501166A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

(57)【要約】 本発明は、一言語情報開発及び多言語翻訳用の統合コンピュータ系プロセスのシステムである。対話テキストエディタ(140)は、テキストを作成するために著者が使用する自然言語サブセットに対して、テキストの曖昧さを取り除き、翻訳可能性を保証するための支援となる語彙制約及び文法規約の準拠を実施する。この結果得られた翻訳可能ソース言語テキストは、翻訳後の後編集を必要とすることなく、ターゲット言語の中の1言語に機械翻訳される。

Description

【発明の詳細な説明】統合オーサリング及び翻訳システム 発明の背景 1.発明の分野 本発明は、コンピータに基づく文書作成及び翻訳システム、特に、前編集や後編 集を行うことなく、制約言語テキストを外国語へオーサリング及び翻訳するため のシステムに関するものである。 2.関連分野 膨大な情報を様々な文書として作成することが要求される組織団体では、分かり 易い文書作成の必要性に直面している。コミュニケーションの最適化を図るため には、このような文書は、必要なすべての表現を備え、簡潔且つ率直な言語でオ ーサリングすることが理想的である。この言語としては、単一で着実な言葉使い となるような一貫性が必要である。言語に曖昧さがあってはならない。 このような優れた執筆の追求は、オーサリングプロセスを統制するための各種規 定の設定へと発展した。しかし、技能や履歴の異なる著者達を、決められた技能 標準に従わせることは容易ではない。執筆のガイドライン、規則、及び標準は捕 らえどころがなく、定義及び実施が困難である。また、執筆の標準化や品質向上 を目的とする研究では、明白な結果が得られることはまれである。得られた結果 は、手段や成果を問わず、ドキュメンテーションのオーサリングコストを増大さ せる要因となってしまう。 執筆作業の生産性と品質向上を目指し、ソフトウェア環境で行われた最近の試み では、スペルチェッカーの提供がその成果として得られただけだ。その他の執筆 ソフトウェアに関しては、現在のところ、思わしい成果は得られていない。 言語的国境を超えることが、情報の提供に必要となる場合、このチャレンジは数 倍にも増大する。このような情報の通路を突破しなければならない組織団体は、 その全部又はほとんどを翻訳に頼っている。 ある言語から他言詔への翻訳は、数百年にもわたって行われてきた作業である。 コンピュータが登場する前は、元のテキスト(ソーステキスト)言語及び目標テ キスト(ターゲットテキスト)言語に精通した翻訳者と呼ばれる専門家によって 、このような翻訳作業 が、完全手動で行われていた。翻訳者としては、一般に、まず目標言語を母国語 として習得し、その後ソース言語を習得することが好ましいとされている。最も 正確で効率の良い翻訳は、このようなアプローチから得られるものと考えられて いた。 テキスト1ページの翻訳には、最も優れた翻訳者でさえもかなりの時間を必要と する。たとえば、専門の翻訳者が、技術テキストを英語から日本語へ翻訳する場 合、翻訳速度は1時問に付き約300語(約1ページ)と見積もられている。これ からも分かるように、特に技術文書では、かなりの時間と努力が、翻訳作業に要 求されることになる。 ビジネスや通商分野での翻訳の必要性は、過去100年間を通じ着実に増大を続け てきた。これには、いくつかの要因がある。第1の要因は、国際ビジネス業務に 伴う、テキストの急速な増加である。第2は、企業が世界貿易に携わるためには 、このようなテキストを多数の言語に翻訳しなければならないということ。第3 は、通商の急速化に伴い文書の頻繁な改版が発生し、その結果改版の翻訳が必要 になることである。 多数言語での情報の作成と配給は、該当する組織団体の責務である。世界市場で は、目標市場の標準言語でマニュアルが入手できることを、製造メーカー側で保 証しなければならない。外国語へのマニュアルの翻訳は、コストや時間が掛かる だけでなく、効率の悪い作業となる。翻訳者が、ドキュメンテーションで使用さ れているアプリケーション特有の用語に精通しているとは限らず、翻訳者自身の 個人的解釈に依存せざるを得ない結果、一貫性に欠ける翻訳となってしまうケー スが一般的である。これらの問題から、実際翻訳に回される文書量は、理想量よ りも少なくなっている。 研究開発分野でも、前世紀に起こった知識の拡大によって、文書翻訳の必要性が 急激に増大している。研究開発分野では、文書に対する優勢言語と言うものは全 くない。一般に、このような研究開発活動は、米国、英国、フランス、ドイツ、 及び日本などの高度産業国で行われている。また、特定の研究開発分野に関する 重要書類では、その言語数に追加の発生することが多い。特にエレクトロニクス やコンピュータ分野では、その技術の発展から、全言語でのテキスト作成にさら に拍車がかかっている。 テキストの作成能力は、適用する技術の能力と比例する。文書を手動で書く場合 、一定時間内に作成できる語数には限りがある。しかし、タイプライター、謄写 器、印刷機などの装置の出現によって、この作成量は大幅に増大している。また 、電子技術、コンピュータ技術、及び光学技術の発展は、著者の作業効率をさら に増大させている。現在、一般の著者が、決められた時間内に作成できるテキス ト量は、過去の手動作業による量をかなり上 回っている。 このようなテキスト量の増加は、技術の進歩と相まって、ソース言語からターゲ ット言語へのテキスト翻訳が注目される要因となっている。翻訳者の介入なしに 行う翻訳達成法の追求に関しては、民間や政府研究所を初め、数々の大学でも行 われてきた。 機械翻訳(MT)を試みるコンピュータシステムも考案されている。このようなコン ピュータシステムでは、ソーステキストを入力とし、ターゲットテキストを出力 として自動翻訳を行うようにプログラムされている。しかし、このような自動機 械翻訳用のコンピュータシステムは、現在の技術や理論だけでは達成できないと いうのが、研究者達の結論である。専門の編集者又は翻訳者による修正なしに、 ソースの自然言語からターゲットの自然言語へ機械翻訳できるようなシステムは 、現在のところ全く存在しない。1つの方法を、以下に説明する。 前編集と呼ばれるプロセスでは、ソースエディタが、ソーステキストの初期編集 を行う。ソースエディタの任務は、機械翻訳システム用テキストの最適状態とし て知られる形式に、ソーステキストを変更することである。このような形式の適 合性は、ソースエディタが、試行錯誤を通じて身に付けた知識である。 上記の前編集プロセスは、より経験の多いソースエディタによって繰返し行われ る場合もある。このようにして準備したソーステキストが、機械翻訳システムの 処理に回されることになる。システムの出力はターゲット言語であり、翻訳の目 的やユーザの品質条件に依って、後編集の要否が決定されることになる。 堪能な人間の翻訳者が行った翻訳に匹敵するような品質が必要とされる場合は、 恐らく、有能な翻訳者によって、機械翻訳の出力を後編集することが必要になる 。これは、人間の言語の複雑性が原因になっているだけではなく、現在の技術を 駆使し、時間と資源の制限やコスト面での条件も満足するように構築した機械翻 訳システムでは、その機能が比較的お粗末になってしまうことも原因になってい る。現在構築されているシステムでは、事実、手段はどうであれ、人間の翻訳者 による品質に近いものを得ようとすれば、後編集が必要になるケースがほとんど である。 このようなシステムの1つとして、Carnegie Mellon UniversityのCenter for M achine Translationが、英語から日本語への翻訳及び日本語から英語への翻訳用 として設計したKBMT-89がある。これは、対話式明瞭化(つまり、文書を明瞭に するための編集)を支援 する、知識系ドメインモデルで動作すろ。しかし、この対話式明瞭化は、通常、 著者と対話的に行うものではなく、明瞭化できない曖味な文章に遭遇すると、シ ステムはそこで一旦処理を停止し、一連の多肢選択式質問を著者又は翻訳者に尋 ねながら、曖味さを解決しようとするものである。さらに、KBMT-89は、定義の 行き届いた制御入力言語を適用していないため、いわゆる翻訳者支援相互明瞭化 で作成されたテキストには、後編集が必要となる。 このような事情から、前編集及び後編集の不要な翻訳システムが、有利になるも のと考えられる。 発明の概略 本発明は、一言語文書開発及び多言語翻訳用統合コンピュータ系プロセスのシス テムである。対話式コンピュータテキストエディタは、テキストの作成で著者が 使用する自然言語サブセットに対する語彙及び文法上の規約を厳守し、翻訳可能 なテキストを作成するために、テキストの明瞭化に関して著者を支援する。この 結果得られた翻訳可能ソース言語は、ターゲット言語の内の1言語に機械翻訳さ れ、翻訳後のテキストの後編集は一切必要としない。 図の簡単な説明 図1(a)及び1(b)は、本発明の構造の高水準ブロック図である。 図2は、本発明の動作の高水準フローチャートである。 図3は、MT120の高水準の情報の流れ及び構造ブロック図である。 図4は、情報要素の例である。 図5は、ドメインモデル500のブロック図である。 図6は、言語エディタ130の動作を示す、高水準フローダイアグラムである。 図7は、用語チェッカー610の動作を示すフローダイアグラムである。 図8は、明瞭化ブロック630の高水準フローダイアグラムである。 図9は、MT120の情報の流れ及び構造ブロック図である。 本発明の詳細な説明 1.統合システムの概要 本発明のコンピュータ系システムは、以下の機能統合を達成する。 1) 文書開発のためのオーサリング環境 2) 前編集及び後編集を必要としない、多言語への正確な機械翻訳モジュール 多言語文書の作成にこの技術を適用すれば、常に正確、迅速、且つコスト面でも 有利な翻訳が、量の大小に関係なく、ソース言語及び翻訳ターゲット言語両方で 、情報の発行とほとんど同時に得ることができる。 ソース言語オーサリング機能と翻訳機能を連係するかどうかは、以下の2つの方 針に基づいて決定する。 1) 多国籍・多言語ビジネス環境では、情報が様々なユーザ言語で提供できる ようになるまでは、開発が完了したものとは考えられない。 2) 一体化したフレームワーク内でオーサリングプロセスと翻訳プロセスを組 み合わせれば、効率の向上につながる。 図1(a)は、統合オーサリング及び翻訳システム(IATS)105の高水準ブロック図で ある。 IATS 105は、任意の言語でのドキュメンテーションのオーサリングや様々な他言 語への翻訳において、組織団体を支援するための専用コンピューティング環境を 提供する。これら2つの機能は、以下のブログラムグループを統合することによ ってサポートする。 1) オーサリング:プログラムの1つのサブグループは、対話式コンピュータ テキストエディタ(TE)140を提供する。このエディタは、自然言語のドメイン依 存サブセットである、サブセット指定規約ソース言語(CSL)の語彙及び文法規約 内で、著者が、一言語テキストを作成できるようにするものである。さらに、TE 140は、前編集することなくテキストを翻訳するために、テキストの明瞭化ブロ セスで著者を援助し、翻訳用テキストが準備できるようにする。 2) 翻訳:プログラムの別のサブプログラムとして、機械翻訳(MT)120機能が ある。これは、ジェネレータモジュールにプログラムされているあらゆるターゲ ット言語へ、後編集の必要がないようにCSLを翻訳するための機能である。 翻訳を中心コンポーネントとするシステムに関しては、現在のところ、本発明に よる一体化フレームワーク内でのオーサリング機能と翻訳機能の統合が、前編集 及び後編集を除去するための唯一の考案である。 テキストエディタ(TE)140は、CSLによる文書作成で、著者及び編集者を支援する ための一連のツールである。これらのツールは、著者が、適切なCSL語彙や文法 を用いて文書を書くための助けとなる。TE 140は、著者160と(又は、その逆方 向に)直接通信する。 図1(b)では、IATS 105が、オーサリング機能及び翻訳機能を実行するために、( 1)規約ソース言語(CS)133、(2)テキストエディタ(TE)140、(3)MT 120、(4)ドメ インモデル(DM)137の4つの主要部に分類されている。テキストエディタ140には 、言語エディタ130と図形エディタ150が含まれる。さらに、全プロセスの制御を 行うために、ファイル管理システム(FMS)110が提供されている。 CSL 133は、翻訳すべき著者の文書のドメインを、文法及び用語に含むソース言 語のサブセットである。CSL 133は、前編集や後編集なしに翻訳を行うために必 要となる、用語及び文法構造を指定することによって定義する。 TE 140は、CSLでの文書作成で、著者及び編集者を支援するための一連のツール である。これらのツールは、著者が、適切なCSL語彙や文法を用いて文書を書く ための助けとなる。LE 130は、テキストエディタ140を介して、著者160と(又は 、その逆方向に)通信する。著者に対しては、テキストエディタ140との両方向 通信が、ライン162を通じて可能になっている。LE 130は、使用した語や句がCSL にあるかどうかの情報を、著者160に伝える。該当文書の情報ドメインに関連す る用語がCSLに見つからない場合、このLE 130が、CSL内の類義語を提案する機能 を備えている。LE 130は、また、テキストがCSL文法規約を満足しているかどう かを著者160に伝えるとともに、構文は正しくても意味的に曖昧な文章が存在す る時は、その明瞭化において著者を支援する。 MT 120は、MTアナライザ127とMTジェネレータ123の2つの部分から構成されて いる。MTアナライザ127の機能としては、文書をCSLに準拠させるための文書解析 とインターリングア テキスト生成の2つがある。ここで得られた分析済みのCSL準拠テキストが、該 当する外国(ターゲット)言語180へ翻訳されることになる。MT 120は、インタ ーリングアに基づく翻訳アプローチを採用している。つまり、文書を他言語へ直 接翻訳するのではなく、まずMTジェネレータ123で、インターリングアと呼ばれ る言語に依存しないコンピュータ可読形式に文書を変換し、次に、得られたイン ターリングアテキストを翻訳するようになっている。この結果得られた翻訳物に 対しては、後編集が不要である。MT 120のバージョンは、各言語別に作成し、イ ンターリングアテキストから外国語テキストへの翻訳を支援するよう設計された 一式の知識ソースが、その主な構成要素となっている。ただし、新しいターゲッ ト言語を追加する場合は、MTジェネレータ123を個別に新規開発することが必要 である。 全機能の稼動時、CSL文法規約は満足していても意味が曖昧となっている文章が 見つかった場合、その文章の別の解釈から適切なものを選択する由の問い合わせ が、LE 130から著者160に対して行われることがある。これは、明瞭化として知 られるプロセスである。該当するテキストが、CSL用語だけから構成され、しか もCSL文法規約を全て満足するものとLE 130が判断すれば、このテキストにCSL承 認ラベルが付けられ、この明瞭化は未定状態となる。以降で説明するように、明 瞭化に関しては、著者に見えるテキスト形式を変更する必要はない。テキストの 明瞭化が完了すれば、ターゲット言語180への翻訳が開始できることになる。 このLE 130は、実際には、テキストや表の作成で著者及び編集者に必要となる、 ワードプロセッサ機能を備えたテキストエディタ140の延長機能として提供する 。図形エディタ150は、図形の作成に使用する。図形エディタ150は、テキストエ ディタ140を介し、図形のテキストラベルをアクセスするためのものであり、こ れらのテキストラベルに対してもCSL承認が得られるようにする。 LE 130は、(エディタ140を介して)MTアナライザ127と通信し、明瞭化処理中は、 両方向ソケット間ラインで、このMTアナライザ127を介してDM 137と通信する。 本発明の好ましい具体化では、DMが、MTアナライザ127へ情報を提供する知識ベ ースの1つとなる。DM 137は、MTアナライザ127及びLE 130が使用するCSL用語に 関する宣言知識の記号表現である。 図2は、IATS 105の動作の高水準フローチャートである。MT 120、LE 130、テキ ストエディタ140、及び図形エディタ150は、全てFMS 110によって制御されてい る。IATS 150が正しく動作するために必要な制御情報は、制御ライン111〜113を 介して提供される。 まず、著者160が、FMS 110を使って編集の対象となる文書を選択すると、FMS 11 0は、テキストエディタ140を開始し、指定された文書のファイルを表示する。こ こで著者は、ブロック160及び220に示すように、テキストエディタ140を使って 、制約がなく、曖味さを含むテキストをIATS 105へ入力することができる。著者 160は、標準エディタコマンドで文書を作成・修正し、CSL準拠チェックの準備を 行う。なお、ここでは、著者が、CSL規約を十分考慮した上でテキストを入力す るものと仮定する。次に、CSLへの準拠を達成するために、著者は、システムの フィードバックに応答しながら、決められた語葉や文法規約への違反箇所を修正 する。これは、当然、全く制約のない初期のテキスト入力よりも効率的であるが 、最初から全く制約のないテキストを入力した場合でも、本システムは正しく動 作する。 著者とLE 130との対話は、マウスのクリック又はキーボードのキーストロークコ マンドによって行う。ただし、この入力方法に限定せず、本発明の適用範囲内で 、スタイラスや音声などの別の入力方法を適用することも可能である。入力の一 例としては、CSLチェックを実行するためのコマンドや、与えられた語や句を定 義し、その用例を見つけるためのコマンドを挙げることができる。 明瞭さやスタイルの点で、CSLテキストにまだ問題が残っている場合は、ブロッ ク230に示すように、さらにCSL準拠を分析し、知識ベースの文法規約の準拠をチ ェックする。このフィードバックは、間違いを訂正するために、フィードバック ライン215を介して著者に与えられる。つまり、CSLに準拠していない語、句、及 び文章に関する情報は、LE 130から著者160に伝えられることになる。最後に、 曖昧な文章がテキストにあるかどうかのチェックが行われる。この時LEは、文章 の意味として適切な解釈を選択するよう著者に問い合わせる。このプロセスは、 テキストが完全に明瞭となるまで繰返される。 著者が、必要な箇所全部の訂正を終えると、分析段階230が完了し、明瞭化及び 制約済みテキスト240が、MTアナライザ及びインタプリタ250へ送られる。インタ プリタは、アナライザの構文部と共にMTアナライザ127内に存在し、明瞭化及び 制約済みテキスト240をインターリングア260へ翻訳する。インターリングア260 は、さらに、ジェネレータブロック270によってターゲットテキスト280に翻訳さ れる。なお、インターリングアテキスト260は、図3に示す通り、多言語306〜31 0への翻訳が可能な形式となっている。 このように、特定の用語及び文法規約に準拠する文書の作成を、著者に規定し、 可能とすることによって、後編集を必要とすることなく、制約言語テキストから 外国語への正確な翻訳を達成することができる。曖味と思われる文章や翻訳不可 能と思われる語は、翻訳前 の段階で、LE用語チェックブロック217及び分析ブロック230で、著者に修正及び (又は)明瞭化させているため、後編集は不要である。 II.機能ブロックの詳細な説明 本発明の好ましい具体化では、32メガバイトのRAMを備えたDECstation、400メガ バイトのディスクドライブ、及び19インチのカラーモニタを、各著者の専用装置 として準備する。各ワークステーションには、ローカルディスクからのスワップ 用として最低100メガバイトを準備する。さらに、著者のワークステーションに 加え、2つのオーサリンググループに付き1台のDECserverを適用し、ユーザ数 は、ファイルサーバ1台に付き45以下とする。また、オーサリングワークステー ションは、イーサネットローカルネットワークに存在する。システムとしては、 ユニックスオペレーシングシステム(システムV(SYSV)系に対しては、バークレ ー標準分散(BSD: Berkeley Standard Distribution)系が好ましい)を適用し、 Cプログラミング言語コンパイラ及びOSF/Motifライブラリが利用できるように する。LEは、Motifウィンドウマネージャ内で稼動する。なお、本発明は、上記 のハードウェア及びソフトウェアプラットフォームに限定されるものではなく、 他のプラットフォームに対しても適用することが可能である。 A.テキストエディタ 本発明の具体化では、最終的に分析され外国語へ翻訳されるべき情報を、著者が 入力できるようにするためのテキストエディタ140を提供することが好ましい。 市販のワードプロセッシングソフトウェアなら、任意のものを本発明で利用する ことが可能である。 ArborText(ArborText Inc., 535 West William St., Ann Arbor, MI 48103)が提 供するSGMLテキストエディタ140の利用は、好ましい適用例である。SGMLテキス トエディタ140は、著者及び編集者に必要となる基本的なワードプロセッシング 機能を提供し、(Annapolis, Marylandの)Intercapが提供する図形作成用ソフト ウェアと組み合わせて使用することができる。 本発明は、標準汎用マークアップ言語(SGML: Standard Generalized Markup Lan guage)タグを使ってテキストを作成するため、SGMLテキストエディタ140を適用 している。SGMLは、電子文書の構造を記述するための国際標準マークアップ言語 であり、広範囲の文書処理や交換タスクの条件を満足するように設計されている 。SGMLタグを利用すれば、文書の内容(テキスト、両像など) 及び論理構造(章 、段落、図、表など)を記述することができる。より多量で複雑な電子文書の場 合は、文書の物理構造をファイルに記述することも可能で ある。このように、SGMLは、複雑さや量に関係なく、任意の種類の文書を、シス テムやアプリケーションに依存しない形で記述できるように設計された言語であ る。この独立性によって、誤解釈やデータの喪失を心配することなく、異なるア プリケーションのシステム間で文書を交換することが可能になる。 SGMLは、マークアップ言語、つまり、任意のテキストから得られる従来の構造情 報に加え、コード化情報を使ってテキストに″マーク付け(マークアップ)″又 は注釈付けを行うための言語である。ほとんどの場合、この言語は、電子文書内 の様々な位置に、文字列として挿入される。この文字列は、その初めと終わりを 示す特別な文字によって、回りのテキストと区別することができる。正しいマー クアップがテキストに挿入されているかどうかは、SGMLタグをチェックするため のソフトウェアを使えば、適時確認することができるようになっている。このマ ークアップは、汎用的であり、特定のシステムやタスクに特有のものではない。 SGMLタグについての詳細は、国際規格(ISO)8879、Information processing-Text and office systems-Standard Generalized Markup Language(SGML), Ref. No.I SO 8879-1986(E)を参照のこと。 SGMLの利用によって、以下の機能が達成できる。 (1) 文書の分断又は翻訳単位への分割。テキストエディタ140ソフトウェアは 、ソース入力テキストの翻訳可能単位を識別するために、句読点とSGMLタグの両 方を使用する(たとえば、セクションのタイトルを識別するためには、SGMLタグ が必要となる)。 (2) 翻訳すべきでない単位の保護(隔離)。全ての語や文章は、前もって予 想することのできない制約言語(たとえば、名称や住所など)や、(容易には) 完全に指定しきれない用語のクラス(たとえば、部品番号や機械からのエラーメ ッセージなど)に属することが前提となってはいるが、SGMLタグを使えば、チェ ックの対象とならない部分をシステムに指定することも可能である。 (3) (2)で述べた内容(たとえば、部品番号など)の識別。 (4) 部分的な文章の翻訳(たとえば、丸付き項目など)。 (5) テキストの構造を識別することによって行う表翻訳支援(一度にセル1 個)。この機能は、(1)で述べた機能と似ている。 (6) (2)、(3)、(4)、(5)を通じ、(以降で述べる)品詞解析プロセスの支援 。 (7) 曖味な文章の正しい解釈を指定できるようにするために、ソーステキス トに不可視タグを挿入することによって行う明瞭化の支援。 (8) 特別な扱いを必要とするテキスト種類の識別による、通貨や数学単位の 翻訳支援。 (9) テキストの一部を、翻訳可能な部分としてラベル付けするための手段の 提供。言い換えれば、任意のテキストが、以降で述べるプロセスを経て、後編集 することなく翻訳できる明瞭な制約テキストになった由を承認することである。 これまで、完全な″本″を表現する電子文書(図形を含まないテキストのみ)は 、著者によって(テキストエディタ140を使って)作成せれてきた。これは、全 ての作業が一人の著者によって行われ、作成した情報の再利用が容易でないこと を意味する。一方、本発明は、より小さな部分又は情報要素の集まりから、本( マニュアル、文書)を編集(又は作成)するようになっているため、複数の著者 によって作業を行うことができる。これは、再利用性の向上につながる。1つの 情報要素は、特定ドメインに関するサービス情報の最小単位として定義される。 なお、ここでは、情報要素の利用が、本発明の好ましい具体化となってはいるが 、本発明によれば、情報要素を利用しなくても、正確で明瞭な翻訳文書を作成す ることができる。 図4は、情報要素410の例を示すもので、″ユニーク″なヘッダ415、″ユニーク ″なテキストブロック420、″共用″図形430、″共用″表435、及び″共用”テ キストブロック425から構成されている。 ″ユニーク″な情報とは、それを含む情報要素にのみ適用できる情報のことであ る。従って、″ユニーク″な情報は、情報要素450の一部としてファイルされる ことになる。 ″共用″オブジェクト(図形、表、又はテキストブロック)とは、情報要素内で ″参照される″情報のことである。″共用″オブジェクトの内容はオーサリング ツールで表示されるが、ファイルされた情報要素450内のみで″ポイント″され る。 ″共用″オブジェクトと情報要素の違いは、″共用″オブジェクトが、それだけ では意味をもたない(つまり、それだけでは、独立的な情報を伝えることができ ない)という点である。それぞれの″共用″オブジェクトは、ブロック450に示 すような個別のファイルを形成する。 情報要素は、″ユニーク″な情報ブロック(テキスト及び(又は)表)と1つ以 上の″共用″ オブジェクトから構成される。なお、″ユニーク″なヘッダ415及び″ユニーク ″なテキスト420は、″共用″図形430、″共用″表435、及び″共用″テキスト4 25と組み合わさっている。1つの完全な文書(本)は、1つ以上の情報要素から 構成される。 ″共用″オブジェクトは、″共用″ライブラリに保存される。ライブラリの種類 としては、″共用″図形ライブラリ460a、″共用″表ライブラリ460b、″共用″ テキストライブラリ460c、″共用″音声ライブラリ460d、及び″共用″ビデオラ イブラリ460eがある。共用オブジェクトは、1回保限り存されるだけである。個 別の情報要素内で使用する時は、元の共用オブジェクトへの″ポインタ″が、情 報共用ファイル450に配置される。これによって、必要となるディスク容量を最 小限に抑えることができる。元のオブジェクトを変更すると、そのオブジェクト を″ポイント″している情報要素全部が、自動的に変更される。共用オブジェク トは、任意の種類の出版物に使用することができる。 ″共用情報要素″とは、1つ以上の文書で利用される情報要素のことである。た とえば、リリースライブラリ470の中の4つの情報要素は、文書480及び485を作 成するために利用されている。 著者とLE 130間の通信は、メニューオプションなどの標準SGMLエディタ機能の拡 張又は別ウィンドウとして提供されるLEユーザインタフェース(UI)の仲介の下で 行われる。UIは、CSLチェッカー及びCSL用語ルックアップへのアクセスや制御を 提供・管理するもので、ユーザがCSL LEと対話するための主なツールでとなって いる。″ユーザインタフェース″という用語は、ソフトウェアシステム全体への インタフェースを意味する場合が一般的であるが、ここでは、CSLチェッカー、 用語ルックアップ機能、及び明瞭化機能へのインタフェースを意味するものと仮 定する。 UIでは、さらに、(a)LEのとる動作、(b)それらの動作の結果、及び(c)その結果 発生する動作に関する明確な情報を提供することが必要である。たとえば、UIを 介して起こった動作によって、規定時間以上のリアルタイム休止が発生した時は 、簡潔なメッセージを使って、遅延の可能性をUIから著者へ通知することが必要 である。 著者は、テキストエディタ140のプルダウンメニューのオプションを選択するこ とによって、LEの機能を実行することができる。著者の利用できるオプションと しては、CSLチェック(用語チェック及び文法チェック)及び用語ルックアップ の開始やこれらの機能からのフィードバックの確認がある。この場合、著者は、 現在表示中の文書からのチェックの開始、又は与えられた語やフレーズの用語ル ックアップを依頼することができる。 UIは、文書内に見つかった非CSL言語のインスタンスを、それぞれ明確に指摘す る。非CSL言語の指摘方法としては、色の利用や、SGMLエディタウィンドウ内の 字体又は文字サイズの変更が考えられる。UIは、非CSL語に関する全ての既知情 報を表示する。たとえば、ある語は非CSL語であるが、CSLの類義語がある由のメ ッセージを、類義語リストとともに表示することが考えられる。 非CSL語の代用語リスト(たとえば、代用スペルやCSLの類義語)が、用語チェッ カーの結果報告に含まれている場合、著者は、それらの代用語の中から1つを選 択し、文書内の用語と自動的に置き換えるよう指定することができる。場合によ っては、適切な形式になるように、選択した代用語に修正を加えなければならな いこともある(つまり、適切な語尾の追加など)。 著者から用語情報の依頼があると、UIは、代用スペル、類義語、定義、及び(又 は)指定した用語の用例を表示する。 UI内では、著者は、チェッカー情報と用語ルックアップ情報間を、迅速且つ容易 に移動することができる。これによって、非CSL言語を削除するための文書修正 プロセスで、情報検索(たとえば、類義語のルックアップ)を行うことが可能に なる。 ほとんどの場合、UIは、非CSL用語を自動的にCSL用語と置き換えるため、ユーザ は、CSL語が正しい形式になるよう修正を加える必要はない。しかし、用語チェ ッカーでは、(以降で述べるように)文書の品詞解析は行わないため、語の正し い形式を識別できない場合も発生する。以下のキャプションを例にとると、動詞 ″view″はCSLではないが、CSL類義語として″see″が存在する。 Direction of Crankshaft Rotation (when viewed from flywheel end) 用語チェッカーでは、″viewed″の代用語として″saw″を提供すべきであるか 、それとも″seen″を提供すべきであるのか分からない。この場合、当然、両方 を提供し、著者に正しい方を選択させるのが適切である。しかし、置き換え用と して適切な代用語を、毎回提供できるとは限らないため、許される限り、LE 130 によって、正しい形式での置き換えオプションリストを提供するようにしている 。ただし、提案のCSL語や句を、実際に文書へ挿入する前に、著者が編集しなけ ればならない場合も発生する。 最後に、LE UIは、文章の意味を明瞭化するための支援を行う。これは、代用の 解釈リストを著者に提供し、その中から適切な解釈を著者が選択できるようにし 、著者の選択を示すタグを該当する文章に付けることによって行っている。 B.ファイル管理システム ファイル管理システム(FMS)110は、IEリリースライブラリ470及びSGMLテキスト エディタ140に対する、署者のインタフェースとして動作する。一般に、著者は 、IEを選択し、FMSインタフェース内のIEに該当するファイルを指定することに よって編集を行う。この結果、指定したIEに対するSGMLエディタセッションが、 FMS 110によって開始・管理される。完成した文書は、人間の編集者又はFMS制御 機能を通じて情報インテグレータヘ送られることになる。 C.制約ソース言語(CSL) 今日の技術文書の複雑性を考えると、制約のない自然言語テキストの上品質機械 翻訳は、実際的に見て不可能である。ここで大きな問題となっているのは、言語 の性質である。ソーステキスト翻訳で重要なプロセスは、元の意味をターゲット 言語に反映するということである。意味は、構造信号の表面下に隠されているた め、この明白な信号を分析することが必要になる。このような分析から得られた 意味は、ターゲット言語の信号生成プロセスに使用される。しかし、分析や生成 を妨げる言語本来の性質が、最も大きな翻訳の障害となるケースもある。 このような言語の性質としては、以下のものを挙げることができる。 1.曖昧な内容で1つ以上の意味を持つ語 例:Make it with light material. [材料は、″暗くない″のか、それとも″重くない″のか?] 2.構成が曖味な語 例:ドイツ語″Arbeiterinformation″は、 ″information for workers″[Arbeiter + lnformation] 又は、 ″formation of female workers″[Arbeiterin + Formation]である。 3.構文的に1つ以上の役割を果たす語 Roundは、以下に示すように、名詞(N)、動詞(V)、又は形容詞(A)として使用す ることができる。 (N) Liston was knocked out in the first round. (V) Round off the figures before tabulating tem. (A) Do not place the cube in a round box. 4.語の組み合わせで、それぞれの語が複数の構文的役割を持つ場合 例:British Left Waffles on Falklands. [Left Wafflesが、N+Vの場合、これは、British Leftに関する見出しであ る。] [Left Wafflesが、V+Nの場合、これは、Britishに関する見出しである。] 5.曖昧な構造での語の組み合わせ 例:Visiting relatives can be boring. [″Visiting of relatives″がboringなのか、″relatives who visit″がbor ingなのか?] 例:Lift the head with the lifting eye. [″Lifting eye″は、計器なのか、それとも″head″の機能なのか?] 6.曖昧な代名詞の使用 例:The monkey ate the banana because it was... [″it″は、″monkey″を指すのか、それとも″banana″を指すのか?] さらに、生成の問題も加わり、機械翻訳の全体的な難しさを増している。 このような翻訳の問題は、言語が持つ言語的現象の範囲を減らすことによって、 大幅に解消することができる。二次言語の扱う範囲としては、限られたドメイン 内のオブジェクト、プロセス、及び関係がある。二次言語には、語彙の面での限 界はあるが、文法の面で限界があるとは限らない。制御された環境では、二次言 語の語葉及び文法両方を制約することが、機械翻訳の促進対策となる。 語葉の制約は、類義語を除くことによってサイズを限定するだけでなく、できる 限り単位1つに付き意味が1つとなるような、語彙単位の専用化を行うことによ って、語彙の曖昧さを制御することもできる。上記1、2、及び4の例で示した ような問題は、この制約によって回避できることは容易に推測できる。また、文 法規制を設ければ、代名詞化(上の例6)といったプロセスは容易に除外するこ とができ、語の追加、冗長的な語の繰返し、又は書き直しを行えば、意味をより 明確化することもできる。この条件の適用に関するパラメータを、以下の例で示 す。 制約のない曖味な英語(解釈としては、以下のA、B1、B2がある): Clean the connecting rod and main bearings. 曖昧な英語A: Clean the connecting rod bearings and the main bearings. 曖味な英語B1: Clean the main bearings and the connecting rod. 曖昧な英語B2: Clean the main bearings and the connecting rods. 語彙及び文法規制の数と種類は、制約二次言語の開発目的によって大きく異なっ てくる。 以上のことから、本発明は、制約言語範囲内での文書オーサリングに限定される 。制約言語とは、特定のユーザアプリケーション用として開発されたソース言語 (たとえば、アメ リカ英語)に対する二次言語である。制約言語又は制御言語の説明については、 ここでも参考として含めてある、Adriaens et atFrom COGRAM to ALCOGRAM: Toward acontrolled English Grammar Checker ,Proc.of Coling-92,Nantes ( Aug.23-28,1992) を参照のこと。機械翻訳という観点からすれば、制約言語の 目標は、以下のようになる。 1. ソース言語の一貫したオーサリングを促進するとともに、明確で率直な 執筆を奨励すること。 2. ユーザ文書に対して迅速で正確な高品質の機械翻訳を可能とするような 、節操あるソーステキストのフレームワークを提供すること。 文書の文法をCSLに準拠させるために、著者が守らなければならない規則のこと を、CSL文法規約と呼ぶ。また、MTコンポーネント内のCSLテキストを分析するた めに適用する、CSL文法規約の演算的実施のことをCSL機能文法と呼び、これは、 Martin Kayが開発し、以降R. Kaplan及びJ. Bresnanによって改良された周知の 形式主義に基づくものである(参考として含めてある、Kay, M.,″Parsing in F unctional Unification Grammar,″in D. Dowty, L Karttunen and A. Zwicky ( eds.), Natural Language Parsing: Psychological, Computational, and Theor etical Perspectives , Cambridge, Mass.: Cambridge University Press, pgs. 251-278(1985)、及びKaplan R. and J. Bresnan,″Lexical Functional Grammar : A formal System for Grammatical Representation,″in J. Bresnan(ed.), T he Mental Representation of Grammatical Relations ,Cambridge, Mass.: MIT Press, pgs.172-281(1982)を参照のこと)。 本稿では、以降、″CSL内″又は″非CSL″という語又は句が、頻繁に出現する。 ここでは、CSLによって統制される用語規制の種類を説明するとともに、″CSL内 ″という表現の意味を明確化する。 英語では、同一の語や句が複数の異なる意味を持つ場合がある。たとえば、汎用 辞書には、″leak″という語に対して次のような定義がある。 (1)動詞:違反又は欠陥によって、物の脱出を許すこと。 (2)動詞:公式な承認又は認可なしに情報を公開すること。 (3) 名詞:容器や管から、物が漏れ出たり、入ったりできる割れ又は開口部。 これらの異なる意味は、それぞれ語又は句の″語義″と呼ぶ。与えられた文章内 で、語又は句がどの語義を意味するのかを理解するために、人間が用いる全知識 を備えていないMTシステムでは、このような単一の語又は句が持つ複数の語義が 問題となる。システムでは、特定の文章内で使用される語の品詞(名詞、動詞、 形容詞など)を見分けることによって、多数の語の曖昧さを、ある程度解消する ことができる。これが可能な理由は、上記の″leak″でも示した通り、品詞の違 いによって、語の定義も異なってくるからである。 しかし、CSL仕様では、MT 120で解消できないような曖昧さを回避するために、 それぞれの品詞に対して語又は句の語義が1つとなるような仕様の設定に努めて いる。従って、語又は句が″CSL内″の時は、最低1つの品詞としてその語又は 句が使用できることを意味する。たとえば、CSLで執筆作業を行っている著者は 、上記(1)及び(3)の品詞として″leak″という語を使用することはできるが、(2 )の品詞としては使用できない。ただし、語又は句が″CSL内″であるとは言って も、その語又は句のあらゆる用法が翻訳できるとは限らない。 ある語又は句が″CSL内″の場合、該当するCSL語義を表現できる語又は句の全語 形も、CSL内となる。上の例では、動詞″leak″を使用できるだけでなく、その 関連動詞語形″leaked″、″leaking″、及び″leaks″も使用できることになる 。名詞としての語又は句がCSL内の時は、その単数形及び複数形も使用すること ができる。ただし、1つ以上の品詞として機能する句は例外である。従って、こ の発見的方法は、曖昧な句の場合にはその妥当性が低下する。 用語とは、特定言語又は二次言語で使用される語及び句の集まりである。限定さ れたドメインは、限られた範囲内の経験に関する情報を、伝達又は表現するため に使用する限定用語で表現される。限定されたドメインの例として農業を考えて みると、農業機器や農業活動に関する用語が、この分野の限定用語となる。なお 、MTコンポーネントは、1種類以上の用語に対して作用する。機械翻訳用の語お よび句は、MT語彙に保存される。用語は、(1)機能項目、(2)一般内容項目、及び (3)専門技術語の3つのクラスに分類することができる。 英語での機能項目は、文章内で、主に考えをつなぎ合わせる働きをする単一の語 又は語の組み合わせである。このような項目は、英語のほぼあらゆる種類の書類 で必要になる。このクラスに含まれるものとしては、前置詞(to、 from、 with、 in front ofなど)、接続詞(and、 but、 or、 if、 when、 because、 since、 while など)、限定詞(the、 a、 your、 most of)、代名詞(it、 something、 anybody など)、一部の副詞(no、 never、 always、 not、 slowlyなど)、及び助動詞(sh oud、 may、 ought、 mustなど)がある。 一般内容語は、その大部分が、私達の回りの世界を表現するために使用され、共 通な一般の人間経験を表現することがその主な用途となる。 文書では、人間経験のかなり特定な部分(たとえば、機械やそれらの状態)が注 目されることが一般的である。従って、MTでは、比較的に一般用語が制限される ことになる。 専門技術語は、技術内容語や句及びユーザアプリケーション特有用語から構成さ れる。技術内容項目とは、特定分野の作業やドメインに特有の語や句のことであ る。ほとんどの技術語は、部品、コンポーネント、機械、材料などのように、項 目を命名するための名詞から成っている。ただし、動詞、形容詞、副詞などの他 の語のクラスを含む場合もある。これらの語は、当然、日常会話で頻繁に使用さ れることはないため、一般内容語に対立するものとなる。 技術内容句は、上記すべてのクラスから成る複数の語の列である。技術ドキュメ ンテーション用語としては、このような句が、最も典型的なものとなる。ユーザ アプリケーション特有用語は、ユーザアプリケーションが作り出した独特な語や 複合語を含む専門用語の一部であり、製品名、文書のタイトル、ユーザの使用す る略語、及びフォーム番号が、これに相当する。 便利で完全な用語の開発は、どのドキュメンテーション作業においても重要であ る。作成したドキュメンテーションを翻訳するとなれば、用語が、その翻訳作業 の重要な資源となる。MT 120は、人称(I、 me、 myなど)、性別(hers、 sheなど )、及び代名詞(it、 themなど)の用法を除けば、英語で利用できるほとんど全 ての機能項目を、扱うことができるように設計されている。これには、英語の一 般語からの技術″借用語″(″truck″や″length″など)が多数含まれる。し たがって、制約言語に含まれる用語の大部分は、特別な分野の物やプロセスを表 現するための、1つ以上の語の″特別な″(たとえば、技術)用語から構成され ることになる。特別な分野に関する完全な概念を表現できるという点からすれば 、用語は、完全なものであると言うことができる。 簡素化されたものとはいえ、完全な用語の開発は、IATSシステム105の成功に大 きく貢献する。制約言語は、用語の正しい使い方と誤った使い方を指定すること によって、迅速且つ正確で高品質の機械翻訳を助成できるような文書作成の可能 性を、約束するものである。 用語項目は、明確な考えを伝えるとともに、読者層に対して適したものでなけれ ばならない。性差別的、口語的、慣用的、過度に複雑又は専門的、曖昧な、又は 通信を妨げるよう な用語は、避けるべきである。また、一般的に受け入れられている文体的な留意 点は、MT志向処理では必ずしも必要とは限らないが、通常、文書作成の重要なガ イドラインとなる。 なお、制約ソース言語及び(又は)一般の言語に関する本稿の説明は、その大部 分が、アメリカ英語を中心としているが、類似的な比較は、他の全ての言語に対 しても適用できることである。ここで説明するシステム100に関しては、アメリ カ英語がソース言語であるべき理由は、本質的に全くない。事実、システム100 は、アメリカ英語を唯一のソース言語として動作させるようには設計されていな い。ただし、LE 130及びMT 120と相互作用するデータベース(たとえば、ドメイ ンモデル)は、該当するソース言語の制約に基づいて変更することが必要である 。 また、標準アメリカ英語綴字法の規則は、厳守することが必要である。″throug h″に対する″thru″、″molding″に対する″moulding″、又は″odometer″に 対する″hodometer″などの、標準以外の綴りは避けるべきである。大文字で綴 る語(たとえば、On-Off、Value Planned Repairなど)は、用語の特別な意味を 示す場合にのみ使用すべきであり、このような用語は、ユーザアブリケーション 用語としてリストすることが必要である。標準以外の大文字化(BrakeSaverなど )に関しても、同様のことが言える。また、略語(ROPS、API、PINなど)を使用 する場合も、ユーザアプリケーション特定用語としてリストすることが必要であ る。なお、数字形式、測定単位、及び日付に関しては、一貫性を守ることが重要 である。 さらに、制約言語回復用語は、該当する制約言語の意味に従って使用することが 必要である。これは、MTが、常に適切な制約言語の語義を使って、語の翻訳を行 うことを保証するためである。英語の中には、1つ以上の構文カテゴリーに属す るものがある。制約言語では、このような構文的に曖昧な語は、曖昧さを明確化 できるような構造内で使用することが必要である。 分野によっては、そのドメインの特殊な性質から、長い複合名詞の頻繁な使用と いう1つの大きな問題が発生する。複合名詞の修飾関係は、言語によってその表 現も異なってくる。このような修飾関係は、常にソーステキストから解明でき、 ターゲット言語で表現できるとは限らないため、以下のような性質を持つ複合名 詞は、MT語彙に含めることが考えられる。 ●ユーザアプリケーション特定用語内の技術用語 ●1語以上から成る複合用語 複雑な名詞一名詞の合成は、できる限り避けるべきである。しかし、語彙にリス トした用語の中には、このような重要なドキュメンテーションの性質をMTで取り 扱うことが可能な場合もある。ただし、名詞一名詞の合成は、英語では非常に一 般的な性質であるが、他の言語でもそうとは限らないため、制約言語の作成規定 は、対象となる特定のソース言語によって異なってくる。 英語では、動詞と前置詞、副詞、又はその他の品詞を組み合わせた、動詞−不変 化詞の形式が豊富である。この場合、不変化詞と動詞の間に目的語や句が挿入さ れるケースが多く、入力テキストのMT処理では、これが複雑さや曖昧さの原因に なる。従って、このような動詞・不変化詞の組み合わせは、できる限り書き直す ことが望ましい。これは、通常、単一の動詞に置き換えることによって行うこと ができる。たとえば、 ●″have to″の代わりに″must″又は″need″を使用する。 ●″refer to″の代わりに″consult″を使用する。 ●″turn the motor on″の代わりに″start the motor″を使用する。 また、できる限り完全な用語又は考えを適用することが必要である。これは、誤 解釈の可能性がある場合、特に重要である。たとえば、以下のような句では、 ″Use a monkey wrench to loosen the bolt...″ wrenchという語を、省略することはできない。技術的な知識を有する人間ならば 、この語がなくても、暗示されている意味を理解することはできるが、翻訳プロ セスでは、意味を明確に示すことが必要である。従って、CTEテキストで使用す る用語は、できる限り明示的に表現し、略語や短縮用語は、語彙的に完全な表現 となるよう書き直すことが必要である。 以下に、別の例を考えてみよう。 ″If the electrolyte density indicates that...″ これは、以下のように考えを正確に表現すれば、意味がより明確で完全になる。 ″If measurement of the etectrolyte density indicates that...″ また、以下の例で示すように、語や句が欠けている文章では、意味をより明確に するために、下線を引いた語を追加することが考えられる。 Turn the start switch key to OFF and remove the key. Pull the backrest(1)up, and move the backrest to the desired position. Jump Starting: make sure tha machines do no touch each other. このように、″ギャップ″を埋めると、考えがより完全になり、IATS 105による 正確な翻訳が、より確実となる。ギャップが原因となる翻訳ミスは、後編集が必 要となる一般的要因である。従って、ギャップは許されない。 口語又は会話英語では、非常に一般的な用語が頻繁に使用される。これは、曖昧 さの原因になるケースもあり、翻訳プロセスで解決することが必要である。たと えば、conditions、 remove、 faci1ities、 procedure、 go、 do、 is for、 make、 g etなどは、正しい語ではあるが、明確ではない。 以下のような文章では、 When the temperature reaches 32°F, you must take special precautions. ″reaches″という語は、温度が上昇しているのか、又は下降しているのかを伝 えることはできないため、いずれか(上昇又は下降)の語を使用した方が、テキ ストの読み易さを変えることなく、意味的により正確となる。 言語によっては、英語では常に区別するとは限らないものを、区別するケースも ある。たとえば、英語では、潤滑液や燃焼に使用する燃料のことをoilで総称し 、ディーゼルであるなしに関係なくfuelという語を使用する。同様に、doorとい う語は、孤立で使用し、どのような種類のdoorを指しているのか判断できないこ とがあり、この場合、car door、building door、又はcompartment doorなどが 考えられる。他の言語では、このような区別が必要となるケースも発生する。従 って、英語では、できる限り完全な用語を使用することが重要である。 C.ドメインモデル 知識系機械翻訳(KBMT)は、世界知識及び語彙単位やそれらの組み合わせに関す る言語的語義知識によって支援することが必要である。KBMTの知識ベースでは、 ″自動車は、車の一種である″、″ドアハンドルは、ドアの一部である″、加工 物は、(特性の中でも特に)″made-by″という特性によって特長付けられると いった、オブジェクトタイプの一般的な分類学的ドメインを表現できるだけでな く、オブジェクトタイプの特定なインスタンス(たとえば、″IBM″は、″corpo ration″というオブジェクトタイプのマーク付きインスタンスとして、ドメイン モデルに含める)や、(潜在的に複合となる)事象タイプのインスタンス(たと えば、米国大統領としてのジョージ・ブッシュの選挙当選は、複合動作″to-ele ct″のマーク付きインスタンスとなる)に関する知識を表現できることが重要で ある。知識ベースの存在学的な部分は、is-a、 part-ofなどの分類学構築リンク を通じて接続される多階層概念を形成する。概念は、同一リンクタイプ上で複数 の親を持つことができるため、このようにして得られた構造を、多階層と呼ぶ。 ドメインモデル又は概念語葉には、存在学モデルが含まれ、これは、特定ドメイ ンを記述するための積み木として利用される、基本分類(オブジェクト、事象タ イプ、関係、特性、場面など)の一様な定義を提供する。この″世界”モデルは 、比較的に静的であり、多様な相互関係を持つ存在学的概念のネットワークとし て構成される。アプリケーション(二次)世界の存在論の一般的展開は、この分 野でもよく知られている。関連文献としては、ここでも参考として含めてある、 Brackman and Schmolze, An Overview of the KL-ONE Knowledge representatio n System , Cognitive Science, vol.9, 1985、Lenat, et al, Cyc: Using Common Sense Knowledge to Overcome Brittleness and Knowledge Acquisition Bottl enecks , AI Magazine, VI:65-85,1985、 Hobbs, Overview of the Tacitus Proj ect , Computational Linguistics, 12:3, 1986、及びNirenburg et al, Acquisi tion of Very Large Knowledge Bases: Methodology, Tools and Applications , Center for Machine Translation, Carnegie Mellon University(1988)がある 。 存在学とは、重機器のトラブルシューティングや修理又はパーソナルコンピュー タとユーザ間の対話といった、特定の二次世界の言語独立型概念表現のことであ る。これは、ソーステキストをインターリングアテキストに解析し、得られたイ ンターリングアテキストからターゲットテキストを得るために、二次言語ドメイ ンで必要となる意味的情報を提供するものである。ドメインモデルでは、解析で の曖昧さを解消するのに十分な、意味上の制約を提供することが必要であり、ま た、存在学モデルでは、特定ドメイン記述用の積み木となる、基本存在分野に対 して一様な定義を提供することが必要である。 世界モデルでは、まず、存在学的概念が、オブジェクト(object)、事象(event) 、(無志向な行為者を説明するための)力(force)、及び特性(property)に分類 される。特性は、さらに、関係と属性に分類される。関係は、概念間のマッピン グ(写像)として定義される(たとえば、″belongs-to″は、あるオブジエクト を集合{*human*organization}にマッピングすることから、関係として分類され る)。また、属性は、特別に定義した値の集合への概念のマッピングとして定義 される(たとえば、″temperature″は、ケルビンスケールの程度の粒状性で、 物体を半オープンスケール[0,*]の値にマッピングする属性である)。概念は、 一般に、スロットがシステム内で完全に定義された特性となる、フレームとして 表現される。 ドメインモデルは、知識系機械翻訳だけでなく、あらゆる知識系システムで必要 となる。これは、翻訳分野で発生する概念の意味的階層を示すものであり、たと えば、オブジェクト*O-VEHICLEが、*O-WHEELED-VEHICLE及び*O-TRACKED-VEHICLE を含み、前者が、*O-TRACK、*O-WHEELED-TRACTORなどを含むといった定義になる 。この階層の底の部分は、CSLの用語に対応する特定概念であり、この部分を共 用K/DMと呼ぶ。正確な翻訳を行うためには、異なる概念が持つ役割に対して、意 味的制約を加えることが必要である。たとえば、*E-DRIVEという動作の行為者の 役割は、人間が果たさなければならないという事実は、*O-VEHICLEに対する意味 的制約となり、同様の制約が、あらゆる種類の車に対しても自動的に有効となる (この結果、それぞれのケースを、手動で個別にコーディングしなくても済む) 。ドメインモデルのオーサリング部分としては、非CSLの類義語に加え、著者が 各情報要素を組み立てる際に、便利なフィードバックとなるその他の情報をK/DM に追加する。 図5は、本発明が適用するドメインモデル(DM)の概念図である。DM 500は、TM 1 20及びLE 130が使用するCSL用語に関する、平叙文の知識を表現する。このDM 50 0は、主に、以下の3つの部分から構成されている。 1. ーネルドメインモデル(K/DM)510には、MTナライザ127及びLE 130の両方 で必要となる全部の語彙情報が含まれている。特に、カーネルには、関連する意 味上の概念、品詞、形態学的情報など、全てのCSL語葉用語(語及び句)が含ま れている。 2. Tドメインモデル(MT/DM)520には、MTアナライザ127のみに必要となる情 報が含まれている。MTメインモデルは、翻訳での曖昧なマッピングや意味の確認 に利用する概念階層である。これには、概念の選択的制約及び概念の分類階層が 含まれる。 3. Eメインモデル(LE/DM)530には、LE 130のみで必要となる情報が含まれ ている。これらの情報としては、CSL語彙用語に対する非CSLの類義語、CSL語彙 用語の辞書定義、及びCSL語彙用語の使用例がある。 カーネル/DM 510に含まれる語彙エントリは、各CSL語彙用語(語又は句)に対し て1つのみである。(″語彙エントリ″は、1つの語彙項目(つまり1つの語又 は1つの句)と、最低それに関連する意味的概念及び品詞から構成される。たと えば、″leak″という語が、名詞と動詞の両方としてCSLに含まれる場合、この 語に対しては、2つの語彙エントリが存在することになる。)各語彙項目は、定 義や不規則な語形変化といった、LE 130及び(又は)MT 120に必要な追加情報で 更新される。 共用K/DM 510は、CSLの洗練化と拡張を促進し、オーサリングや翻訳作業の繰返 しを不要とし、人間に読み易い構造を提供することによって、維持及び拡張を助 成する。 K/DM 510は、制約言語テキストの用語(語及び句)に関する、構文的情報と意味 的情報の両方を含んだ語彙集である。自動機械翻訳(MT)プロセスの分析過程では 、これが、中央語彙知識ソースとなる。K/DM 510は、また、LE/DMの基礎として も使用される。 K/DM 510に含まれるエントリは、各構文カテゴリーの用語1つに対して1つのエ ントリとなっている。(従って、名詞と動詞の両方で使用される″truck″のよ うな語には、2つのエントリが存在することになる。)K/DMエントリに含まれる 情報を、以下に示す。 ● 語根(例:″truck″) ● 品詞(例:N) ● 内容語の概念又は意味(例:O-TRUCK) ● 形態情報(例:不規則な語形変化) ● 構文情報(例:名詞が数えられるかどうかの区別) ● 定義情報:短い定義、異なる語義とその用途を示す文例、及び制約言語で 使用さるべき語義の指定 DM 500は、対象となるプロセスだけでなく、人間にも読める3セットの外部ファ イルに定義される。MT 120及びLE 130は、別のプロセスで稼動するため、このモ デルの情報は、MT 120に必要なDM部分とLE 130に必要な部分の、2つの異なるフォームで内部表現 されることになる。従って、K/DM 510は、両方のフォームで表現できるファイル セットに定義し、LE/DM 530は、LE 130が使用するフォームのみで表現し、MT/DM 520は、MT 120が使用するフォームのみで表現する。外部ファイルの形式、DMを 構成する各部の内容、及びLE 130が使用する情報の内部表現について、以下に説 明する。 上でも述べた通り、K/DMには、MT 120及びLE 130の両方で必要となる全情報が含 まれている。これらの情報としては、CSL語彙項目(基体語、句、又は引用用語 )、及び意味的概念(″概念名″によって語彙エントリに表現される、語彙項目 の意味的概念)がある。さらに、品詞(決められた品詞の中の1つ(たとえば、 動詞、形容詞など)、定義(CSL語彙用語のどの語義かを明確化するための一般 用語の概略定義)、及び不規則な語形変化(不規則な語形のリスト及び各語形に 対する形態変形名)も、情報として含められる。動詞に対する形態変形名の例と しては、″past″(過去)、″third person singular present″(三人称単数 現在)、″past participle″(過去分詞)、″present participle″(現在分 詞)などがある。たとえば、″drive″という語では、このフィールドの値は、 ((past drove)(past-participle driven))となり、これら2つの動詞変形が不 規則であり、その他の語形は規則的であることを意味する。最後に、語彙項目を すべて大文字にすべき時は、最初の文字を大文字にするといったような文字規制 も、K/DMに含まれる。 MT/DM 520には、MT 120のみが必要とする情報が含まれる。これらの情報として は、概念の選択規則、構成に対する概念の階層分類、及び選択規則の継承がある 。 著者が、適切なCSL語彙項目を選択できるようにするために、LE/DM 530には非CS L類義語を含める。また、カーネルとLE/DMには、(以降で説明する)LE用語チェ ッカーを支援するために、CSL語彙を特長付けるために必要な全ての情報及び規 制を含める。LE/DMには、LE用語チェッカーのみに必要となる追加情報も含めら れる。この追加情報としては、辞書定義(LEが著者に提供する語や句の定義)、 非CSL類義語(文書の作成で、著者が利用できるCSL語彙項目の類義語)、及び使 用例(LEが著者に提供する、CSL文内での語や句の使用例)がある。 この情報をLE/DMに含める理由は、執筆物が、適切なCSL語及び句で構成されてい るかどうかを、著者が確認できるようにするためである。CSLで許されている品 詞や意味の語や句を使っているかどうかの確認には、辞書定義と使用例が役立つ が、これらの情報は、すベてのCSL語彙項目に対して必要になるとは限らない。 辞書定義や使用例は、むしろ、CSLでの意味が一目瞭然でないような、不明確又 は曖昧な用語の一部にのみ必要となる。従って、 これらの情報が必要になるのは、DMに含まれる語彙項目の内の半分以下になるも のと思われる。たとえば、″for″や″the″といった機能語に対しては、定義や 使用例は不要である。また、技術用語、特に非常に特定的な意味を持つ技術用語 では、定義や使用例を提供する必要のない場合が多い。 LE/DMに含まれている非CSL類義語は、非CSL語や句を使っている場合に、それと 置き換えるべきCSL語やCSL句の類義語又は関連語を、著者が選択する時の助けと なる。用語チェッカーでは、該当する非CSL語と同じ品詞を持つ類義語だけでな く、文章の書き換えで役立つような、関連語に関する情報も提供することが望ま しい。後者を提供する場合は、必須の内容に加え、関連語に関する情報もLE/DM に含めることが必要である。 D.言語エディタ 図1(b)の制約言語エディタ(LE)130は、著者及び編集者が、CSLの制約内で文書 を作成する時の支援となる一連のツールから構成されている。これらのツールは 、著者がサービスドキュメンテーションを執筆する上で、適切なCSL用語及び文 法を使用するための助けとなる。このLE 130は、SGMLテキストエディタ140の″ 延長″として構築されるものである。LE 130とSGMLテキストエディタ140は、共 に同一の通信チャネルを使用してはいるが、両者の機能は、互いに排他的である 。ただし、LE 130との対話に使用するユーザインタフェースは、SGMLテキストエ ディタインタフェースの″一体的延長″となっている。 著者160は、SGMLテキストエディタ140で文書を作成し、LE 130を起動する。LE 1 30は、文書内のそれぞれの語が、非CSLであるかどうかを著者に知らせるととも に、ユーザアプリケーション情報ドメインに関連する語で、CSLに存在しないも のに対して、CSL類義語を提供することができる。さらに、LE 130は、ファイル 内のテキストが、CSL構文規約を満足しているかどうかの情報も著者に知らせる 。 LE 130のソフトウェアとしては、用語チェッカー、コア文法チェック機能を備え たMT構文アナライザへのインタフェースが含まれる文法チェッカー、及びユーザ インタフェース(UI)がある。さらに、CSL LEが利用するCSL用語情報も、K/DM及 びLE/DMで促供される。 任意の文書内の全用語及び文章構造が、CSL仕様に準拠するかどうかの承認は、L E 130によって行う。LE 130は、CSL承認を示すSGMLタグを使って、文書のマーク 付けを行う。 従って、文章、見出し、リスト項目、キャプション、図内の説明、表内の情報を 含め、文害内の全テキストに対してチェックを行うことが必要である。 本発明は、CSLチェック作業中、著者ができる限り効率よく作業し、一度に1文 書以上のオーサリングを行うことはないものと仮定しているため、文書を処理に 出し、その処理が完全に完了するまではフィードバックが得られないような、バ ッチモードでの作業は適していない。LE 130は、用語チェック、文法チェック、 及びインタラクティブ明瞭化プロセスに対して、対話モードを適用する。 図6は、LE 130の動作の高水準フローチャートである。この図では、制約のない 曖昧なテキスト605が、LE 130の入力になる。潜在的に曖昧で制約のないこの入 力テキスト605は、まず、(後述の)スペルチェッカー615を使ってその機能を果 たす用語チェッカー610でチェックされる。(この構成では、通常、ホストTE 14 0が有するスペルチェッカーによって、このスペルチェッカー機能が提供される 。)用語チェッカー610によるチェック及び(著者の介入を伴った)訂正が全て 完了すると、語彙制約済みテキスト617が、文法チェッカー620へ送られる。この 文法チェッカー620によって、構文の正しいCSLテキスト625が生成され、ブロッ ク630で示すように、構文の正しい制約済みテキスト625の明瞭化が行われる。こ の明瞭化プロセスからは、明瞭で翻訳可能な制約済みテキスト635が得られる。 この翻訳可能テキスト635は、前編集を行うことなく多言語へ翻訳することがで きる。ここで得られた翻訳の正確さによって、後編集も不要となる。 1.用語チェッカー 図7は、用語チェッカー610の動作フローチャートである。用語チェッカー610は 、CSLにない語を識別する。この用語チェッカー610は、著者のテキストに存在す る非CSL語の出現を識別し、著者が、それに代わる適切なCSL語を見つけられるよ う支援する。つまり、文書内の語境界を認識し、CSLにない語彙項目の全インス タンスを識別する。 ブロック706で示すように、単位の最初の用語が、チェック対象として選択され る。この用語は、ブロック710で示すように、全CSL語を含むCSL語彙データベー ス(つまり、辞書)と照合チェックされる。この用語が、CSL辞書に存在しない 時は、ブロック722に示す標準辞書で、用語のスペルがチェックされる。語のス ペルが誤っている場合は、ブロック726に示すように、スペルを訂正するための 手段が著者に提供される(つまり、用語チェッカー610が、代わりとなるスペル を表示する)。 次に、ブロック734に示すように、この用語がCSL用語であるかどうかがチェック される。CSL用語である時は、ブロック718へ処理が移る。CSL語でない時は、ブ ロック736に示すように、この用語に対する類義語がLE/DMに存在するかどうかが 、システムによってチェッ クされる。LE/DMに、少なくとも1個の類義語が見つかった時は、ブロック738に 示す通り、CSL用語であるその類義語を表示し、著者に選択を求める。LE/DMに、 該当する用語の類義語が全く存在しない場合は、ブロック740に示すように、著 者による再入力が行われる。ここで得られた入力は、ブロック710へ送られる。 著者によって妥当な選択が行われれば、手順700の制御はブロック718へ移る。 非CSL語が見つかった時の著者のオプションとしては、代わりの語を選択し、文 書内の非CSL語をその語で置き換えるか、又は文書内の語の置換えとなる新しい 語を入力するかである。通常、著者は、類義語の中から1つを選択し、それで非 CSL項目を置き換える。著者が、この処理をスキップした場合は、テキストが、C SLとしての承認で失格になる可能性もある。 ブロック718では、該当する単位に、別の用語が存在するかどうかをチェックす る。別の用語が存在しなければ、手順700は停止する。存在する場合は、ブロッ ク714に示すように、次の用語が選択され、手順700がブロック710から再開始と なる。 特に用語チェッカー610では、CSLに存在しない語彙項目の全インスタンスが識別 される。用語チェッカー610は、該当する語それぞれに対して、以下に記述する 説明の内どれが適切であるかを決定し、その情報をユーザインタフェースヘ報告 する。 ● 既知のCSL類義語を持つ非CSL語。この場合、用語チェッカー610は、類義 語を識別する。ここでは、例として、″let″という語が、非CSL語である場合を 考えてみよう。 チェック時の著者の入力:Open the valve and let more nitrogen go to the accumulator. VCメッセージ:この用語は非CSLですが、関連する別のCSL語があります。 関連CSL語:allow, allowed, enable, enabled, permit, permitted, leave, left 編集後のCSL文章:Open the valve and allow more nitrogen to go to the a ccumulator. ● 句の一部としてのみCSLに存在するが、該当する文脈では、CSL句として 使用されていない語。この場合、用語チェッカー610は、その語を含み、CSL句と して許される語を報告する。 チェック時の著者の入力:The first time the valve lash is checked, the injector timing should be checked. VCメッセージ:この用語は、非CSLの文脈で使用されています。 関連CSL語:advance signal timing, advance timing groove, timing gear, timing mechnism 編集後のCSL文章:The first time the valve lash is checked, the injecto r timing mechanism should be checked. ● 該当する文脈では引用符で囲まれていないが、CSLでは、引用符で囲むべ き語又は句。この場合、用語チェッカー610は、引用符で囲むべき由を報告する 。 チェック時の著者の入力:For more details, read the Testing and Adjusti ng article in the next section. VCメッセージ:この用語は、通常、引用符で囲みます。 関連CSL語:なし 編集後のCSL文章:For more details, read the ″Testing and Adjusting″a rticle in the next section. ● 該当する文脈では、大文字化されていないが、CSLでは必ず大文字化すべ き語又は句(たとえば、小文字で表現された略語)。この場合、用語チェッカー 610は、CSLでの正しい形式を報告する。 チェック時の著者の入力:Turn the screw until the pressure gauge reads Okpa(O psi). VCメッセージ:この用語は、大文字化が正しくありません。 関連CSL語:kPa 編集後のCSL文章:Turn the screw until the pressure gauge reads O kPa( O psi). ● 正しい綴りの存在する非語(つまり、誤綴りの語を表現する文字の並び) 。この場合、用語チェッカー610は、CSLに存在するかどうかにかかわらず、綴り の正しい関連語を識別する(ユーザは、ここで選択した関連語を、チェック対象 語として入力する)。 チエツク時の著者の入力:When it is necesary to raise the boom, the boo m must have correct support. VCメッセージ:この用語は、非CSLです。 関連CSL語:necessary 編集後のCSL文章:When it is necessary to raise the boom, the boom must have correct support. ● システムに解明できない非CSL語。未知の語又は句に対するメッセージで は、場合に依り、表現の書き換え又は違法表現のチェック保護を、著者に依頼す る。下に示す例では、SGMLタグを利用し、該当する違法表現が、システムによっ て無視されるよう指定している。 チェック時の著者の入力:Put approximately 0.9 L(1 quart)of SAElOW hy draulic oil in the nitrogen end of the accumulator. VCメッセージ:この用語は、存在しません。 関連CSL語:なし 編集後のCSL文章:Put approximately 0.9L(1 quart)of〈sic〉SAElOW〈/si c〉hydraulic oil in the nitrogen end of the accumulator. ● 文脈に関係なく、システムでは絶対に許されない句読点又は特殊記号。 非CSL語に対する直接的CSL類義語(文書内で直接置き換えることのできる語)が 存在しない場合、意図する考えを表現するために使用できる関連CSL語又は句を 、システムは識別 することができる。この機能は、著者にとって、CSL用語のみを使って文章を書 き換える場合の支援となる。しかし、語を変更したために、文章構造まで変更し なければならなくなる場合もあり、同義語に対する自動置換機能だけでは、関連 語の採用に伴う変更が完全とはならないケースもある。たとえば、″can″はCSL 語、″capable″は非CSL語となっている場合に、以下のような文章を書いたとす ると、 The system is capable of being programmed for several customer-specifi ed parameters. ″capable″[[capable]]は、CSL語でない由のメッセージが出されることになる 。この場合、″can″[[can]]は、CSL語ではあるが、文章の他の部分を修正せず に、″capable″又は″is capable of″を、直接″can″で置き換えることはで きない。 2.文法チェッカー 文法チェッカーの目的は、著者のテキストで、CSL文法規約に従っていない箇所 を見つけ、その箇所に対して著者の注意を促すことである。文法チェッカー620 の機能は、分析モジュール127及びMTシステム120によって提供し、構文及び文法 上の曖昧さに関するインスタンスを、システムで報告できるようにする。文法チ ェッカーのインタフェースは、曖昧さを明確化するための要求に対して、著者が 対話的に応答できるようにする。文章を制約言語で書いたとしても、その解釈が 2つ以上存在するケースもある。このような場合、文法チェッカーインタフェー スは、文章に該当する複数の解釈を指摘し、著者にその明確化を要求する。曖昧 な文章の例として、″check the cylinders on the inside″を考えてみると、 この場合、シリンダーが内側に存在するのか、シリンダーの内側をチェックする のか曖昧である。このような曖昧さとしては、以下に示す2種類がある。 語彙の曖昧さ。語彙の曖昧さは、1つの語が、制約言語で2つ以上の意味を持 つ場合に発生する。制約言語では、1つの語は、各品詞に付き1つの意味しか持 たないことが望ましいが、2つ以上の意味を持つ語も存在する。例として、″ga s″又は″gasoline″の意味に解釈できる語″gas″がある。 語彙レベルでは、CSL内で2つの異なる構文的役割を果たす語で、問題が発生す ることがある。この例としては、CSLで名詞としても、また動詞としても使用で きる″fuel″がある。著者が、構文的役割の不明確な文章を入力すると、文法チ ェッカー(GC)620は、以下のようなメッセージを出す。 チェック時の著者の入力:The sensor is attached to fuel rack. GCメッセージ:この用語は、名詞又は動詞として使用することができます。 この時点では、著者は、システムの支援なしに文章を編集することが可能である (この場合、文章の書き直しを行い、再度チェッカーに入力する)。著者が支援 を依頼した場合は、この種の問題を解決するための指示が、システムから提供さ れることになる。この時の支援は、以下のように明確である。 Help! GCメッセージ:語が名詞の場合は、その語の前に限定詞を使用し、動詞の場合 は、その語の後に限定詞を使用します。 例:The ship sinks vs. Ship the sinks. この結果、著者は、文章を編集し、再度文法チェッカー620へ入力することにな る。 構文の曖昧さ。構文の曖昧さは、文章内の語が、2通り以上にグループ分けで きる場合に発生する。たとえば、″Remove the valve with the lever.″の例で は、″with the Iever″が、″the valve″という句を伴う1つの単位を形成す るのか、それとも″remove″という動詞を伴う単位を形成するのか曖昧である。 つまり、レバーの付いたバルブに関する文章なのか、それともバルブを取り外す ためにレバーを使うのか不明である。 IATS 105には、このような問題を解決できるように設計されたコンポーネントと して、ドメンモデル137があり、このドメインモデルは、このような曖昧さの出 現を最小限に抑えられるような構造となっている。 図5に示す通り、機械翻訳プロセス専用のDM/MT 520には、2種類の情報が含ま れている。その1つである語義情報(A)は、概念間の識別又は関係をサポートし 、他方の文脈情報(B)は、特定の動詞が取り得る、いわゆる深格又は引数を提供 する。まず、アナライザ127が、上の例″Remove the valve with the lever″の 構文を解析する上で、語義情報(A)と文脈情報(B)がどのように役立つのかを考え てみよう。 語義関係としては、たとえば、″hat(帽子)″が、″costume(服装)″の″is a part of(一部 である)″という点から、″hat″という概念と″costume″という概念の間には 、″is a part of″という関係が成立する。また、概念″sole″と概念″shoe″ 、又は″heel″と″shoe″の間にも、同様の関係が成り立つ。DM/MT 520に存在 する語義情報(A)は、これに加え、ドメイン内の概念間に存在する他の意味的関 係をも識別することができる。 概念″valve″と概念″lever″との間の語義情報を得るために、処理がMTアナラ イザ127からDM/MT 520へ移った時、MTアナライザ127は、″lever″が″valve″ の″is a part of″であるかどうかは、DM 137内の情報から判断することはでき ない。つまり、このような関係についての知識は、そこには存在しないのである 。従って、この段階では、句″with the lever″を語″valve″と接続すべきか どうかは、MTアナライザ127には不明である。 ここで、MTアナライザ127が、文脈情報(B)をチェックすると、(学校時代のラテ ン語文法よりも深いレベルの分析から)動詞″remove″には、主格(MON)、対 格(ACC)、及び助格(INS)の3つの格があることが分かる。つまり、″remove ″は、以下の格フレームに当てあまることになる。 この抽象パターンに基づいて、以下のような文章を構成することができる。 など DM/MTには、[+INSTRUMENT]という意味的機能を持つ名詞と前置詞″with″との 関係を示す情報があるため、このような組み合わせは、助格句を形成することが 分かる。このことから、アナライザによって、以下の結論が導かれることになる 。 a)″lever″は[+INSTRUMENT]であるため、″with the lever″はINSとなる 。 b)″remove″はINS格を取るため、句″with the lever″は、″remove″と接 続し、 ″remove″を修飾するものとして解釈する。 DM 137は、本発明者が構築した程度までしか高度化できない。従って、語義情報 が完全に開発されていない場合は、ドメインの語彙エントリだけで、MTアナライ ザ127の明瞭化プロセスをサポートすることは不可能な場合もある。 ″Peter has removed the box with the nail″の″nail″を考えてみよう。DM 137に、nailが木製フレームの一部であるという情報が存在したとしても、nail が[+INSTRUMENT]であるという情報が存在しなければ、″with″が″nail″と 組み合わさって助格句を構成することは、MTアナライザ137で判断することはで きない。このように、アナライザで構文の曖昧さを解決できない場合は、著者に 対してその解決が要求されることになる。著者の入力したテキストを文法チェッ クする時は、以下のような対話が発生する。 チェック時の著者の入力:Peter has removed the box with the nail. 文法チェッカー620のメッセージ:文章が曖昧です。 1.nailは、助格ですか? 2.″nail″は、″box″に存在するのですか? 著者が適切な解釈を選択すると、チェッカーは、不可視のSGMLタグを文章に付け 、この文章がどのように翻訳されるべきかをシステムに指示する。 上でも述べたように、入力テキスト又はIE(又はその一部)が、CSLの文法及び 語義規約に準拠しているかどうかをチェックするために、MTアナライザ127が文 法チェッカーから呼び出される。この点から、厳格な″緑ライト又は赤ライト″ メッセージを、各文章に対して返すのが好ましい。なお、赤ライトは、著者が、 オーサリング環境を通じてフラグ付き文章の構造を訂正しなければならないこと を意味する。入力テキスト全体又はIE全体が、CSL準拠として承認されれば、そ れを保管しておくことも、又は直ちに翻訳へ回すことも可能である。 図8は、文法チェッカー620(構文解析)及び明瞭化チェッカー630(語義解析) の高水準フローチャートである。以降使用する″文章″という言葉は、分析モジ ュール127のチェックで合格又は不合格となるテキストの単位を意味する。実際 にチェックされるテキストは、見出し、タイトル、リスト項目、キャプション、 又はその他の図のテキストといった、文 章以外のテキストコンポーネントである。文法チェッカー620は、文章境界に加 え、SGMLマーク付きテキストのSMGL要素境界を認識することができる。また、CS L仕様に準拠していない文章の識別も行う。MT分析モジュール127によって解析で きないような文章が、これに相当することになる。なお、解析処理は、以下に示 す原因に限らず失敗する可能性がある。 ●分析モジュール127による解析の対象とならない文法構造を、文章が含んで いる。たとえば、還元関係節が文章に含まれる場合がある。″Don't change the values that are programmed into the unit″という文章では、関係代名詞″t hat″と動詞″be″の削除によって、還元が発生することになる。 チェック時の著者の入力:Don't change the values programmed into the un it . 文法チェッカーのメッセージ:この文章は、複雑過ぎて解析できません。 以下の問題をチェックしてください。 ここで、文法チェッカー620は、CSLに含まれていない文法構造によって、解析が 不可能あるいは困難となる最も典型的なケースをリストする。 ●文章で使われている引用符が、CSL規約に準拠していない。上でも述べたよ うに、文脈にかかわらず、CSLで許されていない引用符や特殊符号は、用語チェ ッカー610によってフラグ付けされる。ただし、用語チェッカー610では、入力の 解析は行わないため、CSLには存在するが、間違った文脈で使用されるケース については報告しない。このような場合、文法チェッカー620の処理結果は、″ 失敗″となる。 ●CSL用語が、CSLでは認識できない構文形式で使用されている。この場合、用 語チェッカー610は、該当するケースの一部にフラグを付ける。たとえば、test という語が、動詞としてではなく、名詞としてのみCSLに含まれているとすれば 、用語チェッカーは、その過去形testedを非CSL語として報告することになる。 ただし、動詞の現在形testsは、CSL名詞の複数形と同一形式であるため、用語チ ェッカー610のチェックでは合格する。このような場合、文法チェッカー620の処 理結果は、″失敗″となる。 文法チェッカー620は、MT分析モジュール127(及びドメインモデル137)を使っ て、CSL文法規約に準拠していない文章を識別する。これは、構文解析として知 られるものであり、ブロック805に示す通りである。文法チェッカー620は、この ような文章のそれぞれに対し て、CSL外であることを報告する。ただし、文章は、CSL内ではあっても、曖昧な ものになっている場合もある。従って、本発明では、ブロック710に示すような 語義解析を提供している。チェックした文章が、語義的に曖昧でない時は、ブロ ック815及び825で示すように、明瞭化チェッカー630が、該当すると思われる2 つ以上の意味を著者に指摘し、その明確化を要求する。本発明の好ましい具体化 では、文章が、文法チェッカー620及び(又は)明瞭化チェッカー630で失格とな った場合、文書の編集、(読みが曖昧な場合は)文章の明確化、同一の入力の再 チェック、又は編集を伴わないチェックの続行が、著者のオプションとして考え られる。 なお、本発明は、単なる文体的警告や単純なエラーの検出(主語−動詞の一致) を行うのではなく、用語及び文法規約の厳格な準拠を実施するものである。 文章が語義的に曖昧な時は、ブロック820に示すように、インターリングアへの 翻訳を行う。文書が文法チェッカー620で合格すれば、CSL承認を示すSGMLタグを 文書に挿入することができる。 本発明の好ましい具体化では、合格・不合格のフィードバックが、文法チェッカ ー620から著者160に対して与えられる。しかし、合格・不合格以外のより詳細な フィードバックを提供することも可能である。 明瞭化を含む文法チェックの詳細な説明については、ここでも参考として含めて ある、Tomita, M., ″Sentence disambiguation by Asking,″ Computers and T ranslation , 1:39-51(1986)及びCarbonell, J. and M. Tomita, ″Knowledge- Based Machine Translation,the CMU Approach,″in S.Nirenburg(ed.),M achine Translation:Theoretical and Methodological Issues ,Cambridge:Ca mbridge University Press,pgs.68-89(1987)を参照のこと。 E.機械翻訳 MT 120は、インターリングア型機械翻訳システムである。このようなシステムで は、制約ソース言語(CSL)とターゲット言語が、互いに直接係わり合うことは ない。このようなシステムの処理は、通常2段階で行われる。第1段階では、CS Lテキストの意味を、インターリングアと呼ばれる言語独立型正式言語で表現し 、第2段階では、ターゲット言語の語葉単位及び構文構造を使って意味を表現す る。 他のタイプのMTシステムと同様に、インターリングアMTシステムは、この分野 でもよく知 られている。機械翻訳に対するこれら異なるアブローチの詳細については、その 全体をここでも参考として含めてある、Hutchins, Machine Translation: Past, PresentFuture, Ellis Horwood, Ltd., Chichester, UK, 1986及びZarechnak , The History of Machine Translation, in Henisz-Dostert, McDonaId, Zarec hnak, eds., Machine Translation. Trends in Linguistics: Studies and Mono graphs , Vol. ll, The Hague, Mouton, 1979を参照のこと。 CSLテキスト350の意味は、(この分野では周知の)インターリングアと呼ばれる 、特別に設計された知識表現計画に基づいて表現される。このインターリングア は、フレーム表記法で表現されているため、一種の語義ネットワークとして見る ことができる。インターリングアには、他の人工言語又は公式言語と同様に、独 自の語彙と構文が存在する。語彙は、翻訳済みテキストが対象とするドメイン( たとえば、コンピュータ保守、宇宙探検など)に基づいている。従って、インタ ーリングアの″名詞″は、存在学の″物体概念″に相当し、インターリングアの 動詞は、存在学のいわゆる″事象″に対応し、そして、インターリングアの形容 詞及び副詞は、存在学で定義される様々な″特性″に相当する。存在学では、様 々な種類の概念を、ドメインモデルと呼ばれる緻密な結び付きを持ったネットワ ークで表現する。 図3及び図9を見ると、IATS 105の機械翻訳(MT)コンポーネント120が、主に 2つの部分から構成されているのが分かる。そのひとつは、CSLテキストをイン ターリングで表現するための処理の第1段階を実行するCSLアナライザ127であり 、もうひとつは、インターリングアで表現された″CSL承認″テキストをターゲ ット言語へ翻訳するためのターゲット言語ジェネレータ123である。これら2つ のタスクを実行するMTコンポーネント120は、独立した1個以上のサーバモジュ ールとして動作し、人間の翻訳コントローラ(図示省略)からの翻訳要求を受け 付ける。ターゲット言語の生成時には、後編集を必要としない高品質の出力テキ スト950を得るために、ターゲット言語ジェネレータ123は、インターリングアテ キスト260を適切なターゲット言語構文単位にマッピングする。 MT分析モジュール127による、承認済みCSL準拠IE用としてのインターリングアテ キスト260の生成が完了すれば、そのインターリングアは、保管することも、納 品することも、あるいはジェネレータ123(語義−構文マッパー及び、Center fo r Machine Translation, Carnegie Mellon University, Pittsburgh, Pa.から入 手可能なジェネレーションキットを含む(Tomita M. and E. Nyberg, The Gener ation Kit and Transformation Version3.2 User's Manual , Technical Memo(19 88))によって、ターゲット言語IE又は各種ター ゲット言語のIEへ直ちに変換することもできる。MTアナライザ127とMTジェネレ ータ123間には2通りの対話形態があり、一方は、前者の出力が後者の入力とな る形態、他方は、同一の外部知識ソース(特にドメインモデル137)を共用する 形態である。 MTシステム120は、図9に示すように、さらに細かく分類することができる。分 析部分は、構文解析系910とインタプリタ920から構成されている。MT 120の他の 半分は、マッパー930とジェネレータ940に分類することができる。図9の楕円形 は、主なソフトウェアモジュール間で生成され、受け渡しされるデータを示す。 翻訳過程では、DM 137(及び特にMT/DM 520)が、3つの異なる目的で使用され ることになる。つまり、(1)構文解析系910は、(構文解析時、引数や修飾子 の厳格な小分類化を行って)付属物を制約するためにDM 137を使用し、(2)イ ンタプリタ920は、解釈時、適切なドメン概念を例示化するためにDM 137を使用 し、(3)マッパー930は、各インターリングア概念に適切なターゲット言語表 現を選択するためにDM 137を使用する。 MT 120は、1つ以上のサーバモジュールとして動作する。それぞれのMTプロセス は、FMS 110からの翻訳要求を受け付け、その結果を返す。この要求には、SGML タグ付きシステムテキストが含まれ、結果には、SGMLタグ付きターゲット言語翻 訳が含まれる。また、複数言語への翻訳が同時実行されることもあるため、該当 するターゲット言語も要求に含まれることになる。MTサーバプロセスは、ターゲ ット言語によって特殊化されることから、経路指示機能が必要になる。この経路 指示機能は、FMS 110で自動的に実行している。任意の時点で稼動すべきMTプロ セスのグループ及び複数機械間でのそれらのプロセスの分散は、MFS 110によっ て決定される。MFS 110は、要求中の翻訳ジョブのグループに従って、適時プロ セスグループの変更を行う。 図9のCSLアナライザ127は、2つの相互練結コンポーネントである、構文解析系 910と語義インタプリタ920から構成されている。語義インタプリタ920は、この 分野では、″マッピングルールインタプリタ″としても知られるものである。構 文解析系910は、CSLテキスト305を入力として、その構文構造を生成する。この 構文解析系910では、LFG型文法を適用している。語彙機能文法(FG)は、機械翻訳 の分野では周知の正式化文法のことであり、これから、LFG f-構造960が構文構 造として得られる。CSL文章960に対するf-構造が生成されると、ソース言語の語 彙単位及び構文構造をインターリングア翻訳で置き換えるために、語義インタプ リタ920によるマッピングルールの適用が直ちに開始される。語彙単位は、ドメ イン概念のインスタンスにマッピングされ(たとえば、″data″という語は、イ ンターリングアの″information″にマッピングされる)、一方、構文構造は、 概念関係 にマッピングされる(たとえば、文章の主語は、通常、インターリングアの″行 為者″にマッピングされる)。詳細については、ここでも参考として含めてある 、Mitamura, The Hierarchicat Organization of Predicate Frames for Interp retive Mapping in Natural Language Processing , Center for Machine Transl ation, Carnegie Mellon University(May 1990)を参照のこと。 MTアナライザ127は、分析知識(データファイル)を利用して、ソース言語のCSL テキスト305の入力文章を、文章の意味を現わす語義フレーム表現に翻訳する。 解析段階で利用される知識構造は、解析文法、マッピングルール、及び概念語彙 である。 解析の最初の部分は、入力文章の構文を解析する構文解析プロセスである。構文 解析系910は、入力文章の解析中に遭遇した構文の曖昧さを処理するために、概 念語彙(ドメインモデル)に具体化されている語義規約を適用する。マッピング ルールは、構文解析文法と概念語彙との間に介在する。 この解析からは、適用できる全ての語義情報を備えた構文f-構造が、その出力と して得られる。この構造は、意味的に組織化されたフレーム表現(つまり、文章 の構文解析過程で遭遇した概念語彙を、適切な概念に具体化した形式)を得るた めに、さらにMTアナライザ127の2番目の部分で処理することができる。MTアナ ライザ127では、(適切な全ての語義情報を含む)f-構造の語義的機能を検索す ることによって、この形式を得ている。 本発明で使用している構文解析系910は、この分野ではよく知られており、詳細 は、ここでも参考として含めてある、Tomita and Carbonell, The Universal Pa rser Architecture for Knowledge-Based Machine Translation , Technical Rep ort, Center for Machine Translation, Carnegie Mellon University(May 198 7)及びTomita(ed.)et al., The Generalized LR Parser/Compiler Version 8 .1: User's Guide , Technical Memo, Center for Machine Translation, Cargen ie Mellon University(April 1988)に説明されている。 インターリングア翻訳システムが、他の種類のMTシステムよりも有利となる理由 のひとつは、インターリングア260が、言語独立型であること、つまり、ソース 言語とターゲット言語に直接的な接触がないということである。この利点によっ て、任意のソース言語及びターゲット言語が選択される一方、演算構造の変更が 最小限に留められるような機械翻訳システムが、構築できることになる。このよ うなシステムでは、当然、多数のソース言語を構文解析できることが要求される 。従って、インタプリタ自体に文法を組込むのではな く、言語文法を入力とするような、万能構文解析系が必要である。これによって 、より優れた伸張性と汎用性を達成することができる。 換言すれば、多言語を扱う場合、言語構造は、(純粋な英語構文解析系のように )あらゆる全てのアプリケーション間で互換性を持つような汎用不変式ではなく 、パラメータ化や伸張性の1次元でしかない。これに対し、語義情報は、(ドメ イン間での不変性は持たないが)あらゆる言語を通じ不変である。従って、語義 知識ソースは、構文知識ソースから分離させ、新しい言語情報を追加した時には 、その情報が全ての語義ドメインに適用でき、また、新しい語義情報を追加した 時には、それが全ての関連言語に適用できるようにすることが重要である。万能 構文解析系は、実行時の効率や語義精度に大譲歩することなく、これを達成でき るよう設計している。 構文解析系910は、3種類の知識ソースをその特長とする。その1つは、異なる 言語に関する構文文法、第2は、異なるドメインに関する語義知識ベース、第3 は、構文形式(語及び句)を語義知識構造にマッピングするための規則である。 それぞれの構文文法は、どのドメインからも完全に独立しており、同様に、それ ぞれの語義知識ベースは、どのドメインからも、また、どの言語からも独立して いる。 さらに、マッピングルールは、言語及びドメインから独立しており、それぞれの 言語・ドメインの組み合わせに対して、個別のマッピングルールが作成される。 これらの構文文法、ドメイン知識ベース、及びマッピングルールは、非常に抽象 的で、人間に読める形式で作成されているため、実行時の構文解析系では機械効 率が低くなる可能性もあるが、拡張や変更が容易である。 マッピングルールインタプリタ920の機能は、構文構造及び語義構造を生成及び 操作するとともに、これらの構造を同時生成することである。 万能構文解析系910は、解析した文章から得られるあらゆる全ての、つまり、有 効なf-構造を生成する。それぞれの構文f-構造は、語義機能を持ち、これらの機 能は、LFG理論に従って、残りの構文f-構造と同時に生成される。従って、語義 コンポーネントは、f-構造の追加機能として理解することができる。 このように、語義コンポーネントは、構文解析の″可視”部分にとなる。構文構 造及び語義構造を同時に生成するというこのアプローチによって、構文解析完了 前の″無意味な”部分的解析を省略できるシステムが構築されている。語義情報 は、語の定義を目的として 語彙をアクセスする時に、構文構造に追加されるようになっている。また、語の 定義の一部として、構造マッピングルールが含まれている。これらのマッピング ルールは、文法規則の構文式によって情報が構文構造に追加される時に適用され る。 ターゲット言語ジェネレータコンポーネント123は、インターリングアテキスト2 60を入力として、ターゲット言語テキスト950を生成する。このターゲット言語 ジェネレータ123は、語義モジュールと構文モジュールをそれぞれ1個づつとす る、2つの主要モジュールから構成されている。語義モジュールは、生成語彙及 び生成構造マッピングルールの支援によって、それぞれターゲット言語語彙の選 択及びターゲット言語構文構造の選択を行う。このモジュールの出力は、システ ムが出力するターゲット言語文章のf-構造である。 生成モジュールの目標は、CSLアナライザ127が生成したインターリングアテキス ト260のフレームから、ターゲット言語の文章を生成することである。生成処理 には、主に次の3つの段階がある。 1. 語彙の選択。 インターリングアの各概念に対して、最も適した語彙項目を選択するこ とが必要である。 2. F-構造の生成。 インターリングアテキストフレームから、ターゲット言語の文法構造を 決定する構文機能構造を生成することが必要である。 3. 構文の生成。 生成文法によって構文機能構造を処理し、ターゲット言語の文章を生成 する。 生成モジュール940の設計では、従来の翻訳CSLで利用されているマップ・アンド ・ジェネレート範例に、構文選択分野での最近の研究を組み込んでいる。 機械翻訳及び上で述べたモジュールの設計及び動作の詳細な説明については、こ こでも参考として含めてある、Nirenburg et al., Machine Translation: A Kno wledge-Based Approach , Morgan Kaufmann Publishers, Inc. (1992)、Sommers & Hutchins, Interlingua Translation System for Multi-lingual Document Pr oduction , Proceedings of Machine Translation Summit III, Washington D.C. (July 2-4 , 1991)、Nirenburg, S., ″World Knowledge and Text Meaning″, in K. Good man and S. Nirenburg(eds.), The KBMT Project: A Case Stud in Knowledge-B ased Machine Translation , San Mateo, Calif. (Center for Machine Translat ion, Carnegie Mellon University, Pittsburgh, PA(電話番号:(412)268-659 )から入手可能なMorgan Kaufmann, KBMT-89 Project Report)(4th Printing: M arch 1990)、S. Nirenburg(ed.),Machine Translation: Theoretical and Meth odological Issues , Cambridge: Cambridge University Press, pgs. 68-89(198 7)、及びCarbonell et al., Steps Toward Knowledge-Based Machine Translati on , IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. PAMI-3, No. 4(July 1981)を参照のこと。 以上、本発明を、好ましい具体化の例で示し、説明してきたが、本発明の真意及 び範囲から外れることなく、その形態や詳細に様々な変更を加え得ることは、こ の分野の特殊技能を有する者にとっては明白である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ハリス ティモシー ジェイ アメリカ合衆国 イリノイ州 61554 ペ キン サウス トゥエルヴス ストリート 625 (72)発明者 ヒグドン ジェームズ ダブリュー アメリカ合衆国 イリノイ州 61540 レ イコン ベイ ショア ドライヴ 55 (72)発明者 ヒル デニス エイ アメリカ合衆国 イリノイ州 61611 イ ースト ピオーリア アロウヘッド コー ト 121 (72)発明者 ハドソン ディヴィッド シー アメリカ合衆国 イリノイ州 61526 エ ーデルスタイン ノース センターヴィル 15914 (72)発明者 ナシレティ ディヴィッド アメリカ合衆国 イリノイ州 61550 モ ートン サウス ミシシッピー アベニュ ー 317 (72)発明者 レニッチ マーヴィン エル アメリカ合衆国 イリノイ州 61525 ダ ンラップ ノース ルート 91―11313 (72)発明者 アンダーソン ペギー エム アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ ピトック ストリ ート 2302 (72)発明者 バウアー マイケル エム アメリカ合衆国 ペンシルバニア州 15232 ピッツバーグ リーハイ アベニ ュー 245 (72)発明者 バスディッカー ロイ エフ ザ サード アメリカ合衆国 ペンシルバニア州 15232 ピッツバーグ サウス アベニュ ー 914 (72)発明者 ヘイズ フィリップ ジェイ アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ ノームリー プレ イス 5419 (72)発明者 ヒュットナー アリソン ケイ アメリカ合衆国 ペンシルバニア州 15206 ピッツバーグ ウォルナット ス トリート 6018 アパートメント 3 (72)発明者 マックラレン ブルース エム アメリカ合衆国 ペンシルバニア州 15206 ピッツバーグ ヒートス アベニ ュー 1018 (72)発明者 ニーレンバーグ アイリーン アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ ビーチウッド ブ ールヴァード 2550 (72)発明者 リーブリング エリック エイチ アメリカ合衆国 ペンシルバニア州 15237 ピッツバーグ クリアヴィュー ドライヴ 2294 (72)発明者 シュマンド リンダ エム アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ ビーチウッド ブ ールヴァード 1624 アパートメント 1 (72)発明者 スウィート ジョン エフ アメリカ合衆国 ペンシルバニア州 15206 ピッツバーグ 1 オーレリア ストリート 6362 (72)発明者 ベイカー キャサリン エル アメリカ合衆国 ペンシルバニア州 15206 ピッツバーグ ヘイスティングス ストリート 506 (72)発明者 ブラウンロウ ニコラス ディー アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ フィリップス ア ベニュー 5832 アパートメント 4 (72)発明者 フランツ アレクサンダー エム アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ 11 ワイトマン 2130 (72)発明者 ホーム スーザン イー アメリカ合衆国 ペンシルバニア州 15217 ピッツバーグ バートレット ス トリート 5858 (72)発明者 レーヴィット ジョン ロバート ラッセ ル アメリカ合衆国 ペンシルバニア州 15232 ピッツバーグ エルズワース ア ベニュー ディー2―5715 (72)発明者 ロンズデイレ ダリル ダブリュー アメリカ合衆国 ペンシルバニア州 15017 ブリッジヴィル スプリングハウ ス プレイス 6284 (72)発明者 ミタムラ テルコ アメリカ合衆国 ペンシルバニア州 15213 ピッツバーグ 204 ノース クレ イグ ストリート 233 (72)発明者 ニーバーグ エリック エイチ ザ サー ド アメリカ合衆国 ペンシルバニア州 15213 ピッツバーグ 36 ノース クレ イグ ストリート 147

Claims (1)

  1. 【特許請求の範囲】 1. ソース言語で書かれた入力テキストを、著者(160)から対話的に受け付 けるように設計したテキストエディタ(140)と、 曖味さのない制約テキストを生成するために、上記入力テキストに対し てまず語彙制約の準拠を、次に文法規約の準拠を実施する上で、上記著者(160) を対話的に支援するようにし、上記入力テキストを作成するために上記著者(160 )が使用する自然言語サブセットに対してまず語彙制約の準拠を、次に文法規約 の準拠を対話的に実行する上記テキストエディタ(140)の延長である言語エディ タ(130) とから成る、一言語文書開発用コンピュータ系システム(105)。 2.上記の語彙制約及び文法規約の実施において、上記言語エディタ(130)を支 援できるようにするために、語彙単位及びそれらの組み合わせに関する定義済み ドメイン知識及び言語語義知識を、ドメインモデル(137)から提供し、上記言語 エディタ(130)と通信する上記ドメインモデル(137)をその構成要素とした、特許 請求範囲1のシステム(105)。 3.上記DM(137)が3体ドメインモデルであり、この3体ドメインモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタドメインモ デル(530)、 及び、上記機械翻訳システム(105)のみが必要とする情報を含む機械翻 訳ドメンモデル(520) から構成されるようにした、上記特許請求範囲2のシステム(105)。 4.ソース言語で書かれた情報要素を、著者(160)から対話的に受け付けるよう に設計したテキストエディタ(140)と、 曖昧さのない制約情報要素を生成するために、上記情報要素に対してま ず語彙制 約の準拠を、次に文法規約の準拠を実施する上で、上記著者(160)を対話的に支 援するようにし、曖味さのない制約情報要素(410)を作成するために上記著者(16 0)が使用する自然言語サブセットに対してまず語彙制約の準拠を、次に文法規約 の準拠を対話的に実行する上記テキストエディタ(140)の延長である言語エディ タ(130)と、 曖昧さのない制約情報要素を、後の使用に備えて保存しておくためのメ モリ手段とから成る、一言語文書開発用コンピュータ系システム(105)。 5.上記の語彙制約及び文法規約の実施において、上記言語エディタを支援でき るようにするために、語彙単位及びそれらの組み合わせに関する定義済みドメイ ン知識及び言語語義知識を、ドメインモデル(137)から提供し、上記言語エディ タ(130)と通信する上記ドメインモデル(137)をその構成要素とした、特許請求範 囲4のシステム(105)。 6.上記DM(137)が3体ドメインモデルであり、この3体ドメインモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタドメインモ デル(530)、 及び、上記機械翻訳システム(105)のみが必要とする情報を含む機械翻 訳ドメンモデル(520) の3つから構成されるようにした、上記特許請求範囲5のシステム(105)。 7. ソース言語で書かれた入力テキストを、著者(160)から対話的に受け付 けるように設計したテキストエディタ(140)と、 曖昧さのない制約テキストを生成するために、上記入力テキストに対し てまず語彙制約の準拠を、次に文法規約の準拠を実施する上で、上記著者(160) を対話的に支援するようにし、上記入力テキストを作成するために上記著者(160 )が使用する自然言語サブセットに対してまず語彙制約の準拠を、次に文法規約 の準拠を対話的に実行する上記テキストエディタ(140)の延長である言語エディ タ(130)、 及び、上記の語彙制約及び文法規約の実施において、上記言語エディタ を支援で きるようにするために、語彙単位及びそれらの組み合わせに関する定義済みドメ イン知識及び言語語義知識を、ドメインモデル(137)から提供し、上記言語エデ ィタと通信するドメインモデル(137) とから成る、一言語文書開発用コンピュータ系システム(105)。 8.上記DM(137)が3体ドメインモデルであり、この3体ドメインモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタ(530)ドメ インモデル、 及び、上記機械翻訳システムのみが必要とする情報を含む機械翻訳ドメ ンモデル(520) の3つから構成されるようにした、上記特許請求範囲7のシステム(105)。 9. (A) ソース言語で書かれた入力テキストを、著者(160)から対話的に受 け付けるように設計したテキストエディタ(140)と、 (i) 上記入力テキスト内で、語彙制約に準拠していない語の出 現を識別し、その語に代わる妥当な語葉を見つける上で、上記著者(160)を対話 的に支援する用語チェッカー(610)と、 (ii)上記入力テキストの構文的及び語義的な曖味さに関する対 話的フィードバックを、上記著者(160)に提供するとともに、曖味さのない制約 テキストを作成するための上記対話的フィードバックを、上記著者(160)に提供 する文法チェッカー(620)とから成る、 (B) 上記入力テキストを作成するために、上記著者(160)が使用する自 然言語サブセットに対し、語彙制約及び文法規約の準拠を対話的に実行する上記 テキストエディタ(140)の延長である言語エディタ(130)と、 (C) 曖昧さのない上記制約テキストの作成を支援するために、語彙単位 及びそれらの組み合わせに関する定義済みドメイン知識及び言語語義知識を提供 し、上記言語エ ディタと通信するドメインモデル(137) とから成る、一言語文書開発用コンピュータ系システム(105)。 10.上記DM(137)が3体ドメインモデルであり、この3体ドメインモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタドメインモ デル(530)、 及び、上記機械翻訳システム(105)のみが必要とする情報を含む機械翻 訳ドメンモデル(520) の3つから構成されるようにした、上記特許請求範囲9のシステム(105)。 11. (1) ソース言語の入力テキストをテキストエディタ(140)に入力し、 (2) 上記ドメインモデル(137)に存在し、用語及び文法に関するソース 二次言語規則を含む定義済み規約と照らし合わせながら、上記入力テキストをチ ェックし、 (3) 上記入力テキストに関する対話的フィードバックを著者(160)に提 供し、この対話的フィードバックで、上記の定義済み規約を満足しているかどう かを指摘し、さらにこの対話的フィードバックが、語彙単位及びそれらの組み合 わせに関し必要なドメイン知識及び言語語義知識に加え、自然言語サブセットの 文法を提供する上記ドメインモデル(137)を参照した後で行われるようにし、 (4) 上記ステップ(3)の完了後、曖味さのない制約テキストを生成する といった上記ステップから成る、一言語文書開発用コンピュータ系方法(105)。 12.上記入力テキストを上記のソース二次言語規則に準拠させ、曖昧さを取り 除くために、上記の対話的フィードバックを実行するようにし、上記の定義済み 規約が、用語及び文法に関するソース二次言語規則を含むようにした、特許請求 範囲11のコンピュータ系方法。 13. (1)ソース言語の入力テキストをテキストエディタ(140)に入力し、 (2) 上記入力テキストを用語ソース言語規約と照合チェックし、 (3) 上記のソース入力テキストに無制約なソース言語が含まれている場 合、上記著者(160)が、上記入力テキストを制約ソーステキストに修正するまで 、上記ソース入力テキストに関する対話的フィードバックを上記著者(160)に提 供し、この対話的フィードバックが、語彙単位及びそれらの組み合わせに関し必 要なドメイン知識及び言語語義知識を提供する、上記ドメインモデル(137)を参 照した後で行われるようにし、 (4) 上記ドメインモデル(137)を参照することによって、上記制約ソー ステキストの構文誤りや語義の曖昧さをチェックし、 (5) 曖昧さのない制約テキストを生成するために、上記制約ソーステキ ストの上記構文誤りや上記語義の曖昧さを取り除くための対話的フィードバック を、上記著者(160)に提供する といった上記のステップから成る、一言語文書開発用コンピュータ系方法。 14. (1) ソース言語で作成した最低1個の情報要素(410)を、テキストエデ ィタ(140)に入力し、 (2) 最低1個の上記情報要素を、用語ソース言語規約と照合チェックし 、 (3) 上記の最低1個の情報要素(410)に無制約なソース言語が含まれて いる場合、上記の最低1個の情報要素(410)が、制約ソーステキストに修正され るまで、上記の最低1個の情報要素(410)に関する対話的フィードバックを著者( 160)に提供し、この対話的フィードバックが、語彙単位及びそれらの組み合わせ についてのドメイン知識及び言語語義知識を提供する上記ドメインモデル(137) を参照した後で行われるようにし、 (4) 上記ドメインモデル(137)を参照することによって、上記制約ソー ステキストの構文誤りや語義の曖昧さをチェックし、 (5) 曖昧さのない最低1個の制約情報要素を生成するために、上記制約 ソーステキストの上記構文誤りや上記語義の曖味さを取り除くための対話的フィ ードバックを、上記著者(160)に提供し、 (6) 後の使用に備えて、上記最低1個の曖味さのない制約情報要素を保 存する といった上記のステップから成る、一言語文書開発用コンピュータ系方法。 15. (1) ソース言語の入力テキストをテキストエディタ(140)に入力し、 (2) 上記入力テキストを用語ソース言語規約と照合チェックし、 (3) 上記のソース入力テキストに無制約なソース言語が含まれている場 合、上記入力テキストが制約ソーステキストに修正されるまで、上記ソース入力 テキストに関する対話的フィードバックを著者(160)に提供し、 (4) 上記制約ソーステキストの構文誤りや語義の曖味さをチェックし、 (5) 曖味さのない制約テキストを生成するために、上記制約ソーステキ ストの上記構文誤りや上記語義の曖昧さを取り除くための対話的フィードバック を、上記著者(160)に提供する といった上記のステップから成る、一言語文書開発用コンピュータ系方法。 16. ソース言語で書かれた入力テキストを、著者(160)から対話的に受け付 けるように設計したテキストエディタ(140)と、 まず語彙制約の準拠を、次に文法規約の準拠を対話的に実施することに よって、上記入力テキストから曖昧さのない制約テキストを生成するために、上 記著者(160)と対話する上記テキストエディタ(140)の延長である言語エディタ(1 30)と、 曖昧さのない上記制約ソーステキストを、前編集及び後編集を必要とす ることなく外国語へ翻訳するように構成した、上記言語エディタ(130)に応答的 な機械翻訳システム(123)と、 曖昧さのない上記制約ソーステキストの作成並びに外国語への上記翻訳 を支援するために、語彙単位及びそれらの組み合わせに関する定義済みドメイン 知識及び言語語義知識を提供し、上記言語エディタ(130)及び上記機械翻訳シス テム(123)と通信するドメインモデル(137) から成る、前編集及び後編集を必要とすることなく、ソース言語入力テキストを 外国語へ翻訳するためのコンピュータ系システム(105)。 17.上記ドメインモデル(137)が3体ドメインモデルであり、この3体ドメイ ンモデルが、 上記言語エディタ及び上記機械翻訳システム(123)が必要とする情報を 含むカーネル(510)、 上記言語エディタ(130)のみが必要とする情報を含む言語エディタドメ インモデル(530)、 及び、上記機械翻訳システム(123)のみが必要とする情報を含む機械翻 訳ドメンモデル(520) の3つのから構成されるようにした、上記特許請求範囲16のシステム(105)。 18.上記カーネル(510)が、それぞれの制約ソース言語語葉項目に対して1つ の語彙エントリを含むようにした、上記特許請求範囲17のシステム(105)。 19.選択の制限をサポートするために、上記機械翻訳ドメインモデル(510)が 、語彙概念を階層的に分類するための概念を含むようにした、上記特許請求範囲 17のシステム(105)。 20.上記言語エディタドメインモデル(530)が、無制約ソース言語の類義語を 含むようにした、上記特許請求範囲17のシステム(105)。 21.上記言語エディタ(130)の支援において、制約ソース言語語彙を特長づけ るために必要な全ての情報及び制限を、上記言語エディタドメインモデル(530) 及び上記カーネル(510)に含めるようにした、上記特許請求範囲17のシステム( 105)。 22.上記の対話実施によって、曖味さのない制約テキストが得られる上記入力 テキストの一部を、翻訳可能性を示すタグでマーク付けするための手段を、さら にその構成要素として含むようにした、上記特許請求範囲16のシステム(105) 。 23.複数の著者(160)がシステムを使用できるような翻訳サーバ環境で、上記 機械翻訳システム(23)が動作するようにした、上記特許請求範囲16のシステム (105)。 24.上記著者(160)が、コンピュータネットワークの一部であるワークステー ションで作業を行うようにした、上記特許請求範囲16のシステム(105)。 25.上記機械翻訳システム(123)が、曖昧さのない上記制約ソーステキストを インターリングアに翻訳するよう構成したインタプリタ(920)を含むようにした 、上記特許請求範囲16のシステム(105)。 26.上記言語エディタ(130)が、上記著者(160)による上記対話操作を、バッチ モードで行えるようにした、上記特許請求範囲16のシステム(105)。 27.図形エディタ(150)が、テキストラベルを生成するように設計し、上記著 者(160)が、上記言語エディタ(130)を使ってこのテキストラベルを編集し、その 後上記機械翻訳システム(123)で翻訳を行えるようにした、上記特許請求範囲1 6のシステム(105)。 28.制約言語が、自然言語のサブセットとなり、語彙及び文法に関して指定さ れるようにした、上記特許請求範囲16のシステム(105)。 29.上記言語エディタ(130)が、用語チェッカー(610)及び文法チェッカー(620 )から構成されるようにした、上記特許請求範囲16のシステム(105)。 30.上記用語チェッカー(610)が、上記入力テキストを、使用の許された語彙 と照合チェックし、許されない語に対しては、その置換えとなるものを提案する ようにした、上記特許請求範囲29のシステム(105)。 31.上記文法チェッカー(620)が、定義済み文法規則への準拠をチェックし、 未定義の文法構造に対しては、その置換えとなるものを提案するようにした、上 記特許請求範囲29のシステム(105)。 32.上記文法チェッカー(620)が、語彙の曖昧さ及び構造の曖昧さに関して、 著者(160)にフィードバックを提供するようにした、上記特許請求範囲29のシ ステム(105)。 33.上記文法チェッカー(620)が、対話的明瞭化の手段を提供するようにした 、上記特許請求範囲29のシステム(105)。 34.上記用語チェッカー(610)が、スペルチェッカー(615)を含むようにした、 上記特許請求範囲29のシステム(105)。 35.上記用語チェッカー(610)が、制約ソース言語に含まれていない語を識別 できるように構成した、上記特許請求範囲29のシステム(105)。 36.上記入力テキストが、情報要素のかたまりとして提供されるようにした、 上記特許請求範囲16のシステム(105) 37.情報要素(410)の内容及び論理構造の記述を可能にするタグが、上記情報 要素に含まれるようにした、上記特許請求範囲36のシステム(105)。 38. ソース言語で書かれた入力テキストを、著者(160)から対話的に受け付 けるように設計したテキストエディタ(140)と、 曖昧さのない制約テキストを生成するために、入力テキストに対して語 彙制約及び文法規約の準拠を実施する上で、上記著者(160)を対話的に支援する ようにし、上記入力テキストを作成するために上記著者(160)が使用する自然言 語サブセットに対して、上記の語彙制約及び文法規約の準拠を対話的に実行する 上記テキストエディタ(140)の延長である言語エディタ(130)と、 翻訳後テキストの後編集が不要となるように、曖昧さのない上記制約ソ ーステキストを翻訳する構成とした、上記言語エディタ(130)に応答的な機械翻 訳システム(123)から成る、一言語文書開発及び多言語翻訳用コンピュータ系シ ステム(105)。 39.曖昧さのない上記制約テキストを、後の使用に備えて保存しておくための 手段を、さらにその構成要素として含むようにした、上記特許請求範囲38のシ ステム(105)。 40.上記の対話実施によって、曖昧さのない制約テキストが得られる上記入力 テキストの一部を、翻訳可能性を示すタグでマーク付けする手段を、さらにその 構成要素として含むようにした、上記特許請求範囲38のシステム(105)。 41. ソース言語で書かれた情報要素を、著者(160)から対話的に受け付ける ように設計したテキストエディタ(140)と、 曖昧さのない制約情報要素を生成するために、上記情報要素に対して語 彙制約及び文法規約の準拠を実施する上で、上記著者(160)を対話的に支援する ようにし、上記入力テキストを作成するために上記著者(160)が使用する自然言 語サブセットに対して、上記の語彙制約及び文法規約の準拠を対話的に実行する 上記テキストエディタ(140)の延長である言語エディタ(130)と、 翻訳後テキストの後編集が不要となるように、曖味さのない上記制約情 報要素を 外国語へ翻訳する、上記言語エディタ(130)に応答的な機械翻訳システム(123)と 、 曖味さのない上記制約ソーステキストの作成並びに上記外国語への上記 翻訳を支援するために、語彙単位及びそれらの組み合わせに関する定義済みドメ イン知識及び言語語義知識を提供し、上記言語エディタ(130)及び上記機械翻訳 システム(123)と通信するドメインモデル(137) から成る、一言語文書開発及び多言語翻訳用コンピュータ系システム(105)。 42.上記ドメインモデル(137)が3体ドメインモデルであり、この3体ドメイ ンモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタドメインモ デル(530)、 及び、上記機械翻訳システムのみが必要とする情報を含む機械翻訳ドメ ンモデル(520) の3つから構成されるようにした、上記特許請求範囲41のシステム(105)。 43. (A)ソース言語で書かれた入力テキストを、著者(160)から対話的に受け 付けるように設計したテキストエディタ(140)と、 (i) 上記語彙制約に準拠していない語の出現を識別し、その語 に代わる妥当な語彙を見つける上で、上記著者を対話的に支援する用語チェッカ ー(610)と、 (ii) 構文的及び語義的な曖味さに関する対話的フィードバッ クを、上記著者に提供するとともに、曖昧さのない制約テキストを作成するため の上記対話的フィードバックを提供する文法チェッカー(620)とから成る、 (B)上記入力テキストを作成するために、上記著者(160)が使用する自然 言語サブセットに対して、語彙制約及び文法規約の準拠を対話的に実行する上記 テキストエディタ(140)の延長である言語エディタ(130)と、 (C) 語彙単位及びそれらの組み合わせに関する定義済みドメイン知識及 び言語語義知識を提供し、上記言語エディタと通信するドメインモデル(137)と 、 (D) 翻訳後テキストの後編集が不要となるように、曖味さのない上記制 約テキストを任意の外国語へ翻訳する構成とした、上記言語エディタ(130)に応 答的な機械翻訳システム(123) とから成る、一言語文書開発及び多言語翻訳用コンピュータ系システム(105)。 44.上記ドメインモデル(137)が3体ドメインモデルであり、この3体ドメイ ンモデルが、 上記言語エディタ及び上記機械翻訳システムが必要とする情報を含むカ ーネル(510)、 上記言語エディタのみが必要とする情報を含む言語エディタドメインモ デル(530)、 及び、上記機械翻訳システムのみが必要とする情報を含む機械翻訳ドメ ンモデル(520) の3つから構成されるようにした、上記特許請求範囲43のシステム(105)。 45. (1) ソース言語で作成した入力テキストを、テキストエディタ(140)に 入力し、 (2) 上記入力テキストを、用語ソース言語規約と照合チェックし、 (3) 上記のソース入力テキストに無制約なソース言語が含まれている場 合、上記著者が、このソース入力テキストを制約ソーステキストに修正するまで 、ソース入力テキストに関する対話的フィードバックを行い、最低1個の類義語 を含むリストから、この無制約ソース言語の置換えとなる語や句を上記著者が選 択できるようにし、 (4) 上記制約ソーステキストの構文誤りや語義の曖味さをチェックし、 (5) 曖昧さのない制約ソーステキストを生成するために、上記制約ソー ステキストの上記構文誤りや上記語義の曖昧さを取り除くための対話的フィード バックを、上記著者(160)に提供し、 (6) 曖味さのない上記制約ソーステキストを、ターゲット言語に翻訳す る といった上記のステップから成り、前編集及び後編集を必要とすることなく、ソ ース言語テキストを外国語へ翻訳するためのコンピュータ系(105)方法。 46.曖味さのない制約テキストが得られる上記入力テキストの一部を、翻訳可 能性を示すタグでマーク付けするためのステップを、さらにその構成要素として 含むようにした、上記特許請求範囲45のシステム(105)。 47.ステップ(2)及び(4)が、さらに3体ドメインモデル(DM)(137)と通信する ためのステップを含み、この3体ドメインモデル(DM)(137)が、語彙単位及びそ れらの組み合わせに関する定義済みドメイン知識及び言語語義知識を提供するよ うにし、しかも上記3体ドメインモデルが、 上記言語エディタ(130)及び上記機械翻訳システム(123)が必要とする情 報を含むカーネル(510)、 上記言語エディタ(130)のみが必要とする情報を含む言語エディタドメ インモデル(530)、 及び、上記機械翻訳システム(123)のみが必要とする情報を含む機械翻 訳ドメンモデル(520) から構成されるようにした、上記特許請求範囲45の方法。 48.翻訳を行うための上記ステップが、まず、曖昧さのない上記制約テキスト をインターリングアへ翻訳するためのステップを含むようにした、上記特許請求 範囲45の方法。 49.チェックを行うための上記ステップ(2)が、 (a) 上記ソース入力テキスト内の用語を、制約ソース言語(CSL)語彙知 識ベースと照合チェックし、 (b) その用語が、上記CSL語彙知識ベースに存在しない場合は、 (i) 上記用語の綴りを標準辞書でチェックし、綴り間違いの時 は、上記著者がこの用語の綴りを訂正できるようにし、 (ii) 上記用語を、CSL語彙データベースでチェックし、 (iii) 上記用語が上記CSL語彙データベースに存在しない時は 、上記ドメインモデルに存在する最低1個のCSL類義語を提供し、著者がその中 から類義語を1個選択できるようにする といったステップから構成されるようにした、上記特許請求範囲45の方法。 50.上記ソース入力テキスト内のあらゆる用語に対して、ステップ(a)及び(b) を繰り返すためのステップを、さらにその構成要素として含むようにした、上記 特許請求範囲49の方法。 51.上記用語に対する直接的CSL類義語が存在しない場合は、関連するCSL語又 は句のリストを上記著者に提供するためのステップを、さらにその構成要素とし て含むようにした、上記特許請求範囲49の方法。 52.上記著者が、非CSL用語を含む文章を書き換えることができるようにする ためのステップを、さらにその構成要素として含むようにした、上記特許請求範 囲49の方法。 53.上記著者が、曖昧さの明瞭化に対する上記要求に応答した後で、上記ソー ス入力テキストにタグを挿入するためのステップを、さらにその構成要素として 含むようにした、上記特許請求範囲45の方法。 54.上記ソース入力テキストが、情報要素のかたまりとして作成されるように した、上記特許請求範囲45の方法。 55.図形では、上記ソース入力テキストが、テキストラベルとなるようにした 、上記特許請求範囲45の方法。 56.上記著者に対して、上記ソース入力テキストに該当する2つ以上の意味の 指摘を提示するためのステップを、ステップ(3)に含めるようにした、上記特許 請求範囲45の方法。 57. (1) ソース言語で作成した入力テキストを、テキストエディタ(140)に 入力し、 (2) 上記入力テキストを、ドメインモデル(137)に存在する定義済み規 約と照合チェックし、この定義済み規約が、用語及び文法に関するソース二次言 語規則を含むよう にし、さらに上記入力テキストを上記ソース二次言語規則に準拠させ、曖味さを 取り除くために、上記の対話的フィードバックを行うようにし、 (3) 上記の定義済み基準を満足していない場合は、上記入力テキストに 関する対話的フィードバックを著者(160)に提供し、この対話的フィードバック が、語彙単位及びそれらの組み合わせについてのドメイン知識及び言語語義知識 を提供するドメインモデルを参照した後で行われるようにし、さらにこの対話的 フィードバックを通じて、上記著者(160)が、曖昧さのない制約ソーステキスト を作成できるようにし、 (4) 曖昧さのない上記制約ソーステキストを、ターゲット言語へ翻訳す る といったステップから構成される、一言語文書開発及び多言語翻訳用コンピュー タ系方法。 58.曖昧さのない制約テキストが得られる上記入力テキストの一部を、翻訳可 能性を示すタグでマーク付けするためのステップを、さらにその構成要素として 含むようにした、上記特許請求範囲57のシステム(105)。 59.コンピュータ系方法が、 (1) ソース言語で作成した入力テキストを、テキストエディタ(140)に 入力し、 (2) 上記入力テキストを、用語ソース言語規約と照合チェックし、 (3) 上記のソース入力テキストに無制約なソース言語が含まれている場 合、このソース入力テキストが制約ソーステキストに修正されるまで、ソース入 力テキストに関する対話的フィードバックを行い、この対話的フィードバックが 、語彙単位及びそれらの組み合わせについてのドメイン知識及び言語語義知識を 提供するドメインモデルを参照した後で行われるようにし、 (4) 上記ドメインモデル(137)を参照することによって、上記制約ソー ステキストの構文誤りや語義の曖昧さをチェックし、 (5) 曖昧さのない制約ソーステキストを生成するために、上記制約ソー ステキストの上記構文誤りや上記語義の曖味さを取り除くための対話的フィード バックを、上記著者(160)に提供し、 (6) 機械翻訳システム(123)を使って、上記ドメインモデルの支援を基 に、曖昧 さのない上記制約ソーステキストを外国語に翻訳する といったステップから構成される、一言語文書開発及び多言語翻訳用コンピュー タ系方法。 60. (1) ソース言語で作成した最低1個の情報要素(410)を、テキストエデ ィタ(140)に入力し、 (2) 最低1個の上記情報要素を、用語ソース言語規約と照合チェックし 、 (3) 上記の最低1個の情報要素に無制約なソース言語が含まれている場 合、上記の最低1個の情報要素が、制約ソーステキストに修正されるまで、上記 の最低1個の情報要素に関する対話的フィードバックを著者に提供し、この対話 的フィードバックが、語彙単位及びそれらの組み合わせについてのドメイン知識 及び言語語義知識を提供する上記ドメインモデル(137)を参照した後で行われる ようにし、 (4) 上記ドメインモデル(137)を参照することによって、上記制約ソー ステキストの構文誤りや語義の曖昧さをチェックし、 (5) 曖味さのない最低1個の制約情報要素を生成するために、上記制約 ソーステキストの上記構文誤りや上記語義の曖昧さを取り除くための対話的フィ ードバックを、上記著者に提供し、 (6) 後の使用に備えて、上記最低1個の曖昧さのない制約情報要素を保 存し、 (7) 機械翻訳システム(123)を使って、最低1個の曖昧さのない制約情 報要素を外国語に翻訳する といったステップから構成される、一言語文書開発及び多言語翻訳用コンピュー タ系方法。 61.上記情報要素が翻訳可能であることを承認するタグで、上記情報要素をマ ーク付けするためのステップを、さらにその構成要素として含むようにした、上 記特許請求範囲60の方法。 62.上記著者(160)が、上記最低1個の情報要素に存在する無制約言語を置換 えるための語や句を、類義語リストから選択できるようにするステップが、対話 的フィードバックを提供するためのステップ(3)に含まれるようにした、上記特 許請求範囲60の方法。
JP6507259A 1992-09-04 1993-08-23 総合オーサリング及び翻訳システム Pending JPH08501166A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US94118092A 1992-09-04 1992-09-04
US07/941,180 1992-09-04
PCT/US1993/007928 WO1994006086A1 (en) 1992-09-04 1993-08-23 Integrated authoring and translation system

Publications (1)

Publication Number Publication Date
JPH08501166A true JPH08501166A (ja) 1996-02-06

Family

ID=25476055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6507259A Pending JPH08501166A (ja) 1992-09-04 1993-08-23 総合オーサリング及び翻訳システム

Country Status (14)

Country Link
US (3) US5677835A (ja)
EP (1) EP0658259B1 (ja)
JP (1) JPH08501166A (ja)
CN (2) CN1083952A (ja)
AT (1) ATE190156T1 (ja)
AU (2) AU677605B2 (ja)
BR (1) BR9307175A (ja)
CA (1) CA2141221A1 (ja)
DE (1) DE69333568T2 (ja)
ES (1) ES2143509T3 (ja)
FI (1) FI113096B (ja)
NZ (3) NZ299101A (ja)
RU (1) RU2136038C1 (ja)
WO (1) WO1994006086A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933857B2 (en) 2004-04-14 2011-04-26 Ricoh Company, Ltd. Translator support system, server, method and recording medium

Families Citing this family (307)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08501166A (ja) * 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム
FR2716734B1 (fr) * 1994-02-25 1996-05-15 Sonovision Itep Technologies Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues.
US7024666B1 (en) * 2002-01-28 2006-04-04 Roy-G-Biv Corporation Motion control systems and methods
US5794177A (en) * 1995-07-19 1998-08-11 Inso Corporation Method and apparatus for morphological analysis and generation of natural language text
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
WO1998001807A1 (en) 1996-07-03 1998-01-15 Polydoc N.V. Document producing support system
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
GB9619165D0 (en) * 1996-09-13 1996-10-23 British Telecomm Training apparatus and method
US6173298B1 (en) * 1996-09-17 2001-01-09 Asap, Ltd. Method and apparatus for implementing a dynamic collocation dictionary
US7165020B2 (en) * 1998-05-29 2007-01-16 Citicorp Development Center, Inc. Multi-language phrase editor and method thereof
US6466900B1 (en) 1998-05-29 2002-10-15 Citicorp Development Center, Inc. Multi-language phrase editor and method thereof
WO1998020428A1 (en) * 1996-11-01 1998-05-14 Bland Linda M Interactive and automatic processing of text to identify language bias
EP0841624A1 (en) * 1996-11-08 1998-05-13 Softmark Limited Input and output communication in a data processing system
US6498921B1 (en) 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
US5956708A (en) * 1997-03-06 1999-09-21 International Business Machines Corporation Integration of link generation, cross-author user navigation, and reuse identification in authoring process
EP0968475B1 (en) * 1997-05-28 2001-12-19 Shinar Linguistic Technologies Inc. Translation system
JPH113338A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
US20010032278A1 (en) 1997-10-07 2001-10-18 Brown Stephen J. Remote generation and distribution of command programs for programmable devices
JPH11175527A (ja) * 1997-12-15 1999-07-02 Fujitsu Ltd 出力制御装置及び出力制御方法
GB9726654D0 (en) * 1997-12-17 1998-02-18 British Telecomm Data input and retrieval apparatus
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US10541974B2 (en) 1998-02-23 2020-01-21 Transperfect Global, Inc. Intercepting web server requests and localizing content
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
JP3936749B2 (ja) 1998-04-16 2007-06-27 クリエイター・リミテッド 対話型玩具
US7020601B1 (en) * 1998-05-04 2006-03-28 Trados Incorporated Method and apparatus for processing source information based on source placeable elements
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6345244B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically aligning translations in a translation-memory system
US6345243B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically propagating translations in a translation-memory system
US6173250B1 (en) 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
US6667736B1 (en) * 1998-06-17 2003-12-23 Microsoft Corporation Method for communicating local information between component objects and hosts
JP3114703B2 (ja) * 1998-07-02 2000-12-04 富士ゼロックス株式会社 対訳文検索装置
US6285978B1 (en) 1998-09-24 2001-09-04 International Business Machines Corporation System and method for estimating accuracy of an automatic natural language translation
US6336214B1 (en) * 1998-11-10 2002-01-01 International Business Machines Corporation System and method for automatically generating browsable language grammars
US6347316B1 (en) * 1998-12-14 2002-02-12 International Business Machines Corporation National language proxy file save and incremental cache translation option for world wide web documents
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US6460015B1 (en) * 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6321372B1 (en) * 1998-12-23 2001-11-20 Xerox Corporation Executable for requesting a linguistic service
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6278968B1 (en) 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6266642B1 (en) 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6374224B1 (en) 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
EP2336899A3 (en) * 1999-03-19 2014-11-26 Trados GmbH Workflow management system
TWI268806B (en) * 1999-09-15 2006-12-21 Rohm & Haas A catalyst useful for oxidation of alkanes
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US6301554B1 (en) 1999-09-23 2001-10-09 Wordstream, Inc. Language translation using a constrained grammar in the form of structured sentences formed according to pre-defined grammar templates
US6442522B1 (en) * 1999-10-12 2002-08-27 International Business Machines Corporation Bi-directional natural language system for interfacing with multiple back-end applications
US6721697B1 (en) * 1999-10-18 2004-04-13 Sony Corporation Method and system for reducing lexical ambiguity
US6535886B1 (en) 1999-10-18 2003-03-18 Sony Corporation Method to compress linguistic structures
US6529865B1 (en) 1999-10-18 2003-03-04 Sony Corporation System and method to compile instructions to manipulate linguistic structures into separate functions
US6928448B1 (en) 1999-10-18 2005-08-09 Sony Corporation System and method to match linguistic structures using thesaurus information
US6778949B2 (en) 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US8032605B2 (en) 1999-10-27 2011-10-04 Roy-G-Biv Corporation Generation and distribution of motion commands over a distributed network
EP1169678B1 (en) * 1999-12-20 2015-01-21 Nuance Communications Austria GmbH Audio playback for text edition in a speech recognition system
JP2001195463A (ja) * 2000-01-06 2001-07-19 Canon Inc 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
JP2001195115A (ja) 2000-01-06 2001-07-19 Canon Inc 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
JP2001256333A (ja) * 2000-01-06 2001-09-21 Canon Inc 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体
JP2001195462A (ja) * 2000-01-06 2001-07-19 Canon Inc 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム
US6571240B1 (en) 2000-02-02 2003-05-27 Chi Fai Ho Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
US6341959B1 (en) * 2000-03-23 2002-01-29 Inventec Besta Co. Ltd. Method and system for learning a language
AU2001255599A1 (en) * 2000-04-24 2001-11-07 Microsoft Corporation Computer-aided reading system and method with cross-language reading wizard
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
US6604101B1 (en) 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US6662181B1 (en) * 2000-05-08 2003-12-09 International Business Machines Corporation Mechanism for selection using access control structures for authoring systems
US7437669B1 (en) * 2000-05-23 2008-10-14 International Business Machines Corporation Method and system for dynamic creation of mixed language hypertext markup language content through machine translation
US7051278B1 (en) * 2000-07-10 2006-05-23 International Business Machines Corporation Method of, system for, and computer program product for scoping the conversion of unicode data from single byte character sets, double byte character sets, or mixed character sets comprising both single byte and double byte character sets
US7278100B1 (en) 2000-07-10 2007-10-02 International Business Machines Corporation Translating a non-unicode string stored in a constant into unicode, and storing the unicode into the constant
JP3494292B2 (ja) * 2000-09-27 2004-02-09 インターナショナル・ビジネス・マシーンズ・コーポレーション アプリケーションデータの誤り訂正支援方法、コンピュータ装置、アプリケーションデータ提供システム、および記憶媒体
US7130790B1 (en) * 2000-10-24 2006-10-31 Global Translations, Inc. System and method for closed caption data translation
US7747434B2 (en) * 2000-10-24 2010-06-29 Speech Conversion Technologies, Inc. Integrated speech recognition, closed captioning, and translation system and method
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
AU2002221218A1 (en) * 2000-11-22 2002-06-03 Nikolai Borisovich Borodulin Method for radiotelephone communication between interlocutors speaking differentlanguages
US20010056448A1 (en) * 2000-12-06 2001-12-27 Kazuhiro Takeda Document modifying system, document transmission system utilizing the modifying system, document modifying method and medium
US20020078106A1 (en) * 2000-12-18 2002-06-20 Carew David John Method and apparatus to spell check displayable text in computer source code
US7127402B2 (en) * 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US6950793B2 (en) * 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
US7257537B2 (en) * 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US7120868B2 (en) * 2002-05-30 2006-10-10 Microsoft Corp. System and method for adaptive document layout via manifold content
US6825844B2 (en) * 2001-01-16 2004-11-30 Microsoft Corp System and method for optimizing a graphics intensive software program for the user's graphics hardware
US7904595B2 (en) * 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7904194B2 (en) 2001-02-09 2011-03-08 Roy-G-Biv Corporation Event management systems and methods for motion control systems
US6964014B1 (en) * 2001-02-15 2005-11-08 Networks Associates Technology, Inc. Method and system for localizing Web pages
US20020133392A1 (en) * 2001-02-22 2002-09-19 Angel Mark A. Distributed customer relationship management systems and methods
US7483828B2 (en) * 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US20040205674A1 (en) * 2001-04-09 2004-10-14 Delgado Maria Elena E-mail translation system and method
US20020165708A1 (en) * 2001-05-03 2002-11-07 International Business Machines Corporation Method and system for translating human language text
US7283947B2 (en) 2001-05-24 2007-10-16 International Business Machines Corporation Method and system for translation management of source language text phrases
US20030018668A1 (en) * 2001-07-20 2003-01-23 International Business Machines Corporation Enhanced transcoding of structured documents through use of annotation techniques
US7089559B2 (en) * 2001-07-31 2006-08-08 International Business Machines Corporation Method, apparatus, and program for chaining server applications
US6993472B2 (en) * 2001-07-31 2006-01-31 International Business Machines Corporation Method, apparatus, and program for chaining machine translation engines to control error propagation
KR100918338B1 (ko) * 2001-08-10 2009-09-22 도쿠리쯔교세이호진 죠호쯔신겡큐기코 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트 생성 방법, 장치 및 프로그램을 저장한 기록 매체
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
US20030065503A1 (en) * 2001-09-28 2003-04-03 Philips Electronics North America Corp. Multi-lingual transcription system
AU2002330242A1 (en) * 2001-10-05 2003-04-22 Vitria Technology, Inc. System and method for vocabulary-based data transformation
US20030093262A1 (en) * 2001-11-15 2003-05-15 Gines Sanchez Gomez Language translation system
US20030101046A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
FR2833375B1 (fr) * 2001-12-07 2004-06-04 Amadeus Procede, dispositif d'adaptation de fichiers numeriques
US7369984B2 (en) * 2002-02-01 2008-05-06 John Fairweather Platform-independent real-time interface translation by token mapping without modification of application code
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US20030212962A1 (en) * 2002-05-08 2003-11-13 Amikai, Inc. Thin client-server architecture for automated machine translation
US7805302B2 (en) * 2002-05-20 2010-09-28 Microsoft Corporation Applying a structured language model to information extraction
US7356458B1 (en) * 2002-06-27 2008-04-08 Electronic Data Systems Corporation Multi-language correspondence/form generator
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
AU2003269454A1 (en) * 2002-10-07 2004-04-23 Varilang Soft Ltd. A method for manipulation of objects within electronic graphic documents
CN100380373C (zh) * 2002-10-29 2008-04-09 埃里·阿博 知识系统方法和装置
RU2323470C2 (ru) * 2002-12-18 2008-04-27 Майкрософт Корпорейшн Система и способ автоматического измерения высоты строки, размера и других параметров международного шрифта
JP4014563B2 (ja) * 2002-12-18 2007-11-28 株式会社リコー 翻訳支援システムおよび翻訳支援プログラム
US8214378B2 (en) 2003-02-10 2012-07-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time-critical filtering of information using domain ontologies
US7627817B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US7296260B2 (en) * 2003-02-26 2007-11-13 Inventec Corporation System and method for composing a multi-lingual instructional software
US20040193399A1 (en) * 2003-03-31 2004-09-30 Microsoft Corporation System and method for word analysis
US10332416B2 (en) * 2003-04-10 2019-06-25 Educational Testing Service Automated test item generation system and method
CA2427226A1 (en) * 2003-04-29 2004-10-29 Cognos Incorporated Dynamic generation of dimensional metadata
CA2427185A1 (en) * 2003-04-29 2004-10-29 Cognos Incorporated Automated database query generation
CA2427159A1 (en) * 2003-04-29 2004-10-29 Cognos Incorporated Simplified metadata modelling for reporting
CA2427182A1 (en) * 2003-04-29 2004-10-29 Cognos Incorporated Security filters in metadata modelling for reporting
US7319949B2 (en) * 2003-05-27 2008-01-15 Microsoft Corporation Unilingual translator
US8301436B2 (en) 2003-05-29 2012-10-30 Microsoft Corporation Semantic object synchronous understanding for highly interactive interface
US20040250209A1 (en) * 2003-06-05 2004-12-09 Gail Norcross Automated composition assistant
US7854009B2 (en) * 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US20050282133A1 (en) * 2004-06-18 2005-12-22 Christopher Crowhurst System and method for facilitating computer-based testing using traceable test items
US7246311B2 (en) * 2003-07-17 2007-07-17 Microsoft Corporation System and methods for facilitating adaptive grid-based document layout
US8014997B2 (en) 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US20040107124A1 (en) * 2003-09-24 2004-06-03 James Sharpe Software Method for Regulatory Compliance
US20060064503A1 (en) 2003-09-25 2006-03-23 Brown David W Data routing systems and methods
US8027349B2 (en) 2003-09-25 2011-09-27 Roy-G-Biv Corporation Database event driven motion systems
AU2004285259A1 (en) * 2003-10-29 2005-05-12 Benjamin M. W. Carpenter System and method for managing documents
JP2007515019A (ja) * 2003-12-17 2007-06-07 スピーチギア,インコーポレイティド 翻訳ツール
US20050138556A1 (en) * 2003-12-18 2005-06-23 Xerox Corporation Creation of normalized summaries using common domain models for input text analysis and output text generation
US20050137843A1 (en) * 2003-12-18 2005-06-23 Xerox Corporation Method and apparatus for authoring documents using object-based elements as an interaction interface
JP2005200547A (ja) * 2004-01-15 2005-07-28 Tombow Pencil Co Ltd 筆記具用水性インキ組成物
US8200475B2 (en) * 2004-02-13 2012-06-12 Microsoft Corporation Phonetic-based text input method
US7437709B2 (en) * 2004-02-19 2008-10-14 International Business Machines Corporation Providing assistance for editing markup document based on inferred grammar
US8296126B2 (en) * 2004-02-25 2012-10-23 Research In Motion Limited System and method for multi-lingual translation
US20050197826A1 (en) * 2004-03-02 2005-09-08 Neeman Yoni M. Embedded translation document method and system
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
EP1745392A2 (de) * 2004-03-16 2007-01-24 Star AG Computergestütztes hilfsmittel für ein verfahren zur erstellung von fremdsprachigen dokumenten
US20060031386A1 (en) * 2004-06-02 2006-02-09 International Business Machines Corporation System for sharing ontology information in a peer-to-peer network
US20060020465A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based system for data capture and knowledge representation
GB2417103A (en) * 2004-08-11 2006-02-15 Sdl Plc Natural language translation system
CN101137983A (zh) * 2005-01-10 2008-03-05 梅林格有限公司 嵌入式翻译增强的搜索
US7693705B1 (en) * 2005-02-16 2010-04-06 Patrick William Jamieson Process for improving the quality of documents using semantic analysis
US7774195B2 (en) * 2005-03-08 2010-08-10 Microsoft Corporation Method and system for creating, storing, managing and consuming culture specific data
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
JP2006268375A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳メモリシステム
JP2006276915A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳処理方法、文書翻訳装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US20060282266A1 (en) * 2005-06-13 2006-12-14 Microsoft Corporation Static analysis of grammars
US7711551B2 (en) 2005-06-13 2010-05-04 Microsoft Corporation Static analysis to identify defects in grammars
US20070033520A1 (en) * 2005-08-08 2007-02-08 Kimzey Ann M System and method for web page localization
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8392872B2 (en) * 2005-11-19 2013-03-05 International Business Machines Corporation Pseudo translation within integrated development environment
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
US8019714B2 (en) * 2005-12-12 2011-09-13 Qin Zhang Thinking system and method
US8229733B2 (en) * 2006-02-09 2012-07-24 John Harney Method and apparatus for linguistic independent parsing in a natural language systems
US8706470B2 (en) * 2006-05-08 2014-04-22 David T. Lorenzen Methods of offering guidance on common language usage utilizing a hashing function consisting of a hash triplet
US7865352B2 (en) * 2006-06-02 2011-01-04 Microsoft Corporation Generating grammatical elements in natural language sentences
US20070282594A1 (en) * 2006-06-02 2007-12-06 Microsoft Corporation Machine translation in natural language application development
US8209163B2 (en) * 2006-06-02 2012-06-26 Microsoft Corporation Grammatical element generation in machine translation
US20080005667A1 (en) 2006-06-28 2008-01-03 Dias Daniel M Method and apparatus for creating and editing electronic documents
US20080019281A1 (en) * 2006-07-21 2008-01-24 Microsoft Corporation Reuse of available source data and localizations
US8346555B2 (en) * 2006-08-22 2013-01-01 Nuance Communications, Inc. Automatic grammar tuning using statistical language model generation
US8019595B1 (en) 2006-09-11 2011-09-13 WordRake Holdings, LLC Computer processes for analyzing and improving document readability
RU2457534C2 (ru) * 2006-09-21 2012-07-27 Фераг Аг Печатная продукция и способ ее изготовления
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9189482B2 (en) 2012-10-10 2015-11-17 Abbyy Infopoisk Llc Similar document search
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US8078450B2 (en) * 2006-10-10 2011-12-13 Abbyy Software Ltd. Method and system for analyzing various languages and constructing language-independent semantic structures
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
KR100834549B1 (ko) * 2006-10-19 2008-06-02 한국전자통신연구원 번역 시스템 및 번역 서비스 제공방법
DE102006050112A1 (de) * 2006-10-25 2008-04-30 Dspace Digital Signal Processing And Control Engineering Gmbh Verfahren zur Erstellung einer Anforderungsbeschreibung für ein eingebettetes System
US20080115072A1 (en) * 2006-11-09 2008-05-15 International Business Machines Corporation Method and apparatus for visually assisting language input mode indentification
US8099287B2 (en) * 2006-12-05 2012-01-17 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
US7774193B2 (en) * 2006-12-05 2010-08-10 Microsoft Corporation Proofing of word collocation errors based on a comparison with collocations in a corpus
US8285697B1 (en) * 2007-01-23 2012-10-09 Google Inc. Feedback enhanced attribute extraction
US8768689B2 (en) * 2007-02-14 2014-07-01 Nuance Communications, Inc. Method and system for translation management of source language text phrases
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US20080244511A1 (en) * 2007-03-30 2008-10-02 Microsoft Corporation Developing a writing system analyzer using syntax-directed translation
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US8630841B2 (en) 2007-06-29 2014-01-14 Microsoft Corporation Regular expression word verification
IL186505A0 (en) * 2007-10-08 2008-01-20 Excelang Ltd Grammar checker
US20120101803A1 (en) * 2007-11-14 2012-04-26 Ivaylo Popov Formalization of a natural language
US10176827B2 (en) 2008-01-15 2019-01-08 Verint Americas Inc. Active lab
CN101303692B (zh) * 2008-06-19 2012-08-29 徐文和 一种供机器语言翻译的通用数码语义库
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US20090326925A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Projecting syntactic information using a bottom-up pattern matching algorithm
US20090326924A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Projecting Semantic Information from a Language Independent Syntactic Model
US8229735B2 (en) * 2008-06-27 2012-07-24 Microsoft Corporation Grammar checker for visualization
US20100030548A1 (en) * 2008-07-31 2010-02-04 International Business Machines Corporation Method for displaying software applications in a secondary language while interacting and viewing the default language version
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
JP5282528B2 (ja) * 2008-11-04 2013-09-04 富士通株式会社 翻訳支援プログラム、翻訳支援装置、および翻訳支援方法
US10489434B2 (en) * 2008-12-12 2019-11-26 Verint Americas Inc. Leveraging concepts with information retrieval techniques and knowledge bases
DE102009009123A1 (de) * 2009-02-16 2010-08-19 Marius Gevers Verfahren und ein System zum Übersetzen eines Textes aus einer ersten Sprache in zumindest eine weitere Sprache sowie ein Computer-Programm-Produkt
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
DE102009011724A1 (de) 2009-03-04 2010-09-09 Siemens Aktiengesellschaft Verfahren zum Erstellen von Anforderungsspezifikationen für Prozessleitsysteme der Kraftwerksleittechnik
US8943094B2 (en) 2009-09-22 2015-01-27 Next It Corporation Apparatus, system, and method for natural language processing
KR101072100B1 (ko) * 2009-10-23 2011-10-10 포항공과대학교 산학협력단 표현 및 설명 추출을 위한 문서 처리 장치 및 방법
US20110097693A1 (en) * 2009-10-28 2011-04-28 Richard Henry Dana Crawford Aligning chunk translations for language learners
RU2009144948A (ru) * 2009-12-03 2011-06-10 Виталий Евгеньевич Пилкин (RU) Система улучшения автоматизированного перевода информации
US20110144972A1 (en) * 2009-12-11 2011-06-16 Christoph Koenig Method and System for Generating a Localized Software Product
US8478581B2 (en) * 2010-01-25 2013-07-02 Chung-ching Chen Interlingua, interlingua engine, and interlingua machine translation system
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US10936687B1 (en) 2010-04-21 2021-03-02 Richard Paiz Codex search patterns virtual maestro
US11379473B1 (en) 2010-04-21 2022-07-05 Richard Paiz Site rank codex search patterns
US11423018B1 (en) 2010-04-21 2022-08-23 Richard Paiz Multivariate analysis replica intelligent ambience evolving system
WO2011146934A2 (en) * 2010-05-21 2011-11-24 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US9304786B2 (en) * 2010-07-07 2016-04-05 Canon Kabushiki Kaisha Information processing apparatus, method of controlling the same, and program
US9411793B2 (en) 2010-07-13 2016-08-09 Motionpoint Corporation Dynamic language translation of web site content
US9122744B2 (en) 2010-10-11 2015-09-01 Next It Corporation System and method for providing distributed intelligent assistance
US8965751B2 (en) * 2010-11-01 2015-02-24 Microsoft Corporation Providing multi-lingual translation for third party content feed applications
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
CN102622342B (zh) * 2011-01-28 2018-09-28 上海肇通信息技术有限公司 中间语系统、中间语引擎、中间语翻译系统和相应方法
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US20120221319A1 (en) * 2011-02-28 2012-08-30 Andrew Trese Systems, Methods and Media for Translating Informational Content
US20120239381A1 (en) * 2011-03-17 2012-09-20 Sap Ag Semantic phrase suggestion engine
US8527451B2 (en) 2011-03-17 2013-09-03 Sap Ag Business semantic network build
US9098488B2 (en) 2011-04-03 2015-08-04 Microsoft Technology Licensing, Llc Translation of multilingual embedded phrases
US20120290288A1 (en) * 2011-05-09 2012-11-15 Xerox Corporation Parsing of text using linguistic and non-linguistic list properties
US8725760B2 (en) 2011-05-31 2014-05-13 Sap Ag Semantic terminology importer
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US8935230B2 (en) 2011-08-25 2015-01-13 Sap Se Self-learning semantic search engine
US9961442B2 (en) 2011-11-21 2018-05-01 Zero Labs, Inc. Engine for human language comprehension of intent and command execution
US9158759B2 (en) 2011-11-21 2015-10-13 Zero Labs, Inc. Engine for human language comprehension of intent and command execution
US9836177B2 (en) 2011-12-30 2017-12-05 Next IT Innovation Labs, LLC Providing variable responses in a virtual-assistant environment
US9430449B2 (en) 2012-03-30 2016-08-30 Sdl Plc Systems, methods, and media for managing editable previews of webpages
CN102609410B (zh) * 2012-04-12 2014-12-17 传神联合(北京)信息技术有限公司 规范文档辅助写作系统及规范文档生成方法
US9223537B2 (en) 2012-04-18 2015-12-29 Next It Corporation Conversation user interface
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9536049B2 (en) 2012-09-07 2017-01-03 Next It Corporation Conversational virtual healthcare assistant
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9047274B2 (en) 2013-01-21 2015-06-02 Xerox Corporation Machine translation-driven authoring system and method
US9672822B2 (en) 2013-02-22 2017-06-06 Next It Corporation Interaction with a portion of a content item through a virtual assistant
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US10445115B2 (en) 2013-04-18 2019-10-15 Verint Americas Inc. Virtual assistant focused user interfaces
US20140358519A1 (en) * 2013-06-03 2014-12-04 Xerox Corporation Confidence-driven rewriting of source texts for improved translation
US9547641B2 (en) * 2013-09-26 2017-01-17 International Business Machines Corporation Domain specific salient point translation
CN103593340B (zh) * 2013-10-28 2017-08-29 余自立 自然表达信息处理方法、处理及回应方法、设备及系统
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2642343C2 (ru) * 2013-12-19 2018-01-24 Общество с ограниченной ответственностью "Аби Продакшн" Автоматическое построение семантического описания целевого языка
US9823811B2 (en) 2013-12-31 2017-11-21 Next It Corporation Virtual assistant team identification
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US20160071517A1 (en) 2014-09-09 2016-03-10 Next It Corporation Evaluating Conversation Data based on Risk Factors
JP6466138B2 (ja) * 2014-11-04 2019-02-06 株式会社東芝 外国語文作成支援装置、方法及びプログラム
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
RU2595616C1 (ru) * 2015-01-21 2016-08-27 Федеральное государственное бюджетное образовательное учреждение высшего образования "Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского" Способ прогнозирования эффективности речевого воздействия фрагментов дискурса на разных языках
RU2584457C1 (ru) * 2015-02-03 2016-05-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
IT201600074756A1 (it) * 2016-07-18 2018-01-18 Beatrice Branchesi sistema e metodo per identificare, segnalare e correggere inefficienze linguistiche e comunicative della scrittura professionale
US10261995B1 (en) 2016-09-28 2019-04-16 Amazon Technologies, Inc. Semantic and natural language processing for content categorization and routing
US10223356B1 (en) 2016-09-28 2019-03-05 Amazon Technologies, Inc. Abstraction of syntax in localization through pre-rendering
US10229113B1 (en) 2016-09-28 2019-03-12 Amazon Technologies, Inc. Leveraging content dimensions during the translation of human-readable languages
US10235362B1 (en) 2016-09-28 2019-03-19 Amazon Technologies, Inc. Continuous translation refinement with automated delivery of re-translated content
US10275459B1 (en) * 2016-09-28 2019-04-30 Amazon Technologies, Inc. Source language content scoring for localizability
WO2018203912A1 (en) * 2017-05-05 2018-11-08 Midmore Roger Interactive story system using four-valued logic
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
CN108536675B (zh) * 2018-03-22 2021-09-03 云知声智能科技股份有限公司 异常分词的处理方法及系统
US10713441B2 (en) * 2018-03-23 2020-07-14 Servicenow, Inc. Hybrid learning system for natural language intent extraction from a dialog utterance
US11568175B2 (en) 2018-09-07 2023-01-31 Verint Americas Inc. Dynamic intent classification based on environment variables
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
US11196863B2 (en) 2018-10-24 2021-12-07 Verint Americas Inc. Method and system for virtual assistant conversations
US11250842B2 (en) * 2019-01-27 2022-02-15 Min Ku Kim Multi-dimensional parsing method and system for natural language processing
CN110287498B (zh) * 2019-05-30 2023-04-07 北京百度网讯科技有限公司 层次化翻译方法、装置及存储介质
CN112417900A (zh) * 2020-11-25 2021-02-26 北京乐我无限科技有限责任公司 一种翻译方法、装置、电子设备及计算机可读存储介质
WO2023141715A1 (en) * 2022-01-28 2023-08-03 Pitts Lauren Method of semantic transposition of text into an unrelated semantic domain for secure, deniable, stealth encryption

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
US4829423A (en) * 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US4771401A (en) * 1983-02-18 1988-09-13 Houghton Mifflin Company Apparatus and method for linguistic expression processing
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
US5201042A (en) * 1986-04-30 1993-04-06 Hewlett-Packard Company Software process and tools for development of local language translations of text portions of computer source code
US5225981A (en) * 1986-10-03 1993-07-06 Ricoh Company, Ltd. Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes
GB2208448A (en) * 1987-07-22 1989-03-30 Sharp Kk Word processor
US4864501A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Word annotation system
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
US5185698A (en) * 1989-02-24 1993-02-09 International Business Machines Corporation Technique for contracting element marks in a structured document
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
JP2859661B2 (ja) * 1989-11-02 1999-02-17 株式会社リコー 機械翻訳装置
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
US5369574A (en) * 1990-08-01 1994-11-29 Canon Kabushiki Kaisha Sentence generating system
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5243519A (en) * 1992-02-18 1993-09-07 International Business Machines Corporation Method and system for language translation within an interactive software application
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
JPH08501166A (ja) * 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム
US5342519A (en) * 1993-07-30 1994-08-30 Donaldson Company, Inc. Fluid filter cartridge with replaceable filter element
US5995920A (en) * 1994-12-22 1999-11-30 Caterpillar Inc. Computer-based method and system for monolingual document development

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933857B2 (en) 2004-04-14 2011-04-26 Ricoh Company, Ltd. Translator support system, server, method and recording medium

Also Published As

Publication number Publication date
AU677605B2 (en) 1997-05-01
CN1083952A (zh) 1994-03-16
US5677835A (en) 1997-10-14
AU5087993A (en) 1994-03-29
AU1500797A (en) 1997-04-17
RU2136038C1 (ru) 1999-08-27
EP0658259A1 (en) 1995-06-21
US6658627B1 (en) 2003-12-02
DE69333568D1 (de) 2004-08-19
ES2143509T3 (es) 2000-05-16
WO1994006086A1 (en) 1994-03-17
FI951010A0 (fi) 1995-03-03
BR9307175A (pt) 1999-03-30
FI951010A (fi) 1995-03-03
NZ299101A (en) 1997-06-24
EP0658259A4 (en) 1995-10-18
DE69333568T2 (de) 2004-10-21
EP0658259B1 (en) 2000-03-01
AU696867B2 (en) 1998-09-17
ATE190156T1 (de) 2000-03-15
CA2141221A1 (en) 1994-03-17
CN1350250A (zh) 2002-05-22
FI113096B (fi) 2004-02-27
US6163785A (en) 2000-12-19
NZ314657A (en) 1997-06-24
NZ255865A (en) 1997-06-24

Similar Documents

Publication Publication Date Title
JPH08501166A (ja) 総合オーサリング及び翻訳システム
US6139201A (en) Integrated authoring and translation system
Garvin On machine translation: selected papers
Farwell et al. Automatically creating lexical entries for ULTRA, a multilingual MT system
Nirenburg Progress in machine translation
Boitet GETA's MT methodology and its current development towards personal networking communication and speech translation in the context of the UNL and C-STAR projects
Van der Eijk Controlled Languages in Technical Documentation Pim van der Eijk Cap Gemini Advanced Technology Services
Sérasset Recent trends of electronic dictionary research and development in europe
Sågvall Hein Parsing by means of Uppsala Chart Processor (UCP)
Karkaletsis et al. A knowledge-based methodology for supporting multilingual and user-tailored interfaces
Bernth et al. Terminology extraction for global content management
Winiwarter Incremental learning of transfer rules for customized machine translation
Hutchins Methods of linguistic analysis in machine translation
Nijholt Linguistic engineering: a survey
Altynbekova Artificial Intelligence and Translation Technology
van der Steen et al. Online correction and translation of industrial texts
Schwall et al. From METAL to T1: systems and components for machine translation applications
Boitet Gradable quality translations through mutualization of human translation and revision, and UNL-based MT and coedition
Thurmair Recent developments in machine translation
Klein et al. Construction and annotation of test-items in DiET
Bolshakova Towartds Computer-aided Editing of Scientific and Technical Texts
Dami et al. An expert system for french analysis within a multi-mode dialogue to be connected
Boddington Evaluation of an Esperanto-Based Interlingua Multilingual Survey Form Machine Translation Mechanism Incorporating a Sublanguage Translation Methodolgy
Serrano et al. Adapting and extending lexical resources in a dialogue system
CALS TEST NETWORK WRIGHT-PATTERSON AFB OH A Path to Tri-Service Use of SGML.