JP2752977B2 - 機械翻訳方法 - Google Patents

機械翻訳方法

Info

Publication number
JP2752977B2
JP2752977B2 JP62299755A JP29975587A JP2752977B2 JP 2752977 B2 JP2752977 B2 JP 2752977B2 JP 62299755 A JP62299755 A JP 62299755A JP 29975587 A JP29975587 A JP 29975587A JP 2752977 B2 JP2752977 B2 JP 2752977B2
Authority
JP
Japan
Prior art keywords
word
dictionary
translation
unknown
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62299755A
Other languages
English (en)
Other versions
JPH01142865A (ja
Inventor
公人 武田
浩一 長谷部
誠司 三池
真家 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62299755A priority Critical patent/JP2752977B2/ja
Publication of JPH01142865A publication Critical patent/JPH01142865A/ja
Application granted granted Critical
Publication of JP2752977B2 publication Critical patent/JP2752977B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は機械翻訳方法に係り、特に新語登録機能に
関する。 (従来の技術) コンピュータ技術を利用して、キーボードや原文ファ
イルから入力され原文記憶部に記憶された第1言語の原
文を自動的に第2言語の訳文にして出力する機械翻訳装
置の開発が進められている。機械翻訳装置は基本的には
入力された原文を形態素解析・構文解析等により所定の
処理単位(例えば語句)に区分し、その処理単位毎に翻
訳辞書を参照して対応する訳語を見出だし、それを所定
の訳文規則に従って結合することにより訳文を得る構成
となっている。 翻訳辞書としては翻訳処理に必要な第1言語→第2言
語の単語辞書や、文法辞書をはじめとする各種辞書の情
報が収容されている。これらのうち単語辞書においては
現存する全ての単語が登録されていることが理想的であ
るが、実際上は辞書作成に要する労力や、次々に新語が
誕生している現代社会の実情を考えると、不可能に近
い。従って翻訳対象となる原文中に、単語辞書に登録さ
れていない単語、すなわち未知語が存在することは避け
られない。 従来の機械翻訳装置では、翻訳処理の過程で原文に対
して形態素解析により未知語を見出だすと、その都度オ
ペレータへ知らせていた。オペレータはそのメッセージ
を見て、その未知語と対応する訳語や品詞等の属性情報
を入力し、翻訳辞書へ新語として登録している。しかし
ながら、原文が比較的短い場合はよいが、数十頁または
それ以上もの長文になると、未知語が見付かる毎にその
未知語と対応する訳語等の属性情報の入力による辞書登
録操作を行なうことは極めて煩雑であり、翻訳の能率を
著しく低下させる。 (発明が解決しようとする問題点) このように従来の機械翻訳装置では、原文中に翻訳処
理の過程で未知語が見つかる都度、辞書登録を行なう必
要があるため、大量の文書を翻訳する場合、辞書登録操
作により翻訳処理がしばしば中断され、効率が悪いとい
う問題があった。 この発明は、原文中に存在する未知語に対する辞書登
録を一括してできるようにし、翻訳処理を効率的により
短時間で行なう機械翻訳方法を提供することを目的とす
る。 [発明の構成] (問題点を解決するための手段) 本発明は、単語辞書を含む各種辞書の情報を収容した
翻訳辞書部内の情報を用いて翻訳対象の原文を翻訳する
機械翻訳方法において、未知語検索要求を受けて、前記
原文中で前記翻訳辞書部に収容されていない全ての語句
を未知語として検索し、未知語として検索された語句の
リストを表示し、辞書登録要求を受けて、このリストに
おいて訳語を含む属性情報が付加された登録すべき語句
夫々を対応する該属性情報と共に前記翻訳辞書部に一括
して登録することを特徴とする。 (作用) オペレータが未知語検索要求を入力すると、翻訳対象
の原文中から、翻訳辞書部で登録されていない未知語が
全て検索される。オペーレータがこの検索された未知語
のリストを例えば表示画面により確認し、それに基づい
て各々の未知語の語句に対応する訳語や品詞等の属性情
報を入力すると、それが元の語句と対応付けられ新語と
して辞書登録部により一括登録される。この新語の一括
登録が終われば、機械翻訳装置は既に入力されている原
文の翻訳をスムースに進めることができ、結果的に辞書
登録をも含めた翻訳処理の効率が大幅に向上する。 (実施例) この発明の実施例を図面を参照して説明する。第1図
はこの発明の一実施例に係る機械翻訳装置の構成を示す
ブロック図である。以下、英日翻訳を例にとり説明す
る。 第1図において、キーボードからなる入力部1は翻訳
対象となる原文の入力や各種のコマンドの入力を行なう
ためのもので、この入力部1より入力される第1言語の
原文としての英文は、装置全体の制御を司る編集制御部
2を介して原文記憶部3に記憶される。原文記憶部3に
記憶された原文は、翻訳部4で第2言語である日本語文
に翻訳される。翻訳辞書部5は翻訳部4での翻訳処理に
使用する各種辞書、例えば語尾等に変化のある単語を
その原型(基本型)に変換する活用・変化辞書,第1
言語(英語)の単語・熟語に対応する第2言語(日本
語)の訳語がその品詞情報と共に記憶された単語・熟語
辞書,正しい品詞の列が記憶された解析文法辞書,
英語から日本語への変換情報が記憶された変換文法辞
書,変換された日本語の文の構造を決定する生成文法
辞書,日本語の語尾等の語型を変化させて翻訳文を完
成させる形態素生成文法辞書等を収容したものである。
翻訳部4で得られた訳文は編集制御部2を介して訳文記
憶部6に記憶される。表示部7は原文や訳文等を表示す
るためのもので、また印刷部8は原文や訳文をハードコ
ピーとして出力するものである。 この発明では上記の機械翻訳装置の基本構成に加え、
原文記憶部3に記憶された原文中の全ての未知語、すな
わち翻訳辞書部5に収容されていない語句を検索する未
知語検索部9と、この未知語検索部9により検索された
語句を記憶する未知語記憶部10と、この未知語記憶部10
に記憶された語句をそれに対応する訳語を含む属性情報
と共に翻訳辞書部5に新語として登録するための辞書登
録部11とが設けられている。 第2図は入力部1のキー配列の一例を示したものであ
り、文字キー21,編集キー22,機能キー23,カーソル制御
キー24及びその他のキーが備えられている。機能キー23
の中には、未知語検索要求,未知語編集要求,辞書登録
要求を入力するためのキーが含まれている。 第3図は未知語検索部9で未知語として検索された語
句の表示例を示し、第4図は検索された未知語と、その
未知語に対してオペレータにより入力された訳語とを対
応させて表示した例を示している。 次に、本実施例における未知語検索と未知語記憶およ
び新語辞書登録の手順を第5図に示すフローチャートを
参照して説明する。 編集制御部2はステップS1〜S5において入力部1から
のキー入力の有無を監視しており、なんらかのキー入力
があった場合、それに対応する処理を行なう。オペレー
タが機能キー23のいずれかを操作すると、ステップS1〜
S3でこれが検知され、ステップS7〜S9でその機能キーに
対応した処理が行なわれる。 オペレータが編集キー22のいずれかを操作すると、そ
れがステップS4で検知され、ステップS10でその編集キ
ーに対応した処理が行なわれる。 オペレータがカーソル制御キー24あるいはその他のキ
ーを操作した場合は、ステップS1〜S5を介してステップ
S6でそのキー操作に対応したカーソル移動のための処理
やその他の処理が行なわれる。 オペレータが文字キー21を操作して文字入力を行なう
と、ステップS5で各文字キーが検知された後、対応する
文字コードが割当てられた編集領域にセットされる。編
集領域としては、未知語の編集要求がステップS2で検知
されるまでは原文記憶部3が割当てられ、その内容が表
示部7で表示される。未知語の編集要求がステップS2で
検知されると、未知語記憶部10が編集領域に割当てら
れ、第3図および第4図のような表示がなされる。 訂正・挿入・削除等の編集操作は、カーソル制御キー
24の操作により所望の編集個所へカーソルを移動させた
後、編集キー22に含まれる訂正キー,挿入キー,削除キ
ー等を用いて行なわれる。 編集キーの打鍵があると、それがステップS4で編集制
御部2により検知され、編集領域として割当てられてい
る記憶部内のカーソル制御キーで指示されている語また
は句に対して、各キーに対応した編集処理が行なわれ
る。例えば挿入キーの操作によりカーソル位置の前に文
字を挿入したり、削除キーの操作によりカーソルが指示
している範囲の文字列を無効にしたり、移動キーの操作
によりカーソルが指示している範囲を他の位置へ移動さ
せたり、また取消しキーの操作によりこれら挿入キー,
削除キー,移動キー等の操作の効果を無効にすることが
できる。 また、カーソル制御キー24としてはカーソルをそれぞ
各方向に移動させるカーソル移動キー,カーソルが移動
する単位を切換える単位切換えキー,カーソルのサイズ
を文字単位または語単位に拡大・縮小するための拡大・
縮小キーが含まれている。 オペレータは原文の入力・編集を行ないながら、未知
語検索要求キーを適宜操作することにより、原文記憶部
3に記憶された原文中の未知語を検索し、それらをまと
めて辞書登録部11により登録することができる。まず、
未知語検索部9について説明する。未知語検索の手法と
しては、例えば翻訳辞書部5から原文中の未知語に近い
単語を引出して、その単語の品詞が許容する語尾変化を
行なう。複数形,進行形,過去形,過去分詞,不規則変
化等、その単語がとり得る全ての可能性をマッチング候
補として求め、原文とのマッチングを行なう。なお、原
文から未知語の単語の原型を求め、翻訳辞書部5内の辞
書とのマッチングを行なってもよい。その場合は、マッ
チングの後で原型を求めたときの語尾変化と、辞書の品
詞による語尾変化とが一致するチェックを必要とする。 上述のようなマッチングを行なった結果、マッチング
がとれない原文中の語句については、それを未知語とし
て未知語記憶部10へ記憶させる。 ここで、未知語となった語句には2種類あり、一つは
原文の入力誤りで未知語となった語句で、他の一つは正
しく入力されたが翻訳辞書部5に登録されていない本来
の未知語である。例えば第3図に例示した未知語検索部
9で未知語として検索された語句のうち、“read−only
−memory",“VDT"は本来の未知語であるが、“translat
er"は“translator"の入力誤りによるスペルミスで未知
語となったものである。このような入力誤りで未知語と
なったものについては、原文記憶部3内でそれを修正
し、未知語記憶部10内から編集キー22のうちの削除キー
を用いて除けばよい。 未知語検索が終了した後、オペレータが未知語の編集
要求キーを操作すると、編集制御部2においてステップ
S2で検知され、未知語記憶部10が編集領域に割当てられ
る。これにより未知語記憶部10に検索された未知語が記
憶され、かつ表示部7で第3図に示したような形式で未
知語のリストが表示される。 オペレータはカーソル移動と未知語に対する訳文の入
力を第3図の表示画面を見ながら行なうことになる。入
力誤りは前述したように削除キーを用いて除くことがで
きる。この結果、未知語記憶部10内において未知語であ
る原文の語句に、対応する訳語が付加され、かつ第4図
に示すように表示がなされる。全ての訳語の入力が終了
したら、オペレータは未知語の辞書登録要求キーを操作
することで、未知語記憶部10に記憶されている訳語,品
詞等の翻訳に必要な属性情報の付加された未知語情報
が、例えば次のような形式で翻訳辞書部5に順番に登録
される。 原文の語句:訳語:品詞:他の情報 なお、第4図では品詞および他の情報は省略して示し
ている。品詞を省略したときは、名詞で登録すればよ
い。 [発明の効果] この発明によれば、翻訳対象の原文中で翻訳辞書部に
収容されていない語句(未知語)を検索して一括して記
憶し、その対応する訳語を含む属性情報を付加して辞書
登録部で登録できるようにしたことにより、大量の翻訳
対象原文中の未知語に対して短時間で辞書登録を行なう
ことが可能となり、翻訳に要する時間を大幅に短縮する
ことができる。
【図面の簡単な説明】 第1図はこの発明の一実施例に係る機械翻訳装置の構成
を示すブロック図、第2図は第1図における入力部のキ
ー配列を示す図、第3図および第4図は第1図における
表示部の未知語検索時および辞書登録時の表示例を示す
図、第5図は同実施例における主要な処理の流れを示す
フローチャートである。 1……入力部、2……編集制御部、3……原文記憶部、
4……翻訳部、5……翻訳辞書部,6……訳文記憶部、7
……表示部、8……印刷部、9……未知語検索部、10…
…未知語記憶部,11……辞書登録部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天野 真家 神奈川県川崎市幸区小向東芝町1 株式 会社東芝総合研究所内 (56)参考文献 特開 昭62−203266(JP,A) 特開 昭63−136264(JP,A) 特開 昭61−220064(JP,A) 特開 昭62−198957(JP,A) 月刊アスキー 1986年2月号 P. 121〜P.137 (1986)

Claims (1)

  1. (57)【特許請求の範囲】 1.単語辞書を含む各種辞書の情報を収容した翻訳辞書
    部内の情報を用いて翻訳対象の原文を翻訳する機械翻訳
    方法において、 未知語探索要求を受けて、前記原文中で前記翻訳辞書部
    に収容されていない全ての語句を未知語として検索し、
    未知語として検索された語句のリストを表示し、 辞書登録要求を受けて、このリストにおいて訳語を含む
    属性情報が付加された登録すべき語句夫々を対応する該
    属性情報と共に前記翻訳辞書部に一括して登録すること
    を特徴とする機械翻訳方法。
JP62299755A 1987-11-30 1987-11-30 機械翻訳方法 Expired - Lifetime JP2752977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62299755A JP2752977B2 (ja) 1987-11-30 1987-11-30 機械翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62299755A JP2752977B2 (ja) 1987-11-30 1987-11-30 機械翻訳方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8204719A Division JP2747281B2 (ja) 1996-08-02 1996-08-02 辞書登録方法

Publications (2)

Publication Number Publication Date
JPH01142865A JPH01142865A (ja) 1989-06-05
JP2752977B2 true JP2752977B2 (ja) 1998-05-18

Family

ID=17876585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62299755A Expired - Lifetime JP2752977B2 (ja) 1987-11-30 1987-11-30 機械翻訳方法

Country Status (1)

Country Link
JP (1) JP2752977B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03214355A (ja) * 1990-01-19 1991-09-19 Sharp Corp 機械翻訳装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203266A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPS63136264A (ja) * 1986-11-28 1988-06-08 Sharp Corp 機械翻訳装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
月刊アスキー 1986年2月号 P.121〜P.137 (1986)

Also Published As

Publication number Publication date
JPH01142865A (ja) 1989-06-05

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
KR900008375B1 (ko) 기계번역시스템
KR900008769B1 (ko) 기계번역시스템
JP3038079B2 (ja) 自動翻訳装置
JPH0442705B2 (ja)
JP2752977B2 (ja) 機械翻訳方法
JP2747281B2 (ja) 辞書登録方法
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JP2859882B2 (ja) 機械翻訳装置
JPS6320569A (ja) 機械翻訳装置
JPH087749B2 (ja) 機械翻訳装置
JPS62163169A (ja) 機械翻訳システム
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPS63311479A (ja) 機械翻訳装置
JPS63300361A (ja) 機械翻訳装置
JPH0433058A (ja) 機械翻訳装置
JPH01207874A (ja) 機械翻訳装置
JPS62211774A (ja) 機械翻訳システム
JPS6320570A (ja) 機械翻訳システム
JPH0212458A (ja) 機械翻訳システム
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPH03217970A (ja) 機械翻訳システム
JPS63273165A (ja) 翻訳支援装置
JPH02140872A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 10