JPH0926961A - 辞書登録方法 - Google Patents

辞書登録方法

Info

Publication number
JPH0926961A
JPH0926961A JP8204719A JP20471996A JPH0926961A JP H0926961 A JPH0926961 A JP H0926961A JP 8204719 A JP8204719 A JP 8204719A JP 20471996 A JP20471996 A JP 20471996A JP H0926961 A JPH0926961 A JP H0926961A
Authority
JP
Japan
Prior art keywords
words
dictionary
translation
unknown
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8204719A
Other languages
English (en)
Other versions
JP2747281B2 (ja
Inventor
Kimito Takeda
公人 武田
Koichi Hasebe
浩一 長谷部
Seiji Miike
誠司 三池
Masaie Amano
真家 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8204719A priority Critical patent/JP2747281B2/ja
Publication of JPH0926961A publication Critical patent/JPH0926961A/ja
Application granted granted Critical
Publication of JP2747281B2 publication Critical patent/JP2747281B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 機械翻訳装置において、未知語の辞書登録を
効率良く行うことができる辞書登録方法を提供するこ
と。 【解決手段】 単語辞書を含む各種辞書の情報を収容し
た翻訳辞書部内の情報を用いて翻訳対象の原文を翻訳す
る機械翻訳装置の該翻訳辞書部に未知語を登録する辞書
登録方法において、作成された未知語として登録すべき
語句と対応する訳語を含む属性情報の組を含むリストを
もとに、該リストの未知語として登録すべき語句夫々を
属性情報と共に前記翻訳辞書部に一括して辞書登録する
ことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械翻訳装置の辞
書登録方法に係る。
【0002】
【従来の技術】コンピュータ技術を利用して、キーボー
ドや原文ファイルから入力され原文記憶部に記憶された
第1言語の原文を自動的に第2言語の訳文にして出力す
る機械翻訳装置の開発が進められている。機械翻訳装置
は基本的には入力された原文を形態素解析・構文解析等
により所定の処理単位(例えば語句)に区分し、その処
理単位毎に翻訳辞書を参照して対応する訳語を見出だ
し、それを所定の訳文規則に従って結合することにより
訳文を得る構成となっている。
【0003】翻訳辞書としては翻訳処理に必要な第1言
語→第2言語の単語辞書や、文法辞書をはじめとする各
種辞書の情報が収容されている。これらのうち単語辞書
においては現存する全ての単語が登録されていることが
理想的であるが、実際上は辞書作成に要する労力や、次
々に新語が誕生している現代社会の実情を考えると、不
可能に近い。従って翻訳対象となる原文中に、単語辞書
に登録されていない単語、すなわち未知語が存在するこ
とは避けられない。
【0004】従来の機械翻訳装置では、翻訳処理の過程
で原文に対して形態素解析により未知語を見出だすと、
その都度オペレータへ知らせていた。オペレータはその
メッセージを見て、その未知語と対応する訳語や品詞等
の属性情報を入力し、翻訳辞書へ新語として登録してい
る。しかしながら、原文が比較的短い場合はよいが、数
十頁またはそれ以上もの長文になると、未知語が見付か
る毎にその未知語と対応する訳語等の属性情報の入力に
よる辞書登録操作を行なうことは極めて煩雑であり、翻
訳の能率を著しく低下させる。
【0005】
【発明が解決しようとする課題】このように従来の機械
翻訳装置では、辞書登録操作を行なう場合、未知語と対
応する訳語等の属性情報の組について、1組ごとに辞書
登録操作を逐一行なう必要があったので、登録すべき未
知語が多数になると、辞書登録操作が極めて煩雑になる
問題があった。また、このため辞書登録をも含めた翻訳
処理の効率が著しく低下させられていた。
【0006】本発明は、上記事情を考慮してなされたも
のであり、機械翻訳装置において、未知語の辞書登録を
効率良く行うことができる辞書登録方法を提供すること
を目的とする。
【0007】
【課題を解決するための手段】本発明は、単語辞書を含
む各種辞書の情報を収容した翻訳辞書部内の情報を用い
て翻訳対象の原文を翻訳する機械翻訳装置の該翻訳辞書
部に未知語を登録する辞書登録方法において、作成され
た未知語として登録すべき語句と対応する訳語を含む属
性情報の組を含むリストをもとに、該リストの未知語と
して登録すべき語句夫々を属性情報と共に前記翻訳辞書
部に一括して辞書登録することを特徴とする。
【0008】本発明によれば、まず未知語として登録す
べき語句と対応する訳語を含む属性情報のリストを作成
し、次にこのリストの語句夫々を対応する属性情報と共
に前記翻訳辞書部に一括して辞書登録することで、多数
の未知語を最低限の入力操作だけで効率良く辞書登録す
ることができる。
【0009】また、例えば、翻訳に先だって原文中の未
知語を登録しておけば、機械翻訳装置は原文の翻訳をス
ムーズに進めることができ、結果的に辞書登録をも含め
た翻訳処理の効率が大幅に向上する。
【0010】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0011】図1は、本発明の一実施形態に係る機械翻
訳装置の構成を示すブロック図である。以下、英日翻訳
を例にとり説明する。
【0012】図1において、キーボードからなる入力部
1は翻訳対象となる原文の入力や各種のコマンドの入力
を行なうためのもので、この入力部1より入力される第
1言語の原文としての英文は、装置全体の制御を司る編
集制御部2を介して原文記憶部3に記憶される。原文記
憶部3に記憶された原文は、翻訳部4で第2言語である
日本語文に翻訳される。翻訳辞書部5は翻訳部4での翻
訳処理に使用する各種辞書、例えば(1)語尾等に変化
のある単語をその原型(基本型)に変換する活用・変化
辞書、(2)第1言語(英語)の単語・熟語に対応する
第2言語(日本語)の訳語がその品詞情報と共に記憶さ
れた単語・熟語辞書、(3)正しい品詞の列が記憶され
た解析文法辞書、(4)英語から日本語への変換情報が
記憶された変換文法辞書、(5)変換された日本語の文
の構造を決定する生成文法辞書、(6)日本語の語尾等
の語型を変化させて翻訳文を完成させる形態素生成文法
辞書等を収容したものである。翻訳部4で得られた訳文
は編集制御部2を介して訳文記憶部6に記憶される。表
示部7は原文や訳文等を表示するためのもので、また印
刷部8は原文や訳文をハードコピーとして出力するもの
である。
【0013】この発明では、上記の機械翻訳装置の基本
構成に加え、原文記憶部3に記憶された原文中の全ての
未知語、すなわち翻訳辞書部5に収容されていない語句
を検索する未知語検索部9と、この未知語検索部9によ
り検索された語句を記憶する未知語記憶部10と、この
未知語記憶部10に記憶された語句をそれに対応する訳
語を含む属性情報と共に翻訳辞書部5に新語として登録
するための辞書登録部11とが設けられている。
【0014】図2は、入力部1のキー配列の一例を示し
たものであり、文字キー21、編集キー22、機能キー
23、カーソル制御キー24及びその他のキーが備えら
れている。機能キー23の中には、未知語検索要求、未
知語編集要求、辞書登録要求を入力するためのキーが含
まれている。
【0015】図3は、未知語検索部9で未知語として検
索された語句の表示例を示し、図4は、検索された未知
語と、その未知語に対してオペレータにより入力された
訳語とを対応させて表示した例を示している。
【0016】次に、本実施形態における未知語検索と未
知語記憶および新語辞書登録の手順を図5に示すフロー
チャートを参照して説明する。
【0017】編集制御部2は、ステップS1〜S5にお
いて入力部1からのキー入力の有無を監視しており、な
んらかのキー入力があった場合、それに対応する処理を
行なう。オペレータが機能キー23のいずれかを操作す
ると、ステップS1〜S3でこれが検知され、ステップ
S7〜S9でその機能キーに対応した処理が行なわれ
る。
【0018】オペレータが編集キー22のいずれかを操
作すると、それがステップS4で検知され、ステップS
10でその編集キーに対応した処理が行なわれる。
【0019】オペレータがカーソル制御キー24あるい
はその他のキーを操作した場合は、ステップS1〜S5
を介してステップS6でキー操作に対応したカーソル移
動のための処理やその他の処理が行なわれる。
【0020】オペレータが文字キー21を操作して文字
入力を行なうと、ステップS5で各文字キーが検知され
た後、対応する文字コードが割当てられた編集領域にセ
ットされる。編集領域としては、未知語の編集要求がス
テップS2で検知されるまでは原文記憶部3が割当てら
れ、その内容が表示部7で表示される。未知語の編集要
求がステップS2で検知されると、未知語記憶部10が
編集領域に割当てられ、図3および図4のような表示が
なされる。
【0021】訂正・挿入・削除等の編集操作は、カーソ
ル制御キー24の操作により所望の編集個所へカーソル
を移動させた後、編集キー22に含まれる訂正キー、挿
入キー、削除キー等を用いて行なわれる。
【0022】編集キーの打鍵があると、それがステップ
S4で編集制御部2により検知され、編集領域として割
当てられている記憶部内のカーソル制御キーで指示され
ている語または句に対して、各キーに対応した編集処理
が行なわれる。例えば挿入キーの操作によりカーソル位
置の前に文字を挿入したり、削除キーの操作によりカー
ソルが指示している範囲の文字列を無効にしたり、移動
キーの操作によりカーソルが指示している範囲を他の位
置へ移動させたり、また取消しキーの操作によりこれら
挿入キー、削除キー、移動キー等の操作の効果を無効に
することができる。
【0023】また、カーソル制御キー24としてはカー
ソルをそれぞれ各方向に移動させるカーソル移動キー、
カーソルが移動する単位を切換える単位切換えキー、カ
ーソルのサイズを文字単位または語単位に拡大・縮小す
るための拡大・縮小キーが含まれている。
【0024】オペレータは原文の入力・編集を行ないな
がら、未知語検索要求キーを適宜操作することにより、
原文記憶部3に記憶された原文中の未知語を検索し、そ
れらをまとめて辞書登録部11により登録することがで
きる。まず、未知語検索部9について説明する。未知語
検索の手法としては、例えば翻訳辞書部5から原文中の
未知語に近い単語を引出して、その単語の品詞が許容す
る語尾変化を行なう。複数形、進行形、過去形、過去分
詞、不規則変化等、その単語がとり得る全ての可能性を
マッチング候補として求め、原文とのマッチングを行な
う。なお、原文から未知語の単語の原型を求め、翻訳辞
書部5内の辞書とのマッチングを行なってもよい。その
場合は、マッチングの後で原型を求めたときの語尾変化
と、辞書の品詞による語尾変化とが一致するチェックを
必要とする。
【0025】上述のようなマッチングを行なった結果、
マッチングがとれない原文中の語句については、それを
未知語として未知語記憶部10へ記憶させる。
【0026】ここで、未知語となった語句には2種類あ
り、一つは原文の入力誤りで未知語となった語句で、他
の一つは正しく入力されたが翻訳辞書部5に登録されて
いない本来の未知語である。例えば図3に例示した未知
語検索部9で未知語として検索された語句のうち、“r
ead−only−memory”、“VDT”は本来
の未知語であるが、“translater”は“tr
anslator”の入力誤りによるスペルミスで未知
語となったものである。このような入力誤りで未知語と
なったものについては、原文記憶部3内でそれを修正
し、未知語記憶部10内から編集キー22のうちの削除
キーを用いて除けばよい。
【0027】未知語検索が終了した後、オペレータが未
知語の編集要求キーを操作すると、編集制御部2におい
てステップS2で検知され、未知語記憶部10が編集領
域に割当てられる。これにより未知語記憶部10に検索
された未知語が記憶され、かつ表示部7で図3に示した
ような形式で未知語のリストが表示される。
【0028】オペレータはカーソル移動と未知語に対す
る訳文の入力を図3の表示画面を見ながら行なうことに
なる。入力誤りは前述したように削除キーを用いて除く
ことができる。この結果、未知語記憶部10内において
未知語である原文の語句に、対応する訳語が付加され、
かつ図4に示すように表示がなされる。全ての訳語の入
力が終了したら、オペレータは未知語の辞書登録要求キ
ーを操作することで、未知語記憶部10に記憶されてい
る訳語、品詞等の翻訳に必要な属性情報の付加された未
知語情報が、例えば次のような形式で翻訳辞書部5に順
番に登録される。 原文の語句:訳語:品詞:他の情報 なお、図4では品詞および他の情報は省略して示してい
る。品詞を省略したときは、名詞で登録すればよい。
【0029】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0030】
【発明の効果】本発明によれば、翻訳辞書部に登録すべ
き未知語とその訳語を含む属性情報を一括して登録でき
るようにしたことにより、大量の未知語に対して短時間
で辞書登録を行なうことが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る機械翻訳装置の構成
を示すブロック図
【図2】図1における入力部のキー配列を示す図
【図3】図1における表示部の未知語検索時および辞書
登録時の表示例を示す図
【図4】図1における表示部の未知語検索時および辞書
登録時の表示例を示す図
【図5】同実施形態における主要な処理の流れを示すフ
ローチャート 1…入力部 2…編集制御部 3…原文記憶部 4…翻訳部 5…翻訳辞書部 6…訳部記憶部 7…表示部 8…印刷部 9…未知語検索部 10…未知語記憶部 11…辞書登録部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天野 真家 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】単語辞書を含む各種辞書の情報を収容した
    翻訳辞書部内の情報を用いて翻訳対象の原文を翻訳する
    機械翻訳装置の該翻訳辞書部に未知語を登録する辞書登
    録方法において、 作成された未知語として登録すべき語句と対応する訳語
    を含む属性情報の組を含むリストをもとに、該リストの
    未知語として登録すべき語句夫々を属性情報と共に前記
    翻訳辞書部に一括して辞書登録することを特徴とする辞
    書登録方法。
JP8204719A 1996-08-02 1996-08-02 辞書登録方法 Expired - Lifetime JP2747281B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8204719A JP2747281B2 (ja) 1996-08-02 1996-08-02 辞書登録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8204719A JP2747281B2 (ja) 1996-08-02 1996-08-02 辞書登録方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP62299755A Division JP2752977B2 (ja) 1987-11-30 1987-11-30 機械翻訳方法

Publications (2)

Publication Number Publication Date
JPH0926961A true JPH0926961A (ja) 1997-01-28
JP2747281B2 JP2747281B2 (ja) 1998-05-06

Family

ID=16495185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8204719A Expired - Lifetime JP2747281B2 (ja) 1996-08-02 1996-08-02 辞書登録方法

Country Status (1)

Country Link
JP (1) JP2747281B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194403B2 (en) * 2001-03-19 2007-03-20 Fujitsu Limited Apparatus, method, and computer-readable medium for language translation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62198957A (ja) * 1986-02-26 1987-09-02 Canon Inc 文字処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62198957A (ja) * 1986-02-26 1987-09-02 Canon Inc 文字処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194403B2 (en) * 2001-03-19 2007-03-20 Fujitsu Limited Apparatus, method, and computer-readable medium for language translation

Also Published As

Publication number Publication date
JP2747281B2 (ja) 1998-05-06

Similar Documents

Publication Publication Date Title
KR900008375B1 (ko) 기계번역시스템
EP0370774B1 (en) Machine translation system
JP3038079B2 (ja) 自動翻訳装置
JPS6244877A (ja) 機械翻訳装置
JPS62203273A (ja) 機械翻訳システム
JPH0442705B2 (ja)
JPS58192173A (ja) 機械翻訳装置
JP2747281B2 (ja) 辞書登録方法
JP2752977B2 (ja) 機械翻訳方法
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JP2859882B2 (ja) 機械翻訳装置
JP2635551B2 (ja) 機械翻訳システム
JPH04167063A (ja) 機械翻訳方法及び機械翻訳装置
JPS6320569A (ja) 機械翻訳装置
JPH0550778B2 (ja)
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPS63300361A (ja) 機械翻訳装置
JPH0433058A (ja) 機械翻訳装置
JPS62271061A (ja) 機械翻訳システム
JPH01207874A (ja) 機械翻訳装置
JPS62163169A (ja) 機械翻訳システム
JPS6320570A (ja) 機械翻訳システム
JPS63311479A (ja) 機械翻訳装置
JPH01245358A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080213

Year of fee payment: 10