JPH06266751A - ユーザ辞書登録装置 - Google Patents

ユーザ辞書登録装置

Info

Publication number
JPH06266751A
JPH06266751A JP5055637A JP5563793A JPH06266751A JP H06266751 A JPH06266751 A JP H06266751A JP 5055637 A JP5055637 A JP 5055637A JP 5563793 A JP5563793 A JP 5563793A JP H06266751 A JPH06266751 A JP H06266751A
Authority
JP
Japan
Prior art keywords
unknown word
user dictionary
information
unit
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5055637A
Other languages
English (en)
Inventor
Noriyuki Hirai
徳行 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5055637A priority Critical patent/JPH06266751A/ja
Publication of JPH06266751A publication Critical patent/JPH06266751A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 作業性良く未知語の前後関係を参照しながら
必要情報を容易に登録する。 【構成】 原文チェック部19は、入力文のスペルチェ
ックを実施するに際して、当該未知語の未知語データ
“文番号",“単語位置",“原形見出し",“推定品詞"お
よび“推定変化形"を求めて未知語データ・バッファに格
納する。辞書メンテナンス部18は、登録対象の未知語
の未知語データが未知語データ・バッファに格納されて
いる場合には、未知語データ・バッファに格納された
“文番号"を有する当該未知語が含まれた文章を表示さ
せ、未知語データ・バッファに格納された未知語データ
“推定品詞"および“推定変化形"をユーザ辞書登録用バ
ッファに転送することによってユーザ辞書情報を設定
し、表示させる。こうして、作業性良く当該未知語の前
後関係を参照しながら必要情報を容易に登録可能にす
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、機械翻訳機やワード
プロセッサ等に搭載されるユーザ辞書登録装置に関す
る。
【0002】
【従来の技術】英日機械翻訳機や英文ワードプロセッサ
等においては、入力された英文を構成する各単語に対し
てスペルチェック(辞書引き)が実施される。そして、ス
ペルチェックを実施した結果は、次の2つの方法によっ
てユーザに呈示される。 (1) 辞書に登録されていない未知語と判定された単語
の“見出し"とその出現文番号等がリストとして表示さ
れる。 (2) 表示画面に表示されている文中における上記未知
語と判定された単語の見出しの前に、“* "等の特定の
マークが付加される。
【0003】そして、上述のようにして未知語がユーザ
に呈示されると、ユーザは、以後入力される上記未知語
の訳語が確実に訳出されたり(英日機械翻訳機の場合)正
しい単語として確定される(英文ワードプロセッサの場
合)ように、上記呈示された未知語の情報を元にして当
該未知語をユーザ辞書に登録するのである。
【0004】ここで、例えば、上記未知語を英日機械翻
訳機におけるユーザ辞書に登録する場合には、登録対象
の未知語に最適な訳語を付加する必要がある。そのため
に、辞書登録時には、入力英文における該等未知語の前
後関係を参照して最適な訳語を設定するのである。
【0005】
【発明が解決しようとする課題】このように、ユーザ辞
書登録時には、入力英文における該等未知語の前後関係
を参照するために、上記呈示されたリストにおける文番
号を参照して入力英文から該等未知語を検索したり、上
記スペルチェック時に文中に付加された特定マークを参
照して入力英文から該等未知語を検索する必要がある。
したがって、何れの場合にも、ユーザ辞書登録作業を一
旦中断しなければならずユーザ辞書登録作業の効率が悪
いという問題がある。
【0006】また、上記ユーザ辞書を登録する際には、
登録する必要のある情報(例えば、見出し,品詞,変化形,
訳語等:以下、ユーザ辞書情報と言う)を総てマニュア
ル入力する必要がある。したがって、ユーザ辞書登録作
業が面倒であり、二重登録や登録漏れが発生するという
問題もある。
【0007】そこで、この発明の目的は、作業性良く未
知語の前後関係を参照しながら必要情報を容易に登録で
きるユーザ登録装置を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、第1の発明のユーザ辞書登録装置は、入力された文
章中の単語のスペルを辞書を参照してチェックして上記
辞書に登録されていない未知語を検出し、この検出され
た未知語の上記入力文章中における出現場所情報を検知
するスペルチェック部と、上記スペルチェック部によっ
て検出された未知語に関する情報を所定の手順で生成す
る未知語情報生成部と、上記未知語を上記ユーザ辞書に
登録するに際して上記スペルチェック部によって検知さ
れた当該未知語の出現場所情報に基づいて上記入力文章
の当該未知語が含まれた領域を表示する文章表示部と、
上記ユーザ辞書登録時に上記未知語情報生成部によって
生成された未知語情報をユーザ辞書登録用バッファに転
送してユーザ辞書登録時に必要なユーザ辞書情報を設定
するユーザ辞書情報設定部と、上記ユーザ辞書登録用バ
ッファの内容を表示するユーザ辞書情報表示部を備えた
ことを特徴としている。
【0009】また、第2の発明は、第1の発明のユーザ
辞書登録装置において、上記スペルチェック部によって
検出された未知語の原形見出しを所定の手順で形成する
原形見出し形成部を備えると共に、上記未知語情報生成
部は少なくとも品詞および変化形から成る未知語情報を
生成するように構成され、上記ユーザ辞書情報設定部は
上記未知語情報生成部によって生成された未知語情報に
加えて上記原形見出し形成部によって検出された原形見
出しをも上記ユーザ辞書情報として設定するように構成
されたことを特徴としている。
【0010】
【作用】第1の発明では、入力された文章中の単語のス
ペルがスペルチェック部によって辞書を参照してチェッ
クされ、上記辞書に登録されていない未知語が検出され
る。さらに、この検出された未知語の上記入力文中にお
ける出現場所情報が検知される。そうすると、未知語情
報生成部によって、当該未知語の未知語情報が所定の手
順で生成される。
【0011】こうした後、上記スペルチェック部によっ
て検出された未知語をユーザ辞書に登録するに際して
は、文章表示部によって、上記スペルチェック部で検知
された当該未知語の出現場所情報に基づいて上記入力文
章の当該未知語が含まれた領域が表示される。さらに、
ユーザ辞書情報設定部によって、上記未知語情報生成部
によって生成された未知語情報がユーザ辞書登録用バッ
ファに転送されてユーザ辞書情報が設定され、ユーザ辞
書情報表示部によって、上記ユーザ辞書情報が格納され
たユーザ辞書登録用バッファの内容が表示される。
【0012】こうして、上記ユーザ辞書登録時には、登
録対象の未知語を含む入力文章が自動的に表示されると
共に、当該未知語のユーザ辞書情報が自動的に設定/表
示されて、ユーザによるユーザ辞書登録が効率良く実施
できるように支援される。
【0013】また、第2の発明では、上記スペルチェッ
ク部で検出された未知語の原形見出しが原形見出し形成
部によって所定の手順で形成され、未知語情報生成部に
よって少なくとも品詞および変化形から成る未知語情報
が生成される。そして、ユーザ辞書登録時には、上記ユ
ーザ辞書情報設定部によって、登録対象未知語の原形見
出しと品詞および変化形から成る未知語情報とが上記ユ
ーザ辞書情報として設定される。こうして、本ユーザ辞
書登録装置が機械翻訳機に搭載された場合には、多くの
ユーザ辞書情報の入力を必要とするユーザ辞書登録作業
が非常に簡素化される。
【0014】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。図1は本実施例のユーザ辞書登録装置が搭載
された機械翻訳機のブロック図である。
【0015】図1において、1はユーザ・インターフェ
ース・モジュール、2は翻訳モジュール、3は翻訳用辞
書,文法規則および木構造変換規則等のテーブルを格納
したメモリ、4は翻訳用メモリ、5は入力文や翻訳文を
表示するCRT(カソード・レイ・チューブ)、6は入力文
やユーザ・インターフェース・モジュール1に対する指示
等を入力するキーボード、7は翻訳文等を印字するプリ
ンタ、8は入力された文章や作成された翻訳文等を蓄積
する文書ファイルである。
【0016】上記ユーザ・インターフェース・モジュール
1は、翻訳モジュール2,CRT5及びキーボード6に
接続されてユーザと対話形式で入力された文章を翻訳す
る。また、メモリ3に接続されてユーザと対話形式で翻
訳用辞書や文法規則や木構造変換規則のメンテナンスを
実施する。また、文書ファイル8に接続されてユーザと
対話形式で入力文や翻訳文や環境の登録/読み出しを実
施する。さらに、プリンタ7に接続されてユーザと対話
形式で翻訳文等を印字する。ここで、上記環境とは、翻
訳文の文体や1文の翻訳時間等の翻訳に係る環境のこと
である。
【0017】図2は、上記ユーザ・インターフェース・モ
ジュール1の構成を示すブロック図である。ユーザ・イ
ンターフェース・モジュール1は、キーボード6の操作
等によるユーザからの要求を検知して各種制御を実施す
る制御部9と、この制御部9に接続されて制御される翻
訳部10,ソース言語エディタ部11,ターゲット言語エ
ディタ部12,文書入出力部13,環境設定部14,助動
詞訳設定部15,学習部16,オプション辞書選択部1
7,辞書メンテナンス部18,原文チェック部19および
印字部20から構成される。
【0018】このうち、上記翻訳部10は、翻訳モジュ
ール2を呼び出して翻訳を実施し、翻訳結果に応じて翻
訳用メモリ4内のバッファ(図示せず)に格納されている
諸情報を操作する。文書入出力部13は、文書ファイル
8を呼び出して文書情報の書き込み読み出しを実施す
る。オプション辞書選択部17は、メモリ3内の辞書の
うちユーザ辞書,専門辞書および学習辞書等のオプショ
ンの辞書を選択して呼び出す。学習部16および辞書メ
ンテナンス部18は、メモリ3内の各辞書や文法規則を
呼び出して登録/削除等を実施する。印字部20は、文
書情報等をプリンタ7に出力して印字する。また、上記
ソース言語エディッタ部11,ターゲット言語エディッ
タ部12および助動詞訳設定部15は、翻訳用メモリ4
を呼び出してこの翻訳用メモリ4内の上記バッファに格
納されている諸情報を操作する。
【0019】ここで、入力文に対するスペルチェックは
原文チェック部19によって実施され、上記スペルチェ
ックの結果未知語であると判定された単語に対するユー
ザ辞書登録は辞書メンテナンス部18によって実施され
る。
【0020】図3は上記翻訳モジュール2のブロック図
である。翻訳モジュール2は、辞書引き形態素解析部2
1,構文解析部22,変換部23および翻訳文生成部24
から構成されて、ソース言語をターゲット言語に変換す
る。
【0021】上記辞書引き形態素解析部21は、ソース
言語による入力文を読み込んで形態素解析を行い、メモ
リ3に格納された辞書を引いて各単語に対する品詞等の
文法情報および訳語を得、さらに時制,人称,数等を解析
する。上記構文解析部22は、メモリ3に格納された文
法規則を用いて、辞書引き形態素解析部21からの出力
に基づいてソース言語による入力文の内部構造(構造解
析木)を得る。上記変換部23は、メモリ3に格納され
た木構造変換規則を用いて、構文解析部22によって得
られたソース言語による入力文の構造解析木(内部構造)
をターゲット言語による構造解析木(内部構造)に変換す
る。上記翻訳文生成部24は、変換部23からのソース
言語による構造解析木に基づいてターゲット言語による
文章を生成して出力する。
【0022】上記翻訳モジュール2によってソース言語
による入力文を翻訳するに際して、辞書引き形態素解析
部21,構文解析部22,変換部23および翻訳文生成部
24による解析/処理結果は、翻訳用メモリ4内の上記
各バッファに格納される。
【0023】上述のような構成を有する機械翻訳機によ
って自動翻訳を実施するに際して、ソース言語による入
力文(以下、原文という)に対してスペルチェックを実施
することによってスペル誤り語や未知語を予め発見して
おく。そして、スペル修正やユーザ辞書登録を行うこと
によって後に実施される翻訳処理が正しく迅速に実施で
きるのである。
【0024】上記スペルチェックは、次のようにして実
施される。例えば上記キーボード6から上記原文が入力
されると、ユーザ・インターフェース・モジュール1にお
ける文書入出力部13によって、入力された原文が文書
ファイル8に格納される。そうした後、キーボード6か
らのキー入力によってスペルチェックが指示されると、
ユーザ・インターフェース・モジュール1における原文チ
ェック部19によってメモリ3内の辞書を参照してスペ
ルチェックが実施されるのである。
【0025】その際に、本実施例においては、各単語の
“見出し",“変化形(推定)"および“品詞(推定)"の未知
語情報が得られるものとする。そこで、上記スペルチェ
ックを実施する際に 1.未知語見出し,変化形,品詞 2.未知語見出しの出現文番号,単語位置 の未知語データを原文チェック部19内の未知語データ
・ファイルに保存して、この未知語をユーザ辞書に登録
する際には上記未知語データを参照してユーザ辞書登録
時に必要なユーザ辞書情報を自動的に補足し、さらに当
該未知語を含む文を表示するのである。
【0026】上述のような未知語データは、図4に示す
ようなフローチャートに従って次のような形式で出力さ
れて保存される。 文番号 \t 単語番号 \t 見出し \t 推定品詞 \t 推
定変化形 \n ここで、“\t"はタブコード(ascii 0x08)であり、項目
の区切りを表す。また、“\n"は改行コード(ascii 0x0
A)であり、各未知語データ間の区切りを表す。
【0027】図4は、上記ユーザ・インターフェース・モ
ジュール1における制御部9の制御の下に、原文チェッ
ク部19によって実施されるスペルチェック/未知語処
理動作のフローチャートである。以下、図4に従って、
スペルチェック/未知語処理動作について説明する。上
述のように、キー入力等によってスペルチェックが指示
されるとスペルチェック/未知語処理動作がスタートす
る。
【0028】ステップS1で、上記原文から最初の1文
が取り出されて原文チェック部19内のバッファ(図示
せず)に格納される。ステップS2で、上記格納された当
該1文中における先頭の単語が切り出される。ステップ
S3で、上記切り出された単語に対して、メモリ3に格
納された辞書を用いてスペルチェック処理が実施され
る。ステップS4で、スペルチェック処理の結果に基づ
いて、上記ステップS2において切り出された当該単語
は未知語であるか否か(すなわち、上記辞書に登録され
ているか否か)が判別される。その結果未知語であれば
ステップS5に進み、そうでなければステップS16に進
む。
【0029】ステップS5で、当該未知語に対して未知
語処理が実施されて、後に詳述するような当該未知語に
係る“原形見出し"の形成および“品詞/変化形"の推定
が行われる。ステップS6で、当該未知語が存在する当
該1文に付加されている“文番号"が原文チェック部1
9内の未知語データ・バッファに格納される。ステップ
S7で、上記タブコードが上記未知語データ・バッファに
格納される。ステップS8で、上記“文番号"が付加され
た当該1文中における当該未知語の位置を示す“単語番
号"が上記未知語データ・バッファに格納される。ステッ
プS9で、上記タブコードが上記未知語データ・バッファ
に格納される。ステップS10で、上記ステップS5にお
いて形成された“原形見出し"が当該未知語の“見出し"
として上記未知語データ・バッファに格納される。ステ
ップS11で、上記タブコードが上記未知語データ・バッ
ファ内に格納される。ステップS12で、上記ステップS
5において推定された当該未知語の“品詞"が上記未知語
データ・バッファに格納される。ステップS13で、上記
タブコードが上記未知語データ・バッファ内にに格納さ
れる。ステップS14で、上記ステップS5において推定
された当該未知語の“変化形"が上記未知語データ・バッ
ファに格納される。ステップS15で、上記改行コードが
上記未知語データ・バッファ内にに格納される。
【0030】ステップS16で、当該単語は当該1文中に
おける最後の単語であるか否かが判別される。その結
果、最後の単語でなければステップS2に戻って次の単
語の処理に入る。一方、最後の単語であればステップS
17に進む。ステップS17で、当該1文は上記原文におけ
る最終文であるか否かが判別される。その結果、最終文
でなければステップS1に戻って次の1文の処理に入
る。一方、最終文であればスペルチェック/未知語処理
動作を終了する。こうして、上記未知語データ・ファイ
ルが作成されるのである。
【0031】上述のようにしてスペルチェック/未知語
処理動作を実施するに際して、変化形を持たない品詞の
未知語の場合には、タブコードと改行コードとが連続し
て格納されることになる。また、上記ステップS5にお
ける未知語処理の際に品詞あるいは変化形が推定不可能
であった場合には、ステップS12あるいはステップS14
において“0"が格納される。尚、上記品詞の推定は、
後に詳述するが、例えば当該単語の見出しが「ing」で終
わっていれば当該単語の品詞は動詞であると推定する。
また、見出しが「ly」で終わっていれば品詞は副詞である
と推定する。
【0032】上述のようにしてスペルチェック/未知語
処理が実施されて未知語が検出されると、次に、得られ
た未知語がユーザによってメモリ3に格納されているユ
ーザ辞書に登録される。辞書登録には、対話的登録とバ
ッチ登録の2通りの登録方法がある。本実施例における
ユーザ辞書登録は上記対話的登録によって行う。ここ
で、ユーザ辞書登録時に必要なユーザ辞書情報は 1.見出し 2.品詞 3.型 4.変化形 5.訳語 6.訳語の品詞 であるとする。尚、上記“型"とは、登録対象の未知語
を含む単語列の文法的型(例えば、動詞であれば取り得
る構文の型等、名詞であれば作り得る句の型等、…)で
ある。
【0033】図5は、上記ユーザ・インターフェース・モ
ジュール1における制御部9の制御の下に、辞書メンテ
ナンス部18によって実施されるユーザ辞書登録処理動
作のフローチャートである。以下、図5に従ってユーザ
辞書登録処理動作について説明する。上述のように、キ
ー入力等によってユーザ辞書登録モードが指示されると
ユーザ辞書登録処理動作がスタートする。そうすると、
図6に示すような原文が表示されているCRT5の画面
に、ウインドウ(図9参照)が開かれてユーザ辞書登録時
におけるユーザ辞書情報の各項目の見出しが表示され
る。
【0034】ステップS21で、上記ユーザ・インターフ
ェース・モジュール1の原文チェック部19内に上記未
知語データ・ファイルが作成されているか否かが判別さ
れる。その結果作成されていればステップS23に進み、
作成されていなければステップS22に進む。ステップS
22で、通常ユーザ辞書登録サブルーチンが実行された後
ユーザ辞書登録処理動作を終了する。ステップS23で、
上記未知語データ・ファイルにおける未知語データが、
改行コードの箇所で未知語単位で切り出される。
【0035】ステップS24で、上記ステップS23におい
て未知語単位で切り出された未知語データから最初の2
つのデータ“文番号"および“単語番号"が読み出され
る。ステップS25で、上記ステップS24において読み出
された“文番号"に基づいて当該未知語が含まれている
文が検索される。そして、検査された文がCRT5の画
面のバック領域に図9に示すように表示される。図9で
は、未知語「spelling」を含む文番号“8"の1文とその
文の前後の文(すなわち、文番号“7"から文番号“1
0"までの4つの文)が表示されている。その際に、上記
ステップS24において読み出された“単語番号"に基づ
いて、未知語「spelling」の頭にはこの単語が未知語であ
ることを表す上記特定マーク“* "が付加されている。
ステップS26で、上記ステップS23において未知語単位
で切り出された未知語データから残りの3つのデータ
“見出し",“品詞"および“変化形"が読み出される。
【0036】ステップS27で、上記読み出された“見出
し",“品詞"および“変化形"によって、上記辞書メンテ
ナンス部18(図2参照)におけるユーザ辞書登録用バッ
ファ内の対応するエリアの内容が更新される。ステップ
S28で、上記ユーザ辞書登録用バッファに格納された
“見出し",“品詞"および“変化形"を用いてユーザ辞書
登録サブルーチンが実行されて、一つの未知語の登録が
終了する。その際に、図9および図10に示すように、
CRT5の画面には、登録単語の“見出し"と“品詞"と
“変化形"が自動的に表示される。
【0037】ステップS29で、上記未知語データ・ファ
イルに次の未知語データがあるか否かが判別される。そ
の結果、あればステップS23に戻って次の未知語に対す
る処理に入る。一方、なければユーザ辞書登録処理動作
を終了する。
【0038】次に、上記ユーザ辞書登録処理動作中のス
テップS22において実施される通常ユーザ辞書登録サブ
ルーチンおよびステップS28において実施されるユーザ
辞書登録サブルーチンについて詳細に説明する。この通
常ユーザ辞書登録処理動作とは、従来より実施されてい
るマニュアルによるユーザ辞書登録処理動作のことであ
る。図7は通常ユーザ辞書登録サブルーチンのフローチ
ャートである。以下、図7に従って通常ユーザ辞書登録
サブルーチンについて説明する。
【0039】上記ユーザ辞書登録処理動作中のステップ
S21において、未知語データ・ファイルが作成されてい
ないと判別されると通常ユーザ辞書登録サブルーチンが
スタートする。ステップS31で、入力された“見出し",
“品詞",“変化形",“型",“訳語"等が一時的に格納さ
れる上記辞書メンテナンス部18(図2参照)におけるユ
ーザ辞書登録用バッファが、内部に設けられた各エリア
の内容が消去されたり上記内容に“0"がセットされる
ことによって初期化される。
【0040】ステップS32で、当該未知語の“見出し"
がキーボード6からキー入力され、上記ユーザ辞書登録
用バッファ内の見出しエリアに格納される。尚、本ステ
ップにおいては編集機能によって仮名漢字変換等の編集
が可能となっている。ステップS33で、当該未知語の
“品詞"を表す番号(例えば、1→自動詞、2→他動詞、
… :以下、品詞番号と言う)がキー入力されて、上記ユ
ーザ辞書登録用バッファ内の品詞エリアの内容(初期値
“0")が更新される。
【0041】ステップS34で、上記ステップS33におい
て入力された“品詞番号"が参照されて、当該未知語の
品詞は“変化形"を有する品詞(本実施例においては名詞
と動詞)であるか否かが判定される。その結果“変化形"
を有する品詞であればステップS35に進み、“変化形"
を有しない単語であればステップS43に進む。ステップ
S35で、当該未知語の“変化形"を表す番号(例えば、1
→-s/-ed/-ed/-ing、2→-s/e-ed/e-ed/e-ing、…:以
下、変化形番号と言う)がキー入力されて上記ユーザ辞
書登録用バッファ内の変化形エリアの内容(初期値
“0")が更新される。その際に、“変化形"が不規則変
化である場合には、変化形番号として“0"がキー入力
される。ステップS36で、上記ステップS35において入
力された変化形番号が“0"以外の番号であるか“0"で
あるかが判別されて、当該未知語の“変化形"は規則変
化であるか不規則変化であるかが判別される。その結果
規則変化である場合にはステップS43に進み、不規則変
化である場合にはステップS37に進む。ステップS37
で、上記ステップS33において入力された“品詞番号"
が参照されて、当該未知語は名詞であるか動詞であるか
が判別される。その結果、名詞である場合にはステップ
S38に進む。一方、動詞である場合にはステップS39に
進む。ステップS38で、当該未知語である名詞の“複数
形"の見出しが直接キー入力されて上記ユーザ辞書登録
用バッファ内の変化形エリアに格納される。そうした
後、ステップS43に進む。
【0042】ステップS39で、当該未知語である動詞の
“三人称単数現在形"の見出しが直接キー入力されて、
上記変化形エリアに格納される。ステップS40で、当該
未知語である動詞の“過去形"の見出しが直接キー入力
されて、上記変化形エリアに格納される。ステップS41
で、当該未知語である動詞の“過去分詞形"の見出しが
直接キー入力されて上記変化形エリアに格納される。ス
テップS42で、当該未知語である動詞の“現在分詞形"
の見出しが直接キー入力されて上記変化形エリアに格納
される。
【0043】ステップS43で、上記ステップS33におい
て入力された“品詞番号"が参照されて、当該未知語は
上記“型"を指定できる品詞(名詞,動詞,形容詞及び接続
詞)であるか否かが判別される。その結果型を有する品
詞であればステップS44に進み、型を有しない品詞であ
ればステップS46に進む。ステップS44で、辞書登録モ
ードが型登録モードであるか否かが判別される。その結
果型登録モードであればステップS45に進み、そうでな
ければステップS45をスキップする。尚、上記辞書登録
モードは、上記ユーザ・インターフェース・モジュール1
における環境設定部14によって予め設定されている。
ステップS45で、当該未知語の“型"が直接キー入力さ
れて、上記ユーザ辞書登録用バッファ内の型エリアに格
納される。
【0044】ステップS46で、当該未知語の訳語がキー
入力されて、上記ユーザ辞書登録用バッファ内の訳語エ
リアに格納される。尚、本ステップにおいては編集機能
によって仮名漢字変換等の編集が可能となっている。ス
テップS47で、上記ステップS46において入力された訳
語の品詞がキー入力されて、上記ユーザ辞書登録用バッ
ファ内の訳語品詞エリアに格納される。
【0045】ステップS48で、上記ユーザ辞書登録用バ
ッファ内における各エリアに格納された“見出し",“品
詞",“変化形",“型",“訳語"及び“訳語の品詞"の形式
が、ユーザ辞書の内部形式に変換される。ステップS49
で、上記ユーザ辞書登録用バッファ内における各エリア
に格納された“見出し",“品詞",“変化形",“型",“訳
語"及び“訳語の品詞"の内容が、ユーザ辞書に書き込ま
れる。ステップS50で、ユーザによって、ユーザ辞書登
録を続行するか否かが判定される。その結果、続行する
場合には上記ステップS31へ戻って次の未知語の登録処
理に入る。一方、続行しない場合には通常ユーザ辞書登
録サブルーチンを終了して、メインルーチンにリターン
する。
【0046】図8は、上記ユーザ辞書登録処理動作中に
おけるステップS28で実施されるユーザ辞書登録サブル
ーチンのフローチャートである。このユーザ辞書登録サ
ブルーチンのフローチャートは、以下の点を除いては通
常ユーザ辞書登録サブルーチンと同じフローチャートで
ある。すなわち、第1点は、ステップS51における上記
ユーザ辞書登録用バッファの初期化に際しては、上記型
エリア,訳語エリアおよび訳語品詞エリアの内容のみを
初期化する点である。また第2点は、ユーザ辞書登録の
続行の判定はメインルーチン(図5に示すユーザ辞書登
録処理動作)のステップS29において実施されるため、
本ユーザ辞書登録サブルーチンのフローチャートでは通
常ユーザ辞書登録サブルーチンにおけるステップS50に
対応するステップを削除する点である。以下、図8に従
ってユーザ辞書登録サブルーチンについて、特徴的な部
分について説明する。
【0047】図5に示すユーザ辞書登録処理動作中のス
テップS27において“見出し",“品詞"および“変化形"
がユーザ辞書登録用バッファに格納されると、上記ユー
ザ辞書登録サブルーチンがスタートする。
【0048】(A)“見出し"の設定(ステップS52) 上述のように、既に上記ユーザ辞書登録用バッファ内の
見出しエリアには“見出し"が格納されて設定されてい
る。したがって、ユーザ辞書登録サブルーチンでは単に
上記見出しエリアに格納されている“見出し"を、図9
に示すように、CRT5の画面に開かれたウインドウ3
1内に表示してユーザに呈示するだけでよい。尚、図9
では、見出し“spell"が呈示されている。但し、上記呈
示された“見出し"は未知語ではなく単なるミススペル
語である可能性もあるので、本ステップにおいても編集
機能によって内容を修正可能にしておく必要がある。
【0049】(B)“品詞"の設定(ステップS53) 上記“見出し"の場合と同様に、既に上記ユーザ辞書登
録用バッファ内の品詞エリアには“品詞番号"が格納さ
れて設定されている。したがって、ユーザ辞書登録サブ
ルーチンでは単に上記品詞エリアに格納されている“品
詞番号"を、図9に示すように開かれたウインドウ31
内に表示してユーザに呈示するだけでよい。尚、図9で
は、品詞番号“2"が全品詞番号が表す内容と共に呈示
されている。但し、上記品詞エリアに格納されている
“品詞番号"で表される品詞は推定品詞であるから、本
ステップにおいても修正可能にしておく必要がある。品
詞の推定がヒットしている場合には、ユーザはそのまま
リターンキーを押せばよい。尚、上記ユーザ辞書登録用
バッファ内の品詞エリアに品詞番号“0"が格納されて
いる(品詞推定不可能)場合には、上述の通常ユーザ辞書
登録サブルーチンの場合と同様に“品詞番号"をマニュ
アル入力すればよい。
【0050】(C)“変化形"の設定(ステップS55,ステ
ップS58〜ステップS62) 上記ユーザ辞書登録用バッファ内の変化形エリアに格納
されて設定されている“変化形(推定)"を、図10に示
すようにCRT5の画面に表示してユーザに呈示する。
そして、ユーザは、変化形の推定がヒットしている場合
にはリターンキーを押して確定する。一方、ヒットして
いない場合にはマニュアル入力する。また、上記スペル
チェック処理動作において変化形推定不可能であった場
合にもマニュアル入力する。尚、図10では、変化形番
号“1"および変化形“spells spelled spelledspell
ing"が、全変化形番号が表す内容と共に呈示されてい
る。 (D) その他の未知語データの入力 上記訳語等のその他のユーザ辞書情報はユーザによって
マニュアル入力する。
【0051】尚、上記スペルチェック/未知語処理動作
時に簡単な構文解析まで実施可能にしておけば、上述の
“型"を推定することも可能になる。
【0052】ユーザ辞書登録を実施する際には、“見出
しは原形で入力する"という規則がある。これに対し
て、原文中における単語の見出しは必ずしも原形で出現
するとは限らない。したがって、上記スペルチェック/
未知語処理動作中のステップS10において“見出し"を
格納する際には、未知語に係る原文中の見出しの標記か
ら“原形見出し"を作成しておく必要がある。また、上
記ステップS5において“品詞"または“変化形"を推定
する際には、上記作成された“原形見出し"に基づいて
推定する。
【0053】次に、上記“原形見出し"の作成と“品詞"
および“変化形"の推定とについて説明する。図11
は、図4に示すスペルチェック/未知語処理動作中のス
テップS5における未知語処理の際に実施される原形見
出し形成サブルーチンのフローチャートである。以下、
図11に従って原形見出し形成サブルーチンを説明す
る。
【0054】ステップS71で、上記スペルチェック/未
知語処理動作中のステップS2において切り出された単
語の見出しである“未知語見出し"が、バッファ(図示せ
ず)にセットされる。ステップS72で、表1にその一部
を例示するような排他リストの中から一つの要素が読み
出される。
【表1】 ステップS73で、上記ステップS72において読み出され
た排他リストの一つの要素と上記ステップS71において
セットされた“未知語見出し"の語尾とが比較される。
ステップS74で、比較の結果両者が一致しているか否か
が判定される。その結果一致していなければステップS
75に進み、一致していれば“未知語見出し"を原形見出
しであると確定して原形見出し形成サブルーチンを終了
してメインルーチンへリターンする。尚、その際に、上
記比較の結果両者が一致していてその際の当該要素が品
詞を推定することが可能な要素である場合には、当該未
知語の品詞をも推定してしまう。例えば、上記要素が「-
oriented」や「-driven」である場合には、当該未知語の品
詞は“形容詞"であると推定するのである。ステップS7
5で、上記排他リストに未処理の要素があるか否かが判
別される。その結果あればステップS72に戻って上記排
他リストの次の要素による処理に移行し、なければステ
ップS76に進む。
【0055】ステップS76で、表2にその一部を例示す
ような第1テーブルの中から一つの要素が読み出され
る。
【表2】 ステップS77で、上記ステップS76において読み出され
た上記第1テーブルの要素と上記ステップS71において
セットされた“未知語見出し"の語尾とが比較される。
ステップS78で、比較の結果に基づいて両者が一致して
いるか否かが判定される。その結果一致していればステ
ップS79に進み、一致していなければステップS81に進
む。
【0056】ステップS79で、当該“未知語見出し"か
ら上記第1テーブルの当該要素と一致している語尾がカ
ットされる。ステップS80で、上記ステップS76におい
て読み出された当該要素の原形語尾が上記第1テーブル
から検索される。そして、この検索された原形語尾が上
記ステップS79において語尾がカットされた当該“未知
語見出し"に付加されて原形見出しが形成される。例え
ば、当該“未知語見出し"が変化形「studies」であってそ
の語尾「ies」がカットされた場合には、語尾がカットさ
れた“未知語見出し"「stud」に原形語尾「y」を付加して、
原形見出し「study」を形成するのである。こうして原形
見出しが形成されると、原形見出し形成サブルーチンを
終了してメインルーチンへリターンする。ステップS81
で、上記第1テーブルに更に未処理の要素があるか否か
が判別される。その結果あればステップS76に戻って上
記第1テーブルの次の要素による処理に移行し、なけれ
ば当該“未知語見出し"を原形見出しであると確定して
原形見出し形成サブルーチンを終了してメインルーチン
へリターンする。
【0057】図12は、図4に示すスペルチェック/未
知語処理動作中のステップS5における未知語処理の際
に実施される品詞/変化形推定サブルーチンのフローチ
ャートである。以下、図12に従って品詞/変化形推定
サブルーチンを説明する。
【0058】ステップS91で、図11に示す原形見出し
形成サブルーチン中のステップS74,ステップS80ある
いはステップS81において形成された“原形見出し"
が、バッファ(図示せず)にセットされる。ステップS92
で、表3にその一部を例示するような第2テーブルの中
から一つの“原形"が読み出される。
【表3】 ステップS93で、上記ステップS92において読み出され
た当該“原形"と上記ステップS91においてセットされ
た“原形見出し"の語尾とが比較される。ステップS94
で、比較の結果に基づいて両者が一致しているか否かが
判定される。その結果一致していればステップS95に進
み、一致していなければステップS96に進む。
【0059】ステップS95で、当該“原形"に対応付け
られた“品詞"と“変化形番号"とが上記第2テーブルか
ら検索される。そして、この検索された品詞の“品詞番
号"および“変化形番号"がバッファ等にセットされて品
詞/変化形推定サブルーチンを終了してメインルーチン
へリターンする。ステップS96で、上記第2テーブルに
未処理の“原形"があるか否かが判別される。その結果
あればステップS92に戻って上記第2テーブルの次の
“原形"による処理に移行し、なければステップS97に
進む。ステップS97で、当該“原形見出し"の品詞番号
として“5:名詞"がセットされ、変化形番号として
“1:複数形"がセットされる。こうして、総ての未知
語に対する“品詞"と“変化形"の推定が終了すると品詞
/変化形推定サブルーチンを終了してメインルーチンへ
リターンする。このように、上記第2テーブル中に当該
“原形見出し"の語尾に等しい“原形"がない場合には、
最も推定のヒット率が高いと考えられる品詞“名詞"と
その変化形“複数形"とを与えるのである。
【0060】このように、本実施例においては、ユーザ
・インターフェース・モジュール1における原文チェック
部19によってメモリ3に格納された辞書を参照してス
ペルチェックを実施するに際して、入力単語が未知語で
あると判定された場合には、その未知語に係る“文番
号",“単語番号",“見出し(原形見出し)",“品詞(推定
品詞)"および“変化形(推定変化形)"を求めて原文チェ
ック部19内の未知語データ・バッファに格納して未知
語データ・ファイルを作成しておく。そして、辞書メン
テナンス部18によって上記未知語をメモリ3に格納さ
れたユーザ辞書に登録する際には、上記スペルチェック
時に求められた“文番号"および“単語番号"に基づい
て、当該未知語を含む文を自動的に読み出してCRT5
に表示する。したがって、本実施例によれば、ユーザ辞
書登録時にユーザが自ら参照文を検索する必要がなくな
り、辞書登録作業に専念できる。
【0061】また、上記未知語をユーザ辞書に登録する
に際して、上記スペルチェック時に求められた“見出し
(原形見出し)",“品詞(推定品詞)"および“変化形(推定
変化形)"を上記未知語データ・バッファ内から読み出し
て辞書メンテナンス部18内のユーザ辞書登録用バッフ
ァの夫々のエリアに予め転送しておく。こうすることに
よって、ユーザのキー入力によらずにユーザ辞書情報
“原形見出し",“品詞"および“変化形"が自動的に設定
される。したがって、本実施例によれば、ユーザ辞書登
録時にユーザがキー入力するユーザ辞書情報が削減され
るのでユーザの手間を省くことができ、効率良くユーザ
辞書登録作業を実施できる。また、二重登録や登録漏れ
を防ぐことができる。
【0062】上記実施例においては、ユーザ辞書登録を
対話的登録によって実施する場合を例に上げて説明し
た。しかしながら、以下のようにしてバッチ登録を実施
するユーザ辞書登録装置にこの発明を適用することもで
きる。すなわち、上記“見出し",“品詞"及び“変化形"
等の情報を補ったテンプレートファイル(バッチ登録フ
ァイルのフォーマットに準拠)を予め作成して、ユーザ
はこのテンプレートファイル中の足りない部分や推定ミ
スの部分を修正するだけにするのである。こうすること
によって、バッチ登録時においてもユーザによるキー入
力を支援できる。
【0063】上記実施例における機械翻訳機の構成は図
1に示す構成に限定されるものではなく、図1における
ユーザ・インターファイス・モジュール1の構成は図2に
示す構成に限定されるものではなく、図1における翻訳
モジュール2の構成は図3に示す構成に限定されるもの
ではない。また、この発明におけるスペルチェック/未
知語処理,ユーザ辞書登録,通常ユーザ辞書登録サブルー
チン,ユーザ辞書登録サブルーチン,原形見出し形成サブ
ルーチンおよび品詞/変化形推定サブルーチンのアルゴ
リズムは、図4,図5,図7,図8,図11および図12に
示すフローチャートに限定されるものではない。また、
上記“原型",“品詞"および“変化形"の対応付けは、上
記第2テーブルに示すような対応付けに限定されるもの
ではない。
【0064】上記各実施例は、この発明のユーザ辞書登
録装置を機械翻訳機に搭載した場合を例に説明してい
る。しかしながら、この発明は必ずしもこれに限定され
るものではなく、ワードプロセッサ等の入力された文章
を認識する装置であれば搭載可能である。また、上記実
施例における原文のソース言語は英語であるが、この発
明はこれに限定されるものではない。
【0065】
【発明の効果】以上より明らかなように、第1の発明の
ユーザ辞書登録装置は、スペルチェック部によって未知
語を検出して検出された未知語の出現場所情報を検知
し、この検出された未知語の未知語情報を未知語情報生
成部によって生成し、上記未知語をユーザ辞書に登録す
るに際して、入力文章における当該未知語が含まれる領
域を文章表示部によって表示し、ユーザ辞書情報設定部
によって当該未知語の未知語情報をユーザ辞書登録用バ
ッファに転送することによってユーザ辞書情報を設定
し、このユーザ辞書登録用バッファの内容をユーザ辞書
情報表示部によって表示するようにしたので、上記ユー
ザ辞書登録時に、登録対象の未知語が含まれる文が自動
的に表示されると共に、当該未知語のユーザ辞書情報が
自動的に設定されて表示される。
【0066】したがって、ユーザ辞書登録時において
は、ユーザは参照文を自ら検索することなく設定/表示
されたユーザ辞書情報の是非を判断/修正し、必要に応
じてユーザ辞書情報を追加入力するだけでよい。すなわ
ち、この発明によれば、作業性良く当該未知語の前後関
係を参照しながらユーザ辞書情報を容易に登録できる。
【0067】また、第2の発明のユーザ辞書登録装置
は、上記スペルチェック部で検出された未知語の原形見
出しを原形見出し形成部によって形成し、ユーザ辞書登
録時には、上記ユーザ辞書情報設定部によって、上記原
形見出し形成部で形成された原形見出しと上記未知語情
報生成部で生成された少なくとも品詞および変化形から
成る未知語情報とをユーザ辞書情報とし設定するので、
本ユーザ辞書登録装置を機械翻訳機に搭載すれば、非常
に面倒なユーザ辞書登録作業を効率良く簡単に実施でき
るように支援できる。
【図面の簡単な説明】
【図1】この発明のユーザ辞書登録装置が搭載された機
械翻訳機におけるブロック図である。
【図2】図1におけるユーザ・インターファイス・モジュ
ールの構成を示すブロック図である。
【図3】図1における翻訳モジュールの構成を示すブロ
ック図である。
【図4】スペルチェック/未知語処理動作のフローチャ
ートである。
【図5】ユーザ辞書登録処理動作のフローチャートであ
る。
【図6】図1に示すCRTにおける表示内容の一例を示
す図である。
【図7】通常ユーザ辞書登録サブルーチンのフローチャ
ートである。
【図8】ユーザ辞書登録サブルーチンのフローチャート
である。
【図9】ユーザ辞書登録時におけるCRTの表示内容の
一例を示す図である。
【図10】図9とは異なる表示内容を示す図である。
【図11】原形見出し形成サブルーチンのフローチャー
トである。
【図12】品詞/変化形推定サブルーチンのフローチャ
ートである。
【符号の説明】
1…ユーザ・インターフェース・モジュール、2…翻訳モ
ジュール、 3…メモリ、5…CRT、
8…文書ファイル、9…制御部、
10…翻訳部、18…辞書メンテ
ナンス部、 19…原文チェック部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された文章中の単語のスペルを辞書
    を参照してチェックして上記辞書に登録されていない未
    知語を検出し、この検出された未知語の上記入力文章中
    における出現場所情報を検知するスペルチェック部と、 上記スペルチェック部によって検出された未知語に関す
    る情報を所定の手順で生成する未知語情報生成部と、 上記未知語を上記ユーザ辞書に登録するに際して、上記
    スペルチェック部によって検知された当該未知語の出現
    場所情報に基づいて上記入力文章の当該未知語が含まれ
    た領域を表示する文章表示部と、 上記ユーザ辞書登録時に、上記未知語情報生成部によっ
    て生成された未知語情報をユーザ辞書登録用バッファに
    転送してユーザ辞書登録時に必要なユーザ辞書情報を設
    定するユーザ辞書情報設定部と、 上記ユーザ辞書登録用バッファの内容を表示するユーザ
    辞書情報表示部を備えたことを特徴とするユーザ辞書登
    録装置。
  2. 【請求項2】 請求項1に記載のユーザ辞書登録装置に
    おいて、 上記スペルチェック部によって検出された未知語の原形
    見出しを所定の手順で形成する原形見出し形成部を備え
    ると共に、 上記未知語情報生成部は、少なくとも品詞および変化形
    から成る未知語情報を生成するように構成され、 上記ユーザ辞書情報設定部は、上記未知語情報生成部に
    よって生成された未知語情報に加えて上記原形見出し形
    成部によって形成された原形見出しをも上記ユーザ辞書
    情報として設定するように構成されたことを特徴とする
    ユーザ辞書登録装置。
JP5055637A 1993-03-16 1993-03-16 ユーザ辞書登録装置 Pending JPH06266751A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5055637A JPH06266751A (ja) 1993-03-16 1993-03-16 ユーザ辞書登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5055637A JPH06266751A (ja) 1993-03-16 1993-03-16 ユーザ辞書登録装置

Publications (1)

Publication Number Publication Date
JPH06266751A true JPH06266751A (ja) 1994-09-22

Family

ID=13004321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5055637A Pending JPH06266751A (ja) 1993-03-16 1993-03-16 ユーザ辞書登録装置

Country Status (1)

Country Link
JP (1) JPH06266751A (ja)

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
US4821230A (en) Machine translation system
KR900008769B1 (ko) 기계번역시스템
US4774666A (en) Translating apparatus
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
JP2654001B2 (ja) 機械翻訳方法
US4953088A (en) Sentence translator with processing stage indicator
EP0201324B1 (en) Language forming system
US4860206A (en) Translation system allowing user designation of postpositional words
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
KR900008402B1 (ko) 기계번역장치
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH06266751A (ja) ユーザ辞書登録装置
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2737160B2 (ja) 文章処理装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JP3147947B2 (ja) 機械翻訳装置
JP3692711B2 (ja) 機械翻訳装置
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JPH0696117A (ja) 文書変更支援システム
JP3353873B2 (ja) 機械翻訳装置
JPS62203274A (ja) 機械翻訳システム
JPH0350668A (ja) 文字処理装置
JPH1063660A (ja) 機械翻訳装置
JP2004303273A (ja) 言語情報処理装置