JPH0863476A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH0863476A
JPH0863476A JP6194246A JP19424694A JPH0863476A JP H0863476 A JPH0863476 A JP H0863476A JP 6194246 A JP6194246 A JP 6194246A JP 19424694 A JP19424694 A JP 19424694A JP H0863476 A JPH0863476 A JP H0863476A
Authority
JP
Japan
Prior art keywords
word
language
unknown word
unknown
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6194246A
Other languages
English (en)
Inventor
Ikuaki Kobayashi
生明 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP6194246A priority Critical patent/JPH0863476A/ja
Publication of JPH0863476A publication Critical patent/JPH0863476A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 形態素解析処理を行った時点で、未知語が存
在した場合には、その後の構文解析処理及び翻訳処理を
中止することにより、より効率的に翻訳作業ができる機
械翻訳装置を提供すること。 【構成】 S22において、使用者により入力された日
本語文字列に対して、形態素解析処理を行い(S2
3)、その結果、辞書エリア35及びユーザー辞書エリ
ア43に登録されていない単語(未知語)が存在すると
判断された場合(S24:Yes)、S28において、
入力された日本語文字列と「ーーー未知語が存在しま
す。ーーー」とがテキストエリア42に格納されると共
に、表示装置5に表示される。また、未知語の部分に
は、アンダーラインが付けられた状態で表示装置5に表
示される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、第1言語を第2言語に
翻訳するための機械翻訳装置に関するものである。
【0002】
【従来の技術】従来、この種の機械翻訳装置において
は、第1言語を第2言語に翻訳するための各種情報を単
語単位で記憶している辞書部を備えており、この辞書部
の情報を参照して、使用者により入力された第1言語か
ら成る字列文を単語単位に分割する形態素解析処理を行
い、さらに構文解析処理を行い、第2言語から成る翻訳
文を出力していた。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
機械翻訳装置では、形態素解析処理を終えた段階で、解
析できなかった単語、即ち第1言語として認識できない
未知語が含まれている場合でも、そのまま構文解析処理
を行い、翻訳処理を実行してしまうので、翻訳処理に時
間がかかるだけでなく、その翻訳結果として、意味のな
い不適切な翻訳文が出力されてしまい、使用者はその不
適切な部分を修正等しなければならず、非常に作業効率
が悪いという問題があった。
【0004】本発明は、上述した問題点を解決するため
になされたものであり、形態素解析処理を行った時点
で、未知語が存在した場合には、その後の構文解析処理
及び翻訳処理を中止することにより、より効率的に翻訳
作業ができる機械翻訳装置を提供することを目的として
いる。
【0005】
【課題を解決するための手段】この目的を達成するため
に本発明の機械翻訳装置は、第1言語を入力するための
入力手段と、前記入力手段により入力された第1言語の
文字列中の全ての単語を抽出する単語抽出手段と、前記
単語抽出手段によって抽出された単語のうち、第1言語
の単語として認識できない未知語を抽出する未知語抽出
手段と、入力手段により入力された第1言語を第2言語
に翻訳する翻訳手段とを備えた機械翻訳装置において、
前記未知語抽出手段により第1言語の単語として認識で
きない未知語が抽出された場合、前記翻訳手段による翻
訳処理を中止するように制御する中止制御手段を備えて
いる。
【0006】また、前記第1言語を第2言語に翻訳する
ために必要な各種情報が単語単位で登録されている辞書
部を備え、前記未知語抽出手段は、前記単語抽出手段に
よって抽出された単語が、前記辞書部に登録されている
か否かを検出し、登録されていない単語を前記未知語と
して抽出するように構成することが望ましい。
【0007】さらに、前記未知語抽出手段により第1言
語の単語として認識できない未知語が抽出された場合、
その旨を知らせる報知手段を備えていても良い。
【0008】また、前記報知手段は、前記未知語を他の
単語と区別して指示する構成としても良い。
【0009】
【作用】上記の構成を有する本発明の機械翻訳装置は、
前記未知語抽出手段により第1言語の単語として認識で
きない未知語が抽出された場合、中止制御手段が、前記
翻訳手段による翻訳処理を中止するように制御する。
【0010】また、前記未知語抽出手段は、前記単語抽
出手段によって抽出された単語が、前記辞書部に登録さ
れているか否かを検出し、登録されていない単語を前記
未知語として抽出するので、確実に未知語を抽出するこ
とができる。
【0011】さらに、前記報知手段は、前記未知語抽出
手段により第1言語の単語として認識できない未知語が
抽出された場合、その旨を知らせるので、使用者は、容
易に未知語が抽出されたことを把握することができ、作
業の効率化を図ることができる。
【0012】また、前記報知手段は、前記未知語を他の
単語と区別して指示するので、使用者は、入力した文字
列中のどの単語が未知語であるかを容易に確認すること
ができる。
【0013】
【実施例】以下、本発明の機械翻訳装置を日英機械翻訳
装置に具体化した一実施例を図面を参照して説明する。
【0014】まず、本実施例の日英機械翻訳装置の概略
的構成を示すブロック図を、図1に示す。
【0015】図1に示すように、本実施例の日英機械翻
訳装置は、装置全体を制御するためのCPU2に、第1
言語の文字列の入力等を行う入力装置1と、入力された
文字列や翻訳文等を表示する表示装置5と、記憶装置R
OM3と、RAM4とが接続されている。そして、この
入力装置1が、本発明の入力手段を構成し、CPU2
が、本発明の中止制御手段及び未知語抽出手段を構成し
ている。
【0016】前記記憶装置ROM3内には、前記CPU
2の動きを示す機械翻訳装置プログラムエリア31、及
び翻訳処理において参照される辞書エリア35が設けら
れており、さらに、機械翻訳装置プログラムエリア31
は、入力された文字列を単語単位に区切る形態素解析処
理32と、その結果を翻訳するための翻訳処理33と、
ユーザー辞書エリア33に単語を登録するためのユーザ
ー辞書登録処理34とから構成されている。そして、形
態素解析処理32が、本発明の単語抽出手段を構成して
いる。
【0017】前記RAM4内には、前記入力装置1から
入力された第1言語の文字列を格納するための入力文字
列バッファ41、入力された文字列やその文字列を第2
言語に翻訳した結果を格納するためのテキストエリア4
2、及びユーザー辞書エリア43が設けられている。
【0018】前記辞書エリア35は、例えば、図2に示
すように、1単語について、その品詞、日本語の単語表
記、及びその単語に対応する英語の単語表記等がそれぞ
れ格納されている。また、ユーザー辞書エリア43につ
いても、図3に示すように、辞書エリア35の格納状態
と同様であるが、ユーザー辞書エリア43内のデータ
は、使用者によって自由に書き換えられるように構成さ
れている。この辞書エリア35及びユーザー辞書エリア
43が、本発明の辞書部を構成している。
【0019】次に、本実施例の日英機械翻訳装置の動作
について、図4に示すフローチャートに基づいて説明す
る。
【0020】まず、装置を起動すると、ステップS21
(以下、S21と略称する。他のステップも同様)にお
いて、辞書登録が指示されたか否かの判断を行い、指示
されている場合は(S21:Yes)、S29に進み、
後述するユーザー辞書登録処理を行なう。辞書登録が指
示されていない場合は(S21:No)、通常の翻訳処
理を行なう。尚、辞書登録の指示は、表示装置5に表示
されているメニュー項目のうち「辞書登録」をマウス等
で指定することにより行なわれる。
【0021】翻訳処理においては、まず、S22におい
て、使用者からの日本文の入力待ち状態に入り、使用者
が入力装置1を操作することにより日本文を入力する
と、その入力された日本語文字列が入力文字列バッファ
41に格納される。その後、形態素解析処理32のプロ
グラムに従って、入力された日本語文字列に対して形態
素解析が行われる。
【0022】ここでは、入力文字列バッファ41に格納
された日本語文字列が、辞書エリア35及びユーザー辞
書エリア43に格納されている単語情報を参照すること
により、日本語の単語単位に分割される。この際に、辞
書エリア35及びユーザー辞書エリア43に存在しない
単語、即ち未知語が存在するか否かが検出され(S2
4)、未知語が1つでもあれば、S24においてYes
と判定され、全て辞書エリア35及びユーザー辞書エリ
ア43に存在しており、未知語が存在しない場合は、S
24においてNoと判定される。
【0023】例えば、辞書エリア35の登録状況が、図
2に示すような状況の場合に、使用者によって入力され
た日本語文字列が、「人間は動物だ」であれば、辞書エ
リア35の単語情報を参照することにより、「人間|は
|動物|だ」というように単語単位に区切られ、そし
て、「人間」、「は」、「動物」及び「だ」は、図2に
示すように、全て辞書エリア35に登録されているの
で、S24においてNoと判定され、S25に進み、翻
訳処理される。そして、上記処理のS23が、本発明の
単語抽出手段として機能し、S24が、本発明の未知語
抽出手段として機能している。
【0024】ここで、翻訳処理においては、形態素解析
された結果である「人間|は|動物|だ」を構文解析
し、これを日本語から英語に翻訳する。その結果、「A
human being is an anima
l.」という英語文字列が得られ、この英語文字列が、
テキストエリア42に格納されると共に、表示装置5に
表示される(S26)。
【0025】次に、S27に進み、翻訳処理の終了が指
示されたか否かの判断を行い、指示されている場合は
(S27:Yes)、処理を終了し、指示されていない
場合は(S27:No)、S21に戻り、上記と同様の
処理を行なう。尚、翻訳処理の終了の指示は、表示装置
5に表示されているメニュー項目のうち「終了」をマウ
ス等で指定することにより行なわれる。
【0026】また、S22において、使用者により入力
された日本語文字列が「アセトアルデヒドについて」と
いう文字列である場合には、S23の形態素解析におい
て「アセトアルデヒド|に|ついて」と分割される。こ
の時、仮に辞書エリア35及びユーザー辞書エリア43
に「アセトアルデヒド」が登録されてないとすると、こ
の「アセトアルデヒド」は、単語として認識できないの
で未知語として判断され(S24:Yes)、S28に
おいて、入力された日本語文字列「アセトアルデヒドに
ついて」と「ーーー未知語が存在します。ーーー」がテ
キストエリア42に格納されると共に、表示装置5に表
示される。この時の表示装置5の表示状態を図5に示
す。図5に示すように、入力された日本語文字列中に
「アセトアルデヒド」が含まれている場合は、本来その
翻訳文である英語文字列が表示されるべき場所に、「ー
ーー未知語が存在します。ーーー」が表示され、未知語
である「アセトルデヒド」にアンダーラインが付けられ
る。
【0027】上記処理のS28が、本発明の報知手段と
して機能する。
【0028】ここで、使用者が、未知語である「アセト
アルデヒド」を辞書登録するために図5に示す表示装置
5に表示されている「辞書登録」をマウスで指定すると
(S21:Yes)、S29に進みユーザー辞書登録処
理を行う。このユーザー辞書登録処理においては、使用
者が、登録したい単語の日本語表記、その品詞及びその
単語を英語にしたときの英語表記を入力する。例えば、
「アセトルデヒド」の場合、品詞「名詞」、日本語表記
「アセトアルデヒド」、及び英語表記「acetald
ehyde」を入力すると、図3に示すように、ユーザ
ー辞書エリア43に「アセトアルデヒド」に関する単語
情報が格納される。
【0029】この後、再び、翻訳処理が実行され、S2
2で図5で示すような日本語文字列「アセトアルデヒド
について」、「室温ではアセトアルデヒドはほとんど気
体である。」、あるいは「アセトアルデヒドの性質は水
によく溶けます。」等の日本語文字列が入力された場
合、S23の形態素解析において、全て辞書エリア35
及びユーザー辞書エリア43に存在する単語なので、未
知語は存在しないと判断され(S24:No)、S25
の翻訳処理において、適切な英語訳が与えられ、S26
において、日本語文字列とその英語文字列とがテキスト
エリア42に格納されると共に、図6に示すように、日
本語文字列とその翻訳文である英語文字列が表示装置5
に表示される。
【0030】このように、本実施例の日英機械翻訳装置
においては、使用者により入力された文字列の中に未知
語が存在している場合、「ーーー未知語が存在しますー
ーー」と表示し、翻訳処理を行なわないので、従来のよ
うに長い時間をかけて意味のない翻訳処理を行なうこと
なく、早い段階で処理を打ち切り、未知語について対処
することができるので、効率的に翻訳作業を行なうこと
ができる。
【0031】また、未知語には、アンダーラインが付け
られるので、どの部分が未知語であるかを容易に確認す
ることができる。
【0032】さらに、未知語が存在している場合、その
都度辞書登録を行なうことができるので、非常に使い勝
手が良い。
【0033】尚、本実施例においては、未知語にアンダ
ーラインを付けることによって、使用者に知らせるよう
に構成したが、網掛け表示あるいは点滅表示等、その他
の文字と区別可能であればどのような表示方法であって
も良い。また、ブザー等で知らせるように構成しても良
い。
【0034】
【発明の効果】以上説明したことから明かなように、本
発明の機械翻訳装置によれば、前記未知語抽出手段によ
り第1言語の単語として認識できない未知語が抽出され
た場合、中止制御手段が、前記翻訳手段による翻訳処理
を中止するように制御するので、従来のように長い時間
をかけて意味のない翻訳処理を行なうことなく、早い段
階で処理を打ち切り、未知語について対処することがで
きるので、効率的に翻訳作業を行なうことができる。
【図面の簡単な説明】
【図1】本実施例の日英機械翻訳装置の概略的構成を示
すブロック図である。
【図2】辞書エリアの登録状況を概念的に表した図であ
る。
【図3】ユーザー辞書エリアの登録状況を概念的に表し
た図である。
【図4】本実施例の日英機械翻訳装置の動作を示すフロ
ーチャートである。
【図5】未知語が存在する場合の表示装置の表示状態を
示す図である。
【図6】適切な翻訳が得られた場合の表示装置の表示状
態を示す図である。
【符号の説明】
1 入力装置 31 機械翻訳装置プログラムエリア 32 形態素解析処理 33 翻訳処理 5 表示装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 第1言語を入力するための入力手段と、 前記入力手段により入力された第1言語の文字列中の全
    ての単語を抽出する単語抽出手段と、 前記単語抽出手段によって抽出された単語のうち、第1
    言語の単語として認識できない未知語を抽出する未知語
    抽出手段と、 入力手段により入力された第1言語を第2言語に翻訳す
    る翻訳手段と、 を備えた機械翻訳装置において、 前記未知語抽出手段により第1言語の単語として認識で
    きない未知語が抽出された場合、前記翻訳手段による翻
    訳処理を中止するように制御する中止制御手段を備えた
    ことを特徴とする機械翻訳装置。
  2. 【請求項2】 前記第1言語を第2言語に翻訳するため
    に必要な各種情報が単語単位で登録されている辞書部を
    備え、 前記未知語抽出手段は、前記単語抽出手段によって抽出
    された単語が、前記辞書部に登録されているか否かを検
    出し、登録されていない単語を前記未知語として抽出す
    るように構成したことを特徴とする請求項1に記載の機
    械翻訳装置。
  3. 【請求項3】 前記未知語抽出手段により第1言語の単
    語として認識できない未知語が抽出された場合、その旨
    を知らせる報知手段を備えたことを特徴とする請求項1
    に記載の機械翻訳装置。
  4. 【請求項4】 前記報知手段は、前記未知語を他の単語
    と区別して指示することを特徴とする請求項3に記載の
    機械翻訳装置。
JP6194246A 1994-08-18 1994-08-18 機械翻訳装置 Pending JPH0863476A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6194246A JPH0863476A (ja) 1994-08-18 1994-08-18 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6194246A JPH0863476A (ja) 1994-08-18 1994-08-18 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH0863476A true JPH0863476A (ja) 1996-03-08

Family

ID=16321422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6194246A Pending JPH0863476A (ja) 1994-08-18 1994-08-18 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH0863476A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8756058B2 (en) 2006-02-23 2014-06-17 Nec Corporation Speech recognition system, speech recognition result output method, and speech recognition result output program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8756058B2 (en) 2006-02-23 2014-06-17 Nec Corporation Speech recognition system, speech recognition result output method, and speech recognition result output program

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JP2654001B2 (ja) 機械翻訳方法
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JPS6244874A (ja) 機械翻訳装置
JPH09198395A (ja) 文書検索装置
JPH0863476A (ja) 機械翻訳装置
JPS6180362A (ja) 翻訳装置
JPS62163179A (ja) 機械翻訳装置
JP2570681B2 (ja) ワード・プロセッサ
JPH0765008A (ja) 用語登録制御方法及び同装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH0410161A (ja) 省略補完処理装置
JP3244286B2 (ja) 翻訳処理装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH0628396A (ja) 電子化辞書装置
JP2000067048A (ja) データ処理装置及びデータ処理方法ならびにそのデータ処理記録媒体
JPH0687239B2 (ja) 文字処理装置
JPH03201165A (ja) 日本語解析処理方式
JPH06187370A (ja) 文書読解支援装置
JP2002024213A (ja) 翻訳支援装置、翻訳装置
JPH03225468A (ja) 機械翻訳装置
JPH05266009A (ja) 文書作成装置及び文書作成方法
JPH08212293A (ja) Sgmlタグ付与処理システム
JPH06266757A (ja) 日中機械翻訳方式
JPS6244872A (ja) 機械翻訳装置