JPH0258163A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH0258163A
JPH0258163A JP63208087A JP20808788A JPH0258163A JP H0258163 A JPH0258163 A JP H0258163A JP 63208087 A JP63208087 A JP 63208087A JP 20808788 A JP20808788 A JP 20808788A JP H0258163 A JPH0258163 A JP H0258163A
Authority
JP
Japan
Prior art keywords
translation
dictionary
key
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63208087A
Other languages
English (en)
Inventor
Hideki Hirakawa
秀樹 平川
Mariko Kimura
真理子 木村
Yoshimi Asahioka
旭岡 佳美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63208087A priority Critical patent/JPH0258163A/ja
Publication of JPH0258163A publication Critical patent/JPH0258163A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 翻訳処理の結果えられた訳文を記憶する訳文記憶部と、 前記原文および訳文を表示するための表示部と、これら
を制御すると共に、前記編集キーまたはカーソルキーの
操作に応じて前記表示部で表示された原文または訳文の
編集処理および前記表示部の表示面でのカーソルの制御
を行うための翻訳編集部とを備え、前記翻訳部は単語認
識のとき前記する。
(従来の技術) 近年、コンピュータを利用して入力原文を自動的に機械
翻訳するシステムが注目されている。
この機械翻訳システムは、基本的には入力原文を辞書引
き、形態解析、構文解析するなどして語(句)等の所定
の処理単位に区分し、その処理単位ごとに翻訳辞書を検
索して対応する訳語(訳語句)等を見出し、これを所定
の訳文規則にしたかって結合する等してその訳文を得る
ように構成されている。辞書引き処理、形態素処理では
、通常、入力文字列に対して、語用変化規則、語尾変化
規則などの文法的な変形情報を用いて辞書項目とのマツ
チングを行っており、「話さ」、「話し」、「話す」な
どが1の辞書項目とマツチすると認識される。また、辞
書引き、形態素処理で単語として認識されない文字列は
未知語として処理されることになる。
実際の文書には、上記文法的な処理で対応できない場合
がある。例えば、「ループ」の「−」をカタカナの長音
記号ではなく、マイナス記号で入力しである場合、「メ
モリライト」を「メモリ・ライト」と中点を入れて入力
しである場合、「コンピュータ」を「コンピューター」
と入力しである場合などである。この様な入力がシステ
ムに入った場合に、本来は辞書の中に単語が入っている
のもかかわらず、未知語となってしまう。
(発明が解決しようとする課題) この様に従来のシステムでは人力原文中の単語と辞書項
目とのマツチングのとき、様々な表記による原文中の単
語に対処できないという欠点か有った。
本発明は、以上のような表記のずれ、誤りに対しても辞
書項目とマツチする機能を宵する機械翻訳システムを提
供することを目的としいる。
[発明の構成] (課題ホを解決するための手段) この発明は、入力部と、前記人力部を介して入力された
原文に対して翻訳辞書を研削して単語単位に文を区切り
、各単語認識を行なう辞書引き・形態素解析部と、前記
形態素解析部により調べられた各単語の情報から構文上
正当な解決を抽出する構文解析部と、前記構文解析部に
より抽出された解決情報を翻訳すべき言語の構造へ変換
する構造変・換部と、前記構造変換部により得られた構
造より訳文を生成する訳文生成部と、前記原文及び訳文
を表示する表示部と、これら全体の制御を行う翻訳編集
部と、前記辞書引き・形態素処理の文字列のマツチング
においてマツチングの方法の制御(マイナス記号の長音
記号への変換あるいはその逆、カタカナ中点の削除、カ
タカナ長音記号の付加、削除など)を行うマツチング制
御部と、を有することを特徴とする機械翻訳システムを
提供する。
(作用) この様に構成されたシステムにおいて、オペレータは前
記人力手段により翻訳制御部を介して、上記マツチング
制御部のマツチングの方法を示すパラメータを変更する
。文の翻訳時に辞書引き、形態素処理において、入力文
と詳細見出しとのマツチングの方法か、前記パラメータ
により変更される。これにより、オペレータは、入力誤
りや表記の認れを含む単語を本来の単語に修正すること
なく正しく認識することができ、効率良く翻訳を行うこ
とができる。
(実施例) 第1図は本発明の実施例としての日英機械翻訳システム
の全体ブロック図である。このシステムは、キーボード
からなる入力部1、原文としてキー人力された英文を記
憶する原文記憶部2、訳文としての入力日本語文に対応
する英文を記憶する訳文記憶部3、本システム全体を制
御する編集制御部4、翻訳処理を実行する翻訳部5、翻
訳処理に利用する知識情報を収容した翻訳辞書6、原文
や訳文などの表示を制御する表示制御部7、表示部8及
び原文や訳文などを清書してハードコピとして出力する
ための印刷部9とにより構成されている。
第2図は、入力部1のキー配列の一例を示す図である。
入力部1は日本語文、英文人力用の文字キーに加えて以
下の各種キーを偏えている。
翻訳指示キー      :100 編集キー         =101〜106101ル
106 カーソルキー       :130ル133中点削除
キー      :140 長音←マイナスモードキー:141 長音削除モートキー   =142 第3図は表示部8の画面のレイアウトの一例を示す図で
ある。入力原文は画面左側の原文表示領域に表示される
。翻訳処理の結果得られた訳文は画面右側の訳文表示領
域にその原文と対応する位置に表示される。また画面上
部の編集領域には各種編集に必要な情報を表示するため
に用いることかできる。
第4図は編集制御部4による対話翻訳処理の流れの一例
を示すフローチャートである。対話翻訳処理では原文の
入力と対応する訳文の編集作業をオペレータか適宜に行
うことのできる。編集制御部4は、ステップ51〜S6
において、入力部1からなんらかのキー人力があるかあ
るいは翻訳部5から翻訳完了信号を受けているかを監視
しており、なんらかのキー人力があった場合にそれに対
応する処理を行う。
オペレータが機能キーのいずれかを操作した場合、ステ
ップS5によりこれを検知し、ステップS12でその機
能キーに対応した処理を行う。
オペレータか編集キーのいずれかを操作した場合、ステ
ップS4によりこれを検知し、ステップSllでその編
集キーに対応した処理を行う。
オペレータかカーソルキー130あるいはその他の制御
キーを操作した場合、ステップ81〜S6を介してステ
ップS13でキー操作に対応したカーソルの移動のため
の処理やその他の処理を行う。
オペレータが文字キーを操作して原文を入力すると、ス
テップS3で各文字キーが検知された後、対応する文字
コードが順次編集制御部4内の(図示しない)入力バッ
ファにセットされる(ステップS8)。この入力原文は
表示制御部7を介して表示部8の原文表示領域に表示さ
れる(ステップS9)。オペ−レータが任意の時点て例
えば−文の人力か終了したとき、翻訳指示キー100を
打鍵すると、ステップS2でこのキーが検知され、編集
制御部4は翻訳部5に対し入力バッファ内の原文を供給
し、翻訳処理の開始を指示する(ステップS 10)。
なお、原文人力の途中で訂正・挿入・削除等の入力編集
か必要な場合には、カーソルキーにより所望の編集箇所
へカーソルを移動した後、挿入キー101、削除キー1
02等の編集キーを用いてこれを行うことができる。
第5図は翻訳部5における翻訳処理の流れを示すフロー
チャートである。
形態素解析部(S51)では、入力原文に対し、活用・
変化・辞書6aを用いて語尾等に変化がある単語を、そ
の原形(基本形)に変換する。
辞書検索部(S52)では、人力原文を構成する単語毎
に単語・熟語辞書6bを検索し、その品詞や訳語等の情
報を集める。
解析制御部(S 53)は、訳文の候補を構文解析部に
送る処理を行う。
構文解析部(S 54)は、解析文法6Cを使って訳文
候補の構文を解析し、日本語文の構造を生成する。解析
に失敗した場合は解析制御部に戻る。
構造変換部(S 55)は、変換文法6dを使って日本
語の構造を英語の構造に変換する。棄却された場合は、
構文解析部に戻る。
構文生成部(S56)は、生成文法6eに従って英語の
構造から英語の語順を決定し単語列に変換する。
形態素生成部(S57)は、形態素生成文法6fにより
単語の語形等を変化させて翻訳文を完成させる。
以上のそれぞれの処理部は、処理を始めた時点で信号を
編集制御部4に出力する。
再び第4図において、編集制御部4はステップS1で上
記翻訳完了信号を検知すると、ステップS7に進み、翻
訳部5から得られた訳文候補及び補助情報を表示制御部
7に送り訳文を表示させる(ステップS7)。表示制御
部7は上記訳文候補を訳文表示領域内において入力原文
(画面左側)と対応する位置に表示するとともに、補助
情報がある場合には、その訳語を高輝度または反転表示
することによりオペレータがその旨識別できるようにし
ている。
この状態から、編集キーの打鍵があると、編集制御部4
はステップS4でこれを検知し、このときカーソルで指
示されている語または句に対して各キーに対応した編集
処理を行う(ステップ511)。例えば、挿入キー10
1の操作により、カーソル位置の前に文字を挿入する。
削除キー102の操作により、カーソルか指示している
範囲の文字列を削除する。移動キー103の操作により
、カーソルが指示している範囲を移動する。取消キー1
04の操作により、上記101゜102.103の効果
を無効にする。係り受はキー105の操作により、補助
情報を用いて、カーソルか指示している語句の他の係り
受は候補を表示させる。
なお、機能キーにより以下の機能を実現できる。訳語表
示キー110の操作により、訳文中の語に対してその訳
語を表示できる。辞書表示キー111の操作により、原
文中の語に対して辞書を表示できる。辞書登録キー11
2の操作により、新語・熟語の登録がでる。辞書削除キ
ー113の操作により、辞書登録により登録された語・
熟語の削除を行うことができる。部分訳キー114の操
作により、翻訳が失敗した時にその部分訳を表示させる
また、カーソルキーとしては、カーソルをそれぞれ各方
向に移動させるカーソル移動キー130、カーソルが移
動する単位を切換える単位切換キー131、各表示領域
間にカーソルを移動させるための領域間移動キー132
、カーソルのサイズを文字単位に縮小または語単位に拡
大するための拡大縮小キーなどで構成されている。中点
削除モートキー140は、前記辞書引き・形帖素処理に
おいて、入力文中の中点を削除した文字列に対しても辞
書マツチングを行なうか否かを0N10FFで指定する
。長音←マイナスモードキー141は、前記辞書引き・
形態素処理において入力文中のマイナス記号を長音記号
に置換して辞書マツチングを行うか否かを0N10FF
で指定する。長音削除モードキー142は、前記辞書引
き・形態素処理において、入力文中の長音記号を削除し
て辞書マツチングを行うか否かを0N10FFで指定す
る。
したがって、オペレータは原文の人力と、その訳文の編
集処理とを適宜行いながら対話的に翻訳文を得ることが
できる。
以上のように構成されたシステムにおいて、更に辞書引
きにおけるマツチングの制御について詳細に説明する。
第6図は、その処理の流れを示す図である。
S51では、前記原文のある位置からの文字列か入力文
字列として与えられ、その文字列と辞書内の見出し語と
のマツチングが行なわれる。
この結果、マツチした見出し語については、辞書単語リ
ストに単語の候補として登録される。次にS51におい
て、前記中点削除キーにより設定される中点削除モード
かONかOFFがか判定され、OFFの場合は、S54
に行く。ONの場合は、S53にて入力文字列から中点
「・コを除いた文字列と辞書内の見出し語とのマツチン
グが行なわれる。この結果、マツチした見出し語につい
ては辞書単語リストに単語の候補として登録される。
次に354では、前記長音←マイナスモードキーにより
設定される長音記号←マイナス記号変換モードがONか
OFFかが判定され、OFFの場合は、S56に行く。
ONの場合は、S55にて入力文字列のマイナス記号を
長音に置換した文字列に対して、あるいはその逆の置換
を行った文字列の全てのパターンの文字列に対して辞書
内の見出し語とのマツチングか行なわれる。この結果、
マツチした見出し語については辞書単語リストに単語の
候補として登録される。次に、556ては、前記長音削
除モードキーにより設定される長音削除モードがONか
OFFかが判定され、OFFの場合は処理を終了する。
ONの場合は、入力文字列から長音を除いた全てのパタ
ーンの文字列に対して辞書内の見出し語とのマツチング
が行なわれる。この結果、マツチした見出し語について
は、辞書単語リストに単語の候補として登録される。
以下では、具体例を用いて上記処理を説明する。
第7図は機械辞書の見出し及び訳語を示した1例である
第8図は、入力文字列として「ループ」 (二二で「−
」は英記号、以降差を明確にするためマイナス「−」は
「−(記号)」と記述する。)が与えられた時の処理を
説明するための図である。今、説明を簡単にするため、
中点削除モード、長音削除モードはOFF、長音記号→
マイナス変換モトはONとする。入力文字列「ルー(記
号)プ」はカタカナ後の「ループ」の誤りである。ます
、第6図の851で、入力文字列と第7図の辞書とのマ
ツチングが行なわれるが、辞書中には、マツチする単語
かないため。辞書単語リストには、何も登録されない(
8a”) 、次に、S52.S54と処理か進み、長音
記号←マイナス記号変換モトかONであることにより、
S55が行なわれる。S55では、入力文字列中の「−
(記号)」を「−」に置換したストリング「ループ」を
作り、辞書マツチングの対象に含める。この「ループ」
に対して、辞書マツチング処理を行なうと、第7図より
「ループ」がマツチし、この単語が辞書単語リストに登
録される(8b)。ここで「ルー(記号)ブ」の後のカ
ッコ内の数字は、該当する辞書番号である。処理は35
6を通り、終了し、辞書引き結果として、「ルー(記号
)ブ」から「ループ」を得る。
第9図は、「メモリ・ライト」という文字列に対する処
理を説明するための図である。今、説明を簡単にするた
め、中点削除モードのみONであるものとする。入力文
字列「メモリ・ライト」は、まず、第6図の351で、
第7図の辞書とのマツチングかとられる。この結果、「
メモ」 「メモリ」が辞書とマツチングがとれるため、
辞書単語リストは、9aに示すようになる。次に、第6
図552で中点削除モードかONであるため、同図S5
3の処理か行なわれる。ここでは、入力文字列「メモリ
・ライト」から「・」が削除された文字列「メモリライ
ト」が新たに辞書マツチング対象文字列となる。この文
字列に対して辞書とのマツチングが行なわれると、「メ
モ」、「メモリ」、「メモリライト」の3つがマツチす
る。このため、辞書単語リストには、新規に「メモリ・
ライト」が辞書単語リストに追加される。処理はS56
を通り終了し、辞書引き結果として「メモリ・ライト」
から「メモリライト」を得る。
第10図は、「コンピューター処理」という文字列に対
する処置を説明するための図である。
今、説明を簡単にするため、長音削除モードのみかON
であるものとする。入力文字列「コンピューター処理」
は、まず、第6図の351で、第7図の辞書とマツチン
グがとられる。この結果、「コンピュータ」の部分が辞
書とマツチング可能であり、辞書単語リストは、10a
に示すようになる。次に、第6図352.S54を通り
、556に対して、長音削除モードがONであるため、
S57の処理が行なわれる。ここでは、「コンピュータ
ー処理」という人力文字列から、長音記号「−」を除く
全パターンか新たな辞書マツチング対象文字列となる。
ここでは、「コンピューター処理」、「コンピュータ処
理」、「コンビスタ処理」が新たなマツチング対象であ
る。これらの文字列に対して辞書とのマツチングが行な
われると「コンピュータ処理」が辞書見出しの「コンピ
ュータ」とマツチし、辞書単語リストには、長音を復元
した語「コンピューター」が新規に追加されることにな
る(10b)。ここて、10bの「コンピュータ(10
00)」は、次に続く文字が長音「−」であり、同じく
10bの「コンピューター(1000)Jは、次に続く
文字が「処理」であるという違いがある。前者の場合に
は、長音「−」の部分が未知語となってしまい、「コン
ピュータ/−処理」という解釈に対応する。処理か終了
すると、「コンピューター」という部分を1つの単語と
す辞書引き結果を得る。
上記実施例においては、中点の削除及び長音号の削除に
ついては、無条件にこれを行うものとしたが、これらの
処理に適用条件を付加する拡張が考えられる。例えば、
「科学−技術」といった入力文字列の場合に、無条件に
長音の削除を行うと「科学技術」となり、これが辞書中
にあった場合には、誤った辞書引きを行ってしまう。こ
のため、長音、中点の削除は、その直前の文字がカタカ
ナ後に限るといった条件を付加する場合等である。
また、長音記号とマイナス記号の置換においては、ひら
かな長音とカタカナ長音を区別している場合には、その
記号も置換の対象とするという拡張か考えられる。また
、英語の処理の例としては、ハイフンの削除か考えられ
る。例えば、“Computer−SyStem  と
いう人力に対して、ハイフンを取った“Compute
r system″が辞書に登録されていた場合に、そ
の項目も辞書引き結果に含めるといった処理かある。
[発明の効果] この発明によれば、文書中に表われる長音記号とマイナ
ス記号の誤りがあった場合でも正しく辞書引きを行うこ
とかできる。また、「メモリ・ライト」のように中点を
入れて文書が書かれている場合や、「コンピューター」
、「コンピュータ」のように長音の有無による表記のゆ
れかある場合でも辞書中の見出し語とのマツチングを行
うことが可能となり、入力文の訂正や単語の辞書への登
録などの手間をかけずに正しい単語認識を行うことがで
き、翻訳作業を行うオペレータの負担を大幅に軽減する
ことができる。
したかって、編集作業の著しい簡略化を図り、簡易に適
切な翻訳結果を得ることかできる。
【図面の簡単な説明】
第1図は本発明の一実施例の全体ブロック図、第2図は
本発明の一実施例で用いる入力部のキー配列を示す図、
第3図は本発明の一実施例で用いる表示部の画面のレイ
アウトの一例を示す図、第4図は本発明の一実施例で用
いる編集制御部の処理の流れの一例を示すフローチャー
ト、第5図は本発明の一実施例で用いる翻訳処理の流れ
の一例を示すフローチャート、第6図は本発明の一実施
例で用いる辞書引き処理におけるマツチングの制御の処
理流れを示すフローチャート、第7図は本発明の一実施
例で用いる機械辞書の見出し及び訳語を示した図、第8
図、第9図、第10図は本発明の一実施例の動作を説明
するだめの図である。 1・・・入力部、2・・・原文記憶部、3・・・訳文記
憶部、4・・・編集制御部、5・・・翻訳部、6・・・
翻訳辞書、8・・・表示部、9・・・印刷部

Claims (2)

    【特許請求の範囲】
  1. (1)、少なくとも文字キー、編集キー、カーソルキー
    を有する入力部と、 この入力部から入力された翻訳対象となる原文を記憶す
    る原文記憶部と、 翻訳処理に使用する知識情報を収容した翻訳辞書部と、 この翻訳辞書部の内容を用いて前記入力された原文の単
    語認識及び翻訳処理を実行する翻訳部と、翻訳処理の結
    果えられた訳文を記憶する訳文記憶部と、 前記原文および訳文を表示するための表示部と、これら
    を制御すると共に、前記編集キーまたはカーソルキーの
    操作に応じて前記表示部で表示された原文または訳文の
    編集処理および前記表示部の表示面でのカーソルの制御
    を行うための翻訳編集部とを備え、前記翻訳部は単語認
    識のとき前記原文中の単語文字列と前記翻訳辞書中の見
    出し語文字列とが文字の置換、挿入、削除等を行なった
    場合に同一であるか否かを判定して認識することを特徴
    とする機械翻訳システム。
  2. (2)入力部は、前記翻訳部による単語認識に対し文字
    の置換、挿入、削除等を行うか否かを指示できるもので
    ある請求項1記載の機械翻訳システム。
JP63208087A 1988-08-24 1988-08-24 機械翻訳システム Pending JPH0258163A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63208087A JPH0258163A (ja) 1988-08-24 1988-08-24 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63208087A JPH0258163A (ja) 1988-08-24 1988-08-24 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH0258163A true JPH0258163A (ja) 1990-02-27

Family

ID=16550424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63208087A Pending JPH0258163A (ja) 1988-08-24 1988-08-24 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH0258163A (ja)

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
KR900008769B1 (ko) 기계번역시스템
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
KR900009120B1 (ko) 기계번역장치
JPH0442705B2 (ja)
JP2848729B2 (ja) 翻訳方法および翻訳装置
KR900008402B1 (ko) 기계번역장치
JPH0442704B2 (ja)
JPH0258163A (ja) 機械翻訳システム
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
JPS6320569A (ja) 機械翻訳装置
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JPS62271061A (ja) 機械翻訳システム
JPH0773185A (ja) 機械翻訳装置及び方法
JPH0550778B2 (ja)
JPS63236165A (ja) 機械翻訳システム
JPS62203265A (ja) 機械翻訳システム
JPS6320570A (ja) 機械翻訳システム
JPS6244872A (ja) 機械翻訳装置
JPS62211774A (ja) 機械翻訳システム
JPH0212458A (ja) 機械翻訳システム
JPH0212457A (ja) 機械翻訳システム
JPS6244876A (ja) 機械翻訳装置
JPS63300361A (ja) 機械翻訳装置
JPS62203267A (ja) 機械翻訳システム