JPH06295310A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH06295310A
JPH06295310A JP5105138A JP10513893A JPH06295310A JP H06295310 A JPH06295310 A JP H06295310A JP 5105138 A JP5105138 A JP 5105138A JP 10513893 A JP10513893 A JP 10513893A JP H06295310 A JPH06295310 A JP H06295310A
Authority
JP
Japan
Prior art keywords
word
sentence
unit
dictionary
original sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5105138A
Other languages
English (en)
Inventor
Sakiko Honma
咲子 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP5105138A priority Critical patent/JPH06295310A/ja
Publication of JPH06295310A publication Critical patent/JPH06295310A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 ハイフン合成語の認定精度の向上を図る。 【構成】 入力部11により入力された原文は、原文記
憶部12により記憶される。翻訳辞書部には原文の翻訳
処理に用いる知識情報が格納され、翻訳処理部15は知
識情報を用いて前記原文記憶部12に記憶された原文を
翻訳処理する。訳文記憶部13は、翻訳処理によって得
られた訳文を原文に対応させて記憶する。表示部17及
び表示制御部16は、少なくとも前記原文または訳文を
表示する。該表示部17により表示された原文及び訳文
に対する編集処理を編集制御部14により制御する。こ
のような構成により、前記翻訳辞書部の情報をもとに、
前記翻訳処理部において入力された原文を辞書引き処理
する際、語末にハイフンを有する語とそれに後続する語
とをまとめ上げ、語間のスペースを削除して1語のハイ
フン合成語として辞書引きを行う。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、機械翻訳装置に関し、より詳細
には、不正にスペースを挿入させたハイフン合成語の辞
書引き機能を有する機械翻訳装置に関する。
【0002】
【従来技術】ハイフンには大きく分けて2つの働きがあ
る。1語の綴りが2行に渡る場合に、そのつながりを示
す働きと、複合語を構成する働きである。両者の処理を
混同せずに行うための従来技術としては、例えば特開昭
63−106074号公報がある。これは行末にハイフ
ンがある場合に、ハイフン直前の語と次行の先頭の語を
ハイフン無しで繋げて辞書引きし、辞書に登録されてい
ればハイフン無しの1語として扱い、登録されていなけ
れば複合語として扱うというものである。
【0003】ところで、原文の入力中に、ハイフン付き
の複合語をハイフンの部分で改行する際に、ハイフンの
直後に不要なスペースを入れてしまうことがよくある。
このような場合に、従来技術による処理では、語末にハ
イフンの付いた語とハイフンの付かない語の2語から成
ると認識される。例えば、“first-(スペース)(改行)
class”は、“first-”と“class”の2語と認識されて
しまうため、たとえ“first-class”が辞書に登録され
ていても無駄になってしまう。また、2行に渡らない場
合でも、入力ミスなどで同様の問題は起き得る。
【0004】また、特開昭63−20568号公報のも
のは、複合語に対する辞書登録を効果的に行うために、
複合語に現われる、例えば単語を相互に結合して1つの
複合語を形成するハイフン「−」等の特殊文字を辞書登
録のときに調べ、特殊文字を例えばスペースに変換して
辞書へ登録し、翻訳すべき文字列には複合語を形成する
特殊文字を付しても翻訳できるようにしたものである。
すなわち、ハイフンをスペースに置き換えて辞書引き
し、異表記の辞書登録量を軽減しようとするものだが、
上記の問題点を解決するものではない。
【0005】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、行末処理後に、スペースを区切りとする単位で
辞書引き処理を行う際、語末にハイフンを有する語とそ
れに後続する語とをまとめ上げ、語間のスペースを削除
して1語のハイフン合成語として辞書引きを行うことで
ハイフン合成語の認定精度を上げること、また、該ハイ
フン合成語が辞書に未登録の場合は、ハイフン直後にス
ペースを挿入し、その前後を別々の語として再度辞書引
きを行うことで、不正なまとめ上げを防ぐようにした機
械翻訳装置を提供することを目的としてなされたもので
ある。
【0006】
【構成】本発明は、上記目的を達成するために、(1)
少なくとも、原文を入力するための入力部と、該入力部
により入力された原文を記憶する原文記憶部と、前記原
文の翻訳処理に用いる知識情報を格納した翻訳辞書部
と、前記知識情報を用いて、前記原文記憶部に記憶され
た原文を翻訳処理する翻訳処理部と、該翻訳処理部によ
る翻訳処理によって得られた訳文を、原文に対応させて
記憶する訳文記憶部と、少なくとも前記原文または訳文
を表示する表示部および表示制御部と、該表示部に表示
された原文および訳文に対する編集処理を制御する編集
部とから成り、前記翻訳辞書部の情報をもとに、前記翻
訳処理部において入力された原文を辞書引き処理する
際、語末にハイフンを有する語と該ハイフンを有する語
に後続する語とをまとめ上げ、語間のスペースを削除し
て1語のハイフン合成語として辞書引きを行う辞書引き
手段を有すること、更には、(2)前記ハイフン合成語
が辞書に未登録の場合は、ハイフン直後にスペースを挿
入し、その前後を別々の語として再度辞書引きを行う辞
書引き手段を有することを特徴としたものである。以
下、本発明の実施例に基づいて説明する。
【0007】図1は、本発明による機械翻訳装置の一実
施例を説明するための構成図で、図中、11は入力部、
12は原文記憶部、13は訳文記憶部、14は編集制御
部、15は翻訳部(翻訳処理部)、16は表示制御部、
17は表示部である。入力部11から入力された原文は
原文記憶部12に送られる。翻訳部15は、編集制御部
14の制御下で原文記憶部12の原文を翻訳処理する。
すなわち、入力部11により入力された原文は、原文記
憶部12により記憶される。翻訳辞書部には原文の翻訳
処理に用いる知識情報が格納されている。翻訳処理部1
5は前記翻訳辞書部に格納されている知識情報を用いて
前記原文記憶部12に記憶された原文を翻訳処理する。
訳文記憶部13は、翻訳処理によって得られた訳文を原
文に対応させて記憶する。表示部17及び表示制御部1
6は、少なくとも前記原文または訳文を表示する。該表
示部17により表示された原文及び訳文に対する編集処
理を編集制御部14により制御する。このような構成に
より、前記翻訳辞書部の情報をもとに、該翻訳処理部に
おいて入力された原文を辞書引き処理する際、語末にハ
イフンを有する語とそれに後続する語とをまとめ上げ、
語間のスペースを削除して1語のハイフン合成語として
辞書引きを行う。
【0008】図2は、図1における翻訳部の処理を英日
機械翻訳を例にして示した構成図で、図中、21は形態
素解析部、22は構文解析部、23は変換部、24は生
成部、25は辞書、26は文法規則である。まず、入力
文である英文は、形態素解析部21で、辞書25の情報
をもとに個々の単語に認定される。また接辞辞書などを
参照して、システム辞書に未登録である語の一部に対
し、品詞や訳語などの情報を与える。次に、構文解析部
22で文法規則26を適用して文構造が決定され、係り
受け関係などを明らかにした木構造が作られる。該木構
造は、変換部23で出力言語である日本語の構造に即し
た木に変換され、生成部24でノード毎に訳出される。
得られた訳文は順次訳文記憶部13に格納される。編集
制御部14は表示制御部16を駆動し、原文記憶部12
に格納された英文と、訳文記憶部13に格納された日本
語文を対応付けて表示部17において表示する。ユーザ
はこの表示を見ながら後編集処理を行う。後編集処理
は、入力部11から入力される制御情報に従い、編集制
御部14で実行される。
【0009】図3は、本発明による辞書引き処理のフロ
ーチャートである。以下、各ステップに従って順に説明
する。この処理の前に、文認定や行末処理などは終了し
ている。まず、文頭からスペースを区切りとして1語ず
つ読み込み(S31)、これを文末まで繰り返す(S3
2)。読み込んだ語がハイフンを含んでいるかどうかを
判断し(S33)、含んでいるならばその位置が語末で
あるかどうかを判断する(S34)。語末にハイフンを
含む語であれば、後続の語を含め、語間のスペースを削
除して(S35)、辞書引きを行う(S36)。辞書引
きした合成語が未登録で(S37)、かつ前記S35の
処理を行った語であれば(S38)、削除したスペース
を再挿入して、個々の語を辞書引きする(S39)。
【0010】図4(a)〜(e)は、本発明の請求項1
記載の発明を説明するための具体例を示す図で、図
(a)は入力文、図(b)は辞書に登録されている訳
語、図(c)は文認定処理結果、図(d)は本発明によ
り得られた訳文、図(e)は従来の訳文を各々示してい
る。図(a)に示す入力文では、一行目末の語である
“all-”の後ろにスペースが挿入されている。文認定処
理の結果は、図(c)のようになり、“all-”と“nigh
t”の間にはスペースが介在する。図3に示した処理に
従うと、“all-”は語末にハイフンを含むので、後続の
“night”とまとめ上げ、スペースを削除して“all-nig
ht”で辞書引きを行う。“all-night”は、図(b)の
ように辞書に登録されているため、この辞書情報を用い
て翻訳処理を行う。図(d)は本発明によって得られる
訳文、図(e)は従来どおり“all-”と“night”を別
々に辞書引きして得られる訳文である。なお、ここで示
した例は、語末のハイフンを無視して辞書引きした場合
のものである。
【0011】図5(a)〜(d)は、本発明の請求項2
記載の発明を説明するための具体例を示す図で、図
(a)は入力文、図(b)は文末認定処理結果、図
(c)は本発明により得られた訳文、図(d)は本発明
による請求項1の処理のみによって得られた訳文を各々
示している。図(a)に示す入力文では、一行目末の語
である“small-”の後ろにスペースが挿入されている。
文末認定処理の結果は、図(b)のようになり、“smal
l-”と“and”の間にはスペースが介在する。図3に示
した処理に従うと、“small-”は語末にハイフンを含む
ので、後続の“and”とまとめ上げ、スペースを削除し
て“small-and”で辞書引きを行う。しかし、“small-a
nd”は辞書に登録されていないため、スペースを再挿入
して“small-”と“and”を別々に辞書引きし、翻訳処
理を行う。図(c)は本発明の請求項2によって得られ
る訳文、図(d)は請求項1の処理のみによって得られ
る訳文である。
【0012】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1に対応する効果:スペースを区切りとす
る単位で辞書引き処理を行う際、語末にハイフンを有す
る語とそれに後続する語とをまとめ上げ、語間のスペー
スを削除して1語のハイフン合成語として辞書引きを行
うことで、ハイフン合成語の認定精度を上げることがで
きる。 (2)請求項2に対応する効果:該ハイフン合成語が辞
書に未登録の場合は、ハイフン直後にスペースを挿入
し、その前後を別々の語として再度辞書引きを行うこと
で、不正なまとめ上げを防止できる。
【図面の簡単な説明】
【図1】 本発明による機械翻訳装置の一実施例を説明
するための構成図である。
【図2】 図1における翻訳部の処理を英日機械翻訳を
例にして示した構成図である。
【図3】 本発明による辞書引き処理のフローチャート
である。
【図4】 本発明の請求項1記載の発明を説明するため
の具体例を示す図である。
【図5】 本発明の請求項2記載の発明を説明するため
の具体例を示す図である。
【符号の説明】 11…入力部、12…原文記憶部、13…訳文記憶部、
14…編集制御部、15…翻訳部、16…表示制御部、
17…表示部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも、原文を入力するための入力
    部と、該入力部により入力された原文を記憶する原文記
    憶部と、前記原文の翻訳処理に用いる知識情報を格納し
    た翻訳辞書部と、前記知識情報を用いて、前記原文記憶
    部に記憶された原文を翻訳処理する翻訳処理部と、該翻
    訳処理部による翻訳処理によって得られた訳文を、原文
    に対応させて記憶する訳文記憶部と、少なくとも前記原
    文または訳文を表示する表示部および表示制御部と、該
    表示部に表示された原文および訳文に対する編集処理を
    制御する編集部とから成り、前記翻訳辞書部の情報をも
    とに、前記翻訳処理部において入力された原文を辞書引
    き処理する際、語末にハイフンを有する語と該ハイフン
    を有する語に後続する語とをまとめ上げ、語間のスペー
    スを削除して1語のハイフン合成語として辞書引きを行
    う辞書引き手段を有することを特徴とする機械翻訳装
    置。
  2. 【請求項2】 前記ハイフン合成語が辞書に未登録の場
    合は、ハイフン直後にスペースを挿入し、その前後を別
    々の語として再度辞書引きを行う辞辞引き手段を有する
    ことを特徴とする請求項1記載の機械翻訳装置。
JP5105138A 1993-04-06 1993-04-06 機械翻訳装置 Pending JPH06295310A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5105138A JPH06295310A (ja) 1993-04-06 1993-04-06 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5105138A JPH06295310A (ja) 1993-04-06 1993-04-06 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH06295310A true JPH06295310A (ja) 1994-10-21

Family

ID=14399396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5105138A Pending JPH06295310A (ja) 1993-04-06 1993-04-06 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH06295310A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100716158B1 (ko) * 2005-12-09 2007-05-10 한국전자통신연구원 하이픈 포함 미등록어의 대역어 선택 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100716158B1 (ko) * 2005-12-09 2007-05-10 한국전자통신연구원 하이픈 포함 미등록어의 대역어 선택 방법 및 장치

Similar Documents

Publication Publication Date Title
US6119077A (en) Translation machine with format control
JPS62163173A (ja) 機械翻訳方法
JPH02140868A (ja) 機械翻訳システム
JPH06295310A (ja) 機械翻訳装置
JP4007630B2 (ja) 対訳例文登録装置
JP2871300B2 (ja) 機械翻訳装置
JPS60200369A (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3233800B2 (ja) 機械翻訳装置
JP2682048B2 (ja) 文章処理装置
JP3692711B2 (ja) 機械翻訳装置
JPH07182346A (ja) 機械翻訳装置
JPS62203274A (ja) 機械翻訳システム
JPS63261467A (ja) 翻訳方法および装置
JPS6190268A (ja) 翻訳方式
JPH05314172A (ja) 機械翻訳装置
JPH0469767A (ja) 文書作成装置
JPH07141382A (ja) 外国語文書作成支援装置
JPH07262194A (ja) 機械翻訳装置
JPS6320567A (ja) 翻訳装置
JPH02302873A (ja) 機械翻訳装置
JPH0452868A (ja) 機械翻訳装置
JPH03157767A (ja) 機械翻訳装置
JPH04107674A (ja) 言語処理装置
JPH08287072A (ja) 機械翻訳装置