JPS62272359A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPS62272359A
JPS62272359A JP61117901A JP11790186A JPS62272359A JP S62272359 A JPS62272359 A JP S62272359A JP 61117901 A JP61117901 A JP 61117901A JP 11790186 A JP11790186 A JP 11790186A JP S62272359 A JPS62272359 A JP S62272359A
Authority
JP
Japan
Prior art keywords
word
translation
words
unregistered
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61117901A
Other languages
English (en)
Inventor
Hitoshi Suzuki
等 鈴木
Shinji Tokunaga
徳永 信治
Shinobu Shiotani
塩谷 忍
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Sada
いち子 佐田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61117901A priority Critical patent/JPS62272359A/ja
Priority to GB8711953A priority patent/GB2193355B/en
Publication of JPS62272359A publication Critical patent/JPS62272359A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 く技術分野〉 本発明は、入力文に含まれる単語の翻訳語を出力する辞
書を備え、前記辞書から出力された翻訳語を用いて前記
入力文の翻訳処理を行う機械翻訳装置に関し、入力文に
含まれる単語が前記辞書に登録されてなかった場合、翻
訳処理を実行することなく、当該単語を他の単語と区別
表示し、前記未登録語である単語の処理を操作者に促す
と共に、前記区別表示が成された後の翻訳指示に基づき
、当該区別表示状態を解除し、翻訳処理を実行開始する
自動翻訳システムに関するものである。
〈従来技術〉 機械翻訳装置は、原言語を目標言語に変換するため、少
なくとも原言語と目標言語の対訳辞書が必要である。
即ち、入力された原文、即ち入力文に含まれる複数の単
語の中で1つでも辞書に登録されていない単語があると
翻訳ができなくなるので、翻訳処理に入る前に辞書にな
い単語がある旨を操作者(オペレータ)に報知すること
が要求される。
従来の機械翻訳装置は、原文(入力文)の中に未登録語
である単語が存在することのみを知らせるものであった
ため、入力文の中に未登録語の単語があることを知り得
ても、いずれの単語が未登録語かを判別することができ
ず、未登録語を求めるために、操作者は入力文に含まれ
る各単語を、逐一、調べなければならなかった。
〈発明の目的〉 本発明は、上記の事情に鑑み、入力文に含まれる単語の
中に辞書に登銖されていない未登録語があった場合、直
ちに翻訳処理に移ることなく、ひとまず当該単語を他の
単語と区別表示する構成とし、操作者が、前記区別表示
によって入力文に含まれるいずれめ単語が未登録である
かを一目瞭然に把握できる様にすると共に、その後の翻
訳指示によって前記区別表示が、操作者が操作すること
なく自動的に取り除かれる構成を加え、操作者の便宜を
計ることを目的とする。
〈実施例〉 以下、本発明の構成を図面を参照しつつ説明する0 第1図は本発明の実施例に係る翻訳装置のブロック構成
図である。
図中、1は翻訳処理等を行う中央処理装置CPUであっ
て、当該CPUIにはメインメモリー2、表示装置CR
T3、キーボード(入力部)4並びに翻訳モジュール5
が接続されている。
前記メインメモリー2は前記CPUIでシステム処理を
行うためのプログラムがストアされてあり、複数個のバ
ッファーを備える。又、前記CRT3には翻訳処理に必
要な表示が成され、さらに、前記キーボー斗゛4で翻訳
処理に必要な入力が行なわれる。
そして、前記翻訳モジニール5は、翻訳プログラム等の
翻訳過程に必要な情報をストアするものであって、翻訳
時に参照される辞書1文法規則並びに木構造変換規則を
有するテーブル6を備える。
前記翻訳モジュール5の構造を第2図に示した。
同図において、5aは辞書引形態素解析部、5bは構文
解析部、5cは言語変換部(変換部)並びに5dはター
ゲット言語生成部(生成部)を表わしている。
辞書引きとは、辞書をサーチして、入力文の各単語の形
態属性及び文法属性等の情報を得ることでちる。
形態素解析とは、辞書引きによって得られた情報を用い
て、入力文を単語単位に分割し、単数/複数9入称(−
人称/二人称/三人称)1時制。
格(主体格/目的格/所有格)等の形態属性及び自動詞
/他動詞の区別等の文法属性を各単語に付与することで
ある。
構文解析とは、形態素解析によって得られた各単語の形
態属性及び文法属性を用いて、各単語の文法的に容認さ
れない修飾/被修飾関係を排除しながら、文の統語的構
造を決定することである。
変換とは、ターゲット言語の構造に変換することである
生成とは、ターゲット言語での語頭を整え、形態素合成
を行うことである。
具体的な文を取り上げ、前記翻訳モジュール5の動作を
説明する。
今、 Th1s  is  a book。
という英文を日本語文に翻訳する場合について記述する
前記原文は、前記キーボード4を介して、前記翻訳モジ
ュール5のバッファ(図示せず)に入力される。バッフ
1に入力された状態は第3図の通りである。
入力文が入力された後、操作者は前記キーボード4の翻
訳キー(図示せ−ず)を操作する。この翻訳(開始)指
示によって、前記翻訳モジュール5は前記テーブル6を
用いて翻訳処理を実行開始する0 翻訳処理の手順は、概ね、次の通りである。
即ち、前記辞書引き形態素解析部5aは、前記バッファ
に入力されているソース言語を受は取り、各単語の必要
な情報を引き出す。これにより、下記第1表に示す品詞
情報が得られる。
第  1 表 続いて、前記構文解析部5bにより、第4図に示す係り
受は関係が求まる。この際、前記テーブル6の文法規則
から下記第2表に示す解析が実行される。
この規則は、 (イ)文とは、主部と述部からできている。
(ロ)主部とは、名詞句からできている0ρう 述部と
は、動詞と名詞句からできている。
(=)名詞句とは、代名詞からできている。
(→ 名詞句とは、冠詞と名詞からできている。
ということを表わす。
そして、前記言語変換部5Cで、構文解析同様、木構造
変換の規則により解析が行なわれ、結果が、第5図の如
く求まる。その後、前記ターゲット言語生成部5dでは
、適切な助詞や助動詞が付され、ターゲット言語が出力
され、 これは本である。
と前記CRT3にて表示される0 本実施例では、翻訳処理に当たり、辞書引きの段階にお
いて、辞書をサーチ(検索)しても、入力文の各単語の
形態属性及び文法属性等の情報が得られないとき、即ち
、入力文に含まれるある単語が辞書に存在しなかったと
き、入力文中の当該単語を未登録語として、前記単語を
他の辞書に登録されている単語と区別して表示する。
このときは、翻訳処理を実行しない。
そして未登録語の単語を他の辞書に登録されである単語
と区別する区別表示が成された後、操作者が未登録語の
単語について所定の処理を行い、改めて翻訳指示を成し
たときに、即ち入力文中に未登録語がない状態で、翻訳
処理を実行開始する。
次に、未登録語の区別表示に関する処理動作を第6図の
フローチャートに基づき説明する。
操作者によって原文(入力文)が入力された後、オペレ
ータから翻訳指示があることを待ち、当該翻訳指示があ
ると、以下の処理に移行する(S+ステップ)0 最初、未知語表示の有無を判別する(S2ステツプ)0
未知語表示が有るということは、前段階の翻訳指示後の
処理に際して、辞書引きの結果、入力文中の単語の中に
未登録語が存在していることを意味する。又、未知語表
示が無ければ、前段階の翻訳指示後の処理に際して、辞
書引きによって入力文単語は、全て対応する情報が得ら
れたこととなる。
未知語表示があったときは、当該未知語表示を消去する
(S3ステツプ)。
そして、入力文に含まれる各単語の順序を示す単語番号
(単語No)をCPUIにセットしくS4ステツプ、セ
ット後、入力文に含まれる第1番目の単語の有無を判定
しくS5ステツプ)、第1番目の単語が存在した場合、
辞書引き処理(S6ステツプ)へ進む。
辞書引きの結果、辞書引きに成功すれば(S7ステップ
)、引き続いて入力文に含まれる第2番目の単語の処理
を行うべく、単語番号を1だけ増やしくS9 ステップ
)、前記S、ステップに復帰する。
しかし、辞書引きの結果、辞書引きに失敗した場合(S
7ステップ)は、その時点の単語番号を未登録語リスト
に加え(sgステップ)、その後、前記S、ステップに
移り、単語番号のインクリメント処理を行う。轟核S、
ステップの処理が完了すると、前記S5ステツプに復帰
する。
以下、同様な処理を入力文に含まれる全単語について繰
り遮光す。
処理が進み全単語につき辞書引き処理を完了すると、前
記未登録語リストを調べ、未登録語の有無を判定する(
St。ステップ)。
前記s+oステップにおいて、未登録語リストが空の場
合、即ち未登録語が入力文中に存在しない場合、−文の
翻訳処理を経て(sl、ステップ)、翻訳結果の表示が
成される(s、2ステツプ)0しかし、前記S、。ステ
ップで未登録語リスト中に未登録単語番号が格納されて
いれば、未登録語表示を行う(S13ステツプ)。
前記813ステツプである単語が未登録語であることを
表示されたときは、入力文の翻訳処理は実行されない。
従って、操作者は、未知語表示によって辞書に登録され
ていない未登録語であると判明した単語につき所定の処
理を施し、当該単語を未登録単語ではない状態にして、
再度前記S1ステツプで翻訳指示を行う。
未知語表示の実際について、第7図に基づき説明を行う
同図(a)の通り、原文 Th1s  is a  boook・が入力されたと
する。
前記原文(入力文)中の各単語の単語番号は下記第3表
の通りとなる。
第3表 そして、単語番号4の単語rboookJが未登録単語
であれば、前記S8ステツプにおいて、未登録語リスト
に単語番号4が格納され、その結果、前記SI3ステッ
プの処理により、同図(b)の如く表示が成される。
図示する様に、単語番号4の単語rboookJに未登
録語を示すマーク「*」が付加されており、操作者は、
未知語表示があることを把握する。
未知語表示が有った場合、操作者は必要な処置を取る。
ここで、必要な処置とは、入力文の修正又は単語の追加
登録を言う。
前記原文の場合、単語rboookJは単語rbook
Jのミススペルであると判定されるから、操作者は、前
記キーボード4を操作して、単語rboookJを単語
rbookJに修正する。
修正後の表示は、同図(c)の様になっており、いまだ
マーク「*」が付加されているが、再翻訳の指示に基づ
き、前記S3ステツプの処理が実行され、当該マーク「
*」は自動的に消去され、以後、翻訳処理に進んでいく
なお、マーク消去の方法は、・前記CRT3の表示メモ
リのマーク記憶領域をクリアすることにより成される。
ここで、未登録語を区別表示するマークとして記号「*
」を使用したが、これに限定することなく、入力文に出
現する可能性の少ない記号等を選択すれば良い。
もちろん、マークを付加することの他に、第8図の如く
、該当する単語全体にアンダーラインを引いたり、或い
は、前記CRT3が白黒反転表示やハイライト表示若し
くはカラー表示機能を有しているときは、これらの機能
を利用して、区別表示を成すことも考えられる。
さらに、マークを付加する場合は入力文中に出現する同
じ記号付きの単語と区別するために、第9図の通り、入
力文の頭から数えて何番目の単語が未登録語であるかを
数字で示すことを並用しても良い。
第9図の区別表示を行う際、入力文に含まれる複数個の
単語が未登録語であったときは、気、〃(コンマ)で単
語番号を区切って、複数の単語番号を一括表示する。
前述した単語の追加登録に関し、第10図のフローチャ
ートを用い説明する。
操作者より登録指示があると(rzステップ)、登録す
べき単語入力の指示を行う(nzステップ)0前記入力
指示に基づき、操作者は登録すべき単語を前記キーボー
ド4から入力する(n3ステツプ)0 続いて入力された単語の品詞入力の指示を行う(n4ス
テツプ)。
前記入力指示に基づき、操作者は入力した単語の品詞を
前記キーボード4から入力する(nsステップ)。
さらに、入力された単語の訳語入力の指示を行う(na
ミステップ0 前記入力指示に基づき、操作者は入力した単語の訳語を
前記キーボード4から入力する(nyステップ)0 以上の処理を経た後、入力された単語及びその品詞、訳
語を前記テーブル6の辞書に登録する(nsステップ)
前記n4ステツプにおいては、前記CRT3上に名詞や
形容詞等の品詞を複数個列挙表示し、次のn、ステップ
で、操作者がカーソルによって特定の品詞を選択可能と
する。
具体的な入力指示を促すCRT3の画面表示を第11図
に示し、さらに、前記入力指示に基づき入力した後のC
RT3の画面表示を第12図に示した。
く効 果〉 以上の様に本発明によれば、入力文に含まれる単語の翻
訳語を出力する辞書を備え、前記辞書から出力された翻
訳語を用いて前記入力文の翻訳処理を行う機械翻訳装置
にあって、入力文に含まれる単語の中に前記辞書に登録
されていない未登録語があった場合、前記翻訳処理を実
行することなく当該単語を他の単語と区別表示する表示
手段と、前記表示手段で区別表示が成された後の翻訳指
示に基づき、前記区別表示を消去すると共に前記翻訳処
理を実行する実行手段を具備するから、下記効果を得る
ら)未登録語が入力文に含まれるどの単語であるか直接
示されるので、操作者は即座に当該単語の処理について
対策を立てられ、能率的である。
伽)未登録語について処置を成し、区別表示が必要なく
なっているにも拘わらず区別表示が依然として持続され
ていると入力文が読みづらいが、哩訳を指示すると前記
区別表示が自動的に消去され、操作者が自らキー操作等
で区別表示の消去操作を行う手間を要せず、便利である
【図面の簡単な説明】
第1図は本発明に係る機械翻訳装置のブロック構成図、
第2図は前記機械翻訳装置の翻訳モジュール5の構造図
、第3図は入力文がバッファに格納された状態を示す図
、第4図及び第5図は前記翻訳モジュールの翻訳処理過
程を説明するための図、第6図は前記機械翻訳装置の未
登録単語の区別表示の処理フローチャート、第7図(a
)乃至(d)は前記未登録単語の区別表示の処理におけ
る表示状態を示す図、第8図及び第9図は区別表示の表
示形態を示す図、第10図は単語登録の処理フローチャ
ート、第11図及び第12図は前記単語登録の処理にお
ける表示状態を示す図である。 1・・・CPU、3・・・CRT、5・・・翻訳モジュ
ール。 6・・・テーブル。 代職人 弁理士杉 山 毅 至(他1名)第2 図 13図 Th1j      Ls    Q   book又 主部     走部 第 7図 第δ 図 $q 図 第1O図 第11図 第12121

Claims (1)

  1. 【特許請求の範囲】 1、入力文に含まれる単語の翻訳語を出力する辞書を備
    え、前記辞書から出力された翻訳語を用いて前記入力文
    の翻訳処理を行う機械翻訳装置において、 入力文に含まれる単語の中に前記辞書に登録されていな
    い未登録語があった場合、前記翻訳処理を実行すること
    なく当該単語を他の単語と区別表示する表示手段と、 前記表示手段で区別表示が成された後の翻訳指示に基づ
    き、前記区別表示を消去すると共に前記翻訳処理を実行
    する実行手段と を具備することを特徴とする機械翻訳装置。
JP61117901A 1986-05-20 1986-05-20 機械翻訳装置 Pending JPS62272359A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61117901A JPS62272359A (ja) 1986-05-20 1986-05-20 機械翻訳装置
GB8711953A GB2193355B (en) 1986-05-20 1987-05-20 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61117901A JPS62272359A (ja) 1986-05-20 1986-05-20 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPS62272359A true JPS62272359A (ja) 1987-11-26

Family

ID=14723006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61117901A Pending JPS62272359A (ja) 1986-05-20 1986-05-20 機械翻訳装置

Country Status (2)

Country Link
JP (1) JPS62272359A (ja)
GB (1) GB2193355B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01189766A (ja) * 1988-01-25 1989-07-28 Nec Corp 翻訳システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03222065A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190270A (ja) * 1984-10-09 1986-05-08 Sharp Corp 辞書機能を用いた翻訳方式
JPS62203266A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4381551A (en) * 1979-09-13 1983-04-26 Sharp Kabushiki Kaisha Electronic translator
JPS5727367A (en) * 1980-07-23 1982-02-13 Sharp Corp Electronic translator
JPS5731083A (en) * 1980-07-31 1982-02-19 Sharp Corp Electronic interpreter
EP0175357B1 (en) * 1984-09-18 1992-04-29 Sharp Kabushiki Kaisha Translation system
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190270A (ja) * 1984-10-09 1986-05-08 Sharp Corp 辞書機能を用いた翻訳方式
JPS62203266A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01189766A (ja) * 1988-01-25 1989-07-28 Nec Corp 翻訳システム

Also Published As

Publication number Publication date
GB8711953D0 (en) 1987-06-24
GB2193355A (en) 1988-02-03
GB2193355B (en) 1990-07-11

Similar Documents

Publication Publication Date Title
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
JPH06195373A (ja) 機械翻訳装置
JPH07295986A (ja) イディオム処理機能を持つ機械翻訳装置
US4953088A (en) Sentence translator with processing stage indicator
GB2241094A (en) Translation machine
JPH0721183A (ja) 機械翻訳装置
US4860206A (en) Translation system allowing user designation of postpositional words
JPH0261763A (ja) 機械翻訳装置
JPS62272359A (ja) 機械翻訳装置
JPS6180362A (ja) 翻訳装置
JPS6190269A (ja) 翻訳方式
JPS59140545A (ja) 仮名漢字変換装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPS63136264A (ja) 機械翻訳装置
JPH06243163A (ja) 文書解析装置
JPH1139347A (ja) テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体
JPH03218566A (ja) 機械翻訳装置
JPS62272358A (ja) 翻訳装置における翻訳中断時の表示方式
JPH0452868A (ja) 機械翻訳装置
JPH0240767A (ja) 文章処理装置
JPH0264859A (ja) 文章処理装置
JPH04213164A (ja) 辞書引き方式
JP2002041512A (ja) 自然言語処理装置及び方法