JP3161942B2 - 訳振り機械翻訳装置 - Google Patents

訳振り機械翻訳装置

Info

Publication number
JP3161942B2
JP3161942B2 JP14791795A JP14791795A JP3161942B2 JP 3161942 B2 JP3161942 B2 JP 3161942B2 JP 14791795 A JP14791795 A JP 14791795A JP 14791795 A JP14791795 A JP 14791795A JP 3161942 B2 JP3161942 B2 JP 3161942B2
Authority
JP
Japan
Prior art keywords
translation
word
level
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14791795A
Other languages
English (en)
Other versions
JPH096787A (ja
Inventor
稔幸 奥西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP14791795A priority Critical patent/JP3161942B2/ja
Priority to US08/664,457 priority patent/US5873055A/en
Priority to EP96109596A priority patent/EP0749075A3/en
Publication of JPH096787A publication Critical patent/JPH096787A/ja
Application granted granted Critical
Publication of JP3161942B2 publication Critical patent/JP3161942B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原文における各言語の
近傍に訳語を配置して出力する訳振り機械翻訳装置に関
する。
【0002】
【従来の技術】従来、ある言語で書かれた文章を別の言
語に翻訳する際、入力文が複数行にわたるような長い文
では訳文と入力文の対応関係をとるのが難しい場合があ
る。特に、英語と日本語のように文の構造が大きく異な
る場合には「入力文の1行目の語句の訳が訳文では3行
目に存在する」という現象はしばしば見受けられる。
【0003】現在の機械翻訳システムは訳文の後編集操
作を前提としている以上、入力文と翻訳結果をつきあわ
せて見比べる過程で語句の対応関係を一目で見つけられ
ないことは、翻訳精度がもたらす以上の負担を利用者に
強いることになる。
【0004】外国語の文の速読や粗読をする場合、ま
た、英語がある程度理解できる人や入力文がある程度簡
単な構造をしている時には、上記のような問題を抱える
1文単位の訳文が生成されるより、自分が知らない難し
い英単語にだけ訳語が振られていれば、後は自分で英文
を読んで文を理解する方が便利といったことがある。
【0005】このような需要に応える従来技術として、
特開平6−243162号公報「翻訳支援装置」および
特開平6−325081号公報「機械翻訳装置」があ
る。
【0006】まず、この特開平6−243162号公報
は、原文における各言語の近傍に訳語を配置して出力
し、原語と訳語の関係を明確にする翻訳支援装置に関す
るものである。この翻訳支援装置は、図12に示すよう
に、キー入力部21から入力されて文章メモリ22に格
納される和文の文章データを漢字に変換するための辞書
データを格納するとともに、英文の文書データを翻訳す
るための訳語データを格納する辞書メモリ23や、翻訳
支援処理に際して文書メモリ22から読み出される原語
のうち対訳が不要である原語(英単語)を記憶する訳語
不要単語メモリ24や文書メモリ22から読み出した訳
語を格納する訳語レジスタ25bなどから形成されるレ
ジスタ25などにより構成されている。
【0007】この翻訳支援装置26の動作について以下
に説明する。
【0008】例えば、”I will purchase the restaura
nt from my uncle." という英文がキー入力部21から
入力され、文書メモリ22に格納されているとする。こ
のキー操作により翻訳が指示されると、CPU27は、
文書メモリ22中の文字データが原語レジスタ25aに
格納され、原語の桁数を数えて原語桁数レジスタ25c
に格納するように制御し、その後、原語レジスタ25a
に格納した原語データが訳語不要単語メモリ24に格納
されているか否かをサーチし、その原語に訳語を付与す
ることが必要か否かを判別する。例えば、"I","will","
the","from","my"が訳語不要単語メモリ24に格納され
ていたとすると、残りの"purchase","restaurant","unc
le"に対して訳語を付加する必要があるため、対応する
訳語を辞書メモリ23からサーチし、訳語がある時は、
訳語を辞書メモリ23から読み出して訳語レジスタ25
bに格納するとともに、訳語の桁数を計算して訳語桁数
レジスタ25dに記憶する。その後、原語、訳語の桁数
に応じて表示処理が行われ、表示メモリ28を介して表
示部29で表示される。このとき、次に示すように、単
語単位に区切って見やすく訳語が付与される。
【0009】 次に、特開平6−325081号公報「機械翻訳装置」
について説明する。
【0010】この特開平6−325081号公報は、品
詞や訳語などの目的原語の情報だけを選択して提示し、
対象原語の読解を容易にする機械翻訳装置である。この
機械翻訳装置は、図13に示すように、第1原語文を入
力するための入力手段31と、解析辞書32を利用して
形態素解析を行う形態素解析手段33と、第1言語を品
詞の連鎖確立表34を利用して第1原語文の各単語に対
応する最適品詞を求める品詞推定手段35と、第1言語
と第2言語の情報とを対応させた出力を作成する出力形
態決定手段36と、出力装置に出力する出力手段37と
により構成される。
【0011】この機械翻訳装置38の動作について以下
に説明する。
【0012】例えば、"I will book the restaurant fo
r my uncle."という英文が入力手段31により入力され
たとすると、形態素解析により形態素に分割され、各形
態素毎に辞書引きされる。その結果、英語などの多品詞
語では、下記に示すように形態素毎に複数の候補がセッ
トされる。
【0013】 単語 品詞候補 I 代名詞 will 助動詞/名詞 book 名詞/動詞 the 冠詞 restaurant 名詞 for 前置詞/接続詞 my 代名詞/感嘆詞 uncle 名詞 上記例文では、"will","book","for","my"には複数の品
詞候補があって曖昧性がある。そこで、品詞推定手段3
5では品詞の連接確率を推定し、その連接確率に基づい
て品詞列の出現確率を算出し、確率が最大である品詞列
を選択する。この従来例では、品詞推定手段35として
連接確率を直前2品詞までに制限するtrigramモデルを
利用し、さらに、単語内相対品詞出現確率も加味する。
今、この品詞推定手段35により、入力文の品詞は下記
に示すように推定される。特に、直前の品詞が「助動
詞」であるなどのことから、"book"の品詞は「動詞」と
推定できる。
【0014】 単語 品詞候補 I 代名詞 will [助動詞]/名詞 book 名詞/[動詞] the 冠詞 restaurant 名詞 for [前置詞]/接続詞 my [代名詞]/感嘆詞 uncle 名詞 []内が推定した品詞 この後は、その品詞に対応した第2言語の情報を辞書か
ら得て、出力形態決定手段36により第1言語の単語の
位置に対応させて第2言語の情報を付与して行けばよ
い。このとき、第2言語情報の内容のうち、よく知られ
た内容を頻繁に出力するのを抑制するために、辞書中に
出力抑制欄を設けてマークしておく。また、複数の用法
がある見出しに対しては用法毎に優先度を数値で記入し
ておくと一部の用法の出力だけを抑制することができ
る。例えば、例文の"book"は「名詞(本)」のときには
抑制し、「動詞(予約する)」のときは出力する。以上
の処理により、例文に対する出力結果は以下のようにな
る。
【0015】
【0016】
【発明が解決しようとする課題】しかしながら、上記従
来の翻訳支援装置26や機械翻訳装置38では、以下の
(a),(b)に示すような問題があった。
【0017】(a)訳語の精度が悪い。
【0018】特開平6−243162号公報の翻訳支援
装置26では、文の前後の単語に関係なく、毎回同じ訳
語(一番先に格納された訳や最も優先される訳)を付与
する。例えば、単語"book"に対しては品詞が「名詞」訳
が「本」という解釈が最も一般的なので、次のような上
述した例文でも「本」という誤った訳語を付与してしま
う。
【0019】 これに対して、特開平6−325081号公報の機械翻
訳装置38では、前述したように直前2単語との連接品
詞をチェックするため、上記した入力文例の"book"には
「動詞:予約する」という正しい訳を与えることができ
る。
【0020】しかしながら、特開平6−325081号
公報の機械翻訳装置38において、例えば構文解析を使
ったとしても、品詞しか特定できないので、同じ品詞の
訳語の中で意味的な制限で決まる訳語を正しく選択する
ことはできない。例えば、"take"は以下のように、種々
の意味(訳語)を持つ英単語であるが、 take(動詞) 手に取る、奪う、連れていく、乗る、食
べる、購読する、要する、受ける、取る、・・・ 品詞を「動詞」と推定するだけでは、その中のどの訳語
を選択していいかわからない。以下に示す入力文におい
ても「取る」という最も一般的な訳語を振ってしまう
が、実際には、目的語が「人」を意味する場合には「連
れていく」という訳語が相応している。
【0021】 このように、誤った訳語が振られたこれらの2つの入力
文を読んだ利用者は誤った理解をしてしまう。もちろ
ん、特開平6−243162号公報と特開平6−325
081号公報のどちらにおいても複数の訳語候補を出力
することはできるが、利用者自身に訳語を選択させると
いう負担を強いることになる。
【0022】(b)本当に必要な単語だけに訳語が振ら
れない。
【0023】利用者にとって自分の「知らない」単語に
だけ訳語が振られていればそれで十分である。逆に、
「知っている」単語に訳語が振られていても邪魔なこと
が多い。特開平6−243162号公報と特開平6−3
25081号公報では「訳語不要単語」、「出力抑制不
要フィールドの設定」「訳語に対する優先度」を予め
設けておき、訳語を付与する単語を制限している。これ
らの「訳語不要単語」はシステムに固定であるのに対
し、ある単語を「知っている」とか「知らない」という
のは利用者によって大きく異なる。つまり、英語の「初
級者」にとって知らない単語(訳語が欲しい単語)であ
っても「上級者」にとっては既知の単語であることは十
分考えられるため、特開平6−243162号公報と特
開平6−325081号公報のように、どんな利用者が
使おうが抑制される訳語が決っているシステムでは本当
に役立つ訳語付与が期待できない。
【0024】このように、(a)訳語の精度が悪かった
り、(b)訳振りに不必要な単語が多くあると紛らわし
く、外国語の文の速読や粗読を効率よく容易に行うこと
ができないという問題があった。
【0025】本発明は、上記従来の問題を解決するもの
で、外国語の入力文の速読や粗読を効率よく容易に行う
ことができる訳振り機械翻訳装置を提供することを目的
とする。
【0026】
【課題を解決するための手段】本発明の訳振り機械翻訳
装置は、単語に対する品詞などの文法情報および訳語を
格納するとともに、該訳語毎に訳振りレベルが付与され
た単語辞書と、入力文を単語列に分割し、前記単語辞書
から該単語列の各単語に対する品詞などの文法情報およ
び訳語を得るとともに、該各単語の時制・人称・数を解
析する辞書引き・形態素解析手段と、前記辞書引き・形
態素解析手段で得られた文法情報に従って該単語列の単
語間の係り受け関係などの入力文章構造を決定する構文
解析手段と、前記構文解析手段で決定した入力文章構造
を翻訳文に対する文章構造に変換し、意味的な整合性を
検査して該単語に対する該訳語を選択する構文変換手段
と、前記構文変換手段で得られた訳語の並び順を決定
し、活用変化を調整して翻訳文を生成する翻訳文生成手
段とを備えた訳振り機械翻訳装置であって、利用者が、
該各単語の難易度、頻出度または重要度などのレベル情
報に基づいて設定された訳振りレベルを指定可能な訳振
りレベル設定手段と、前記訳振りレベル設定手段で指定
された訳振りレベルと前記単語辞書における訳振りレベ
ルとの関係により訳語を付与するか否かを判定する翻訳
出力判定手段と、前記翻訳文生成手段までの翻訳処理を
行なった後に、前記翻訳出力判定手段で判定した訳語に
対して、入力文の各単語とその訳語との対応をとって該
訳語を該入力文とともに見易い形式に整えて出力する原
語訳語対応出力手段と、をさらに備え、前記翻訳出力判
定手段は、前記訳振りレベル設定手段で指定された訳振
りレベルと前記単語辞書における訳振りレベルとの関係
により訳語を付与するか否かを判定するとともに、前記
解析処理中に得られる文の構文構造、前記変換処理中に
得られる訳語の文字種構成、前記変換処理中に得られる
訳語が分野指定されたものであるか否か、および、同一
訳語の付与位置間の距離のうち、少なくともいずれかの
情報を言語情報とし、該言語情報に基づいて訳語を付与
するか否かを判定することを特徴とするものであり、そ
のことにより上記目的が達成される。
【0027】さらに、好ましくは、本発明の訳振り機械
翻訳装置は、同一訳語の付与位置間の距離は、直前に付
与した同一訳語間の距離であることを特徴とするもので
あり、そのことにより上記目的が達成される。
【0028】また、本発明の訳振り機械翻訳装置は、単
語に対する品詞などの文法情報および訳語を格納すると
ともに、該訳語毎に訳振りレベルが付与された単語辞書
と、入力文を単語列に分割し、前記単語辞書から該単語
列の各単語に対する品詞などの文法情報および訳語を得
るとともに、該各単語の時制・人称・数を解析する辞書
引き・形態素解析手段と、前記辞書引き・形態素解析手
段で得られた文法情報に従って該単語列の単語間の係り
受け関係などの入力文章構造を決定する構文解析手段
と、前記構文解析手段で決定した入力文章構造を翻訳文
に対する文章構造に変換し、意味的な整合性を検査して
該単語に対する該訳語を選択する構文変換手段と、前記
構文変換手段で得られた訳語の並び順を決定し、活用変
化を調整して翻訳文を生成する翻訳文生成手段とを備え
た訳振り機械翻訳装置であって、利用者が、該各単語の
難易度、頻出度または重要度などのレベル情報に基づい
て設定された訳振りレベルを指定可能な訳振りレベル設
定手段と、前記訳振りレベル設定手段で指定された訳振
りレベルと前記単語辞書における訳振りレベルとの関係
により訳語を付与するか否かを判定する翻訳出力判定手
段と、前記翻訳文生成手段までの翻訳処理を行なった後
に、前記翻訳出力判定手段で判定した訳語に対して、入
力文の各単語とその訳語との対応をとって該訳語を該入
力文とともに見易い形式に整えて出力する原語訳語対応
出力手段と、をさらに備え、前記翻訳出力判定手段は、
前記訳振りレベル設定手段で指定された訳振りレベルと
前記単語辞書における訳振りレベルとの関係により訳語
を付与するか否かを判定するとともに、前記構文解析処
理中に得られる文の構文構造、前記変換処理中に得られ
る訳語の文字種構成、前記変換処理中に得られる訳語が
分野指定されたものであるか否か、および、同一訳語の
付与位置間の距離のうち、少なくともいずれかの情報を
言語情報とし、該言語情報に基づいて訳語を付与するか
否かを判定し、さらに前記構文変換処理中に得られる同
一訳語の付与回数が、文書の所定範囲内で所定基準を越
えた場合、それ以降は該同一訳語を付与しないことを特
徴とするものであり、そのことにより上記目的が達成さ
れる
【0029】さらに、好ましくは、本発明の訳振り機械
翻訳装置は、前記単語辞書中に付与する訳振りレベル
は、通常の辞書に付与された重要度マークに関する第1
情報と、前記入力文の各単語を構成する単語文字数に関
する第2情報と、品詞の種類に関する第3情報と、基本
辞書、ユーザ辞書または専門辞書など辞書の種類に関す
る第4情報、のうち少なくともいずれかの情報から構成
され、前記第1情報に基づいて訳振りレベルを設定する
際は、複数の辞書のうち、幾つの辞書に重要度マークが
付与されているか、また該重要度マークがどの程度の重
要度マークかに基づいて設定し、前記第2情報に基づい
て訳振りレベルを設定する際は、該単語文字数が一定の
文字数を越えるか否か、または該各単語の接頭辞および
接尾辞などの該各単語の構成により該各単語の意味が推
測可能か否かに基づいて設定し、前記第3情報に基づい
て訳振りレベルを設定する際は、特定品詞に対してレベ
ルを低く設定し、固有名詞および助動詞は訳振り対象か
ら除き、前記第3情報に基づいて訳振りレベルを設定す
る際は、基本辞書に登録されている単語は単語レベルを
低くし、ユーザ辞書または専門辞書などに登録されてい
る単語は単語レベルを高くする、ことで前記単語辞書中
に付与する訳振りレベルを設定することを特徴とするも
のであり、そのことにより上記目的が達成される
【0030】
【0031】
【0032】
【0033】
【0034】
【0035】
【作用】本発明においては、入力された文を単語の形態
素列に分割し、その単語毎に単語辞書をひくとともに、
その単語の時制・人称・数などを解析する。この形態素
列における単語間の係り受けなど入力文章構造を決定
し、これを翻訳文に対する文章構造に変換し、意味的な
整合性を検査して単語に対する訳語を選択する。さら
に、この訳語の並びを決定し、活用変化を調整して翻訳
文を生成し、この翻訳文と入力文を見易い形式に整え、
この後、入力文の各単語と訳語との対応をとって出力す
る。このように、形態素解析、構文解析、構文変換さら
に翻訳文生成の翻訳処理を行った後に、入力文の各単語
と訳語との対応をとって訳振りをしているので、より精
度の高い訳語を出力することが可能となり、利用者は入
力文を正しく理解することができて、外国語の入力文の
速読や粗読を効率よく容易に行うことが可能となる。
【0036】また、各単語の難易度、頻出度および重要
度などのレベル情報に基づいて設定された訳振りレベル
設定手段で設定された訳振りレベルと、各単語の難易
度、頻出度および重要度などのレベル情報に基づいて設
定された単語辞書における訳振りレベルとの関係により
訳語を付与するか否かが判定されるので、利用者の語学
レベルに応じて訳語の不要な単語には訳語が付与され
ず、利用者の望む最低限必要な単語に、より精度の高い
適切な訳語を付与することが可能となって、利用者は外
国語の入力文の速読や粗読を効率良く容易に行うことが
可能となる。
【0037】この場合、単語辞書中に付与する訳振りレ
ベルを、通常の辞書に付与された重要度マークのうち、
重要度マークがどの程度の重要度マークか、どの程度多
くの該辞書に付与されているかに関する第1情報と、入
力文の各単語を構成する単語文字数に関する第2情報
と、品詞の種類に関する第3情報と、基本辞書、ユーザ
辞書および専門辞書など単語の辞書の種類に関する第4
情報とのうち、少なくともいずれかの情報などに基づい
て設定するが、第1〜第4の情報のうち情報が多い程、
必要な単語に正確な訳振りをし、かつ不要な単語に訳振
りしないという、よりきめ細かい正確な訳振りがなされ
る。
【0038】この単語文字数に基づいて行う訳振りレベ
ルの設定において、単語文字数が一定の文字数を越える
かどうかに基づいて設定するだけではなく、各単語の接
頭辞および接尾辞などの各単語の構成により各単語の意
味が推測可能か否かに基づいても設定するようにすれ
ば、さらによりきめ細かいすっきりとした訳振りがなさ
れる。
【0039】また、品詞の種類に基づいて行う訳振りレ
ベルの設定において、特定品詞は訳振りレベルを低く設
定し、固有名詞および助動詞は訳振り対象から除くよう
にすれば、訳振り状態がすっきりして外国語の入力文の
速読や粗読をより効率よく容易に行うことが可能とな
る。
【0040】さらに、訳語出力判定処理は、構文解析処
理、構文変換処理および翻訳文生成処理のうち少なくと
もいずれかの処理中に得られる言語情報に基づいても訳
語を付与するか否かを判定することが可能であり、より
きめ細かい正確な訳振りがなされる。
【0041】この言語情報とは、構文解析処理中に得ら
れる文の構文構造、構文変換処理中に得られる訳語の文
字種構成、構文変換処理中に得られる訳語が分野指定さ
れたものであるか否か、および、同一訳語の付与位置間
の距離のうち少なくともいずれかの情報などであるが、
これら情報が多い程、必要な単語に正確な訳振りをし、
かつ不要な単語に訳振りしないという、よりきめ細かい
正確な訳振りがなされる。
【0042】また、直前に付与した同一訳語間の距離に
よって訳語を付与するか否かを判定したり、また、構文
変換処理中に得られる同一訳語の付与回数が、文書の所
定範囲内で所定基準を越えた場合、それ以降は同一訳語
を付与しないようにすれば、一度訳語が付与されて人の
記憶に留まっているものや視野の範囲内で容易に参照可
能な訳語については付与する必要がなく、訳振り状態が
すっきりして外国語の入力文の速読や粗読をより効率よ
く容易に行うことが可能となる。
【0043】
【実施例】以下、本発明の実施例について説明する。
【0044】図1は本発明の一実施例における訳振り機
械翻訳装置の基本構成を示すブロック図である。
【0045】図1において、文字列および記号を入力す
る入力手段1は翻訳CPU2を介して出力手段3に接続
され、訳振りに必要な単語に対応した訳語を入力文とと
もに出力手段3に出力し、出力手段3でそれを表示した
り印刷したりして出力する。また、この翻訳CPU2は
記憶手段4と接続されており、翻訳CPU2による翻訳
処理に必要な辞書データおよび処理結果を記憶手段4に
記憶している。
【0046】この翻訳CPU2の構成について説明する
と、上記入力手段1が接続される訳振りレベル設定手段
5はユーザが入力手段1を介して自らの語学レベルに応
じた訳振りレベルを指定する。また、入力手段1が接続
される分野指定手段6はユーザが入力手段1を介して翻
訳専門分野を指定する。これらの訳振りレベル設定手段
5および分野指定手段6が接続される辞書引き・形態素
解析手段7は、単語辞書を引き、入力された文章を各形
態素列(単語列)に分割し、各単語の品詞などの文法情
報およびその訳語を得るとともに、各単語の時制・人称
・数などを解析する。この辞書引き・形態素解析手段7
が接続される構文解析手段8は、この文法情報に従っ
て、入力文の各形態素列における単語間の係り受けなど
の文構造をいわゆる構造解析木によって決定する。この
構文解析手段8が接続される構文変換手段9は、入力文
に対する構文解折木の構造を、翻訳文に対する構文解析
木に変換し、さらに意味的な整合性を検査して単語に対
する訳語を選択する。この構文変換手段9が接続される
翻訳文生成手段10は、構文変換手段9で得られた訳語
の並び順を決定し、活用変化を調整して翻訳文を生成す
る。この翻訳文生成手段10が接続される原語訳語対応
記憶手段11は、形態素解析と、構文解析と、構文変換
と、翻訳文生成の翻訳処理を行なった後に、入力文の各
単語と訳語との対応をとってその位置関係を記憶する。
また、翻訳文生成手段10が接続される翻訳出力判定手
段12は、訳振りレベル設定手段5で指定した訳振りレ
ベルと単語辞書における原語の訳振りレベルとの関係に
より訳語を付与するか否かを判定する。この翻訳出力判
定手段12が接続される訳語出力位置回数記憶手段13
は訳語の出力位置回数を記憶する。また、翻訳出力判定
手段12が接続される出力形式整形手段(原語訳語対応
出力手段)14は出力手段3に接続され、出力手段3に
原文と翻訳文を見易い形式に整えて出力する。本実施例
の場合、出力形式整形手段14は原語訳語対応出力手段
としても機能し、翻訳文生成手段10までの翻訳処理を
行なった後に、翻訳出力判定手段12で判定した訳語に
対して、入力文の各単語とその訳語との対応をとって訳
語を入力文とともに出力する。
【0047】また、この記憶手段4の構成について説明
すると、記憶手段4は、単語に対する品詞などの文法情
報および訳語を格納するとともに、各単語の見出し毎に
レベル情報が付与されている単語辞書4aと、利用者が
指定した訳振りレベルを記憶する訳振りレベルバッファ
4bと、原文の単語番号と原語の対応をとる原語バッフ
ァ4cと、翻訳文の単語番号と訳語の対応をとる訳語バ
ッファ4dと、入力文中の各原語に対応する訳語が、通
常の翻訳文の文頭から何語目であるかの情報を格納する
原語訳語対応情報バッファ4eと、出力形式整形手段1
4により整えられた原文と訳文の出力形式を格納する出
力形式バッファ4fとから構成されている。
【0048】次に、この訳振り機械翻訳装置の具体的ハ
ード構成を図2を用いて説明する。この訳振り機械翻訳
装置は、各部を制御するメインCPU15と、記憶手段
4の構成要素としてのメインメモリ4Aおよび辞書メモ
リ4aと、出力手段3としてのCRT(陰極線管)また
はLCD(液晶ディスプレイ)からなる表示手段3A
と、入力手段1としてのキーボード1Aと、翻訳を行う
翻訳モジュール16と、これら各部を接続するバスライ
ン17とから構成されている。
【0049】この翻訳モジュール16は、図3に示すよ
うに、バスライン17を介して入力されるソース言語
を、所定の翻訳プログラムに従って翻訳してターゲット
言語としてバスライン17に出力する翻訳CPU2と、
この翻訳CPU2で実行される翻訳プログラムを格納す
る翻訳プログラムメモリ16Aと、入力されたソース言
語の原文を各単語毎に格納するバッファAと、辞書メモ
リ4a格納されている辞書データを参照して得た各単
語の品詞、訳語などの情報を格納するバッファBと、ソ
ース言語の構造解析木に関する情報を格納するバッファ
Cと、構造解析木から変換されたターゲット言語の構造
解析木を格納するバッファDと、ターゲット言語の構造
解析木に適切な付属語、例えば日本語ならば助詞や助動
詞などを補充して、ターゲット言語の形として整えられ
た文章を格納するバッファEとを具備している。
【0050】ここで、機械翻訳について説明する。
【0051】図4に示すような、様々な解析レベルがあ
り、図4の左上においてソース言語がキーボード1Aを
介して入力されると、レベルL1の辞書引き、レベルL
2の形態素解析、レベルL3の構文解析、・・・と、解
析が進められる。機械翻訳は、どのレベルの解析処理ま
で行うかによって、大きく次の2つに分けられる。その
1つは、レベルL6のソース言語およびターゲット言語
のどちらにも依存しない概念である中間言語まで解析
し、そこから、レベルL7の文脈生成、レベルL8の意
味生成、レベルL9の構文生成、レベルL10の形態素
生成と生成を進めて、ターゲット言語を生成していくピ
ボット方式である。もう1つは、上述のレベルL2の形
態素解析、レベルL3の構文解析、レベルL4の意味解
析およびレベルL5の文脈解析のいずれかまで解析を行
ってソース言語の内部構造を得、次に、この得られたソ
ース言語の内部構造と同レベルのターゲット言語の内部
構造に変換した後、ターゲット言語を生成するトランス
ファー方式である。
【0052】上記構成によって、以下、図1〜図9を用
いて本発明の翻訳動作を説明する。ここでは、下記の英
文を日本語に翻訳して、より精度の高い訳語を出力する
場合を例にとって説明する。
【0053】I will take her child to the zoo. まず、キーボード1Aなどの入力手段1で読み込まれた
原文は、図5に示すようにバッファAに格納される。こ
のバッファAは辞書引きのために原文は1単語毎(英語
の場合は空白毎)に分離され、さらに、語尾処理などの
形態素処理のために各単語も1文字づつ分離して格納さ
れる。図5では、一行が1単語に相当している。翻訳プ
ログラムメモリ16Aに記憶された翻訳プログラムに基
づく翻訳CPU2の制御にて、辞書引き・形態素解析手
段5における処理において、バッファAに格納された原
文に従って辞書メモリ4aの辞書を用いて各単語の訳語
や、その単語に対する品詞などの文法情報などが得ら
れ、バッファBに格納される。例えば、その各情報の一
部である品詞情報は、図6に示すように格納される。こ
こで、“will”“her”“to”は多品詞語であるが、翻
訳プログラムのうちの構文解析手段8における処理にお
いて一意に決定される。このようにして、辞書引き・形
態素解析手段7による辞書引き、形態素解析において、
辞書メモリ4aの辞書が引かれ、入力された文章が各形
態素列(単語列)に分割され、この各単語に対する品詞
などの文法情報および訳語が得られ、さらに時制・人称
・数などが解析される。
【0054】この構文解析手段8における解析処理にお
いては、辞書メモリ4aに格納された辞書データと文法
規則に従って、単語列の各単語間の係り受け関係を示す
構造解析木が例えば図7に示すように決定され、バッフ
ァCに格納される。
【0055】構造解析木の決定は、次のようにして決定
される。すなわち、辞書メモリ4aの文法規則から 文 → 主部、述部 主部 → 名詞句 述部 → 助動詞、動詞、名詞句、前置詞句 名詞句 → 代名詞 名詞句 → 名詞 前置詞句→ 前置詞、限定詞、名詞 の規則が得られる。この規則は、例えば、1つ目の規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則に従って構造解析木が決定され
る。このように、構文解析手段8による構文解析におい
ては、各形態素列の単語間の係り受けなどの、文章の構
造(構造解析木)が決定される。
【0056】この翻訳プログラムのうち、構文変換手段
9における意味解析処理では、辞書メモリ4aの木構造
変換規則を用いて、図7に示すように、入力された英文
に対する構文解析木の構造が決定された後、図8に示す
ように、日本文に対する構文解析木に変換される。この
ようにして得られた結果がバッファDに格納される。こ
の構文解析木の変換の際、辞書メモリ4aの単語辞書中
の意味情報を用いて、図7中の構文解析木の主要な語句
の間を意味的にチェックすることで、原語に対する適切
な訳語を選択する。
【0057】本実施例の単語辞書では、下記の(表1)
に示すような意味情報が格納されている。
【0058】
【表1】
【0059】この(表1)に示すように、“take”の品
詞は「動詞」であり、その訳語には「とる」「受けと
る」「捕らえる」など幾つかの意味がある。動詞に対す
る意味情報には訳語選択条件が格納されている。具体的
には、「動詞の目的語がそこに列挙した意味カテゴリの
名詞であれば、その訳語をとる」ことを表している。
【0060】また、(表1)に示すように、“child”
の品詞は「名詞」であり、名詞の意味情報には訳語に対
する意味カテゴリが格納されている。訳語「子供」の意
味カテゴリは「人」であることがわかる。
【0061】本例文では、構文解析結果により、“tak
e”の目的語が“child”であることがわかる。“chil
d”の「子供」の訳語の意味カテゴリが「人」であるた
め、“take”の訳語選択条件に「人」が含まれる訳語を
探すと、「連れて行く」が見つかるので、この例文で
は、“take”と“child”の訳語は、それぞれ「連れて
行く」と「子供」であることがわかる。
【0062】このように、構文変換手段9による意味解
析においては、複数の構文解析の結果から意味的に正し
いものとそうでないものが判別され、各単語に対する訳
語を選択する。
【0063】この翻訳プログラムのうち、翻訳文生成手
段10における文脈解析処理では、構文変換手段9で得
られた日本文字『私 彼女 子供 動物園 連れて行
く。』に適切な助詞『は』『の』『に』『を』や助動詞
がつけられて、図9に示すような日本語の形にして、バ
ッファEに格納する。この日本文『私は、彼女の子供を
動物園に連れて行く。』は、翻訳モジュール16から出
力され、メインメモリ4Aに格納されると共に、出力手
段3としての表示装置3Aに表示可能である。
【0064】このように、翻訳文生成手段10による文
脈解析においては、話題が理解され、省略や曖昧さが取
り去られる。
【0065】このとき、翻訳文生成手段10からの制御
で原語訳語対応記憶手段11が起動され、上記入力文中
の各原語に対応する訳語が、通常の翻訳文の文頭から何
語目であるかが、訳語番号として原語訳語対応情報バッ
ファ4eに設定される。この後、出力形式整形手段14
では、原語バッファ4c、訳語バッファ4dおよび原語
訳語対応情報バッファ4eのデータを基に原語(単語)
と訳語の対応をとった文字列が出力形式バッファ4fに
格納され、これが出力手段3としての表示装置3Aなど
に、必要な単語に訳語を付与した訳振り形式で出力され
る。
【0066】次に、利用者の語学レベルに応じて訳語の
不要な単語には訳語を付与せず、利用者の望む最低限必
要な単語に訳語を付与する場合について、本実施例の動
作を図1のブロック図、(表2)〜(表4)を参照して
詳しく説明する。
【0067】まず、以下の文が入力手段1に入力された
ものとする。
【0068】The earth contains a large number of m
etals which are useful to man. この入力文は、上述した本発明の訳振り機械翻訳の場合
と同様に、辞書引き・形態素解析、構文解析、構文変換
を経て、翻訳文生成処理が行われる。
【0069】このとき、翻訳文生成手段10からの制御
で原語訳語対応記憶手段11が起動され、上記入力文中
の各原語に対応する訳語が、通常の翻訳文の文頭から何
語目であるかが、訳語番号として原語訳語対応情報バッ
ファ4eに設定される。この原語訳語対応情報バッファ
4eの例を下記の(表2)に示す。ちなみに、それそれ
の番号に対応する訳語(訳語バッファ4d)と原語(原
語バッファ4c)の記憶内容を下記の(表3)および
(表4)にそれぞれ示している。
【0070】
【表2】
【0071】
【表3】
【0072】
【表4】
【0073】この後、出力形式整形手段14では、原語
バッファ4c、訳語バッファ4dおよび原語訳語対応情
報バッファ4eのデータを基に原語(単語)と訳語の対
応をとった文字列が出力形式バッファ4fに格納され、
これが出力手段3としての表示装置3Aなどにより、下
記に示すように出力形式整形結果として、訳語を入力文
と共に出力する。
【0074】 The earth contains a large number of metals which are useful to man. その 地球 含む 多数の 有益である このようにして訳振りされる場合の訳語出力判定処理に
ついて、図10のフローチャートに沿って、下記の(表
5)を参照して詳しく説明する。
【0075】単語辞書の辞書メモリ4aは、難易度や頻
度や重要度などのレベル情報に基づき各見出しにレベル
付けがなされている。本実施例では「上級/中級/初級
/超初級」の4つのレベルを想定する。下記の(表5)
に上記入力文例における各単語の各見出し単位にレベル
付けされた基本辞書内容を模式的に示している。
【0076】
【表5】
【0077】この(表5)において、例えば、“are”
は基本的な単語なので「超初級」が付与されており、
「超初級」の単語は訳振り不要とする。利用者は、訳振
りレベル設定手段5を使って自らの学力レベルとしての
訳振りレベルを設定する。本実施例では、「上級/中級
/初級」の3つのレベルを想定する。指定されたレベル
情報は訳振りレベルバッファ4bに格納される。
【0078】最初に、訳振りレベルが「中級」である場
合について説明する。先の入力文と同じ入力文が入力さ
れ、同様にして各原語に対する単語単位の訳語が得ら
れ、原語バッファ4cと、訳語バッファ4dと、原語訳
語対応情報バッファ4eとに格納された状態になってい
るものとする。
【0079】翻訳出力判定手段12において、図10に
示すように、まず、ステップs1で先頭単語“the”に
着目する。ステップs2で単語のレベル情報を取り出
す。各見出し単位にレベル付けされた基本辞書を模式的
に示した(表5)にあるように「超初級」であることが
わかる。
【0080】今、訳振りレベルは「中級」でイディオム
を構成しないので、ステップs3およびステップs5で
はNOであり、ステップs9でYESとなる。ステップ
s10で単語“the”のレベル情報が「超初級」または
「初級」であるかどうかを判定する。単語“the”のレ
ベル情報は「超初級」であり、この「初級」以下の単語
である“the”の訳語は、ステップs11で出力しな
い。さらに、ステップs16に進んで、入力された文の
全ての単語の処理は終了したかどうかを判断する。全て
の単語の処理が終了していないならば、ステップs17
で次の単語“earth”に着目する。ステップs2で単語
のレベル情報を取り出すと「初級」なので、先頭単語
“the”の場合と同様に、ステップs11でやはり訳語
は出力しない。
【0081】同様にして、ステップs17で次の単語
“contain”に着目し、ステップs2でレベル情報を取
り出すと「中級」であり、ステップs9を介してステッ
プs10でこれは「中級」であると判断され、ステップ
s12で“contain”の訳語を出力する。
【0082】この実際の出力は、出力形式整形手段14
によって、原文と訳語の出力の形式が整形されたものが
出力形式バッファ4fに格納され、これが出力手段3に
より表示や印字などの形式で出力される。この時点での
出力手段3の出力状態は以下のようになっている。
【0083】 さらに、ステップs17で次の単語“a”に着目し、ス
テップs2でレベル情報を取り出し、ステップs3で
“a”以降の句が、“a large number of”というイディ
オムかどうかを判定し、イディオムであれば、利用者が
指定した訳振りレベルやその単語のレベル情報に関係な
く訳語を出力する。この時点での出力手段3の出力状態
は以下のようになっている。
【0084】 以下、同様に処理が進み、結局、中級レベルでは、次の
ような出力結果が得られる。
【0085】 The earth contains a large number of metals which are useful to man. 含む 多数の 金属 有益な 次に、利用者が、訳振りレベルに「上級」を指定した場
合の処理について、上記した「中級」の場合との相違点
を説明する。
【0086】単語“the”と“earth”は上記と同様の判
断で出力されないが、次の単語“contain”は「中級」
であるのに対し、利用者が指定した訳振りレベルは「上
級」なので、ステップS14では『出力しない』と判断
される。同様に、レベル情報「中級」の単語“metal”
と“useful”が出力しないと判断され、結局、上級レベ
ルでは、“a large number of”のイディオムだけの訳
語が出力されて、出力手段3の出力状態は以下のように
なる。
【0087】 The earth contains a large number of metals which are useful to man. 多数の このようにして、利用者が指定する3つの訳振りレベル
を設定した時の出力形式整形結果を下記に示す。
【0088】 (初級レベルの例) The earth contains a large number of metals which are useful to man. 地球 含む 多数の 金属 有益である 人 (中級レベルの例) The earth contains a large number
of metals which are useful to man. 含む 多数の 金属 有益な (上級レベルの例) The earth contains a large number
of metals which are useful to man. 多数の ここで、単語辞書に格納しておく各単語のレベル情報の
付与基準の各具体例1〜4について説明する。このレベ
ル情報の付与基準を用いて、訳語出力判定手段12は訳
語を出力するかどうかの判定をする。
【0089】(具体例1)単語辞書中の辞書メモリ4a
に付与する各単語のレベル情報を、複数の英和辞書のう
ち、幾つの辞書に重要度マークが付与されているかなど
に基づいて設定する。即ち、高い重要度マークが付与さ
れている辞書が多い単語は、それだけ基本的な単語であ
り、多くの人が訳や意味を知っているであろうというこ
とで、低い単語レベルを付与する。
【0090】このように、通常の辞書に付与された重要
度マークのうち、この重要度マークがどの程度の重要度
マークか、また、どの程度多くの辞書に付与されている
かに関する情報に基づいて、単語辞書中の辞書メモリ4
aに付与する訳振りのレベル情報を設定する。
【0091】(具体例2)単語辞書中の辞書メモリ4a
に付与する各単語のレベル情報を、見出しの文字構成に
よって決める。例えば、見出しの文字構成が11文字以
上から構成される単語は、それだけ理解や記憶が困難な
単語であろうということで、高い単語レベルを付与す
る。例えば下記に示す2単語は11文字以上の文字構成
であり、これら2単語には、訳語を付与する。
【0092】supernatural 超自然の supercalender 紙に光沢をつける また、11文字以上の文字構成の単語であっても、語構
成的にみれば、接頭辞や接尾辞などが連接して長くなっ
た単語であって、かつそれら断片の意味か、または単語
全体としての意味が容易に推測できて構成できるものに
は単語レベルを低く設定する。例えば、上記した2単語
はいずれも”super”の接頭辞を持ち、それ以外の部分
は、”natural”と”calender”とも基本的な単語であ
るが、前者は、”natural”から意味が容易に推測する
ことができるのに対して、後者の”calender”は全く意
味が変わってしまう。したがって、前者の単語レベルは
低く設定して訳語を振らないようにし、また、後者の単
語レベルは高く設定して訳語を振るようにする。
【0093】なお、イディオムについては、ほとんどの
イディオムが11文字を越えてしまうので、この付与基
準を用いれば、イディオムの単語レベル(複合語レベ
ル)にはすべて高い単語レベルが設定されることにな
る。この場合には、例えば、容易なイディオムの単語レ
ベル(複合語レベル)には低い単語レベルを付与して設
定するようにしても良い。
【0094】このように、入力文の各単語を構成する単
語文字数に関する情報に基づいて、単語辞書中の辞書メ
モリ4aに付与する訳振りのレベル情報を設定する。こ
の単語文字数が一定の文字数を越えるかどうか、かつ各
単語の接頭辞および接尾辞などの各単語の構成により各
単語の意味が推測可能か否かに基づいてレベル情報を設
定する。
【0095】(具体例3)単語辞書中の辞書メモリ4a
に付与する各単語のレベル情報を、品詞の種類によって
決める。即ち、特定の品詞には一律に低い単語レベルを
付与する。例えば、助動詞はその数も少ないこともあっ
て、訳振り対象外の品詞とする。同様に、固有名詞はカ
タカナ訳語になることや、誤った訳語になることが多い
ため、訳語を付与しないようにする。
【0096】このように、品詞の種類に関する情報に基
づいて、単語辞書中の辞書メモリ4aに付与する訳振り
のレベル情報を設定する。つまり、特定品詞は訳振りレ
ベルを低く設定し、固有名詞および助動詞などは訳振り
対象から除く。
【0097】(具体例4)単語辞書中の辞書メモリ4a
に付与する各単語のレベル情報を、どの種類の辞書に登
録されていたものであるかによって決める。即ち、基本
辞書に登録されている単語は、基本的な単語であろうと
いうことで、単語レベルを低く設定する。一方、ユーザ
辞書および専門辞書などに登録されている単語は、単語
自体またはその訳語が特殊なものであろうということ
で、単語レベルを高く設定する。
【0098】このように、基本辞書、ユーザ辞書および
専門辞書など単語の辞書の種類に関する情報に基づい
て、単語辞書中の辞書メモリ4aに付与する訳振りのレ
ベル情報を設定する。
【0099】次に、以上のような単語辞書中の辞書メモ
リ4aに付与する予め決まったレベル情報ではなく、上
記した翻訳(訳振り)処理(構文解析処理、構文変換処
理および翻訳文生成処理)中に得られる言語情報に基づ
いて、訳語出力判定手段12が、訳語を付与するか否か
を判定する付与基準の各具体例5〜7について説明す
る。
【0100】(具体例5)構文解析の結果として得られ
る原文の構文構造を利用することで、訳語出力判定手段
12は訳語を付与するか否かを判定する出力判定を行
う。即ち、構文解析が終わると、図7に示すように、主
部に相当する名詞句、述部の主動詞などの文の骨格とな
る構造を得ることができる。この構文解析情報を利用す
ることで、たとえ単語レベルが低いものであっても、文
の中で重要な役割を果たす語句には訳語を付与する。特
に、初級レベルでは、主語や述語の役割を担うような単
語は、どのようなレベルの単語でも訳語を付与し、ま
た、逆に、上級レベルでは、修飾語(関係節中の単語な
どを含む)の単語には訳語を付与しない。
【0101】下記に示す入力文例について具体的に説明
すると、「初級」レベルでは、単語レベルで判定するだ
けではなく、S(主語)、V(動詞)、O(目的語)な
どの文の構成要素にも訳語を付与している。また、単語
レベルだけで判定する「中級」レベルにおいては、文の
構成要素というだけでは訳語は付与されない。例えば、
文の構成要素(主語)である「友達」の訳語は、「初
級」レベルでは付与されていたが、「中級」レベルでは
付与されていない。さらに、逆に、「上級」レベルで
は、単語レベルだけで判定すると、付与されるはずの
「派生する」などの訳語も、修飾語句としての関係節の
中なので抑制されている。
【0102】 (初級レベル:単語レベルおよび文構成要素で判定する。) Her friends extolled Japan where technology are derived from the theory・ 友達 絶賛した 技術 派生する 理論 (中級レベル:単語レベルで判定する。) Her friends extolled Japan where technology are derived from the theory・ 絶賛した 技術 派生する 理論 (上級レベル:関係節などの修飾語には訳語を付与しない。) Her friends extolled Japan where technology are derived from the theory・ 絶賛した このように、翻訳出力判定手段12は、単語レベルだけ
ではなく、構文解析処理中に得られる文の構文構造(文
構成要素や修飾語句など)に基づいて訳語を付与するか
否かを判定する。
【0103】(具体例6)構文変換の際に行われる意味
処理を用いた訳語選択により最も適切な訳語が決まる。
この訳語の文字の種類を判断することで、出力判定を行
う。例えば、英単語の発音をそのままカタカナにしたよ
うな訳語は、英文解読にとって有用な情報ではないの
で、どのようなレベルであったとしても訳語を付与しな
い。
【0104】下記に示す入力文例について具体的に説明
する。
【0105】 (カタカナ訳語抑制前) The text describes an mechanism and programmig model for new software. テキスト 記述する メカニズム プログラミング モデル ソフトウェア (カタカナ訳語抑制後) The text describes an mechanism and programmig model for new software. 記述する 上記したカタカナ訳語抑制後の訳振り結果においては、
すっきりと見やすくなっていることがわかる。
【0106】このように、翻訳出力判定手段12は、単
語レベルだけではなく、構文変換処理中に得られる訳語
の文字種構成に基づいて訳語を付与するか否かを判定す
る。
【0107】(具体例7) 同じ単語であっても、分野によっては訳語が不要になる
場合がある。実用化レベルの機械翻訳システムとして、
翻訳する文書の分野を入力手段1を介して分野指定手段
6で利用者に指定させる。これは、訳語選択を適切に行
うためであるが、この分野情報を翻訳出力判定手段12
で行う訳語付与の判定にも利用する。即ち、翻訳出力判
定手段12は、分野指定された訳語(特殊な訳語)が選
択された場合には、単語のレベル情報が低くても訳語を
付与するように判断する。
【0108】例えば、下記の例文の1つ目の出力判断結
果では、”attack”は単語レベルが低いので、訳語が付
与されないが、2つ目の出力判断結果では、「医学」分
野が指定された場合に、選択される訳語「発病」が訳振
りされる。
【0109】 She had an attack of fever. She had an attack of fever. 発病 このように、翻訳出力判定手段12は、構文変換処理中
に得られる訳語が分野指定されたものであるか否かの言
語情報に基づいて訳語を付与するか否かを判定する。
【0110】(具体例8) この具体例8では、翻訳出力判定手段12が、翻訳出力
位置回数記憶手段13からの情報に基づいて訳語を付与
するか否かを判定する付与基準について説明する。
【0111】訳語を付与する度に、その訳語とその表示
位置を訳語出力位置回数記憶手段13にて保持してお
く。この訳語出力位置回数記憶手段13からの情報によ
って、その訳語を前回に表示した位置からある一定以上
の距離が離れている場合にのみ訳語を付与できるように
する。
【0112】また、ある訳語の付与回数が文書のある範
囲内である基準を越えれば、以降はその訳語は付与しな
いようにする。また、全単語(訳語)を対象に直前に付
与した位置からの距離で訳語を付与するか否かを決める
ことも可能である。
【0113】下記の例文の1つ目の訳振り結果(本規則
追加前)では、critical temperature(臨界温度)、ca
rbon(炭素)、heat(加熱する)、temperature(温
度)などの複数回出現する語句の訳も毎回、訳振りされ
ているが、その例文の2つ目の訳振り結果(本規則追加
後)では、2度目以降に出現する訳語が抑制されている
場合を示しており、すっきり見やすくなっていることが
わかる。
【0114】 (本規則追加前) In the first place,steel which contains very little carbon will be まず第一に 含む 炭素 milder than steel. Secondly,we can heat the carbon above a certain 穏やかな 第二に 加熱する 炭素 critical temperature. At this critical temperature,changes begin 臨界温度 臨界温度 to take place in the molecular structure. In the process known as 分子の 構造 annealing,we heat the carbon above the critical temperature. We heat it 焼なまし 加熱する 炭素 臨界温度 加熱する up beyond the critical temperature,and then quench it in other liquid. 臨界温度 抑制する 液体 The temperature drop fixes the change in the carbon which occurred 温度 炭素 発生する at the critical temperature. But a bar of this hardened carbon is more 臨界温度 堅くなった 炭素 liable to fracture than normal carbon. We therefore heat it again to a 傾向がある 破砕 正常な 炭素 加熱する temperature below the critical temperature. 温度 臨界温度 (本規則追加後) In the first place,steel which contains very little carbon will be まず第一に 含む 炭素 milder than steel. Secondly,we can heat the carbon above a certain 穏やかな 第二に 加熱する critical temperature. At this critical temperature,changes begin 臨界温度 to take place in the molecular structure. In the process known as 分子の 構造 annealing,we heat the carbon above the critical temperature. We heat it 焼なまし up beyond the critical temperature,and then quench it in other liquid. 抑制する 液体 The temperature drop fixes the change in the carbon which occurred 温度 発生する at the critical temperature. But a bar of this hardened carbon is more 堅くなった liable to fracture than normal carbon. We therefore heat it again to a 傾向がある 破砕 正常な temperature below the critical temperature. ここで、上記具体例1〜8を考慮した場合の訳語出力判
定手段12の動作を図11のフローチャートを用いて説
明する。
【0115】図11に示すように、まず、ステップS1
で先頭単語に着目する。次に、ステップS2で着目した
単語のレベル情報、品詞および訳語を取り出す。さら
に、ステップA1で着目した単語の品詞が助動詞または
固有名詞かどうかを判定し、YESの場合、即ち、着目
した単語の品詞が助動詞または固有名詞の場合、ステッ
プA2で訳語は出力しない。ステップS16で全ての単
語が着目されたかどうかを判定し、全ての単語が着目さ
れていないならば、ステップS17で次の単語に着目
し、ステップS2を介してステップA1に進む。
【0116】さらに、ステップA1で着目した単語の品
詞が助動詞または固有名詞ではない場合、ステップA3
で着目している単語がユーザ辞書か専門辞書または、そ
の訳語は指定分野の訳語かどうかを判定する。YESの
場合、ステップA4でその訳語は出力する。さらに、ス
テップS16で全ての単語が着目されたかどうかを判定
し、全ての単語が着目されていないならば、ステップS
17で次の単語に着目し、ステップS2を介してステッ
プA1に進む。
【0117】このステップA1およびステップA3でN
Oの場合、ステップA5に進み、ステップA5で直前の
訳語付与単語から十分に離れているかどうかを判定す
る。直前の同一訳語付与単語から十分に離れていないな
らば、ステップA6でその訳語は出力しない。さらに、
ステップS16で全ての単語が着目されたかどうかを判
定し、全ての単語が着目されていないならば、ステップ
S17で次の単語に着目し、ステップS2を介してステ
ップA1に進む。
【0118】さらに、このステップA1およびステップ
A3でNO、ステップA5でYESの場合、ステップS
5に進み、ステップS5で訳振りレベルは「初級」かど
うかを判定する。訳振りレベルが「初級」の場合、ステ
ップS6でその着目している単語は、レベル情報が「超
初級」で、かつ文の修飾部かどうかを判定する。その単
語のレベル情報が「超初級」で、かつその単語は文の修
飾部である場合、ステップS7でその訳語は出力しな
い。また、その単語のレベル情報が「超初級」で、かつ
その単語が文の修飾部ではない場合、ステップS8でそ
の訳語は出力する。さらに、ステップS16で全ての単
語が着目されたかどうかを判定し、全ての単語が着目さ
れていないならば、ステップS17で次の単語に着目
し、ステップS2を介してステップA1に進む。
【0119】ステップA1から同様にしてステップS7
に進んだ場合、ステップS7で着目した単語の訳語が、
カタカナだけで構成されているかどうかを判定する。そ
の訳語がカタカナだけで構成されている場合、ステップ
A8でその訳語は出力しないようにする。さらに、ステ
ップS16で全ての単語が着目されたかどうかを判定
し、全ての単語が着目されていないならば、ステップS
17で次の単語に着目し、ステップS2を介してステッ
プA1に進む。
【0120】さらに、ステップA1から同様にしてステ
ップS7に進み、ステップS7で訳語がカタカナではな
くNOでステップS9に進んだ場合、ステップS9で訳
振りレベルは「中級」かどうかを判定する。訳振りレベ
ルが「中級」の場合、ステップS10でその着目してい
る単語のレベル情報は、レベル情報が「超初級」または
「初級」かどうかを判定する。その単語のレベル情報が
「超初級」または「初級」の場合、ステップS11でそ
の訳語は出力しないようにする。また、その単語のレベ
ル情報が「超初級」または「初級」ではない場合、ステ
ップS12でその訳語は出力する。さらに、ステップS
16で全ての単語が着目されたかどうかを判定し、全て
の単語が着目されていないならば、ステップS17で次
の単語に着目し、ステップS2を介してステップA1に
進む。
【0121】さらに、ステップA1から同様にしてステ
ップS9に進み、ステップS9で訳振りレベルが「中
級」ではなくNOでステップS13に進んだ場合、ステ
ップS13でその注目している単語は、そのレベル情報
が「上級」で、かつその単語が文のSVO部かどうかを
判定する。その注目している単語のレベル情報が「上
級」で、かつその単語が文のSVO部の場合、ステップ
S15でその訳語は出力する。さらに、ステップS16
で全ての単語が着目されたかどうかを判定し、全ての単
語が着目されていないならば、ステップS17で次の単
語に着目し、ステップS2を介してステップA1に進
む。
【0122】さらに、ステップA1から同様にしてステ
ップS13に進み、ステップS13でその単語のレベル
情報が「上級」で、かつその単語が文のSVO部ではな
くNOの場合、ステップS14で訳語は出力せず、ステ
ップS16で全ての単語が着目されたかどうかを判定
し、全ての単語が着目されていれば、訳振り処理を終了
する。
【0123】このように、訳語を付与するか否かの判断
がきめ細かくなされて、利用者のレベルに応じて訳語の
不要な単語には訳語がより正確に抑制されるので、入力
文をより効率良く速読または粗読することができる。
【0124】以上のように、本発明においては、入力手
段1から入力された文を単語の形態素列に分割し、その
単語毎に単語辞書をひくとともに、その単語の時制・人
称・数などを解析する。この形態素列における単語間の
係り受けなど入力文章構造を構文解析手段8が決定し、
これを翻訳文に対する文章構造に構文変換手段9が変換
し、意味的な整合性を検査して単語に対する訳語を選択
する。さらに、翻訳文生成手段10は、この訳語の並び
を決定し、活用変化を調整して翻訳文を生成する。この
ように、形態素解析、構文解析、構文変換さらに翻訳文
生成の翻訳処理を行った後に、出力形式整形手段14は
入力文の各単語と訳語との対応をとって訳振りをする。
この訳振りは、訳振りレベル設定手段5で設定された訳
振りレベルと単語辞書における訳振りレベルとの関係に
より、訳語出力判定手段12が訳語を付与するか否かを
判定する。これによって、外国語の入力文の速読や粗読
を効率よく容易に行うことができる。
【0125】
【発明の効果】以上のように本発明によれば、形態素解
析、構文解析、構文変換さらに翻訳文生成の翻訳処理を
行った後に、入力文の各単語と訳語との対応をとって訳
振りをするため、より精度の高い訳語を出力することが
でき、利用者は入力文を正しく理解することができて、
外国語の入力文の速読や粗読を効率よく容易に行うこと
ができる。
【0126】また、単語の見出し毎にレベル情報が付与
されており、ユーザが訳振りレベルを指定し、その指定
された訳振りレベルと原語(単語)のレベル情報との関
係により訳語を付与するか否かを判定するため、利用者
のレベルに応じて訳語の不要な単語には訳語が付与され
ず、利用者は入力文を効率良く速読や粗読することがで
きる。
【図面の簡単な説明】
【図1】本発明の一実施例における訳振り機械翻訳装置
の基本構成を示すブロック図である。
【図2】図1の訳振り機械翻訳装置の具体的ハード構成
を示すブロック図である。
【図3】図2の翻訳モジュール16の詳細な構成を示す
ブロック図である。
【図4】機械翻訳の概念を模式的に示す図である。
【図5】図3のバッファAの格納内容を模式的に示す図
である。
【図6】図3のバッファBの格納内容を模式的に示す図
である。
【図7】図3のバッファCの格納内容を模式的に示す図
である。
【図8】図3のバッファDの格納内容を模式的に示す図
である。
【図9】図3のバッファEの格納内容を模式的に示す図
である。
【図10】図1の訳語出力判定手段12の動作の一例を
示すフローチャート図である。
【図11】図1の訳語出力判定手段12の動作の他の例
を示すフローチャート図である。
【図12】従来の翻訳支援装置の構成を示すブロック図
である。
【図13】従来の機械翻訳装置の構成を示すブロック図
である。
【符号の説明】
1 入力手段 1A キーボード 2 翻訳CPU 3 出力手段 3A 表示手段(表示装置) 4 記憶手段 4A メインメモリ 4a 辞書メモリ 4b 訳振りレベルバッファ 4c 原語バッファ 4d 訳語バッファ 4e 原語訳語対応情報バッファ 4f 出力形式バッファ 5 訳振りレベル設定手段 6 分野指定手段 7 辞書引き・形態素解析手段 8 構文解析手段 9 構文変換手段 10 翻訳文生成手段 11 原語訳語対応記憶手段 12 訳語出力判定手段(翻訳出力判定手段) 13 訳語出力位置回数記憶手段 14 出力形式整形手段 15 メインCPU 16 翻訳モジュール 16A 翻訳プログラムメモリ A〜E バッファ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/27 - 17/28

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 単語に対する品詞などの文法情報および
    訳語を格納するとともに、該訳語毎に訳振りレベルが付
    与された単語辞書と、 入力文を単語列に分割し、前記単語辞書から該単語列の
    各単語に対する品詞などの文法情報および訳語を得ると
    ともに、該各単語の時制・人称・数を解析する辞書引き
    ・形態素解析手段と、 前記辞書引き・形態素解析手段で得られた文法情報に従
    って該単語列の単語間の係り受け関係などの入力文章構
    造を決定する構文解析手段と、 前記構文解析手段で決定した入力文章構造を翻訳文に対
    する文章構造に変換し、意味的な整合性を検査して該単
    語に対する該訳語を選択する構文変換手段と、 前記構文変換手段で得られた訳語の並び順を決定し、活
    用変化を調整して翻訳文を生成する翻訳文生成手段とを
    備えた訳振り機械翻訳装置であって、 利用者が、該各単語の難易度、頻出度または重要度など
    のレベル情報に基づいて設定された訳振りレベルを指定
    可能な訳振りレベル設定手段と、 前記訳振りレベル設定手段で指定された訳振りレベルと
    前記単語辞書における訳振りレベルとの関係により訳語
    を付与するか否かを判定する翻訳出力判定手段と、 前記翻訳文生成手段までの翻訳処理を行なった後に、前
    記翻訳出力判定手段で判定した訳語に対して、入力文の
    各単語とその訳語との対応をとって該訳語を該入力文と
    ともに見易い形式に整えて出力する原語訳語対応出力手
    段と、をさらに備え、 前記翻訳出力判定手段は、前記訳振りレベル設定手段で
    指定された訳振りレベルと前記単語辞書における訳振り
    レベルとの関係により訳語を付与するか否かを判定する
    とともに、前記解析処理中に得られる文の構文構造、前
    記変換処理中に得られる訳語の文字種構成、前記変換処
    理中に得られる訳語が分野指定されたものであるか否
    か、および、同一訳語の付与位置間の距離のうち、少な
    くともいずれかの情報を言語情報とし、該言語情報に基
    づいて訳語を付与するか否かを判定することを特徴とす
    訳振り機械翻訳装置。
  2. 【請求項2】 前記同一訳語の付与位置間の距離は、直
    前に付与した同一訳 語間の距離であることを特徴とする
    請求項1記載の訳振り機械翻訳装置。
  3. 【請求項3】 単語に対する品詞などの文法情報および
    訳語を格納するとともに、該訳語毎に訳振りレベルが付
    与された単語辞書と、 入力文を単語列に分割し、前記単語辞書から該単語列の
    各単語に対する品詞などの文法情報および訳語を得ると
    ともに、該各単語の時制・人称・数を解析する辞書引き
    ・形態素解析手段と、 前記辞書引き・形態素解析手段で得られた文法情報に従
    って該単語列の単語間の係り受け関係などの入力文章構
    造を決定する構文解析手段と、 前記構文解析手段で決定した入力文章構造を翻訳文に対
    する文章構造に変換し、意味的な整合性を検査して該単
    語に対する該訳語を選択する構文変換手段と、 前記構文変換手段で得られた訳語の並び順を決定し、活
    用変化を調整して翻訳文を生成する翻訳文生成手段とを
    備えた訳振り機械翻訳装置であって、 利用者が、該各単語の難易度、頻出度または重要度など
    のレベル情報に基づいて設定された訳振りレベルを指定
    可能な訳振りレベル設定手段と、 前記訳振りレベル設定手段で指定された訳振りレベルと
    前記単語辞書における訳振りレベルとの関係により訳語
    を付与するか否かを判定する翻訳出力判定手段と、 前記翻訳文生成手段までの翻訳処理を行なった後に、前
    記翻訳出力判定手段で判定した訳語に対して、入力文の
    各単語とその訳語との対応をとって該訳語を該入力文と
    ともに見易い形式に整えて出力する原語訳語対応出力手
    段と、をさらに備え、 前記翻訳出力判定手段は、前記訳振りレベル設定手段で
    指定された訳振りレベルと前記単語辞書における訳振り
    レベルとの関係により訳語を付与するか否かを判定する
    とともに、前記構文解析処理中に得られる文の構文構
    造、前記変換処理中に得られる訳語の文字種構成、前記
    変換処理中に得られる訳語が分野指定されたものである
    か否か、および、同一訳語の付与位置間の距離のうち、
    少なくともいずれかの情報を言語情報とし、該言語情報
    に基づいて訳語を付与するか否かを判定し、さらに前記
    構文変換処理中に得られる同一訳語の付与回数が、文書
    の所定範囲内で所定基準を越えた場合、それ以降は該同
    一訳語を付与しないことを特 徴とする 訳振り機械翻訳装
    置。
  4. 【請求項4】 前記単語辞書中に付与する訳振りレベル
    は、 通常の辞書に付与された重要度マークに関する第1情報
    と、 前記入力文の各単語を構成する単語文字数に関する第2
    情報と、 品詞の種類に関する第3情報と、 基本辞書、ユーザ辞書または専門辞書など辞書の種類に
    関する第4情報、 のうち少なくともいずれかの情報から構成され、 前記第1情報に基づいて訳振りレベルを設定する際は、
    複数の辞書のうち、幾つの辞書に重要度マークが付与さ
    れているか、また該重要度マークがどの程度の重要度マ
    ークかに基づいて設定し、 前記第2情報に基づいて訳振りレベルを設定する際は、
    該単語文字数が一定の文字数を越えるか否か、または該
    各単語の接頭辞および接尾辞などの該各単語の構成によ
    り該各単語の意味が推測可能か否かに基づいて設定し、 前記第3情報に基づいて訳振りレベルを設定する際は、
    特定品詞に対してレベルを低く設定し、固有名詞および
    助動詞は訳振り対象から除き、 前記第4情報に基づいて訳振りレベルを設定する際は、
    基本辞書に登録されている単語は単語レベルを低くし、
    ユーザ辞書または専門辞書などに登録されている単語は
    単語レベルを高くする、 ことで前記単語辞書中に付与する訳振りレベルを設定す
    ることを特徴とする請求項1または3のいずれか記載の
    訳振り機械翻訳装置。
JP14791795A 1995-06-14 1995-06-14 訳振り機械翻訳装置 Expired - Fee Related JP3161942B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP14791795A JP3161942B2 (ja) 1995-06-14 1995-06-14 訳振り機械翻訳装置
US08/664,457 US5873055A (en) 1995-06-14 1996-06-14 Sentence translation system showing translated word and original word
EP96109596A EP0749075A3 (en) 1995-06-14 1996-06-14 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14791795A JP3161942B2 (ja) 1995-06-14 1995-06-14 訳振り機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH096787A JPH096787A (ja) 1997-01-10
JP3161942B2 true JP3161942B2 (ja) 2001-04-25

Family

ID=15441025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14791795A Expired - Fee Related JP3161942B2 (ja) 1995-06-14 1995-06-14 訳振り機械翻訳装置

Country Status (3)

Country Link
US (1) US5873055A (ja)
EP (1) EP0749075A3 (ja)
JP (1) JP3161942B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072594A (ja) * 2005-09-05 2007-03-22 Sharp Corp 翻訳装置、翻訳方法および翻訳プログラム、媒体
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2014106052A (ja) * 2012-11-26 2014-06-09 Shibuya Kogyo Co Ltd 物品分類装置

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9726654D0 (en) * 1997-12-17 1998-02-18 British Telecomm Data input and retrieval apparatus
US6493709B1 (en) * 1998-07-31 2002-12-10 The Regents Of The University Of California Method and apparatus for digitally shredding similar documents within large document sets in a data processing environment
JP3959180B2 (ja) * 1998-08-24 2007-08-15 東芝ソリューション株式会社 通信翻訳装置
JP2000132550A (ja) * 1998-10-26 2000-05-12 Matsushita Electric Ind Co Ltd 機械翻訳のための中国語生成装置
JP3539479B2 (ja) * 1999-03-11 2004-07-07 シャープ株式会社 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体
FR2802731B1 (fr) * 1999-12-16 2002-01-25 Schneider Electric Ind Sa Dispositif autonome de commande a distance, appareil et installation electrique comportant un tel dispositif
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US7483828B2 (en) * 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
US7089559B2 (en) * 2001-07-31 2006-08-08 International Business Machines Corporation Method, apparatus, and program for chaining server applications
US6993472B2 (en) * 2001-07-31 2006-01-31 International Business Machines Corporation Method, apparatus, and program for chaining machine translation engines to control error propagation
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
WO2003065245A1 (fr) * 2002-01-29 2003-08-07 International Business Machines Corporation Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
US6716032B2 (en) 2002-02-11 2004-04-06 Edwin C. Reisz System and method of correlating leveling criteria to label leveled reading books
EP1353280B1 (en) * 2002-04-12 2006-06-14 Targit A/S A method of processing multi-lingual queries
US7664628B2 (en) * 2002-12-27 2010-02-16 Casio Computer Co., Ltd. Electronic dictionary with illustrative sentences
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
JP4476609B2 (ja) * 2003-12-10 2010-06-09 株式会社東芝 中国語解析装置、中国語解析方法および中国語解析プログラム
CN1661593B (zh) * 2004-02-24 2010-04-28 北京中专翻译有限公司 一种计算机语言翻译方法及其翻译系统
JP4076520B2 (ja) * 2004-05-26 2008-04-16 富士通株式会社 翻訳支援プログラムおよび単語対応付けプログラム
JP2006072417A (ja) * 2004-08-31 2006-03-16 Straight Word:Kk 情報変換装置及び情報変換プログラム
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US8332205B2 (en) * 2009-01-09 2012-12-11 Microsoft Corporation Mining transliterations for out-of-vocabulary query terms
JP4935869B2 (ja) * 2009-08-07 2012-05-23 カシオ計算機株式会社 電子機器及びプログラム
KR101266361B1 (ko) * 2009-09-10 2013-05-22 한국전자통신연구원 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
WO2011088141A2 (en) * 2010-01-12 2011-07-21 Maverick Multimedia, Inc. Automatic technical language extension engine
JP5482223B2 (ja) * 2010-01-22 2014-05-07 株式会社リコー 情報処理装置、情報処理方法
JP5604276B2 (ja) * 2010-12-02 2014-10-08 シャープ株式会社 文書画像生成装置および文書画像生成方法
US8954315B2 (en) 2011-10-10 2015-02-10 Ca, Inc. System and method for mixed-language support for applications
JP5528420B2 (ja) * 2011-12-05 2014-06-25 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
CN102609408B (zh) * 2012-01-11 2014-11-26 清华大学 基于多文种文档图像识别的跨文种理解方法
CN103092972A (zh) * 2013-01-24 2013-05-08 华为技术有限公司 基于线索对象的搜索方法及装置
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9031829B2 (en) * 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9575965B2 (en) * 2013-03-13 2017-02-21 Red Hat, Inc. Translation assessment based on computer-generated subjective translation quality score
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
CN104346461B (zh) * 2014-11-07 2018-05-04 北京奇虎科技有限公司 搜索网页元素的方法、装置和浏览器客户端
CN105574180A (zh) * 2015-12-21 2016-05-11 北京奇虎科技有限公司 一种搜索方法及装置
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
WO2018123139A1 (ja) * 2016-12-27 2018-07-05 シャープ株式会社 応答装置、応答装置の制御方法、および制御プログラム
AU2018247564B2 (en) 2017-04-05 2021-10-21 TSTREET Pty Ltd A language translation aid
WO2019060353A1 (en) 2017-09-21 2019-03-28 Mz Ip Holdings, Llc SYSTEM AND METHOD FOR TRANSLATION OF KEYBOARD MESSAGES
KR102449875B1 (ko) * 2017-10-18 2022-09-30 삼성전자주식회사 음성 신호 번역 방법 및 그에 따른 전자 장치
JP6676093B2 (ja) * 2017-10-30 2020-04-08 株式会社テクノリンク 異言語間コミュニケーション支援装置及びシステム
JP6729656B2 (ja) * 2018-10-11 2020-07-22 株式会社リコー 文章処理装置、文章表示システム、情報処理装置、プログラム
KR102338949B1 (ko) * 2020-02-19 2021-12-10 이영호 기술문서 번역 지원 시스템
US11488579B2 (en) * 2020-06-02 2022-11-01 Oracle International Corporation Evaluating language models using negative data

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1270063A (en) * 1985-05-14 1990-06-05 Kouji Miyao Translating apparatus
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
JPS6310265A (ja) * 1986-06-30 1988-01-16 Sharp Corp 翻訳装置
JP2814634B2 (ja) * 1989-12-29 1998-10-27 松下電器産業株式会社 機械翻訳装置
JPH06243162A (ja) * 1992-04-15 1994-09-02 Ricoh Co Ltd 機械翻訳装置
JPH06259467A (ja) * 1993-03-08 1994-09-16 Nec Corp 機械翻訳装置
JPH06325081A (ja) * 1993-03-26 1994-11-25 Casio Comput Co Ltd 翻訳支援装置
US5359514A (en) * 1993-08-03 1994-10-25 International Business Machines Corporation Method and apparatus for facilitating comprehension of on-line documents
JPH0765012A (ja) * 1993-08-27 1995-03-10 Ricoh Co Ltd 対訳画像形成装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072594A (ja) * 2005-09-05 2007-03-22 Sharp Corp 翻訳装置、翻訳方法および翻訳プログラム、媒体
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2014106052A (ja) * 2012-11-26 2014-06-09 Shibuya Kogyo Co Ltd 物品分類装置

Also Published As

Publication number Publication date
EP0749075A2 (en) 1996-12-18
EP0749075A3 (en) 1997-01-22
US5873055A (en) 1999-02-16
JPH096787A (ja) 1997-01-10

Similar Documents

Publication Publication Date Title
JP3161942B2 (ja) 訳振り機械翻訳装置
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
US4953088A (en) Sentence translator with processing stage indicator
JPH05314166A (ja) 電子化辞書および辞書検索装置
US5442547A (en) Apparatus for aiding a user in producing a dictionary storing morphemes with input cursor prepositioned at character location with the highest probability of change
JP2815714B2 (ja) 翻訳装置
EP0357344B1 (en) Computer assisted language translating machine
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP2007072594A (ja) 翻訳装置、翻訳方法および翻訳プログラム、媒体
JPS6190269A (ja) 翻訳方式
JP3692711B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPS6190268A (ja) 翻訳方式
JPH0332105B2 (ja)
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2752025B2 (ja) 機械翻訳装置
JPH05314172A (ja) 機械翻訳装置
JP2011008615A (ja) 対訳登録システム及びプログラム
JP2002259424A (ja) クロスリンガル情報検索方法及び装置及びプログラム
JP2002032369A (ja) 辞書作成装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JP2004171397A (ja) 翻訳支援装置
JPH1185751A (ja) 翻訳装置及び翻訳装置制御プログラムを記憶した媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080223

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees