JPH07200605A - 翻訳装置 - Google Patents

翻訳装置

Info

Publication number
JPH07200605A
JPH07200605A JP5335319A JP33531993A JPH07200605A JP H07200605 A JPH07200605 A JP H07200605A JP 5335319 A JP5335319 A JP 5335319A JP 33531993 A JP33531993 A JP 33531993A JP H07200605 A JPH07200605 A JP H07200605A
Authority
JP
Japan
Prior art keywords
kana
kanji
sentence
translation
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5335319A
Other languages
English (en)
Inventor
Masaki Koshida
正樹 越田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5335319A priority Critical patent/JPH07200605A/ja
Publication of JPH07200605A publication Critical patent/JPH07200605A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】翻訳装置の翻訳品質を向上する。 【構成】この翻訳装置は、かなのみの文章が入力される
入力部1と、入力されたかなのみの文章を、形態素解析
用辞書2を用いて形態素、例えば単語単位など区分して
文節解析を行い、最終的に確定した文節でかな漢字変換
を行ってかな漢字混在文を作成すると共に前記各文節を
区分した形態素情報を記憶する形態素解析及びかな漢字
変換部3と、前記かな漢字混在文のデータと形態素情報
と基にかな漢字混在文の文構解析を行って英文に翻訳す
る翻訳処理部4と、この翻訳処理部4により翻訳された
英文を表示する表示モニタ5とを具備する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語の文章を、例え
ば英文などに翻訳する翻訳装置に関する。
【0002】
【従来の技術】従来から、日本語の文章を外国語の文
章、例えば英文などに翻訳する翻訳装置は実用化されて
いるが、この翻訳装置によって翻訳された文章の質は、
今だ良いとは言えず翻訳品質の向上が望まれている。
【0003】従来の翻訳装置は、かな漢字変換部と、形
態素解析を含む翻訳処理を行う翻訳処理部とを有してお
り、かな漢字変換部と翻訳処理部との間は、文字データ
の授受のみであり、それぞれが独立して動作するよう構
成されている。なおかな漢字変換部にはかな漢字変換用
辞書が、形態素解析部には形態素解析用辞書がそれぞれ
用いられている。
【0004】この翻訳装置にて、例えば日本語の文章を
英文などに翻訳する場合、まず、かな漢字変換部が、か
なのみの文章を文節ごとにかな漢字変換してかな漢字混
在文を作成し、作成したかな漢字混在文のデータを形態
素解析部に送出する。このかな漢字混在文のデータを形
態素解析部が受け取り、受け取ったかな漢字混在文を形
態素、例えば単語単位などに区分するための解析を行
う。この解析結果は翻訳処理部に送出されて、この結果
を基にかな漢字混在文の構文解析が行われた後、かな漢
字混在文は英文に翻訳される。
【0005】ところで、日本語には、単語単位の切れ目
を示すセパレータ、つまり英文におけるスペースのよう
なものがない。このため、形態素解析部がかな漢字混在
文のデータを単語ごとに区分するとき、その解析が曖昧
になる。
【0006】例えば「今日本を見た」などというかな漢
字混在文の場合、形態素解析部は、「今日/本…」ある
いは「今/日本…」というように文章を単語単位で区分
可能である。この場合、形態素解析部は文字データのみ
ではいずれか一方を選択できないため、他の条件、例え
ば使用頻度の多さなどを基に判定する。
【0007】しかしながら、使用頻度などでは、突発的
に使う用語に対しては誤判定することも多く、例えばか
な文字で「わ/た/し/は/い/ま/に/ほ/ん/を/
み/た」という明確な日本語が入力され、「私は今日本
を見た」とかな漢字変換されたにも拘らず、それが「私
/は/今日/本/を/見た」などというように異なる意
味の文節に区切られて英文に翻訳されてしまうことがあ
る。
【0008】
【発明が解決しようとする課題】このように上述した従
来の翻訳装置では、かな漢字変換後のかな漢字混在文の
文字データを基に形態素を解析するが、このとき形態素
の区分位置が曖昧になり文章が誤訳されることがあり翻
訳品質が良くないという問題があった。
【0009】本発明はこのような課題を解決するために
なされたもので、かな漢字混在文の翻訳対象文をより正
確に区分し、この結果、翻訳品質の向上を図ることので
きる翻訳装置を提供することを目的としている。
【0010】
【課題を解決するための手段】本発明の翻訳装置は上記
した目的を達成するために、かな文字で構成された文字
列が入力される入力部と、前記文字列より形態素を抽出
するための多くの形態素が格納された形態素辞書と、こ
の形態素辞書を用いて前記文字列より形態素を抽出する
ことにより文節ごと区分しかな漢字変換してかな漢字混
在文を作成すると共に、前記形態素を記憶する形態素解
析及びかな漢字変換部と、この形態素解析及びかな漢字
変換部により変換された前記かな漢字混在文のデータお
よび前記形態素情報を基にかな漢字混在文の構文解析を
行い前記かな漢字混在文を所定語に翻訳する翻訳処理部
と、この翻訳処理部により翻訳された文章を出力する出
力部とを具備している。
【0011】
【作用】本発明では、従来、独立動作していた形態素解
析部とかな漢字変換部とを融合して形態素解析及びかな
漢字変換部としたので、かな文字を形態素に区分しかな
漢字変換する処理を繰り返し行うことができる。
【0012】したがって、翻訳処理部は、最後に文節が
確定した時点での形態素情報を基に、かな文字をかな漢
字変換して得たかな漢字混在文を翻訳できるようにな
り、かな文をより正確に翻訳することができる。
【0013】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
【0014】図1は本発明に係る一実施例の翻訳装置の
構成を示す図である。
【0015】同図において、1はキーボードおよびマウ
スなどの入力部であり、かな文字で構成された文字列、
つまりかなの文章が入力されると共に、画面上の文字に
対する指示操作が行われる。2は形態素解析用辞書であ
り、かなのみの文章を形態素、例えば単語単位で区分す
るための多くの単語、例えば名詞、動詞、助詞などが格
納されている。3は、例えば後述する翻訳処理部4と共
にフロントエンドプロセッサ形態のソフトウェアとした
形態素解析及びかな漢字変換部であり、かなのみの文章
を形態素解析用辞書2を用いて形態素解析を行い、かな
漢字混在文を作成すると共に、形態素解析の結果、例え
ば文節の区切り位置などを記憶する。4は翻訳処理部で
あり、上記かな漢字混在文と形態素解析結果の情報を基
に構文解析を行って、変換されたかな漢字混在文を例え
ば英文などに翻訳する。5は表示モニタなどの出力部で
あり、入力されたかな文字、かな漢字変換された文章お
よび翻訳された英文などを表示する。
【0016】次に、図2のフローチャート、図3〜図9
を参照してこの翻訳装置の動作を説明する。
【0017】この実施例では、ユーザはこの翻訳装置が
組み込まれたメール作成用のアプリケーションを起動し
て日本語を入力して英文のメールを作成するものとす
る。
【0018】この場合、まず、入力部1よりかな文字で
構成された文字列、例えば「きょうはいしゃにいく」な
どが形態素解析及びかな漢字変換部3に入力される。
【0019】すると、形態素解析及びかな漢字変換部3
は、図3に示すように、まず、「きょうはいしゃにい
く」という文の文頭に文節開始ポインタ31を設定する
(ステップ201 )。そして文節開始ポインタ31の位置
が文末でなければ(ステップ202 )、形態素解析及びか
な漢字変換部3は、文節開始ポインタ31以下の文につ
いて、形態素解析用辞書2を参照して形態素解析を行い
(ステップ203 )、「きょう/はいしゃ/に/いく」と
いうように名詞、名詞、助詞、動詞などの単語単位で区
分し、図4に示すように、「今日/歯医者/に/行く」
というようにかな漢字変換を行う。そして形態素解析及
びかな漢字変換部3は、その文の最初の文節である単語
「今日」の後ろに文節終了ポインタ32を設定し(ステ
ップ204 )、それを、図5に示すように、「今日/歯医
者/に行く」というかな漢字混在文として表示する。
【0020】ここで、入力部1よりこの表示された文に
ついて、文節の区切り方が正しくないと入力されると
(ステップ205 )、形態素解析部及びかな漢字変換3
は、図6に示すように、文節終了ポインタ32を次の文
節、すなわち「きょうは」の後ろまで移動して文節の区
分を修正する(ステップ206 )。そして形態素解析及び
かな漢字変換部3は、この文節の区分に従って、文節開
始ポインタ31以下を形態素解析する(ステップ207
)。
【0021】この結果、図7に示すように、文書データ
は「京/は/医者/に/行く」というように名詞、助
詞、名詞、助詞、動詞などの単語に区分され、これを形
態素解析及びかな漢字変換部3は、第1の変換候補とし
てかな漢字変換を行い、この結果、表示モニタ5上に
は、図8に示すように、「京は/医者に/行く」という
文が表示される。
【0022】続いて形態素解析及びかな漢字変換部3
は、文節開始ポインタと終了ポインタに挟まれた文節
「京は」という文節が正しい否かをユーザに促す、いわ
ゆる判定待機状態となり、入力部1より正しくないと入
力されると(ステップ208 )、形態素解析及びかな漢字
変換部3は、文節開始ポインタと終了ポインタに挟まれ
た文節「京は」を他の候補、例えば「今日は」などに変
更し(ステップ209 )、図9に示すように、「今日は医
者に行く」と表示モニタ5に表示して判定待機状態とな
る。なお上記候補「今日は」が正しい場合、入力部1よ
り正しいと入力されると、この候補「今日は」が初めの
文節に確定し、この文節に関する形態素解析及びかな漢
字変換が終了する。なお図9の時点において、文書中の
翻訳対象となっている文節について、かな漢字変換結果
は正しい。
【0023】さらにこの対象文節よりも後ろの表示内容
が正しい場合は(ステップ210 )、形態素解析及びかな
漢字変換などが共に正しく行われていると判断し、上記
した形態素解析結果を用いて翻訳処理部4がかな漢字混
在文の構文解析を行い(ステップ211 )、かな漢字混在
文を英文に翻訳し(ステップ212 )、翻訳した結果を表
示モニタ5に表示する。
【0024】一方、対象文節よりも後ろの表示内容が正
しくない場合は、図10に示すように、文節開始ポイン
タ31をさらに後ろ、つまり文節終了ポインタ32の位
置まで移動した後、ステップ202 に戻り、上記各処理を
繰り返す。
【0025】このように本実施例の翻訳装置によれば、
かな漢字エンジンに機械翻訳エンジンをインプリメント
した形態素解析及びかな漢字変換部3にて形態素解析し
た結果が表示モニタ5に表示され、それをユーザが目で
見て修正できるので、形態素解析の間違いを減らすこと
ができ、これに続く翻訳処理では翻訳品質を向上するこ
とができる。
【0026】また従来、かな漢字エンジンや機械翻訳エ
ンジンなどが、それぞれ個々に持つ必要のあったかな漢
字変換用辞書および形態素解析用辞書などを1つにまと
める、いわゆる辞書機能の一元化が可能になる。
【0027】
【発明の効果】以上説明したように本発明の翻訳装置に
よれば、従来、独立して動作していた形態素解析部とか
な漢字変換部とを融合させて形態素解析及びかな漢字変
換部部とすることにより、形態素解析の結果を表示およ
び修正できるようになったので、翻訳品質を向上するこ
とができる。
【0028】また従来のように「今/日本…」というよ
うな文章が、「今日/本…」という文章に変換されるこ
とはなくなる。
【図面の簡単な説明】
【図1】本発明に係る一実施例の翻訳装置の構成を示す
図である。
【図2】この翻訳装置の動作を示すフローチャートであ
る。
【図3】この翻訳装置の文節開始ポインタの表示例を示
す図である。
【図4】この翻訳装置によりかな文字が形態素毎に区分
された状態を示す図である。
【図5】この翻訳装置の文節終了ポインタの表示例を示
す図である。
【図6】この翻訳装置により文節終了ポインタが移動さ
れた状態を示す図である。
【図7】図6の文節終了ポインタの位置でかな文字が形
態素毎に区分された状態を示す図である。
【図8】図7の形態素解析結果で、かな文字がかな漢字
変換された第1候補の表示例を示す図である。
【図9】図8の例に続いてかな漢字変換した第2候補の
例を示す図である。
【図10】文節決定後に文節終了ポインタの位置に文節
開始ポインタを移動した例を示す図である。
【符号の説明】
1…入力部、2…形態素解析用辞書、3…形態素解析及
びかな漢字変換部、4…翻訳処理部、5…表示モニタ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 8219−5L G06F 15/38 E

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 かな文字で構成された文字列が入力され
    る入力部と、 前記文字列より形態素を抽出するための多くの形態素が
    格納された形態素辞書と、 この形態素辞書を用いて前記文字列より形態素を抽出す
    ることにより文節ごと区分しかな漢字変換してかな漢字
    混在文を作成すると共に、前記形態素を記憶する形態素
    解析及びかな漢字変換部と、 この形態素解析及びかな漢字変換部により変換された前
    記かな漢字混在文のデータおよび前記形態素情報を基に
    かな漢字混在文の構文解析を行い前記かな漢字混在文を
    所定語に翻訳する翻訳処理部と、 この翻訳処理部により翻訳された文章を出力する出力部
    とを具備することを特徴とする翻訳装置。
JP5335319A 1993-12-28 1993-12-28 翻訳装置 Withdrawn JPH07200605A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5335319A JPH07200605A (ja) 1993-12-28 1993-12-28 翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5335319A JPH07200605A (ja) 1993-12-28 1993-12-28 翻訳装置

Publications (1)

Publication Number Publication Date
JPH07200605A true JPH07200605A (ja) 1995-08-04

Family

ID=18287197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5335319A Withdrawn JPH07200605A (ja) 1993-12-28 1993-12-28 翻訳装置

Country Status (1)

Country Link
JP (1) JPH07200605A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844749A (ja) * 1994-08-01 1996-02-16 Nec Corp 機械翻訳機能つきフロントエンド・プロセッサ
US20070201069A1 (en) * 2005-09-12 2007-08-30 Seiko Epson Corporation Image Editing Apparatus, Image Editing Method, and Printing Apparatus
JP2008134772A (ja) * 2006-11-28 2008-06-12 National Institute Of Information & Communication Technology 文書処理装置、文書の製造方法、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844749A (ja) * 1994-08-01 1996-02-16 Nec Corp 機械翻訳機能つきフロントエンド・プロセッサ
US20070201069A1 (en) * 2005-09-12 2007-08-30 Seiko Epson Corporation Image Editing Apparatus, Image Editing Method, and Printing Apparatus
US8526017B2 (en) * 2005-09-12 2013-09-03 Seiko Epson Corporation Image editing apparatus, image editing method, and printing apparatus
JP2008134772A (ja) * 2006-11-28 2008-06-12 National Institute Of Information & Communication Technology 文書処理装置、文書の製造方法、およびプログラム

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
US5893133A (en) Keyboard for a system and method for processing Chinese language text
US8005662B2 (en) Translation method, translation output method and storage medium, program, and computer used therewith
WO1997040453A1 (en) Automated natural language processing
JPS59165179A (ja) 辞書引方式
JPH07200605A (ja) 翻訳装置
JPH07334499A (ja) 文字列入力装置
JPH09153034A (ja) 文書作成装置及び文書作成方法
JPS60164864A (ja) デ−タ処理装置
JP2817497B2 (ja) 辞書編集装置
JP2894064B2 (ja) 機械翻訳装置
JPH01118961A (ja) 翻訳装置
JP3692711B2 (ja) 機械翻訳装置
JP2915225B2 (ja) 文書作成装置
Kawada Inputting Japanese from the keyboard
JP3244286B2 (ja) 翻訳処理装置
JPH06236399A (ja) 翻訳機能付きワードプロセッサ
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2947554B2 (ja) 機械翻訳装置
JP2864691B2 (ja) 学習支援装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH10171804A (ja) 機械翻訳装置
JPH05342253A (ja) 辞書構築支援装置及び辞書構築支援方法
JPH10320391A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010306