JPH11316758A - 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH11316758A
JPH11316758A JP10121494A JP12149498A JPH11316758A JP H11316758 A JPH11316758 A JP H11316758A JP 10121494 A JP10121494 A JP 10121494A JP 12149498 A JP12149498 A JP 12149498A JP H11316758 A JPH11316758 A JP H11316758A
Authority
JP
Japan
Prior art keywords
dictionary
program
procedure
morphological analysis
headword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10121494A
Other languages
English (en)
Inventor
Akiko Niimi
晶子 新美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP10121494A priority Critical patent/JPH11316758A/ja
Publication of JPH11316758A publication Critical patent/JPH11316758A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 形態素解析で用いるシステム辞書の語句をユ
ーザのニーズに合わせて削除できる、効率が良く精度が
高い形態素解析装置を提供すること。 【解決手段】システム辞書から削除したい見出し語があ
る場合、見出し語を入力し(S510:YES)、シス
テム辞書削除キーを操作し(S530:YES)、該当
する語句がシステム辞書にあれば(S540:YE
S)、見出し語が、形態素解析の検索対象である見出し
語フィールドから、検索対象から外れる一時的な待避場
所である見出し語隔離フィールドに移動され(S55
0)、この移動された語句の見出しは削除見出し語リス
トに追加される(S560)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、形態素解析装置及
びこの形態素解析装置を備えた機械翻訳装置及びこれら
のプログラムに関する。詳しくは、形態素解析に用いる
システム辞書についてユーザが削除したり復活させたり
することが可能な形態素解析の技術に関する。
【0002】
【従来の技術】従来、機械翻訳装置を始め、OCRやワ
ードプロセッサなど言語処理を行う機器は、入力された
言語を処理するために形態素解析が行なわれてきた。こ
の形態素解析は、入力した文字列について、辞書に格納
した見出し語を検索して分析をしていくため、分析に必
要な単語の見出し、品詞、意味、接続情報などの文法の
辞書情報を格納したシステム辞書が用意される。また、
ユーザが自由に設定できるユーザ辞書が用意されること
もあった。ここで、システム辞書については、形態素解
析のシステムの一部として組み込まれ、システム辞書に
不備があるとシステム全体が動かなくなったりするた
め、ユーザにはその内容については変更を許してないの
が普通だった。
【0003】もし、ユーザがシステム辞書に格納された
基本辞書の単語だけでは不足の場合には、システム辞書
に追加されシステム辞書として辞書検索される専門用語
などを格納した専門辞書を追加できるようにしていた。
また、ユーザが、単語の見出しや、その品詞、意味など
を自由に登録することができるユーザ辞書を用意し、ユ
ーザの必要とする単語を辞書として登録し検索できるよ
うにしていた。従って、ユーザとしては、システム辞書
にない単語については、ユーザ辞書に登録しておけばそ
のままユーザ辞書の内容がシステム辞書と同様に読み出
され、さらにシステム辞書に格納されている単語でも、
ユーザの辞書と異なる意味や品詞などを登録することに
よりシステム辞書に格納されている情報をマスクして、
システム辞書に優先してユーザ辞書の内容が読み出され
るようにして、ユーザの望む通りの正確な形態素解析を
行っていた。
【0004】
【発明が解決しようとする課題】しかしながら、ユーザ
が入力する入力文は多様であり、特に日本語の場合など
は、単語ごとの分かち書きをしないため、どの部分が単
語なのかシステム辞書を用いていちいち検索しなければ
単語の区切りの確定ができない。そのため、形態素解析
の最初の段階で、最長一致法のアルゴリズムとシステム
辞書を用いて、入力文を見出し語ごとに分割をする。
【0005】その際、例えば小さなネジを回転させた場
合に「回転させたこねじ」と入力すると、「させ」と
「させた」の後は、いずれの切り方も可能であるため確
定できず、より長い単語を検索するため、まず「させ」
の後で切ると名詞「たこ」が最長の単語として検索に成
功し「たこ」の部分で切れてしまうことになる。また
「こねじ」ではなく「ねじ」であっても正しい単語であ
るので元に戻って検索をやり直すようなことはなく、結
果「回転させ/たこ/ねじ」のように、名詞「たこ」と
いう単語がシステム辞書に格納されている限り「たこ」
という部分で単語が切れると判断されてしまう。たと
え、ユーザ辞書に「こねじ」という単語を登録したとし
ても、「こねじ」の「こ」は、既に「たこ」の「こ」と
認識されて確定されているので、「こねじ」という部分
では、単語として区切られることがないため、いくらユ
ーザ辞書に登録していても反映されることはなく、ユー
ザとしては、どうすることもできなかった。従って、こ
のような表現が頻出しても、ユーザは形態素解析後にい
ちいち書き換えるしかなく、ユーザにとって極めて煩雑
になるという問題があった。
【0006】一方、ユーザが勝手にシステム辞書を書き
換えることは、システム全体のバランスを崩すことにな
るため、システム辞書を編集することは完全に禁止され
ることが多かった。或いは、もし書き換えを許すとして
も一旦書き換えれば、元に戻すことが極めて困難になる
ため、システムを壊してしまったり、形態素解析の精度
を落とすことになりかねないという問題があった。
【0007】この発明は上記課題を解決するものであ
り、ユーザが指定した単語については一時的にシステム
辞書から見出語を削除することにより、ユーザの入力文
に適した辞書に変更することで、形態素解析の効率と精
度を上げることができる形態素解析装置であって、その
一方で、いつでも削除した単語の見出し語を復活させ、
容易にシステム辞書を初期状態に戻すことができるよう
にして、形態素解析装置全体のシステムが崩れない信頼
性が高い形態素解析装置を提供することを目的とする。
【0008】また、この形態素解析装置を利用した処理
効率の高い機械翻訳装置を提供することも目的の一つと
する。さらに、これらの処理をコンピュータに実行させ
るプログラムを記録した記録媒体を提供することも目的
の一つとする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の発明に係る形態素解析装置では、文字列
を入力する入力手段と、見出語と、品詞と、辞書情報と
を格納したシステム辞書と、前記システム辞書を検索し
て前記入力された文字列の形態素解析を行う形態素解析
手段と、任意の語句については前記形態素解析において
検索しないように指定する指定手段と、前記指定手段に
より検索しないように指定された語句を再び検索可能と
なるように指定を解除する解除手段とを備えたことを特
徴とする。
【0010】この構成による形態素解析装置では、誤検
索を引き起こす単語について、ユーザが一時的にシステ
ム辞書から削除したい場合に、簡単な操作で、この語句
を指定して削除でき、ユーザの思い通りの形態素解析が
できる自由度が高いシステムでありながら、指定して変
更した辞書を元に戻したいと思えばいつでも元に戻すこ
とができシステム全体を崩すことがない、高い信頼性を
有するシステムとすることができる。
【0011】請求項2に係る発明の形態素解析装置は、
請求項1に記載の形態素解析装置の構成に加え、前記指
定手段により指定された語句を表示する表示手段を有す
ることを特徴とする。
【0012】この構成による形態素解析装置では、指定
して変更した辞書の内容をいつでも確認ができるため、
辞書にどのような変更を加えたのか容易に把握でき、そ
の後の修正や削除した語句の復活などが容易にできる。
【0013】請求項3に係る発明の形態素解析装置は、
請求項1又は請求項2に記載の形態素解析装置の構成に
加え、前記指定手段により指定された内容を保存する保
存手段を備えることを特徴とする。
【0014】この構成による形態素解析装置では、請求
項1又は請求項2に記載の形態素解析装置の作用に加
え、ユーザが蓄積した辞書に対する変更の結果を保存す
ることができるので、他のユーザが使用する場合に、初
期状態に復帰させて使用したりさらに変更を加えて使用
しても、最初のユーザの辞書の変更が蓄積された指定内
容を保存しているため、再び最初のユーザの指定内容で
使用できる。また、複数の保存手段によれば、それぞれ
のユーザが自分に合わせた辞書の変更を呼び出して使用
できるようになる。
【0015】請求項4に係る発明の形態素解析装置は、
請求項3に記載の形態素解析装置の構成に加え、前記指
定手段に指定された内容を前記保存手段に保存したま
ま、前記形態素解析処理においてシステム辞書に格納さ
れたすべての語句の検索ができる全語句検索手段を備え
たことを特徴とする。
【0016】この構成による形態素解析装置では、請求
項3に記載の形態素解析装置の作用に加え、最初のユー
ザが辞書を変更して使用した場合、他のユーザは全語句
検索手段を用いることで、即座に辞書を初期状態にして
使用でき、また先のユーザも変更内容が保存されている
ため、自分が蓄積した辞書の変更内容に戻して用いるこ
とができる。
【0017】請求項5に係る発明の機械翻訳装置では、
原言語からなる文字列を入力する入力手段と、原言語で
ある第一言語文を目的言語である第二言語文に翻訳する
翻訳手段と、目的言語からなる翻訳文を表示する表示手
段を備えた機械翻訳装置であって、前記翻訳手段は、請
求項1乃至請求項4のいずれかに記載の形態素解析装置
を備えることを特徴とする。
【0018】この構成による機械翻訳装置では、請求項
1乃至請求項4のいずれかに記載の形態素解析装置の機
能を備えた機械翻訳装置を用いることで、自由度が高く
精度が高いものでありながら、システムが崩れることが
ない信頼性の高い機械翻訳装置となる。
【0019】請求項6に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、文字列を入力する入力の手順
と、
【0020】見出し語と、品詞と、辞書情報を格納した
システム辞書を検索して前記入力された文字列の形態素
解析を行う形態素解析の手順と、任意の語句については
前記形態素解析において検索しないように指定する指定
の手順と、前記指定の手順により検索しないように指定
された語句を再び検索可能となるように指定を解除する
解除の手順とを実行させる形態素解析処理プログラムを
記録していることを特徴とする。
【0021】この構成による記録媒体では、コンピュー
タに、誤検索を引き起こす単語についてユーザが辞書か
ら一時的に削除したい場合に、この語句を指定して削除
する手順を実行させることにより、ユーザの思い通りの
形態素解析をさせ、且つ、指定して変更した辞書を元に
戻したいと思えばいつでも元に戻す手順も実行させるこ
とができるので、自由度が高いシステムでありながらシ
ステム全体を崩すことなく安心して容易に辞書に変更を
加えることができる形態素解析処理を実行させることが
できる。
【0022】請求項7に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項6に記載の形態素解析処理プログラムの構
成に加え、前記コンピュータに、前記指定の手順により
指定された語句を表示する表示の手順を実行させるプロ
グラムを備えることを特徴とする。
【0023】この構成による記憶媒体では、コンピュー
タに、指定して変更した辞書の内容をいつでも確認がで
きるような手順を実行させることができるので、辞書に
どのような変更を加えたのか容易に把握でき、その後の
修正や削除した語句の復活などが容易にできる形態素解
析の手順を実行させることができる。
【0024】請求項8に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項6又は請求項7に記載の形態素解析処理プ
ログラムにおいて、前記指定の手順により指定された内
容を保存する保存の手順のプログラムを備えることを特
徴とする。
【0025】この構成による記憶媒体では、コンピュー
タに、ユーザが蓄積した辞書に対する変更の結果を保存
する手順を実行させることができるので、他のユーザが
使用する場合に、初期状態に復帰させて使用したり、さ
らに変更を加えて使用しても、保存されていた指定内容
により、最初のユーザが蓄積した辞書の変更を再び使用
できる形態素解析の手順を実行することができる。ま
た、コンピュータに複数の指定の内容を保存する保存の
手順を実行させることで、それぞれのユーザが自分に合
わせた辞書の変更を呼び出して使用できるようになる。
【0026】請求項9に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項8に記載の形態素解析処理プログラムにお
いて、前記コンピュータに、前記指定の手順により指定
された内容を前記保存の手順により保存したまま、前記
形態素解析においてシステム辞書に格納されたすべての
語句の検索ができる全語句検索の手順を実行させるプロ
グラムを備えたことを特徴とする。
【0027】この構成による記憶媒体では、コンピュー
タに、最初のユーザが辞書を変更して使用しても、他の
ユーザは全語句検索手段を用いる手順を実行させること
で、即座に初期状態で使用でき、また最初のユーザも変
更内容が保存されているため、自分が蓄積した辞書の変
更内容を用いることができる形態素解析の手順を実行す
る。
【0028】請求項10に係る発明の形態素解析処理プ
ログラムを備えた機械翻訳処理プログラムを記録したコ
ンピュータ読み取り可能な記録媒体では、前記コンピュ
ータに、原言語からなる文字列を入力する入力の手順
と、原言語である第一言語文を目的言語である第二言語
文に翻訳する翻訳手順と、目的言語からなる翻訳文を表
示する表示の手順とを実行させるプログラムを備えた機
械翻訳処理プログラムであって、前記翻訳の手順を実行
させるプログラムは、請求項5乃至請求項9のいずれか
に記載の形態素解析処理プログラムを備えることを特徴
とする。
【0029】この構成による記憶媒体は、コンピュータ
に、上述の機能を持った形態素解析装置を実行させるプ
ログラムを利用した機械翻訳装置を用いることで、自由
度が高く精度が高いものでありながら、システムが崩れ
ることがない信頼性の高い機械翻訳処理の手順を実行さ
せる。
【0030】
【発明の実施の形態】以下、本発明を具体化した一の実
施の形態の形態素解析装置を備えた機械翻訳装置につい
て図面を参照して説明する。尚、本実施の形態では、日
本語(第一言語)から英語(第二言語)に翻訳する場合
を例として説明する。
【0031】まず、図1に本実施の形態の機械翻訳装置
の概略構成を示すブロック図を示す。図1に示すよう
に、本実施形態の機械翻訳装置は、翻訳対象となる日本
語の原文や各種操作指示等を入力するためのキーボード
等からなる入力部2と、翻訳処理に利用されるシステム
辞書12やユーザ辞書14などの各種辞書が格納され、
ハードディスクや光ディスク等からなる外部記憶装置4
と、入力された日本語の原文や翻訳結果である英語の訳
文等を表示するためのCRT等からなる表示部6と、そ
の表示部6に表示するデータを制御する表示制御部7
と、翻訳結果である英語の訳文等を印刷して出力するた
めのレーザープリンタ等からなる印刷部8と、前記入力
部2や外部記憶装置4から入力されるデータに基づいて
翻訳処理を行い、その翻訳結果の表示部6での表示や、
印刷部8の出力等の制御を行う制御部10とから構成さ
れている。
【0032】前記入力部2には、図示しない、文字を入
力するための文字キー、各種処理を起動するための入力
文編集キー、翻訳実行キー、ユーザ辞書編集キー、シス
テム辞書見出し削除キー、システム辞書見出し復活キ
ー、登録キー、削除キー、キャンセルキー、出力文編集
キー、終了キー,及び印字実行キーといった各種機能キ
ー、入力文や出力文の編集、表示部6に表示されている
画面操作等に使用するカーソルキー、挿入キー、削除キ
ー、確定キー、及び次候補選択キー等が設けられてい
る。
【0033】更に、削除見出し語リスト表示キー、削除
見出し語リスト保存キー、システム辞書初期化キーなど
を独立して設けることもできる。
【0034】また、前記外部記憶装置4には、翻訳処理
に利用されるシステム辞書12とユザ辞書14が格納さ
れている。
【0035】ここで、機械翻訳装置が利用する辞書とし
ては、機械翻訳装置が予めシステムの一部として保有し
ている基本辞書であるシステム辞書12の他に、例えば
医学用語など専門分野毎に編集された図示してない専門
辞書、及びユーザが独自に構築するユーザ辞書14があ
る。専門辞書、ユーザ辞書14は任意に用いるもので基
本辞書だけでもシステムとしては稼動できる。ユーザ辞
書14、専門辞書を利用する際には、外部記憶装置4内
に格納して利用する。また、専門辞書は,各種専門分野
毎に、ユーザ辞書14は、例えば、ユーザ毎や利用分野
毎にそれぞれ複数個の辞書が同時に存在可能に構成され
ていてもよい。本実施形態では、便宜上基本辞書と専門
辞書を特に区別せずシステム辞書12と呼び、かつユー
ザ辞書14を1種類のみ利用した状況において説明す
る。
【0036】図6にシステム辞書12のデータ構成の一
例を示し、図2にユーザ辞書14のデータ構成の一例を
示す。個々の辞書登録情報は、それぞれ見出し語40/
30と、各見出し語の品詞42/32と、各見出し語に
対する訳語44/34と、その他の翻訳に必要な辞書情
報48/36とから構成されている。なお、システム辞
書12については、ユーザ辞書14のデータ構成に加
え、さらに隔離見出し語46のフィールドが設けられ、
見出し語40のフィールドから、指定された見出し語が
この隔離見出し語46のフィールドに待避される。この
フィールドに待避された隔離見出し語46は、形態素解
析の際の辞書検索の対象から外されることになる。
【0037】なお、画面表示において、システム辞書1
2の語句の指定による削除は、フィールドが移動される
という表示をし、内部的にも、実際にデータの保存場所
を移動する構成としているが、他の方法として、見出し
語自体の格納場所はそのままで、見出し語に削除を検出
するためのフラグを立てることで見出し語の削除を検出
するように構成してもよい。
【0038】次に、前記制御部10は、CPU18、R
0M20、RAM22、入出力ポート24、及びこれら
各部を結ぶバスライン26を備えた周知のコンピュータ
により構成されている。そして、制御部10において
は、ROM20に格納された以下のプログラムによって
各種処理が実行される。
【0039】制御プログラム202は、本実施の形態の
入出力や、各プログラムを制御し全体を統括するもので
ある。
【0040】翻訳プログラム204は、形態素解析プロ
グラム206、構文解析プログラム206、変換プログ
ラム210、生成プログラム212からなり、本機械翻
訳装置に入力された原言語文である日本語文章を、目的
言語文である英語の文章に翻訳するためのプログラムで
ある。
【0041】形態素解析プログラム206は、日本語文
章を辞書検索を行って、単語に分解し、同時にその単語
の情報を辞書から読み取り後の処理のため保存しておく
手順を実行させるものである。構文解析プログラム20
6は、形態素解析を行って単語に分解された日本文を、
辞書に記載された文法情報をもとに、修飾関係を木(ツ
リー)構造で記述する手順を実行させるものである。変
換プログラム210は、原言語の単語を、目的言語ここ
では日本語を対応する英語に変換する手順を実行させる
ものである。生成プログラム212は、木構造に記述さ
れ英語に変換された入力文を、目的言語の文法に従っ
て、ここでは英語の文章に構成し直す構文生成を行い、
さらに文法に従って細部を調整し最終的な訳文を生成す
る形態素生成の手順を実行させる。
【0042】辞書編集プログラム214は、隔離見出し
語指定・解除プログラム216と、隔離見出し語保存プ
ログラム218と、隔離見出し語表示プログラム220
と、ユーザ辞書編集プログラムから構成される。
【0043】隔離見出し語保存プログラム218は、隔
離見出し語46のフィールドに移動された語句を記憶さ
せる手順を実行する。そして、一旦初期化されたシステ
ム辞書12について、この記憶された語句の見出し語を
呼び出して見出し語40のフィールドから一括して隔離
見出し語46のフィールドに移動させる手順を実行させ
る。
【0044】システム辞書初期化プログラム221は、
指定されてシステム辞書12の隔離見出し語46のフィ
ールド46に移動した見出し語をすべて見出し語40の
フィールドに戻すものである。そして、システム辞書1
2の初期状態で検索ができるようにするプログラムであ
る。なお、システム辞書初期化プログラム221により
初期化されたシステム辞書12は、隔離見出し語保存プ
ログラム218により隔離見出し語保存ファイル16に
隔離見出し語46を記憶させておけば、ここに記憶させ
た情報をもとに初期化前の変更されたシステム辞書12
の状態に戻すことが可能である。なお、本発明の全語句
検索手段及び手順は、システム辞書12の初期化をせず
に、隔離見出し語46のフィールドの見出し語も検索可
能にして、全語句を検索できるような手順を実行させる
ような構成であってもよい。
【0045】RAM22には、入力部から入力される日
本語の原文、及び翻訳・編集処理により翻訳、編集され
た英語の訳文が格納される。
【0046】作業領域222は、各種処理のため、文字
列やパラメータを一時的に記憶しておく領域である。
【0047】原言語文記憶領域224は、入力された原
言語文をテキストデータの形で記憶しておく領域であ
る。
【0048】訳文記憶領域226は、翻訳された目的言
語文を、表示・印刷・編集のためテキストデータの形で
記憶しておく領域である。
【0049】入出力ポート24は、例えば、電話回線等
を経由してインターネットから有線で入出力したり、音
声認識装置などの各種入力機器から入力したりする場合
のインターフェイスとなるもので、この意味で本発明の
入力手段を構成し得る。
【0050】バスライン26は、各機器のデータ等をや
り取りするためのアドレスバス、データバス、制御バス
からなるものである。
【0051】続いて、制御部10が実行する翻訳,編集
処理について図3〜図5に示すフローチャートに従って
説明する。
【0052】図3に示すように、翻訳・編集処理が実行
されると、まず、ユーザにより入力部2の文字キー等が
操作され(ステップ110(以下、S110と略称す
る。他のステップも同様))、翻訳対象となる日本語の
原文を入力するのを待つ。ここで、原文の入力は,既に
作成されて外部記憶装置4に格納されたデータや入出力
ポート24から原言語文記憶領域222に読み込むよう
に構成してもよい。そして、日本語の原文(以下、入力
文)が入力されると、この入力文を、表示部6の所定の
エリアに表示する(S120)。
【0053】次に、入力部2に設けられた入力文編集キ
ーが操作されたか否かを判断し(S130)、操作され
ていなければ(S130:NO)、翻訳実行キーの操作
の有無が判断される(S150)。また、入力文編集キ
ーが操作されていれば(Sl30:YES)、入力文編
集処理を実行する(S140)。尚、入力文編集処理が
実行されると、ユーザは表示部6の所定のエリアに表示
された入力文を、入力部2に設けられたカーソルキー、
削除キー、挿入キー及び文字キー等を使用して直接修正
することが可能となる。入力文編集キーが押されていな
い場合には、入力部2に設けられた翻訳実行キーが操作
されたか否かを判断し(S150)、操作されていなけ
れば(S150:NO)、辞書編集キーの操作の有無が
判断され(S190)、また、翻訳実行キーが操作され
ていれば(S150:YES)、日本語の入力文を英語
の訳文(以下、出力文とする)に翻訳する翻訳処理を実
行し(S160)、翻訳処理により得られた出力文を入
力文と対にしてRAM22に格納する(S170)と共
に、表示部6に設けられた所定のエリアにそれぞれ入力
文と出力文とを表示する(S180)。
【0054】尚、翻訳処理は、入力文全部を一括して実
行しても良いし、文章単位で範囲を指定し、指定された
範囲の文章のみについて実行するようにしてもよい。
【0055】翻訳実行キーが押されていない場合は(S
150:NO)、辞書編集キーが操作されたか否かを判
断し(S190)、操作されていなければ(S190:
NO)、出力文編集キーの操作の有無が判断される(S
210)。また、辞書編集キーが操作されていれば(S
190:YES)、辞書編集処理を実行する(S20
0)。尚辞書編集処理が実行されると、ユーザはシステ
ム辞書12及びユーザ辞書14に登録されている情報の
内容を修正したり、削除したり、新たに必要な見出し語
を登録することが可能となる。このS200の処理が、
本発明の辞書編集手段若しくは辞書編集プログラムとし
て機能している。
【0056】S210では、入力部2に設けられた出力
文編集キーが操作されたか否かを判断し,操作されてい
なければ(S210:NO)、終了キーの操作の有無が
判断される(S230)。また、出力文編集キーが操作
されていれば(S210:YES)、出力文編集処理を
実行する(S220)。尚、出力文編集処理が実行され
ると、ユーザは先のS160において翻訳処理が実行さ
れることにより表示部6の所定のエリアに表示される出
力文(英語の訳文)を、S140の入力文編集処理と同
様に、入力部2に設けられたカーソルキー、削除キー、
挿入キー及び文字キー等を使用して、直接修正すること
が可能となる。
【0057】出力文編集キーが押されていなければ(S
210:NO)入力部2に設けられた終了キーが操作さ
れたか否かを判断し(S230)、操作されてなければ
(S230:NO)、他のキー、例えば、翻訳された出
力文を印刷部8に出力し印刷させる印刷実行キー等、そ
の他のキー操作を検出すると共に、操作されたキーに応
じた処理を実行する(S240)。
【0058】即ち、S130、S150、S190、S
210、S230の各ステップにより入力文編集キー、
翻訳実行キー、辞書編集キー、出力文編集キー、終了キ
ーのいずれかが操作されるのを待機する操作待ちのルー
プが形成されている。
【0059】そして、入力文編集処理(S140)、入
力文と出力文の表示(S180)、辞書編集処理(S2
00)、出力文編集処理(S220)、他のキー処理
(S240)の各処理が実行された後は、前述の操作待
機状態に戻る。
【0060】処理を終了したいときには、終了キーを操
作すると、これが検出され(S230:YES)、本処
理を終了する(END)。
【0061】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部2に設けられた各種
キーの操作に従って、入力文の編集処理、翻訳処理、辞
書編集処理、及び出力文編集処理といった各種処理が実
行される。そして、もし、翻訳実行キーを操作し翻訳処
理を実行したが、得られた出力文(英語の訳文)が不正
確であったり不自然であったりする場合には、入力文編
集キーを操作して入力文編集処理を実行し,入力文であ
る日本語の原文を再編集した後、またはユーザ辞書編集
キーを操作してユーザ辞書14を編集した後、再度、翻
訳実行キーを操作して再翻訳させるか,あるいは出力文
編集キーを操作して出力文編集処理を実行し、出力文で
ある英語の訳文を直接編集する。
【0062】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部8から出力したり、テキ
ストデータとしてRAM22や外部記憶装置4に保存し
(S240)、その後、終了キーを操作して(S23
0),処理を終了する(END)。
【0063】次に、図4に示すフローチャートに従っ
て、図3に示すフローチャート中のS200において前
半に実行され、ユーザがシステム辞書12やユーザ辞書
14の内容を修正したり、削除したり、新たに必要な見
出し語を登録する辞書編集処理について説明する。な
お、S200の辞書編集処理は、この見出し語編集・削
除処理に続いて、図5に示す見出し語復活処理の二つの
処理から構成されている。
【0064】まず、見出し語編集削除処理では、ユーザ
が編集したい見出し語を入力したか否かを判断し(S5
10)、入力されなければ(S510:NO)終了キー
を押さない限り(S500:NO)入力待機の状態とな
り、入力されれば(S510:YES)、品詞が入力さ
れたか否かを判断する(S520)。新たな見出し語の
登録や、既存の見出し語の更新でない場合は、システム
辞書の見出し語の削除の場合であるため、品詞の入力の
必要はなく(S520:NO)、システム辞書見出し削
除キーが操作されたか否かを判断する(S530)。入
力した品詞を入力しなかったが(S520:NO)、シ
ステム辞書の削除のキーも押さなかったような場合(S
530:NO)、再度品詞が入力されたか否かが判断さ
れ(S520)、品詞の入力(S520:YES)か、
削除キーの操作(S530:YES)かのいずれかの操
作がされるまで操作待ちの状態となる(S520:N
O、S530:NO)。削除キーが操作されれば(S5
30:YES)、その見出し語がシステム辞書にあるか
否かが検索され(S540)、システム辞書にある場合
には(S540:YES)、見出し語のフィールドか
ら、見出し語を隔離のフィールドへ移し(S550)、
システム辞書削除見出し語ファイル16のリストに見出
し語を追加する(S560)。
【0065】S520で品詞が入力された場合(S52
0:YES)、編集しようとする見出し語が新規な登録
をしようとするのか、既存の登録後の編集をしようとす
るのか入力された単語がユーザ辞書に存在するか否かを
検索する(S570)。入力された見出し語がユーザ辞
書14での検索が成功し存在するとされれば(S57
0:YES)、ユーザ辞書14内で検索された見出し
語、訳語やその他の辞書情報を呼び出して再編集に備え
(S590)、編集処理(S600)へ移行する。ユー
ザ辞書14での検索が失敗すれば(S570:NO)、
新規な登録として新規に見出し語を編集するためのテン
プレートが用意される(S580)。
【0066】そしてこれらのデータが呼び出された既登
録の見出し語や、テンプレートが用意された新規な見出
し語は、訳語、さらに、その他の辞書情報がユーザによ
り編集され(S600)、編集が完了した後、登録をす
るか否かが登録キーが操作されたか否かで判断され(S
610)、登録キーが操作されていなければ(S61
0:NO)、削除キーが操作されたか否かを判断する
(S620)。削除しないのであれば、削除キーを操作
せず(S620:NO)、さらにキャンセルキーが操作
されたか否かが判断される(S630)。キャンセルキ
ーも操作されていなければ(S630:NO)、再度登
録をするか否かを判断するためS610へ戻り、いずれ
かのキーが押されるまで待機のループとなる(S61
0:NO、S620:NO、S630:NO)。
【0067】登録をする場合(S610:YES)、又
は削除をする場合(S620:YES)、ユーザ辞書1
4のこれらの見出し語のデータを更新し(S640)、
終了しなければ(S500:NO)、次の見出し語の入
力を待つ(S510)。システム辞書の削除のキーは押
したが(S530:YES)システム辞書には該当する
見出し語がなかったような場合(S540:NO)、シ
ステム辞書から該当見出し語を削除し終わった場合(S
560)も、新たな見出し入力の待機の状態に戻る(S
510)。新たに見出し語の入力が完了した場合は(S
510:NO)、終了キーを操作して(S500:YE
S)、見出し語編集削除処理を終了する。そして、続い
て図5に示す見出し語復活の処理に移行する。
【0068】図4のフローチャートを具体例で説明する
と、初期状態のシステム辞書には「てこ」という単語
が、もともと格納されているとすれば、見出し語40の
フィールドに「てこ」という見出しが存在し、形態素解
析の際に検索の対象とされるが、辞書編集処理(S20
0)で、見出し語として「てこ」が入力され(S51
0)かつ、システム辞書削除キーが操作された場合(S
530:YES)、システム辞書には「てこ」という単
語が存在するため(S540:YES)、見出し語「て
こ」は、見出し語40のフィールドから隔離見出し語4
6のフィールドへ移動され、且つ削除見出し語リストに
「てこ」の見出し語が追加される(S560)。
【0069】次に、図5に示すフローチャートに従っ
て、図3に示すフローチャート中のS200において図
4の見出し語編集削除処理に続いて実行されユーザが削
除キーを操作して図4のS550で削除した見出し語を
復活する見出し語復活処理について説明する。
【0070】先ず、見出し語編集削除処理が終了すると
(図4:END)、処理を中止しなければ(S670:
NO)、削除された見出し語を一括して復活させるシス
テム辞書初期化をするか否かが判断される(S68
0)。すべての削除された見出し語を復活する、即ちシ
ステム辞書の初期化をしたい場合はシステム辞書初期化
キーを操作すれば(S680:YES)、システム辞書
の隔離見出し語46のフィールドにある見出し語をすべ
て見出し語40のフィールドに戻してシステム辞書12
を初期状態にする(S690)。
【0071】削除されたすべての見出し語を復活はしな
いが、一部の削除された見出し語を復活させるために
は、システム辞書の削除見出し語のリストを表示する削
除見出し語リスト表示キーを操作すると、操作されたか
否かが判断され(S700)、操作されていれば(S7
00:YES)、隔離見出し語保存ファイルに16に保
存されている隔離見出し語保存リストを呼び出して表示
し(S710)、ユーザが表示されたリストから復活さ
せたい削除見出し語を選択キーを操作して選択する。選
択すると、削除見出し語を復活させる復活キーを操作し
たか否かが判断され(S720)、システム辞書見出し
復活キーが操作されていれば(S720:YES)、隔
離見出し語46のフィールドに隔離されていた復活させ
たい見出し語を見出し語のフィールドへコピーして(S
730)、隔離見出し語内の見出し語データを削除する
(S740)ことにより、見出し語がシステム辞書の隔
離見出し語46のフィールドから見出し語40のフィー
ルドに移動され、検索対象として復活する。それと同時
に隔離見出し語保存リストから当該単語が削除される。
その後、S670に戻り、終了キー、システム辞書初期
化キー、削除見出し語表示キーの3つのキーのいずれか
の操作待ちの状態になる(S670:NO、S680:
NO、S700:NO)。終了キーを操作すれば(S6
70:YES)、見出し語復活処理が終了し、辞書編集
処理(S200)が終了する。
【0072】本実施の形態では、形態素解析の処理ごと
に、形態素解析に用いない単語をその都度隔離見出し語
指定・解除プログラム214により指示して削除するよ
うに構成されているが、処理に使用したシステム辞書の
削除見出し語保存リストを削除見出し語リスト保存キー
を操作することで隔離見出し語保存プログラム218に
より外部記憶装置4の隔離見出し語保存ファイル16に
格納しておけば、次回の形態素解析処理の際に、削除見
出し語表示キーを操作して隔離見出し語表示プログラム
220により削除されるべき単語を呼び出してシステム
辞書を書き換え、書き換えられたシステム辞書により処
理をするように構成することもできる。
【0073】更に、次回の形態素解析処理の際には、自
動的に削除見出し語ファイル16から情報を呼び出し、
前回の処理に用いたシステム辞書を用いるようにされて
おり、初期状態で使用したい場合には、システム辞書初
期化キーを操作することですべてのシステム辞書の単語
を検索できるように、システム辞書初期化プログラム2
21により、システム辞書の隔離見出し語46に存在す
る単語をすべて見出し語40のフィールドに移動させる
こともできるように構成されている。この場合、隔離見
出し語46は、隔離見出し語保存キーを操作すること
で、隔離見出し語保存プログラムにより外部記憶装置4
の隔離見出し語保存ファイル16に内容を格納しておく
ようにすることができる。そうすれば、一旦システム辞
書初期化キーを操作してシステム辞書初期化プログラム
221によりシステム辞書12が初期化されても、隔離
見出し語保存ファイル16から隔離見出し語表示プログ
ラム220により削除見出し語リストを呼び出し、画面
上で確認してシステム辞書の内容を変更して使用するこ
とができる。
【0074】もちろん隔離見出し語保存ファイル16
は、複数の削除見出し語リストを保存でき、複数人で装
置を使用する場合など、夫々の業務にあった仕様で処理
作業ができる。更に、システム辞書の不整合などの理由
から形態素解析が正常に処理されないようになったら、
システム辞書初期化キーを操作するだけで、複雑な操作
なしで、システム辞書初期化プログラム221により直
ちにシステム辞書が初期状態に復帰し、正常な処理がで
きる。
【0075】次に、図7示すフローチャートに従って、
図3に示すフローチャート中のS160において実行さ
れ、第一言語文による入力文(本実施の形態では日本語
文)から第二言語文による出力文(英語の訳文)に翻訳
する翻訳処理について、説明する。
【0076】まず、形態素解析処理内の予め定められた
判断規則とシステム辞書12の削除されてない見出し語
40とユーザ辞書14内の接続情報とを用いて、見出し
語を検索する。システム辞書12かまたはユーザ辞書1
4内の見出し語が検索できたものに対して、訳語、品
詞、といった検索情報を形態素解析結果に付与する形態
素解析処理を実行する(S250)。もし、ユーザ辞
書、専門辞書を利用する場合は、ユーザ辞書、専門辞
書、基本辞書の順に優先される。
【0077】S250における形態素解析処理の結果を
受け取り、ROM20の構文解析プログラム208に格
納されている予め定められた解析文法を用いて、日本語
の構造を解析する解析処理を実行する(S260)。
【0078】続いて、ROM20の変換プログラム21
0に格納されている予め定められた変換文法を用いて、
解析処理により解析された日本語の構造を英語の構造に
変換すると共に、個々の単語を英語に置き換える変換処
理を実行する(S270)。変換された文字列は、RO
M20の生成プログラム212に格納されている予め定
められた生成文法を用いて、変換処理により変換された
英語の構造から英語の語順を決定したり、英語に特有の
冠詞を生成したり、入力文に存在しなくても出力文には
必須の主語を補充したり、テンス、アスぺクト、人称及
び数素性等を処理し、英語の単語列から成る出力文を生
成する生成処理を実行する(S280)。
【0079】生成処理により生成された英語の単語列に
対して、ROM20の生成プログラム212に格納され
ている予め定められた形態素生成規則を用いて、名詞の
複数形,動詞の過去、過去分詞等の活用形を生成して、
出力文を得る形態素生成処理を実行して(S290)翻
訳処理を終了する(END)。
【0080】次に、本実施の形態の機械翻訳装置におけ
る処理を具体例を用いて説明する。入力文が「軸受けを
回転させてこねじ支えを固定する」とである場合、シス
テム辞書に名詞「てこ」があると、形態素解析結果は
「軸受け(名詞)/を(助詞)/回転する(動詞)/せ
る(助動詞)/てこ(名詞)/ねじ(名詞)/支え(名
詞)/を(助詞)/固定する(動詞)」となる。このた
め、出力文は”A shaft Carrier is
turned and a lever screw
support is fixed.”となる。ユー
ザが「こねじ支え(名詞)”small screw
holder”」を登録しても、最長一致のアルゴリズ
ムである場合は、辞書検索に成功した語句同士であれ
ば、より長い文字列の方が先に検索されるため、名詞
「てこ」が文節の切れ目として認識されるため、どうし
ても「てこ」が第一解となり、ユーザ辞書を使うことが
できない。従って、この「てこ(名詞)」を削除しなけ
ればならない。そこで、名詞「てこ」をシステム辞書か
ら削除するため、本実施例の機械翻訳装置を立上げ、辞
書編集キーを操作して図3のS200辞書編集処理に行
く。ここでは、まず、見出し語である「てこ」を入力し
(S510)、品詞「名詞」は入力せず、システム辞書
削除キーを操作する(S530)。そうすれば、前述の
ように「てこ」が検索され、これが削除されて、図6の
ように、見出し語40の「てこ」が削除され、隔離見出
し語46のフィールドに移動して「てこ」が格納された
状態になる。
【0081】ここで、再度「軸受けを回転させてこねじ
支えを固定する」の文を入力して、形態素解析をさせる
と、今度は、「てこ(名詞)」を辞書検索の対象から外
して形態素解析を行うため、前述のように「てこ」を名
詞として認識することなく、且つユーザ辞書の「こねじ
支え」を最長の名詞として認識するため、正しい形態素
解析を行うことができる。
【0082】しかし、一方で、実際に「てこ(名詞)」
として用いる場合、例えば、「みんなで発表したてこの
実験」を、先ほどの「てこ」を辞書からを削除した状態
で形態素解析を行うと、形態素解析の結果「てこ」を検
索しないため、不都合を生じる。
【0083】なお、本実施の形態においては、制御プロ
グラム202が、CPU18を本発明の入力手段として
入力部2と共に機能させるものであり、この制御プログ
ラム202が本発明の入力の手順をコンピュータに実行
させる。
【0084】また、システム辞書12が、本発明のシス
テム辞書に相当する。
【0085】また、形態素解析プログラム206が、C
PU18を本発明の形態素解析手段として機能させるも
のであり、この形態素解析プログラム206が本発明の
形態素解析の手順をコンピュータに実行させる。
【0086】また、隔離見出し語指定・解除プログラム
216が、CPU18を本発明の指定手段及び解除手段
として機能させるものであり、この隔離見出し語指定・
解除プログラム216が本発明の指定の手順及び解除の
手順をコンピュータに実行させる。
【0087】また、隔離見出し語表示プログラム220
が、CPU18を本発明の表示手段として機能させるも
のであり、隔離見出し表示プログラム220が本発明の
表示の手順をコンピュータに実行させる。
【0088】また、隔離見出し語保存プログラム218
が、CPU18を本発明の保存手段として機能させるも
のであり、この隔離見出し語保存プログラム218が本
発明の保存の手順をコンピュータに実行させる。
【0089】そして、システム辞書初期化プログラム2
21が、CPU18に本発明の全語句検索手段として機
能させるものであり、システム辞書初期化プログラム2
21が本発明の全語句検索の手順をコンピュータに実行
させる。
【0090】以上、本発明を一の実施の形態をもって詳
細に説明したが、本発明は上記の実施の形態に限定され
るものではなく、特許請求の記載の範囲を逸脱しない限
り種々の変更を加え実施することができる。
【0091】本実施の形態では、入力した言語は日本語
であったが、特に言語の種類は問わず、種々の言語に適
用できる。
【0092】今回は辞書編集手段の中にシステム辞書の
編集処理を含めているが、これは機械翻訳装置全体の処
理の流れを考えて、別メニューとしてユーザに提供して
も良い。
【0093】また、今回は出力文しか表示する機構を示
していないが、どのように形態素解析処理がなされたか
を表示して、ユーザがユーザ辞書を編集したり、システ
ム辞書の見出し語を削除したりという処理を行いやすく
することも可能である。これまでは、ユーザはあくまで
もユーザ辞書の範疇でしかカスタマイズできなかった
が、このようにシステム辞書の整合性を保ちつつ、カス
タマイズができれば、ユーザの自由が広がり、翻訳精度
の向上と後編集の軽減が可能になる。
【0094】さらに、本実施の形態では、機械翻訳装置
を例に挙げたが、文章を入力してこれを処理する機械、
例えばOCR(光学式文字読み取り装置)、音声認識装
置、ワードプロセッサなど何らかの形で文字列を入力し
てこの文字列を処理する装置に適用できる。
【0095】なお、本実施の形態の機械翻訳装置は、プ
ログラムをROMに格納して実施するが、このプログラ
ムをハードディスクにインストールしてプログラムを実
行すれば、ハードディスクが本発明の記録媒体に相当す
る。その他、各種記録媒体により実施できることは言う
までもない。
【0096】
【発明の効果】以上の説明から明らかなように、請求項
1の発明に係る形態素解析装置では、文字列を入力する
入力手段と、見出し語と、品詞と、辞書情報とを格納し
たシステム辞書と、前記システム辞書を検索して前記入
力された文字列の形態素解析を行う形態素解析手段と、
任意の語句については前記形態素解析において検索しな
いように指定する指定手段と、前記指定手段により検索
しないように指定された語句を再び検索可能となるよう
に指定を解除する解除手段とを備えているため、誤検索
を引き起こす単語について、ユーザが一時的にシステム
辞書から削除したい場合に、簡単な操作で削除できると
いう効果がある。そのため、語句を指定して削除するこ
とにより、ユーザの思い通りの形態素解析ができる自由
度が高いシステムとすることができる。また、指定して
変更した辞書を元に戻したいと思えばいつでも元に戻す
ことができるという効果がある。そのため、システム辞
書を不当に変更してシステム全体が崩れ、システムが不
調になってしまったような場合でも、容易にシステム辞
書を初期状態の戻すことができ、システムとして高い信
頼性も有する。
【0097】請求項2に係る発明の形態素解析装置は、
請求項1に記載の形態素解析装置の構成に加え、前記指
定手段により指定された語句を表示する表示手段を有す
ることを特徴とするため、指定して変更した辞書の内容
をいつでも確認ができるという効果がある。そのため、
辞書にどのような変更を加えたのか容易に把握でき、そ
の後の修正や削除した語句の復活などが容易にできると
いう効果を奏する。
【0098】請求項3に係る発明の形態素解析装置は、
請求項1又は請求項2に記載の形態素解析装置の構成に
加え、前記システム辞書は、前記指定手段により指定さ
れた内容を保存する保存手段を備えることを特徴とする
ため、請求項1又は請求項2に記載の形態素解析装置の
効果に加え、ユーザが蓄積した辞書に対する変更の結果
を保存することができるという効果がある。そのため、
他のユーザが使用する場合に、初期状態に復帰させて使
用したりさらに変更を加えて使用しても、保存されてい
た指定内容により蓄積された最初のユーザの辞書の変更
を指定して再び使用できるという効果を奏する。また、
複数の保存手段によれば、それぞれのユーザが自分に合
わせた辞書の変更を呼び出して使用できるという効果も
ある。
【0099】請求項4に係る発明の形態素解析装置は、
請求項3に記載の形態素解析装置の構成に加え、前記指
定手段に指定された内容を前記保存手段に保存したま
ま、前記形態素解析処理においてシステム辞書に格納さ
れたすべての語句の検索ができる全語句検索手段を備え
たことを特徴とするため、請求項3に記載の形態素解析
装置の効果に加え、最初のユーザが辞書を変更して使用
した場合、他のユーザは全語句検索手段を用いること
で、即座に辞書を初期状態にして使用できるという効果
がある。また先のユーザも変更内容が保存されているた
め、自分が蓄積した辞書の変更内容に戻して用いること
ができるという効果もある。
【0100】請求項5に係る発明の機械翻訳装置では、
原言語からなる文字列を入力する入力手段と、原言語で
ある第一言語文を目的言語である第二言語文に翻訳する
翻訳手段と、目的言語からなる翻訳文を表示する表示手
段を備えた機械翻訳装置であって、前記翻訳手段は、請
求項1乃至請求項4のいずれかに記載の形態素解析装置
を備えることを特徴とするため、請求項1乃至請求項4
のいずれかに記載の形態素解析装置の機能を備えた機械
翻訳装置を用いることで、自由度が高く精度が高いもの
でありながら、システムが崩れることがない信頼性の高
い機械翻訳装置とできるという効果がある。
【0101】請求項6に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに文字列を入力する入力の手順と、
見出し語と、品詞と、辞書情報を格納したシステム辞書
を検索して前記入力された文字列の形態素解析を行う形
態素解析の手順と、任意の語句については前記形態素解
析において検索しないように指定する指定の手順と、前
記指定の手順により検索しないように指定された語句を
再び検索可能となるように指定を解除する解除の手順と
を実行させることを特徴とするため、コンピュータに、
誤検索を引き起こす単語についてユーザが辞書から一時
的に削除したい場合に、この語句を指定して削除する手
順を実行させることにより、ユーザの思い通りの形態素
解析をさせ、且つ、指定して変更した辞書を元に戻した
いと思えばいつでも元に戻す手順も実行させることがで
きるという効果がある。そのため、自由度が高いシステ
ムでありながらシステム全体を崩すことなく安心して容
易に辞書に変更を加えることができる形態素解析処理を
実行させることができるという効果を奏する。
【0102】請求項7に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項6に記載の形態素解析処理プログラムの構
成に加え、前記コンピュータに、前記指定の手順により
指定された語句を表示する表示の手順を実行させるプロ
グラムを備えることを特徴とするため、コンピュータ
に、指定して変更した辞書の内容をいつでも確認ができ
るような手順を実行させることができるという効果があ
る。そのため、辞書にどのような変更を加えたのか容易
に把握でき、その後の修正や削除した語句の復活などが
容易にできる形態素解析の手順を実行させることができ
るという効果を奏する。
【0103】請求項8に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項6又は請求項7に記載の形態素解析処理プ
ログラムにおいて、前記システム辞書編集の手順は、前
記指定の手順により指定された内容を保存する保存の手
順を備えることを特徴とするため、コンピュータに、ユ
ーザが蓄積した辞書に対する変更の結果を保存する手順
を実行させることができるという効果がある。そのた
め、他のユーザが使用する場合に、初期状態に復帰させ
て使用したり、さらに変更を加えて使用しても、保存さ
れていた指定内容により、最初のユーザが蓄積した辞書
の変更を再び使用できる形態素解析の手順を実行するこ
とができるという効果を奏する。また、コンピュータに
複数の指定の内容を保存する保存の手順を実行させるこ
とで、それぞれのユーザが自分に合わせた辞書の変更を
呼び出して使用できるようになるという効果もある。
【0104】請求項9に係る発明の形態素解析処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項8に記載の形態素解析処理プログラムにお
いて、コンピュータに、前記指定の手順により指定され
た内容を前記保存の手順により保存したまま、前記形態
素解析においてシステム辞書に格納されたすべての語句
の検索ができる全語句検索の手順を実行させるプログラ
ムを備えたことを特徴とするため、コンピュータに、最
初のユーザが辞書を変更して使用しても、他のユーザは
全語句検索手段を用いる手順を実行させることで、即座
に初期状態で使用できるという効果がある。また最初の
ユーザも変更内容が保存されているため、自分が蓄積し
た辞書の変更内容を用いることができる形態素解析の手
順を実行することができるという効果もある。
【0105】請求項10に係る発明の形態素解析処理プ
ログラムを備えた機械翻訳処理プログラムを記録したコ
ンピュータ読み取り可能な記録媒体では、コンピュータ
に、原言語からなる文字列を入力する入力の手順と、原
言語である第一言語文を目的言語である第二言語文に翻
訳する翻訳手順と、目的言語からなる翻訳文を表示する
表示の手順とを実行させるプログラムを備えた機械翻訳
処理プログラムであって、前記翻訳の手順を実行させる
プログラムは、請求項5乃至請求項9のいずれかに記載
の形態素解析処理プログラムを備えることを特徴とする
ため、コンピュータに、上述の機能を持った形態素解析
装置を実行させるプログラムを利用した機械翻訳装置を
用いることで、自由度が高く精度が高いものでありなが
ら、システムが崩れることがない信頼性の高い機械翻訳
処理の手順を実行させることができるという効果があ
る。
【図面の簡単な説明】
【図1】本実施形態の機械翻訳装置の概略構成を示すブ
ロック図である。
【図2】ユーザ辞書14のデータ構成の一例を示す図で
ある。
【図3】制御部10が実行する翻訳、編集処理について
のフローチャートである。
【図4】図3中のS200において実行される辞書編集
処理のうち前半で処理される見出し語編集削除処理につ
いてのフローチャートである。
【図5】図3中のS200において実行される辞書編集
処理のうち後半で処理される見出し語復活処理について
のフローチャートである。
【図6】システム辞書12のデータ構成の一例を示す図
である。
【図7】図3中のS160において実行される翻訳処理
についてのフローチャートである。
【符号の説明】
2 入力部(入力手段) 4 外部記憶装置 6 表示部 7 表示制御部 8 印刷部 10 制御部 12 システム辞書 14 ユーザ辞書 16 隔離見出し語保存ファイル 18 CPU 20 ROM 22 RAM 24 入出力ポート 26 バスライン 202 制御プログラム 204 翻訳プログラム 206 形態素解析プログラム 208 構文解析プログラム 210 変換プログラム 212 生成プログラム 214 辞書編集プログラム 216 隔離見出し語指定・解除プログラム 218 隔離見出し語保存プログラム 220 隔離見出し語表示プログラム 221 システム辞書初期化プログラム 222 作業領域 224 原言語文記憶領域 226 訳文記憶領域
───────────────────────────────────────────────────── フロントページの続き (54)【発明の名称】 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録した コンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プ ログラムを記録したコンピュータ読み取り可能な記録媒体

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文字列を入力する入力手段と、 見出し語と、品詞と、辞書情報とを格納したシステム辞
    書と、 前記システム辞書を検索して前記入力された文字列の形
    態素解析を行う形態素解析手段と、 任意の語句については前記形態素解析において検索しな
    いように指定する指定手段と、 前記指定手段により検索しないように指定された語句を
    再び検索可能となるように指定を解除する解除手段とを
    備えたことを特徴とする形態素解析装置。
  2. 【請求項2】 請求項1に記載の形態素解析装置におい
    て、 前記指定手段により指定された語句を表示する表示手段
    を有することを特徴とする形態素解析装置。
  3. 【請求項3】 請求項1又は請求項2に記載の形態素解
    析装置において、 前記指定手段により指定された内容を保存する保存手段
    を備えることを特徴とする形態素解析装置。
  4. 【請求項4】 請求項3に記載の形態素解析装置におい
    て、 前記指定手段に指定された内容を前記保存手段に保存し
    たまま、前記形態素解析処理においてシステム辞書に格
    納されたすべての語句の検索ができる全語句検索手段を
    備えたことを特徴とする形態素解析装置。
  5. 【請求項5】 原言語からなる文字列を入力する入力手
    段と、 原言語である第一言語文を目的言語である第二言語文に
    翻訳する翻訳手段と、 目的言語からなる翻訳文を表示する表示手段を備えた機
    械翻訳装置であって、 前記翻訳手段は、請求項1乃至請求項4のいずれかに記
    載の形態素解析装置を備えることを特徴とする機械翻訳
    装置。
  6. 【請求項6】 コンピュータに、 文字列を入力する入力の手順と、 見出し語と、品詞と、辞書情報を格納したシステム辞書
    を検索して前記入力された文字列の形態素解析を行う形
    態素解析の手順と、 任意の語句については前記形態素解析において検索しな
    いように指定する指定の手順と、 前記指定の手順により検索しないように指定された語句
    を再び検索可能となるように指定を解除する解除の手順
    とを実行させることを特徴とする形態素解析処理プログ
    ラムを記録したコンピュータ読み取り可能な記録媒体。
  7. 【請求項7】 請求項6に記載の形態素解析処理プログ
    ラムにおいて、 前記コンピュータに、 前記指定の手順により指定された語句を表示する表示の
    手順を実行させるプログラムを備えることを特徴とする
    形態素解析処理プログラムを記録したコンピュータ読み
    取り可能な記録媒体。
  8. 【請求項8】 請求項6又は請求項7に記載の形態素解
    析処理プログラムにおいて、 前記指定の手順により指定された内容を保存する保存の
    手順を実行させるプログラムを備えることを特徴とする
    形態素解析処理プログラムを記録したコンピュータ読み
    取り可能な記録媒体。
  9. 【請求項9】 請求項8に記載の形態素解析処理プログ
    ラムにおいて、 前記コンピュータに、 前記指定の手順により指定された内容を前記保存の手順
    により保存したまま、前記形態素解析においてシステム
    辞書に格納されたすべての語句の検索ができる全語句検
    索の手順を実行させるプログラムを備えたことを特徴と
    する形態素解析処理プログラムを記録したコンピュータ
    読み取り可能な記録媒体。
  10. 【請求項10】 前記コンピュータに、 原言語からなる文字列を入力する入力の手順と、 原言語である第一言語文を目的言語である第二言語文に
    翻訳する翻訳手順と、 目的言語からなる翻訳文を表示する表示の手順とを実行
    させるプログラムを備えた機械翻訳処理プログラムであ
    って、 前記翻訳の手順を実行させるプログラムは、請求項5乃
    至請求項9のいずれかに記載の形態素解析処理プログラ
    ムを備えることを特徴とする機械翻訳処理プログラムを
    記録したコンピュータ読み取り可能な記録媒体。
JP10121494A 1998-04-30 1998-04-30 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH11316758A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10121494A JPH11316758A (ja) 1998-04-30 1998-04-30 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10121494A JPH11316758A (ja) 1998-04-30 1998-04-30 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH11316758A true JPH11316758A (ja) 1999-11-16

Family

ID=14812567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10121494A Pending JPH11316758A (ja) 1998-04-30 1998-04-30 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH11316758A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632212A (zh) * 2019-10-08 2021-04-09 腾讯科技(深圳)有限公司 一种待翻译词条的更新方法、装置、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632212A (zh) * 2019-10-08 2021-04-09 腾讯科技(深圳)有限公司 一种待翻译词条的更新方法、装置、设备和介质
CN112632212B (zh) * 2019-10-08 2024-03-15 腾讯科技(深圳)有限公司 一种待翻译词条的更新方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH11316758A (ja) 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003006191A (ja) 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
JP4043176B2 (ja) 自然言語処理装置
JP3692711B2 (ja) 機械翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体
JP3147947B2 (ja) 機械翻訳装置
JP2727076B2 (ja) 翻訳支援装置
JP2000029882A (ja) 要約文作成装置
JP3999773B2 (ja) 機械翻訳プログラム、機械翻訳システム、機械翻訳方法
JPH07191995A (ja) 機械翻訳装置
JPH10134054A (ja) 文作成支援装置
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JP2000137709A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11328176A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05324647A (ja) 文章作成装置
JPH05189421A (ja) 古文かな漢字変換装置及び方法
JPH11345229A (ja) 文字処理装置及び文字処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05151199A (ja) 文書作成装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH10134055A (ja) 文作成支援装置及び文作成支援プログラムを記憶した媒体
JPH0816599A (ja) 翻訳支援装置
JP2000137712A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体