JPH1125079A - 文字処理装置および方法ならびに記録媒体 - Google Patents
文字処理装置および方法ならびに記録媒体Info
- Publication number
- JPH1125079A JPH1125079A JP9175027A JP17502797A JPH1125079A JP H1125079 A JPH1125079 A JP H1125079A JP 9175027 A JP9175027 A JP 9175027A JP 17502797 A JP17502797 A JP 17502797A JP H1125079 A JPH1125079 A JP H1125079A
- Authority
- JP
- Japan
- Prior art keywords
- field
- likelihood
- phrase
- word
- kana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 ユーザに分野処理の様子を通知し、さらに分
野の重み付けを任意に設定する手段を与えることによ
り、ユーザの意にかなった変換結果を得ることができる
文字処理装置および方法ならびに記録媒体を提供する。 【解決手段】 現在ユーザがどの分野に関する文章を入
力しているかの尤もらしさを表現した分野尤度を分野毎
に格納しておき、分野尤度の大きい分野の単語を優先さ
せて最適な候補に変換する。分野尤度はかな漢字変換候
補より単語が選択される度に更新される。分野尤度は、
CRT上の分野尤度表示部に視覚的に表示される。この
分野尤度表示によりユーザは現在どの分野の優先度が高
いのかを一目で理解することができる。この分野尤度表
示部をユーザが直接操作することによってユーザの意向
に沿うように分野尤度を変更することが可能である。
野の重み付けを任意に設定する手段を与えることによ
り、ユーザの意にかなった変換結果を得ることができる
文字処理装置および方法ならびに記録媒体を提供する。 【解決手段】 現在ユーザがどの分野に関する文章を入
力しているかの尤もらしさを表現した分野尤度を分野毎
に格納しておき、分野尤度の大きい分野の単語を優先さ
せて最適な候補に変換する。分野尤度はかな漢字変換候
補より単語が選択される度に更新される。分野尤度は、
CRT上の分野尤度表示部に視覚的に表示される。この
分野尤度表示によりユーザは現在どの分野の優先度が高
いのかを一目で理解することができる。この分野尤度表
示部をユーザが直接操作することによってユーザの意向
に沿うように分野尤度を変更することが可能である。
Description
【0001】
【発明の属する技術分野】本発明は、かな漢字変換処理
を行う文字処理装置および方法ならびに記録媒体に関す
る。
を行う文字処理装置および方法ならびに記録媒体に関す
る。
【0002】
【従来の技術】近年、ワードプロセッサやコンピュータ
等の急速な普及に伴い、電子化された文書を作成するこ
とは我々の日常生活の一部となった。このような電子化
された文書の作成において、日本語の文書の読みを入力
する場合、入力された読みをかな漢字混じり文に変換す
るかな漢字変換処理は必要不可欠なものである。
等の急速な普及に伴い、電子化された文書を作成するこ
とは我々の日常生活の一部となった。このような電子化
された文書の作成において、日本語の文書の読みを入力
する場合、入力された読みをかな漢字混じり文に変換す
るかな漢字変換処理は必要不可欠なものである。
【0003】ところが、日本語には、読みが同じでも意
味や表記が異なる単語や句が多数存在するという性質が
あるために、同音異義語を状況に応じて正しい文章に変
換する同音異義語選択技術がかな漢字変換処理において
重要な技術になっている。また、日本語は単語単位に区
切りを入れる習慣はない。すなわち、かな漢字変換処理
において入力される読みも、区切りを入れずにべた書き
の状態で入力されるため、単語の区切り位置を決定する
技術も重要である。
味や表記が異なる単語や句が多数存在するという性質が
あるために、同音異義語を状況に応じて正しい文章に変
換する同音異義語選択技術がかな漢字変換処理において
重要な技術になっている。また、日本語は単語単位に区
切りを入れる習慣はない。すなわち、かな漢字変換処理
において入力される読みも、区切りを入れずにべた書き
の状態で入力されるため、単語の区切り位置を決定する
技術も重要である。
【0004】同音異義語選択技術や、単語の区切り位置
を決定する技術として、意味的に関連の深い単語の集ま
りを意味ごとに分野としてグループにまとめ、各分野に
属する単語の出現の度合いを表す分野尤度を各分野に対
応させておき、ある単語が選択確定される毎にその単語
の属する分野尤度を上げて、この分野に属する単語が変
換候補として優先的に選択されるようにする分野処理と
いうものがある。
を決定する技術として、意味的に関連の深い単語の集ま
りを意味ごとに分野としてグループにまとめ、各分野に
属する単語の出現の度合いを表す分野尤度を各分野に対
応させておき、ある単語が選択確定される毎にその単語
の属する分野尤度を上げて、この分野に属する単語が変
換候補として優先的に選択されるようにする分野処理と
いうものがある。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
分野処理を用いたかな漢字変換においては、これら分野
尤度の重み付けはユーザの関知することなく自動的に行
われており、時としてユーザの意に反する単語が優先的
に選択されるという弊害が生じる場合がある。
分野処理を用いたかな漢字変換においては、これら分野
尤度の重み付けはユーザの関知することなく自動的に行
われており、時としてユーザの意に反する単語が優先的
に選択されるという弊害が生じる場合がある。
【0006】例えば、分野のひとつとして医療分野が存
在し、この医療分野が重み付けされている状態で、「し
ゅようなへやはりょうほうともせまい。」という読みを
与えた場合、医療分野に属する単語である「腫瘍」や
「療法」が「しゅよう」や「りょうほう」の変換候補と
して優先的に選択されるため、「腫瘍な部屋は療法とも
狭い。」というまるで意味をなさない変換結果を出すこ
とになってしまう。
在し、この医療分野が重み付けされている状態で、「し
ゅようなへやはりょうほうともせまい。」という読みを
与えた場合、医療分野に属する単語である「腫瘍」や
「療法」が「しゅよう」や「りょうほう」の変換候補と
して優先的に選択されるため、「腫瘍な部屋は療法とも
狭い。」というまるで意味をなさない変換結果を出すこ
とになってしまう。
【0007】また、従来の技術ではかな漢字変換処理中
にどの分野が優先されているのか全くユーザに通知され
ず、さらに、ユーザが分野の優先度の修正を行うことも
できないという問題点があった。
にどの分野が優先されているのか全くユーザに通知され
ず、さらに、ユーザが分野の優先度の修正を行うことも
できないという問題点があった。
【0008】そこで、本発明の目的は上記問題点を解決
するためになされたものであり、ユーザに分野処理の様
子を通知し、さらに分野の重み付けを任意に設定する手
段を与えることにより、ユーザの意にかなった変換結果
を得ることができる文字処理装置および方法ならびに記
録媒体を提供することにある。
するためになされたものであり、ユーザに分野処理の様
子を通知し、さらに分野の重み付けを任意に設定する手
段を与えることにより、ユーザの意にかなった変換結果
を得ることができる文字処理装置および方法ならびに記
録媒体を提供することにある。
【0009】
【課題を解決するための手段】請求項1記載の発明は、
かな漢字変換の対象となる文の読みを表す文字列データ
を入力する読み入力手段と、前記読み入力手段により入
力した文の読みを表す文字列データを漢字かな混じり文
に変換するかな漢字変換手段と、単語の読みと該単語を
表記する漢字と該単語に関する情報とを格納した単語辞
書とを有する文字処理装置において、単語が関係する分
野を格納した分野辞書と、前記読み入力手段により入力
している文と1以上の前記分野との関係の程度を各分野
毎に示す分野尤度を保持する分野尤度保持手段と、前記
分野尤度保持手段中の分野尤度の大きな分野に属する単
語を変換候補として優先させる分野処理を行う手段と、
前記分野尤度保持手段に保持された分野尤度を表示する
分野尤度表示手段とを備えている。
かな漢字変換の対象となる文の読みを表す文字列データ
を入力する読み入力手段と、前記読み入力手段により入
力した文の読みを表す文字列データを漢字かな混じり文
に変換するかな漢字変換手段と、単語の読みと該単語を
表記する漢字と該単語に関する情報とを格納した単語辞
書とを有する文字処理装置において、単語が関係する分
野を格納した分野辞書と、前記読み入力手段により入力
している文と1以上の前記分野との関係の程度を各分野
毎に示す分野尤度を保持する分野尤度保持手段と、前記
分野尤度保持手段中の分野尤度の大きな分野に属する単
語を変換候補として優先させる分野処理を行う手段と、
前記分野尤度保持手段に保持された分野尤度を表示する
分野尤度表示手段とを備えている。
【0010】請求項2記載の発明は、請求項1におい
て、前記かな漢字変換手段は、前記文字列データ中のか
な漢字変換を行う位置から抽出した連続する2文節の文
節を区切る位置が複数個ある場合に、前記2文節の内の
1文節から抽出した単語が関係する分野の前記分野尤度
を用いて該1文節の分野尤度である第1の文節尤度を求
める手段と、前記2文節の内の他の1文節から抽出した
単語が関係する分野の前記分野尤度を用いて該他の1文
節の分野尤度である第2の文節尤度を求める手段と、前
記第1の文節尤度と前記第2の文節尤度とから前記2文
節全体の文節尤度を求める手段と、前記複数個の文節を
区切る位置に対応した複数個の2文節の組が各々有する
前記2文節全体の文節尤度を比較して、2文節の組を抽
出する手段とを備えたこととすることができる。
て、前記かな漢字変換手段は、前記文字列データ中のか
な漢字変換を行う位置から抽出した連続する2文節の文
節を区切る位置が複数個ある場合に、前記2文節の内の
1文節から抽出した単語が関係する分野の前記分野尤度
を用いて該1文節の分野尤度である第1の文節尤度を求
める手段と、前記2文節の内の他の1文節から抽出した
単語が関係する分野の前記分野尤度を用いて該他の1文
節の分野尤度である第2の文節尤度を求める手段と、前
記第1の文節尤度と前記第2の文節尤度とから前記2文
節全体の文節尤度を求める手段と、前記複数個の文節を
区切る位置に対応した複数個の2文節の組が各々有する
前記2文節全体の文節尤度を比較して、2文節の組を抽
出する手段とを備えたこととすることができる。
【0011】請求項3記載の発明は、請求項1におい
て、前記かな漢字変換手段による変換をユーザからの入
力により選択する変換確定手段と、前記変換確定手段に
より選択された単語が関係する前記分野尤度保持手段中
の分野尤度を更新する更新手段とをさらに備えたことと
することができる。
て、前記かな漢字変換手段による変換をユーザからの入
力により選択する変換確定手段と、前記変換確定手段に
より選択された単語が関係する前記分野尤度保持手段中
の分野尤度を更新する更新手段とをさらに備えたことと
することができる。
【0012】請求項4記載の発明は、請求項1におい
て、前記分野尤度保持手段に保持された分野尤度をユー
ザからの指示により更新するユーザ更新手段をさらに備
えたこととすることができる。
て、前記分野尤度保持手段に保持された分野尤度をユー
ザからの指示により更新するユーザ更新手段をさらに備
えたこととすることができる。
【0013】請求項5記載の発明は、請求項4におい
て、前記ユーザ更新手段は、前記分野尤度表示手段によ
り表示された前記分野尤度をユーザが操作することによ
り更新する手段であることとすることができる。
て、前記ユーザ更新手段は、前記分野尤度表示手段によ
り表示された前記分野尤度をユーザが操作することによ
り更新する手段であることとすることができる。
【0014】請求項6記載の発明は、請求項1ないし5
のいずれかにおいて、前記分野尤度表示手段は、グラフ
表示により前記分野尤度を表示することができる。
のいずれかにおいて、前記分野尤度表示手段は、グラフ
表示により前記分野尤度を表示することができる。
【0015】請求項7記載の発明は、請求項1ないし5
のいずれかにおいて、前記分野尤度表示手段は、数値表
示により前記分野尤度を表示することができる。
のいずれかにおいて、前記分野尤度表示手段は、数値表
示により前記分野尤度を表示することができる。
【0016】請求項8記載の発明は、かな漢字変換の対
象となる文の読みを表す文字列データを入力する読み入
力ステップと、単語の読みと該単語を表記する漢字と該
単語に関する情報とを格納した単語辞書を用いて、前記
読み入力ステップにより入力した文の読みを表す文字列
データを漢字かな混じり文に変換するかな漢字変換ステ
ップとを有する文字処理方法において、単語が関係する
分野を格納した分野辞書と、前記読み入力ステップによ
り入力している文と1以上の前記分野との関係の程度を
各分野毎に示す分野尤度とを用いて、前記分野尤度の大
きな分野に属する単語を変換候補として優先させる分野
処理を行うステップと前記分野尤度を表示する分野尤度
表示ステップとを備えている。
象となる文の読みを表す文字列データを入力する読み入
力ステップと、単語の読みと該単語を表記する漢字と該
単語に関する情報とを格納した単語辞書を用いて、前記
読み入力ステップにより入力した文の読みを表す文字列
データを漢字かな混じり文に変換するかな漢字変換ステ
ップとを有する文字処理方法において、単語が関係する
分野を格納した分野辞書と、前記読み入力ステップによ
り入力している文と1以上の前記分野との関係の程度を
各分野毎に示す分野尤度とを用いて、前記分野尤度の大
きな分野に属する単語を変換候補として優先させる分野
処理を行うステップと前記分野尤度を表示する分野尤度
表示ステップとを備えている。
【0017】請求項9記載の発明は、請求項8におい
て、前記分野尤度をユーザからの指示により更新するユ
ーザ更新ステップをさらに備えたこととすることができ
る。
て、前記分野尤度をユーザからの指示により更新するユ
ーザ更新ステップをさらに備えたこととすることができ
る。
【0018】請求項10記載の発明は、請求項9におい
て、前記ユーザ更新ステップは、前記分野尤度表示ステ
ップにより表示された前記分野尤度をユーザが操作する
ことにより更新するステップであることとすることがで
きる。
て、前記ユーザ更新ステップは、前記分野尤度表示ステ
ップにより表示された前記分野尤度をユーザが操作する
ことにより更新するステップであることとすることがで
きる。
【0019】請求項11記載の発明は、請求項8におい
て、前記かな漢字変換ステップは、前記文字列データ中
のかな漢字変換を行う位置から抽出した連続する2文節
の文節を区切る位置が複数個ある場合に、前記2文節の
内の1文節から抽出した単語が関係する分野の前記分野
尤度を用いて該1文節の分野尤度である第1の文節尤度
を求めるステップと、前記2文節の内の他の1文節から
抽出した単語が関係する分野の前記分野尤度とを用いて
該他の1文節の分野尤度である第2の文節尤度を求める
ステップと、前記第1の文節尤度と前記第2の文節尤度
とから前記2文節全体の文節尤度を求めるステップと、
前記複数個の文節を区切る位置に対応した複数個の2文
節の組が各々有する前記2文節全体の文節尤度を比較し
て、2文節の組を抽出するステップとを備えている。
て、前記かな漢字変換ステップは、前記文字列データ中
のかな漢字変換を行う位置から抽出した連続する2文節
の文節を区切る位置が複数個ある場合に、前記2文節の
内の1文節から抽出した単語が関係する分野の前記分野
尤度を用いて該1文節の分野尤度である第1の文節尤度
を求めるステップと、前記2文節の内の他の1文節から
抽出した単語が関係する分野の前記分野尤度とを用いて
該他の1文節の分野尤度である第2の文節尤度を求める
ステップと、前記第1の文節尤度と前記第2の文節尤度
とから前記2文節全体の文節尤度を求めるステップと、
前記複数個の文節を区切る位置に対応した複数個の2文
節の組が各々有する前記2文節全体の文節尤度を比較し
て、2文節の組を抽出するステップとを備えている。
【0020】請求項12記載の発明は、請求項8におい
て、前記かな漢字変換ステップによる変換をユーザから
の入力により選択する変換確定ステップと、前記変換確
定ステップにより選択された単語が関係する前記分野尤
度中の分野尤度を更新する更新ステップとを備えたこと
とすることができる。
て、前記かな漢字変換ステップによる変換をユーザから
の入力により選択する変換確定ステップと、前記変換確
定ステップにより選択された単語が関係する前記分野尤
度中の分野尤度を更新する更新ステップとを備えたこと
とすることができる。
【0021】請求項13記載の発明は、請求項8ないし
12のいずれか記載の文字処理方法を実行するためのプ
ログラムを記録したコンピュータ読み取り可能な記録媒
体である。
12のいずれか記載の文字処理方法を実行するためのプ
ログラムを記録したコンピュータ読み取り可能な記録媒
体である。
【0022】請求項14記載の発明は、請求項13記載
のコンピュータ読み取り可能な記録媒体であって、前記
分野辞書および分野尤度は、前記記録媒体に形成される
分野辞書ファイルおよび分野尤度ファイルに記録され、
前記分野辞書ファイルは、単語を識別する単語識別子
と、該単語が関係する分野とを対応づけて記録した単語
データ領域を有し、前記分野尤度ファイルは、前記分野
と、かな漢字変換の対象となる文の読みを表す文字列デ
ータを入力している文と1以上の前記分野との関係の程
度を各分野毎に示す分野尤度を対応づけて記録した分野
尤度データ領域を有し、前記単語データ領域は前記単語
識別子に基づいてソートされており、同一の前記単語識
別子を有する前記単語データ領域が複数ある場合は、単
語と分野との関係の程度を示す確信度に基づいてソート
されていることを特徴とする分野データを記録したコン
ピュータ読み取り可能な記録媒体である。
のコンピュータ読み取り可能な記録媒体であって、前記
分野辞書および分野尤度は、前記記録媒体に形成される
分野辞書ファイルおよび分野尤度ファイルに記録され、
前記分野辞書ファイルは、単語を識別する単語識別子
と、該単語が関係する分野とを対応づけて記録した単語
データ領域を有し、前記分野尤度ファイルは、前記分野
と、かな漢字変換の対象となる文の読みを表す文字列デ
ータを入力している文と1以上の前記分野との関係の程
度を各分野毎に示す分野尤度を対応づけて記録した分野
尤度データ領域を有し、前記単語データ領域は前記単語
識別子に基づいてソートされており、同一の前記単語識
別子を有する前記単語データ領域が複数ある場合は、単
語と分野との関係の程度を示す確信度に基づいてソート
されていることを特徴とする分野データを記録したコン
ピュータ読み取り可能な記録媒体である。
【0023】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
施の形態を詳細に説明する。
【0024】図1は本発明の全体構成の一例である。
【0025】図1において、CPU130は、マイクロ
プロセッサであり、文字処理のための演算、論理判断な
どを行い、アドレスバスAB10、コントロールバスC
B20、データバスDB30を介して、それらのバス1
0,20,30に接続された各構成要素を制御する。
プロセッサであり、文字処理のための演算、論理判断な
どを行い、アドレスバスAB10、コントロールバスC
B20、データバスDB30を介して、それらのバス1
0,20,30に接続された各構成要素を制御する。
【0026】アドレスバスAB10はマイクロプロセッ
サCPU130による制御の対象となる構成要素を指示
するアドレス信号を転送する。コントロールバスCB2
0はマイクロプロセッサCPU10の制御の対象とする
各構成要素のコントロール信号を転送する。データバス
DB30は各構成機器相互間のデータ転送を行う。
サCPU130による制御の対象となる構成要素を指示
するアドレス信号を転送する。コントロールバスCB2
0はマイクロプロセッサCPU10の制御の対象とする
各構成要素のコントロール信号を転送する。データバス
DB30は各構成機器相互間のデータ転送を行う。
【0027】ROM120は、読み出し専用の固定メモ
リである。ROM120に設けられているPA125
は、図6〜図13に関して後述するマイクロプロセッサ
CPU130による制御の手順を記憶させたプログラム
・エリアである。
リである。ROM120に設けられているPA125
は、図6〜図13に関して後述するマイクロプロセッサ
CPU130による制御の手順を記憶させたプログラム
・エリアである。
【0028】RAM110は、書込み可能のランダムア
クセスメモリであって、各構成要素からの各種データの
一時記憶に用いる。RAM110は、単語辞書EDIC
111、分野辞書BDIC113、分野尤度BYUD1
15で構成されている。
クセスメモリであって、各構成要素からの各種データの
一時記憶に用いる。RAM110は、単語辞書EDIC
111、分野辞書BDIC113、分野尤度BYUD1
15で構成されている。
【0029】単語辞書WDIC111は、かな漢字変換
を行うための単語の情報を格納したものであり、詳細は
図2を用いて詳述する。
を行うための単語の情報を格納したものであり、詳細は
図2を用いて詳述する。
【0030】分野辞書BDIC113は、単語辞書WD
IC111に格納されている単語の中で特定の分野に属
する単語を集めて格納したものであり、詳細は図3を用
いて後述する。
IC111に格納されている単語の中で特定の分野に属
する単語を集めて格納したものであり、詳細は図3を用
いて後述する。
【0031】分野尤度BYUD115は、かな漢字変換
で入力されている文章の内容と各分野との関係の深さを
表す情報を格納するものであり、詳細は図4を用いて後
述する。
で入力されている文章の内容と各分野との関係の深さを
表す情報を格納するものであり、詳細は図4を用いて後
述する。
【0032】KB180はキーボードであって、アルフ
ァベット・キー、ひらがなキー、カタカナキー等の文字
記号入力キー、および、カーソル移動を指示するカーソ
ル移動キー等のような各種のファンクション・キー、た
とえば以下に説明するCNVT182、SLCT18
4、MOVE186、NEXT188を備えている。
ァベット・キー、ひらがなキー、カタカナキー等の文字
記号入力キー、および、カーソル移動を指示するカーソ
ル移動キー等のような各種のファンクション・キー、た
とえば以下に説明するCNVT182、SLCT18
4、MOVE186、NEXT188を備えている。
【0033】CNVT182は、入力した文字列に対し
て、かな漢字変換を指示するキーである。SLCT18
4は、かな漢字変換後方の選択を指示するキーである。
MOVE186は、かな漢字変換の対象文節の移動を指
示するキーである。NEXT188は、かな漢字変換候
補の変更を指示するキーである。
て、かな漢字変換を指示するキーである。SLCT18
4は、かな漢字変換後方の選択を指示するキーである。
MOVE186は、かな漢字変換の対象文節の移動を指
示するキーである。NEXT188は、かな漢字変換候
補の変更を指示するキーである。
【0034】PD190はマウスなどのポインティング
・デバイスである。これは、CRT150上に表示され
る画像情報を加工、指定するために使用され、処理の指
示や、編集対象の指示、描画位置の指定などを行う。
・デバイスである。これは、CRT150上に表示され
る画像情報を加工、指定するために使用され、処理の指
示や、編集対象の指示、描画位置の指定などを行う。
【0035】INCTR195は入力制御部であり、K
B180やPD190に入力された指示を入力信号に変
換してCB30、DB20、AB10の各バスに伝達す
る。
B180やPD190に入力された指示を入力信号に変
換してCB30、DB20、AB10の各バスに伝達す
る。
【0036】DISK100は文書データ等を記憶する
ための外部メモリである。文書データ等は必要に応じて
保管され、また、保管されたデータはキーボードKB1
80の指示により、必要な時呼び出される。
ための外部メモリである。文書データ等は必要に応じて
保管され、また、保管されたデータはキーボードKB1
80の指示により、必要な時呼び出される。
【0037】CR175はカーソル・レジスタである。
CPU130が、カーソル・レジスタCR175の内容
を読み書きできる。後述するCRTコントローラCRT
C160は、カーソル・レジスタCR175に蓄えられ
たアドレス・データに対応する表示装置CRT150上
の位置にカーソルを表示する。
CPU130が、カーソル・レジスタCR175の内容
を読み書きできる。後述するCRTコントローラCRT
C160は、カーソル・レジスタCR175に蓄えられ
たアドレス・データに対応する表示装置CRT150上
の位置にカーソルを表示する。
【0038】DBUF170は表示用バッファ・メモリ
で、表示すべきデータのパターンを蓄える。
で、表示すべきデータのパターンを蓄える。
【0039】CRTC160はカーソル・レジスタCR
175およびバッファDBUF170に蓄えられた内容
を表示装置CRT150に表示する役割を担う。
175およびバッファDBUF170に蓄えられた内容
を表示装置CRT150に表示する役割を担う。
【0040】CRT150はたとえば、陰極線管等を用
いた表示装置であり、その表示装置CRT150におけ
るドット構成の表示パターンおよびカーソルの表示をC
RTコントローラ160で制御する。CRT150は、
液晶ディスプレイ等の表示措置とすることもできる。
いた表示装置であり、その表示装置CRT150におけ
るドット構成の表示パターンおよびカーソルの表示をC
RTコントローラ160で制御する。CRT150は、
液晶ディスプレイ等の表示措置とすることもできる。
【0041】さらに、CG140はキャラクタ・ジェネ
レータであって、表示装置CRT150に表示する文
字、記号のパターンを記憶するものである。
レータであって、表示装置CRT150に表示する文
字、記号のパターンを記憶するものである。
【0042】上述の各構成要素からなる本発明の文字処
理装置は、キーボードKB180やポイティング・デバ
イスPD190からの各種の入力に応じて作動する。こ
れらの入力が入力制御部INCRT195を介して供給
されると、まず、インタラプト信号がマイクロプロセッ
サCPU130に送られ、そのマイクロプロセッサCP
U130がROM120内に記憶してある各種の制御信
号を読み出し、それらの制御信号に従って、各種の制御
が行われる。
理装置は、キーボードKB180やポイティング・デバ
イスPD190からの各種の入力に応じて作動する。こ
れらの入力が入力制御部INCRT195を介して供給
されると、まず、インタラプト信号がマイクロプロセッ
サCPU130に送られ、そのマイクロプロセッサCP
U130がROM120内に記憶してある各種の制御信
号を読み出し、それらの制御信号に従って、各種の制御
が行われる。
【0043】図2は、単語辞書WDIC111の構成例
を説明した図である。
を説明した図である。
【0044】図2において、1つの単語の情報として、
読みと表記と品詞と単語IDとが格納される。単語ID
はある単語と他の単語とを区別し、その単語を指し示す
ことができるようにつけられたユニークな番号である。
例えば、図2において、読みが「しゅよう」で表記が
「腫瘍」で品詞が「名詞」で単語IDが「12344」
なる単語が格納されている。各単語の情報はあいうえお
順の読みになってソートされて格納されている。
読みと表記と品詞と単語IDとが格納される。単語ID
はある単語と他の単語とを区別し、その単語を指し示す
ことができるようにつけられたユニークな番号である。
例えば、図2において、読みが「しゅよう」で表記が
「腫瘍」で品詞が「名詞」で単語IDが「12344」
なる単語が格納されている。各単語の情報はあいうえお
順の読みになってソートされて格納されている。
【0045】図3は、分野辞書BDIC113の構成例
を説明した図である。分野辞書は、単語や句がどの分野
とどの程度関係があるのかの情報を格納するものであ
る。例えば、「腫瘍」という単語は「医療」という分野
に密接に関係があるということができるが、分野辞書は
このような単語と分野との関係に関する情報を格納する
ものである。分野辞書113には、この情報を単語ID
と分野と確信度とを対応させて格納する。例えば、図3
によって示される分野辞書では、単語ID「1234
4」と分野「医療」と確信度「10」とを対応させて格
納することによって、単語ID「12344」によって
示される単語「腫瘍」が分野「医療」に確信度「10」
で関係していることを表している。ここで、確信度と
は、単語と分野の関係の度合いを表す正の数値であり、
値が大きくなるほど単語と分野の関係が深いことを意味
する。確信度として、負の値を取ることも可能である。
負の値を取るということは、単語と分野がまったく無関
係であることを積極的に表しているものであり、値が小
さくなるほど無関係である度合いが高くなる。例えば、
図4によって示される分野辞書では、単語ID「123
44」で表される単語「腫瘍」が分野「経済」と確信度
「−5」で関係していることを表しているが、これは、
確信度「5」で無関係であることを示している。また、
分野辞書では、一つの単語が複数の分野と関係があるこ
とも記述できる。例えば、単語ID「5678」で表さ
れる単語「裁判」は、分野「法律」と確信度「10」で
関係があり、分野「政治」とは確信度「2」で関係があ
ることを示している。
を説明した図である。分野辞書は、単語や句がどの分野
とどの程度関係があるのかの情報を格納するものであ
る。例えば、「腫瘍」という単語は「医療」という分野
に密接に関係があるということができるが、分野辞書は
このような単語と分野との関係に関する情報を格納する
ものである。分野辞書113には、この情報を単語ID
と分野と確信度とを対応させて格納する。例えば、図3
によって示される分野辞書では、単語ID「1234
4」と分野「医療」と確信度「10」とを対応させて格
納することによって、単語ID「12344」によって
示される単語「腫瘍」が分野「医療」に確信度「10」
で関係していることを表している。ここで、確信度と
は、単語と分野の関係の度合いを表す正の数値であり、
値が大きくなるほど単語と分野の関係が深いことを意味
する。確信度として、負の値を取ることも可能である。
負の値を取るということは、単語と分野がまったく無関
係であることを積極的に表しているものであり、値が小
さくなるほど無関係である度合いが高くなる。例えば、
図4によって示される分野辞書では、単語ID「123
44」で表される単語「腫瘍」が分野「経済」と確信度
「−5」で関係していることを表しているが、これは、
確信度「5」で無関係であることを示している。また、
分野辞書では、一つの単語が複数の分野と関係があるこ
とも記述できる。例えば、単語ID「5678」で表さ
れる単語「裁判」は、分野「法律」と確信度「10」で
関係があり、分野「政治」とは確信度「2」で関係があ
ることを示している。
【0046】図4は分野尤度BYUD115の構成例を
説明した図である。分野尤度とは、現在ユーザがどの分
野に関する文章を入力しているかの尤もらしさを表現し
たものであり、BYUD115は配列を用いて、現在の
各分野の尤度が各分野に対応する領域400〜490に
それぞれ格納される。図4においては、分野が格納され
る順序が定まっているが、配列要素として分野と分野尤
度とを1組にした要素を考えることもできる。この場
合、分野が格納される順序は不定とすることができる。
本実施の形態においては、これら各分野の中で、最も尤
度が大きいものが現在入力中の文書の分野であると判断
する。本実施の形態において、分野尤度はかな漢字変換
候補として単語が選択される度に更新される。また、本
実施の形態では後述する分野尤度表示部をユーザが直接
操作することによって分野尤度を変更することが可能で
ある。分野尤度は、後述の図13の説明において詳述す
る。
説明した図である。分野尤度とは、現在ユーザがどの分
野に関する文章を入力しているかの尤もらしさを表現し
たものであり、BYUD115は配列を用いて、現在の
各分野の尤度が各分野に対応する領域400〜490に
それぞれ格納される。図4においては、分野が格納され
る順序が定まっているが、配列要素として分野と分野尤
度とを1組にした要素を考えることもできる。この場
合、分野が格納される順序は不定とすることができる。
本実施の形態においては、これら各分野の中で、最も尤
度が大きいものが現在入力中の文書の分野であると判断
する。本実施の形態において、分野尤度はかな漢字変換
候補として単語が選択される度に更新される。また、本
実施の形態では後述する分野尤度表示部をユーザが直接
操作することによって分野尤度を変更することが可能で
ある。分野尤度は、後述の図13の説明において詳述す
る。
【0047】図5は本実施の形態における分野尤度表示
部のイメージである。分野尤度表示部はCRT150上
に表示され、図5に示すように現在の分野尤度BYUD
115の値を視覚的に表示する。この分野尤度表示によ
りユーザは現在どの分野の優先度が高いのかを一目で理
解することができる。また、本実施の形態ではここに表
示されているグラフをユーザがPD190で直接操作す
ることにより、分野尤度BYUD115の値を変更する
ことが可能である。詳細は後述する(図7)。上述の実
施の形態のPA125に格納された手順の動作をフロー
チャートにしたがって説明する。
部のイメージである。分野尤度表示部はCRT150上
に表示され、図5に示すように現在の分野尤度BYUD
115の値を視覚的に表示する。この分野尤度表示によ
りユーザは現在どの分野の優先度が高いのかを一目で理
解することができる。また、本実施の形態ではここに表
示されているグラフをユーザがPD190で直接操作す
ることにより、分野尤度BYUD115の値を変更する
ことが可能である。詳細は後述する(図7)。上述の実
施の形態のPA125に格納された手順の動作をフロー
チャートにしたがって説明する。
【0048】図6は本発明の文字処理装置の動作を示す
フローチャートである。
フローチャートである。
【0049】ユーザによりKB180またはPD190
からのユーザ入力データを取り込む(S1)。次に取り
込まれた入力の種類を判定し(S2)、各入力に対する
処理ルーチンに分岐する。
からのユーザ入力データを取り込む(S1)。次に取り
込まれた入力の種類を判定し(S2)、各入力に対する
処理ルーチンに分岐する。
【0050】PD190によるドラッグが行われた場合
はS3に分岐し、図7に詳述するユーティリティ操作処
理(S3)が行われる。ユーティリティ操作処理が行わ
れた後、S1に戻る。
はS3に分岐し、図7に詳述するユーティリティ操作処
理(S3)が行われる。ユーティリティ操作処理が行わ
れた後、S1に戻る。
【0051】文字キーが入力された場合はS4に分岐
し、図8に詳述するかな漢字入力処理(S4)が行われ
る。かな漢字入力処理が行われた後、S6へ進む。
し、図8に詳述するかな漢字入力処理(S4)が行われ
る。かな漢字入力処理が行われた後、S6へ進む。
【0052】その他のキーの時はS5に分岐し、挿入、
削除などの通常の文字処理装置において行われる処理を
行う。これらの処理は同種の文字処理装置において一般
に行われている処理である。処理が行われた後S6へ進
む。
削除などの通常の文字処理装置において行われる処理を
行う。これらの処理は同種の文字処理装置において一般
に行われている処理である。処理が行われた後S6へ進
む。
【0053】S6は上述の処理の結果、変更された部分
を表示する文字表示処理である。文書中のデータ一文字
を読むごとに文字パターンに展開し、表示バッファに出
力するというように通常一般的に行われている処理であ
る。処理を終えると、S1に進む。
を表示する文字表示処理である。文書中のデータ一文字
を読むごとに文字パターンに展開し、表示バッファに出
力するというように通常一般的に行われている処理であ
る。処理を終えると、S1に進む。
【0054】図7は、ユーティリティ操作処理(S3)
を詳細化したフローチャートである。
を詳細化したフローチャートである。
【0055】図7において、ドラッグの始点と終点の座
標が表示中の表示部のどの部分に相当するかを計算する
(S11)。始点と終点がともに分野尤度表示部(図
5)の同じ分野グラフ上であればS12に進む。その他
の場合はS13に進む。
標が表示中の表示部のどの部分に相当するかを計算する
(S11)。始点と終点がともに分野尤度表示部(図
5)の同じ分野グラフ上であればS12に進む。その他
の場合はS13に進む。
【0056】S12では、S11で検出された分野グラ
フにおけるドラッグの座標変化を分野尤度の変化量に変
換して、該当する分野尤度BYUD115の値を変更す
る該当分野尤度変更処理が行われる。CRT150上の
座標変化を実際のある値の変化量に変換する処理は公知
であり、ここでは特に記述しない。処理を終えるとその
他の処理(S13)に進む。
フにおけるドラッグの座標変化を分野尤度の変化量に変
換して、該当する分野尤度BYUD115の値を変更す
る該当分野尤度変更処理が行われる。CRT150上の
座標変化を実際のある値の変化量に変換する処理は公知
であり、ここでは特に記述しない。処理を終えるとその
他の処理(S13)に進む。
【0057】S14は、検知された座標変化をCRT1
50上のグラフに反映するグラフ表示処理である。この
処理はGUIをベースとしたシステムでは一般に行われ
ている処理であり、公知であるので、ここでは特に記述
しない。
50上のグラフに反映するグラフ表示処理である。この
処理はGUIをベースとしたシステムでは一般に行われ
ている処理であり、公知であるので、ここでは特に記述
しない。
【0058】S11においてドラッグ座標が分野グラフ
以外と判断された場合は、その他の処理(S13)へ進
み、各ドラッグ座標の位置によってウィンドウの移動や
縮小などの処理を行う。これらの処理は公知であるので
ここでは特に記述しない。処理を終えるとユーティリテ
ィ操作処理を終了する。
以外と判断された場合は、その他の処理(S13)へ進
み、各ドラッグ座標の位置によってウィンドウの移動や
縮小などの処理を行う。これらの処理は公知であるので
ここでは特に記述しない。処理を終えるとユーティリテ
ィ操作処理を終了する。
【0059】図8はかな漢字変換処理(S4)を詳細化
したフローチャートである。
したフローチャートである。
【0060】図8において、文字格納処理(S21)
は、ユーザ入力待ち(S1)およびキー入力待ち(S2
2)において入力されたかな漢字変換の対象となるすべ
ての文字データを、読みバッファYBUF119に格納
する文字格納処理である。格納した結果は、表示バッフ
ァに出力することで、CRT150に表示する。処理を
終えたキー入力待ち(S22)へ進む。S22はキーボ
ードからのデータを取り込む処理である。取り込まれた
キーの種別を判定し(S23)、各キーの処理ルーチン
に分岐する。
は、ユーザ入力待ち(S1)およびキー入力待ち(S2
2)において入力されたかな漢字変換の対象となるすべ
ての文字データを、読みバッファYBUF119に格納
する文字格納処理である。格納した結果は、表示バッフ
ァに出力することで、CRT150に表示する。処理を
終えたキー入力待ち(S22)へ進む。S22はキーボ
ードからのデータを取り込む処理である。取り込まれた
キーの種別を判定し(S23)、各キーの処理ルーチン
に分岐する。
【0061】文字キーが入力された時はS21に分岐す
る。
る。
【0062】CNVTキーまたは、句点が入力された時
は最適候補変換(S24)に分岐し、読みバッファYB
UF119に格納された読みの文字列データに対する最
適なかな漢字変換結果を求める最適候補変換処理を行っ
た後、候補選択(S25)へ進む。最適候補変換処理
(S24)は、図9において詳述する。
は最適候補変換(S24)に分岐し、読みバッファYB
UF119に格納された読みの文字列データに対する最
適なかな漢字変換結果を求める最適候補変換処理を行っ
た後、候補選択(S25)へ進む。最適候補変換処理
(S24)は、図9において詳述する。
【0063】候補選択(S25)は、最適候補選択(S
24)において求められたかな漢字変換の最適な候補を
変更して変換結果を選択し、かな漢字変換結果を出力す
る候補選択処理である。候補選択処理は、図12におい
て詳述する。処理を終えると、かな漢字入力処理(S
4)を終了する。
24)において求められたかな漢字変換の最適な候補を
変更して変換結果を選択し、かな漢字変換結果を出力す
る候補選択処理である。候補選択処理は、図12におい
て詳述する。処理を終えると、かな漢字入力処理(S
4)を終了する。
【0064】その他のキーが入力された時は、何も処理
を行わずS22に分岐する。
を行わずS22に分岐する。
【0065】図9は、最適候補変換処理(S24)を詳
細化したフローチャートである。
細化したフローチャートである。
【0066】図9において、2文節候補抽出(S31)
は、バッファに格納された読みを示す文字データの変換
対象位置から連続する2文節の組み合わせの中より、読
みの長さが最長となる組み合わせをすべて抽出する処理
である。この処理は、2文節最長一致法と呼ばれる方法
で、変換対象の読みによって単語辞書WDIC111を
検索することにより、文法的に正しい文節を抽出し、連
続する2文節の組み合わせの中から、2文節合わせた読
みの長さが最も長い組み合わせを抽出する処理である。
これは、同種のかな漢字変換処理において一般に行われ
ている処理であり、詳細な説明は行わない。
は、バッファに格納された読みを示す文字データの変換
対象位置から連続する2文節の組み合わせの中より、読
みの長さが最長となる組み合わせをすべて抽出する処理
である。この処理は、2文節最長一致法と呼ばれる方法
で、変換対象の読みによって単語辞書WDIC111を
検索することにより、文法的に正しい文節を抽出し、連
続する2文節の組み合わせの中から、2文節合わせた読
みの長さが最も長い組み合わせを抽出する処理である。
これは、同種のかな漢字変換処理において一般に行われ
ている処理であり、詳細な説明は行わない。
【0067】この処理において、連続する2文節が抽出
できずに、1文節しか抽出できない場合がある。この場
合は、最も長い文節のみを抽出する(S32)。1文節
しか抽出できない場合は、バッファに格納されたすべて
の読みを示すデータが1文節として抽出されているの
で、変換結果決定(S36)へ分岐する。連続する2文
節が抽出できた場合は、S33に分岐する。
できずに、1文節しか抽出できない場合がある。この場
合は、最も長い文節のみを抽出する(S32)。1文節
しか抽出できない場合は、バッファに格納されたすべて
の読みを示すデータが1文節として抽出されているの
で、変換結果決定(S36)へ分岐する。連続する2文
節が抽出できた場合は、S33に分岐する。
【0068】S33は、2文節候補抽出(S31)で抽
出された2文節の組み合わせの中に、2つの文節の区切
り位置が異なるものがあるかどうか、すなわち、区切り
位置が複数個あるかどうかをチェックする。複数個の場
合は、区切り決定(S34)に分岐し、区切り位置が1
つだけであれば変換結果決定(S35)に分岐する。
出された2文節の組み合わせの中に、2つの文節の区切
り位置が異なるものがあるかどうか、すなわち、区切り
位置が複数個あるかどうかをチェックする。複数個の場
合は、区切り決定(S34)に分岐し、区切り位置が1
つだけであれば変換結果決定(S35)に分岐する。
【0069】区切り決定(S34)は、複数個の異なる
区切りの中から、最も最適と思われる区切り位置を1つ
だけ選んで決定する処理であり、この処理において決定
された区切り位置とは異なる位置で区切れる2文節の組
み合わせを取り除く。この処理は、図10において詳述
する。処理を終えると、変換結果決定(S35)に進
む。
区切りの中から、最も最適と思われる区切り位置を1つ
だけ選んで決定する処理であり、この処理において決定
された区切り位置とは異なる位置で区切れる2文節の組
み合わせを取り除く。この処理は、図10において詳述
する。処理を終えると、変換結果決定(S35)に進
む。
【0070】変換結果決定(S35)は、連続する2文
節のうち、最初の文節に対して変換結果を決定し、変換
結果を出力し、変換対象の読みを示すデータの対象位置
を後続する文節の先頭位置に移す処理である。この処理
は、図13において詳述する。処理を終えると、S31
に戻る。
節のうち、最初の文節に対して変換結果を決定し、変換
結果を出力し、変換対象の読みを示すデータの対象位置
を後続する文節の先頭位置に移す処理である。この処理
は、図13において詳述する。処理を終えると、S31
に戻る。
【0071】変換結果決定(S36)は、2文節候補抽
出(S31)において1文節のみ抽出された文節に対し
て変換結果を決定し、変換結果を出力する処理である。
これらの処理は、変換結果決定(S35)で行われてい
る処理と同じであるので、特に詳細な説明はしない。処
理を終えるとリターンする。
出(S31)において1文節のみ抽出された文節に対し
て変換結果を決定し、変換結果を出力する処理である。
これらの処理は、変換結果決定(S35)で行われてい
る処理と同じであるので、特に詳細な説明はしない。処
理を終えるとリターンする。
【0072】図10は、区切り決定処理(S34)を詳
細化したフローである。
細化したフローである。
【0073】図10において、用例で決定する処理(S
41)は、用例によって複数個ある区切り位置を絞り込
む処理である。すなわち、連続する2文節を構成する2
つの自立語の組み合わせの用例があれば、その2文節の
間の区切りは用例がある区切りとみなす。また、既に変
換出力された文節を構成する自立語と、連続する2文節
のいずれか一方の文節を構成する自立語の組み合わせの
用例があれば、その2文節の間の区切りは用例がある区
切りとみなす。用例があるかどうか判断する方法は同種
のかな漢字処理で用いられており、公知であるので、こ
こでは特に詳述しない。各区切りに対して用例があるか
どうかを調べ、用例がある区切りが存在していれば、用
例がない区切りを持つ2文節の組み合わせを候補からは
ずす。このようにして、用例によって、区切り位置の絞
り込みを行う。この処理を終えると、決定の判断(S4
2)に進む。
41)は、用例によって複数個ある区切り位置を絞り込
む処理である。すなわち、連続する2文節を構成する2
つの自立語の組み合わせの用例があれば、その2文節の
間の区切りは用例がある区切りとみなす。また、既に変
換出力された文節を構成する自立語と、連続する2文節
のいずれか一方の文節を構成する自立語の組み合わせの
用例があれば、その2文節の間の区切りは用例がある区
切りとみなす。用例があるかどうか判断する方法は同種
のかな漢字処理で用いられており、公知であるので、こ
こでは特に詳述しない。各区切りに対して用例があるか
どうかを調べ、用例がある区切りが存在していれば、用
例がない区切りを持つ2文節の組み合わせを候補からは
ずす。このようにして、用例によって、区切り位置の絞
り込みを行う。この処理を終えると、決定の判断(S4
2)に進む。
【0074】決定の判断(S42)は、用例で決定する
処理(S41)において、区切り位置が一つに決定でき
たかどうかを判定する処理であり、区切りの候補が複数
個存在していれば分野で決定(S43)に分岐し、区切
りの候補が1つのみであればリターンする。
処理(S41)において、区切り位置が一つに決定でき
たかどうかを判定する処理であり、区切りの候補が複数
個存在していれば分野で決定(S43)に分岐し、区切
りの候補が1つのみであればリターンする。
【0075】分野で決定する処理(S43)は、分野を
考慮して複数個ある区切り位置を絞り込む処理である。
分野尤度の状態と2文節を構成する単語が属する分野と
の関係によって、2文節全体の確からしさを求め、その
確からしさによって、区切りを絞り込む処理である。こ
の処理は、図11において詳述する。この処理を終える
と、決定の判断(S44)に進む。
考慮して複数個ある区切り位置を絞り込む処理である。
分野尤度の状態と2文節を構成する単語が属する分野と
の関係によって、2文節全体の確からしさを求め、その
確からしさによって、区切りを絞り込む処理である。こ
の処理は、図11において詳述する。この処理を終える
と、決定の判断(S44)に進む。
【0076】決定の判断(S44)は、分野で決定(S
43)において、区切り位置が一つに決定できたかどう
かを判定する処理であり、区切りの候補が複数個存在し
ていれば短期学習で決定(S45)へ分岐し、区切りの
候補が1つのみであればリターンする。
43)において、区切り位置が一つに決定できたかどう
かを判定する処理であり、区切りの候補が複数個存在し
ていれば短期学習で決定(S45)へ分岐し、区切りの
候補が1つのみであればリターンする。
【0077】短期学習で決定(S45)は、短期学習に
よって複数個ある区切り位置を絞り込む処理である。す
なわち、2文節を構成する2つの自立語のうち、いずれ
か一方でも最近ユーザに使用されていれば、その2文節
の区切りは、短期学習がある区切りとする。短期学習の
仕組みは同種のかな漢字変換処理で一般的に用いられて
おり、公知であるので、ここでは特に詳述はしない。こ
のようにして、各区切りに対して短期学習があるかどう
かを調べ、短期学習がある区切りが存在していれば、短
期学習がない区切りを持つ2文節の組み合わせを候補か
らはずす。この処理を終えると、決定の判断(S46)
へ進む。
よって複数個ある区切り位置を絞り込む処理である。す
なわち、2文節を構成する2つの自立語のうち、いずれ
か一方でも最近ユーザに使用されていれば、その2文節
の区切りは、短期学習がある区切りとする。短期学習の
仕組みは同種のかな漢字変換処理で一般的に用いられて
おり、公知であるので、ここでは特に詳述はしない。こ
のようにして、各区切りに対して短期学習があるかどう
かを調べ、短期学習がある区切りが存在していれば、短
期学習がない区切りを持つ2文節の組み合わせを候補か
らはずす。この処理を終えると、決定の判断(S46)
へ進む。
【0078】決定の判断(S46)では、短期学習で決
定(S45)において区切り位置が一つに絞り込むこと
ができたかどうかを判定する処理である。区切りの候補
が複数個存在していれば他の方法で決定(S47)へ分
岐し、区切りの候補が1つのみであればリターンする。
定(S45)において区切り位置が一つに絞り込むこと
ができたかどうかを判定する処理である。区切りの候補
が複数個存在していれば他の方法で決定(S47)へ分
岐し、区切りの候補が1つのみであればリターンする。
【0079】他の方法で決定(S47)は、上記以外の
方法によって区切りを決定する処理であり、例えば、単
語の頻度などによって区切りを決定する処理である。こ
のような処理は、同種のかな漢字変換処理において一般
的に行われている処理であり、公知であるので特に詳細
な説明は行わない。処理を終えると、区切りは一つに決
定されているので、リターンする。
方法によって区切りを決定する処理であり、例えば、単
語の頻度などによって区切りを決定する処理である。こ
のような処理は、同種のかな漢字変換処理において一般
的に行われている処理であり、公知であるので特に詳細
な説明は行わない。処理を終えると、区切りは一つに決
定されているので、リターンする。
【0080】図11は、分野の決定処理(S43)を詳
細化したフローチャートである。
細化したフローチャートである。
【0081】図11において、2文節候補取り出し(S
51)において、2文節の候補の中から、対象となる2
文節を一つずつ順番に取り出していく。取り出しが終了
したか否かを判断し(S52)、終了していなければ分
野文節尤度(1)(S53)へ進む。すべての候補を取
り出し終えたら、S52においてS56へ分岐する。分
野文節尤度(1)(S53)において、2文節のうち、
最初の文節に対して、分野による文節尤度、すなわち、
分野処理による文節の確からしさの度合いを求める。こ
の処理の詳細は図12において詳述する。処理を終える
と分野文節尤度(2)(S54)へ進む。
51)において、2文節の候補の中から、対象となる2
文節を一つずつ順番に取り出していく。取り出しが終了
したか否かを判断し(S52)、終了していなければ分
野文節尤度(1)(S53)へ進む。すべての候補を取
り出し終えたら、S52においてS56へ分岐する。分
野文節尤度(1)(S53)において、2文節のうち、
最初の文節に対して、分野による文節尤度、すなわち、
分野処理による文節の確からしさの度合いを求める。こ
の処理の詳細は図12において詳述する。処理を終える
と分野文節尤度(2)(S54)へ進む。
【0082】分野文節尤度(2)(S54)では、2文
節のうち、後ろの文節に対して、分野による文節尤度を
求める。この処理は分野文節尤度(1)(S53)と同
じようにして行われるので、詳細は図12において詳述
する。処理を終えると、加えて格納処理(S55)へ進
む。
節のうち、後ろの文節に対して、分野による文節尤度を
求める。この処理は分野文節尤度(1)(S53)と同
じようにして行われるので、詳細は図12において詳述
する。処理を終えると、加えて格納処理(S55)へ進
む。
【0083】加えて格納処理(S55)では、分野文節
尤度(1)(S53)で求めた文節尤度と分野文節尤度
(2)(S54)で求めた文節尤度とを加える。結果の
値は、対象となっている2文節の分野による尤度とな
る。そして、この結果の値を、対象となっている2文節
に対応させて格納する。処理を終えると、S51に戻
る。候補絞り込み(S56)では、加えて格納(S5
5)において格納保存した2文節の分野による尤度によ
って、2文節の候補の絞り込みを行う。例えば、2文節
の分野による尤度の値がある基準以上の候補のみを残し
て、その他の2文節を候補からはずす。処理を終えると
リターンする。
尤度(1)(S53)で求めた文節尤度と分野文節尤度
(2)(S54)で求めた文節尤度とを加える。結果の
値は、対象となっている2文節の分野による尤度とな
る。そして、この結果の値を、対象となっている2文節
に対応させて格納する。処理を終えると、S51に戻
る。候補絞り込み(S56)では、加えて格納(S5
5)において格納保存した2文節の分野による尤度によ
って、2文節の候補の絞り込みを行う。例えば、2文節
の分野による尤度の値がある基準以上の候補のみを残し
て、その他の2文節を候補からはずす。処理を終えると
リターンする。
【0084】図12は、文節分野尤度(1)処理(S5
3)および文節分野尤度(2)処理(S54)を詳細化
したフローチャートである。
3)および文節分野尤度(2)処理(S54)を詳細化
したフローチャートである。
【0085】図12において、分野辞書検索(S61)
は、対象となっている文節を構成する自立語が、分野辞
書BDIC113に登録されているかどうかの検索を行
う処理である。分野辞書BDIC113の先頭から順々
に検索していき、登録されている分野の情報が見つかっ
たか否か判断し(S62)、一つ見つかるごとに分野に
よる尤度(S63)に分岐する。分野辞書BDIC11
3の最後まで検索を終えたら、S62においてリターン
へ分岐し、リターンする。
は、対象となっている文節を構成する自立語が、分野辞
書BDIC113に登録されているかどうかの検索を行
う処理である。分野辞書BDIC113の先頭から順々
に検索していき、登録されている分野の情報が見つかっ
たか否か判断し(S62)、一つ見つかるごとに分野に
よる尤度(S63)に分岐する。分野辞書BDIC11
3の最後まで検索を終えたら、S62においてリターン
へ分岐し、リターンする。
【0086】分野による尤度(S63)では、分野辞書
検索(S61)で検索された自立語の分野の情報と、分
野尤度BYUD115とによって、その分野による文節
の尤度を求める。検出された自立語の分野の情報が、分
野が分野iで確信度がCi であるとすると、分野iの分
野尤度Oi を用いて、分野iによる対象となる文節の尤
度BYi は、例えば、次の式で求めることができる。
検索(S61)で検索された自立語の分野の情報と、分
野尤度BYUD115とによって、その分野による文節
の尤度を求める。検出された自立語の分野の情報が、分
野が分野iで確信度がCi であるとすると、分野iの分
野尤度Oi を用いて、分野iによる対象となる文節の尤
度BYi は、例えば、次の式で求めることができる。
【0087】
【数1】BYi =Oi Ci このようにして、分野iによる文節の尤度BYi を求め
ると、分野尤度の値が大きければ大きいほど(すなわち
入力されている文書が分野iに関係があればあるほ
ど)、また、文節を構成する自立語が分野iに属する確
信度が大きければ大きいほど(すなわちその自立語が分
野iに関係が深ければ深いほど)、このBYiの値が大
きくなる。分野による文節の尤度を求めたら、最大値更
新(S64)へ進む。
ると、分野尤度の値が大きければ大きいほど(すなわち
入力されている文書が分野iに関係があればあるほ
ど)、また、文節を構成する自立語が分野iに属する確
信度が大きければ大きいほど(すなわちその自立語が分
野iに関係が深ければ深いほど)、このBYiの値が大
きくなる。分野による文節の尤度を求めたら、最大値更
新(S64)へ進む。
【0088】図14は、変換単語決定処理(S71)を
詳細化したフローチャートである。
詳細化したフローチャートである。
【0089】図14において、用例で決定(S81)
は、用例によって変換する単語を絞り込む処理である。
文節の候補に対して用例があるかどうかを調べ、用例が
ある文節が存在していれば、用例がない文節を候補から
はずす。このようにして、用例によって、変換する文節
の候補の絞り込みを行うことができる。この処理は、同
種のかな漢字変換処理において一般的に行われている処
理であり、公知であるので詳細には記述しない。この処
理を終えると、決定の判断(S82)へ進む。
は、用例によって変換する単語を絞り込む処理である。
文節の候補に対して用例があるかどうかを調べ、用例が
ある文節が存在していれば、用例がない文節を候補から
はずす。このようにして、用例によって、変換する文節
の候補の絞り込みを行うことができる。この処理は、同
種のかな漢字変換処理において一般的に行われている処
理であり、公知であるので詳細には記述しない。この処
理を終えると、決定の判断(S82)へ進む。
【0090】決定の判断(S82)は、用例で決定(S
81)において、変換する文節の候補が一つに決定でき
たかどうかを判定する処理であり、文節の候補が複数個
存在していれば分野で決定(S83)へ分岐し、文節の
候補が1つのみであればリターンする。
81)において、変換する文節の候補が一つに決定でき
たかどうかを判定する処理であり、文節の候補が複数個
存在していれば分野で決定(S83)へ分岐し、文節の
候補が1つのみであればリターンする。
【0091】分野で決定(S83)は、分野によって複
数個ある文節の候補を絞り込む処理である。分野尤度の
状態と対象となる文節を構成する単語が属する分野との
関係によって、文節の確からしさを求め、その確からし
さによって、文節の候補を絞り込む処理である。この処
理は、図15において詳述する。この処理を終えると、
決定の判断(S84)へ進む。
数個ある文節の候補を絞り込む処理である。分野尤度の
状態と対象となる文節を構成する単語が属する分野との
関係によって、文節の確からしさを求め、その確からし
さによって、文節の候補を絞り込む処理である。この処
理は、図15において詳述する。この処理を終えると、
決定の判断(S84)へ進む。
【0092】決定の判断(84)は、分野で決定(S8
3)において、変換する文節の候補が一つに決定できた
かどうかを判定する処理であり、文節の候補が複数個存
在していれば短期学習で決定(S85)へ分岐し、文節
の候補が1つのみであればリターンする。短期学習で決
定(S85)は、短期学習によって複数個ある文節の候
補を絞り込む処理である。すなわち、文節を構成する自
立語が最近ユーザに使用されていれば、その文節は短期
学習されているとする。このようにして、各文節の候補
に対して短期学習されているかどうかを調べ、短期学習
されている文節が存在していれば、短期学習されていな
い文節を候補からはずす。このような処理は、同種のか
な漢字変換処理において一般に行われている処理であ
る。この処理を終えると、決定の判断(S86)へ進
む。
3)において、変換する文節の候補が一つに決定できた
かどうかを判定する処理であり、文節の候補が複数個存
在していれば短期学習で決定(S85)へ分岐し、文節
の候補が1つのみであればリターンする。短期学習で決
定(S85)は、短期学習によって複数個ある文節の候
補を絞り込む処理である。すなわち、文節を構成する自
立語が最近ユーザに使用されていれば、その文節は短期
学習されているとする。このようにして、各文節の候補
に対して短期学習されているかどうかを調べ、短期学習
されている文節が存在していれば、短期学習されていな
い文節を候補からはずす。このような処理は、同種のか
な漢字変換処理において一般に行われている処理であ
る。この処理を終えると、決定の判断(S86)へ進
む。
【0093】決定の判断(S86)は、短期学習で決定
(85)において、変換する文節の候補が一つに決定で
きたかどうかを判定する処理であり、文節の候補が複数
個存在していれば他の方法で決定(S87)へ分岐し、
文節の候補が1つのみであればリターンする。他の方法
で決定(S87)は、上記以外の方法によって変換する
文節の構造を決定する処理であり、例えば、単語の頻度
などによって変換する単語を決定する処理である。この
ような処理は、同種のかな漢字変換処理において一般的
に行われている処理であり、公知であるので特に詳細な
説明は行わない。処理を終えると、変換する文節の構造
は一つに決定されているので、リターンする。
(85)において、変換する文節の候補が一つに決定で
きたかどうかを判定する処理であり、文節の候補が複数
個存在していれば他の方法で決定(S87)へ分岐し、
文節の候補が1つのみであればリターンする。他の方法
で決定(S87)は、上記以外の方法によって変換する
文節の構造を決定する処理であり、例えば、単語の頻度
などによって変換する単語を決定する処理である。この
ような処理は、同種のかな漢字変換処理において一般的
に行われている処理であり、公知であるので特に詳細な
説明は行わない。処理を終えると、変換する文節の構造
は一つに決定されているので、リターンする。
【0094】図15は、分野で決定処理(S83)を詳
細化したフローチャートである。
細化したフローチャートである。
【0095】図15において、文節候補取り出し(S9
1)は、文節の候補の中から、対象となる文節を一つ一
つ順番に取り出していく。取り出しが終了したか否かを
判断し(S92)、終了していれば分野文節尤度(S9
3)へ進む。すべての候補を取り出し終えたら、S92
においてS95へ分岐する。
1)は、文節の候補の中から、対象となる文節を一つ一
つ順番に取り出していく。取り出しが終了したか否かを
判断し(S92)、終了していれば分野文節尤度(S9
3)へ進む。すべての候補を取り出し終えたら、S92
においてS95へ分岐する。
【0096】分野文節尤度(S93)において、対象と
なる文節に対して、分野による文節尤度、すなわち、分
野処理による文節の確からしさの度合いを求める。この
処理は、分野文節尤度(1)(S53)や分野文節尤度
(2)(S54)における処理と同じような処理であ
り、すでに図12において詳述しているので、ここでは
特に説明しない。処理を終えると格納(S94)へ進
む。
なる文節に対して、分野による文節尤度、すなわち、分
野処理による文節の確からしさの度合いを求める。この
処理は、分野文節尤度(1)(S53)や分野文節尤度
(2)(S54)における処理と同じような処理であ
り、すでに図12において詳述しているので、ここでは
特に説明しない。処理を終えると格納(S94)へ進
む。
【0097】格納(S94)において、分野文節尤度
(S93)で求めた分野による文節尤度を、対象となっ
ている文節に対応させて格納して保存する。処理を終え
ると、S91へ戻る。
(S93)で求めた分野による文節尤度を、対象となっ
ている文節に対応させて格納して保存する。処理を終え
ると、S91へ戻る。
【0098】候補絞り込み(S95)は、格納(S9
4)において格納保存した文節の分野による尤度によ
り、文節の候補の絞り込みを行う。例えば、文節の分野
による尤度の値が最も互い値を持つ候補のみを残して、
他の文節を候補からはずす。処理を終えるとリターンす
る。
4)において格納保存した文節の分野による尤度によ
り、文節の候補の絞り込みを行う。例えば、文節の分野
による尤度の値が最も互い値を持つ候補のみを残して、
他の文節を候補からはずす。処理を終えるとリターンす
る。
【0099】図16は、分野尤度更新の処理(S73)
を説明したフローチャートである。
を説明したフローチャートである。
【0100】図16において、分野辞書検索(S10
1)は、変換単語決定(S71)において決定された変
換する文節の構造に従って、自立語の単語IDに従って
分野辞書BYUD115を検索する処理である。分野辞
書BDIC113の先頭から自立語の単語IDと一致す
る辞書項目を一つずつ順番に見つけ出し、見つかった判
断をした場合は(S102)、分野尤度補正(S10
3)に分岐する。分野辞書BDIC113の最後まで検
索を終えたらリターンする。
1)は、変換単語決定(S71)において決定された変
換する文節の構造に従って、自立語の単語IDに従って
分野辞書BYUD115を検索する処理である。分野辞
書BDIC113の先頭から自立語の単語IDと一致す
る辞書項目を一つずつ順番に見つけ出し、見つかった判
断をした場合は(S102)、分野尤度補正(S10
3)に分岐する。分野辞書BDIC113の最後まで検
索を終えたらリターンする。
【0101】分野尤度補正(S103)は、分野辞書検
索(S101)において見つかった分野辞書BDIC1
13の辞書項目に従って、分野尤度BYUD115を補
正する処理である。分野辞書検索(S101)において
見つかった分野辞書BDIC113の辞書項目の内容
が、分野が分野iで、確信度がCi とすると、分野iに
対応する尤度に対する補正値θi の値を、以下の式のよ
うにする。
索(S101)において見つかった分野辞書BDIC1
13の辞書項目に従って、分野尤度BYUD115を補
正する処理である。分野辞書検索(S101)において
見つかった分野辞書BDIC113の辞書項目の内容
が、分野が分野iで、確信度がCi とすると、分野iに
対応する尤度に対する補正値θi の値を、以下の式のよ
うにする。
【0102】
【数2】θi =Zi Ci ここで、Zi は、分野ごとに設定される正の定数であ
る。
る。
【0103】この補正値を分野尤度に加えることによっ
て、Ci が正の値で、大きければ大きいほど分野iの分
野尤度Oi は大きくなり、分野iに属する単語が優先さ
れて変換されやすくなる。また、Ci が負の値で、小さ
ければ小さいほど分野iの分野尤度Oi は小さくなり、
分野iに属する単語は変換されにくくなる。
て、Ci が正の値で、大きければ大きいほど分野iの分
野尤度Oi は大きくなり、分野iに属する単語が優先さ
れて変換されやすくなる。また、Ci が負の値で、小さ
ければ小さいほど分野iの分野尤度Oi は小さくなり、
分野iに属する単語は変換されにくくなる。
【0104】図17は、候補選択の処理(S25)を説
明したフローチャートである。
明したフローチャートである。
【0105】図17において、文節取り出し(S11
1)は、最適候補変換(S24)で変換出力された変換
結果の先頭から、文節を一つずつ順番に取り出してき
て、オペレータに変換結果として正しいかどうかを問い
合わせる処理である。文節を一つ取り出すごとに終了か
否か判断し(S112)、終了でない場合はキー入力待
ち(S113)に分岐する。すべての文節を取り出し終
えたら、S112においてリターンする。
1)は、最適候補変換(S24)で変換出力された変換
結果の先頭から、文節を一つずつ順番に取り出してき
て、オペレータに変換結果として正しいかどうかを問い
合わせる処理である。文節を一つ取り出すごとに終了か
否か判断し(S112)、終了でない場合はキー入力待
ち(S113)に分岐する。すべての文節を取り出し終
えたら、S112においてリターンする。
【0106】キー入力待ち(S113)において、キー
ボードからのデータを取り込む。入力されたキーがSL
CTキー184であるか否か判断し、SLCTキー18
4の場合は分野尤度更新(S117)に分岐する。SL
CTキー184以外のキーが入力された場合は、同音異
義語表示(S115)に分岐する。
ボードからのデータを取り込む。入力されたキーがSL
CTキー184であるか否か判断し、SLCTキー18
4の場合は分野尤度更新(S117)に分岐する。SL
CTキー184以外のキーが入力された場合は、同音異
義語表示(S115)に分岐する。
【0107】同音異義語表示(S115)は、文節取り
出し(S111)で取り出された文節に対して、同音異
義語の候補を求めて表示する処理である。この処理は同
種のかな漢字変換処理で一般に行われている処理であ
り、公知であるので、ここでは特に詳細な説明は行わな
い。処理を終えると変換結果指定(S116)へ進む。
出し(S111)で取り出された文節に対して、同音異
義語の候補を求めて表示する処理である。この処理は同
種のかな漢字変換処理で一般に行われている処理であ
り、公知であるので、ここでは特に詳細な説明は行わな
い。処理を終えると変換結果指定(S116)へ進む。
【0108】変換結果指定(S116)は、同音異義語
表示(S115)で表示されている候補の中からオペレ
ータが変換すべき候補を選択する処理である。例えば、
同音異義語表示(S115)において、各同音異義語に
対して番号をつけて表示しておけば、オペレータは番号
を指定して対応する数字キーを入力することによって、
変換すべき候補を選択できる。変換すべき候補が選択さ
れたら、分野尤度更新(S117)へ進む。
表示(S115)で表示されている候補の中からオペレ
ータが変換すべき候補を選択する処理である。例えば、
同音異義語表示(S115)において、各同音異義語に
対して番号をつけて表示しておけば、オペレータは番号
を指定して対応する数字キーを入力することによって、
変換すべき候補を選択できる。変換すべき候補が選択さ
れたら、分野尤度更新(S117)へ進む。
【0109】分野尤度更新(S117)は、分野尤度を
更新する処理である。この処理は図16で説明した処理
と同様に、変換結果指定(S116)において選択され
た文節の自立語が分野辞書にあるかどうかチェックし、
ある場合は図16の場合と同様に分野尤度の値を補正す
る。処理を終えると決定処理(S118)へ進む。
更新する処理である。この処理は図16で説明した処理
と同様に、変換結果指定(S116)において選択され
た文節の自立語が分野辞書にあるかどうかチェックし、
ある場合は図16の場合と同様に分野尤度の値を補正す
る。処理を終えると決定処理(S118)へ進む。
【0110】決定処理(S118)は、分野尤度更新
(S117)において補正された分野尤度の値を元に分
野尤度表示部を再表示する分野表示部更新処理である。
ここでも、ユーザの選択による分野尤度補正の様子が直
接分野尤度表示部に反映されるので、ユーザはどの分野
が優先されているのかを直接知ることが可能である。処
理を終えると、決定処理(S119)に進む。
(S117)において補正された分野尤度の値を元に分
野尤度表示部を再表示する分野表示部更新処理である。
ここでも、ユーザの選択による分野尤度補正の様子が直
接分野尤度表示部に反映されるので、ユーザはどの分野
が優先されているのかを直接知ることが可能である。処
理を終えると、決定処理(S119)に進む。
【0111】決定処理(S119)は、対象となる文節
について、オペレータによって選択された変換結果を決
定出力する処理である。この処理は同種のかな漢字変換
処理において一般的に用いられている処理であり、公知
であるので特に詳細な説明は行わない。処理が終われ
ば、S111へ戻る。
について、オペレータによって選択された変換結果を決
定出力する処理である。この処理は同種のかな漢字変換
処理において一般的に用いられている処理であり、公知
であるので特に詳細な説明は行わない。処理が終われ
ば、S111へ戻る。
【0112】なお、本発明は上述した実施の形態に限定
されるものではない。
されるものではない。
【0113】上述の実施の形態では分野尤度表示部はグ
ラフであったが、直接分野尤度を数字で示した表を表示
することも可能である。この場合、ユーザは表の数字を
直接変更することによって分野尤度を変更することが可
能である。
ラフであったが、直接分野尤度を数字で示した表を表示
することも可能である。この場合、ユーザは表の数字を
直接変更することによって分野尤度を変更することが可
能である。
【0114】また、上述の実施の形態では各分野ごとの
相関関係はないが、各分野をノードとする分野ネットワ
ークを構成し、ネットワークの各ノードに重み付けをす
ることによって各分野の分野尤度に相関関係を持たせる
ことも可能である。この場合、分野尤度がよりダイナミ
ックに変更され、その様子を逐次分野表示部に反映させ
ることができる。
相関関係はないが、各分野をノードとする分野ネットワ
ークを構成し、ネットワークの各ノードに重み付けをす
ることによって各分野の分野尤度に相関関係を持たせる
ことも可能である。この場合、分野尤度がよりダイナミ
ックに変更され、その様子を逐次分野表示部に反映させ
ることができる。
【0115】また、上述の実施の形態では単語に分野情
報を付加する手段として、単語辞書WDIC111とは
別の辞書BDIC113を用いているが、単語辞書WD
IC111中に分野情報を格納してもよい。
報を付加する手段として、単語辞書WDIC111とは
別の辞書BDIC113を用いているが、単語辞書WD
IC111中に分野情報を格納してもよい。
【0116】また、単語と分野の関係の度合いを表すも
のとして確信度を用いていたが、処理を簡単にするため
に確信度は全て正の一定値を持つものとして扱い、確信
度を省略してもよい。
のとして確信度を用いていたが、処理を簡単にするため
に確信度は全て正の一定値を持つものとして扱い、確信
度を省略してもよい。
【0117】また、かな漢字変換において文節の区切り
や変換する単語を決定する際、用例による決定と分野に
よる決定と短期学習による決定とその他の方法による決
定をこの順番に適用して決定しているが、この決定アル
ゴリズムは種々変形可能である。例えば、この順番の逆
の順序で適用して決定してもよいし、それぞれの決定方
法を全ての候補に対して行い、それぞれの処理結果に所
定の重み付けを行い、相互的に判断してもよい。
や変換する単語を決定する際、用例による決定と分野に
よる決定と短期学習による決定とその他の方法による決
定をこの順番に適用して決定しているが、この決定アル
ゴリズムは種々変形可能である。例えば、この順番の逆
の順序で適用して決定してもよいし、それぞれの決定方
法を全ての候補に対して行い、それぞれの処理結果に所
定の重み付けを行い、相互的に判断してもよい。
【0118】その他、本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。
囲で種々変形して実施することができる。
【0119】
【発明の効果】以上説明したように、本発明の文字処理
装置および方法によれば、ユーザが現在の分野尤度を確
認することができる。更に、ユーザが分野尤度を変更し
てその後の分野尤度に基づく変換に反映させることが可
能となり、ユーザの意向を反映しつつ少ない操作で所望
の変換結果を得ることが実現でき、さらに使いやすい文
字処理装置を提供することが可能となる。
装置および方法によれば、ユーザが現在の分野尤度を確
認することができる。更に、ユーザが分野尤度を変更し
てその後の分野尤度に基づく変換に反映させることが可
能となり、ユーザの意向を反映しつつ少ない操作で所望
の変換結果を得ることが実現でき、さらに使いやすい文
字処理装置を提供することが可能となる。
【図1】本発明における全体構成のブロック図である。
【図2】本発明における単語辞書WDICの構成例を示
す図である。
す図である。
【図3】本発明における分野辞書BDICの構成例を示
す図である。
す図である。
【図4】本発明における分野尤度BYUDの構成例を示
す図である。
す図である。
【図5】本発明における分野尤度表示部を示す図であ
る。
る。
【図6】本発明における文字処理装置の動作を示すフロ
ーチャートである。
ーチャートである。
【図7】本発明におけるユーティリティ操作の動作を示
すフローチャートである。
すフローチャートである。
【図8】本発明におけるかな漢字入力の動作を示すフロ
ーチャートである。
ーチャートである。
【図9】本発明における最適候補変換の動作を示すフロ
ーチャートである。
ーチャートである。
【図10】本発明における区切り決定の動作を示すフロ
ーチャートである。
ーチャートである。
【図11】本発明における区切りを分野で決定する動作
を示すフローチャートである。
を示すフローチャートである。
【図12】本発明における分野による分野尤度を求める
動作を示すフローチャートである。
動作を示すフローチャートである。
【図13】本発明における変換結果決定の動作を示すフ
ローチャートである。
ローチャートである。
【図14】本発明における変換単語決定の動作を示すフ
ローチャートである。
ローチャートである。
【図15】本発明における変換単語を分野で決定する動
作を示すフローチャートである。
作を示すフローチャートである。
【図16】本発明における分野尤度更新の動作を示すフ
ローチャートである。
ローチャートである。
【図17】本発明における候補選択の動作を示すフロー
チャートである。
チャートである。
100 外部メモリ 110 RAM 111 単語辞書(WDIC) 113 分野辞書(BDIC) 115 分野尤度(BYUD) 120 ROM 125 プログラム・エリア(PA) 130 CPU 140 キャラクタ・ジェネレータ(CG) 150 CRT 160 CRTC 170 バッファ・メモリ(DBUF) 180 キーボード(KB) 182 CNVTキー 184 SLCTキー 186 MOVEキー 188 NEXTキー 190 ポインティング・デバイス(PD) 195 入力制御部(INCTR)
Claims (14)
- 【請求項1】 かな漢字変換の対象となる文の読みを表
す文字列データを入力する読み入力手段と、 前記読み入力手段により入力した文の読みを表す文字列
データを漢字かな混じり文に変換するかな漢字変換手段
と、 単語の読みと該単語を表記する漢字と該単語に関する情
報とを格納した単語辞書とを有する文字処理装置におい
て、 単語が関係する分野を格納した分野辞書と、 前記読み入力手段により入力している文と1以上の前記
分野との関係の程度を各分野毎に示す分野尤度を保持す
る分野尤度保持手段と、 前記分野尤度保持手段中の分野尤度の大きな分野に属す
る単語を変換候補として優先させる分野処理を行う手段
と、 前記分野尤度保持手段に保持された分野尤度を表示する
分野尤度表示手段とを備えたことを特徴とする文字処理
装置。 - 【請求項2】 請求項1記載の文字処理装置において、 前記かな漢字変換手段は、前記文字列データ中のかな漢
字変換を行う位置から抽出した連続する2文節の文節を
区切る位置が複数個ある場合に、 前記2文節の内の1文節から抽出した単語が関係する分
野の前記分野尤度を用いて該1文節の分野尤度である第
1の文節尤度を求める手段と、 前記2文節の内の他の1文節から抽出した単語が関係す
る分野の前記分野尤度を用いて該他の1文節の分野尤度
である第2の文節尤度を求める手段と、 前記第1の文節尤度と前記第2の文節尤度とから前記2
文節全体の文節尤度を求める手段と、 前記複数個の文節を区切る位置に対応した複数個の2文
節の組が各々有する前記2文節全体の文節尤度を比較し
て、2文節の組を抽出する手段とを備えたことを特徴と
する文字処理装置。 - 【請求項3】 請求項1記載の文字処理装置において、 前記かな漢字変換手段による変換をユーザからの入力に
より選択する変換確定手段と、 前記変換確定手段により選択された単語が関係する前記
分野尤度保持手段中の分野尤度を更新する更新手段とを
さらに備えたことを特徴とする文字処理装置。 - 【請求項4】 請求項1記載の文字処理装置において、 前記分野尤度保持手段に保持された分野尤度をユーザか
らの指示により更新するユーザ更新手段をさらに備えた
ことを特徴とする文字処理装置。 - 【請求項5】 請求項4記載の文字処理装置において、 前記ユーザ更新手段は、前記分野尤度表示手段により表
示された前記分野尤度をユーザが操作することにより更
新する手段であることを特徴とする文字処理装置。 - 【請求項6】 請求項1ないし5のいずれかに記載の文
字処理装置において、 前記分野尤度表示手段は、グラフ表示により前記分野尤
度を表示することを特徴とする文字処理装置。 - 【請求項7】 請求項1ないし5のいずれかに記載の文
字処理装置において、 前記分野尤度表示手段は、数値表示により前記分野尤度
を表示することを特徴とする文字処理装置。 - 【請求項8】 かな漢字変換の対象となる文の読みを表
す文字列データを入力する読み入力ステップと、 単語の読みと該単語を表記する漢字と該単語に関する情
報とを格納した単語辞書を用いて、前記読み入力ステッ
プにより入力した文の読みを表す文字列データを漢字か
な混じり文に変換するかな漢字変換ステップとを有する
文字処理方法において、 単語が関係する分野を格納した分野辞書と、 前記読み入力ステップにより入力している文と1以上の
前記分野との関係の程度を各分野毎に示す分野尤度とを
用いて、 前記分野尤度の大きな分野に属する単語を変換候補とし
て優先させる分野処理を行うステップと前記分野尤度を
表示する分野尤度表示ステップとを備えたことを特徴と
する文字処理方法。 - 【請求項9】 請求項8記載の文字処理方法において、 前記分野尤度をユーザからの指示により更新するユーザ
更新ステップをさらに備えたことを特徴とする文字処理
方法。 - 【請求項10】 請求項9記載の文字処理方法におい
て、 前記ユーザ更新ステップは、前記分野尤度表示ステップ
により表示された前記分野尤度をユーザが操作すること
により更新するステップであることを特徴とする文字処
理方法。 - 【請求項11】 請求項8記載の文字処理方法におい
て、 前記かな漢字変換ステップは、前記文字列データ中のか
な漢字変換を行う位置から抽出した連続する2文節の文
節を区切る位置が複数個ある場合に、 前記2文節の内の1文節から抽出した単語が関係する分
野の前記分野尤度を用いて該1文節の分野尤度である第
1の文節尤度を求めるステップと、 前記2文節の内の他の1文節から抽出した単語が関係す
る分野の前記分野尤度とを用いて該他の1文節の分野尤
度である第2の文節尤度を求めるステップと、 前記第1の文節尤度と前記第2の文節尤度とから前記2
文節全体の文節尤度を求めるステップと、 前記複数個の文節を区切る位置に対応した複数個の2文
節の組が各々有する前記2文節全体の文節尤度を比較し
て、2文節の組を抽出するステップとを備えたことを特
徴とする文字処理方法。 - 【請求項12】 請求項8記載の文字処理方法におい
て、 前記かな漢字変換ステップによる変換をユーザからの入
力により選択する変換確定ステップと、 前記変換確定ステップにより選択された単語が関係する
前記分野尤度中の分野尤度を更新する更新ステップとを
備えたことを特徴とする文字処理方法。 - 【請求項13】 請求項8ないし12のいずれかに記載
の文字処理方法を実行するためのプログラムを記録した
コンピュータ読み取り可能な記録媒体。 - 【請求項14】 請求項13記載のコンピュータ読み取
り可能な記録媒体であって、 前記分野辞書および分野尤度は、前記記録媒体に形成さ
れる分野辞書ファイルおよび分野尤度ファイルに記録さ
れ、 前記分野辞書ファイルは、単語を識別する単語識別子
と、該単語が関係する分野とを対応づけて記録した単語
データ領域を有し、 前記分野尤度ファイルは、前記分野と、かな漢字変換の
対象となる文の読みを表す文字列データを入力している
文と1以上の前記分野との関係の程度を各分野毎に示す
分野尤度を対応づけて記録した分野尤度データ領域を有
し、 前記単語データ領域は前記単語識別子に基づいてソート
されており、同一の前記単語識別子を有する前記単語デ
ータ領域が複数ある場合は、単語と分野との関係の程度
を示す確信度に基づいてソートされていることを特徴と
する分野データを記録したコンピュータ読み取り可能な
記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9175027A JPH1125079A (ja) | 1997-06-30 | 1997-06-30 | 文字処理装置および方法ならびに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9175027A JPH1125079A (ja) | 1997-06-30 | 1997-06-30 | 文字処理装置および方法ならびに記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1125079A true JPH1125079A (ja) | 1999-01-29 |
Family
ID=15988945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9175027A Pending JPH1125079A (ja) | 1997-06-30 | 1997-06-30 | 文字処理装置および方法ならびに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1125079A (ja) |
-
1997
- 1997-06-30 JP JP9175027A patent/JPH1125079A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2135177A1 (en) | Method system and apparatus for entering text on a computing device | |
JP2003131776A (ja) | 情報処理装置、文字列入力装置、および確定履歴制御方法 | |
JP5790820B2 (ja) | 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法 | |
JPH113331A (ja) | 文書作成装置、予測入力方法、及び記録媒体 | |
JP3290451B2 (ja) | 電子辞書 | |
JP3267064B2 (ja) | パターン情報処理装置 | |
JPH07334499A (ja) | 文字列入力装置 | |
JPH1125079A (ja) | 文字処理装置および方法ならびに記録媒体 | |
JPH1125087A (ja) | 文字処理装置および方法ならびに記録媒体 | |
JPH07271774A (ja) | 文章入力装置 | |
JPH0683812A (ja) | 文書入力装置のかな漢字変換装置 | |
JP2000057134A (ja) | 文書作成装置 | |
JP3847801B2 (ja) | 文字処理装置及びその処理方法 | |
JP3498635B2 (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
JP2005070856A (ja) | 電子辞書における漢字熟語検索機能 | |
JP2833650B2 (ja) | 文書処理装置 | |
JP2000048019A (ja) | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 | |
JP2864418B2 (ja) | 文書処理装置 | |
JPH1125083A (ja) | かな漢字変換装置及びコンピュータ読取可能な記憶媒体 | |
JPH08194701A (ja) | 文字処理装置 | |
JP2007034962A (ja) | 電子辞書および電子辞書の検索方法、電子辞書の検索プログラム | |
JPH0623973B2 (ja) | 文字処理装置の頻度変更方式 | |
JP2006099695A (ja) | 情報表示制御装置及びプログラム | |
JPH10124500A (ja) | かな漢字変換装置 | |
JPH0773279A (ja) | 文字変換装置 |