JPH0442348A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0442348A
JPH0442348A JP2150122A JP15012290A JPH0442348A JP H0442348 A JPH0442348 A JP H0442348A JP 2150122 A JP2150122 A JP 2150122A JP 15012290 A JP15012290 A JP 15012290A JP H0442348 A JPH0442348 A JP H0442348A
Authority
JP
Japan
Prior art keywords
field
candidate
word
conversion
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2150122A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Kazuyo Ikeda
和世 池田
Yuji Kobayashi
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2150122A priority Critical patent/JPH0442348A/ja
Publication of JPH0442348A publication Critical patent/JPH0442348A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を作成し、
入力する文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
この仮名漢字変換は辞書を参照することにより、入力さ
れた読み列を漢字に変換するものである。一般に言って
、仮名漢字変換は、辞書の単語数が少ないとオペレータ
の望む単語は変換できないので変換率が低(なり、単語
数が多いとオペレータの望む単語が変換される可能性が
高(なるので変換率が高くなる。ところが、逆に単語数
が増えすぎて特殊な分野の単語まで辞書に登録される様
になると、オペレータの全(望まない単語が変換され、
変換率が悪くなる場合もある。
例えば、読み列「とうきようきかい」に対しては通常は
「東京機械」と変換してほしいわけてある。ところが、
地名「東京」と地名「官界」が登録されていれば、地名
十地名のパターンは住所の入力などで使われるために優
先して変換され、「東京塵界」と変換されることがある
。この場合、住所入力を全く考えていないオペレータに
とっては、地名が豊富に登録されていることにより、逆
に変換率が下がってしまったことになる。
そこで、−船釣な文書の変換率を高めるために分野別辞
書という手法が提案されている。分野別辞書とは、主な
分野ごとにその分野の単語を格納した辞書のことであり
、オペレータは自分の目的にあった分野別辞書を選択し
変換することで最適な変換をすることができる。上記の
例では住所入力を目的とするオペレータは、地名分野別
辞書を指定して変換し、住所入力を考えていないオペレ
ータは標準辞書を指定して変換するのである。この様に
することで、一般のオペレータは標準辞書を利用するの
で「どうきようきかい」と入力しても正常に「東京機械
Jと変換されることになる。また、住所入力を行なうオ
ペレータは地名分野別辞書を利用するので「東京機械」
の変換は失敗するが、その代わり住所を入力したときの
変換率は高くなる。
この分野別辞書の実現方法には2種類の手法が存在する
第1の方法は特定の分野に属さない普遍的な単語を格納
した標準辞書を設定し、他方、特殊分野の単語のみを格
納した分野別辞書を用意し、ある分野が指定された場合
、標準辞書と指定された分野の分野別辞書の両方をサー
チして変換することで実現する方法である。
第2の方法は上記の標準辞書の内容と特定の分野別辞書
の内容を予めマージした辞書を用意するという方法であ
る。この方式では変換の際には1つの辞書のみをサーチ
すれば良い。
ところが、分野別辞書を実現する上述の第1の方法、第
2の方法はいずれも深刻な問題を抱えている。
第1の方法に従うと変換時の処理時間に負担がかかる。
すなわち、標準辞書の変換のみであれば、1つの辞書の
みをサーチすれば良いところを、分野が指定されている
と更に別の辞書もサーチしなければならず、余分なサー
チ処理の分だけ変換時間がかかってしまう。
第2の方法に従うと、こちらは辞書を1回サーチするだ
けなので変換時間には負担はかからないが、分野の種類
が増えてしまうと分野別辞書の種類が飛躍的に増えてし
まう。例えば、「地名」 「歴史」 「建築」 「医学
」の4分野があるだけで「標準辞書」 「地名分野別辞
書」 「歴史分野別辞書」 「建築分野別辞書」 「医
学分野別辞書」 「地名士歴史分野別辞書」 「地名土
建築分野別辞書」 「「地名十医学分野別辞書」 「歴
史+建築分野別辞し」等の16種類もの分野別辞書を用
意しなければならない。
この問題を解決するために、分野別辞書を何種類も用意
するのではなく、1つの辞書のみを用意し、その辞書中
の各単語に分野情報を記述して変換時に分野を判断する
ことにより、分野別変換を実現するという方法が考えら
れる。
[発明が解決しようとしている課題] このとき、使用する分野情報をオペレータが指定するこ
とになる。ところが、この様な自由に設定可能な情報は
RAM上に記憶され、特別な回路構成を持たないかぎり
、電源を遮断時に情報が消滅してしまうことになる。す
なわちオペレータは電源を投入するごとに自分の使用す
る分野を設定し直すことになる。
ある特定のオペレータに限定すると、使用する分野は予
め決まっており、電源投入時に毎回1分野を設定し直す
のは、その人にとっては不合理な操作である。更に複数
の分野を組み合わせて使用している場合には、どの様な
分野構成であるかを記憶しておかなければならず、操作
が苦痛ですらある。
[課題を解決するための手段(及び作用)]本発明は、
−度設定した分野情報を、外部記憶装置に保存し、必要
なときに外部記憶から呼びだす手段を提供することによ
り、分野設定の作業を簡便化し、操作性の高い分野別変
換を実現するものである。
[実施例] 以下図面を参照しながら本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCpUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
5図〜第22図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させてお(。
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。IBUFはキー人力
されたキーデータを記憶する入力バッファであり、0B
UFは仮名漢字変換された結果を一時的に記憶する出力
バッファである。DICは仮名漢字変換を行なうための
辞書である。BCTRLは変換途中の文節候補を記憶す
る文節候補テーブルである。TBUFはテキストバッフ
ァであり、入力編集中のテキストデータが記憶される。
DOBUPは同音語バッファであり、テキストバッファ
TBUFに記憶される文字に同音語候補が存在するとき
はその候補が記憶される。5BUNFはシステム分野フ
ラグであり、仮名漢字変換するとき、標準分野以外に変
換すべき単語の分野を指定したフラグが記憶される。
KBはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字配号入カキ−1及び、変
換キー、次候補キー、選択キー、分野設定キー、分野保
存キー、分野呼出キー実行キー、解除キー等の本文字処
理装置に対する各種機能を指示するための各種のファン
クションキーを備えている。
DISKは文書データ、システムフラグ、あるいはイラ
ストデータ、図形データ等を記憶するための外部記憶部
である。テキストバッファTBUF上に作成された文書
、システム分野フラグなどはこの外部記憶部に保管され
る。保管されたデータはキーボードの指示により、必要
な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。テキストの内容を表示するときは
テキストバッファTBUFの内容に応じて表示パターン
がDBUFに作成されることにより、表示されることに
なる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおりるドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネ1ノータであって、表
示装置CRTに表示する文字、記号のパターンを記憶す
るものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBがらの各種の人力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCP tJがRO
M内に記憶しである各種の制御信号を読出し、それらの
制御信号に従って各種の制御が行なわれる。
第2図は本発明装置による各分野ごとの変換例を示した
図である。図中[」はそこで変換キーを打鍵するという
意味である。各変換例は全て入力読み列として「はびき
のしこんだにあるおうじんでんのうりよう」を与えた場
合のものである。
2−1は標準分野での変換例を示した図である。入力に
対して第1候補は「羽曳野仕込んだ荷ある追う陣天皇寮
」と変換される。これは(地名) (歴史)の分野が設
定されていないので地名「音用」人名「応神」名詞[陵
jが存在しないために誤変換しているからである。
2−2は標準分野+地名分野での変換例を示した図であ
る。入力に対して第1候補は「羽曳野市誉田にある追う
陣天皇寮」と変換される。これは(歴史)の分野が設定
されていないので人名「応神」、名詞「陵」が存在しな
いために誤変換しているからである。2−1に比べて(
地名)の分野が設定されているので地名「音用」は変換
できる様になっている。
2−3は標準分野+歴史分野での変換例を示した図であ
る。入力に対して第1候補は「羽曳野仕込んだ荷ある応
神天皇陵」と変換される。これは(地名)の分野が設定
されていないので地名「音用」が存在しないために誤変
換しているからである。2−1に比べて(歴史)の分野
が設定されているので人名「応神」名詞「陵」は変換で
きる様になっている。
2−4は標準分野土地各分野+歴史分野での変換例を示
した図である。入力に対して第1候補は「羽曳野市誉田
にある応神天皇陵」と正しく変換されている。
第3図は分野の設定・保存操作の例を示した図である。
3−1は初期画面を示したものである。
通常の文書作成編集はこの画面で行なう。アングライン
はカーソルの存在する位置を示している。
3−2は分野設定キーを打鍵した時の画面を示している
。カーソルは最初の設定項目「地名分野」のところにい
る。各分野それぞれについて?0.1はその分野の単語
を変換しないことを意味し、「IJIはその分野の単語
を変換することを意味している。3−2の画面において
は全分野FOJIが設置1 定されているので、どの分野の単語も変換されることは
なく、標準分野の単語のみが変換されることを意味して
いる。ここでキー「lJlを打鍵すると3−3の画面に
なる。3−3では地名分野の設定項目が1rllとなっ
ているので地名分野の単語が変換可能になったことを意
味している。力〜ツルは次の設定項目である歴史分野の
ところに移動している。ここでもう−度、キー「1」を
打鍵すると3−4の画面になる。ここで歴史分野の設定
項目も71.!lとなり、更に歴史分野の単語も変換可
能になったことを意味している。カーソルは更に次の設
定項目である建築分野のところに移動している。ここで
分野保存キーを打鍵すると、現在表示されている分野状
態(標準分野+地名分野中歴史分野の単語が変換される
状態)が外部記憶部DISK中に保存され、3−5の画
面になる。この画面は3−4の画面と何ら変りがない。
ここで実行キーを打鍵すると分野情報が更新され、分野
設定画面は消え、3−6の様に元の文書編集画面に戻る
第4図は分野の呼出操作の例を示した図である。4−1
は通常の文書作成編集の初期画面である。この状態で分
野呼出キーを打鍵すると、DISK中に存在する分野情
報が呼びだされ、例えば、4−2の画面の様になる。こ
の例はDISK中に「標準分野+地名分野+建築分野」
の変換を行なう分野情報がたまたま保存されていたこと
を示している。4−2の状態で第3図に説明した様な操
作を行なうことも可能である。もし、そのまま実行キー
を打鍵すると、分野設定画面が消滅し、4−3の様に元
の文書作成編集画面に戻る。
第5図は仮名漢字変換の操作の例を示した図である。5
−1は文書作成編集を行なう初期画面である。読み列「
はびきのしこんだ」を入力すると5−2の画面になる。
5−2ではカーソルは入力読み列の次に表示されている
。ここで変換キーを打鍵すると5−3の画面になる。5
−3では読み列「はびきのしこんだ」が「羽曳野市誉田
」と変換されている。オペレータは「羽曳野市金円」と
いう変換を望んだとして、次候補キーを打鍵すると5−
4の画面になる。ここで「こんだ」の変換候補が表示さ
れる。第1候補は「音用」であり、第2候補は「今田」
である。現在の候補は第2候補の「今田」であり、2が
反転表示している。ここで選択キーを打鍵すると、5−
5の画面になる。第2候補の「今田」が確定してテキス
トデータの中に格納され、同時に「今田」が学習され、
単語尤度が向上する。
第6図は大力バッファI BUF、出力バッファ0BU
Fの構成を示した図である。
I BUF、0BUFともに同じ構成である。最初の2
バイトは各バッファのサイズ情報であり、バッファに格
納されている文字数から1を減じたものを2倍した数値
が入る。大力バッファの末尾にある「 」はそこで変換
キーが打鍵されたことを意味する。各文字は1文字2バ
イトで構成され、JIS X 020gコードで格納さ
れる。
第7図は仮名漢字変換用辞書DICの記憶内容を概念的
に示した図である。各単語は「読み」 「表記」 「品
詞」 「単語尤度」 「分野情報」のフィールドから構
成される。
「読み」には単語の読み、「表記」には単語の表記、「
品詞」には単語の品詞が格納される。
「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が1〜5の値で格納される。
尤度値5は最も尤もらしいという意味であり、値が小さ
くなるにつれ疑わしいと解釈される。尤度値0は全(考
えられないということを意味するので単語尤度の値とし
ては存在しない。
「分野情報」にはその単語の使用される分野が、(地名
) (歴史) (建築) (医学)などと、−船釣には
複数個記述される。特定の分野に属さない単語に対して
は分野情報は記述されない。
第8図は仮名漢字変換用辞書り丁Cの具体的構成を示し
た図である。
8−1は標準分野以外の単語の格納構成を示している。
読みはJIS X 0208コードの下位バイトを使用
して1文字1バイトで可変長で構成される。
JIS X 0208コードの下位バイトであるから各
バイトのMSBはOFFとなっている。分野は1バイト
で構成され、図に示す様にビット対応で単語の分野が設
定される。単語がその分野に属するときは対応するビッ
トに1が格納され、属さないときは0が格納される。M
SBはONとなる。従って、分野の値の範囲は0x80
〜0x8fとなる。表記はJIS X 0208コード
を使用して1文字2バイトで可変長で格納される。ただ
し、各バイトのMSBをONとする。JIS X 02
08コードの各バイトは0x21〜0x7eの値となる
ので、表記の各バイトはOxa 1〜0xfeの範囲に
入る。
品詞は1バイトで構成され、その単語の品詞コードが格
納される。MSBはOFFされる。頻度もやはり1バイ
トで構成され、その単語の頻度が格納されるMSBはO
FFされる。
8−2は標準分野の単語の格納形式を示している。標準
分野以外の単語の格納形式と大体同じであるが、違いは
分野が含まれていないという点である。なお、分野の値
の範囲(Ox21〜0x7e)と表記の値の範囲(Ox
al 〜0xff)は異なるので、値をチエツクするこ
とで読みの後に分野があるのか表記があるのかが分かる
仕掛けとなっている。
第9図は文節候補テーブルBCTRLの記憶内容を概念
的に示した図である。文節候補テーブルは入力読みの解
析の結W 考えられる文節候補をバイナリ−トリーで表
現し7たものである。図中、横線は子ポインタを意味し
、縦線は第ポインタを意味する。第ポインタはある読み
位置から始まる他の文節候補(通常はより短い候補)を
リンクし、子ポインタはその文節に引き続く文節候補を
リンクする。
入力読み列「はびきのしこんだ」の先頭部分は「羽曳野
」 「歯」 「葉」などの解釈が存在し、これらは順に
第ポインタ(縦線)でリンクされている。
「羽曳野」に引き続く文節は「仕込んだ」が考えられ、
子ポインタでリンクされている。
この様な文節候補テーブルができ上がるど、「羽曳野仕
込んだ」 「羽曳野重管用」 「歯引きの仕込んだ」 
「歯引きのし音用Jなどと文節候補列を作成することは
容易である。
第10図は文節候補テーブルBCTBUの具体的構成を
示した図である。
「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭1バイ
トが大力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが大力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第6図に示す入力バッ
ファのとき、「んだ」を表現するには第1バイトに12
、第2バイトに14を設定する。付属語列が存在しない
ときは図中で「φ」で示している。
「第リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリン
クする。
なお、リンクは値0のときに終端することを意味する。
例えば、文節候補O(羽曳野)の第リンクは50であり
、文節候補50(歯)をリンクする。文節候補0(羽曳
野)の子リンクは100であり、文節候補100(仕込
んだ)をリンクする。文節候補100の子リンクは0で
あり、そこで人力読みが終端していることが分かる。
第11図はテキストバッファTBUFの構成を示した図
である。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、lが同音語を意味する。残りの
15ビツトは通常文字のときは文字コードを表現し、同
音語のときは同音語番号を表現する。文字コードは、J
IS X 0208コードを使用する。同音語番号は第
12図に示す同音語バッファDOBUF上のどの同音語
であるかを示す番号である。
第12図は同音語バッファDOBUFの構成を示した図
である。各同音語には同音語番号が付いており、それに
よって識別される。
各同音語は「読み」 「候補総数」 「現候補番号」 
「第i候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数」はその同音に含まれる候補の総数を格納す
る。
「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後初値に第1候補が表示され
るから「1」が格納される。
「第i候補情報」は各候補の「表記」「単語アドレス」
が格納される。
「表記」にはその候補の表記が格納される。
「単語アドレスコには、その単語の存在アドレスを格納
する。
第13図はシステム分−野フラグS B U’N Fの
構成を示した図である。
辞書DIC内の各単語の分野情報とほぼ同一の構成をし
ており、変換すべき単語の分野を指定する。もし、標準
分野の単語のみを変換すれば良いのであれば、全部の分
野のビットをOFFすれば良い。辞書DIC内の各単語
の分野情報と異なる点はMSBがOFFになっていると
いう点である。
第14図は外部記憶部DISKの構成を示した図である
14−1に示す様に、DISKの中は格納されるデータ
に応じて複数のエリアに区分されている。例えば、文書
データTBUFfJ<DISKに保存されるときは文書
データ格納エリアに保存される。システムフラグ格納エ
リアはDISK中に−か所のみ存在し、システムに関係
する各種のフラグを保管する。
14−2はシステムフラグ格納エリアの更なる詳細構成
を示している。例えば、システム分野フラグ、変換モー
ド(即時変換、−括変換など)、選択モード(自動選択
、指定選択など)、入力モード(ローマ字人力、かな入
力など)から構成される。システム分野フラグ5BUN
FがD I S Kに保存されるときは4−2の「シス
テム分野フラグ」に示す領域に保存される。
上述の実施例の動作を第15図以下のフローにチャート
に従って説明する。
第15図はキー人力を取り込み、処理を行なう部分のフ
ローチャートである。
ステップ15−1はキーボードからのデータを取り込む
処理である。ステップ15−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ15−3に分岐し、ス
テップ15−3において第16図に詳述するように仮名
漢字変換の変換処理が行なわれる。次候補キーであった
ときはステップ15−4において第19図に詳述する次
候補処理を行なう。
選択キーであったときはステップ15−5において第2
0図に詳述する選択処理を行なう。
分野設定キーであったときはステップ15・−6におい
て第21図に詳述する分野設定処理を行なう。
分野呼出キーであったときはステップ15−7において
第22図に詳述する分野呼出処理を行ない、その後ステ
ップ15−6の分野設定処理に分岐する。
その他のキーのときはステップ15−8に分岐し、挿入
、削除等の通常の文字処理装置において行なわれるその
他の処理が行なわれる。
各キーの処理が終了すると、ステップ15−1に分岐す
る。
第16図はステップ15−3の「変換処理」を詳細化し
たフローチャートである。
ステップ16−1において、第17図に詳述する文節候
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
ステップ16−2において、作成された文節候補から最
も尤もらしい変換候補を決定する第1候補決定処理を行
なう。
ステップ16−3において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
第17図はステップ16−1の「文節候補作成処理]を
詳細化したフローチャートである。
ステップ17−1において、入力バッファインデックス
i、文節候補テーブルインデックスJをOに初期設定す
る。
ステップ17−2においてiの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補のリストを作成
する。
ステップ17−3において、第18図に詳述する様に、
作成された単語候補がシステム分野フラグの指定から見
て適切であるかどうかチエツクし、適切でないものをオ
ミットする「分野チエツク処理」を行なう。
ステップ17−4において、リストされている単語候補
に対して接続する付属語列を解析する形態素解析処理を
行なう。この結果、文節候補が得られる。
ステップ17−5において得られた文節候補を文節候補
テーブルに格納する。格納する時は、j十1番目のエン
トリーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは第とする文節候補につ
いては、子リンク、第リンクを設定する。格納後jの値
をカウ、ントアッブする。
ステップ17−6において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ステップ17−7において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ17−2に分岐する。そうでなければリ
ターンする。
第18図はステップ17−3の「分野チエック処理」を
詳細化したフローチャートである。
ステップ18−1において、単語候補にリストから候補
を1つとりだす。
ステップ18−2において全ての単語候補についてチエ
ツクが終了したかどうかを判定し、終了しているときは
リターンする。終了していないときはステップ18−3
に進む。
ステップ18−3において、その単語候補に分野が記述
されているかどうか(標準分野の単語であるかどうか)
を判定し、分野が記述されていないときは標準分野の単
語であるのでステップ187にスキップする。分野が記
述されているときはステップ18−4に進む。
ステップ18−4において、システム分野フラグ5BU
NF、単語候補の分野情報、0xOfの全てのAND 
(論理積)をとり、単語候補が変換すべき分野の単語で
あるかどうかを調べる。
ステップ18−5において上記の値の判定を行ない、O
のときは変換すべき単語ではないからステップ18−6
において単語候補のリストから除外する。0でないとき
はステップ18−7に分岐し、その単語候補をリストに
残す。
その後ステップ18−1にループし、次の単語候補を処
理する。
第19図はステップ15−4の「次候補処理」を詳細化
したフローチャートである。
ステップ19−1において、次候補を見るべき同音語の
同音語番号をテキストバッファTBUFより求める。
ステップ19−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアツプする
ステップ19−3において、候補−覧を表示する。
第20図はステップ15−5の「選択処理」を詳細化し
たフローチャートである。
ステップ20−1において、選択すべき同音語の同音語
番号をテキストバッファTBUFより求める。
ステップ20−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り出し、テキストバッファTBUFに確定文字と
して設定する。
ステップ20−3において、同様に、現候補番号の示す
候補情報から単語アドレスを求め、その示された単語の
単語尤度をカウントアツプする。
ただし、単語尤度が既に5になっているときはカウント
アツプは行なわない。
ステップ20−4において、同様に、第1候補の示す候
補情報から単語アドレスを求め、その示された単語の単
語尤度をカウントダウンする。ただし、単語尤度が既に
1のときはカウントダウンは行なわない。
第21図はステップ15−6の「分野設定処理」を詳細
化したフローチャートである。
ステップ21−1において、元の画面状態を退避し、分
野設定画面を表示する。
ステップ21−2において、現在のシステム分野フラグ
5BUNFの値を退避する。
ステップ21−3において、キーボードからのデータを
取り込む。
ステップ21−4において、取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
キー「1」が打鍵されたときはステップ21−5に分岐
し、システム分野フラグ5BUNFの対応する分野のビ
ットを1にセットする。また、カーソルを次の設定項目
に移動させる。
キーFOJIが打鍵されたときはステップ21−6に分
岐し、システム分野フラグ5BUNFの対応する分野の
ビットな0にリセットする。また、カーソルを次の設定
項目に移動させる。
画面関係のキー(カーソル移動キーなど)が打鍵された
ときはステップ21−7に分岐し、カーソル移動等の画
面制御処理を行なう。
ステップ21−5.21−6.21−7の各処理が終了
すると、ステップ15−1に分岐し、次のキー人力を待
つ。
分野保存キーが打鍵されたときはステップ218に分岐
し、システム分野フラグ5BUNFを外部記憶部DIS
Kの定められた区分に保存する。その後、ステップ21
−10に分岐する。
解除キーが打鍵されたときはステップ21−9に分岐し
、システム分野フラグの値を退避されたいた値に復旧す
る。その後、ステップ21−10に分岐する。
実行キーが打鍵されたときはステップ2l−1Oに分岐
し、画面を分野設定キーが打鍵される以前の状態に復旧
し、リターンする。
第22図はステップ15−7のr分野呼出処理」を詳細
化したフローチャートである。
ステップ22−1において、現在のシステム分野フラグ
5BLINFの値を退避する。
ステップ22−2において、外部記憶部DISK中のシ
ステムフラグ格納エリア中のシステム分野フラグの値を
取り出す。
ステップ22−3において、上記取り出された値を5B
UNFに代入してリターンする。
[他の実施例コ 以上の説明において、分野の種類は4分野のみであると
して説明したが、何分野の辞書であっても同様に処理す
ることができる。
[発明の効果] 以上の説明から明らかなように、本発明によれば、辞書
中に分野情報を持っているので、複数の分野別辞書を用
意する必要がなく、また、1つの辞書のみをサーチすれ
ば良いので、高速の分野別仮名漢字変換が実現できる。
これにより、オペレータは自分の希望しない分野の単語
が存在することによる誤変換に遭遇することがないので
変換率の高い、快適な文字処理装置を実現することがで
きる。
更に、オペレータの設定した分野情報は外部記憶に保存
し、必要なときに呼び出すことができるので、厄介な分
野設定処理を電源投入ごとに毎回行なう必要がなく、操
作性の高い分野別変換を実現することができる。
【図面の簡単な説明】
第1図は本発明に係る文字処理装置の全体構成のブロッ
ク図、 第2図は本発明における仮名漢字変換の変換例を示した
図、 第3図は本発明における分野の設定・保存操作の例を示
した図、 第4図は本発明における分野の呼出操作の例を示した図
、 第5図は本発明における仮名漢字変換の操作の例を示し
た図、 第6図は本発明における入力バッファIBUFと出力バ
ッファ0BLIFの構成を示した図、第7図は本発明に
おける仮名漢字変換用辞書DICの記憶内容を概念的に
示した図、 第8図は本発明における仮名漢字変換用辞書DICの具
体的構成を示した図、 第9図は本発明における文節候補テーブルB装置の記憶
内容を概念的に示した図、 第10図は本発明における文節候補テーブルBCTBL
の具体的構成を示した図、 第11図は本発明におけるテキストバッファTBUFの
構成を示した図、 第12図は本発明における同音語バッファDOBUFの
構成を示した図、 第13図は本発明におけるシステム分野フラグ5BUN
Fの構成を示した図、 第14図は本発明における外部記憶部DISKの構成を
示した図、 第15図〜第22図は本発明の文字処理装置の動作を示
すフローチャートである。 DISK   ・・・外部記憶部 CPU   ・・・マイクロプロセッサOM AM I  BTJF BUF IC CTBL BUF 0BUF BUNF ・・・読出し専用メモリ ・・・ランダムアクセスメモリ ・・・入力バッファ ・・・出力バッファ ・・・仮名漢字変換用辞書 ・・・文節候補テーブル ・・・テキストバッファ ・・・同音語バッファ ・・・システム分野フラグ 図 ■)標準分野での変換 はびきのしこんだにあるおうじんでんのうりようl→羽
曳野仕込んだ荷ある追う陣天皇寮 (2−2)標準分野+地名分野での変換はびきのしこん
だにあるおうしんでんのうりょうj→羽曳野市重管用あ
る追う陣天皇寮 3)標準分野+歴史分野での変換 はびきのしこんだにあるおうじんでんのうりようグ→羽
曳野仕込んだ荷ある応神天皇陵 り標準分野+地名分野+歴史分野での変換はびきのしこ
んだにあるおうしんでんのうりようj→羽曳野市重管用
ある応神天皇陵 ↓ 読み入力 ↓ 変換キー 図 ↓ 次候補キー ↓ 選択キー 同音語番号 第 図

Claims (1)

  1. 【特許請求の範囲】 1、読み列を入力する入力手段と、 読み、表記、分野を対応づけて記憶した辞書手段と、 どの分野の単語を変換すべきかを指定する分野情報記憶
    手段と、 分野情報を分野情報記憶手段に設定する分野設定手段と
    、 前記辞書手段に基づき入力読み列を表記に変換する変換
    手段と、 前記分野情報を外部記憶装置に保存する分野情報保存手
    段と、前記分野情報を外部記憶装置から呼び出す分野情
    報呼出手段とを具備し、前記変換手段は分野情報の記述
    に従って変換に利用する単語を異にし、前記分野情報を
    必要なときに外部記憶装置から呼び出すことを特徴とす
    る文字処理装置。
JP2150122A 1990-06-08 1990-06-08 文字処理装置 Pending JPH0442348A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2150122A JPH0442348A (ja) 1990-06-08 1990-06-08 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2150122A JPH0442348A (ja) 1990-06-08 1990-06-08 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0442348A true JPH0442348A (ja) 1992-02-12

Family

ID=15489965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2150122A Pending JPH0442348A (ja) 1990-06-08 1990-06-08 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0442348A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058813A (ja) * 2006-09-01 2008-03-13 Honda Motor Co Ltd 音声応答システム、音声応答プログラム
JP2014056492A (ja) * 2012-09-13 2014-03-27 Nec Corp 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058813A (ja) * 2006-09-01 2008-03-13 Honda Motor Co Ltd 音声応答システム、音声応答プログラム
JP4666648B2 (ja) * 2006-09-01 2011-04-06 本田技研工業株式会社 音声応答システム、音声応答プログラム
JP2014056492A (ja) * 2012-09-13 2014-03-27 Nec Corp 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Similar Documents

Publication Publication Date Title
US20010052900A1 (en) Apparatus and method for inputting chinese characters
JPH0442348A (ja) 文字処理装置
JPH0442350A (ja) 文字処理装置
JPH0442349A (ja) 文字処理装置
JPS6057422A (ja) 文書目次索引作成装置
JPH0442351A (ja) 文字処理装置
JPH0442347A (ja) 文字処理装置
JPS628259A (ja) かな漢字変換方式
JPH0442352A (ja) 文字処理装置
JPS6246029B2 (ja)
JPS60201467A (ja) 日本語処理装置
JPH03116363A (ja) 文字処理装置
JP2713942B2 (ja) かな漢字変換装置
JPH0623974B2 (ja) 文字処理装置
JPS61260353A (ja) 文書処理方式
JPH03116364A (ja) 文字処理装置
JPH0447442A (ja) 文字処理装置及びその方法
JPH04332073A (ja) 文字処理方法及びその装置
JPH02255936A (ja) 文書作成編集装置
JPH0452853A (ja) 文字処理装置
JPH0447451A (ja) 文字処理装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH03286249A (ja) 文字処理装置
JPH03176759A (ja) 文字処理装置及びその方法
JPH03167660A (ja) 文字処理装置及びその方法