JPH0442349A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0442349A
JPH0442349A JP2150123A JP15012390A JPH0442349A JP H0442349 A JPH0442349 A JP H0442349A JP 2150123 A JP2150123 A JP 2150123A JP 15012390 A JP15012390 A JP 15012390A JP H0442349 A JPH0442349 A JP H0442349A
Authority
JP
Japan
Prior art keywords
field
candidate
dictionary
word
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2150123A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Kazuyo Ikeda
和世 池田
Yuji Kobayashi
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2150123A priority Critical patent/JPH0442349A/ja
Publication of JPH0442349A publication Critical patent/JPH0442349A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名l英字変換を使って行なうこと
が一般的である。
仮名漢字変換は辞書を参照するζ、とt・二より、入力
された読み列を漢字に変換するものである。
般に言って、辞書の単語数が少ないとJ tCIノー多
・の望む単語は変換できないので変換率が低くなり、単
語数が多いとオペレータの望も単語が変換される可能性
が高くなるので変換率が高(なる。
ところが、逆に単語数が増えすぎて特殊な分野の単語ま
で辞書に登録される様になると、オペレータの全く望ま
ない単語が変換され、変換率が悪(なる場合もある。
例えば、読み列「どうきようきかい」に対しては通常は
「東京機械」と変換してほしいわけである。ところが、
地名[東京jと地名[官界jカに登録されていれば、地
名十地名のパターンは住所の入力などで使われるために
優先して変換され、「東京官界」と変換されることがあ
る。この場合、住所入力を全く考えていないオペレータ
にとっては、地名が豊富に登録されていることにより、
逆に変換率が下がってしまったことになる。
そこで、−船釣な文書の変換率を高めるために分野別辞
書という手法が提案されている。分野別辞書とは、主な
分野ごとにその分野の単語を格納した辞書のことであり
、オペレータは自分の目的にあった分野別辞書を選択し
変換することで最適な変換をすることができる。上記の
例では住所入力を目的とするオペレータは地名分野別辞
書を指定して変換し、住所入力を考えていないオペレー
タは標準辞書を指定して変換するのである。この様にす
ることで、一般のオペレータは標準辞書を利用するので
「どうきょうきかい」と入力しても正常に「東京機械」
と変換されることになる。また、住所入力を行なうオペ
レータは地名分野別辞書を利用するので「東京機械」の
変換は失敗するが、その代わり住所を入力したときの変
換率は高くなる。
この分野別辞書の実現方法には2種類の手法が存在する
第1の方法は特定の分野に属さない普遍的な単語を格納
した標準辞書を設定し、他方、特殊分野の単語のみを格
納した分野別辞書を用意し、ある分野が指定された場合
、標準辞書と指定された分野の分野別辞書の両方をサー
チして変換することで実現する方法である。
第2の方法は上記の標準辞書の内容と特定の分野別辞書
の内容を予めマージした辞書を用意するという方法であ
る。この方式では変換の際には1つの辞書のみをサーチ
すれば良い。
ところが、分野別辞書を実現する上述の第1の方法、第
2の方法はいずれも深刻な問題を抱えている。
第1の方法に従うと変換時の処理時間に負担がかかる。
すなわち、標準辞書の変換のみであれば、1つの辞書の
みをサーチすれば良いところを、分野が指定されている
と更に別の辞書もサーチしなければならず、余分なサー
チ処理の分だけ変換時間がかかってしまう。
第2の方法に従うと、こちらは辞書を1回サーチするだ
けなので変換時間には負担はかからないが、分野の種類
が増えてしまうと分野別辞書の種類が飛躍的に増えてし
まう。例えば、「地名」 「歴史」 「建築」 「医学
」の4分野があるだけで「標準辞書」 「地名分野別辞
書」 「歴史分野別辞書」 「建築分野別辞書」 「医
学分野別辞書」 [地名十歴史分野別辞書」 「地名土
建築分野別辞書」 「「地名生医学分野別辞書」 「歴
史十建築分野別辞しj等の16種類もの分野別辞書を用
意しなければならない。
この問題を解決するために、分野別辞書を何種類も用意
するのではな(,1つの辞書のみを用意し、その辞書中
の各単語に分野情報を記述して変換時に分野を判断して
仮名漢字変換し分ける方法が考えられる。
[発明が解決しようとしている課題] ところが、上記の方法を採用したとき、辞書中の1単語
1単語について分野情報が記述されるため、使用メモリ
量が無視できないという問題がある。
[課題を解決するための手段(及び作用)]本発明は、
辞書の格納形式として、標準分野の単語については分野
情報を省略する様に構成することにより、分野情報の記
述のためのメモリ量を減少させる様にし、安価な分野別
変換を実現するものである。
[実施例] 以下図面を参照しながら本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
5図〜第22図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させておく。
また、RAMは、lワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。I BUFはキー入
力されたキーデータを記憶する入力バッファであり、0
BUFは仮名漢字変換された結果を一時的に記憶する出
力バッファである。DICは仮名漢字変換を行なうため
の辞書である。BCTBLは変換途中の文節候補を記憶
する文節候補テーブルである。TBUFはテキストバッ
ファであり、入力編集中のテキストデータが記憶される
。DOBUFは同音語バッファであり、テキストバッフ
ァTBUFに記憶される文字に同音語候補が存在すると
きはその候補が記憶される。5BUNFはシステム分野
フラグであり、仮名漢字変換するとき、標準分野以外に
変換すべき単語の分野を指定したフラグが記憶される。
KBはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字配号入カキ−1及び、変
換キー、次候補キー、選択キー、分野設定キー、分野保
存キー、分野呼出キー実行キー、解除キー等の本文字処
理装置に対する各種機能を指示するための各種のファン
クションキーを備えている。
DISKは文書データ、システムフラグ、あるいはイラ
ストデータ、図形データ等を記憶するための外部記憶部
である。テキストバッファTBUF上に作成された文書
、システム分野フラグなどはこの外部記憶部に保管され
る。保管されたデータはキーボードの指示により、必要
な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DBtJFは表示用バッファメモリで、表示すべきデー
タのパターンを蓄える。テキストの内容を表示するとき
はテキストバッファTBUFの内容に応じて表示パター
ンがDBUFに作成されることにより、表示されること
になる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけろドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
 Uに送られ、そのマイクロプロセッサC)) [1が
ROM内に記憶しである各種の制御信号を読出し、それ
らの制御信号に従って各種の制御が行なわれる。
第2図は本発明装置ににる各分野ごとの変換例を示した
図である。図中「〃」は(こで変換ギを打鍵するという
意味である。各変換例は全て入力読み列として「はびき
のしこんだにあるおうじんでんのうりよう」を与えた場
合のものである。
2−1は標準分野での変換例を示した図である。入力に
対して第1候補は「羽曳野仕込んだ荷ある追う陣天皇寮
」と変換される。これは(地名) (歴史)の分野が設
定されていないので地名「音用」人名「応神」名詞「陵
」が存在しないために誤変換しているからである。
2−2は標準分野→−地名分野での変換例を示した図で
ある。入力に対して第1候補は「羽曳野市音用にある追
う陣天皇寮」と変換される。これは(歴史)の分野が設
定されていないので人名「応神」、名詞「陵」が存在し
ないために誤変換しているからである。2−1に比べて
(地名)の分野が設定されているので地名「音用」は変
換できる様になっている。
2−3は標準分野+歴史分野での変換例を示した図であ
る。入力に対して第1候補は「羽曳野仕込んだ荷ある応
神天皇陵」と変換される。これは(地名)の分野が設定
されていないので地名「音用」が存在しないために誤変
換しているからである。2−1に比べて(歴史)の分野
が設定されているので人名「応神」名詞「陵」は変換で
きる様になっている。
2−4は標準分野+地名分野+歴史分野での変換例を示
した図である。入力に対して第1候補は「羽曳野市誉田
にある応神天皇陵」と正しく変換されている。
第3図は分野の設定・保存操作の例を示した図である。
3−1は初期画面を示したものである。
通常の文書作成編集はこの画面で行なう。アングライン
はカーソルの存在する位置を示している。
3−2は分野設定キーを打鍵した時の画面を示している
。カーソルは最初の設定項目「地名分野」のところにい
る。各分野それぞれについて「0」はその分野の単語を
変換しないことを意味し、「1」はその分野の単語を変
換することを意味している。3−2の画面においては全
分野「0」が設定されているので、どの分野の単語も変
換されることはなく、標準分野の単語のみが変換される
ことを意味している。ここでキー「1.0を打鍵すると
3−3の画面になる。3−3では地名分野の設定項目が
「1」となっているので地名分野の単語が変換可能にな
ったことを意味している。カーソルは次の設定項目であ
る歴史分野のところに移動している。ここでもう−度、
キー「IJIを打鍵すると3−4の画面になる。ここで
歴史分野の設定項目も「IJIとなり、更に歴史分野の
単語も変換可能になったことを意味している。カーソル
は更に次の設定項目である建築分野のところに移動して
いる。ここで分野保存キーを打鍵すると、現在表示され
ている分野状態(標準分野+地名分野十歴史分野の単語
が変換される状態)が外部記憶部DISK中に保存され
、3−5の画面になる。この画面は3−4の画面と何ら
変りがない。ここで実行キーを打鍵すると分野情報が更
新され、分野設定画面は消え、3−6の様に元の文書編
集画面に戻る。
第4図は分野の呼出操作の例を示した図である。4−1
は通常の文書作成編集の初期画面である。この状態で分
野呼出キーを打鍵すると、DISK中に存在する分野情
報が呼びだされ、例えば、4−2の画面の様になる。こ
の例はDISK中に「標準分野+地名分野+建築分野」
の変換を行なう分野情報がたまたま保存されていたこと
を示している。4−2の状態で第3図に説明した様な操
作を行なうことも可能である。もし、そのまま実行キー
を打鍵すると、分野設定画面が消滅し、4−3の様に元
の文書作成編集画面に戻る。
第5図は仮名漢字変換の操作の例を示した図である。5
−1は文書作成編集を行なう初期画面である。読み列「
はびきのしこんだ」を入力すると5−2の画面になる。
5−2ではカーソルは入力読み列の次に表示されている
。ここで変換キーを打鍵すると5−3の画面になる。5
−3では読み列「はびきのしこんだ」が「羽曳野市誉田
」と変換されている。オペレータは「羽曳野市金円」と
いう変換を望んだとして、次候補キーを打鍵すると5−
4の画面になる。ここで「こんだ」の変換候補が表示さ
れる。第1候補は「音用」であり、第2候補は「金円」
である。現在の候補は第2候補の「金円」であり、2が
反転表示している。ここで選択キーを打鍵すると、5−
5の画面になる。第2候補の「金円」が確定してテキス
トデータの中に格納され、同時に「金円」が学習され、
単語尤度が向上する。
第6図は大力バッファI BUF、出力バッファ0BL
IFの構成を示した図である。
IBUF、0BUFともに同じ構成である。最初の2バ
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から1を減じたものを2倍した数値が
入る。入力バッファの末尾にあるr//Jはそこで変換
キーが打鍵されたことを意味する。各文字は1文字2バ
イトで構成され、JIS X 0208コードで格納さ
れる。
第7図は仮名漢字変換用辞書DICの記憶内容を概念的
に示した図である。各単語は「読み」 「表記」 「品
詞」 「単語尤度」 「分野情報」のフィールドから構
成される。
「読み」には単語の読み、「表記Jには単語の表記、r
品詞」には単語の品詞が格納される。
「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が1〜5の値で格納される。
尤度値5は最も尤もらしいという意味であり、値が小さ
(なるにつれ疑わしいと解釈される。尤度値0は全く考
えられないということを意味するので単語尤度の値とし
ては存在しない。
「分野情報」にはその単語の使用される分野が、(地名
) (歴史)(建築)(医学)などと、−船釣には複数
個記述される。特定の分野に属さない単語に対しては分
野情報は記述されない。
第8図は仮名漢字変換用辞書DICの具体的構成を示し
た図である。
8−1は標準分野以外の単語の格納構成を示している。
読みはJIS X 020gコードの下位バイトを使用
して1文字1バイトで可変長で構成される。
JIS X 0208コードの下位バイトであるから各
バイトのMSBはOFFとなっている。分野は1バイト
で構成され、図に示す様にビット対応で単語の分野が設
定される。単語がその分野に属するときは対応するビッ
トに1が格納され、属さないときはOが格納される。M
SBはONとなる。従って、分野の値の範囲は0X80
〜0x8fとなる。表記はJIS X 020gコード
を使用して1文字2バイトで可変長で格納される。ただ
し、各バイトのMSBをONとする。JIS X 02
[18]−ドの各バイトは0X21〜0x7eの値とな
るので、表記の各バイトは0xal〜0xfeの範囲に
入る。
品詞は1バイトで構成され、その単語の品詞コードが格
納される。MSBはOFFされる。頻度もやはり1バイ
トで構成され、その単語の頻度が格納されるMSBはO
FFされる。
8−2は標準分野の単語の格納形式を示している。標準
分野以外の単語の格納形式と大体同じであるが、違いは
分野が含まれていないという点である。なお、分野の値
の範囲(Ox21〜0x7e)と表記の値の範囲(OX
81〜0Xff)は異なるので、値をチエツクすること
で読みの後に分野があるのか表記があるのかが分かる仕
掛けとなっている。
第9図は文節候補テーブルBCTBLの配憶内容を概念
的に示した図である。文節候補テーブルは入力読みの解
析の結果、考えられる文節候補をバイナリ−トリーで表
現したものである。図中、横線は子ポインタを意味し、
縦線は第ポインタを意味する。第ポインタはある読み位
置から始まる他の文節候補(通常はより短い候補)をリ
ンクし、子ポインタはその文節に引き続く文節候補をリ
ンクする。
入力読み列「はびきのしこんだ」の先頭部分は「羽曳野
」 「歯」 「葉」などの解釈が存在し、これらは順に
第ポインタ(縦線)でリンクされている。
「羽曳野」に引き続く文節は「仕込んだ」が考えられ、
子ポインタでリンクされている。
この様な文節候補テーブルができ上がると、「羽曳野仕
込んだ」 「羽曳野重音用」 「歯引ぎの仕込んだ」 
「歯引きのし音用jなどと文節候補列を作成することは
容易である。
第10図は文節候補テーブルBCTBLの具体的構成を
示した図である。
「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭1バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが大力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第6図に示す大力バッ
ファのとき、「んだ」を表現するには第1バイトに12
、第2バイトに14を設定する。付属語列が存在しない
ときは図中で「φ」で示している。
「第リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリン
クする。
なお、リンクは値Oのときに終端することを意味する。
例えば、文節候補0(羽曳野)の第リンクは50であり
、文節候補50(歯)をリンクする。文節候補O(羽曳
野)の子リンクは100であり、文節候補100(仕込
んだ)をリンクする。文節候補100の子リンクはOで
あり、そこで入力読みが終端していることが分かる。
第11図はテキストバッファTBUFの構成を示した図
である。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、lが同音語を意味する。残りの
15ビツトは通常文字のときは文字コードを表現し、同
音語のときは同音語番号を表現する。文字コードは、J
IS X 0208コードを使用する。同音語番号は第
12図に示す同音語バッファDOBUF上のどの同音語
であるかを示す番号である。
第12図は同音語バッファDOBUFの構成を示した図
である。各同音語には同音語番号が付いており、それに
よって識別される。
各同音言吾は「読み」 「候補総数」 「現候補番号」
 「第i候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数」はその同音に含まれる候補の総数を格納す
る。
「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後初値に第1候補が表示され
るから「l」が格納される。
「第i候補情報」は各候補の1表記」 「単語アドレス
」が格納される。
「表記」にはその候補の表記が格納される。
「単語アドレス」には、その単語の存在アドレスを格納
する。
第13図はシステム分野フラグ5BUNFの構成を示し
た図である。
辞書10C内の各単語の分野情報とほぼ同一の構成をし
ており、変換すべき単語の分野を指定する。もし、標準
分野の単語のみを変換すれば良いのであれば、全部の分
野のビットをOFFすれば良い。辞書DIC内の各単語
の分野情報と異なる点はMSBがOFFになっていると
いう点である。
第14図は外部記憶部DISKの構成を示した図である
14−1に示す様に、DISKの中は格納されるデータ
に応じて複数のエリアに区分されている。例えば、文書
データTBUFがDISKに保存されるときは文書デー
タ格納エリアに保存される。システムフラグ格納エリア
はDISK中に−か所のみ存在し、システムに関係する
各種のフラグを保管する。
14−2はシステムフラグ格納エリアの更なる詳細構成
を示している。例えば、システム分野フラグ、変換モー
ド(即時変換、−括変換など)、選択モード(自動選択
、指定選択など)、入力モード(ローマ字入力、かな入
力など)から構成される。システム分野フラグ5BUN
FがDISKに保存されるときは4−2の「システム分
野フラグ」に示す領域に保存される。
上述の実施例の動作を第15図以下のフローにチャート
に従って説明する。
第15図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。
ステップ15−1はキーボードからのデータを取り込む
処理である。ステップ15−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ15−3に分岐し、ス
テップ15−3において第16図に詳述するように仮名
漢字変換の変換処理が行なわれる。次候補キーであった
ときはステップ15−4において第19図に詳述する次
候補処理を行なう。
選択キーであったときはステップ15−5において第2
0図に詳述する選択処理を行なう。
分野設定キーであったときはステップ15−6において
第21図に詳述する分野設定処理を行なう。
分野呼出キーであったときはステップ15−7において
第22図に詳述する分野呼出処理を行ない、その後ステ
ップ15−6の分野設定処理に分岐する。
その他のキーのときはステップ15−8に分岐し、挿入
、削除等の通常の文字処理装置において行なわれるその
他の処理が行なわれる。
各キーの処理が終了すると、ステップ15−1に分岐す
る。
第16図はステップ15−3のし変換処理」を詳細化し
たフローチャートである。
ステップ16−1において、第17図に詳述する文節候
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
ステップ16−2において、作成された文節候補から最
も尤もらしい変換候補を決定する第1候補決定処理を行
なう。
ステップ16−3において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
第17図はステップ16−1の「文節候補作成処理」を
詳細化したフローチャートである。
ステップ17−1において、入力バッファインデックス
i、文節候補テーブルインデックスjを0に初期設定す
る。
ステップ17−2においてiの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補のリストを作成
する。
ステップ17−3において、第18図に詳述する様に、
作成された単語候補がシステム分野フラグの指定から見
て適切であるかどうかチエツクし、適切でないものをオ
ミットする「分野チエツク処理」を行なう。
ステップ17−4において、リストされている単語候補
に対して接続する付属語列を解析する形態素解析処理を
行なう。この結果、文節候補が得られる。
ステップ17−5において得られた文節候補を文節候補
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例えば
、この文節候補を子、あるいは第とする文節候補につい
ては、子リンク、第リンクを設定する。格納後jの値を
カウントアツプする。
ステップ17−6において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ステップ17−7において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ17−2に分岐する。そうでなければリ
ターンする。
第18図はステップ17−3の「分野チエツク処理」を
詳細化したフローチャートである。
ステップ18−1において、単語候補にリストから候補
を1つとりだす。
ステップ18−2において全ての単語候補についてチエ
ツクが終了したかどうかを判定し、終了しているときは
リターンする。終了していないときはステップ18−3
に進む。
ステップ18−3において、その単語候補に分野が記述
されているかどうか(標準分野の単語であるかどうか)
を判定し、分野が記述されていないときは標準分野の単
語であるのでステップ18−7にスキップする。分野が
記述されているときはステップ18−4に進む。
ステップ18−4において、システム分野フラグ5BU
NF、単語候補の分野情報、0xOfの全てのAND 
(論理積)をとり、単語候補が変換すべき分野の単語で
あるかどうかを調べる。
ステップ18−5において上記の値の判定を行ない、0
のときは変換すべき単語ではないからステップ18−6
において単語候補のリストから除外する60でないとき
はステップ18−7に分岐し、その単語候補をリストに
残す。
その後ステップ18−1にループし、次の単語候補を処
理する。
第19図はステップ15−4の「次候補処理」を詳細化
したフローチャートである。
ステップ19−1において、次候補を見るべき同音語の
同音語番号をテキストバッファTBUFより求める。
ステップ19−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアツプする
ステップ19−3において、候補−覧を表示する。
第20図はステップ15−5の「選択処理」を詳細化し
たフローチャートである。
ステップ20−1において、選択すべき同音語の同音語
番号をテキストバッファTBUFより求める。
ステップ20−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り圧し、テキストバッファTBUFに硲定文字と
して設定する。
ステップ20−3において、同様に、現候補番号の示す
候補情報から単語アドレスを求め、その示された単語の
単語尤度をカウントアツプする。
ただし、単語尤度が既に5になっているときはカウント
アツプは行なわない。
ステップ2o−4において、同様に、第1候補の示す候
補情報から単語アドレスを求め、その示された単語の単
語尤度をカウントダウンする。ただし、単語尤度が既に
1のときはカウントダウンは行なわない。
第21図はステップ15−6の「分野設定処理」を詳細
化したフローチャートである。
ステップ21−1において、元の画面状態を退避し、分
野設定画面を表示する。
ステップ21−2において、現在のシステム分野フラグ
5BUNFの値を退避する。
ステップ21−3において、キーボードからのデータを
取り込む。
ステップ21−4において、取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
キーFl、Qが打鍵されたときはステップ215に分岐
し、システム分野フラグ5BUNFの対応する分野のビ
ットを1にセットする。また、カーソルを次の設定項目
に移動させる。
キーFOJIが打鍵されたときはステップ216に分岐
し、システム分野フラグ5BUNFの対応する分野のビ
ットなOにリセットする。また、カーソルを次の設定項
目に移動させる。
画面関係のキー(カーソル移動キーなど)が打鍵された
ときはステップ21−7に分岐し、カーソル移動等の画
面制御処理を行なう。
ステップ21−5.21−6.21−7の各処理が終了
すると、ステップ15−1に分岐し、次のキー入力を待
つ。
分野保存キーが打鍵されたときはステップ218に分岐
し、システム分野フラグ5BUNFを外部記憶部DIS
Kの定められた区分に保存する。その後、ステップ21
−10に分岐する。
解除キーが打鍵されたときはステップ21−9に分岐し
、システム分野フラグの値を退避されたいた値に復旧す
る。その後、ステップ21−10に分岐する。
実行キーが打鍵されたときはステップ21−10に分岐
し、画面を分野設定キーが打鍵される以前の状態に復旧
し、リターンする。
第22図はステップ15−7の「分野呼出処理」を詳細
化したフローチャートである。
ステップ22−1において、現在のシステム分野フラグ
5BUNFの値を退避する。
ステップ22−2において、外部記憶部DISK中のシ
ステムフラグ格納エリア中のシステム分野フラグの値を
取り出す。
ステップ22−3において、上記取り出された値を5B
UNFに代入してリターンする。
[他の実施例] 以上の説明において、分野の種類は4分野のみであると
して説明したが、同分野の辞書であっても同様に処理す
ることができる。
[発明の効果] 以上の説明から明らかなように、本発明によれば、辞書
中に分野情報を持っているので、複数の分野別辞書を用
意する必要がなく、また、1つの辞書のみをサーチすれ
ば良いので、高速の分野別仮名漢字変換が実現できる。
これにより、オペレータは自分の希望しない分野の単語
が存在することによる誤変換に遭遇することがないので
変換率の高い、快適な文字処理装置を実現することがで
きる。
更に、辞書の格納形式として櫟準分野の単語については
分野情報が省略されているので、分野情報のためのメモ
リ使用量が少なく、安価な分野別辞書を実現することが
できる。
【図面の簡単な説明】
第1図は本発明に係る文字処理装置の全体構成のブロッ
ク図、 第2図は本発明における仮名漢字変換の変換例を示した
図、 第3図は本発明における分野の設定・保存操作の例を示
した図、 第4図は本発明における分野の呼出操作の例を示した図
、 第5図は本発明における仮名漢字変換の操作の例を示し
た図、 第6図は本発明における入力バッファI BUFと出力
バッファ0BUFの構成を示した図、第7図は本発明に
おける仮名漢字変換用辞書DICの記憶内容を概念的に
示した図、 第8図は本発明における仮名漢字変換用辞書DICの具
体的構成を示した図、 第9図は本発明における文節候補テーブルBCTBLの
記憶内容を概念的に示した図、第10図は本発明におけ
る文節候補テーブルBCTBLの具体的構成を示した図
、 第11図は本発明におけるテキストバッファTBUFの
構成を示した図、 第12図は本発明における同音語バッファD。 BUFの構成を示した図、 第13図は本発明におけるシステム分野フラグSBUN
Fの構成を示した図、 第14図は本発明における外部記憶部DISKの構成を
示した図、 第15図〜第22図は本発明の文字処理装置の動作を示
すフローチャートである。 10SK   ・・・外部記憶部 CPU   ・・・マイクロプロセッサROM    
・・・読出し専用メモリRAM    ・・・ランダム
アクセスメモリIBUF   ・・・入力バッファ 0BUF   ・・・出力バッファ DIC・・・仮名漢字変換用辞書 BCTRL  ・・・文節候補テーブルTBUF   
・・・テキストバッファDOBUF  ・・・同音語バ
ッファ

Claims (1)

  1. 【特許請求の範囲】 1、読み列を入力する入力手段と、 読み、表記、分野を対応づけて記憶し、格納形式として
    標準分野の単語については分野情報が省略されている辞
    書手段と、 どの分野の単語を変換すべきかを指定する分野情報記憶
    手段と、 分野情報を分野情報記憶手段に設定する分野設定手段と
    、 前記辞書手段に基づき入力読み列を表記に変換する変換
    手段と、 前記変換手段はシステム分野フラグの記述に従って変換
    に利用する単語を異にするよう、制御する制御手段とを
    有することを特徴とする文字処理装置。
JP2150123A 1990-06-08 1990-06-08 文字処理装置 Pending JPH0442349A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2150123A JPH0442349A (ja) 1990-06-08 1990-06-08 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2150123A JPH0442349A (ja) 1990-06-08 1990-06-08 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0442349A true JPH0442349A (ja) 1992-02-12

Family

ID=15489987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2150123A Pending JPH0442349A (ja) 1990-06-08 1990-06-08 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0442349A (ja)

Similar Documents

Publication Publication Date Title
EP0180047B1 (en) Text editor for speech input
US4891786A (en) Stroke typing system
US5349368A (en) Machine translation method and apparatus
JPH0442350A (ja) 文字処理装置
JPH0442349A (ja) 文字処理装置
JPH0442348A (ja) 文字処理装置
JPH0442347A (ja) 文字処理装置
JPH0442351A (ja) 文字処理装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JPS6057422A (ja) 文書目次索引作成装置
JPS628259A (ja) かな漢字変換方式
JPS6246029B2 (ja)
JPH0442352A (ja) 文字処理装置
JPS5818730A (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JPS60201467A (ja) 日本語処理装置
JP3342036B2 (ja) かな漢字変換装置
JP2744241B2 (ja) 文字処理装置
JPH0623974B2 (ja) 文字処理装置
JPH01204174A (ja) 文字処理装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
CN1037602A (zh) 中文文书作成装置
JPH07200565A (ja) 文字処理装置
JPH04111042A (ja) 文字処理装置
JPS62119665A (ja) ワ−ドプロセツサ