JPH0442349A

JPH0442349A - 文字処理装置

Info

Publication number: JPH0442349A
Application number: JP2150123A
Authority: JP
Inventors: Eiichiro Toshima; 英一朗戸島; Kazuyo Ikeda; 和世池田; Yuji Kobayashi; 雄二小林
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1990-06-08
Filing date: 1990-06-08
Publication date: 1992-02-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。

［従来の技術］現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名ｌ英字変換を使って行なうこと
が一般的である。

仮名漢字変換は辞書を参照するζ、とｔ・二より、入力
された読み列を漢字に変換するものである。

般に言って、辞書の単語数が少ないとＪ　ｔＣＩノー多
・の望む単語は変換できないので変換率が低くなり、単
語数が多いとオペレータの望も単語が変換される可能性
が高くなるので変換率が高（なる。

ところが、逆に単語数が増えすぎて特殊な分野の単語ま
で辞書に登録される様になると、オペレータの全く望ま
ない単語が変換され、変換率が悪（なる場合もある。

例えば、読み列「どうきようきかい」に対しては通常は
「東京機械」と変換してほしいわけである。ところが、
地名［東京ｊと地名［官界ｊカに登録されていれば、地
名十地名のパターンは住所の入力などで使われるために
優先して変換され、「東京官界」と変換されることがあ
る。この場合、住所入力を全く考えていないオペレータ
にとっては、地名が豊富に登録されていることにより、
逆に変換率が下がってしまったことになる。

そこで、−船釣な文書の変換率を高めるために分野別辞
書という手法が提案されている。分野別辞書とは、主な
分野ごとにその分野の単語を格納した辞書のことであり
、オペレータは自分の目的にあった分野別辞書を選択し
変換することで最適な変換をすることができる。上記の
例では住所入力を目的とするオペレータは地名分野別辞
書を指定して変換し、住所入力を考えていないオペレー
タは標準辞書を指定して変換するのである。この様にす
ることで、一般のオペレータは標準辞書を利用するので
「どうきょうきかい」と入力しても正常に「東京機械」
と変換されることになる。また、住所入力を行なうオペ
レータは地名分野別辞書を利用するので「東京機械」の
変換は失敗するが、その代わり住所を入力したときの変
換率は高くなる。

この分野別辞書の実現方法には２種類の手法が存在する
。

第１の方法は特定の分野に属さない普遍的な単語を格納
した標準辞書を設定し、他方、特殊分野の単語のみを格
納した分野別辞書を用意し、ある分野が指定された場合
、標準辞書と指定された分野の分野別辞書の両方をサー
チして変換することで実現する方法である。

第２の方法は上記の標準辞書の内容と特定の分野別辞書
の内容を予めマージした辞書を用意するという方法であ
る。この方式では変換の際には１つの辞書のみをサーチ
すれば良い。

ところが、分野別辞書を実現する上述の第１の方法、第
２の方法はいずれも深刻な問題を抱えている。

第１の方法に従うと変換時の処理時間に負担がかかる。

すなわち、標準辞書の変換のみであれば、１つの辞書の
みをサーチすれば良いところを、分野が指定されている
と更に別の辞書もサーチしなければならず、余分なサー
チ処理の分だけ変換時間がかかってしまう。

第２の方法に従うと、こちらは辞書を１回サーチするだ
けなので変換時間には負担はかからないが、分野の種類
が増えてしまうと分野別辞書の種類が飛躍的に増えてし
まう。例えば、「地名」　「歴史」　「建築」　「医学
」の４分野があるだけで「標準辞書」　「地名分野別辞
書」　「歴史分野別辞書」　「建築分野別辞書」　「医
学分野別辞書」　［地名十歴史分野別辞書」　「地名土
建築分野別辞書」　「「地名生医学分野別辞書」　「歴
史十建築分野別辞しｊ等の１６種類もの分野別辞書を用
意しなければならない。

この問題を解決するために、分野別辞書を何種類も用意
するのではな（，１つの辞書のみを用意し、その辞書中
の各単語に分野情報を記述して変換時に分野を判断して
仮名漢字変換し分ける方法が考えられる。

［発明が解決しようとしている課題］ところが、上記の方法を採用したとき、辞書中の１単語
１単語について分野情報が記述されるため、使用メモリ
量が無視できないという問題がある。

［課題を解決するための手段（及び作用）］本発明は、
辞書の格納形式として、標準分野の単語については分野
情報を省略する様に構成することにより、分野情報の記
述のためのメモリ量を減少させる様にし、安価な分野別
変換を実現するものである。

［実施例］以下図面を参照しながら本発明の詳細な説明する。

第１図は本発明の全体構成の一例である。

図示の構成において、ＣＰＵは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスＡＢ、コントロールバスＣＢ、データバスＤ
Ｂを介して、それらのバスに接続された各構成要素を制
御する。

アドレスバスＡＢはマイクロプロセッサＣＰＵの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスＣＢはマイクロプロセッサＣＰＵの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスＤＢは各構成機器相互間のデ
ータの転送を行なう。

つぎにＲＯＭは、読出し専用の固定メモリであり、第１
５図〜第２２図につき後述するマイクロプロセッサＣＰ
Ｕによる制御の手順を記憶させておく。

また、ＲＡＭは、ｌワード１６ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。Ｉ　ＢＵＦはキー入
力されたキーデータを記憶する入力バッファであり、０
ＢＵＦは仮名漢字変換された結果を一時的に記憶する出
力バッファである。ＤＩＣは仮名漢字変換を行なうため
の辞書である。ＢＣＴＢＬは変換途中の文節候補を記憶
する文節候補テーブルである。ＴＢＵＦはテキストバッ
ファであり、入力編集中のテキストデータが記憶される
。ＤＯＢＵＦは同音語バッファであり、テキストバッフ
ァＴＢＵＦに記憶される文字に同音語候補が存在すると
きはその候補が記憶される。５ＢＵＮＦはシステム分野
フラグであり、仮名漢字変換するとき、標準分野以外に
変換すべき単語の分野を指定したフラグが記憶される。

ＫＢはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字配号入カキ−１及び、変
換キー、次候補キー、選択キー、分野設定キー、分野保
存キー、分野呼出キー実行キー、解除キー等の本文字処
理装置に対する各種機能を指示するための各種のファン
クションキーを備えている。

ＤＩＳＫは文書データ、システムフラグ、あるいはイラ
ストデータ、図形データ等を記憶するための外部記憶部
である。テキストバッファＴＢＵＦ上に作成された文書
、システム分野フラグなどはこの外部記憶部に保管され
る。保管されたデータはキーボードの指示により、必要
な時呼び出される。

ＣＲはカーソルレジスタである。ＣＰＵにより、カーソ
ルレジスタの内容を読み書きできる。

後述するＣＲＴコントローラＣＲＴＣは、ここに蓄えら
れたアドレスに対応する表示装置ＣＲＴ上の位置にカー
ソルを表示する。

ＤＢｔＪＦは表示用バッファメモリで、表示すべきデー
タのパターンを蓄える。テキストの内容を表示するとき
はテキストバッファＴＢＵＦの内容に応じて表示パター
ンがＤＢＵＦに作成されることにより、表示されること
になる。

ＣＲＴＣはカーソルレジスタＣＲ及びバッファＤＢＵＦ
に蓄えられた内容を表示器ＣＲＴに表示する役割を担う
。

またＣＲＴは陰極線管等を用いた表示装置であり、その
表示装置ＣＲＴにおけろドツト構成の表示パターンおよ
びカーソルの表示をＣＲＴコントローラで制御する。

さらに、ＣＧはキャラクタジェネレータであって、表示
装置ＣＲＴに表示する文字、記号のパターンを記憶する
ものである。

かかる各構成要素からなる本発明文字処理装置において
は、キーボードＫＢからの各種の入力に応じて作動する
ものであって、キーボードＫＢからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサＣＰ
　Ｕに送られ、そのマイクロプロセッサＣ））　［１が
ＲＯＭ内に記憶しである各種の制御信号を読出し、それ
らの制御信号に従って各種の制御が行なわれる。

第２図は本発明装置ににる各分野ごとの変換例を示した
図である。図中「〃」は（こで変換ギを打鍵するという
意味である。各変換例は全て入力読み列として「はびき
のしこんだにあるおうじんでんのうりよう」を与えた場
合のものである。

２−１は標準分野での変換例を示した図である。入力に
対して第１候補は「羽曳野仕込んだ荷ある追う陣天皇寮
」と変換される。これは（地名）　（歴史）の分野が設
定されていないので地名「音用」人名「応神」名詞「陵
」が存在しないために誤変換しているからである。

２−２は標準分野→−地名分野での変換例を示した図で
ある。入力に対して第１候補は「羽曳野市音用にある追
う陣天皇寮」と変換される。これは（歴史）の分野が設
定されていないので人名「応神」、名詞「陵」が存在し
ないために誤変換しているからである。２−１に比べて
（地名）の分野が設定されているので地名「音用」は変
換できる様になっている。

２−３は標準分野＋歴史分野での変換例を示した図であ
る。入力に対して第１候補は「羽曳野仕込んだ荷ある応
神天皇陵」と変換される。これは（地名）の分野が設定
されていないので地名「音用」が存在しないために誤変
換しているからである。２−１に比べて（歴史）の分野
が設定されているので人名「応神」名詞「陵」は変換で
きる様になっている。

２−４は標準分野＋地名分野＋歴史分野での変換例を示
した図である。入力に対して第１候補は「羽曳野市誉田
にある応神天皇陵」と正しく変換されている。

第３図は分野の設定・保存操作の例を示した図である。

３−１は初期画面を示したものである。

通常の文書作成編集はこの画面で行なう。アングライン
はカーソルの存在する位置を示している。

３−２は分野設定キーを打鍵した時の画面を示している
。カーソルは最初の設定項目「地名分野」のところにい
る。各分野それぞれについて「０」はその分野の単語を
変換しないことを意味し、「１」はその分野の単語を変
換することを意味している。３−２の画面においては全
分野「０」が設定されているので、どの分野の単語も変
換されることはなく、標準分野の単語のみが変換される
ことを意味している。ここでキー「１．０を打鍵すると
３−３の画面になる。３−３では地名分野の設定項目が
「１」となっているので地名分野の単語が変換可能にな
ったことを意味している。カーソルは次の設定項目であ
る歴史分野のところに移動している。ここでもう−度、
キー「ＩＪＩを打鍵すると３−４の画面になる。ここで
歴史分野の設定項目も「ＩＪＩとなり、更に歴史分野の
単語も変換可能になったことを意味している。カーソル
は更に次の設定項目である建築分野のところに移動して
いる。ここで分野保存キーを打鍵すると、現在表示され
ている分野状態（標準分野＋地名分野十歴史分野の単語
が変換される状態）が外部記憶部ＤＩＳＫ中に保存され
、３−５の画面になる。この画面は３−４の画面と何ら
変りがない。ここで実行キーを打鍵すると分野情報が更
新され、分野設定画面は消え、３−６の様に元の文書編
集画面に戻る。

第４図は分野の呼出操作の例を示した図である。４−１
は通常の文書作成編集の初期画面である。この状態で分
野呼出キーを打鍵すると、ＤＩＳＫ中に存在する分野情
報が呼びだされ、例えば、４−２の画面の様になる。こ
の例はＤＩＳＫ中に「標準分野＋地名分野＋建築分野」
の変換を行なう分野情報がたまたま保存されていたこと
を示している。４−２の状態で第３図に説明した様な操
作を行なうことも可能である。もし、そのまま実行キー
を打鍵すると、分野設定画面が消滅し、４−３の様に元
の文書作成編集画面に戻る。

第５図は仮名漢字変換の操作の例を示した図である。５
−１は文書作成編集を行なう初期画面である。読み列「
はびきのしこんだ」を入力すると５−２の画面になる。

５−２ではカーソルは入力読み列の次に表示されている
。ここで変換キーを打鍵すると５−３の画面になる。５
−３では読み列「はびきのしこんだ」が「羽曳野市誉田
」と変換されている。オペレータは「羽曳野市金円」と
いう変換を望んだとして、次候補キーを打鍵すると５−
４の画面になる。ここで「こんだ」の変換候補が表示さ
れる。第１候補は「音用」であり、第２候補は「金円」
である。現在の候補は第２候補の「金円」であり、２が
反転表示している。ここで選択キーを打鍵すると、５−
５の画面になる。第２候補の「金円」が確定してテキス
トデータの中に格納され、同時に「金円」が学習され、
単語尤度が向上する。

第６図は大力バッファＩ　ＢＵＦ、出力バッファ０ＢＬ
ＩＦの構成を示した図である。

ＩＢＵＦ、０ＢＵＦともに同じ構成である。最初の２バ
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から１を減じたものを２倍した数値が
入る。入力バッファの末尾にあるｒ／／Ｊはそこで変換
キーが打鍵されたことを意味する。各文字は１文字２バ
イトで構成され、ＪＩＳ　Ｘ　０２０８コードで格納さ
れる。

第７図は仮名漢字変換用辞書ＤＩＣの記憶内容を概念的
に示した図である。各単語は「読み」　「表記」　「品
詞」　「単語尤度」　「分野情報」のフィールドから構
成される。

「読み」には単語の読み、「表記Ｊには単語の表記、ｒ
品詞」には単語の品詞が格納される。

「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が１〜５の値で格納される。

尤度値５は最も尤もらしいという意味であり、値が小さ
（なるにつれ疑わしいと解釈される。尤度値０は全く考
えられないということを意味するので単語尤度の値とし
ては存在しない。

「分野情報」にはその単語の使用される分野が、（地名
）　（歴史）（建築）（医学）などと、−船釣には複数
個記述される。特定の分野に属さない単語に対しては分
野情報は記述されない。

第８図は仮名漢字変換用辞書ＤＩＣの具体的構成を示し
た図である。

８−１は標準分野以外の単語の格納構成を示している。

読みはＪＩＳ　Ｘ　０２０ｇコードの下位バイトを使用
して１文字１バイトで可変長で構成される。

ＪＩＳ　Ｘ　０２０８コードの下位バイトであるから各
バイトのＭＳＢはＯＦＦとなっている。分野は１バイト
で構成され、図に示す様にビット対応で単語の分野が設
定される。単語がその分野に属するときは対応するビッ
トに１が格納され、属さないときはＯが格納される。Ｍ
ＳＢはＯＮとなる。従って、分野の値の範囲は０Ｘ８０
〜０ｘ８ｆとなる。表記はＪＩＳ　Ｘ　０２０ｇコード
を使用して１文字２バイトで可変長で格納される。ただ
し、各バイトのＭＳＢをＯＮとする。ＪＩＳ　Ｘ　０２
［１８］−ドの各バイトは０Ｘ２１〜０ｘ７ｅの値とな
るので、表記の各バイトは０ｘａｌ〜０ｘｆｅの範囲に
入る。

品詞は１バイトで構成され、その単語の品詞コードが格
納される。ＭＳＢはＯＦＦされる。頻度もやはり１バイ
トで構成され、その単語の頻度が格納されるＭＳＢはＯ
ＦＦされる。

８−２は標準分野の単語の格納形式を示している。標準
分野以外の単語の格納形式と大体同じであるが、違いは
分野が含まれていないという点である。なお、分野の値
の範囲（Ｏｘ２１〜０ｘ７ｅ）と表記の値の範囲（ＯＸ
８１〜０Ｘｆｆ）は異なるので、値をチエツクすること
で読みの後に分野があるのか表記があるのかが分かる仕
掛けとなっている。

第９図は文節候補テーブルＢＣＴＢＬの配憶内容を概念
的に示した図である。文節候補テーブルは入力読みの解
析の結果、考えられる文節候補をバイナリ−トリーで表
現したものである。図中、横線は子ポインタを意味し、
縦線は第ポインタを意味する。第ポインタはある読み位
置から始まる他の文節候補（通常はより短い候補）をリ
ンクし、子ポインタはその文節に引き続く文節候補をリ
ンクする。

入力読み列「はびきのしこんだ」の先頭部分は「羽曳野
」　「歯」　「葉」などの解釈が存在し、これらは順に
第ポインタ（縦線）でリンクされている。

「羽曳野」に引き続く文節は「仕込んだ」が考えられ、
子ポインタでリンクされている。

この様な文節候補テーブルができ上がると、「羽曳野仕
込んだ」　「羽曳野重音用」　「歯引ぎの仕込んだ」　
「歯引きのし音用ｊなどと文節候補列を作成することは
容易である。

第１０図は文節候補テーブルＢＣＴＢＬの具体的構成を
示した図である。

「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。

「付属語列」は２バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭１バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の１バイトが大力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第６図に示す大力バッ
ファのとき、「んだ」を表現するには第１バイトに１２
、第２バイトに１４を設定する。付属語列が存在しない
ときは図中で「φ」で示している。

「第リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。

「子リンク」はその文節候補に引き続く文節候補をリン
クする。

なお、リンクは値Ｏのときに終端することを意味する。

例えば、文節候補０（羽曳野）の第リンクは５０であり
、文節候補５０（歯）をリンクする。文節候補Ｏ（羽曳
野）の子リンクは１００であり、文節候補１００（仕込
んだ）をリンクする。文節候補１００の子リンクはＯで
あり、そこで入力読みが終端していることが分かる。

第１１図はテキストバッファＴＢＵＦの構成を示した図
である。

テキストバッファは文字の羅列から構成され、各文字は
２バイトで構成される。各文字のＭＳＢは同音語フラグ
であり、０は通常文字、ｌが同音語を意味する。残りの
１５ビツトは通常文字のときは文字コードを表現し、同
音語のときは同音語番号を表現する。文字コードは、Ｊ
ＩＳ　Ｘ　０２０８コードを使用する。同音語番号は第
１２図に示す同音語バッファＤＯＢＵＦ上のどの同音語
であるかを示す番号である。

第１２図は同音語バッファＤＯＢＵＦの構成を示した図
である。各同音語には同音語番号が付いており、それに
よって識別される。

各同音言吾は「読み」　「候補総数」　「現候補番号」
　「第ｉ候補情報」からなる。

「読み」はその同音語の読みを格納する。

「候補総数」はその同音に含まれる候補の総数を格納す
る。

「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後初値に第１候補が表示され
るから「ｌ」が格納される。

「第ｉ候補情報」は各候補の１表記」　「単語アドレス
」が格納される。

「表記」にはその候補の表記が格納される。

「単語アドレス」には、その単語の存在アドレスを格納
する。

第１３図はシステム分野フラグ５ＢＵＮＦの構成を示し
た図である。

辞書１０Ｃ内の各単語の分野情報とほぼ同一の構成をし
ており、変換すべき単語の分野を指定する。もし、標準
分野の単語のみを変換すれば良いのであれば、全部の分
野のビットをＯＦＦすれば良い。辞書ＤＩＣ内の各単語
の分野情報と異なる点はＭＳＢがＯＦＦになっていると
いう点である。

第１４図は外部記憶部ＤＩＳＫの構成を示した図である
。

１４−１に示す様に、ＤＩＳＫの中は格納されるデータ
に応じて複数のエリアに区分されている。例えば、文書
データＴＢＵＦがＤＩＳＫに保存されるときは文書デー
タ格納エリアに保存される。システムフラグ格納エリア
はＤＩＳＫ中に−か所のみ存在し、システムに関係する
各種のフラグを保管する。

１４−２はシステムフラグ格納エリアの更なる詳細構成
を示している。例えば、システム分野フラグ、変換モー
ド（即時変換、−括変換など）、選択モード（自動選択
、指定選択など）、入力モード（ローマ字入力、かな入
力など）から構成される。システム分野フラグ５ＢＵＮ
ＦがＤＩＳＫに保存されるときは４−２の「システム分
野フラグ」に示す領域に保存される。

上述の実施例の動作を第１５図以下のフローにチャート
に従って説明する。

第１５図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。

ステップ１５−１はキーボードからのデータを取り込む
処理である。ステップ１５−２で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。

変換キーであったときはステップ１５−３に分岐し、ス
テップ１５−３において第１６図に詳述するように仮名
漢字変換の変換処理が行なわれる。次候補キーであった
ときはステップ１５−４において第１９図に詳述する次
候補処理を行なう。

選択キーであったときはステップ１５−５において第２
０図に詳述する選択処理を行なう。

分野設定キーであったときはステップ１５−６において
第２１図に詳述する分野設定処理を行なう。

分野呼出キーであったときはステップ１５−７において
第２２図に詳述する分野呼出処理を行ない、その後ステ
ップ１５−６の分野設定処理に分岐する。

その他のキーのときはステップ１５−８に分岐し、挿入
、削除等の通常の文字処理装置において行なわれるその
他の処理が行なわれる。

各キーの処理が終了すると、ステップ１５−１に分岐す
る。

第１６図はステップ１５−３のし変換処理」を詳細化し
たフローチャートである。

ステップ１６−１において、第１７図に詳述する文節候
補作成処理を行ない、文節候補テーブルＢＣＴＢＬを作
成する。

ステップ１６−２において、作成された文節候補から最
も尤もらしい変換候補を決定する第１候補決定処理を行
なう。

ステップ１６−３において、決定された第１候補に基づ
いて変換結果を作成し、出力する。

第１７図はステップ１６−１の「文節候補作成処理」を
詳細化したフローチャートである。

ステップ１７−１において、入力バッファインデックス
ｉ、文節候補テーブルインデックスｊを０に初期設定す
る。

ステップ１７−２においてｉの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補のリストを作成
する。

ステップ１７−３において、第１８図に詳述する様に、
作成された単語候補がシステム分野フラグの指定から見
て適切であるかどうかチエツクし、適切でないものをオ
ミットする「分野チエツク処理」を行なう。

ステップ１７−４において、リストされている単語候補
に対して接続する付属語列を解析する形態素解析処理を
行なう。この結果、文節候補が得られる。

ステップ１７−５において得られた文節候補を文節候補
テーブルに格納する。格納する時はｊ＋１番目のエント
リーに格納する。また、必要な情報を設定する。例えば
、この文節候補を子、あるいは第とする文節候補につい
ては、子リンク、第リンクを設定する。格納後ｊの値を
カウントアツプする。

ステップ１７−６において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をｉ
に代入する。

ステップ１７−７において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ１７−２に分岐する。そうでなければリ
ターンする。

第１８図はステップ１７−３の「分野チエツク処理」を
詳細化したフローチャートである。

ステップ１８−１において、単語候補にリストから候補
を１つとりだす。

ステップ１８−２において全ての単語候補についてチエ
ツクが終了したかどうかを判定し、終了しているときは
リターンする。終了していないときはステップ１８−３
に進む。

ステップ１８−３において、その単語候補に分野が記述
されているかどうか（標準分野の単語であるかどうか）
を判定し、分野が記述されていないときは標準分野の単
語であるのでステップ１８−７にスキップする。分野が
記述されているときはステップ１８−４に進む。

ステップ１８−４において、システム分野フラグ５ＢＵ
ＮＦ、単語候補の分野情報、０ｘＯｆの全てのＡＮＤ　
（論理積）をとり、単語候補が変換すべき分野の単語で
あるかどうかを調べる。

ステップ１８−５において上記の値の判定を行ない、０
のときは変換すべき単語ではないからステップ１８−６
において単語候補のリストから除外する６０でないとき
はステップ１８−７に分岐し、その単語候補をリストに
残す。

その後ステップ１８−１にループし、次の単語候補を処
理する。

第１９図はステップ１５−４の「次候補処理」を詳細化
したフローチャートである。

ステップ１９−１において、次候補を見るべき同音語の
同音語番号をテキストバッファＴＢＵＦより求める。

ステップ１９−２において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアツプする
。

ステップ１９−３において、候補−覧を表示する。

第２０図はステップ１５−５の「選択処理」を詳細化し
たフローチャートである。

ステップ２０−１において、選択すべき同音語の同音語
番号をテキストバッファＴＢＵＦより求める。

ステップ２０−２において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り圧し、テキストバッファＴＢＵＦに硲定文字と
して設定する。

ステップ２０−３において、同様に、現候補番号の示す
候補情報から単語アドレスを求め、その示された単語の
単語尤度をカウントアツプする。

ただし、単語尤度が既に５になっているときはカウント
アツプは行なわない。

ステップ２ｏ−４において、同様に、第１候補の示す候
補情報から単語アドレスを求め、その示された単語の単
語尤度をカウントダウンする。ただし、単語尤度が既に
１のときはカウントダウンは行なわない。

第２１図はステップ１５−６の「分野設定処理」を詳細
化したフローチャートである。

ステップ２１−１において、元の画面状態を退避し、分
野設定画面を表示する。

ステップ２１−２において、現在のシステム分野フラグ
５ＢＵＮＦの値を退避する。

ステップ２１−３において、キーボードからのデータを
取り込む。

ステップ２１−４において、取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。

キーＦｌ、Ｑが打鍵されたときはステップ２１５に分岐
し、システム分野フラグ５ＢＵＮＦの対応する分野のビ
ットを１にセットする。また、カーソルを次の設定項目
に移動させる。

キーＦＯＪＩが打鍵されたときはステップ２１６に分岐
し、システム分野フラグ５ＢＵＮＦの対応する分野のビ
ットなＯにリセットする。また、カーソルを次の設定項
目に移動させる。

画面関係のキー（カーソル移動キーなど）が打鍵された
ときはステップ２１−７に分岐し、カーソル移動等の画
面制御処理を行なう。

ステップ２１−５．２１−６．２１−７の各処理が終了
すると、ステップ１５−１に分岐し、次のキー入力を待
つ。

分野保存キーが打鍵されたときはステップ２１８に分岐
し、システム分野フラグ５ＢＵＮＦを外部記憶部ＤＩＳ
Ｋの定められた区分に保存する。その後、ステップ２１
−１０に分岐する。

解除キーが打鍵されたときはステップ２１−９に分岐し
、システム分野フラグの値を退避されたいた値に復旧す
る。その後、ステップ２１−１０に分岐する。

実行キーが打鍵されたときはステップ２１−１０に分岐
し、画面を分野設定キーが打鍵される以前の状態に復旧
し、リターンする。

第２２図はステップ１５−７の「分野呼出処理」を詳細
化したフローチャートである。

ステップ２２−１において、現在のシステム分野フラグ
５ＢＵＮＦの値を退避する。

ステップ２２−２において、外部記憶部ＤＩＳＫ中のシ
ステムフラグ格納エリア中のシステム分野フラグの値を
取り出す。

ステップ２２−３において、上記取り出された値を５Ｂ
ＵＮＦに代入してリターンする。

［他の実施例］以上の説明において、分野の種類は４分野のみであると
して説明したが、同分野の辞書であっても同様に処理す
ることができる。

［発明の効果］以上の説明から明らかなように、本発明によれば、辞書
中に分野情報を持っているので、複数の分野別辞書を用
意する必要がなく、また、１つの辞書のみをサーチすれ
ば良いので、高速の分野別仮名漢字変換が実現できる。

これにより、オペレータは自分の希望しない分野の単語
が存在することによる誤変換に遭遇することがないので
変換率の高い、快適な文字処理装置を実現することがで
きる。

更に、辞書の格納形式として櫟準分野の単語については
分野情報が省略されているので、分野情報のためのメモ
リ使用量が少なく、安価な分野別辞書を実現することが
できる。

【図面の簡単な説明】

第１図は本発明に係る文字処理装置の全体構成のブロッ
ク図、第２図は本発明における仮名漢字変換の変換例を示した
図、第３図は本発明における分野の設定・保存操作の例を示
した図、第４図は本発明における分野の呼出操作の例を示した図
、第５図は本発明における仮名漢字変換の操作の例を示し
た図、第６図は本発明における入力バッファＩ　ＢＵＦと出力
バッファ０ＢＵＦの構成を示した図、第７図は本発明に
おける仮名漢字変換用辞書ＤＩＣの記憶内容を概念的に
示した図、第８図は本発明における仮名漢字変換用辞書ＤＩＣの具
体的構成を示した図、第９図は本発明における文節候補テーブルＢＣＴＢＬの
記憶内容を概念的に示した図、第１０図は本発明におけ
る文節候補テーブルＢＣＴＢＬの具体的構成を示した図
、第１１図は本発明におけるテキストバッファＴＢＵＦの
構成を示した図、第１２図は本発明における同音語バッファＤ。ＢＵＦの構成を示した図、第１３図は本発明におけるシステム分野フラグＳＢＵＮ
Ｆの構成を示した図、第１４図は本発明における外部記憶部ＤＩＳＫの構成を
示した図、第１５図〜第２２図は本発明の文字処理装置の動作を示
すフローチャートである。１０ＳＫ　　　・・・外部記憶部ＣＰＵ　　　・・・マイクロプロセッサＲＯＭ　　　　
・・・読出し専用メモリＲＡＭ　　　　・・・ランダム
アクセスメモリＩＢＵＦ　　　・・・入力バッファ０ＢＵＦ　　　・・・出力バッファＤＩＣ・・・仮名漢字変換用辞書ＢＣＴＲＬ　　・・・文節候補テーブルＴＢＵＦ　　　
・・・テキストバッファＤＯＢＵＦ　　・・・同音語バ
ッファ

Claims

【特許請求の範囲】１、読み列を入力する入力手段と、読み、表記、分野を対応づけて記憶し、格納形式として
標準分野の単語については分野情報が省略されている辞
書手段と、どの分野の単語を変換すべきかを指定する分野情報記憶
手段と、分野情報を分野情報記憶手段に設定する分野設定手段と
、前記辞書手段に基づき入力読み列を表記に変換する変換
手段と、前記変換手段はシステム分野フラグの記述に従って変換
に利用する単語を異にするよう、制御する制御手段とを
有することを特徴とする文字処理装置。