JPH056361A

JPH056361A - 文字処理装置

Info

Publication number: JPH056361A
Application number: JP3156505A
Authority: JP
Inventors: Eiichiro Toshima; 英一朗戸島
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1991-06-27
Filing date: 1991-06-27
Publication date: 1993-01-14

Abstract

(57)【要約】【目的】複合語に対しても短縮変換ができ、かつ、操作
性を向上することができる。【構成】単語を変換するとき、変換した単語は、その表
記に対応したＤＩＣ（辞書）２−１上のアドレス（位置
情報）をＲＡＭ３のＵＳＲＤ（登録単語辞書）３−５に
記憶する。次回の変換では、先頭読みが指定されると、
この指定された先頭読みを先頭読みとする単語のアドレ
スがＵＳＲＤ３−５に登録されているかどうか調べ、登
録されていればその単語を変換する。入力した読みの単
語は、前回変換した単語または複合語のどちらを構成す
るか判断し、複合語を構成すると判断したときは、複合
語の全体を完全な読みでＵＳＲＤ３−５に登録し、か
つ、そのアドレスも登録する。次回の変換で複合語の先
頭読みが指定されれば、複合語の全体がＵＳＲＤ３−５
に登録したアドレスによりＤＩＣ２−１を参照して変換
されることになる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文字処理装置に関し、例
えば、単語と複合語の文字処理を行う文字処理装置に関
する。

【０００２】

【従来の技術】現在、日本ワードプロセツサなどの文字
処理装置は漢字仮名混じり文の入力を仮名漢字変換を使
って行なうことが一般的である。

【０００３】仮名漢字変換入力においては、キーボード
より入力したい日本文の読み列を入力し、それを装置に
仮名漢字変換させ、望む候補を選択することにより、目
的の漢字仮名混じり文を作成する。例えば、『機械』を
入力するためにはキーボードより『きかい』と打鍵し、
表示される候補『機械，機会，器械』などから目的の候
補である『機械』を選択する。

【０００４】ところで、通常の文章においては、特定の
単語が頻繁に登場する傾向が一般にある。従来、この点
に着目して、一度変換した単語に対しては、次回からそ
の先頭読みを指定して変換するだけで完全な単語が変換
されるように工夫した、いわゆる短縮変換という機構を
持つ装置が提案されている。この装置によると、例えば
『きかい』という読みを変換して『機械』を得た後、次
に『き』という読みだけを指定して変換すると『木』等
の候補に先んじて『機械』が変換される。

【０００５】ところが、従来考案されている短縮変換に
おいては『機械振興会館』のような複合語の入力におい
て問題があつた。例えば、『機械』『振興』『会館にお
いて』と単語に分割して入力した場合、『き』を変換し
ても『機械』が変換されるだけである。『き』で『機械
振興会館』を変更するには最初に『きかいしんこうかい
かん』で『機械振興会館』を変換しておく必要があつ
た。

【０００６】

【発明が解決しようとしている課題】すなわち、従来装
置における短縮変換においては、単語単位の入力におい
て簡便になつているだけであり、複合語部分については
あらかじめ複合語単位で変換しておく等の工夫が必要で
るという欠点があつた。

【０００７】本発明は、上述した従来例の欠点に鑑みて
なされたものであり、その目的とするところは、複合語
に対しても短縮変換ができ、かつ、操作性を向上できる
文字処理装置を提供する点にある。

【０００８】

【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、本発明に係る文字処理装置は、予
め単語を読みと表記との対応関係で記憶する記憶手段を
備えた文字処理装置において、少なくとも１文字を含む
文字列で読みを入力する入力手段と、前記入力手段で入
力した読みを前記記憶手段を用いて表記に変換する変換
手段と、前記変換手段で変換した表記の前記記憶手段で
の位置情報を登録する登録手段と、前記変換手段で変換
した表記と前記登録手段で直前に登録した位置情報に対
応した表記とを組み合わせた文字列が複合語であるか否
かを判断する判断手段と、前記判断手段が複合語である
と判断した場合、前記登録手段で直前に登録した位置情
報を前記複合語を構成する全単語の位置情報に更新し、
かつ、前記全単語の位置情報に対応させて前記複合語の
読みを追加する更新手段と、前記入力手段で短縮型の読
みを入力したときに該短縮型の読みを含む読みを有した
複合語の各位置情報を前記登録手段で登録した内容から
検出する検出手段と、前記検出手段で検出した各位置情
報に対応した表記を前記記憶手段から読み出して合成す
る合成手段とを備えることを特徴とする。

【０００９】

【作用】かかる構成によれば、入力手段は少なくとも１
文字を含む文字列で読みを入力し、変換手段は入力手段
で入力した読みを前記記憶手段を用いて表記に変換し、
登録手段は変換手段で変換した表記の記憶手段での位置
情報を登録し、判断手段は変換手段で変換した表記と登
録手段で直前に登録した位置情報に対応した表記とを組
み合わせた文字列が複合語であるか否かを判断し、更新
手段は登録手段で直前に登録した位置情報を前記複合語
を構成する全単語の位置情報に更新し、かつ、前記全単
語の位置情報に対応させて前記複合語の読みを追加し、
特に、検出手段は、入力手段で短縮型の読みを入力した
ときに該短縮型の読みを含む読みを有した複合語の各位
置情報を登録手段で登録した内容から検出し、合成手段
は検出手段で検出した各位置情報に対応した表記を記憶
手段から読み出して合成する。

【００１０】

【実施例】以下、添付図面を参照しながら本発明の一実
施例を詳細に説明する。

【００１１】＜第１の実施例＞図１は本発明に係る文字
処理装置の第１の実施例の構成を示すブロツク図であ
る。同図において、１はマイクロプロセツサで構成され
たＣＰＵで、文字処理のための演算，論理判断等を行な
い、アドレスバスＡＢ，コントロールバスＣＢ，データ
バスＤＢを介して、それらのバスに接続された各構成要
素を制御する。

【００１２】ＡＢはアドレスバスＡＢで、マイクロプロ
セツサＣＰＵの制御の対象とする構成要素を指示するア
ドレス信号を転送する。ＣＢはコントロールバスで、Ｃ
ＰＵ１の制御の対象とする各構成要素のコントロール信
号を転送して印加する。ＤＢはデータバスで、各構成機
器相互間のデータの転送を行なう。

【００１３】２は読み出し専用の固定メモリ（以下「Ｒ
ＯＭ」という）で、図１０〜図１５につき後述するＣＰ
Ｕ１による制御のためのプログラム等を予め記憶する。
２−１は仮名漢字変換を行なうための辞書（以下「ＤＩ
Ｃ」という）である。

【００１４】また、３は１ワード１６ビツトの構成の書
込み可能のランダムアクセスメモリ（以下「ＲＡＭ」と
いう）であつて、各構成要素からの各種データの一時記
憶に用いると同時に、ワークエリアとしても用いる。３
−１はキー入力されたキーデータを読み列として記憶す
る入力バツフア（以下「ＹＢＵＦ」という）であり、３
−２は仮名漢字変換された結果を記憶する出力文字列バ
ツフア（以下「ＳＴＢＵＦ」という）である。３−３は
出力文字列の同音語情報を記憶するための同音語バツフ
ア（以下「ＤＯＢＵＦ」という）である。３−４は短縮
変換のための情報を記憶する短縮メモリ（以下「ＡＭＥ
Ｍ「という）である。３−５はオペレータが自分に特有
の単語を登録する登録単語辞書（以下「ＵＳＲＤ」とい
う）である。３−６は連続する漢字列を記憶する連続漢
字列バツフア（以下「ＫＡＮＢＵＦ」という）である。

【００１５】５はキーボード（以下「ＫＢ」という）で
あつて、アルフアベツトキー，ひらかなキー，カタカナ
キー等の文字記号入力キー、及び変換キー，無変換キー
等の本文字処理装置に対する各種機能を指示するための
各種のフアンクシヨンキーを備えている。４は文書デー
タを記憶するための外部記憶装置（以下「ＤＩＳＫ」と
いう）であり、テキストバツフア上に作成された文書の
保管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。６はカーソルレジスタ（以
下「ＣＲ」という）であり、ＣＰＵ１により内容を読み
書きされる。後述するＣＲＴＣ（ＣＲＴコントローラ）
８は、ここに蓄えられたアドレスに対応するＣＲＴ９
（表示装置）上の位置にカーソルを表示する。７は表示
用バツフアメモリ（以下「ＤＢＵＦ」という）で、表示
すべきデータを蓄える。

【００１６】８はＣＲＴコントローラ（以下「ＣＲＴ
Ｃ」という）で、ＣＲ６及びＤＢＵＦ７に蓄えられた内
容を後述のＣＲＴ９に表示する役割を担う。９は陰極線
管等を用いた表示装置（以下「ＣＲＴ」という）であ
り、その表示するときのドツト構成の表示パターンおよ
びカーソルの表示をＣＲＴＣ８によって制御される。１
０はキヤラクタジエネレータ（以下「ＣＧ」という）で
あつて、ＣＲＴ９に表示する文字，記号のパターンを記
憶するものである。

【００１７】かかる各構成要素においては、ＫＢ５から
の各種の入力に応じて作動するものであつて、ＫＢ５か
らの入力が供給されると、まず、インタラプト信号がＣ
ＰＵ１に送られ、そのＣＰＵ１がＲＯＭ２内に記憶して
ある各種の制御信号を読出し、それらの制御信号に従つ
て各種の制御が行なわれる。

【００１８】図２は第１の実施例による変換例を示した
図である。

【００１９】同図において、（ａ）は読み『きかい』を
打鍵した状態を示している。その後変換キーを打鍵する
と、（ｂ）の画面になり、『機械』が変換される。この
段階では、次候補／前候補を見ることが可能であり、実
際には変換結果は文書中に出力されていない。

【００２０】次いで、読み『しんこう』を打鍵すると、
（ｃ）の画面になり、変換結果『機械』が実際に文書中
に出力され、ＡＭＥＭ３−４に『機械』のアドレスが記
憶される。その後変換キーを打鍵すると、（ｄ）の画面
になり『振興』が変換される。この段階では『振興』は
文書中に出力されていない。

【００２１】次いで、読み『かいかんにおいて』を打鍵
すると、（ｅ）の画面になり、変換結果『振興』が実際
に文書中に出力され、ＡＭＥＭ３−４に『振興』のアド
レスが記憶される。また、前回の変換は『機械』である
ので、この段階で複合語『機械振興』が自動登録され、
そのアドレスもＡＭＥＭ３−４に記憶される。その後変
換キーを打鍵すると、（ｆ）の画面になり『会館におい
て』が変換される。この段階では『会館において』はま
だ文書中には出力されていないが、無関係なキーの打鍵
で変換結果『会館において』が実際に文書中に出力さ
れ、ＡＭＥＭ３−４に『振興』のアドレスが記憶され、
かつ『機械振興会館』が複合語をなすと解釈され、ＵＳ
ＲＤ３−５に自動登録されそのアドレスもＡＭＥＭ３−
４に記憶される（ｇ）。

【００２２】次に読み『き』を入力し（ｈ）、変換キー
を打鍵すると、１文字の変換であるので、ＡＭＥＭ３−
４が検索され、これまでの操作で登録されている、『機
械振興会館』『機械振興』『機械』等のアドレスが見つ
かり、『機械振興会館』が第１候補として変換され、
（ｉ）の画面になる。

【００２３】このように、本装置においては、分割して
変換した複合語に対して、次回からはその複合語全体の
先頭の読み（例えば、『き』）を指定するだけで変換が
可能である。すなわち、複合語の短縮変換が可能であ
る。

【００２４】なお、本実施例においては、先頭の１文字
のみを指定して短縮するように構成しているが、読み先
頭部分の複数文字を指定による短縮変換も実現可能であ
る。そのような短縮変換においては、例えば『内閣総辞
職』を変換した後、『な』『ない』『ないか』等を指定
して変換させることになる。このような『な』『ない』
『ないか』等を元の完全な読み『ないかくそうじしょ
く』に対して『プレフイツクス』と呼ぶ。たとえば、
『きかい』は『機械振興会館（きかいしんこうかいか
ん）』のプレフイツクスであり、『いち』は『一目瞭然
（いちもくりょうぜん）』のプレフイツクスである。

【００２５】図３は第１の実施例によるＹＢＵＦの構成
を示す図である。同図において、ＹＢＵＦ３−１の最初
の２バイトはバツフアサイズ情報であり、同バツフアに
格納されている文字数から１を減じたものを２倍した数
値がバツフアサイズとして入る。ＹＢＵＦ３−１にはそ
の時点で未変換の読み列情報が記憶される。各文字は１
文字２バイトで構成され、一例としてＪＩＳＸ０２０８
コードで格納される。

【００２６】図４は第１の実施例によるＯＢＵＦの構成
を示した図である。

【００２７】ＳＴＢＵＦ３−２の最初の２バイトはバツ
フアサイズ情報であり、同バツフアに格納されている文
字数から１を減じたものを２倍した数値がバツフアサイ
ズとして入る。仮名漢字変換が起動されると、ＳＴＢＵ
Ｆ３−２に変換結果が設定される。ただし、その時点で
表示されている候補の変換結果が記憶される。各文字は
１文字２バイトで構成され、ＪＩＳＸ０２０８コードで
格納される。

【００２８】図５は第１の実施例によるＤＯＢＵＦの構
成を示した図である。

【００２９】ＤＯＢＵＦ３−３には変換が起動される
と、その変換結果の同音語情報が設定される。候補数は
ＤＯＢＵＦ３−３に格納されている同音語候補の個数が
記憶される。候補番号は、その時点で表示されている候
補の番号が格納される。例えば、変換直後の状態では、
たいていの場合１が記憶されることになる。次候補表示
指示、前候補表示指示等が行なわれると、候補番号の値
は＋１、あるいは−１される。

【００３０】各単語はアドレスと表記が対応づけて記憶
される。アドレスには、その単語の辞書上での位置がア
ドレスで記憶される。表記はその単語の実際の表記であ
る。各用語の場合には活用した形態で記憶される。例え
ば、『歩いた』の場合、辞書上には語幹部の『歩』しか
記憶されないが、ＤＯＢＵＦ３−３上の表記の欄には
『歩いた』の形で記憶される。各文字は１文字２バイト
で構成され、ＪＩＳＸ０２０８コードで格納される。

【００３１】図６は第１の実施例によるＤＩＣの構成を
示した図である。ＤＩＣ２−１の構成はインデツクス部
と本体部とに分かれている。本体部には、単語が読みの
昇順にソートされて（いわゆる辞書式配列で）格納され
る。従つて、読みの先頭が同じ単語（例えば、読みが
『き』で始まる単語）は固まった領域に格納される（こ
れを同一先頭読みのブロツクと呼ぶ）。

【００３２】またインデツクス部は、同一先頭読みのブ
ロツクに対して、その先頭アドレスを、各先頭読みごと
に記憶する。例えば、先頭読みが『あ』であるブロツク
のアドレス、先頭読みが『い』であるブロツクのアドレ
ス等を『ぁ』〜『ん』に対して記憶する。

【００３３】本体部は「読み」、「表記」、「詳細情
報」のフイールドから構成され、「読み」には単語の読
み、「表記」には単語の表記、「詳細情報」には単語の
品詞などが格納される。

【００３４】図７は第１の実施例によるＵＳＲＤの構成
を示した図である。ＵＳＲＤ３−５は、ＤＩＣ２−１と
同様の構成を有しており、オペレータ特有の単語を記憶
するための辞書である。内容は書き換え可能にするため
ＲＡＭ３上に配置される。オペレータの登録に応じて内
容が更新され、オペレータが分割して変換した複合語も
この登録単語辞書に登録される。

【００３５】また、オペレータが無変換した仮名文字列
もこのＵＳＲＤ３−５に登録され、その結果、無変換文
字列の学習機能が実現されている。

【００３６】なお、複合語の登録の際表記として完全な
文字列を登録するのではなく、ＤＩＣ２−１へのアドレ
ス（ポインタ）を登録し、仮名漢字変換時にそのポイン
タをたどることにより変換するようにしている。これに
より、表記を記憶するためのメモリを削減することがで
きる。例えば、複合語『振興会館』に対してはその字面
を表記として登録するのではなく、『振興』のアドレス
と『会館』のアドレスを記憶する。

【００３７】図８は第１の実施例によるＡＭＥＭの構成
を示した図である。

【００３８】ＡＭＥＭ３−４には、単語を変換する度
に、変換した単語の辞書上でのアドレスが頻度と共に登
録され、アドレスは上から順番に登録される。従つて最
新に登録されたアドレスは最も上位に存在するアドレス
である。

【００３９】短縮変換時にはこのＡＭＥＭ３−４内がサ
ーチされ、入力された先頭読みに対応するアドレス範囲
に入ったもののみが抽出され、そのうち、最も上位に登
録されているものが第１候補として変換される。

【００４０】頻度は最初にアドレスが登録するときに０
が設定され、使用されるたびにカウントアツプする。

【００４１】図９は第１の実施例によるＫＡＮＢＵＦの
構成を示した図である。

【００４２】ＫＡＮＢＵＦ３−６は複合語を構成し得る
単語が連続して変換されるかぎり、変換された単語のア
ドレス、及び個数を保持する。新しい単語がＫＡＮＢＵ
Ｆ３−６に登録されたとき、その内容に基づき、複合語
が登録単語辞書に登録される。複合語がとぎれたと解釈
されたとき、ＫＡＮＢＵＦ３−６の内容はクリアされ
る。

【００４３】例えば、『機械』、『振興』、『会館』と
連続的に変換されているときは『機械』のアドレス、
『振興』のアドレス、『会館』のアドレス、及び個数＝
３が記憶される。

【００４４】次に、上述の動作をフローに従つて説明す
る。

【００４５】図１０は第１の実施例によるキー入力を取
り込んで処理を行なう動作を説明するフローチヤートで
ある。

【００４６】ステツプ１０−１において、変換結果、同
音語情報が設定されているかどうかを示す『変換フラ
グ』をＯＦＦにリセツトする。ステツプ１０−２０にお
いて、ＫＡＮＢＵＦ３−６をクリアする。ステツプ１０
−２において、キーボードから打鍵されるキーデータを
取り込む。ステツプ１０−３において、取り込まれたキ
ーの種別を判定する。判定結果に応じて、各キーの処理
ルーチンに分岐する。変換キーであつたときはステツプ
１０−６、無変換キーであつたときはステツプ１０−１
２、読みキーであつたときはステツプ１０−４、その他
のキーであつたときはステツプ１０−１４にそれぞれ分
岐する。

【００４７】ステツプ１０−３において読みキーがきた
ときは、ステツプ１０−４において、まず変換フラグが
ＯＮであるかどうか判定する。読みの入力中であれば変
換フラグがＯＦＦであるので、ステツプ１０−５に進
み、ＹＢＵＦ３−１に今入力されたキーを追加する。ス
テツプ１０−４において変換フラグがＯＮのときは変換
結果が存在するので、その確定を行なうためにステツプ
１０−１５に分岐する。ステツプ１０−３において変換
キーがきたときは、ステツプ１０−６において、まず変
換フラグがＯＮであるかどうか判定する。変換フラグが
ＯＦＦのときはステツプ１０−７に進み、ＹＢＵＦ３−
１に格納されている読みが１文字であるかどうか判定す
る。読みが１文字以上のときは通常の仮名漢字変換を行
なうためにステツプ１０−８に分岐し、ＳＴＢＵＦ３−
２，ＤＯＢＵＦ３−３に出力文字列、同音語情報を設定
した後、ステツプ１０−１０に進み、変換フラグをＯＮ
して、ステツプ１０−２にループする。

【００４８】ステツプ１０−７において読み１文字であ
つたときは、ステツプ１０−９に分岐し図１２に詳述す
る短縮変換処理を行ない、ＳＴＢＵＦ３−２，ＤＯＢＵ
Ｆ３−３に出力文字列、同音語情報を設定する。更にス
テツプ１０−１０に進んで変換フラグをＯＮし、ステツ
プ１０−２にループする。

【００４９】ステツプ１０−６において変換フラグがＯ
Ｎのときはすでに変換結果があるのでステツプ１０−１
１に分岐して図１１に詳述する次候補処理を行なう。そ
の後、ステツプ１０−２にループする。

【００５０】ステツプ１０−３において無変換キーがき
たときは、ステツプ１０−１２において無変換の処理を
行ない、次いでステツプ１０−１３において図１３に詳
述する読み学習処理を行なう。その後、ステツプ１０−
１０に進んで変換フラグをＯＮし、ステツプ１０−２に
ループする。

【００５１】ステツプ１０−３においてその他のキーが
きたときは、ステツプ１０−１４において変換フラグが
ＯＮかどうか判定する。ＯＮのときはステツプ１０−１
５に分岐し、出力文字列バツフアの内容を実際の文章上
に出力する。その後、ステツプ１０−１６において変換
フラグをＯＦＦする。次いで、ステツプ１０−１９にお
いて打鍵されたキーが句読点等の区切り記号であるかど
うかを判定し、区切記号のときは区切フラグをＯＮし、
そうでないときは区切フラグをＯＦＦする。更にステツ
プ１０−１７において図１４に詳述するように短縮デー
タ登録処理を行なう。その後、取り込んだキーをもう一
度処理するため、ステツプ１０−３にループする。

【００５２】ステツプ１０−１４において変換フラグが
ＯＦＦであつたときは、変換結果がなかつた場合なの
で、そのままステツプ１０−１８に進み、その他の処理
を行なう。その後、ステツプ１０−２にループする。

【００５３】図１１は第１の実施例によるステツプ１０
−１１の「次候補処理」を詳細に説明するフローチヤー
トである。

【００５４】ステツプ１１−１において、同音語バツフ
ア中の候補番号が候補数と等しくなつているかどうか判
定する。等しいときはステツプ１１−３に進んで候補番
号を１にリセツトし、等しくないときはステツプ１１−
２において候補番号の値を＋１する。

【００５５】次候補の結果、候補が変更されているの
で、ステツプ１１−４においてＳＴＢＵＦ３−２にその
時点の候補の文字列を設定する。

【００５６】図１２は第１の実施例によるステツプ１０
−９の「短縮変換処理」を詳細に説明するフローチヤー
トである。

【００５７】ステツプ１２−１において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課，
火，可，蚊などを変換する。変換の結果、ＳＴＢＵＦ３
−２、ＤＯＢＵＦ３−３が設定される。ここで作成され
たＤＯＢＵＦ３−３に更に短縮変換の単語が追加される
ことになる。

【００５８】ステツプ１２−２において、入力読み（１
文字）に対してＤＩＣ２−１及びＵＳＲＤ３−５のイン
デツクス部を参照することにより、その入力読みが先頭
読みとなる単語の存在する範囲（アドレス範囲）を求め
る。例えば、入力『き』であれば、『き』のインデツク
スと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの２つのアドレスの間にあるはず
である。

【００５９】ステツプ１２−３において、ＡＭＥＭ３−
４内をサーチ、上記求めたアドレス範囲に入るものをリ
ストアツプする。なお、この処理はＡＭＥＭ３−４全体
をサーチするのであるから比較的処理時間がかかるとい
える。しかし、トータルの処理時間として考えると、ｎ
文字の読みを仮名漢字変換する時間に比べれば、この処
理のオーバヘツドは無視できる。

【００６０】ステツプ１２−４において、上記リストア
ツプしたものをＡＭＥＭ３−４上で上位にあるものがＤ
ＯＢＵＦ３−３の先頭となるように追加ていく。候補番
号を１に設定し、ＡＭＥＭ３−４上で最上位にある短縮
変換の単語が最上位に表示されるようにする。ステツプ
１２−５において、ＳＴＢＵＦ３−２に候補番号の表記
（すなわち、第１候補の表記）を設定し、リターンす
る。

【００６１】図１３は第１の実施例によるステツプ１０
−１３の「読み学習処理」を詳細に説明するフローチヤ
ートである。

【００６２】ステツプ１３−１において、無変換された
仮名文字列に対して、それが読みかつ表記である単語を
ＵＳＲＤ３−５に登録する。ステツプ１３−２におい
て、登録の結果、ＵＳＲＤ３−５内の単語の位置がすれ
るので、ＡＭＥＭ３−４内に格納されているアドレス情
報の値を補正する。ステツプ１３−３において、無変換
された仮名文字列を『読み』かつ『表記』とし、『アド
レス』としてＵＳＲＤ３−５に登録された単語のアドレ
スを持ち、候補数＝１，候補番号＝１であるＤＯＢＵＦ
３−３を作成する。ステツプ１３−４において、無変換
された仮名文字列をＳＴＢＵＦ３−２に設定しリターン
する。

【００６３】図１４は第１の実施例によるステツプ１０
−１７の「短縮データ登録」を詳細に説明するフローチ
ヤートである。

【００６４】ステツプ１４−１において、ＤＯＢＵＦ３
−３より候補番号の単語のアドレスを取得する。ステツ
プ１４−２において、上記のアドレスを後述の図１５に
詳述するように、ＡＭＥＭ３−４に登録する。

【００６５】ステツプ１４−３において、変換した単語
が名詞またはサ変名詞であるかどうか判定する。名詞で
もサ変名詞でもないときは複合語は構成しないと判定
し、ステツプ１４−１０に分岐し、ＫＡＮＢＵＦ３−６
をクリアしてリターンする。

【００６６】名詞またはサ変名詞が変換されたときは、
ステツプ１４−４において、ＫＡＮＢＵＦ３−６に変換
された単語のアドレスを追加する。ステツプ１４−５に
おいてＫＡＮＢＵＦ３−６に登録されている単語が１単
語のみであるかどうかを判定する。１単語のみのときは
複合語の登録処理は行なわず、リターンする。

【００６７】ステツプ１４−６においてＫＡＮＢＵＦ３
−６に登録されている複合語をＵＳＲＤ３−５に登録す
る。その際の読みは複合語を構成する各単語の読みを連
接したものである。また、表記としては、ＤＩＣ２−１
の単語のみから構成される複合語の場合は、各単語のア
ドレスを連続して登録する。ＤＩＣ２−１以外の単語が
含まれるときは完全な表記を合成し登録する。また、品
詞は末尾の単語の品詞を指定する。

【００６８】ステツプ１４−７において、上記登録され
た複合語のアドレスを指定して後述の図１５に詳述する
ようにＡＭＥＭ３−４に登録する。ステツプ１４−８に
おいて、区切フラグがＯＮであるかどうか判定する。Ｏ
Ｎのときは、ステツプ１４−１０においてＡＭＥＭ３−
４をクリアし、リターンする。ＯＦＦのときはステツプ
１４−９において、今回変換した単語に送りがな（付属
語）が存在するかどうか判定し、存在するときは、ステ
ツプ１４−１０においてＫＡＮＢＵＦ３−６をクリア
し、リターンする。送りがながなかつたときはＫＡＮＢ
ＵＦ３−６の内容はそのままにしてリターンする。

【００６９】図１５は第１の実施例によるステツプ１４
−２，１４−７の「短縮メモリに登録」を詳細に説明す
るフローチヤートである。

【００７０】ステツプ１５−１において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をＤＩＣ２−１及びＵＳＲＤ３−５のインデツクス部
（図６，図７）を参照することにより求める。ステツプ
１５−２において、短縮メモリをサーチし、ステツプ１
５−１で求めたアドレス範囲内に入るアドレスを抽出す
る。ステツプ１５−３において、上記抽出されたアドレ
スに、指定されたアドレスと同一のものがあれば、ステ
ツプ１５−６において、その同一アドレスをＡＭＥＭ３
−４の先頭に移動し（すなわち、最新のアドレスとな
る）、リターンする。

【００７１】ステツプ１５−３において同一アドレスが
なかつたときは、ステツプ１５−４において、ＡＭＥＭ
３−４内に記憶される同一先頭読みの単語アドレスの上
限（ｎ）を越えているかどうか判定する。越えていると
きはステツプ１５−８に分岐し、同一先頭読みとなる単
語アドレスのうち、ＡＭＥＭ３−４の最も下位に登録さ
れているアドレスを削除し、ステツプ１５−９に分岐
し、アドレスをＡＭＥＭ３−４の先頭に登録する。ステ
ツプ１５−４において、上限ｎを越えていなかつたとき
はステツプ１５−５において、ＡＭＥＭ３−４が一杯で
あるかどうか判定し、一杯のときはステツプ１５−７に
おいてＡＭＥＭ３−４最下位のアドレスを削除する。そ
の後、ステツプ１５−９において、アドレスをＡＭＥＭ
３−４先頭に登録する。

【００７２】以上説明したように、第１の実施例によれ
ば、仮名漢字変換時に、分割して変換した単語が複合語
を構成し得るかどうか判定し、複合語と認められたとき
は、その全体をＵＳＲＤ３−５に登録し、更に、そのア
ドレスをＡＭＥＭ３−４に登録するので、次回に複合語
の先頭読みを指定して変換すれば、その先頭読みに対応
する複合語が変換できる。換言すれば、複合語に対して
も短縮変換ができ、操作性の高い、文字処理装置を実現
することができる。

【００７３】＜第２の実施例＞次に、第２の実施例を説
明する。

【００７４】前述の第１の実施例において、入力読みを
先頭読みとして持つ単語アドレスが複数個、ＡＭＥＭ３
−４に登録されているときは、最新に使用されたものを
優先的に変換するとしたが、本発明はこれに限定される
ものではなく、頻度順に変換するようにもできる。

【００７５】この場合には、前述の図１２，図１５のフ
ローチヤートを、それぞれ図１６，図１７のように変更
して得られる動作を行えば良い。尚、構成は同様のため
説明を省略し、以下の説明では、図１と同様のユニツト
には同一番号にダッシュ「’」を付加して示す。

【００７６】図１６は第２の実施例によるステツプ１０
−９の「短縮変換処理」を詳細に説明するフローチヤー
トである。

【００７７】ステツプ１６−１において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課，
火，可，蚊などを変換する。変換の結果、ＳＴＢＵＦ３
−２’、ＤＯＢＵＦ３−３’が設定される。ここで作成
されたＤＯＢＵＦ３−３’に更に短縮変換の単語が追加
されることになる。

【００７８】ステツプ１６−２において、入力読み（１
文字）に対してＤＩＣ２−１’及びＵＳＲＤ３−５’の
インデツクス部を参照することにより、その入力読みが
先頭読みとなる単語の存在する範囲（アドレス範囲）を
求める。例えば、入力『き』であれば、『き』のインデ
ツクスと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの２つのアドレスの間にあるはず
である。

【００７９】ステツプ１６−３において、ＡＭＥＭ３−
４’内をサーチ、上記求めたアドレス範囲に入るものを
リストアツプする。

【００８０】ステツプ１６−４において、上記リストア
ツプしたものを頻度が高いものが上位となるように、Ｄ
ＯＢＵＦ３−３’の先頭に追加ていく。候補番号を１に
設定し、短縮変換の単語で最も頻度が高いものが最上位
に表示されるようにする。

【００８１】ステツプ１６−５において、ＳＴＢＵＦ３
−２’に候補番号の表記（すなわち、第１候補の表記）
を設定し、リターンする。

【００８２】図１７は第２の実施例によるステツプ１４
−２，１４−７の「ＡＭＥＭ３−４’に登録」を詳細に
説明するフローチヤートである。

【００８３】ステツプ１７−１において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をＤＩＣ２−１’及びＵＳＲＤ３−５’のインデツクス
部を参照することにより求める。ステツプ１７−２にお
いて、ＡＭＥＭ３−４’をサーチし、ステツプ１７−１
で求めたアドレス範囲内に入るアドレスを抽出する。ス
テツプ１７−３において、上記抽出されたアドレスに、
指定されたアドレスと同一のものがあるかどうか判定す
る。同一のものがあれば、ステツプ１７−６において、
その同一アドレスをＡＭＥＭ３−４’の先頭に移動し
（すなわち、最新のアドレスとなる）、更に頻度を＋１
してリターンする。

【００８４】ステツプ１７−３において同一アドレスが
なかつたときは、ステツプ１７−４において、ＡＭＥＭ
３−４’内に記憶される同一先頭読みの単語アドレスの
上限（ｎ）を越えているかどうか判定する。越えている
ときはステツプ１７−８に分岐し、同一先頭読みとなる
単語アドレスのうち、頻度の最も低いアドレスを削除
し、ステツプ１７−９に分岐し、アドレスをＡＭＥＭ３
−４’の先頭に登録する。

【００８５】ステツプ１７−４において、上限ｎを越え
ていなかつたときはステツプ１７−５において、ＡＭＥ
Ｍ３−４’が一杯であるかどうか判定し、一杯のときは
ステツプ１７−７においてＡＭＥＭ３−４’最下位のア
ドレスを削減する。その後、ステツプ１７−９におい
て、アドレスを頻度＝０でＡＭＥＭの３−４’先頭に登
録する。

【００８６】また、以上の第１，第２の実施例の説明に
おいては、単語単位で変換することを想定しているが、
一括変換（連文節変換）に応用することも容易である。
その時は、変換された連文節が複合語を構成し得るかど
うかを判定し、複合語であると判定されれば、第１の実
施例と同様の方式で複合語をＵＳＲＤに登録し、そのア
ドレスを記憶することにより実現できる。

【００８７】また、以上の第１，第２の実施例の説明に
おいては、ＡＭＥＭにアドレスを記憶していたが、アド
レス以外でも単語のＤＩＣ上の位置を示す情報（例え
ば、単語番号等）であれば、同様の仕組みで実現でき
る。

【００８８】また、以上の第１，第２の実施例の説明に
おいては、先頭読みの１文字により短縮変換するように
したが、読みのプレフイツクスとなるｎ文字（例えば、
読み先頭の２文字）で短縮変換するように拡張すること
は容易である。例えば、読み先頭２文字による短縮変換
の場合は、ＤＩＣ、ＵＳＲＤのインデツクス部を読み２
文字に対して構成することにより実現できる。

【００８９】尚、本発明は、複数の機器から構成される
システムに適用しても、１つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによつて達成される場合にも適用で
きることは言うまでもない。

【００９０】

【発明の効果】以上の説明から明らかなように本発明に
よれば、複合語に対しても短縮変換ができ、操作性の高
い、文字処理装置を実現することができる。

【図面の簡単な説明】

【図１】本発明に係る文字処理装置の第１の実施例の構
成を示すブロツク図である。

【図２】第１の実施例による変換例を示した図である。

【図３】第１の実施例によるＹＢＵＦの構成を示す図で
ある。

【図４】第１の実施例によるＯＢＵＦの構成を示した図
である。

【図５】第１の実施例によるＤＯＢＵＦの構成を示した
図である。

【図６】第１の実施例によるＤＩＣの構成を示した図で
ある。

【図７】第１の実施例によるＵＳＲＤの構成を示した図
である。

【図８】第１の実施例によるＡＭＥＭの構成を示した図
である。

【図９】第１の実施例によるＫＡＮＢＵＦの構成を示し
た図である。

【図１０】第１の実施例によるキー入力を取り込んで処
理を行なう動作を説明するフローチヤートである。

【図１１】第１の実施例によるステツプ１０−１１の
「次候補処理」を詳細に説明するフローチヤートであ
る。

【図１２】第１の実施例によるステツプ１０−９の「短
縮変換処理」を詳細に説明するフローチヤートである。

【図１３】第１の実施例によるステツプ１０−１３の
「読み学習処理」を詳細に説明するフローチヤートであ
る。

【図１４】第１の実施例によるステツプ１０−１７の
「短縮データ登録」を詳細に説明するフローチヤートで
ある。

【図１５】第１の実施例によるステツプ１４−２，１４
−７の「短縮メモリに登録」を詳細に説明するフローチ
ヤートである。

【図１６】第２の実施例によるステツプ１０−９の「短
縮変換処理」を詳細に説明するフローチヤートである。

【図１７】第２の実施例によるステツプ１４−２，１４
−７の「短縮メモリに登録」を詳細に説明するフローチ
ヤートである。

【符号の説明】

１ＣＰＵ２ＲＯＭ２−１ＤＩＣ３ＲＡＭ３−１ＹＢＵＦ３−２ＳＴＢＵＦ３−３ＤＯＢＵＦ３−４ＡＭＥＭ３−５ＵＳＲＤ３−６ＫＡＮＢＵＦ４ＤＩＳＫ５ＫＢ６ＣＲ７ＤＢＵＦ８ＣＲＴＣ９ＣＲＴ１０ＣＧ

Claims

【特許請求の範囲】

【請求項１】予め単語を読みと表記との対応関係で記憶
する記憶手段を備えた文字処理装置において、少なくと
も１文字を含む文字列で読みを入力する入力手段と、前
記入力手段で入力した読みを前記記憶手段を用いて表記
に変換する変換手段と、前記変換手段で変換した表記の
前記記憶手段での位置情報を登録する登録手段と、前記
変換手段で変換した表記と前記登録手段で直前に登録し
た位置情報に対応した表記とを組み合わせた文字列が複
合語であるか否かを判断する判断手段と、前記判断手段
が複合語であると判断した場合、前記登録手段で直前に
登録した位置情報を前記複合語を構成する全単語の位置
情報に更新し、かつ、前記全単語の位置情報に対応させ
て前記複合語の読みを追加する更新手段と、前記入力手
段で短縮型の読みを入力したときに該短縮型の読みを含
む読みを有した複合語の各位置情報を前記登録手段で登
録した内容から検出する検出手段と、前記検出手段で検
出した各位置情報に対応した表記を前記記憶手段から読
み出して合成する合成手段とを備えることを特徴とする
文字処理装置。
【請求項２】前記検出手段は、前記短縮型の読みを前記
複合語の先頭部分の読みと照合する手段を含むことを特
徴とする請求項１記載の文字処理装置。
【請求項３】前記短縮型の読みは、前記複合語の先頭文
字からの読みの一部であることを特徴とする請求項２記
載の文字処理装置。