JPH056362A

JPH056362A - 文字処理装置

Info

Publication number: JPH056362A
Application number: JP3156506A
Authority: JP
Inventors: Eiichiro Toshima; 英一朗戸島
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1991-06-27
Filing date: 1991-06-27
Publication date: 1993-01-14

Abstract

(57)【要約】【目的】複合語に対しても短縮変換ができ、かつ、操作
性を向上することができる。【構成】ＫＢ（キーボード）５により少なくとも１文字
を含む文字列で読みを入力すると、ＣＰＵ１は、入力し
た読みをＤＩＣ２−１を用いて表記に変換し、変換した
表記のＤＩＣ２−１での位置情報をＲＡＭ３に登録し、
変換した表記が漢字以外の表記であり、かつ、直前に連
続して登録された位置情報が複数の単語の漢字列を示す
場合、漢字列を複合漢字列として、複合漢字列の位置情
報に複合漢字列の読みを対応させて再登録する。ＣＰＵ
１は、短縮型の読みを入力したときに短縮型の読みを含
む読みを有した複合漢字列の各位置情報をＲＡＭ３に登
録した内容から検出し、検出した各位置情報に対応した
表記をＤＩＣ２−１から読み出して合成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文字処理装置に関し、例
えば、単語と複合語の文字処理を行う文字処理装置に関
する。

【０００２】

【従来の技術】現在、日本ワードプロセツサなどの文字
処理装置は漢字仮名混じり文の入力を仮名漢字変換を使
って行なうことが一般的である。

【０００３】仮名漢字変換入力においては、キーボード
より入力したい日本文の読み列を入力し、それを装置に
仮名漢字変換させ、望む候補を選択することにより、目
的の漢字仮名混じり文を作成する。例えば、『機械』を
入力するためにはキーボードより『きかい』と打鍵し、
表示される候補『機械，機会，器械』などから目的の候
補である『機械』を選択する。

【０００４】ところで、通常の文章においては、特定の
単語が頻繁に登場する傾向が一般にある。従来、この点
に着目して、一度変換した単語に対しては、次回からそ
の先頭読みを指定して変換するだけで完全な単語が変換
されるように工夫した、いわゆる短縮変換という機構を
持つ装置が提案されている。この装置によると、例えば
『きかい』という読みを変換して『機械』を得た後、次
に『き』という読みだけを指定して変換すると『木』等
の候補に先んじて『機械』が変換される。

【０００５】ところが、従来考案されている短縮変換に
おいては『機械振興会館』のような複合語の入力におい
て問題があつた。例えば、『機械』『振興』『会館』と
単語に分割して入力した場合、『き』を変換しても『機
械』が変換されるだけである。『き』で『機械振興会
館』を変更するには最初に『きかいしんこうかいかん』
で『機械振興会館』を変換しておく必要があつた。

【０００６】

【発明が解決しようとしている課題】すなわち、従来装
置における短縮変換においては、単語単位の入力におい
て簡便になつているだけであり、複合語部分については
あらかじめ複合語単位で変換しておく等の工夫が必要で
るという欠点があつた。

【０００７】本発明は、上述した従来例の欠点に鑑みて
なされたものであり、その目的とするところは、複合語
に対しても短縮変換ができ、かつ、操作性を向上できる
文字処理装置を提供する点にある。

【０００８】

【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、本発明に係る文字処理装置は、予
め単語を読みと表記との対応関係で記憶する記憶手段を
備えた文字処理装置において、少なくとも１文字を含む
文字列で読みを入力する入力手段と、前記入力手段で入
力した読みを前記記憶手段を用いて表記に変換する変換
手段と、前記変換手段で変換した表記の前記記憶手段で
の位置情報を登録する登録手段と、前記変換手段で変換
した表記が漢字以外の表記であり、かつ、直前に前記登
録手段で連続して登録された位置情報が複数の単語の漢
字列を示す場合、前記登録手段において、前記漢字列を
複合漢字列として更新し、かつ、該複合漢字列に対応す
る読みを追加する更新手段と、前記入力手段で短縮型の
読みを入力したときに該短縮型の読みを含む読みを有し
た複合漢字列の各位置情報を前記登録手段で登録した内
容から検出する検出手段と、前記検出手段で検出した各
位置情報に対応した表記を前記記憶手段から読み出して
合成する合成手段とを備えることを特徴とする。

【０００９】

【作用】かかる構成によれば、入力手段は少なくとも１
文字を含む文字列で読みを入力し、変換手段は入力手段
で入力した読みを前記記憶手段を用いて表記に変換し、
登録手段は変換手段で変換した表記の記憶手段での位置
情報を登録し、変更手段は、変換手段で変換した表記が
漢字以外の表記であり、かつ、直前に登録手段で連続し
て登録された位置情報が複数の単語の漢字列を示す場
合、登録手段において、漢字列を複合漢字列として更新
し、かつ、複合漢字列に対応する読みを追加し、検出手
段は入力手段で短縮型の読みを入力したときに短縮型の
読みを含む読みを有した複合漢字列の各位置情報を登録
手段で登録した内容から検出し、合成手段は検出手段で
検出した各位置情報に対応した表記を記憶手段から読み
出して合成する。

【００１０】

【実施例】以下、添付図面を参照しながら本発明の一実
施例を詳細に説明する。

【００１１】＜第１の実施例＞図１は本発明に係る文字
処理装置の第１の実施例の構成を示すブロツク図であ
る。同図において、１はマイクロプロセツサで構成され
たＣＰＵで、文字処理のための演算，論理判断等を行な
い、アドレスバスＡＢ，コントロールバスＣＢ，データ
バスＤＢを介して、それらのバスに接続された各構成要
素を制御する。

【００１２】ＡＢはアドレスバスＡＢで、マイクロプロ
セツサＣＰＵの制御の対象とする構成要素を指示するア
ドレス信号を転送する。ＣＢはコントロールバスで、Ｃ
ＰＵ１の制御の対象とする各構成要素のコントロール信
号を転送して印加する。ＤＢはデータバスで、各構成機
器相互間のデータの転送を行なう。

【００１３】２は読み出し専用の固定メモリ（以下「Ｒ
ＯＭ」という）で、図１０〜図１５につき後述するＣＰ
Ｕ１による制御のためのプログラム等を予め記憶する。
２−１は仮名漢字変換を行なうための辞書（以下「ＤＩ
Ｃ」という）である。

【００１４】また、３は１ワード１６ビツトの構成の書
込み可能のランダムアクセスメモリ（以下「ＲＡＭ」と
いう）であつて、各構成要素からの各種データの一時記
憶に用いると同時に、ワークエリアとしても用いる。３
−１はキー入力されたキーデータを読み列として記憶す
る入力バツフア（以下「ＹＢＵＦ」という）であり、３
−２は仮名漢字変換された結果を記憶する出力文字列バ
ツフア（以下「ＳＴＢＵＦ」という）である。３−３は
出力文字列の同音語情報を記憶するための同音語バツフ
ア（以下「ＤＯＢＵＦ」という）である。３−４は短縮
変換のための情報を記憶する短縮メモリ（以下「ＡＭＥ
Ｍ「という）である。３−５はオペレータが自分に特有
の単語を登録する登録単語辞書（以下「ＵＳＲＤ」とい
う）である。３−６は連続する漢字列を記憶する連続漢
字列バツフア（以下「ＫＡＮＢＵＦ」という）である。

【００１５】５はキーボード（以下「ＫＢ」という）で
あつて、アルフアベツトキー，ひらかなキー，カタカナ
キー等の文字記号入力キー、及び変換キー，無変換キー
等の本文字処理装置に対する各種機能を指示するための
各種のフアンクシヨンキーを備えている。４は文書デー
タを記憶するための外部記憶装置（以下「ＤＩＳＫ」と
いう）であり、テキストバツフア上に作成された文書の
保管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。６はカーソルレジスタ（以
下「ＣＲ」という）であり、ＣＰＵ１により内容を読み
書きされる。後述するＣＲＴＣ（ＣＲＴコントローラ）
８は、ここに蓄えられたアドレスに対応するＣＲＴ９
（表示装置）上の位置にカーソルを表示する。７は表示
用バツフアメモリ（以下「ＤＢＵＦ」という）で、表示
すべきデータを蓄える。

【００１６】８はＣＲＴコントローラ（以下「ＣＲＴ
Ｃ」という）で、ＣＲ６及びＤＢＵＦ７に蓄えられた内
容を後述のＣＲＴ９に表示する役割を担う。９は陰極線
管等を用いた表示装置（以下「ＣＲＴ」という）であ
り、その表示するときのドツト構成の表示パターンおよ
びカーソルの表示をＣＲＴＣ８によって制御される。１
０はキヤラクタジエネレータ（以下「ＣＧ」という）で
あつて、ＣＲＴ９に表示する文字，記号のパターンを記
憶するものである。

【００１７】かかる各構成要素においては、ＫＢ５から
の各種の入力に応じて作動するものであつて、ＫＢ５か
らの入力が供給されると、まず、インタラプト信号がＣ
ＰＵ１に送られ、そのＣＰＵ１がＲＯＭ２内に記憶して
ある各種の制御信号を読出し、それらの制御信号に従つ
て各種の制御が行なわれる。

【００１８】図２は第１の実施例による変換例を示した
図である。

【００１９】同図において、（ａ）は読み『きかい』を
打鍵した状態を示している。その後変換キーを打鍵する
と、（ｂ）の画面になり、『機械』が変換される。この
段階では、次候補／前候補を見ることが可能であり、実
際には変換結果は文書中に出力されていない。

【００２０】次いで、読み『しんこう』を打鍵すると、
（ｃ）の画面になり、変換結果『機械』が実際に文書中
に出力され、ＡＭＥＭ３−４に『機械』のアドレスが記
憶される。その後変換キーを打鍵すると、（ｄ）の画面
になり『振興』が変換される。この段階では『振興』は
文書中に出力されていない。

【００２１】次いで、読み『かいかん』を打鍵すると、
（ｅ）の画面になり、変換結果『振興』が実際に文書中
に出力され、ＡＭＥＭ３−４に『振興』のアドレスが記
憶される。また、前回の変換は『機械』であるので、こ
の段階で複合語『機械振興』が自動登録され、そのアド
レスもＡＭＥＭ３−４に記憶される。その後変換キーを
打鍵すると、（ｆ）の画面になり『会館』が変換され
る。この段階では『会館』はまだ文書中には出力されて
いないが、無関係なキーの打鍵で変換結果『会館』が実
際に文書中に出力され、ＡＭＥＭ３−４に『振興』のア
ドレスが記憶され、かつ『機械振興会館』が複合語をな
すと解釈され、ＵＳＲＤ３−５に自動登録されそのアド
レスもＡＭＥＭ３−４に記憶される（ｇ）。

【００２２】次に読み『き』を入力し（ｈ）、変換キー
を打鍵すると、１文字の変換であるので、ＡＭＥＭ３−
４が検索され、これまでの操作で登録されている、『機
械振興会館』『機械振興』『機械』等のアドレスが見つ
かり、『機械振興会館』が第１候補として変換され、
（ｉ）の画面になる。

【００２３】このように、本装置においては、分割して
変換した複合語に対して、次回からはその複合語全体の
先頭の読み（例えば、『き』）を指定するだけで変換が
可能である。すなわち、複合語の短縮変換が可能であ
る。

【００２４】なお、本実施例においては、先頭の１文字
のみを指定して短縮するように構成しているが、読み先
頭部分の複数文字を指定による短縮変換も実現可能であ
る。そのような短縮変換においては、例えば『内閣総辞
職』を変換した後、『な』『ない』『ないか』等を指定
して変換させることになる。このような『な』『ない』
『ないか』等を元の完全な読み『ないかくそうじしょ
く』に対して『プレフイツクス』と呼ぶ。たとえば、
『きかい』は『機械振興会館（きかいしんこうかいか
ん）』のプレフイツクスであり、『いち』は『一目瞭然
（いちもくりょうぜん）』のプレフイツクスである。

【００２５】図３は第１の実施例によるＹＢＵＦの構成
を示す図である。同図において、ＹＢＵＦ３−１の最初
の２バイトはバツフアサイズ情報であり、同バツフアに
格納されている文字数から１を減じたものを２倍した数
値がバツフアサイズとして入る。ＹＢＵＦ３−１にはそ
の時点で未変換の読み列情報が記憶される。各文字は１
文字２バイトで構成され、一例としてＪＩＳＸ０２０８
コードで格納される。図４は第１の実施例によるＯＢＵ
Ｆの構成を示した図である。

【００２６】ＳＴＢＵＦ３−２の最初の２バイトはバツ
フアサイズ情報であり、同バツフアに格納されている文
字数から１を減じたものを２倍した数値がバツフアサイ
ズとして入る。仮名漢字変換が起動されると、ＳＴＢＵ
Ｆ３−２に変換結果が設定される。ただし、その時点で
表示されている候補の変換結果が記憶される。各文字は
１文字２バイトで構成され、ＪＩＳＸ０２０８コードで
格納される。

【００２７】図５は第１の実施例によるＤＯＢＵＦの構
成を示した図である。

【００２８】ＤＯＢＵＦ３−３には変換が起動される
と、その変換結果の同音語情報が設定される。候補数は
ＤＯＢＵＦ３−３に格納されている同音語候補の個数が
記憶される。候補番号は、その時点で表示されている候
補の番号が格納される。例えば、変換直後の状態では、
たいていの場合１が記憶されることになる。次候補表示
指示、前候補表示指示等が行なわれると、候補番号の値
は＋１、あるいは−１される。

【００２９】各単語はアドレスと表記が対応づけて記憶
される。アドレスには、その単語の辞書上での位置がア
ドレスで記憶される。表記はその単語の実際の表記であ
る。各用語の場合には活用した形態で記憶される。例え
ば、『歩いた』の場合、辞書上には語幹部の『歩』しか
記憶されないが、ＤＯＢＵＦ３−３上の表記の欄には
『歩いた』の形で記憶される。各文字は１文字２バイト
で構成され、ＪＩＳＸ０２０８コードで格納される。

【００３０】図６は第１の実施例によるＤＩＣの構成を
示した図である。ＤＩＣ２−１の構成はインデツクス部
と本体部とに分かれている。本体部には、単語が読みの
昇順にソートされて（いわゆる辞書式配列で）格納され
る。従つて、読みの先頭が同じ単語（例えば、読みが
『き』で始まる単語）は固まった領域に格納される（こ
れを同一先頭読みのブロツクと呼ぶ）。

【００３１】またインデツクス部は、同一先頭読みのブ
ロツクに対して、その先頭アドレスを、各先頭読みごと
に記憶する。例えば、先頭読みが『あ』であるブロツク
のアドレス、先頭読みが『い』であるブロツクのアドレ
ス等を『ぁ』〜『ん』に対して記憶する。

【００３２】本体部は「読み」、「表記」、「詳細情
報」のフイールドから構成され、「読み」には単語の読
み、「表記」には単語の表記、「詳細情報」には単語の
品詞などが格納される。

【００３３】図７は第１の実施例によるＵＳＲＤの構成
を示した図である。ＵＳＲＤ３−５は、ＤＩＣ２−１と
同様の構成を有しており、オペレータ特有の単語を記憶
するための辞書である。内容は書き換え可能にするため
ＲＡＭ３上に配置される。オペレータの登録に応じて内
容が更新され、オペレータが分割して変換した複合語も
この登録単語辞書に登録される。

【００３４】また、オペレータが無変換した仮名文字列
もこのＵＳＲＤ３−５に登録され、その結果、無変換文
字列の学習機能が実現されている。

【００３５】なお、複合語の登録の際表記として完全な
文字列を登録するのではなく、ＤＩＣ２−１へのアドレ
ス（ポインタ）を登録し、仮名漢字変換時にそのポイン
タをたどることにより変換するようにしている。これに
より、表記を記憶するためのメモリを削減することがで
きる。例えば、複合語『振興会館』に対してはその字面
を表記として登録するのではなく、『振興』のアドレス
と『会館』のアドレスを記憶する。

【００３６】図８は第１の実施例によるＡＭＥＭの構成
を示した図である。

【００３７】ＡＭＥＭ３−４には、単語を変換する度
に、変換した単語の辞書上でのアドレスが頻度と共に登
録され、アドレスは上から順番に登録される。従つて最
新に登録されたアドレスは最も上位に存在するアドレス
である。

【００３８】短縮変換時にはこのＡＭＥＭ３−４内がサ
ーチされ、入力された先頭読みに対応するアドレス範囲
に入ったもののみが抽出され、そのうち、最も上位に登
録されているものが第１候補として変換される。

【００３９】頻度は最初にアドレスが登録するときに０
が設定され、使用されるたびにカウントアツプする。

【００４０】図９は第１の実施例によるＫＡＮＢＵＦの
構成を示した図である。

【００４１】ＫＡＮＢＵＦ３−６は複合語を構成し得る
単語が連続して変換されるかぎり、変換された単語のア
ドレス、及び個数を保持する。新しい単語がＫＡＮＢＵ
Ｆ３−６に登録されたとき、その内容に基づき、複合語
がＵＳＲＤ３−５に登録される。複合語がとぎれたと解
釈されたとき、ＫＡＮＢＵＦ３−６の内容はクリアされ
る。

【００４２】例えば、『機械』、『振興』、『会館』と
連続的に変換されているときは『機械』のアドレス、
『振興』のアドレス、『会館』のアドレス、及び個数＝
３が記憶される。

【００４３】次に、上述の動作をフローに従つて説明す
る。

【００４４】図１０は第１の実施例によるキー入力を取
り込んで処理を行なう動作を説明するフローチヤートで
ある。

【００４５】ステツプ１０−１において、変換結果、同
音語情報が設定されているかどうかを示す『変換フラ
グ』をＯＦＦにリセツトする。ステツプ１０−２０にお
いて、ＫＡＮＢＵＦ３−６をクリアする。ステツプ１０
−２において、キーボードから打鍵されるキーデータを
取り込む。ステツプ１０−３において、取り込まれたキ
ーの種別を判定する。判定結果に応じて、各キーの処理
ルーチンに分岐する。変換キーであつたときはステツプ
１０−６、無変換キーであつたときはステツプ１０−１
２、読みキーであつたときはステツプ１０−４、その他
のキーであつたときはステツプ１０−１４にそれぞれ分
岐する。

【００４６】ステツプ１０−３において読みキーがきた
ときは、ステツプ１０−４において、まず変換フラグが
ＯＮであるかどうか判定する。読みの入力中であれば変
換フラグがＯＦＦであるので、ステツプ１０−５に進
み、ＹＢＵＦ３−１に今入力されたキーを追加する。ス
テツプ１０−４において変換フラグがＯＮのときは変換
結果が存在するので、その確定を行なうためにステツプ
１０−１５に分岐する。ステツプ１０−３において変換
キーがきたときは、ステツプ１０−６において、まず変
換フラグがＯＮであるかどうか判定する。変換フラグが
ＯＦＦのときはステツプ１０−７に進み、ＹＢＵＦ３−
１に格納されている読みが１文字であるかどうか判定す
る。読みが１文字以上のときは通常の仮名漢字変換を行
なうためにステツプ１０−８に分岐し、ＳＴＢＵＦ３−
２，ＤＯＢＵＦ３−３に出力文字列、同音語情報を設定
した後、ステツプ１０−１０に進み、変換フラグをＯＮ
して、ステツプ１０−２にループする。

【００４７】ステツプ１０−７において読み１文字であ
つたときは、ステツプ１０−９に分岐し図１２に詳述す
る短縮変換処理を行ない、ＳＴＢＵＦ３−２，ＤＯＢＵ
Ｆ３−３に出力文字列、同音語情報を設定する。更にス
テツプ１０−１０に進んで変換フラグをＯＮし、ステツ
プ１０−２にループする。

【００４８】ステツプ１０−６において変換フラグがＯ
Ｎのときはすでに変換結果があるのでステツプ１０−１
１に分岐して図１１に詳述する次候補処理を行なう。そ
の後、ステツプ１０−２にループする。

【００４９】ステツプ１０−３において無変換キーがき
たときは、ステツプ１０−１２において無変換の処理を
行ない、次いでステツプ１０−１３において図１３に詳
述する読み学習処理を行なう。その後、ステツプ１０−
１０に進んで変換フラグをＯＮし、ステツプ１０−２に
ループする。

【００５０】ステツプ１０−３においてその他のキーが
きたときは、ステツプ１０−１４において変換フラグが
ＯＮかどうか判定する。ＯＮのときはステツプ１０−１
５に分岐し、ＳＴＢＵＦ３−２の内容を実際の文章上に
出力する。その後、ステツプ１０−１６において変換フ
ラグをＯＦＦする。次いで、ステツプ１０−１９におい
て打鍵されたキーが句読点等の区切り記号であるかどう
かを判定し、区切記号のときは区切フラグをＯＮし、そ
うでないときは区切フラグをＯＦＦする。更にステツプ
１０−１７において図１４に詳述するように短縮データ
登録処理を行なう。その後、取り込んだキーをもう一度
処理するため、ステツプ１０−３にループする。

【００５１】ステツプ１０−１４において変換フラグが
ＯＦＦであつたときは、変換結果がなかつた場合なの
で、そのままステツプ１０−１８に進み、その他の処理
を行なう。その後、ステツプ１０−２にループする。

【００５２】図１１は第１の実施例によるステツプ１０
−１１の「次候補処理」を詳細に説明するフローチヤー
トである。

【００５３】ステツプ１１−１において、ＤＯＢＵＦ３
−３中の候補番号が候補数と等しくなつているかどうか
判定する。等しいときはステツプ１１−３に進んで候補
番号を１にリセツトし、等しくないときはステツプ１１
−２において候補番号の値を＋１する。

【００５４】次候補の結果、候補が変更されているの
で、ステツプ１１−４においてＳＴＢＵＦ３−２にその
時点の候補の文字列を設定する。

【００５５】図１２は第１の実施例によるステツプ１０
−９の「短縮変換処理」を詳細に説明するフローチヤー
トである。

【００５６】ステツプ１２−１において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課，
火，可，蚊などを変換する。変換の結果、ＳＴＢＵＦ３
−２、ＤＯＢＵＦ３−３が設定される。ここで作成され
たＤＯＢＵＦ３−３に更に短縮変換の単語が追加される
ことになる。

【００５７】ステツプ１２−２において、入力読み（１
文字）に対してＤＩＣ２−１及びＵＳＲＤ３−５のイン
デツクス部を参照することにより、その入力読みが先頭
読みとなる単語の存在する範囲（アドレス範囲）を求め
る。例えば、入力『き』であれば、『き』のインデツク
スと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの２つのアドレスの間にあるはず
である。

【００５８】ステツプ１２−３において、ＡＭＥＭ３−
４内をサーチ、上記求めたアドレス範囲に入るものをリ
ストアツプする。なお、この処理はＡＭＥＭ３−４全体
をサーチするのであるから比較的処理時間がかかるとい
える。しかし、トータルの処理時間として考えると、ｎ
文字の読みを仮名漢字変換する時間に比べれば、この処
理のオーバヘツドは無視できる。

【００５９】ステツプ１２−４において、上記リストア
ツプしたものをＡＭＥＭ３−４上で上位にあるものがＤ
ＯＢＵＦ３−３の先頭となるように追加ていく。候補番
号を１に設定し、ＡＭＥＭ３−４上で最上位にある短縮
変換の単語が最上位に表示されるようにする。ステツプ
１２−５において、ＳＴＢＵＦ３−２に候補番号の表記
（すなわち、第１候補の表記）を設定し、リターンす
る。

【００６０】図１３は第１の実施例によるステツプ１０
−１３の「読み学習処理」を詳細に説明するフローチヤ
ートである。

【００６１】ステツプ１３−１において、無変換された
仮名文字列に対して、それが読みかつ表記である単語を
ＵＳＲＤ３−５に登録する。ステツプ１３−２におい
て、登録の結果、ＵＳＲＤ３−５内の単語の位置がすれ
るので、ＡＭＥＭ３−４内に格納されているアドレス情
報の値を補正する。ステツプ１３−３において、無変換
された仮名文字列を『読み』かつ『表記』とし、『アド
レス』としてＵＳＲＤ３−５に登録された単語のアドレ
スを持ち、候補数＝１，候補番号＝１であるＤＯＢＵＦ
３−３を作成する。ステツプ１３−４において、無変換
された仮名文字列をＳＴＢＵＦ３−２に設定しリターン
する。

【００６２】図１４は第１の実施例によるステツプ１０
−１７の「短縮データ登録」を詳細に説明するフローチ
ヤートである。

【００６３】ステツプ１４−１において、ＤＯＢＵＦ３
−３より候補番号の単語のアドレスを取得する。ステツ
プ１４−２において、上記のアドレスを後述の図１５に
詳述するように、ＡＭＥＭ３−４に登録する。

【００６４】ステツプ１４−３において、変換した単語
が漢字のみからなるかどうかを判定する。仮名文字等が
含まれるときにはステツプ１４−１０に分岐し、ＫＡＮ
ＢＵＦ３−６をクリアしてリターンする。

【００６５】漢字のみからなる語が変換されたときは、
ステツプ１４−４において、ＫＡＮＢＵＦ３−６に変換
された単語のアドレスを追加する。ステツプ１４−５に
おいてＫＡＮＢＵＦ３−６に登録されている単語が１単
語のみであるかどうかを判定する。１単語のみのときは
複合語の登録処理は行なわず、リターンする。

【００６６】ステツプ１４−６においてＫＡＮＢＵＦ３
−６に登録されている複合語をＵＳＲＤ３−５に登録す
る。その際の読みは複合語を構成する各単語の読みを連
接したものである。また、表記としては、ＤＩＣ２−１
の単語のみから構成される複合語の場合は、各単語のア
ドレスを連続して登録する。ＤＩＣ２−１以外の単語が
含まれるときは完全な表記を合成し登録する。また、品
詞は末尾の単語の品詞を指定する。

【００６７】ステツプ１４−７において、上記登録され
た複合語のアドレスを指定して後述の図１５に詳述する
ようにＡＭＥＭ３−４に登録する。ステツプ１４−８に
おいて、区切フラグがＯＮであるかどうか判定する。Ｏ
Ｎのときは、ステツプ１４−１０においてＡＭＥＭ３−
４をクリアし、リターンする。ＯＦＦのときはステツプ
１４−９において、今回変換した単語に送りがな（付属
語）が存在するかどうか判定し、存在するときは、ステ
ツプ１４−１０においてＫＡＮＢＵＦ３−６をクリア
し、リターンする。送りがながなかつたときはＫＡＮＢ
ＵＦ３−６の内容はそのままにしてリターンする。

【００６８】図１５は第１の実施例によるステツプ１４
−２，１４−７の「ＡＭＥＭ３−４に登録」を詳細に説
明するフローチヤートである。

【００６９】ステツプ１５−１において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をＤＩＣ２−１及びＵＳＲＤ３−５のインデツクス部
（図６，図７）を参照することにより求める。ステツプ
１５−２において、ＡＭＥＭ３−４をサーチし、ステツ
プ１５−１で求めたアドレス範囲内に入るアドレスを抽
出する。ステツプ１５−３において、上記抽出されたア
ドレスに、指定されたアドレスと同一のものがあれば、
ステツプ１５−６において、その同一アドレスをＡＭＥ
Ｍ３−４の先頭に移動し（すなわち、最新のアドレスと
なる）、リターンする。

【００７０】ステツプ１５−３において同一アドレスが
なかつたときは、ステツプ１５−４において、ＡＭＥＭ
３−４内に記憶される同一先頭読みの単語アドレスの上
限（ｎ）を越えているかどうか判定する。越えていると
きはステツプ１５−８に分岐し、同一先頭読みとなる単
語アドレスのうち、ＡＭＥＭ３−４の最も下位に登録さ
れているアドレスを削除し、ステツプ１５−９に分岐
し、アドレスをＡＭＥＭ３−４の先頭に登録する。ステ
ツプ１５−４において、上限ｎを越えていなかつたとき
はステツプ１５−５において、ＡＭＥＭ３−４が一杯で
あるかどうか判定し、一杯のときはステツプ１５−７に
おいてＡＭＥＭ３−４最下位のアドレスを削除する。そ
の後、ステツプ１５−９において、アドレスをＡＭＥＭ
３−４先頭に登録する。

【００７１】以上説明したように、第１の実施例によれ
ば、仮名漢字変換時に、分割して変換した単語が漢字の
みからなるかを判定し、漢字以外を含む単語を変換した
とき、あるいは、句読点等の区切信号を打鍵したときに
複合語の終了と判断し、その点までに変換した単語の全
体を複合語としてＵＳＲＤ３−５に登録し、更に、その
アドレスをＡＭＥＭ３−４に登録するので、次回に複合
語の先頭読みを指定して変換すれば、その先頭読みに対
応する複合語が変換できる。換言すれば、複合語に対し
ても短縮変換ができ、操作性の高い、文字処理装置を実
現することができる。

【００７２】＜第２の実施例＞次に、第２の実施例を説
明する。

【００７３】前述の第１の実施例において、入力読みを
先頭読みとして持つ単語アドレスが複数個、ＡＭＥＭ３
−４に登録されているときは、最新に使用されたものを
優先的に変換するとしたが、本発明はこれに限定される
ものではなく、頻度順に変換するようにもできる。

【００７４】この場合には、前述の図１２，図１５のフ
ローチヤートを、それぞれ図１６，図１７のように変更
して得られる動作を行えば良い。尚、構成は同様のため
説明を省略し、以下の説明では、図１と同様のユニツト
には同一番号にダッシュ「’」を付加して示す。

【００７５】図１６は第２の実施例によるステツプ１０
−９の「短縮変換処理」を詳細に説明するフローチヤー
トである。

【００７６】ステツプ１６−１において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課，
火，可，蚊などを変換する。変換の結果、ＳＴＢＵＦ３
−２’、ＤＯＢＵＦ３−３’が設定される。ここで作成
されたＤＯＢＵＦ３−３’に更に短縮変換の単語が追加
されることになる。

【００７７】ステツプ１６−２において、入力読み（１
文字）に対してＤＩＣ２−１’及びＵＳＲＤ３−５’の
インデツクス部を参照することにより、その入力読みが
先頭読みとなる単語の存在する範囲（アドレス範囲）を
求める。例えば、入力『き』であれば、『き』のインデ
ツクスと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの２つのアドレスの間にあるはず
である。

【００７８】ステツプ１６−３において、ＡＭＥＭ３−
４’内をサーチ、上記求めたアドレス範囲に入るものを
リストアツプする。

【００７９】ステツプ１６−４において、上記リストア
ツプしたものを頻度が高いものが上位となるように、Ｄ
ＯＢＵＦ３−３’の先頭に追加ていく。候補番号を１に
設定し、短縮変換の単語で最も頻度が高いものが最上位
に表示されるようにする。

【００８０】ステツプ１６−５において、ＳＴＢＵＦ３
−２’に候補番号の表記（すなわち、第１候補の表記）
を設定し、リターンする。

【００８１】図１７は第２の実施例によるステツプ１４
−２，１４−７の「ＡＭＥＭに登録」を詳細に説明する
フローチヤートである。

【００８２】ステツプ１７−１において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をＤＩＣ２−１’及びＵＳＲＤ３−５’のインデツクス
部を参照することにより求める。ステツプ１７−２にお
いて、ＡＭＥＭ３−４’をサーチし、ステツプ１７−１
で求めたアドレス範囲内に入るアドレスを抽出する。ス
テツプ１７−３において、上記抽出されたアドレスに、
指定されたアドレスと同一のものがあるかどうか判定す
る。同一のものがあれば、ステツプ１７−６において、
その同一アドレスをＡＭＥＭ３−４’の先頭に移動し
（すなわち、最新のアドレスとなる）、更に頻度を＋１
してリターンする。

【００８３】ステツプ１７−３において同一アドレスが
なかつたときは、ステツプ１７−４において、ＡＭＥＭ
３−４’内に記憶される同一先頭読みの単語アドレスの
上限（ｎ）を越えているかどうか判定する。越えている
ときはステツプ１７−８に分岐し、同一先頭読みとなる
単語アドレスのうち、頻度の最も低いアドレスを削除
し、ステツプ１７−９に分岐し、アドレスをＡＭＥＭ３
−４’の先頭に登録する。

【００８４】ステツプ１７−４において、上限ｎを越え
ていなかつたときはステツプ１７−５において、ＡＭＥ
Ｍ３−４’が一杯であるかどうか判定し、一杯のときは
ステツプ１７−７においてＡＭＥＭ最下位のアドレスを
削減する。その後、ステツプ１７−９において、アドレ
スを頻度＝０でＡＭＥＭの３−４’先頭に登録する。

【００８５】また、以上の第１，第２の実施例の説明に
おいては、単語単位で変換することを想定しているが、
一括変換（連文節変換）に応用することも容易である。
その時は、変換された連文節がすべて漢字のみから構成
されれば、第１、第２の実施例と同様の方式で複合語と
してＵＳＲＤ３−５’に登録し、そのアドレスを記憶す
ることにより実現できる。

【００８６】また、以上の第１，第２の実施例の説明に
おいてはＡＭＥＭ３−４’にアドレスを記憶していた
が、アドレス以外でも単語の辞書上の位置を示す情報
（例えば、単語番号等）であれば、同様の仕組みで実現
できる。

【００８７】また、以上の第１，第２の実施例の説明に
おいては、先頭読みの１文字により短縮変換するように
したが、読みのプレフイツクスとなるｎ文字（例えば、
読み先頭の２文字）で短縮変換するように拡張すること
は容易である。例えば、読み先頭２文字による短縮変換
の場合は、ＤＩＣ２−１’、ＵＳＲＤ３−５’のインデ
ツクス部を読み２文字に対して構成することにより実現
できる。

【００８８】尚、本発明は、複数の機器から構成される
システムに適用しても、１つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによつて達成される場合にも適用で
きることは言うまでもない。

【００８９】

【発明の効果】以上の説明から明らかなように本発明に
よれば、複合語に対しても短縮変換ができ、操作性の高
い、文字処理装置を実現することができる。

【図面の簡単な説明】

【図１】本発明に係る文字処理装置の第１の実施例の構
成を示すブロツク図である。

【図２】第１の実施例による変換例を示した図である。

【図３】第１の実施例によるＹＢＵＦの構成を示す図で
ある。

【図４】第１の実施例によるＯＢＵＦの構成を示した図
である。

【図５】第１の実施例によるＤＯＢＵＦの構成を示した
図である。

【図６】第１の実施例によるＤＩＣの構成を示した図で
ある。

【図７】第１の実施例によるＵＳＲＤの構成を示した図
である。

【図８】第１の実施例によるＡＭＥＭの構成を示した図
である。

【図９】第１の実施例によるＫＡＮＢＵＦの構成を示し
た図である。

【図１０】第１の実施例によるキー入力を取り込んで処
理を行なう動作を説明するフローチヤートである。

【図１１】第１の実施例によるステツプ１０−１１の
「次候補処理」を詳細に説明するフローチヤートであ
る。

【図１２】第１の実施例によるステツプ１０−９の「短
縮変換処理」を詳細に説明するフローチヤートである。

【図１３】第１の実施例によるステツプ１０−１３の
「読み学習処理」を詳細に説明するフローチヤートであ
る。

【図１４】第１の実施例によるステツプ１０−１７の
「短縮データ登録」を詳細に説明するフローチヤートで
ある。

【図１５】第１の実施例によるステツプ１４−２，１４
−７の「ＡＭＥＭに登録」を詳細に説明するフローチヤ
ートである。

【図１６】第２の実施例によるステツプ１０−９の「短
縮変換処理」を詳細に説明するフローチヤートである。

【図１７】第２の実施例によるステツプ１４−２，１４
−７の「ＡＭＥＭに登録」を詳細に説明するフローチヤ
ートである。

【符号の説明】

１ＣＰＵ２ＲＯＭ２−１ＤＩＣ３ＲＡＭ３−１ＹＢＵＦ３−２ＳＴＢＵＦ３−３ＤＯＢＵＦ３−４ＡＭＥＭ３−５ＵＳＲＤ３−６ＫＡＮＢＵＦ４ＤＩＳＫ５ＫＢ６ＣＲ７ＤＢＵＦ８ＣＲＴＣ９ＣＲＴ１０ＣＧ

Claims

【特許請求の範囲】

【請求項１】予め単語を読みと表記との対応関係で記憶
する記憶手段を備えた文字処理装置において、少なくと
も１文字を含む文字列で読みを入力する入力手段と、前
記入力手段で入力した読みを前記記憶手段を用いて表記
に変換する変換手段と、前記変換手段で変換した表記の
前記記憶手段での位置情報を登録する登録手段と、前記
変換手段で変換した表記が漢字以外の表記であり、か
つ、直前に前記登録手段で連続して登録された位置情報
が複数の単語の漢字列を示す場合、前記登録手段におい
て、前記漢字列を複合漢字列として更新し、かつ、該複
合漢字列に対応する読みを追加する変更手段と、前記入
力手段で短縮型の読みを入力したときに該短縮型の読み
を含む読みを有した複合漢字列の各位置情報を前記登録
手段で登録した内容から検出する検出手段と、前記検出
手段で検出した各位置情報に対応した表記を前記記憶手
段から読み出して合成する合成手段とを備えることを特
徴とする文字処理装置。
【請求項２】前記検出手段は、前記短縮型の読みを前記
複合語の先頭部分の読みと照合する手段を含むことを特
徴とする請求項１記載の文字処理装置。
【請求項３】前記短縮型の読みは、前記複合語の先頭文
字からの読みの一部であることを特徴とする請求項２記
載の文字処理装置。