JPH056362A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH056362A
JPH056362A JP3156506A JP15650691A JPH056362A JP H056362 A JPH056362 A JP H056362A JP 3156506 A JP3156506 A JP 3156506A JP 15650691 A JP15650691 A JP 15650691A JP H056362 A JPH056362 A JP H056362A
Authority
JP
Japan
Prior art keywords
reading
word
kanji
conversion
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3156506A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3156506A priority Critical patent/JPH056362A/ja
Publication of JPH056362A publication Critical patent/JPH056362A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】複合語に対しても短縮変換ができ、かつ、操作
性を向上することができる。 【構成】KB(キーボード)5により少なくとも1文字
を含む文字列で読みを入力すると、CPU1は、入力し
た読みをDIC2−1を用いて表記に変換し、変換した
表記のDIC2−1での位置情報をRAM3に登録し、
変換した表記が漢字以外の表記であり、かつ、直前に連
続して登録された位置情報が複数の単語の漢字列を示す
場合、漢字列を複合漢字列として、複合漢字列の位置情
報に複合漢字列の読みを対応させて再登録する。CPU
1は、短縮型の読みを入力したときに短縮型の読みを含
む読みを有した複合漢字列の各位置情報をRAM3に登
録した内容から検出し、検出した各位置情報に対応した
表記をDIC2−1から読み出して合成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字処理装置に関し、例
えば、単語と複合語の文字処理を行う文字処理装置に関
する。
【0002】
【従来の技術】現在、日本ワードプロセツサなどの文字
処理装置は漢字仮名混じり文の入力を仮名漢字変換を使
って行なうことが一般的である。
【0003】仮名漢字変換入力においては、キーボード
より入力したい日本文の読み列を入力し、それを装置に
仮名漢字変換させ、望む候補を選択することにより、目
的の漢字仮名混じり文を作成する。例えば、『機械』を
入力するためにはキーボードより『きかい』と打鍵し、
表示される候補『機械,機会,器械』などから目的の候
補である『機械』を選択する。
【0004】ところで、通常の文章においては、特定の
単語が頻繁に登場する傾向が一般にある。従来、この点
に着目して、一度変換した単語に対しては、次回からそ
の先頭読みを指定して変換するだけで完全な単語が変換
されるように工夫した、いわゆる短縮変換という機構を
持つ装置が提案されている。この装置によると、例えば
『きかい』という読みを変換して『機械』を得た後、次
に『き』という読みだけを指定して変換すると『木』等
の候補に先んじて『機械』が変換される。
【0005】ところが、従来考案されている短縮変換に
おいては『機械振興会館』のような複合語の入力におい
て問題があつた。例えば、『機械』『振興』『会館』と
単語に分割して入力した場合、『き』を変換しても『機
械』が変換されるだけである。『き』で『機械振興会
館』を変更するには最初に『きかいしんこうかいかん』
で『機械振興会館』を変換しておく必要があつた。
【0006】
【発明が解決しようとしている課題】すなわち、従来装
置における短縮変換においては、単語単位の入力におい
て簡便になつているだけであり、複合語部分については
あらかじめ複合語単位で変換しておく等の工夫が必要で
るという欠点があつた。
【0007】本発明は、上述した従来例の欠点に鑑みて
なされたものであり、その目的とするところは、複合語
に対しても短縮変換ができ、かつ、操作性を向上できる
文字処理装置を提供する点にある。
【0008】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、本発明に係る文字処理装置は、予
め単語を読みと表記との対応関係で記憶する記憶手段を
備えた文字処理装置において、少なくとも1文字を含む
文字列で読みを入力する入力手段と、前記入力手段で入
力した読みを前記記憶手段を用いて表記に変換する変換
手段と、前記変換手段で変換した表記の前記記憶手段で
の位置情報を登録する登録手段と、前記変換手段で変換
した表記が漢字以外の表記であり、かつ、直前に前記登
録手段で連続して登録された位置情報が複数の単語の漢
字列を示す場合、前記登録手段において、前記漢字列を
複合漢字列として更新し、かつ、該複合漢字列に対応す
る読みを追加する更新手段と、前記入力手段で短縮型の
読みを入力したときに該短縮型の読みを含む読みを有し
た複合漢字列の各位置情報を前記登録手段で登録した内
容から検出する検出手段と、前記検出手段で検出した各
位置情報に対応した表記を前記記憶手段から読み出して
合成する合成手段とを備えることを特徴とする。
【0009】
【作用】かかる構成によれば、入力手段は少なくとも1
文字を含む文字列で読みを入力し、変換手段は入力手段
で入力した読みを前記記憶手段を用いて表記に変換し、
登録手段は変換手段で変換した表記の記憶手段での位置
情報を登録し、変更手段は、変換手段で変換した表記が
漢字以外の表記であり、かつ、直前に登録手段で連続し
て登録された位置情報が複数の単語の漢字列を示す場
合、登録手段において、漢字列を複合漢字列として更新
し、かつ、複合漢字列に対応する読みを追加し、検出手
段は入力手段で短縮型の読みを入力したときに短縮型の
読みを含む読みを有した複合漢字列の各位置情報を登録
手段で登録した内容から検出し、合成手段は検出手段で
検出した各位置情報に対応した表記を記憶手段から読み
出して合成する。
【0010】
【実施例】以下、添付図面を参照しながら本発明の一実
施例を詳細に説明する。
【0011】<第1の実施例>図1は本発明に係る文字
処理装置の第1の実施例の構成を示すブロツク図であ
る。同図において、1はマイクロプロセツサで構成され
たCPUで、文字処理のための演算,論理判断等を行な
い、アドレスバスAB,コントロールバスCB,データ
バスDBを介して、それらのバスに接続された各構成要
素を制御する。
【0012】ABはアドレスバスABで、マイクロプロ
セツサCPUの制御の対象とする構成要素を指示するア
ドレス信号を転送する。CBはコントロールバスで、C
PU1の制御の対象とする各構成要素のコントロール信
号を転送して印加する。DBはデータバスで、各構成機
器相互間のデータの転送を行なう。
【0013】2は読み出し専用の固定メモリ(以下「R
OM」という)で、図10〜図15につき後述するCP
U1による制御のためのプログラム等を予め記憶する。
2−1は仮名漢字変換を行なうための辞書(以下「DI
C」という)である。
【0014】また、3は1ワード16ビツトの構成の書
込み可能のランダムアクセスメモリ(以下「RAM」と
いう)であつて、各構成要素からの各種データの一時記
憶に用いると同時に、ワークエリアとしても用いる。3
−1はキー入力されたキーデータを読み列として記憶す
る入力バツフア(以下「YBUF」という)であり、3
−2は仮名漢字変換された結果を記憶する出力文字列バ
ツフア(以下「STBUF」という)である。3−3は
出力文字列の同音語情報を記憶するための同音語バツフ
ア(以下「DOBUF」という)である。3−4は短縮
変換のための情報を記憶する短縮メモリ(以下「AME
M「という)である。3−5はオペレータが自分に特有
の単語を登録する登録単語辞書(以下「USRD」とい
う)である。3−6は連続する漢字列を記憶する連続漢
字列バツフア(以下「KANBUF」という)である。
【0015】5はキーボード(以下「KB」という)で
あつて、アルフアベツトキー,ひらかなキー,カタカナ
キー等の文字記号入力キー、及び変換キー,無変換キー
等の本文字処理装置に対する各種機能を指示するための
各種のフアンクシヨンキーを備えている。4は文書デー
タを記憶するための外部記憶装置(以下「DISK」と
いう)であり、テキストバツフア上に作成された文書の
保管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。6はカーソルレジスタ(以
下「CR」という)であり、CPU1により内容を読み
書きされる。後述するCRTC(CRTコントローラ)
8は、ここに蓄えられたアドレスに対応するCRT9
(表示装置)上の位置にカーソルを表示する。7は表示
用バツフアメモリ(以下「DBUF」という)で、表示
すべきデータを蓄える。
【0016】8はCRTコントローラ(以下「CRT
C」という)で、CR6及びDBUF7に蓄えられた内
容を後述のCRT9に表示する役割を担う。9は陰極線
管等を用いた表示装置(以下「CRT」という)であ
り、その表示するときのドツト構成の表示パターンおよ
びカーソルの表示をCRTC8によって制御される。1
0はキヤラクタジエネレータ(以下「CG」という)で
あつて、CRT9に表示する文字,記号のパターンを記
憶するものである。
【0017】かかる各構成要素においては、KB5から
の各種の入力に応じて作動するものであつて、KB5か
らの入力が供給されると、まず、インタラプト信号がC
PU1に送られ、そのCPU1がROM2内に記憶して
ある各種の制御信号を読出し、それらの制御信号に従つ
て各種の制御が行なわれる。
【0018】図2は第1の実施例による変換例を示した
図である。
【0019】同図において、(a)は読み『きかい』を
打鍵した状態を示している。その後変換キーを打鍵する
と、(b)の画面になり、『機械』が変換される。この
段階では、次候補/前候補を見ることが可能であり、実
際には変換結果は文書中に出力されていない。
【0020】次いで、読み『しんこう』を打鍵すると、
(c)の画面になり、変換結果『機械』が実際に文書中
に出力され、AMEM3−4に『機械』のアドレスが記
憶される。その後変換キーを打鍵すると、(d)の画面
になり『振興』が変換される。この段階では『振興』は
文書中に出力されていない。
【0021】次いで、読み『かいかん』を打鍵すると、
(e)の画面になり、変換結果『振興』が実際に文書中
に出力され、AMEM3−4に『振興』のアドレスが記
憶される。また、前回の変換は『機械』であるので、こ
の段階で複合語『機械振興』が自動登録され、そのアド
レスもAMEM3−4に記憶される。その後変換キーを
打鍵すると、(f)の画面になり『会館』が変換され
る。この段階では『会館』はまだ文書中には出力されて
いないが、無関係なキーの打鍵で変換結果『会館』が実
際に文書中に出力され、AMEM3−4に『振興』のア
ドレスが記憶され、かつ『機械振興会館』が複合語をな
すと解釈され、USRD3−5に自動登録されそのアド
レスもAMEM3−4に記憶される(g)。
【0022】次に読み『き』を入力し(h)、変換キー
を打鍵すると、1文字の変換であるので、AMEM3−
4が検索され、これまでの操作で登録されている、『機
械振興会館』『機械振興』『機械』等のアドレスが見つ
かり、『機械振興会館』が第1候補として変換され、
(i)の画面になる。
【0023】このように、本装置においては、分割して
変換した複合語に対して、次回からはその複合語全体の
先頭の読み(例えば、『き』)を指定するだけで変換が
可能である。すなわち、複合語の短縮変換が可能であ
る。
【0024】なお、本実施例においては、先頭の1文字
のみを指定して短縮するように構成しているが、読み先
頭部分の複数文字を指定による短縮変換も実現可能であ
る。そのような短縮変換においては、例えば『内閣総辞
職』を変換した後、『な』『ない』『ないか』等を指定
して変換させることになる。このような『な』『ない』
『ないか』等を元の完全な読み『ないかくそうじしょ
く』に対して『プレフイツクス』と呼ぶ。たとえば、
『きかい』は『機械振興会館(きかいしんこうかいか
ん)』のプレフイツクスであり、『いち』は『一目瞭然
(いちもくりょうぜん)』のプレフイツクスである。
【0025】図3は第1の実施例によるYBUFの構成
を示す図である。同図において、YBUF3−1の最初
の2バイトはバツフアサイズ情報であり、同バツフアに
格納されている文字数から1を減じたものを2倍した数
値がバツフアサイズとして入る。YBUF3−1にはそ
の時点で未変換の読み列情報が記憶される。各文字は1
文字2バイトで構成され、一例としてJISX0208
コードで格納される。図4は第1の実施例によるOBU
Fの構成を示した図である。
【0026】STBUF3−2の最初の2バイトはバツ
フアサイズ情報であり、同バツフアに格納されている文
字数から1を減じたものを2倍した数値がバツフアサイ
ズとして入る。仮名漢字変換が起動されると、STBU
F3−2に変換結果が設定される。ただし、その時点で
表示されている候補の変換結果が記憶される。各文字は
1文字2バイトで構成され、JISX0208コードで
格納される。
【0027】図5は第1の実施例によるDOBUFの構
成を示した図である。
【0028】DOBUF3−3には変換が起動される
と、その変換結果の同音語情報が設定される。候補数は
DOBUF3−3に格納されている同音語候補の個数が
記憶される。候補番号は、その時点で表示されている候
補の番号が格納される。例えば、変換直後の状態では、
たいていの場合1が記憶されることになる。次候補表示
指示、前候補表示指示等が行なわれると、候補番号の値
は+1、あるいは−1される。
【0029】各単語はアドレスと表記が対応づけて記憶
される。アドレスには、その単語の辞書上での位置がア
ドレスで記憶される。表記はその単語の実際の表記であ
る。各用語の場合には活用した形態で記憶される。例え
ば、『歩いた』の場合、辞書上には語幹部の『歩』しか
記憶されないが、DOBUF3−3上の表記の欄には
『歩いた』の形で記憶される。各文字は1文字2バイト
で構成され、JISX0208コードで格納される。
【0030】図6は第1の実施例によるDICの構成を
示した図である。DIC2−1の構成はインデツクス部
と本体部とに分かれている。本体部には、単語が読みの
昇順にソートされて(いわゆる辞書式配列で)格納され
る。従つて、読みの先頭が同じ単語(例えば、読みが
『き』で始まる単語)は固まった領域に格納される(こ
れを同一先頭読みのブロツクと呼ぶ)。
【0031】またインデツクス部は、同一先頭読みのブ
ロツクに対して、その先頭アドレスを、各先頭読みごと
に記憶する。例えば、先頭読みが『あ』であるブロツク
のアドレス、先頭読みが『い』であるブロツクのアドレ
ス等を『ぁ』〜『ん』に対して記憶する。
【0032】本体部は「読み」、「表記」、「詳細情
報」のフイールドから構成され、「読み」には単語の読
み、「表記」には単語の表記、「詳細情報」には単語の
品詞などが格納される。
【0033】図7は第1の実施例によるUSRDの構成
を示した図である。USRD3−5は、DIC2−1と
同様の構成を有しており、オペレータ特有の単語を記憶
するための辞書である。内容は書き換え可能にするため
RAM3上に配置される。オペレータの登録に応じて内
容が更新され、オペレータが分割して変換した複合語も
この登録単語辞書に登録される。
【0034】また、オペレータが無変換した仮名文字列
もこのUSRD3−5に登録され、その結果、無変換文
字列の学習機能が実現されている。
【0035】なお、複合語の登録の際表記として完全な
文字列を登録するのではなく、DIC2−1へのアドレ
ス(ポインタ)を登録し、仮名漢字変換時にそのポイン
タをたどることにより変換するようにしている。これに
より、表記を記憶するためのメモリを削減することがで
きる。例えば、複合語『振興会館』に対してはその字面
を表記として登録するのではなく、『振興』のアドレス
と『会館』のアドレスを記憶する。
【0036】図8は第1の実施例によるAMEMの構成
を示した図である。
【0037】AMEM3−4には、単語を変換する度
に、変換した単語の辞書上でのアドレスが頻度と共に登
録され、アドレスは上から順番に登録される。従つて最
新に登録されたアドレスは最も上位に存在するアドレス
である。
【0038】短縮変換時にはこのAMEM3−4内がサ
ーチされ、入力された先頭読みに対応するアドレス範囲
に入ったもののみが抽出され、そのうち、最も上位に登
録されているものが第1候補として変換される。
【0039】頻度は最初にアドレスが登録するときに0
が設定され、使用されるたびにカウントアツプする。
【0040】図9は第1の実施例によるKANBUFの
構成を示した図である。
【0041】KANBUF3−6は複合語を構成し得る
単語が連続して変換されるかぎり、変換された単語のア
ドレス、及び個数を保持する。新しい単語がKANBU
F3−6に登録されたとき、その内容に基づき、複合語
がUSRD3−5に登録される。複合語がとぎれたと解
釈されたとき、KANBUF3−6の内容はクリアされ
る。
【0042】例えば、『機械』、『振興』、『会館』と
連続的に変換されているときは『機械』のアドレス、
『振興』のアドレス、『会館』のアドレス、及び個数=
3が記憶される。
【0043】次に、上述の動作をフローに従つて説明す
る。
【0044】図10は第1の実施例によるキー入力を取
り込んで処理を行なう動作を説明するフローチヤートで
ある。
【0045】ステツプ10−1において、変換結果、同
音語情報が設定されているかどうかを示す『変換フラ
グ』をOFFにリセツトする。ステツプ10−20にお
いて、KANBUF3−6をクリアする。ステツプ10
−2において、キーボードから打鍵されるキーデータを
取り込む。ステツプ10−3において、取り込まれたキ
ーの種別を判定する。判定結果に応じて、各キーの処理
ルーチンに分岐する。変換キーであつたときはステツプ
10−6、無変換キーであつたときはステツプ10−1
2、読みキーであつたときはステツプ10−4、その他
のキーであつたときはステツプ10−14にそれぞれ分
岐する。
【0046】ステツプ10−3において読みキーがきた
ときは、ステツプ10−4において、まず変換フラグが
ONであるかどうか判定する。読みの入力中であれば変
換フラグがOFFであるので、ステツプ10−5に進
み、YBUF3−1に今入力されたキーを追加する。ス
テツプ10−4において変換フラグがONのときは変換
結果が存在するので、その確定を行なうためにステツプ
10−15に分岐する。ステツプ10−3において変換
キーがきたときは、ステツプ10−6において、まず変
換フラグがONであるかどうか判定する。変換フラグが
OFFのときはステツプ10−7に進み、YBUF3−
1に格納されている読みが1文字であるかどうか判定す
る。読みが1文字以上のときは通常の仮名漢字変換を行
なうためにステツプ10−8に分岐し、STBUF3−
2,DOBUF3−3に出力文字列、同音語情報を設定
した後、ステツプ10−10に進み、変換フラグをON
して、ステツプ10−2にループする。
【0047】ステツプ10−7において読み1文字であ
つたときは、ステツプ10−9に分岐し図12に詳述す
る短縮変換処理を行ない、STBUF3−2,DOBU
F3−3に出力文字列、同音語情報を設定する。更にス
テツプ10−10に進んで変換フラグをONし、ステツ
プ10−2にループする。
【0048】ステツプ10−6において変換フラグがO
Nのときはすでに変換結果があるのでステツプ10−1
1に分岐して図11に詳述する次候補処理を行なう。そ
の後、ステツプ10−2にループする。
【0049】ステツプ10−3において無変換キーがき
たときは、ステツプ10−12において無変換の処理を
行ない、次いでステツプ10−13において図13に詳
述する読み学習処理を行なう。その後、ステツプ10−
10に進んで変換フラグをONし、ステツプ10−2に
ループする。
【0050】ステツプ10−3においてその他のキーが
きたときは、ステツプ10−14において変換フラグが
ONかどうか判定する。ONのときはステツプ10−1
5に分岐し、STBUF3−2の内容を実際の文章上に
出力する。その後、ステツプ10−16において変換フ
ラグをOFFする。次いで、ステツプ10−19におい
て打鍵されたキーが句読点等の区切り記号であるかどう
かを判定し、区切記号のときは区切フラグをONし、そ
うでないときは区切フラグをOFFする。更にステツプ
10−17において図14に詳述するように短縮データ
登録処理を行なう。その後、取り込んだキーをもう一度
処理するため、ステツプ10−3にループする。
【0051】ステツプ10−14において変換フラグが
OFFであつたときは、変換結果がなかつた場合なの
で、そのままステツプ10−18に進み、その他の処理
を行なう。その後、ステツプ10−2にループする。
【0052】図11は第1の実施例によるステツプ10
−11の「次候補処理」を詳細に説明するフローチヤー
トである。
【0053】ステツプ11−1において、DOBUF3
−3中の候補番号が候補数と等しくなつているかどうか
判定する。等しいときはステツプ11−3に進んで候補
番号を1にリセツトし、等しくないときはステツプ11
−2において候補番号の値を+1する。
【0054】次候補の結果、候補が変更されているの
で、ステツプ11−4においてSTBUF3−2にその
時点の候補の文字列を設定する。
【0055】図12は第1の実施例によるステツプ10
−9の「短縮変換処理」を詳細に説明するフローチヤー
トである。
【0056】ステツプ12−1において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課,
火,可,蚊などを変換する。変換の結果、STBUF3
−2、DOBUF3−3が設定される。ここで作成され
たDOBUF3−3に更に短縮変換の単語が追加される
ことになる。
【0057】ステツプ12−2において、入力読み(1
文字)に対してDIC2−1及びUSRD3−5のイン
デツクス部を参照することにより、その入力読みが先頭
読みとなる単語の存在する範囲(アドレス範囲)を求め
る。例えば、入力『き』であれば、『き』のインデツク
スと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの2つのアドレスの間にあるはず
である。
【0058】ステツプ12−3において、AMEM3−
4内をサーチ、上記求めたアドレス範囲に入るものをリ
ストアツプする。なお、この処理はAMEM3−4全体
をサーチするのであるから比較的処理時間がかかるとい
える。しかし、トータルの処理時間として考えると、n
文字の読みを仮名漢字変換する時間に比べれば、この処
理のオーバヘツドは無視できる。
【0059】ステツプ12−4において、上記リストア
ツプしたものをAMEM3−4上で上位にあるものがD
OBUF3−3の先頭となるように追加ていく。候補番
号を1に設定し、AMEM3−4上で最上位にある短縮
変換の単語が最上位に表示されるようにする。ステツプ
12−5において、STBUF3−2に候補番号の表記
(すなわち、第1候補の表記)を設定し、リターンす
る。
【0060】図13は第1の実施例によるステツプ10
−13の「読み学習処理」を詳細に説明するフローチヤ
ートである。
【0061】ステツプ13−1において、無変換された
仮名文字列に対して、それが読みかつ表記である単語を
USRD3−5に登録する。ステツプ13−2におい
て、登録の結果、USRD3−5内の単語の位置がすれ
るので、AMEM3−4内に格納されているアドレス情
報の値を補正する。ステツプ13−3において、無変換
された仮名文字列を『読み』かつ『表記』とし、『アド
レス』としてUSRD3−5に登録された単語のアドレ
スを持ち、候補数=1,候補番号=1であるDOBUF
3−3を作成する。ステツプ13−4において、無変換
された仮名文字列をSTBUF3−2に設定しリターン
する。
【0062】図14は第1の実施例によるステツプ10
−17の「短縮データ登録」を詳細に説明するフローチ
ヤートである。
【0063】ステツプ14−1において、DOBUF3
−3より候補番号の単語のアドレスを取得する。ステツ
プ14−2において、上記のアドレスを後述の図15に
詳述するように、AMEM3−4に登録する。
【0064】ステツプ14−3において、変換した単語
が漢字のみからなるかどうかを判定する。仮名文字等が
含まれるときにはステツプ14−10に分岐し、KAN
BUF3−6をクリアしてリターンする。
【0065】漢字のみからなる語が変換されたときは、
ステツプ14−4において、KANBUF3−6に変換
された単語のアドレスを追加する。ステツプ14−5に
おいてKANBUF3−6に登録されている単語が1単
語のみであるかどうかを判定する。1単語のみのときは
複合語の登録処理は行なわず、リターンする。
【0066】ステツプ14−6においてKANBUF3
−6に登録されている複合語をUSRD3−5に登録す
る。その際の読みは複合語を構成する各単語の読みを連
接したものである。また、表記としては、DIC2−1
の単語のみから構成される複合語の場合は、各単語のア
ドレスを連続して登録する。DIC2−1以外の単語が
含まれるときは完全な表記を合成し登録する。また、品
詞は末尾の単語の品詞を指定する。
【0067】ステツプ14−7において、上記登録され
た複合語のアドレスを指定して後述の図15に詳述する
ようにAMEM3−4に登録する。ステツプ14−8に
おいて、区切フラグがONであるかどうか判定する。O
Nのときは、ステツプ14−10においてAMEM3−
4をクリアし、リターンする。OFFのときはステツプ
14−9において、今回変換した単語に送りがな(付属
語)が存在するかどうか判定し、存在するときは、ステ
ツプ14−10においてKANBUF3−6をクリア
し、リターンする。送りがながなかつたときはKANB
UF3−6の内容はそのままにしてリターンする。
【0068】図15は第1の実施例によるステツプ14
−2,14−7の「AMEM3−4に登録」を詳細に説
明するフローチヤートである。
【0069】ステツプ15−1において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をDIC2−1及びUSRD3−5のインデツクス部
(図6,図7)を参照することにより求める。ステツプ
15−2において、AMEM3−4をサーチし、ステツ
プ15−1で求めたアドレス範囲内に入るアドレスを抽
出する。ステツプ15−3において、上記抽出されたア
ドレスに、指定されたアドレスと同一のものがあれば、
ステツプ15−6において、その同一アドレスをAME
M3−4の先頭に移動し(すなわち、最新のアドレスと
なる)、リターンする。
【0070】ステツプ15−3において同一アドレスが
なかつたときは、ステツプ15−4において、AMEM
3−4内に記憶される同一先頭読みの単語アドレスの上
限(n)を越えているかどうか判定する。越えていると
きはステツプ15−8に分岐し、同一先頭読みとなる単
語アドレスのうち、AMEM3−4の最も下位に登録さ
れているアドレスを削除し、ステツプ15−9に分岐
し、アドレスをAMEM3−4の先頭に登録する。ステ
ツプ15−4において、上限nを越えていなかつたとき
はステツプ15−5において、AMEM3−4が一杯で
あるかどうか判定し、一杯のときはステツプ15−7に
おいてAMEM3−4最下位のアドレスを削除する。そ
の後、ステツプ15−9において、アドレスをAMEM
3−4先頭に登録する。
【0071】以上説明したように、第1の実施例によれ
ば、仮名漢字変換時に、分割して変換した単語が漢字の
みからなるかを判定し、漢字以外を含む単語を変換した
とき、あるいは、句読点等の区切信号を打鍵したときに
複合語の終了と判断し、その点までに変換した単語の全
体を複合語としてUSRD3−5に登録し、更に、その
アドレスをAMEM3−4に登録するので、次回に複合
語の先頭読みを指定して変換すれば、その先頭読みに対
応する複合語が変換できる。換言すれば、複合語に対し
ても短縮変換ができ、操作性の高い、文字処理装置を実
現することができる。
【0072】<第2の実施例>次に、第2の実施例を説
明する。
【0073】前述の第1の実施例において、入力読みを
先頭読みとして持つ単語アドレスが複数個、AMEM3
−4に登録されているときは、最新に使用されたものを
優先的に変換するとしたが、本発明はこれに限定される
ものではなく、頻度順に変換するようにもできる。
【0074】この場合には、前述の図12,図15のフ
ローチヤートを、それぞれ図16,図17のように変更
して得られる動作を行えば良い。尚、構成は同様のため
説明を省略し、以下の説明では、図1と同様のユニツト
には同一番号にダッシュ「’」を付加して示す。
【0075】図16は第2の実施例によるステツプ10
−9の「短縮変換処理」を詳細に説明するフローチヤー
トである。
【0076】ステツプ16−1において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課,
火,可,蚊などを変換する。変換の結果、STBUF3
−2’、DOBUF3−3’が設定される。ここで作成
されたDOBUF3−3’に更に短縮変換の単語が追加
されることになる。
【0077】ステツプ16−2において、入力読み(1
文字)に対してDIC2−1’及びUSRD3−5’の
インデツクス部を参照することにより、その入力読みが
先頭読みとなる単語の存在する範囲(アドレス範囲)を
求める。例えば、入力『き』であれば、『き』のインデ
ツクスと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの2つのアドレスの間にあるはず
である。
【0078】ステツプ16−3において、AMEM3−
4’内をサーチ、上記求めたアドレス範囲に入るものを
リストアツプする。
【0079】ステツプ16−4において、上記リストア
ツプしたものを頻度が高いものが上位となるように、D
OBUF3−3’の先頭に追加ていく。候補番号を1に
設定し、短縮変換の単語で最も頻度が高いものが最上位
に表示されるようにする。
【0080】ステツプ16−5において、STBUF3
−2’に候補番号の表記(すなわち、第1候補の表記)
を設定し、リターンする。
【0081】図17は第2の実施例によるステツプ14
−2,14−7の「AMEMに登録」を詳細に説明する
フローチヤートである。
【0082】ステツプ17−1において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をDIC2−1’及びUSRD3−5’のインデツクス
部を参照することにより求める。ステツプ17−2にお
いて、AMEM3−4’をサーチし、ステツプ17−1
で求めたアドレス範囲内に入るアドレスを抽出する。ス
テツプ17−3において、上記抽出されたアドレスに、
指定されたアドレスと同一のものがあるかどうか判定す
る。同一のものがあれば、ステツプ17−6において、
その同一アドレスをAMEM3−4’の先頭に移動し
(すなわち、最新のアドレスとなる)、更に頻度を+1
してリターンする。
【0083】ステツプ17−3において同一アドレスが
なかつたときは、ステツプ17−4において、AMEM
3−4’内に記憶される同一先頭読みの単語アドレスの
上限(n)を越えているかどうか判定する。越えている
ときはステツプ17−8に分岐し、同一先頭読みとなる
単語アドレスのうち、頻度の最も低いアドレスを削除
し、ステツプ17−9に分岐し、アドレスをAMEM3
−4’の先頭に登録する。
【0084】ステツプ17−4において、上限nを越え
ていなかつたときはステツプ17−5において、AME
M3−4’が一杯であるかどうか判定し、一杯のときは
ステツプ17−7においてAMEM最下位のアドレスを
削減する。その後、ステツプ17−9において、アドレ
スを頻度=0でAMEMの3−4’先頭に登録する。
【0085】また、以上の第1,第2の実施例の説明に
おいては、単語単位で変換することを想定しているが、
一括変換(連文節変換)に応用することも容易である。
その時は、変換された連文節がすべて漢字のみから構成
されれば、第1、第2の実施例と同様の方式で複合語と
してUSRD3−5’に登録し、そのアドレスを記憶す
ることにより実現できる。
【0086】また、以上の第1,第2の実施例の説明に
おいてはAMEM3−4’にアドレスを記憶していた
が、アドレス以外でも単語の辞書上の位置を示す情報
(例えば、単語番号等)であれば、同様の仕組みで実現
できる。
【0087】また、以上の第1,第2の実施例の説明に
おいては、先頭読みの1文字により短縮変換するように
したが、読みのプレフイツクスとなるn文字(例えば、
読み先頭の2文字)で短縮変換するように拡張すること
は容易である。例えば、読み先頭2文字による短縮変換
の場合は、DIC2−1’、USRD3−5’のインデ
ツクス部を読み2文字に対して構成することにより実現
できる。
【0088】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによつて達成される場合にも適用で
きることは言うまでもない。
【0089】
【発明の効果】以上の説明から明らかなように本発明に
よれば、複合語に対しても短縮変換ができ、操作性の高
い、文字処理装置を実現することができる。
【図面の簡単な説明】
【図1】本発明に係る文字処理装置の第1の実施例の構
成を示すブロツク図である。
【図2】第1の実施例による変換例を示した図である。
【図3】第1の実施例によるYBUFの構成を示す図で
ある。
【図4】第1の実施例によるOBUFの構成を示した図
である。
【図5】第1の実施例によるDOBUFの構成を示した
図である。
【図6】第1の実施例によるDICの構成を示した図で
ある。
【図7】第1の実施例によるUSRDの構成を示した図
である。
【図8】第1の実施例によるAMEMの構成を示した図
である。
【図9】第1の実施例によるKANBUFの構成を示し
た図である。
【図10】第1の実施例によるキー入力を取り込んで処
理を行なう動作を説明するフローチヤートである。
【図11】第1の実施例によるステツプ10−11の
「次候補処理」を詳細に説明するフローチヤートであ
る。
【図12】第1の実施例によるステツプ10−9の「短
縮変換処理」を詳細に説明するフローチヤートである。
【図13】第1の実施例によるステツプ10−13の
「読み学習処理」を詳細に説明するフローチヤートであ
る。
【図14】第1の実施例によるステツプ10−17の
「短縮データ登録」を詳細に説明するフローチヤートで
ある。
【図15】第1の実施例によるステツプ14−2,14
−7の「AMEMに登録」を詳細に説明するフローチヤ
ートである。
【図16】第2の実施例によるステツプ10−9の「短
縮変換処理」を詳細に説明するフローチヤートである。
【図17】第2の実施例によるステツプ14−2,14
−7の「AMEMに登録」を詳細に説明するフローチヤ
ートである。
【符号の説明】
1 CPU 2 ROM 2−1 DIC 3 RAM 3−1 YBUF 3−2 STBUF 3−3 DOBUF 3−4 AMEM 3−5 USRD 3−6 KANBUF 4 DISK 5 KB 6 CR 7 DBUF 8 CRTC 9 CRT 10 CG

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】予め単語を読みと表記との対応関係で記憶
    する記憶手段を備えた文字処理装置において、少なくと
    も1文字を含む文字列で読みを入力する入力手段と、前
    記入力手段で入力した読みを前記記憶手段を用いて表記
    に変換する変換手段と、前記変換手段で変換した表記の
    前記記憶手段での位置情報を登録する登録手段と、前記
    変換手段で変換した表記が漢字以外の表記であり、か
    つ、直前に前記登録手段で連続して登録された位置情報
    が複数の単語の漢字列を示す場合、前記登録手段におい
    て、前記漢字列を複合漢字列として更新し、かつ、該複
    合漢字列に対応する読みを追加する変更手段と、前記入
    力手段で短縮型の読みを入力したときに該短縮型の読み
    を含む読みを有した複合漢字列の各位置情報を前記登録
    手段で登録した内容から検出する検出手段と、前記検出
    手段で検出した各位置情報に対応した表記を前記記憶手
    段から読み出して合成する合成手段とを備えることを特
    徴とする文字処理装置。
  2. 【請求項2】前記検出手段は、前記短縮型の読みを前記
    複合語の先頭部分の読みと照合する手段を含むことを特
    徴とする請求項1記載の文字処理装置。
  3. 【請求項3】前記短縮型の読みは、前記複合語の先頭文
    字からの読みの一部であることを特徴とする請求項2記
    載の文字処理装置。
JP3156506A 1991-06-27 1991-06-27 文字処理装置 Withdrawn JPH056362A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3156506A JPH056362A (ja) 1991-06-27 1991-06-27 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3156506A JPH056362A (ja) 1991-06-27 1991-06-27 文字処理装置

Publications (1)

Publication Number Publication Date
JPH056362A true JPH056362A (ja) 1993-01-14

Family

ID=15629254

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3156506A Withdrawn JPH056362A (ja) 1991-06-27 1991-06-27 文字処理装置

Country Status (1)

Country Link
JP (1) JPH056362A (ja)

Similar Documents

Publication Publication Date Title
JPH056362A (ja) 文字処理装置
JPH056361A (ja) 文字処理装置
JPH08190558A (ja) 文字間挿入装置および挿入方法
JPH056360A (ja) 文字処理装置
JP2592793B2 (ja) 文字処理方法
JPH0115906B2 (ja)
JPH056359A (ja) 文字処理装置
JP2688651B2 (ja) 文字列変換装置
JP3278148B2 (ja) 文字処理装置及びその方法
JPH08287060A (ja) 文字処理装置および文字処理方法
JPS63155262A (ja) 日本語処理方法および装置
JPH03269664A (ja) 文字処理装置
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPH076172A (ja) ワードプロセッサ
JPS61175854A (ja) 仮名漢字変換装置
JPH0922411A (ja) 文書処理方法及びその装置
JPH03245260A (ja) 文書処理装置
JPH0622025B2 (ja) 文字処理装置
JPH07271787A (ja) 読み文字列変換装置
JPH07271788A (ja) 読み文字列変換装置
JPH0638260B2 (ja) 文字処理装置及びその方法
JPS6089235A (ja) 文字処理装置
JPH0638261B2 (ja) 文字処理装置及びその方法
JPH0661080B2 (ja) 振仮名付加機能付き文書処理装置
JPH01214967A (ja) 文字処理装置及びその方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980903