JPH056361A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH056361A
JPH056361A JP3156505A JP15650591A JPH056361A JP H056361 A JPH056361 A JP H056361A JP 3156505 A JP3156505 A JP 3156505A JP 15650591 A JP15650591 A JP 15650591A JP H056361 A JPH056361 A JP H056361A
Authority
JP
Japan
Prior art keywords
reading
word
conversion
address
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3156505A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3156505A priority Critical patent/JPH056361A/ja
Publication of JPH056361A publication Critical patent/JPH056361A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】複合語に対しても短縮変換ができ、かつ、操作
性を向上することができる。 【構成】単語を変換するとき、変換した単語は、その表
記に対応したDIC(辞書)2−1上のアドレス(位置
情報)をRAM3のUSRD(登録単語辞書)3−5に
記憶する。次回の変換では、先頭読みが指定されると、
この指定された先頭読みを先頭読みとする単語のアドレ
スがUSRD3−5に登録されているかどうか調べ、登
録されていればその単語を変換する。入力した読みの単
語は、前回変換した単語または複合語のどちらを構成す
るか判断し、複合語を構成すると判断したときは、複合
語の全体を完全な読みでUSRD3−5に登録し、か
つ、そのアドレスも登録する。次回の変換で複合語の先
頭読みが指定されれば、複合語の全体がUSRD3−5
に登録したアドレスによりDIC2−1を参照して変換
されることになる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字処理装置に関し、例
えば、単語と複合語の文字処理を行う文字処理装置に関
する。
【0002】
【従来の技術】現在、日本ワードプロセツサなどの文字
処理装置は漢字仮名混じり文の入力を仮名漢字変換を使
って行なうことが一般的である。
【0003】仮名漢字変換入力においては、キーボード
より入力したい日本文の読み列を入力し、それを装置に
仮名漢字変換させ、望む候補を選択することにより、目
的の漢字仮名混じり文を作成する。例えば、『機械』を
入力するためにはキーボードより『きかい』と打鍵し、
表示される候補『機械,機会,器械』などから目的の候
補である『機械』を選択する。
【0004】ところで、通常の文章においては、特定の
単語が頻繁に登場する傾向が一般にある。従来、この点
に着目して、一度変換した単語に対しては、次回からそ
の先頭読みを指定して変換するだけで完全な単語が変換
されるように工夫した、いわゆる短縮変換という機構を
持つ装置が提案されている。この装置によると、例えば
『きかい』という読みを変換して『機械』を得た後、次
に『き』という読みだけを指定して変換すると『木』等
の候補に先んじて『機械』が変換される。
【0005】ところが、従来考案されている短縮変換に
おいては『機械振興会館』のような複合語の入力におい
て問題があつた。例えば、『機械』『振興』『会館にお
いて』と単語に分割して入力した場合、『き』を変換し
ても『機械』が変換されるだけである。『き』で『機械
振興会館』を変更するには最初に『きかいしんこうかい
かん』で『機械振興会館』を変換しておく必要があつ
た。
【0006】
【発明が解決しようとしている課題】すなわち、従来装
置における短縮変換においては、単語単位の入力におい
て簡便になつているだけであり、複合語部分については
あらかじめ複合語単位で変換しておく等の工夫が必要で
るという欠点があつた。
【0007】本発明は、上述した従来例の欠点に鑑みて
なされたものであり、その目的とするところは、複合語
に対しても短縮変換ができ、かつ、操作性を向上できる
文字処理装置を提供する点にある。
【0008】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、本発明に係る文字処理装置は、予
め単語を読みと表記との対応関係で記憶する記憶手段を
備えた文字処理装置において、少なくとも1文字を含む
文字列で読みを入力する入力手段と、前記入力手段で入
力した読みを前記記憶手段を用いて表記に変換する変換
手段と、前記変換手段で変換した表記の前記記憶手段で
の位置情報を登録する登録手段と、前記変換手段で変換
した表記と前記登録手段で直前に登録した位置情報に対
応した表記とを組み合わせた文字列が複合語であるか否
かを判断する判断手段と、前記判断手段が複合語である
と判断した場合、前記登録手段で直前に登録した位置情
報を前記複合語を構成する全単語の位置情報に更新し、
かつ、前記全単語の位置情報に対応させて前記複合語の
読みを追加する更新手段と、前記入力手段で短縮型の読
みを入力したときに該短縮型の読みを含む読みを有した
複合語の各位置情報を前記登録手段で登録した内容から
検出する検出手段と、前記検出手段で検出した各位置情
報に対応した表記を前記記憶手段から読み出して合成す
る合成手段とを備えることを特徴とする。
【0009】
【作用】かかる構成によれば、入力手段は少なくとも1
文字を含む文字列で読みを入力し、変換手段は入力手段
で入力した読みを前記記憶手段を用いて表記に変換し、
登録手段は変換手段で変換した表記の記憶手段での位置
情報を登録し、判断手段は変換手段で変換した表記と登
録手段で直前に登録した位置情報に対応した表記とを組
み合わせた文字列が複合語であるか否かを判断し、更新
手段は登録手段で直前に登録した位置情報を前記複合語
を構成する全単語の位置情報に更新し、かつ、前記全単
語の位置情報に対応させて前記複合語の読みを追加し、
特に、検出手段は、入力手段で短縮型の読みを入力した
ときに該短縮型の読みを含む読みを有した複合語の各位
置情報を登録手段で登録した内容から検出し、合成手段
は検出手段で検出した各位置情報に対応した表記を記憶
手段から読み出して合成する。
【0010】
【実施例】以下、添付図面を参照しながら本発明の一実
施例を詳細に説明する。
【0011】<第1の実施例>図1は本発明に係る文字
処理装置の第1の実施例の構成を示すブロツク図であ
る。同図において、1はマイクロプロセツサで構成され
たCPUで、文字処理のための演算,論理判断等を行な
い、アドレスバスAB,コントロールバスCB,データ
バスDBを介して、それらのバスに接続された各構成要
素を制御する。
【0012】ABはアドレスバスABで、マイクロプロ
セツサCPUの制御の対象とする構成要素を指示するア
ドレス信号を転送する。CBはコントロールバスで、C
PU1の制御の対象とする各構成要素のコントロール信
号を転送して印加する。DBはデータバスで、各構成機
器相互間のデータの転送を行なう。
【0013】2は読み出し専用の固定メモリ(以下「R
OM」という)で、図10〜図15につき後述するCP
U1による制御のためのプログラム等を予め記憶する。
2−1は仮名漢字変換を行なうための辞書(以下「DI
C」という)である。
【0014】また、3は1ワード16ビツトの構成の書
込み可能のランダムアクセスメモリ(以下「RAM」と
いう)であつて、各構成要素からの各種データの一時記
憶に用いると同時に、ワークエリアとしても用いる。3
−1はキー入力されたキーデータを読み列として記憶す
る入力バツフア(以下「YBUF」という)であり、3
−2は仮名漢字変換された結果を記憶する出力文字列バ
ツフア(以下「STBUF」という)である。3−3は
出力文字列の同音語情報を記憶するための同音語バツフ
ア(以下「DOBUF」という)である。3−4は短縮
変換のための情報を記憶する短縮メモリ(以下「AME
M「という)である。3−5はオペレータが自分に特有
の単語を登録する登録単語辞書(以下「USRD」とい
う)である。3−6は連続する漢字列を記憶する連続漢
字列バツフア(以下「KANBUF」という)である。
【0015】5はキーボード(以下「KB」という)で
あつて、アルフアベツトキー,ひらかなキー,カタカナ
キー等の文字記号入力キー、及び変換キー,無変換キー
等の本文字処理装置に対する各種機能を指示するための
各種のフアンクシヨンキーを備えている。4は文書デー
タを記憶するための外部記憶装置(以下「DISK」と
いう)であり、テキストバツフア上に作成された文書の
保管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。6はカーソルレジスタ(以
下「CR」という)であり、CPU1により内容を読み
書きされる。後述するCRTC(CRTコントローラ)
8は、ここに蓄えられたアドレスに対応するCRT9
(表示装置)上の位置にカーソルを表示する。7は表示
用バツフアメモリ(以下「DBUF」という)で、表示
すべきデータを蓄える。
【0016】8はCRTコントローラ(以下「CRT
C」という)で、CR6及びDBUF7に蓄えられた内
容を後述のCRT9に表示する役割を担う。9は陰極線
管等を用いた表示装置(以下「CRT」という)であ
り、その表示するときのドツト構成の表示パターンおよ
びカーソルの表示をCRTC8によって制御される。1
0はキヤラクタジエネレータ(以下「CG」という)で
あつて、CRT9に表示する文字,記号のパターンを記
憶するものである。
【0017】かかる各構成要素においては、KB5から
の各種の入力に応じて作動するものであつて、KB5か
らの入力が供給されると、まず、インタラプト信号がC
PU1に送られ、そのCPU1がROM2内に記憶して
ある各種の制御信号を読出し、それらの制御信号に従つ
て各種の制御が行なわれる。
【0018】図2は第1の実施例による変換例を示した
図である。
【0019】同図において、(a)は読み『きかい』を
打鍵した状態を示している。その後変換キーを打鍵する
と、(b)の画面になり、『機械』が変換される。この
段階では、次候補/前候補を見ることが可能であり、実
際には変換結果は文書中に出力されていない。
【0020】次いで、読み『しんこう』を打鍵すると、
(c)の画面になり、変換結果『機械』が実際に文書中
に出力され、AMEM3−4に『機械』のアドレスが記
憶される。その後変換キーを打鍵すると、(d)の画面
になり『振興』が変換される。この段階では『振興』は
文書中に出力されていない。
【0021】次いで、読み『かいかんにおいて』を打鍵
すると、(e)の画面になり、変換結果『振興』が実際
に文書中に出力され、AMEM3−4に『振興』のアド
レスが記憶される。また、前回の変換は『機械』である
ので、この段階で複合語『機械振興』が自動登録され、
そのアドレスもAMEM3−4に記憶される。その後変
換キーを打鍵すると、(f)の画面になり『会館におい
て』が変換される。この段階では『会館において』はま
だ文書中には出力されていないが、無関係なキーの打鍵
で変換結果『会館において』が実際に文書中に出力さ
れ、AMEM3−4に『振興』のアドレスが記憶され、
かつ『機械振興会館』が複合語をなすと解釈され、US
RD3−5に自動登録されそのアドレスもAMEM3−
4に記憶される(g)。
【0022】次に読み『き』を入力し(h)、変換キー
を打鍵すると、1文字の変換であるので、AMEM3−
4が検索され、これまでの操作で登録されている、『機
械振興会館』『機械振興』『機械』等のアドレスが見つ
かり、『機械振興会館』が第1候補として変換され、
(i)の画面になる。
【0023】このように、本装置においては、分割して
変換した複合語に対して、次回からはその複合語全体の
先頭の読み(例えば、『き』)を指定するだけで変換が
可能である。すなわち、複合語の短縮変換が可能であ
る。
【0024】なお、本実施例においては、先頭の1文字
のみを指定して短縮するように構成しているが、読み先
頭部分の複数文字を指定による短縮変換も実現可能であ
る。そのような短縮変換においては、例えば『内閣総辞
職』を変換した後、『な』『ない』『ないか』等を指定
して変換させることになる。このような『な』『ない』
『ないか』等を元の完全な読み『ないかくそうじしょ
く』に対して『プレフイツクス』と呼ぶ。たとえば、
『きかい』は『機械振興会館(きかいしんこうかいか
ん)』のプレフイツクスであり、『いち』は『一目瞭然
(いちもくりょうぜん)』のプレフイツクスである。
【0025】図3は第1の実施例によるYBUFの構成
を示す図である。同図において、YBUF3−1の最初
の2バイトはバツフアサイズ情報であり、同バツフアに
格納されている文字数から1を減じたものを2倍した数
値がバツフアサイズとして入る。YBUF3−1にはそ
の時点で未変換の読み列情報が記憶される。各文字は1
文字2バイトで構成され、一例としてJISX0208
コードで格納される。
【0026】図4は第1の実施例によるOBUFの構成
を示した図である。
【0027】STBUF3−2の最初の2バイトはバツ
フアサイズ情報であり、同バツフアに格納されている文
字数から1を減じたものを2倍した数値がバツフアサイ
ズとして入る。仮名漢字変換が起動されると、STBU
F3−2に変換結果が設定される。ただし、その時点で
表示されている候補の変換結果が記憶される。各文字は
1文字2バイトで構成され、JISX0208コードで
格納される。
【0028】図5は第1の実施例によるDOBUFの構
成を示した図である。
【0029】DOBUF3−3には変換が起動される
と、その変換結果の同音語情報が設定される。候補数は
DOBUF3−3に格納されている同音語候補の個数が
記憶される。候補番号は、その時点で表示されている候
補の番号が格納される。例えば、変換直後の状態では、
たいていの場合1が記憶されることになる。次候補表示
指示、前候補表示指示等が行なわれると、候補番号の値
は+1、あるいは−1される。
【0030】各単語はアドレスと表記が対応づけて記憶
される。アドレスには、その単語の辞書上での位置がア
ドレスで記憶される。表記はその単語の実際の表記であ
る。各用語の場合には活用した形態で記憶される。例え
ば、『歩いた』の場合、辞書上には語幹部の『歩』しか
記憶されないが、DOBUF3−3上の表記の欄には
『歩いた』の形で記憶される。各文字は1文字2バイト
で構成され、JISX0208コードで格納される。
【0031】図6は第1の実施例によるDICの構成を
示した図である。DIC2−1の構成はインデツクス部
と本体部とに分かれている。本体部には、単語が読みの
昇順にソートされて(いわゆる辞書式配列で)格納され
る。従つて、読みの先頭が同じ単語(例えば、読みが
『き』で始まる単語)は固まった領域に格納される(こ
れを同一先頭読みのブロツクと呼ぶ)。
【0032】またインデツクス部は、同一先頭読みのブ
ロツクに対して、その先頭アドレスを、各先頭読みごと
に記憶する。例えば、先頭読みが『あ』であるブロツク
のアドレス、先頭読みが『い』であるブロツクのアドレ
ス等を『ぁ』〜『ん』に対して記憶する。
【0033】本体部は「読み」、「表記」、「詳細情
報」のフイールドから構成され、「読み」には単語の読
み、「表記」には単語の表記、「詳細情報」には単語の
品詞などが格納される。
【0034】図7は第1の実施例によるUSRDの構成
を示した図である。USRD3−5は、DIC2−1と
同様の構成を有しており、オペレータ特有の単語を記憶
するための辞書である。内容は書き換え可能にするため
RAM3上に配置される。オペレータの登録に応じて内
容が更新され、オペレータが分割して変換した複合語も
この登録単語辞書に登録される。
【0035】また、オペレータが無変換した仮名文字列
もこのUSRD3−5に登録され、その結果、無変換文
字列の学習機能が実現されている。
【0036】なお、複合語の登録の際表記として完全な
文字列を登録するのではなく、DIC2−1へのアドレ
ス(ポインタ)を登録し、仮名漢字変換時にそのポイン
タをたどることにより変換するようにしている。これに
より、表記を記憶するためのメモリを削減することがで
きる。例えば、複合語『振興会館』に対してはその字面
を表記として登録するのではなく、『振興』のアドレス
と『会館』のアドレスを記憶する。
【0037】図8は第1の実施例によるAMEMの構成
を示した図である。
【0038】AMEM3−4には、単語を変換する度
に、変換した単語の辞書上でのアドレスが頻度と共に登
録され、アドレスは上から順番に登録される。従つて最
新に登録されたアドレスは最も上位に存在するアドレス
である。
【0039】短縮変換時にはこのAMEM3−4内がサ
ーチされ、入力された先頭読みに対応するアドレス範囲
に入ったもののみが抽出され、そのうち、最も上位に登
録されているものが第1候補として変換される。
【0040】頻度は最初にアドレスが登録するときに0
が設定され、使用されるたびにカウントアツプする。
【0041】図9は第1の実施例によるKANBUFの
構成を示した図である。
【0042】KANBUF3−6は複合語を構成し得る
単語が連続して変換されるかぎり、変換された単語のア
ドレス、及び個数を保持する。新しい単語がKANBU
F3−6に登録されたとき、その内容に基づき、複合語
が登録単語辞書に登録される。複合語がとぎれたと解釈
されたとき、KANBUF3−6の内容はクリアされ
る。
【0043】例えば、『機械』、『振興』、『会館』と
連続的に変換されているときは『機械』のアドレス、
『振興』のアドレス、『会館』のアドレス、及び個数=
3が記憶される。
【0044】次に、上述の動作をフローに従つて説明す
る。
【0045】図10は第1の実施例によるキー入力を取
り込んで処理を行なう動作を説明するフローチヤートで
ある。
【0046】ステツプ10−1において、変換結果、同
音語情報が設定されているかどうかを示す『変換フラ
グ』をOFFにリセツトする。ステツプ10−20にお
いて、KANBUF3−6をクリアする。ステツプ10
−2において、キーボードから打鍵されるキーデータを
取り込む。ステツプ10−3において、取り込まれたキ
ーの種別を判定する。判定結果に応じて、各キーの処理
ルーチンに分岐する。変換キーであつたときはステツプ
10−6、無変換キーであつたときはステツプ10−1
2、読みキーであつたときはステツプ10−4、その他
のキーであつたときはステツプ10−14にそれぞれ分
岐する。
【0047】ステツプ10−3において読みキーがきた
ときは、ステツプ10−4において、まず変換フラグが
ONであるかどうか判定する。読みの入力中であれば変
換フラグがOFFであるので、ステツプ10−5に進
み、YBUF3−1に今入力されたキーを追加する。ス
テツプ10−4において変換フラグがONのときは変換
結果が存在するので、その確定を行なうためにステツプ
10−15に分岐する。ステツプ10−3において変換
キーがきたときは、ステツプ10−6において、まず変
換フラグがONであるかどうか判定する。変換フラグが
OFFのときはステツプ10−7に進み、YBUF3−
1に格納されている読みが1文字であるかどうか判定す
る。読みが1文字以上のときは通常の仮名漢字変換を行
なうためにステツプ10−8に分岐し、STBUF3−
2,DOBUF3−3に出力文字列、同音語情報を設定
した後、ステツプ10−10に進み、変換フラグをON
して、ステツプ10−2にループする。
【0048】ステツプ10−7において読み1文字であ
つたときは、ステツプ10−9に分岐し図12に詳述す
る短縮変換処理を行ない、STBUF3−2,DOBU
F3−3に出力文字列、同音語情報を設定する。更にス
テツプ10−10に進んで変換フラグをONし、ステツ
プ10−2にループする。
【0049】ステツプ10−6において変換フラグがO
Nのときはすでに変換結果があるのでステツプ10−1
1に分岐して図11に詳述する次候補処理を行なう。そ
の後、ステツプ10−2にループする。
【0050】ステツプ10−3において無変換キーがき
たときは、ステツプ10−12において無変換の処理を
行ない、次いでステツプ10−13において図13に詳
述する読み学習処理を行なう。その後、ステツプ10−
10に進んで変換フラグをONし、ステツプ10−2に
ループする。
【0051】ステツプ10−3においてその他のキーが
きたときは、ステツプ10−14において変換フラグが
ONかどうか判定する。ONのときはステツプ10−1
5に分岐し、出力文字列バツフアの内容を実際の文章上
に出力する。その後、ステツプ10−16において変換
フラグをOFFする。次いで、ステツプ10−19にお
いて打鍵されたキーが句読点等の区切り記号であるかど
うかを判定し、区切記号のときは区切フラグをONし、
そうでないときは区切フラグをOFFする。更にステツ
プ10−17において図14に詳述するように短縮デー
タ登録処理を行なう。その後、取り込んだキーをもう一
度処理するため、ステツプ10−3にループする。
【0052】ステツプ10−14において変換フラグが
OFFであつたときは、変換結果がなかつた場合なの
で、そのままステツプ10−18に進み、その他の処理
を行なう。その後、ステツプ10−2にループする。
【0053】図11は第1の実施例によるステツプ10
−11の「次候補処理」を詳細に説明するフローチヤー
トである。
【0054】ステツプ11−1において、同音語バツフ
ア中の候補番号が候補数と等しくなつているかどうか判
定する。等しいときはステツプ11−3に進んで候補番
号を1にリセツトし、等しくないときはステツプ11−
2において候補番号の値を+1する。
【0055】次候補の結果、候補が変更されているの
で、ステツプ11−4においてSTBUF3−2にその
時点の候補の文字列を設定する。
【0056】図12は第1の実施例によるステツプ10
−9の「短縮変換処理」を詳細に説明するフローチヤー
トである。
【0057】ステツプ12−1において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課,
火,可,蚊などを変換する。変換の結果、STBUF3
−2、DOBUF3−3が設定される。ここで作成され
たDOBUF3−3に更に短縮変換の単語が追加される
ことになる。
【0058】ステツプ12−2において、入力読み(1
文字)に対してDIC2−1及びUSRD3−5のイン
デツクス部を参照することにより、その入力読みが先頭
読みとなる単語の存在する範囲(アドレス範囲)を求め
る。例えば、入力『き』であれば、『き』のインデツク
スと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの2つのアドレスの間にあるはず
である。
【0059】ステツプ12−3において、AMEM3−
4内をサーチ、上記求めたアドレス範囲に入るものをリ
ストアツプする。なお、この処理はAMEM3−4全体
をサーチするのであるから比較的処理時間がかかるとい
える。しかし、トータルの処理時間として考えると、n
文字の読みを仮名漢字変換する時間に比べれば、この処
理のオーバヘツドは無視できる。
【0060】ステツプ12−4において、上記リストア
ツプしたものをAMEM3−4上で上位にあるものがD
OBUF3−3の先頭となるように追加ていく。候補番
号を1に設定し、AMEM3−4上で最上位にある短縮
変換の単語が最上位に表示されるようにする。ステツプ
12−5において、STBUF3−2に候補番号の表記
(すなわち、第1候補の表記)を設定し、リターンす
る。
【0061】図13は第1の実施例によるステツプ10
−13の「読み学習処理」を詳細に説明するフローチヤ
ートである。
【0062】ステツプ13−1において、無変換された
仮名文字列に対して、それが読みかつ表記である単語を
USRD3−5に登録する。ステツプ13−2におい
て、登録の結果、USRD3−5内の単語の位置がすれ
るので、AMEM3−4内に格納されているアドレス情
報の値を補正する。ステツプ13−3において、無変換
された仮名文字列を『読み』かつ『表記』とし、『アド
レス』としてUSRD3−5に登録された単語のアドレ
スを持ち、候補数=1,候補番号=1であるDOBUF
3−3を作成する。ステツプ13−4において、無変換
された仮名文字列をSTBUF3−2に設定しリターン
する。
【0063】図14は第1の実施例によるステツプ10
−17の「短縮データ登録」を詳細に説明するフローチ
ヤートである。
【0064】ステツプ14−1において、DOBUF3
−3より候補番号の単語のアドレスを取得する。ステツ
プ14−2において、上記のアドレスを後述の図15に
詳述するように、AMEM3−4に登録する。
【0065】ステツプ14−3において、変換した単語
が名詞またはサ変名詞であるかどうか判定する。名詞で
もサ変名詞でもないときは複合語は構成しないと判定
し、ステツプ14−10に分岐し、KANBUF3−6
をクリアしてリターンする。
【0066】名詞またはサ変名詞が変換されたときは、
ステツプ14−4において、KANBUF3−6に変換
された単語のアドレスを追加する。ステツプ14−5に
おいてKANBUF3−6に登録されている単語が1単
語のみであるかどうかを判定する。1単語のみのときは
複合語の登録処理は行なわず、リターンする。
【0067】ステツプ14−6においてKANBUF3
−6に登録されている複合語をUSRD3−5に登録す
る。その際の読みは複合語を構成する各単語の読みを連
接したものである。また、表記としては、DIC2−1
の単語のみから構成される複合語の場合は、各単語のア
ドレスを連続して登録する。DIC2−1以外の単語が
含まれるときは完全な表記を合成し登録する。また、品
詞は末尾の単語の品詞を指定する。
【0068】ステツプ14−7において、上記登録され
た複合語のアドレスを指定して後述の図15に詳述する
ようにAMEM3−4に登録する。ステツプ14−8に
おいて、区切フラグがONであるかどうか判定する。O
Nのときは、ステツプ14−10においてAMEM3−
4をクリアし、リターンする。OFFのときはステツプ
14−9において、今回変換した単語に送りがな(付属
語)が存在するかどうか判定し、存在するときは、ステ
ツプ14−10においてKANBUF3−6をクリア
し、リターンする。送りがながなかつたときはKANB
UF3−6の内容はそのままにしてリターンする。
【0069】図15は第1の実施例によるステツプ14
−2,14−7の「短縮メモリに登録」を詳細に説明す
るフローチヤートである。
【0070】ステツプ15−1において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をDIC2−1及びUSRD3−5のインデツクス部
(図6,図7)を参照することにより求める。ステツプ
15−2において、短縮メモリをサーチし、ステツプ1
5−1で求めたアドレス範囲内に入るアドレスを抽出す
る。ステツプ15−3において、上記抽出されたアドレ
スに、指定されたアドレスと同一のものがあれば、ステ
ツプ15−6において、その同一アドレスをAMEM3
−4の先頭に移動し(すなわち、最新のアドレスとな
る)、リターンする。
【0071】ステツプ15−3において同一アドレスが
なかつたときは、ステツプ15−4において、AMEM
3−4内に記憶される同一先頭読みの単語アドレスの上
限(n)を越えているかどうか判定する。越えていると
きはステツプ15−8に分岐し、同一先頭読みとなる単
語アドレスのうち、AMEM3−4の最も下位に登録さ
れているアドレスを削除し、ステツプ15−9に分岐
し、アドレスをAMEM3−4の先頭に登録する。ステ
ツプ15−4において、上限nを越えていなかつたとき
はステツプ15−5において、AMEM3−4が一杯で
あるかどうか判定し、一杯のときはステツプ15−7に
おいてAMEM3−4最下位のアドレスを削除する。そ
の後、ステツプ15−9において、アドレスをAMEM
3−4先頭に登録する。
【0072】以上説明したように、第1の実施例によれ
ば、仮名漢字変換時に、分割して変換した単語が複合語
を構成し得るかどうか判定し、複合語と認められたとき
は、その全体をUSRD3−5に登録し、更に、そのア
ドレスをAMEM3−4に登録するので、次回に複合語
の先頭読みを指定して変換すれば、その先頭読みに対応
する複合語が変換できる。換言すれば、複合語に対して
も短縮変換ができ、操作性の高い、文字処理装置を実現
することができる。
【0073】<第2の実施例>次に、第2の実施例を説
明する。
【0074】前述の第1の実施例において、入力読みを
先頭読みとして持つ単語アドレスが複数個、AMEM3
−4に登録されているときは、最新に使用されたものを
優先的に変換するとしたが、本発明はこれに限定される
ものではなく、頻度順に変換するようにもできる。
【0075】この場合には、前述の図12,図15のフ
ローチヤートを、それぞれ図16,図17のように変更
して得られる動作を行えば良い。尚、構成は同様のため
説明を省略し、以下の説明では、図1と同様のユニツト
には同一番号にダッシュ「’」を付加して示す。
【0076】図16は第2の実施例によるステツプ10
−9の「短縮変換処理」を詳細に説明するフローチヤー
トである。
【0077】ステツプ16−1において、通常の仮名漢
字変換を行なう。例えば、入力『か』においては課,
火,可,蚊などを変換する。変換の結果、STBUF3
−2’、DOBUF3−3’が設定される。ここで作成
されたDOBUF3−3’に更に短縮変換の単語が追加
されることになる。
【0078】ステツプ16−2において、入力読み(1
文字)に対してDIC2−1’及びUSRD3−5’の
インデツクス部を参照することにより、その入力読みが
先頭読みとなる単語の存在する範囲(アドレス範囲)を
求める。例えば、入力『き』であれば、『き』のインデ
ツクスと『ぎ』のインデツクスを取得する。先頭読みが
『き』である単語はこの2つのアドレスの間にあるはず
である。
【0079】ステツプ16−3において、AMEM3−
4’内をサーチ、上記求めたアドレス範囲に入るものを
リストアツプする。
【0080】ステツプ16−4において、上記リストア
ツプしたものを頻度が高いものが上位となるように、D
OBUF3−3’の先頭に追加ていく。候補番号を1に
設定し、短縮変換の単語で最も頻度が高いものが最上位
に表示されるようにする。
【0081】ステツプ16−5において、STBUF3
−2’に候補番号の表記(すなわち、第1候補の表記)
を設定し、リターンする。
【0082】図17は第2の実施例によるステツプ14
−2,14−7の「AMEM3−4’に登録」を詳細に
説明するフローチヤートである。
【0083】ステツプ17−1において、指定された単
語アドレスと同じ先頭読みを持つ単語のアドレスの範囲
をDIC2−1’及びUSRD3−5’のインデツクス
部を参照することにより求める。ステツプ17−2にお
いて、AMEM3−4’をサーチし、ステツプ17−1
で求めたアドレス範囲内に入るアドレスを抽出する。ス
テツプ17−3において、上記抽出されたアドレスに、
指定されたアドレスと同一のものがあるかどうか判定す
る。同一のものがあれば、ステツプ17−6において、
その同一アドレスをAMEM3−4’の先頭に移動し
(すなわち、最新のアドレスとなる)、更に頻度を+1
してリターンする。
【0084】ステツプ17−3において同一アドレスが
なかつたときは、ステツプ17−4において、AMEM
3−4’内に記憶される同一先頭読みの単語アドレスの
上限(n)を越えているかどうか判定する。越えている
ときはステツプ17−8に分岐し、同一先頭読みとなる
単語アドレスのうち、頻度の最も低いアドレスを削除
し、ステツプ17−9に分岐し、アドレスをAMEM3
−4’の先頭に登録する。
【0085】ステツプ17−4において、上限nを越え
ていなかつたときはステツプ17−5において、AME
M3−4’が一杯であるかどうか判定し、一杯のときは
ステツプ17−7においてAMEM3−4’最下位のア
ドレスを削減する。その後、ステツプ17−9におい
て、アドレスを頻度=0でAMEMの3−4’先頭に登
録する。
【0086】また、以上の第1,第2の実施例の説明に
おいては、単語単位で変換することを想定しているが、
一括変換(連文節変換)に応用することも容易である。
その時は、変換された連文節が複合語を構成し得るかど
うかを判定し、複合語であると判定されれば、第1の実
施例と同様の方式で複合語をUSRDに登録し、そのア
ドレスを記憶することにより実現できる。
【0087】また、以上の第1,第2の実施例の説明に
おいては、AMEMにアドレスを記憶していたが、アド
レス以外でも単語のDIC上の位置を示す情報(例え
ば、単語番号等)であれば、同様の仕組みで実現でき
る。
【0088】また、以上の第1,第2の実施例の説明に
おいては、先頭読みの1文字により短縮変換するように
したが、読みのプレフイツクスとなるn文字(例えば、
読み先頭の2文字)で短縮変換するように拡張すること
は容易である。例えば、読み先頭2文字による短縮変換
の場合は、DIC、USRDのインデツクス部を読み2
文字に対して構成することにより実現できる。
【0089】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによつて達成される場合にも適用で
きることは言うまでもない。
【0090】
【発明の効果】以上の説明から明らかなように本発明に
よれば、複合語に対しても短縮変換ができ、操作性の高
い、文字処理装置を実現することができる。
【図面の簡単な説明】
【図1】本発明に係る文字処理装置の第1の実施例の構
成を示すブロツク図である。
【図2】第1の実施例による変換例を示した図である。
【図3】第1の実施例によるYBUFの構成を示す図で
ある。
【図4】第1の実施例によるOBUFの構成を示した図
である。
【図5】第1の実施例によるDOBUFの構成を示した
図である。
【図6】第1の実施例によるDICの構成を示した図で
ある。
【図7】第1の実施例によるUSRDの構成を示した図
である。
【図8】第1の実施例によるAMEMの構成を示した図
である。
【図9】第1の実施例によるKANBUFの構成を示し
た図である。
【図10】第1の実施例によるキー入力を取り込んで処
理を行なう動作を説明するフローチヤートである。
【図11】第1の実施例によるステツプ10−11の
「次候補処理」を詳細に説明するフローチヤートであ
る。
【図12】第1の実施例によるステツプ10−9の「短
縮変換処理」を詳細に説明するフローチヤートである。
【図13】第1の実施例によるステツプ10−13の
「読み学習処理」を詳細に説明するフローチヤートであ
る。
【図14】第1の実施例によるステツプ10−17の
「短縮データ登録」を詳細に説明するフローチヤートで
ある。
【図15】第1の実施例によるステツプ14−2,14
−7の「短縮メモリに登録」を詳細に説明するフローチ
ヤートである。
【図16】第2の実施例によるステツプ10−9の「短
縮変換処理」を詳細に説明するフローチヤートである。
【図17】第2の実施例によるステツプ14−2,14
−7の「短縮メモリに登録」を詳細に説明するフローチ
ヤートである。
【符号の説明】
1 CPU 2 ROM 2−1 DIC 3 RAM 3−1 YBUF 3−2 STBUF 3−3 DOBUF 3−4 AMEM 3−5 USRD 3−6 KANBUF 4 DISK 5 KB 6 CR 7 DBUF 8 CRTC 9 CRT 10 CG

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】予め単語を読みと表記との対応関係で記憶
    する記憶手段を備えた文字処理装置において、少なくと
    も1文字を含む文字列で読みを入力する入力手段と、前
    記入力手段で入力した読みを前記記憶手段を用いて表記
    に変換する変換手段と、前記変換手段で変換した表記の
    前記記憶手段での位置情報を登録する登録手段と、前記
    変換手段で変換した表記と前記登録手段で直前に登録し
    た位置情報に対応した表記とを組み合わせた文字列が複
    合語であるか否かを判断する判断手段と、前記判断手段
    が複合語であると判断した場合、前記登録手段で直前に
    登録した位置情報を前記複合語を構成する全単語の位置
    情報に更新し、かつ、前記全単語の位置情報に対応させ
    て前記複合語の読みを追加する更新手段と、前記入力手
    段で短縮型の読みを入力したときに該短縮型の読みを含
    む読みを有した複合語の各位置情報を前記登録手段で登
    録した内容から検出する検出手段と、前記検出手段で検
    出した各位置情報に対応した表記を前記記憶手段から読
    み出して合成する合成手段とを備えることを特徴とする
    文字処理装置。
  2. 【請求項2】前記検出手段は、前記短縮型の読みを前記
    複合語の先頭部分の読みと照合する手段を含むことを特
    徴とする請求項1記載の文字処理装置。
  3. 【請求項3】前記短縮型の読みは、前記複合語の先頭文
    字からの読みの一部であることを特徴とする請求項2記
    載の文字処理装置。
JP3156505A 1991-06-27 1991-06-27 文字処理装置 Withdrawn JPH056361A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3156505A JPH056361A (ja) 1991-06-27 1991-06-27 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3156505A JPH056361A (ja) 1991-06-27 1991-06-27 文字処理装置

Publications (1)

Publication Number Publication Date
JPH056361A true JPH056361A (ja) 1993-01-14

Family

ID=15629233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3156505A Withdrawn JPH056361A (ja) 1991-06-27 1991-06-27 文字処理装置

Country Status (1)

Country Link
JP (1) JPH056361A (ja)

Similar Documents

Publication Publication Date Title
JPH056361A (ja) 文字処理装置
JPH056362A (ja) 文字処理装置
JPH08190558A (ja) 文字間挿入装置および挿入方法
JPH056360A (ja) 文字処理装置
JP2592793B2 (ja) 文字処理方法
JPH0115906B2 (ja)
JPH056359A (ja) 文字処理装置
JP2688651B2 (ja) 文字列変換装置
JPS63155262A (ja) 日本語処理方法および装置
JPH0630099B2 (ja) 日本語処理装置
JP2744241B2 (ja) 文字処理装置
JPH08287060A (ja) 文字処理装置および文字処理方法
JPH0414381B2 (ja)
JPS61175854A (ja) 仮名漢字変換装置
JPH0922411A (ja) 文書処理方法及びその装置
JPH0736912A (ja) 翻訳支援装置
JPH07271787A (ja) 読み文字列変換装置
JPH07271788A (ja) 読み文字列変換装置
JPH076172A (ja) ワードプロセッサ
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPH11345230A (ja) 文書処理装置
JPH0622025B2 (ja) 文字処理装置
JPH03269664A (ja) 文字処理装置
JPH0638260B2 (ja) 文字処理装置及びその方法
JPH03245260A (ja) 文書処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980903