JPS63250772A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPS63250772A
JPS63250772A JP62085272A JP8527287A JPS63250772A JP S63250772 A JPS63250772 A JP S63250772A JP 62085272 A JP62085272 A JP 62085272A JP 8527287 A JP8527287 A JP 8527287A JP S63250772 A JPS63250772 A JP S63250772A
Authority
JP
Japan
Prior art keywords
reading
word
dictionary
ybuf
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62085272A
Other languages
English (en)
Inventor
Yuji Kobayashi
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62085272A priority Critical patent/JPS63250772A/ja
Publication of JPS63250772A publication Critical patent/JPS63250772A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字列の変換を行なう文字処理装置において
、非漢字符号を含む表記を変換することのできる文字処
理装置に関するものである。
[従来の技術] 従来、文字列の変換を行なう文字処理装置として1例え
ば操作者が入力したい漢字に対応する読みを入力して変
換指示を与えることにより、読みを漢字に変換して入力
する、いわゆるカナ漢字変換を行なう文字処理装置が実
現されている。
上記装置に、おてるカナ漢字変換においては、入力され
た読みに対応する単語があるかどうか辞書を検索し、見
つかった表記を変換候補として出力している。また、読
み通りの単語が辞書に登録されていなくとも複合語生成
処理を行なうことによって、自動的に変換候補を生成す
ることができる。そのためよく使用する単語はすべて辞
書に登録しておけば読みを指定することにより、いつで
も所望の変換結果を得ることができる。
[発明が解決しようとしている問題点]しかしながら上
記従来例ては、踊り字など非漢字である符号を含む単語
の変換を望む場合。
その単語表記か辞書に登録されていないと変換てきず、
非漢字符号を特殊記号入力など通常のカナ漢字変換とは
別の方法で再入力しなくてはならず、操作性の良い入力
か期待できなかった。ここて°踊り字”とは「同じ文字
が続くとき、あとの文字に代えて用いる符号」 (学研
国語大辞典学習研究社)のことであり、「人々」におけ
る「々」や「ま\」における「\」などがその例である
[問題点を解決するための手段(及び作用)]本発明の
目的は、上記従来例の欠点を除去することにある。
すなわち、非漢字符号が表記に出現しやすい読みを判定
する手段を設けることにより、辞書に登録されていない
単語であっても所望の表記に変換できる文字処理装置を
提供することである。
その為に本発明は以下の手段を備える。
すなわち、踊り字が用いられる単語は、通常その単語の
読みも同じ読みが重なっていることが多いため、入力読
み列が同音の連続形であるかどうかを判定し、同音の連
続形であるならばその重なりのある読みに対応する表記
を検索し、その直後に踊り字を付加することによって、
辞書に登録されていない単語であっても所望の表記に変
換する変換手段を備えることである。これによって、例
えば「はんはん」を変換すると、「はん」に対応する表
記「半」に踊り字「々」を合成した「半々」を変換結果
として得ることができる。
[実施例] 以下、図面を参照して本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印火する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
次にROMは、読出し専用の固定メモリである。PAは
、第6図〜第8図につき後述するマイクロプロセッサC
PUによる制御手順等を記憶させたプログラムエリアで
ある。
また、RAMは、lワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
TBUFは文書バッファであり、キーボードKBより入
力された文書情報を蓄えるためのメモリである。。
YBUFはキーボードKBにあるカナ入カキ−KANA
より入力されたカナ読みコードを蓄えるためのバッファ
である。
YLENはYBUFに蓄えられている読みの文字数を格
納する。
HYLENはYLENの雅の値を算出して格納するレジ
スタ変数である。
FYBUFはYBUFに格納されている文字コードのう
ち、バッファ先頭からHYLEN文字分を取り出した前
半部読みバッファである。
BYBUFはYBUFに格納されている文字コードのう
ち、バッファ先頭からFYBUFを除いた残り読みであ
る後半部読みバッファである。
CANは変換の結果を一時的に格納する候補バッファで
ある。
DICはカナ漢字変換を行なうための辞書である。
C,ON Tは“踊り字”のコード「々」を格納する。
KBはキーボードてあって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号入カキ−1及び、
変換を指示する変換キー等の各種のファンクションキー
を備えている。
図において、KANAは読みを入力するためのカナキー
であり、CONは変換キーである。
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
CRはカーソルレジスタである。cpuにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、 TBUFに蓄えられた文書情報等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
また、CRTはl!38iyj管等を用いた表示装置で
あり、その表示装置CRTにおけるドツト構成のパター
ンおよびカーソルの表示をCRTコントローラで制御す
る。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号かマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って、各種の制御か行なわれる。
第2図は、本発明文字処理装置の実行例と、従来例を比
較した図である。
図において、CRT画面に表示したカーソルおよび文書
を対象としている。
(1)において、漢字に変換したい読みrかずかずJを
入力する。
(2ンにおいてアングラインが付いているのは読み入力
中であることを意味する。そこで変換キーを押下すると
、fかすかず1という読みが辞書に登録されていなけれ
ば、従来例では。
(3)の如くrかすかず」と変換できないが、本発明に
よれば(4)の如< raJとr々」を合成してr数々
Jと所望の変換結果を得ることができる。
第3図は、本発明文字処理装置における辞書(DIC)
の構成を示した図である。
YFは読み部てあり、単一の読みを1文字2バイトて最
高lθ文字まで格納し、余った領域には0を格納する。
KFは漢字部であり、単語の表記を1文字2バイトで最
高4文字まで格納し、余った債城には0を格納する。
GFは文法情報部であり、その単語の品詞などの文法情
報を格納する。
各単語1よすべて20バイトで構成され、辞書線先頭か
ら単語を識別する単語コードが割り付けられている6例
えば、W (i )で示されるのは辞書先頭から1番め
の単語を意味する。
第4図は、文書データバッファTBUFの構成を示した
図である。
文書データは1文字2バイトて表わす。未入力コードと
してOを格納する。
第5図は入力読みコートバッファYBUFの構成を示し
た図である。
キーボードKB上のカナ入カキ−KANAか押下された
とき出力するカナコードを1文字2バイトで蓄える。
第6図は、本発明文字処理装置の動作を示すフローチャ
ートである。
56−1においてキーボードKBよりキーが押下され1
割込みが発生するのを待つ。
キーが入力されると、56−2において入力されたキー
の判別を行ない、キーの種類に応じて56−3.56−
4.56−5のいずれかのステップに分岐する。
56−3は、カナキーKANAが入力されたときの処理
てあり、入力されたカナキーをYBUFに格納する。
56−4は、変換キーCONを入力した場合の処理であ
り、YBUFに蓄えられた読みを辞書DICを参照して
変換する。(第7図にて詳述) S6−5は、KANA−CON−以外の通常のキー(例
えばカーソル移動キーなど)を入力した場合の処理であ
り、同種の文字処理装置において、一般的に行なわれて
いる処理であり、公知であるのて、特に記述しない。
56−6は、上記の編集処理の結果、変更された部分を
表示する表示処理である。文書中のデータを1文字読ん
てはパターンに展開し、表示バッファDBUFに出力す
るという通常広く行なわれている処理である。
第7図は第6図の56−4を詳細化したものである。
S7−・lにおいて入力読みYBUFに従って辞書をサ
ーチする。
57−2において、辞書サーチの結果、入力読み列に対
応する単語かあったかどうかを判断し、もし見つかれば
S7−10へ分岐するが。
見つからなければ以下の処理を行なう。
57−3において入力読み列YBUFが、同音の連続し
たパターン、例、えばrかず」を重ねたrかすかず」、
「てん」を重ねた「てんてんjなどであるかどうかを判
断し、もし同音連続形ならば以下の処理を行ない、そう
でなければ57−8へ分岐する。
57−4において入力読み列YBUFの前半部読み列で
あるFYBUFに従って辞書をサーチする。
57−5において辞書サーチの結果。
FYBUFに対応する単語があったかどうかを判断し、
もし見つかれば以下の処理を行なうが、見つからなけれ
ば57−8へ分岐する。
51−6において辞書サーチの結果見つかった単語の表
記を候補バッファCAMに格納する。
57−7において候補バッファCANに格納されている
表記の末尾に踊り字CON Tを付加する。
57−8は、変換てきなかった場合の処理であり、入力
読み列YBUFをそのまま文書バッファTBUFに出力
する。
57−9は同音連続形の変換結果であるCAMを文書バ
ッファTBUFに出力する。
S7−10は入力読み列YBUFに対応する単語かあっ
た場合の処理であり、見つかった単語の表記を文書バッ
ファTBUFに出力する。
第8図は第7図の87−3を詳細化したものである。
58−1において入力読み列長YLENが2文字以上で
あるかどうかを判断し、もし2文字以上であるならば以
下の処理を行なうが、そうてなければ58−7へ分岐す
る。
58−2において、HYLENにYLENの局の値を格
納する。
58−3においてYBUF先頭から )fYLEN分の読みをFYBUFに格納する。
58−4において入力読み列YBUFからのFYBUF
の読みを除いた残り読みを BYBUFに格納する。
58−5においてFYBUFの内容と BYBUFの内容が一致するかどうかを判断し、もし一
致するならば、以下の処理を行なうが、そうでなければ
58−7へ分岐する。
58−6において同音連続形であると判断し58−7に
″おいて同゛音連続形でないと判断しリターンする。
[他の実施例] 以上の実施例の瞳明において、辞書構造としては、単語
長が固定長の辞書を想定しているが、可変長の単語長で
構成した、より圧縮された辞書構造であっても同様に処
理を行なうことができる。
実施例においては、同じ読みの重なりであるかどうかを
判定するのに完全に一致するかどうかて判定をしている
が、「さまざま」とか「ひとびと」などの単語に対応す
るため、読みの一致性判定の際に濁音・半濁音の変換チ
ーツルを用意し、清音以外にも対応できるようにするこ
ともできる。
また、実施例中でメモリC0NTに格納する踊り字の表
記は、「々」に限らず、通常よく用いられる「\」など
複数の踊り字を格納しても良い。
[効果の説明] 以上の説明から明らかなように本発明によれば、踊り字
を表記に含む単語を辞書に登録せずども変換可能である
ため、辞書容量の節約を計ることができ、なおかつ読み
を指定するたけて所望の変換結果を得ることができるた
め、安価で操作性の優れた文字処理装置を実現すること
ができる。
【図面の簡単な説明】
第1藺は本発明の全体構成の一例を示す図。 第2図は従来例と本発明との変換の相違を示した図。 第3図は本発明の辞書構成の例を示す図6第4図は本発
明の文書データの例を示す図。 第5図は本発明の入力読みバッファの例を示す図。 第6図〜第8図は本発明文字処理装置の動作を示すフロ
ーチャート。

Claims (1)

  1. 【特許請求の範囲】 単語の読みを入力する入力手段と、 単語の読みと表記との対応をとって収容した辞書と、 前記入力手段から入力された読みを前記辞書を参照して
    表記に変換する変換手段と、 入力された読みが同じ読みの連続形であるかどうかを判
    定する判定手段とを備え、 前記変換手段は、前記判定手段により同読み連続である
    と判定された入力読み列に対し、非漢字符号を付加した
    候補を出力することを特徴とする文字処理装置。
JP62085272A 1987-04-07 1987-04-07 文字処理装置 Pending JPS63250772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62085272A JPS63250772A (ja) 1987-04-07 1987-04-07 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62085272A JPS63250772A (ja) 1987-04-07 1987-04-07 文字処理装置

Publications (1)

Publication Number Publication Date
JPS63250772A true JPS63250772A (ja) 1988-10-18

Family

ID=13853928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62085272A Pending JPS63250772A (ja) 1987-04-07 1987-04-07 文字処理装置

Country Status (1)

Country Link
JP (1) JPS63250772A (ja)

Similar Documents

Publication Publication Date Title
JPS63250772A (ja) 文字処理装置
JPS5818730A (ja) 文字処理装置
JPH0452500B2 (ja)
JPH0115906B2 (ja)
JPS5819936A (ja) 漢字入力装置
JP2593433B2 (ja) 文字処理装置
JPS59140541A (ja) 文字処理装置
JP2744241B2 (ja) 文字処理装置
JPH0778795B2 (ja) 文字処理装置
JPH0628075A (ja) 日本語入力用キーボード入力装置
JPS60207948A (ja) カナ漢字変換処理装置
JPH0683807A (ja) 文書作成装置
JP2000187659A (ja) かな漢字変換方法、かな漢字変換装置、及び記憶媒体
JPH10154141A (ja) かな漢字変換装置
JPH04160668A (ja) 文字処理装置
JPS63250775A (ja) 文字処理装置
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPS62125465A (ja) 文書デ−タ処理装置
JPH03286251A (ja) 文字処理装置
JPH027161A (ja) 文字処理装置
JPH0610804B2 (ja) かな漢字変換装置
JPH03286250A (ja) 文字処理装置及びその方法
JPH08287060A (ja) 文字処理装置および文字処理方法
JPH0638258B2 (ja) 文字処理装置
JPH02255936A (ja) 文書作成編集装置