JPS62198952A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPS62198952A
JPS62198952A JP61041277A JP4127786A JPS62198952A JP S62198952 A JPS62198952 A JP S62198952A JP 61041277 A JP61041277 A JP 61041277A JP 4127786 A JP4127786 A JP 4127786A JP S62198952 A JPS62198952 A JP S62198952A
Authority
JP
Japan
Prior art keywords
word
frequency
words
changed
frequencies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61041277A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61041277A priority Critical patent/JPS62198952A/ja
Publication of JPS62198952A publication Critical patent/JPS62198952A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はかな漢字変換を行なうことにより日本文を入力
する文字処理装置における辞書の管理方式に関係する。
〔従来の技術〕
日本文、特に漢字を入力する文字処理装置においては、
オペレータがキーボードより入力したい漢字に対応する
読みを入力して変換指示を与えることにより読みを漢字
に変換して入力するいわゆるかな漢字変換により漢字入
力を実現する方法が広く行なわれている。
上記の方法において一つの読みに対して複数の漢字列が
存在する場合、優先度の高い候補から表示される。その
優先度は単語の使用頻度をもとに決定される。しかし、
単語の使用頻度は文章の分野によって異り、また、個人
によっても異る。そこで、一度使用された単語は次回か
らは使用頻度をあげてやる、いわゆる学習処理が行われ
ている。
〔発明が解決しようとする問題点〕
しかし、非常に頻度の低い単語の頻度を高めてやるため
には、何度もその単語を選択していかなければならない
という煩わしさがあった。また、頻度の高い単語の頻度
を下げるためには、その単語と同音の単語を全て学習さ
せほかの同音語の頻度を高めることによってしか、頻度
の高い単語の頻度を下げることができなっかった。
〔問題点を解決する為の手段〕
木発明は上記の問題点を解決する為に、頻度を変更する
単語リストを予め記憶する頻度変更単語リスト記憶手段
と単語の頻度を変更するための指示を与え、頻度変更単
語リスト記憶手段によって記憶された辞書中の単語の頻
度を一括して変更する手段を備える。
(作 用) 頻度変更単語リスト記憶手段に記憶された単語に対して
、一度に辞書中の単語の頻度を自由に設定できる。また
、リスト形式であるために、一度に多数の単語の頻度を
変更でき、多数の単語の頻度を変更する際の手間を簡略
化し、オペレータの頻度変更の際に生じるミスを軽減し
、頻度を変更した単語を確認しやすくできる。
(実施例) 以下図面を参照して本発明の詳細な説明する。
第1図は本発明の詳細な説明する図である。
頻度変更単語リスト入力手段によって入力された、頻度
変更する単語の読みや表記のリストは、頻度変更単語リ
スト記憶手段によって記憶される。一括単語頻度変更指
示手段によって一括単語頻度変更の指示が与えられると
、一括単語頻度変更手段によって頻度変更単語リストに
記載されている単語の辞書中の頻度を一括して変更する
第2図は木発明の全体構成の一例である図示の構成にお
いて、CPUは、マイクロプロセッサであり、文字処理
のための演算、論理判断等を行ない、アドレスバスAB
、コントロールバスCB、データバスDBを介して、そ
れらのバスに接続された各構成要素を制御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
次にROMは、読出し専用の固定メモリであり、第6図
〜第12図につき後述するマイクロプロセッサCPUに
よる制御の手順等を記憶させておく。
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
TBUFは文書バッファであり、キーボードKBより入
力された文書データを蓄えるためのメモリである。
DrCはかな漢字変換を行なうための辞書である。
Xは文書バッファTBUF中の文書データの文書座標の
X座標、yは文書バッファTBUF中の文書データの文
書座標のY座標である。
YOM Iは頻度を変更する1単語の読みを格納するバ
ッファ、KANJIは頻度を変更するliX語の漢字を
格納するバッファ、Glは頻度を変更するl単語の読み
を格納するバッファ、HINDOは頻度を変更する1単
語の読みを格納するバッファである。
iは・単語の読みYOM Iや漢字KANJIの1文字
分の文字データを示すポインタである。
KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号入カキ−1及び、
変換キー、一括単語登録キー等の本文字処理装置に対す
る各種機能を指示するだめの各種のファンクションキー
を備えている。
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUによリ、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対する表示装置CRT上の位置にカーソ
ルを表示する。
DBLIFは表示用バッフアメそりで、TBUFに蓄え
られた文書情報等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
また、CRTは陰極線管等を用いた表示装置であり、そ
の表示装置CRTにおけるドツト構成のパターンおよび
カーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って、各種の制御が行なわれる。
第3図は一括単語頻度変更を行なう文書バッファTBU
F中の文書データに格納される頻度変更単語リストのフ
ォーマットを示す図である。
1行に1単語ずつ、頻度変更する単語の情報をキーボー
ドKBから入力していき、各行の1文字目から単語の読
みを入力し、10文字目から単語の表記を入力し、15
文字目から単語の文法情報を入力し、20文字目から変
更する単語の頻度情報を入力する。・ 第4図は本発明における文書バッファTBUFに格納さ
れる文書データの構成を示す図である。
(a)は文書バッファTBUFがいくつかの行データに
区分されて格納されていることを示す。
各行データに対して文書座標が割り付けられ、例えば、
1行目のデータを指示するときは文書座標のY座標、y
=1と設定するものとする。各行データの長さは固定で
あり、各行128バイトで構成される。
(b)は各行データの構造を示す図である。行データは
64個の文字データより構成される。各文字データに対
して文書座標が割り付けられ、例えば、1文字目のデー
タを指示するときは文書座標のX座標x=1と設定する
ものとする。各文字データの長さは固定であり、各文字
2バイトで構成される。
文字データにはJIS  C−6226コードを使用し
、文書データで文字が格納されていない領域にはOが埋
められている。
第5図は本発明における辞書DICの構成を示した図で
ある。
YFは読み部であり、単語の読みを1文字2バイトで最
高8文字まで格納する。コードはJIS  C−622
6コードを使用し、余った領域にはOを埋める。YF 
(i)は辞書DICの先頭からi番目の単語の読み部で
ある。
KFはα字部であり、単語の表記を1文字2バイトで最
高3文字まで格納する。コードはJIS  C−622
6コードを使用し、余った領域には0を埋める。KF(
i)は辞書DICの先頭からi番目の単語の表記部であ
る。
GFは文法情報部であり、その単語の品詞等の文法情報
を格納する。GF (i)は辞書先頭からi番目の単語
の文法情報部である。
HFは頻度情報部であり、その単語の頻度を1から25
6の数値で格納する。HF (i)は辞書DICの先頭
からi番目の単語の頻度情報部である。
各単語はすべて26バイトで構成される。
上述の実施例の作動をフローに従って説明する。
第6図は本発明文字処理装置の動作を示すフローチャー
トである。
ステップ6−1においてキーボードKBよりキーが押下
され、割り込みが発生するのを待つ。
キーが入力されるとステップ6−6にてキー判別をし、
キーの種類に応じて6−2.6−3.6−4のいずれか
のステップに分岐する。
ステップ6−2は変換キーが押下されたときの処理であ
り、入力された読み列を漢字列に変換する処理であり、
同種の文字処理装置において一般に行なわれている処理
であり、公知であるので、特に詳細な記述はしない。
ステップ6−3は一括単語頻度変更キーが入力されたと
きの処理であり、文書バッファTBUF中の文書データ
に格納されている頻度変更単語リストに従って、指定さ
れた辞書DICの単語の頻度を変更する。
ステップ6−4は変換キー、一括単語頻度変更キー以外
のキーの通常のキーが(例えばカーソル移動キー)を入
力した場合の処理であり、同種の文字処理装置において
一般に行なわれている処理であり、公知であるので、特
に記述しない。
ステップ6−5は上記の編集処理の結果、変更された部
分を表示する表示処理である。文書データ中の1文字読
んではパターンに展開し、表示バッファDBUFに出力
するという通常広く行なわれている処理である。
第7図はステップ6−3の処理を詳細化したフローチャ
ートである。
ステップ7−1において文書データの1行目のデータ(
すなわち、頻度変更単語リストの最初の単語のデータ)
を取り込むために、文書座標のY座標yに1を代入する
ステップ7−2において文書データのy行目にデータが
存在するかどうかを、y行目の1文字目の文字データを
0と比較することによってチェックし、もし存在すれば
ステップ7−3に進み、存在しなければ一括単語頻度変
更処理が終了したものとみなし、リターンする。
ステップ7−3において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy番目の単語)の
読みを取り込む。
ステップ7−4において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy番目の単語)の
漢字を取り込む。
ステップ7−5において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy−番目の単語)
の文法情報を取り込む。
ステップ7−6において、文書データのy行目に格納さ
れている単語(すなわち!#語りストのy番目の単語)
の頻度を取り込む。
ステップ7−7において、ステップ7−3.ステップ7
−4.ステップ7−5において取り込んだ単語と一致す
る辞書DIC中の単語の頻度をステップ7−6において
取り込んだ頻度に変更する。
ステップ7−8において、次の行に格納されている単語
のデータを取り込むために、文書データの配列の行変数
yの値を1だけインクリメントし、ステップ7−2へ進
む。
第8図はステップ7−3の処理を詳細化したフローチャ
ートである。
ステップ8−1において、頻度を変更する単語の読みバ
ッファY OM I ’le Oクリアし、読みバッフ
ァへのポインタiに1を代入する。
ステップ8−2において、文書データのy行目の1文字
目から格納されている単語の読みの1文字目を取り込む
ために、文書座標のX座標Xに1を代入する。
ステップ8−3において、単語の読みが終ったかどうか
をチェックするために、y行目のX桁目の(文書座標の
X座標x、Y座標yで指定される)文字データを0と比
較し、等しければ、単語の読みが終ったものとしてリタ
ーンする。等しくなければ、ステップ8−4に進む。
ステップ8−4において、文書座標のX座標x、Y座標
yで指定される単語の読みのi文字目の文字コードを、
頻度を変更する単語の読みバッファYOM Iのポイン
タiで指定される位置に取り込む。
ステップ8−5において、文書データ中の次の文字を取
り込むために文書座標のX座標Xと読みバッファへのポ
インタiの値を1だけインクリメントする。
ステップ8−6において、頻度変更単語リストのIII
L語の読みが8文字を越えたかどうかをiを8と比較す
ることによってチェックし、越えていたらリターンする
。越えていなければステップ8−3に進む。
第9図はステップ7−4の処理を詳細化したフローチャ
ートである。
ステップ9−1において、頻度を変更する単語の漢字バ
ッファKANJIを0クリアし、漢字バッファへのポイ
ンタiに1を代入する。
ステップ9−2において、文書データのy行目の10文
字目から格納されている単語の漢字の1文字目を取り込
むために、文書座標のX座標Xに10を代入する。
ステップ9−3において、単語の漢字が終ったかどうか
をチェ・ツクするために、y行目のX桁目の(文書座標
のX座標x、Y座標yで指定される)文字データを0と
比較し、等しければ、単語の漢字が終ったものとしてリ
ターンする。等しくなければ、ステップ9−4に進む。
ステップ9−4において、文書座標のX座標x、Y座標
yで指定される単語の漢字のi文字目の文字データを、
頻度を変更する単語の漢字バッファKANJIのポイン
タiで指定される位置に取り込む。
ステップ9−5において、文書データ中の次の文字を取
り込むために文書座標のX座標Xと読みバッファへのポ
インタiの値を1だけインクリメントする。
ステップ9−6において、頻度変更単語リストの単語の
漢字が3文字を越えたかどうかをiを3と比較すること
によってチェックし、越えていたらリターンする。越え
ていなければステップ9−3に進む。
第10図はステップ7−5の処理を詳細化したフローチ
ャートである。
ステップ10−1において、単語の文法情報バッファG
lを0クリアする。
ステップ10−2において、文書データのy行目の15
文字目から格納されている単語の文法情報を取り込むた
めに、文書座標のX座標Xに15を代入する。
ステップ10−3において、単語の文法情報を単語の文
法情報バッファGlに取り込み、リターンする。
第11図はステップ7−6の処理を詳細化したフローチ
ャートである。
、 ステップ11−1において、単語の頻度情報バッフ
ァHINDOを0クリアする。
ステップ11−2において、文書データのy行目の20
文字目から格納されている単語の頻度情報を取り込むた
めに、文書座標のX座標Xに20を代入する。
ステップ11−3において、単語の頻度情報を単語の頻
度情報バッファHINDOに取り込み、リターンする。
第12図はステップ7−7の処理を詳細化したフローチ
ャートである。
ステップ12−1において、頻度を変更する単語の読み
バッファYOM Iの内容と一致する読み部YFを持つ
辞書DIC中の単語をサーチする。
辞書DIC中の単語を単語の読みによってサーチする方
法は公知であるので詳細な説明は省略する。
ステップ12−2において、サーチした結果、頻度を変
更する単語の読みバッファYOM Iの内容と一致する
読み部YFを持つ辞書DIC中の単語が見つかればステ
ップ12−3に進み、見つからなければリターンする。
ステップ12−3において、サーチされた辞書DIC中
の単語の漢字部KFが頻度を変更するJrL語の漢字バ
ッファと一致するかどうかをチェックする。一致してな
ければステップ12−6に進む。一致していればステッ
プ12−4に進む。
ステップ12−4において、サーチされた辞書DIC中
の単語の文法情報部GFが頻度を変更する単語の文法情
報バッファGIと一致するかどうかをチェックする。一
致してなければステップ12−6に進む。一致していれ
ばステップ12−5に進む。
ステップ12−5において、サーチされた辞書DIC中
の単語の頭皮情報部HFに頻度情報バッファHINDO
の内容を代入して単語の頻度を変更する。
ステップ12−6において、サーチされた辞書DIC中
の41語の次の単語から、再度頻度を変更する単語の読
みバッファYOM Iの内容と一致する読み部YFを持
つ辞書DIC中の単語をサーチする。
ステップ12−7において、サーチした結果、頻度を変
更する単語の読みバッファYOM Iの内容と一致する
読み部YFを持つ辞書DIC中の単語が見つかればステ
ップ12−3に進み、見つからなければリターンする。
以上の説明において、辞書構造としては単語長が固定長
の辞書を想定しているが、可変長の単語長で構成した、
より圧縮された辞書構造であっても同様に処理を行なう
ことができる。また、辞書に登録されている単語は辞書
の読みによってソートされていなかったが、単語の読み
によってソートされた辞書構造であっても同様に処理で
きる。
また、頻度変更単語リストは定められた位置から単語の
読みや表記などが記述するフォーマットであったが、単
語の読みや表記などが識別できるものであれば、どのよ
うなフォーマットを用いてもよい。
また、以上の実施例においては頻度変更単語リストの入
力をキーボードから行なっていたが、フロッピーディス
クなどの外部記憶装置から入力してもよい。
以上の説明からも明らかなように、本発明によれば、単
語の頻度を一度の指示で直接変更できるので、単語の頻
度を変更する操作が従来と比較して非常に簡単になった
。また、複数の単語の頻度を一括して変更できるために
、単語を多数頻度変更するときに、オペレータの操作の
負担が軽減され、単語を頻度変更する際の操作ミスが減
少し、また、頻度変更された単語の確認が容易である、
操作性の優れた文字処理装置を実現できた。
【図面の簡単な説明】
第1図は本発明の概念を示す図、 第2図は本発明の全体構成のブロック図、第3図は頻度
変更単語リストのフォーマット例を説明した図、 第4図は本発明の文書データの構造の例を示す図、 第5図は本発明の辞書構成の例を示す図、第6図〜第1
2図は本発明文字処理装置の動作を示すフローヂャート

Claims (1)

  1. 【特許請求の範囲】 複数単語をその読みと表記と頻度との対応をとって収容
    した辞書手段と、 前記辞書手段に登録されている単語の中で、頻度を変更
    する単語の読みと表記を入力する頻度変更単語リスト入
    力手段と、 前記入力された頻度変更単語リストを記憶する頻度変更
    単語リスト記憶手段と、 前記頻度変更単語リストに記載されている単語と一致す
    る前記辞書手段に登録されている単語の頻度を変更する
    ことを指示する一括単語頻度変更指示手段と、 前記一括単語頻度変更指示手段に従って、頻度変更単語
    リストに記載されている単語と一致する前記辞書手段に
    登録されている単語の頻度を変更する一括単語頻度変更
    手段とを有することを特徴とする文字処理装置。
JP61041277A 1986-02-26 1986-02-26 文字処理装置 Pending JPS62198952A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61041277A JPS62198952A (ja) 1986-02-26 1986-02-26 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61041277A JPS62198952A (ja) 1986-02-26 1986-02-26 文字処理装置

Publications (1)

Publication Number Publication Date
JPS62198952A true JPS62198952A (ja) 1987-09-02

Family

ID=12603947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61041277A Pending JPS62198952A (ja) 1986-02-26 1986-02-26 文字処理装置

Country Status (1)

Country Link
JP (1) JPS62198952A (ja)

Similar Documents

Publication Publication Date Title
JPH07114568A (ja) データ検索装置
JPS6120004B2 (ja)
JPS62198952A (ja) 文字処理装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JPS62198953A (ja) 文字処理装置
JPS62198957A (ja) 文字処理装置
JPS62198955A (ja) 文字処理装置
JP2744241B2 (ja) 文字処理装置
JPS62198956A (ja) 文字処理装置
JPS62198954A (ja) 文字処理装置
JP2786260B2 (ja) かな漢字変換装置
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP2862236B2 (ja) 文字処理装置
JP2603269B2 (ja) 文字処理装置
JP2771020B2 (ja) 文字処理装置
JP2688651B2 (ja) 文字列変換装置
JPS6265162A (ja) かな漢字変換方法及び装置
JPH08287060A (ja) 文字処理装置および文字処理方法
JPH06119314A (ja) 文書作成装置
JPH07200565A (ja) 文字処理装置
JPS63259763A (ja) 文字処理装置
JPH027161A (ja) 文字処理装置
JPH0731679B2 (ja) 文字処理装置
JPH10187700A (ja) 文書処理装置
JPH0769907B2 (ja) 文字処理装置