JPH04120656A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH04120656A
JPH04120656A JP2240159A JP24015990A JPH04120656A JP H04120656 A JPH04120656 A JP H04120656A JP 2240159 A JP2240159 A JP 2240159A JP 24015990 A JP24015990 A JP 24015990A JP H04120656 A JPH04120656 A JP H04120656A
Authority
JP
Japan
Prior art keywords
word
character
character string
kana
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2240159A
Other languages
English (en)
Inventor
Naomi Suzuki
直美 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2240159A priority Critical patent/JPH04120656A/ja
Publication of JPH04120656A publication Critical patent/JPH04120656A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文書処理装置に関し、特に、例えば、文書作成
及び編集を行う文書処理装置に関する。
[従来の技術] 従来、かな漢字変換処理を行なう文書処理装置において
、入力したかな文字列を、かな漢字変換し複数の異なる
文字が変換結果とじてか得られる(いわゆる同音異義語
)場合、これを出力する順序は、変換処理に利用する単
語辞書にあらかじめ登録されている単語使用頻度及び文
書処理装置利用者の単語使用頻度などの情報を利用して
決定されていた。また、1つの単語に複数の文字種によ
る表記法がある場合、利用者が複数の表記の中から望む
表記を選択する作業を行っていた。
[発明が解決しようとする課題] しかしながら上記従来例では、1つの単語を2種類以上
の表記法で表わすことができる場合(例えば、虎は“と
ら”、“トラ”、“虎”と表記できる。)、かな漢字変
換結果の出力順の決定において、単語の意味分類(例え
ば、“虎′°という単語は“動物”という意味分類に分
類される。)を考慮しないため、同じ意味分類の単語表
記をすべて1種類の表記法に統一するためには、利用者
自身が該当する単語1つ1つを望む表記にするための選
択作業をしなければならなかった。特に、利用者が、あ
らかじめ、ある意味分類に属する単語をどのような表記
にするかを考慮していたにもかかわらず、文書量が多(
、利用者にとって望ましくない表記が頻繁に出力された
場合、表記選択作業をやり直さなければならず、また、
それは操作ミスをまねき利用者にとって大きな負担とな
っているという欠点があった。
本発明は上記従来例に鑑みてなされたもので、単語の意
味分類を考慮し、不適切な表記箇所を利用者に知らせる
ことができる文書処理装置を提供することを目的とする
[課題を解決するための手段] 上記目的を達成するために本発明の文書処理装置は以下
の様な構成からなる。即ち、 かな漢字変換された文字列を入力し、前記文字列の表記
をチェックする文書処理装置において、複数の単語の読
みと、前記読みに対応する表記と、前記読みと前記表記
とが表す単語の範略を格納する第1記憶手段と、前記範
疇と前記範疇に属する単語を表記すべき文字種別を格納
する第2記憶手段と、前記文字列を格納する第3記憶手
段と、前記第3記憶手段に格納された前記文字列を読み
出し、前記文字列を構成する各単語について、前記第1
記憶手段から対応する表記を検索する検索手段と、前記
検索手段によって検索された表記に対応する単語の範疇
を、第2記憶手段に格納された前記単語の範疇に対応す
る文字種別と比較し、該比較結果に基づいて表記の出力
を制御する制御手段とを有することを特徴とする文書処
理装置を備える。
[作用] 以上の構成により本発明は、入力された文字列の読みと
一致する読みの表記の意味を調べ、不適切な表記は表示
を変えて表示するよう動作する。
[実施例] 以下添付図面を参照して本発明の好適な実施例を詳細に
説明する。
第1図は本発明の代表的な実施例である文書処理装置の
構成を示すブロック図である。第1図において、文書処
理装置は、CPUl0、コントロールバス(CB)20
、データバス(DB)30、アドレスバス(AB)40
.ROM50、RAM60、キーボード(KB)70、
カーソルレジスタ(CR)80、表示データバッファ(
DBUF)90、CRT制御部(CRTC)100、C
RTIIO、キャラクタジェネレータ(CG)120及
びディスク(DISK)130とから構成されている。
このような文書処理装置で、CPUl0は、文字処理の
ための演算及び論理判断等を行ない各種バスを介して、
それらのバスに接続された構成要素を制御する。ここで
各種バスの内、アドレスバス(AB)40は、CPUl
0の制御対象となる構成要素を指示するアドレス信号を
転送する。また、コントロールバス(CB)20はCP
Ul0の制御対象とする各構成要素のコントロール信号
を転送する。さらに、データバス(DB)30は各構成
機器相互間のデータの転送を行なう。
ROM50内には、かな漢字変換処理にための単語辞書
(以後、これをDICTという。)が格納されている。
第3図にDICTの構造を示す。
DICTには、単語名々について、単語の読み、その表
記及び意味分類とが辞書情報として単語の読みコード順
にソーティングされて登録されている。また、ROM5
0内にはDICTIC上、後述の入出力制御プログラム
がCNTLとラベルされた領域に、同様に後述の検索処
理プログラムが5RCHとラベルされた領域に格納され
る。
一方、RAM60は、各構成要素からの各種データの一
時記憶に用いられる。RAM60内には、意味分類とそ
れに対する優先して出力すべき文字種を対にして格納し
た表記規則集(以後、RLと呼ぶ。)を格納する領域及
び検索の対象となる文字列を保存する領域(以後、TB
と呼ぶ。)が確保される。第4図にRLの構造を示す。
CRTIIIfi1部(CRTC)100は、CR80
及びDBUF90に蓄えられたデータ内容をドツトパタ
ーンとしてCRTIIOに表示するための制御及びCR
Tllo上にカーソル表示するための制御を行う。
CG120は、CRTIIOに表示する文字及び記号の
ドツトパターンを記憶するキャラクタジェネレータであ
る。
また、DISK130は、文書記憶装置であり、作成さ
れた文書の保管がなされ、これら保管文書は、必要な時
に呼び圧され、更新される。
上述の構成要素からなる文書処理装置における文字処理
は、KB70からのかな文字入力を契機として開始され
る。まず、KB70からの入力に基づき、インクラブド
信号がCPUl0に送られ、インクラット信号受信後、
CPUl0がROM50内に格納されているDICTと
RAM60に格納されているRLを参照しながら、がな
漢字変換を実行する。その後、変換処理の結果得られた
読h コ−F ニ基づきCG120がCRTC100の
制御のもと文字ドツトパターンを発生しCRTIIOに
表示する。
次に、第5図と第6図に示すフローチャートを用いなが
ら、本実施例におけるかな漢字変換処理について説明す
る。かな漢字変換処理は、入出力制御プログラムによる
キーボード入力制御及びかな漢字変換結果のCRT表示
制御などを行う入出力制御処理と、検索処理プログラム
によるキーボード入力された文字列を用いた単語辞書検
索及び表記規則参照などを行う検索処理から成り立って
いる。
まず、文書処理装置が電源ONの状態になると、かな漢
字変換処理の内、ROM50から入出力制御プログラム
が読み出され、起動され、文書処理装置はKB70から
の入力受付待ち状態となる(SLio)。次に、入力を
受は付けると処理はステップ5115に進み、キーボー
ド入力された文字列はRAM60内の一時格納領域TH
に格納される。そして、入力された文字列が、検索処理
プログラムを起動するコードに対応する文字列であるか
どうかを判定する(S120)。ここで、検索処理(詳
細は後述)を起動する文字コードである場合、ステップ
5130に進み、第6図のフローチャートに示す検索処
理を起動する。
方、入力された文字列が検索処理を起動するものではな
い場合、ステップ5110の入力受付待ち状態に戻る。
検索処理が終了すると、ステップ5135で入出力制御
プログラムに制御が戻り、検索処理の結果得られた内容
でTBに一時的に格納されている文字列を更新し、最後
に、その更新結果を表示用バッファDBUF90に転送
し、CRTClooの制御のもと更新結果に対応する文
字ドツトパターンを発生し、CRTlloに表示する(
S140)。
次に、検索処理について説明する。
本実施例では、動物名はカタカナの文字種で表記するこ
とを前提とし、動物の意味分類に属する単語が、カタカ
ナ以外の文字種(例えばひらがなや漢字など)で表記さ
れていれば、(例えば「犬とサル」の「犬」)この箇所
が利用者に反転表示されるように指示される。ここでは
「いぬ1という文字列が既に入力されているとして説明
する。
検索処理が起動されると、ステップ5200において、
TBに格納されている入力文字列を検索するためのポイ
ンタ(p)を0に初期化し、ステップ5205で入力文
字列の文字数(C)をカウントする。ここでは、「いぬ
1が入力文字列なので、C=2である。
次に、処理はステップ5210に進み、pの値が、入力
文字列の文字数(C)より大きくなり、入力文字列の最
後まで検索したかどうかを判定する。入力文字列の最後
まで検索終了したなら検索処理を終了する。
そうでないなら、処理はステップ5220に進み、単語
辞書中(D I CT)中からの入力された文字列の読
みと一致する単語を検索するため、単語辞書内の単語を
指すアドレスカウンタ(n)を0に初期化し、ポインタ
(p)を+1する。続いて処理は、ステップ3230に
進み、アドレスカウンタ(n)の値が単語辞書の単語数
(N)を越えたかどうかを判定する。ここで、アドレス
カウンタ(n)の値が単語辞書の登録単語数(N)より
多い場合、入力文字列の次の文字から検索するために、
処理はステップS 21. Oに戻る。これに対して、
アドレスカウンタ(n)が単語辞書の登録単語数(N)
より少ない場合、処理はステップ5240に進み、入力
文字列内のポインタ(p)で指示された文字と、単語辞
書内のアドレスカウンタ(n)でアドレスされた単語の
読みが一致するかどうかを判定するために、nを+1し
、アドレスカウンタ(n)でアドレスされた単語のj番
目の文字の読みを比較するためのポインタ(j)をOに
初期化する。
次に、処理はステップ5250に進み、TB内入力文字
列のポインタ(p)から数えてj番目の文字までと、単
語辞書のアドレスカウンタ(n)でアドレスされた単語
のj文字目までの読みを比較する。本実施例の場合、入
力文字列「いぬ」について、最初の一文字であるrい1
が、単語辞書のアドレスカウンタ(n)でアドレスされ
た単語の1文字目と一致したなら、その次の文字である
「ぬJが単語辞書のアドレスカウンタ(n)でアドレス
された単語の2文字目と一致するかを調べる。ステップ
5250において、文字が一致しない場合、ステップ5
230に戻り、次の単語と比較する。これに対して、ス
テップ5250において文字が一致した場合、処理は8
260に進み、さらに次の文字も一致するかどうかを比
較するために、ポインタ(j)を+1する。
次に、ステップ5270でポインタ(j)の値を、アド
レスカウンタ(n)でアドレスされた単語の文字数(W
N)と比較する。jがアドレスカウンタ(n)でアドレ
スされた単語の文字数(WN)と一致する場合、TB内
の入力文字列の内、ポインタ(p)から数えてj番目ま
での文字列はアドレスカウンタ(n)でアドレスされた
単語を表わしているとみなす。本実施例の場合、単語辞
書からアドレスカウンタ(n)でアドレスされた単語が
rいぬj、つまり、その単語の文字数(WN)が2であ
るなら、入力文字列rいぬ」は、単語辞書から検索され
たrいぬJであるとみなす。
続いてステップ5280で、単語辞書から検索された単
語の読みと入力文字列の上述の範囲の文字列が一致した
場合、その単語の表記が、RAM60内に登録されてい
る表記規則集(RL)に登録されている単語の意味分類
に対応する表記文字種と一致するか否かを比較する。比
較結果、表記文字種が一致した場合、検索処理が正しく
実行されたとみなして、次の文字を処理するため、ステ
ップ5300で、ポインタ(p)をj−1だけカウント
アツプを行ってステップ5210に戻る。
これに対して、表記文字種が一致しなかった場合、ステ
ップ5290で表記文字種が正しくない旨を使用者に知
らせるため、その箇所を反転表示するよう指示する。そ
の後、次の文字処理のためステップ5300で、ポイン
タ(p)をj−1だけカウントアツプを行ってステップ
5210に戻る。つまり、本実施例の場合、単語辞書か
ら検索された単語の表記が「イヌ1であったなら、検索
処理が正しく行われたとみなされるが、単語の表記がr
犬1であったなら、その「いぬ」という人力文字列は反
転表示されるように指示される。このようにして、入力
文字列の文字全てについて検索処理を続ける。
従って、本実施例に従えば、入力した文字列に対してか
な漢字変換の結果が、単語の意味分類上不適切であった
としても、その旨を利用者に文字反転表示により通知す
ることができるので、利用者の文字修正作業に資するこ
とができる。
本実施例では、使用者に表記文字種の不適切を通知する
ための手段として、反転表示を用いているが、本発明は
これに限定されるものではない。
例えば、アッパーライン付加、カーソル指示などによっ
ても本発明を適用することができる。
[発明の効果] 以上説明したように本発明によれば、不適切な表記箇所
を利用者に知らせることができる効果がある。従って、
利用者は、不適切な表記箇所を容易に発見し、その箇所
を容易に修正できるという利点も有する。
【図面の簡単な説明】
第1図は本発明の代表的な実施例である文書処理装置の
構成を示すブロック図、 第2図は単語辞書データの構成を示す説明図、第3図は
表記規則データの構成を示す説明図、第4図は入出力制
御処理の処理手順を示すフローチャート、そして、 第5図は検索処理の処理手順を示すフローチャートであ
る。 図中、10・・・CPU、20・・・コントロールバス
、30・・・データバス、40・・・アドレスバス、5
0・・・ROM、60・・・RAM、70・・・キーボ
ード、80・・・カーソルレジスタ、90・・・表示用
バッファメモリ、100・・・CRT、110・・・C
RT制御部、120・・・キャラクタジェネレータ、1
30・・・ディスクである。 代理人 弁理士   大塚康徳(他1名)第 図 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】  かな漢字変換された文字列を入力し、前記文字列の表
    記をチェックする文書処理装置において、複数の単語の
    読みと、前記読みに対応する表記と、前記読みと前記表
    記とが表す単語の範疇を格納する第1記憶手段と、 前記範疇と前記範疇に属する単語を表記すべき文字種別
    を格納する第2記憶手段と、 前記文字列を格納する第3記憶手段と、 前記第3記憶手段に格納された前記文字列を読み出し、
    前記文字列を構成する各単語について、前記第1記憶手
    段から対応する表記を検索する検索手段と、 前記検索手段によつて検索された表記に対応する単語の
    範疇を、第2記憶手段に格納された前記単語の範疇に対
    応する文字種別と比較し、該比較結果に基づいて表記の
    出力を制御する制御手段とを有することを特徴とする文
    書処理装置。
JP2240159A 1990-09-12 1990-09-12 文書処理装置 Pending JPH04120656A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2240159A JPH04120656A (ja) 1990-09-12 1990-09-12 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2240159A JPH04120656A (ja) 1990-09-12 1990-09-12 文書処理装置

Publications (1)

Publication Number Publication Date
JPH04120656A true JPH04120656A (ja) 1992-04-21

Family

ID=17055375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2240159A Pending JPH04120656A (ja) 1990-09-12 1990-09-12 文書処理装置

Country Status (1)

Country Link
JP (1) JPH04120656A (ja)

Similar Documents

Publication Publication Date Title
JPH07114568A (ja) データ検索装置
JPH04120656A (ja) 文書処理装置
JPH0412866B2 (ja)
JP2621999B2 (ja) 文書処理装置
JPS6057422A (ja) 文書目次索引作成装置
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP2975529B2 (ja) 電子化辞書検索装置
JPH0785058A (ja) 情報検索装置
JP3036005B2 (ja) かな漢字変換装置
JPS628259A (ja) かな漢字変換方式
JPH0497477A (ja) 文書処理装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0785236B2 (ja) 文字データ入力装置
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH03137768A (ja) 文書処理装置
JPH06131329A (ja) 日本語文字処理装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH0363754A (ja) 文章処理装置
JPH0652152A (ja) 文書処理装置
JPH09282316A (ja) 漢字仮名変換装置
JPH0764987A (ja) 日本語ワードプロセッサ
JPH01200470A (ja) 文字処理装置
JPH03110663A (ja) 文書処理装置
JPH0385669A (ja) 送りがな解析機能付き検索置換装置
JPH07117957B2 (ja) 目次文書作成方法