JPH04332073A - Method and device for processing character - Google Patents

Method and device for processing character

Info

Publication number
JPH04332073A
JPH04332073A JP3101114A JP10111491A JPH04332073A JP H04332073 A JPH04332073 A JP H04332073A JP 3101114 A JP3101114 A JP 3101114A JP 10111491 A JP10111491 A JP 10111491A JP H04332073 A JPH04332073 A JP H04332073A
Authority
JP
Japan
Prior art keywords
kanji
kana
character
dictionary
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3101114A
Other languages
Japanese (ja)
Inventor
Atsushi Sakakibara
榊原 厚志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3101114A priority Critical patent/JPH04332073A/en
Publication of JPH04332073A publication Critical patent/JPH04332073A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To improve the complexity of operation due to the conversion of a different form character. CONSTITUTION:A KANA (Japanese syllabary) character string inputted from a keyboard(KB) 7 is converted by referring a KANA/KANJI (Chinese character) dictionary and the converted character string is displayed on the screen of a CRT 12 as a conversion candidate. Whether uncommon KANJIs stored in an uncommon KANJI identifying dictionary are included in the character string or not is checked, and when an uncommon KANJI is included, different form character conversion is applied to the uncommon KANJI by referring a different form character dictionary and the different form converted character string is displayed on the screen of the CRT 12 as another conversion candidate. Since a KANJI having high difficulty in reading and included in a KANA/ KANJI converted character string is automatically converted into a KANJI having low difficulty in reading, operability following the different form character conversion can be improved.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は文字処理方法及びその装
置に関し、特に、平仮名読み列を所定文字列に変換する
文字処理方法及びその装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character processing method and apparatus, and more particularly to a character processing method and apparatus for converting a hiragana reading sequence into a predetermined character string.

【0002】0002

【従来の技術】従来の平仮名読み列をかな漢字文字列に
変換したり、また、その得られた文字列に異体字変換を
施す機能を有する文書処理装置において、かな漢字変換
の結果得られた文字列に難読度の高い(読み難い)異体
字漢字が変換候補として存在する場合、難読度の高い(
読み難い)異体字漢字に対して編集処理を行って、難読
度の低い(読み易い)漢字を得ていた。つまり、漢字の
難読度情報を格納した辞書により難読度の高い漢字を検
索した後、難読度の高い漢字とその異体字となる難読度
の低い漢字との関係を示した辞書を用いて難読度の低い
(読み易い)漢字へと変換処理を行っていた。
[Background Art] In a document processing device that has a function of converting a conventional hiragana reading string into a kana-kanji character string and also converting the obtained character string into a variant character string, a character string obtained as a result of kana-kanji conversion is used. If there is a variant kanji that is difficult to read (hard to read) as a conversion candidate, the
Editing was performed on variant kanji (hard to read) to obtain kanji that were less difficult to read (easier to read). In other words, after searching for kanji that are highly difficult to read using a dictionary that stores information about the difficulty of reading kanji, we search for kanji that are difficult to read using a dictionary that shows the relationship between kanji that are highly difficult to read and their variant characters that are less difficult to read. The conversion process was performed to lower (easier to read) kanji.

【0003】0003

【発明が解決しようとする課題】しかしながら上記従来
例では、難読度の高い(読み難い)漢字を難読度の低い
(読み易い)に変換する場合、異体字変換を行う文字位
置にいちいちカーソルを移動して、異体字変換を行わな
ければならないという煩わしさがあった。
[Problem to be solved by the invention] However, in the above conventional example, when converting a kanji with a high degree of difficulty to read (hard to read) to a kanji with a low degree of difficulty in reading (easy to read), the cursor is moved to the character position where the variant character conversion is to be performed. However, there was the inconvenience of having to perform different character conversion.

【0004】また、操作者が、難読度の高い(読み難い
)漢字と難読度の低い(読み易い)漢字との間の異体字
間の関係を知らない場合は、上記従来例をもってしても
、所望の文字を得ることができず、単漢字入力などによ
り所望の文字列を入力しなければならなかつた。
[0004] Furthermore, if the operator does not know the relationship between variant characters between kanji that are highly difficult to read (hard to read) and kanji that are less difficult to read (easy to read), even with the above conventional example, , it was not possible to obtain the desired character, and the desired character string had to be input by inputting single kanji characters.

【0005】従って、上記のいづれの場合でも、操作が
複雑になるため誤入力が発生しやすく操作性の点から大
きな問題点となっていた。
[0005] Therefore, in any of the above cases, the operation becomes complicated and erroneous input is likely to occur, which poses a major problem in terms of operability.

【0006】本発明は上記従来例に鑑みてなされたもの
で、異体字変換を自動的に行って難読度の低い(読み易
い)文字を変換候補として提示できる文字処理方法及び
その装置を提供することを目的としている。
The present invention has been made in view of the above-mentioned conventional example, and provides a character processing method and apparatus thereof that can automatically perform variant character conversion and present characters with low readability (easy to read) as conversion candidates. The purpose is to

【0007】[0007]

【課題を解決するための手段】上記目的を達成するため
に、本発明の文字処理方法は以下の様な工程からなる。 即ち、平仮名読み列と前記平仮名読み列に対応するかな
漢字文字列を格納するかな漢字辞書と、かな漢字文字列
と前記かな漢字文字列に対応する異体字のかな漢字文字
列を格納する異体字辞書と、漢字の難読度情報を格納し
た難読度辞書とを用いる文字処理方法において、平仮名
読み列を入力する入力工程と、前記入力工程によって入
力された前記平仮名読み列をかな漢字変換するように指
示する指示工程と、前記指示工程による指示に基づいて
、前記入力工程によって入力された前記平仮名読み列を
前記かな漢字辞書に基づいて、かな漢字文字列に変換す
る変換工程と、前記変換工程によって変換された前記か
な漢字文字列を表示する第1表示工程と、前記変換工程
によって変換された前記かな漢字文字列に難読度の高い
漢字が含まれているかどうかを、前記難読度辞書を用い
て検索する検索工程と、前記検索工程によって前記かな
漢字文字列に難読度の高い漢字が検索されたとき、前記
異体字辞書を用いて、前記難読度の高い漢字を難読度の
低い漢字に変換する異体字変換工程と、前記変換工程に
よって変換された前記かな漢字文字列に含まれる前記難
読度の高い漢字を前記異体字変換工程によって変換され
た前記難読度の低い漢字で置換して表示する第2表示工
程とを有することを特徴とする文字処理方法を備える。
Means for Solving the Problems In order to achieve the above object, the character processing method of the present invention comprises the following steps. That is, a kana-kanji dictionary that stores hiragana reading strings and kana-kanji character strings corresponding to the hiragana reading strings, a variant dictionary that stores kana-kanji strings and variant kana-kanji strings that correspond to the kana-kanji strings, and kanji dictionary. In a character processing method using a difficulty level dictionary storing difficulty level information, an input step of inputting a hiragana reading string, an instruction step of instructing to convert the hiragana reading string input in the input step to kana-kanji, a conversion step of converting the hiragana reading string input in the input step into a kana-kanji character string based on the instruction in the instruction step; and a conversion step of converting the kana-kanji character string converted in the conversion step. a first displaying step of displaying, a searching step of searching using the difficulty level dictionary to determine whether or not the Kana-Kanji character string converted by the conversion step includes kanji with a high degree of difficulty in reading; a variant character conversion step of converting the highly difficult to read kanji into a less difficult to read kanji using the variant character dictionary when a kanji with a high degree of difficulty in reading is searched for in the kana-kanji character string, and conversion by the conversion step; a second displaying step of replacing and displaying the highly difficult-to-read kanji included in the converted kana-kanji character string with the less difficult-to-read kanji converted by the variant character conversion step. A processing method is provided.

【0008】また他の発明によれば、平仮名読み列と前
記平仮名読み列に対応するかな漢字文字列を格納するか
な漢字辞書と、かな漢字文字列と前記かな漢字文字列に
対応する異体字のかな漢字文字列を格納する異体字辞書
と、漢字の難読度情報を格納した難読度辞書とを有する
文字処理装置において、平仮名読み列を入力する入力手
段と、前記入力手段によって入力された前記平仮名読み
列をかな漢字変換するように指示する指示手段と、前記
指示手段による指示に基づいて、前記入力手段によって
入力された前記平仮名読み列を前記かな漢字辞書に基づ
いて、かな漢字文字列に変換する変換手段と、前記変換
手段によって変換された前記かな漢字文字列を表示する
第1表示手段と、前記変換手段によって変換された前記
かな漢字文字列に難読度の高い漢字が含まれているかど
うかを、前記難読度辞書を用いて検索する検索手段と、
前記検索手段によって前記かな漢字文字列に難読度の高
い漢字が検索されたとき、前記異体字辞書を用いて、前
記難読度の高い漢字を難読度の低い漢字に変換する異体
字変換手段と、前記変換手段によって変換された前記か
な漢字文字列に含まれる前記難読度の高い漢字を前記異
体字変換手段によって変換された前記難読度の低い漢字
で置換して表示する第2表示手段とを有することを特徴
とする文字処理装置を備える。
According to another invention, there is provided a kana-kanji dictionary that stores a hiragana reading sequence and a kana-kanji character string corresponding to the hiragana reading sequence, and a kana-kanji character string that stores a kana-kanji character string and a variant character string that corresponds to the kana-kanji character string. In a character processing device, the character processing device has a dictionary of variant characters stored therein and a difficulty level dictionary storing difficulty level information of kanji characters, an input means for inputting a hiragana reading sequence, and a kana-kanji conversion of the hiragana reading sequence inputted by the input means. a converting means for converting the hiragana pronunciation inputted by the input means into a kana-kanji character string based on the kana-kanji dictionary based on the instruction by the instruction means; and the converting means a first display means for displaying the kana-kanji string converted by the conversion means; and a search using the difficulty dictionary to determine whether or not the kana-kanji string converted by the conversion means includes a kanji with a high degree of difficulty in reading. a search means to
a variant character converting means for converting the highly difficult to read kanji into a less difficult to read kanji using the variant character dictionary when the search means searches for a kanji with a high degree of difficulty in reading in the kana-kanji character string; and a second display means for replacing and displaying the highly difficult to read kanji included in the kana-kanji character string converted by the conversion means with the less difficult to read kanji converted by the variant character conversion means. Equipped with a characteristic character processing device.

【0009】[0009]

【作用】以上の構成により本発明は、かな漢字変換が施
された文字列に難読度の高い漢字が含まれているかを調
べ、難読度の高い漢字を異体字辞書を用いて難読度の低
い漢字に置換し、難読度の低い漢字を含む文字列を提示
するよう動作する。
[Operation] With the above configuration, the present invention checks whether a character string that has been subjected to kana-kanji conversion contains kanji that are highly difficult to read, and uses a variant dictionary to extract kanji that are difficult to read. , and presents a string containing kanji that is less difficult to read.

【0010】0010

【実施例】以下添付図面を参照しながら本発明の好適な
実施例を詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described in detail below with reference to the accompanying drawings.

【0011】図1は本発明の代表的な実施例である文書
処理装置の構成を示すブロック図である。図1において
、CPU1は、文字処理のための演算や論理判断等を行
うマイクロプロセツサであり、アドレスバス(AB)2
、コントロールバス(CB)3、データバス(DB)4
を介して、それらのバス2〜4に接続された後述の各構
成要素を制御する。
FIG. 1 is a block diagram showing the configuration of a document processing device that is a typical embodiment of the present invention. In FIG. 1, a CPU 1 is a microprocessor that performs calculations and logical judgments for character processing, and an address bus (AB) 2.
, control bus (CB) 3, data bus (DB) 4
Each component connected to these buses 2 to 4, which will be described later, is controlled via the busses 2 to 4.

【0012】アドレスバス(AB)2は、CPU1の制
御の対象とする構成要素を指示するアドレス信号を転送
する。コントロールバス(CB)3はCPU1の制御対
象となる各構成要素にコントロール信号を転送して印加
する。データバス(DB)4は各構成要素相互間のデー
タの転送を行なう。
The address bus (AB) 2 transfers address signals indicating the components to be controlled by the CPU 1. A control bus (CB) 3 transfers and applies control signals to each component to be controlled by the CPU 1. A data bus (DB) 4 transfers data between each component.

【0013】ROM5は、読出し専用の固定メモリであ
り、図9〜図10のフローチャートに示すような異体字
変換処理を実行する制御プログラム、かな漢字変換実行
時に参照される辞書が格納されているかな漢字変換辞書
(KNCNVDIC)の固定データ、及び、基準字体の
漢字を俗字・略字などの異体字漢字へ変換する情報及び
俗字・略字などの異体字漢字を基準字体の漢字へ変換す
る情報のための辞書が格納されている異体字辞書(IT
AIJDIC)の固定データ、及び、常用外漢字識別辞
書(JOGAIDIC)の固定データが格納されている
。異体字辞書(ITAIJDIC)とは、図6を用いて
後述するように、異体字変換数(n)情報、基準字体の
漢字コード情報、(n−1)個分の俗字・略字等の異体
字漢字コード情報を記憶した辞書である。また、常用外
漢字識別辞書(JOGAIDIC)とは、図8を用いて
後述するように、漢字JISコード情報、常用外識別フ
ラグ情報を記憶した辞書である。
The ROM 5 is a read-only fixed memory, and stores a control program for executing the variant character conversion process as shown in the flowcharts of FIGS. 9 and 10, and a dictionary that is referred to when executing the kana-kanji conversion. The fixed data of the dictionary (KNCNVDIC), information on converting standard kanji to variant kanji such as slang and abbreviations, and information on converting variant kanji such as slang and abbreviations to standard font kanji are provided. Stored variant dictionaries (IT
Fixed data of AIJDIC) and fixed data of Commonly Used Kanji Identification Dictionary (JOGAIDIC) are stored. The variant character dictionary (ITAIJDIC) is, as described later using Figure 6, information on the number of variant character conversions (n), standard kanji code information, and (n-1) variant characters such as slang characters and abbreviations. This is a dictionary that stores kanji code information. Further, the non-commonly used kanji identification dictionary (JOGAIDIC) is a dictionary that stores kanji JIS code information and non-commonly used identification flag information, as will be described later with reference to FIG.

【0014】RAM6は、1ワード16ビツトの構成の
書き換え可能のランダムアクセスメモリであつて各構成
要素からの各種データの一時記憶に用いる。TEXTは
、テキストバツフアであり、図7を用いて後述するよう
に、本実施例の文字処理装置で取り扱う文書を内部形式
で記憶する。KBBUFは、入力された読み列及び操作
選択のキー入力を蓄えるためのキーボードバツフアであ
る。YOMIBUFは、かな漢字変換の入力読みを記憶
するための読み入力バツフアである。KOUHOBUF
は、かな漢字変換処理の結果、変換候補となった文字列
を記憶するための候補出力バツフアである。
The RAM 6 is a rewritable random access memory having a configuration of 1 word and 16 bits, and is used for temporary storage of various data from each component. TEXT is a text buffer, which stores a document handled by the character processing device of this embodiment in an internal format, as will be described later with reference to FIG. KBBUF is a keyboard buffer for storing input reading sequences and key inputs for operation selection. YOMIBUF is a reading input buffer for storing input readings for kana-kanji conversion. KOUHOBUF
is a candidate output buffer for storing character strings that have become conversion candidates as a result of the kana-kanji conversion process.

【0015】KB7はキーボードであつて、アルファベ
ツトキー、ひらがなキー、カタカナキーの文字記号入力
キー、及び、変換キー、カーソル移動キー、選択キー等
の本実施例の文字処理装置が有する各種機能を指示する
ための各種のフアンクシヨンキーを備えている。
KB7 is a keyboard, which has various functions possessed by the character processing device of this embodiment, such as character symbol input keys such as alphabet keys, hiragana keys, and katakana keys, as well as conversion keys, cursor movement keys, and selection keys. Equipped with various function keys for instructions.

【0016】DISK8は文書データを記憶するための
ハードディスクであり、テキストバツフア(TEXT)
上に作成された文書の保管を行ない、保管された文書は
キーボード(KB)7の指示により、必要な時にRAM
6上に呼び出される。
DISK8 is a hard disk for storing document data, and is a text buffer (TEXT).
The documents created above are stored, and the stored documents are stored in the RAM when necessary according to instructions from the keyboard (KB) 7.
Called on 6.

【0017】CR9はカーソルレジスタである。CPU
1により、カーソルレジスタの内容を読み書きできる。 後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
CR9 is a cursor register. CPU
1 allows the contents of the cursor register to be read and written. A CRT controller CRTC, which will be described later, displays a cursor at a position on the display device CRT corresponding to the address stored here.

【0018】DBUF10は表示用バツフアメモリで、
表示すべきデータのパターンを蓄える。文書データの内
容表示は、テキストバツフア(TEXT)上のデータに
基いてDBUF10上にパターンを展開することにより
行なわれる。
DBUF10 is a display buffer memory,
Stores patterns of data to be displayed. The contents of the document data are displayed by developing a pattern on the DBUF 10 based on the data on the text buffer (TEXT).

【0019】CRTC11はカーソルレジスタ(CR)
9及びバツフアDBUF10に蓄えられた内容をCRT
12に表示する役割を担うCRTコントローラである。
CRTC11 is a cursor register (CR)
9 and the contents stored in the buffer DBUF10 on the CRT
This is a CRT controller that plays the role of displaying images on the screen.

【0020】またCRT12は陰極線管等を用いた表示
装置であり、CRT12におけるドットマトリックス構
成の表示パターン及びカーソル表示をCRTC11で制
御する。さらに、CG13はキヤラクタジエネレータで
あつて、CRT13に表示する文字、記号のパターンを
記憶するものである。
The CRT 12 is a display device using a cathode ray tube or the like, and the dot matrix display pattern and cursor display on the CRT 12 are controlled by the CRTC 11. Further, the CG 13 is a character generator that stores patterns of characters and symbols to be displayed on the CRT 13.

【0021】以上のような構成要素からなる本実施例の
文字処理装置は、キーボード(KB)7からの各種の入
力に応じて動作する。まず、キーボード(KB)7から
の入力が供給されると、まず、インタラプト信号がCP
U1に送られる。これに応じて、CPU1がROM5内
に記憶してある各種の制御プログラムを読出し、それら
の制御プログラムに従つて各種の制御が行なわれる。
The character processing device of this embodiment, which is composed of the above-described components, operates in response to various inputs from the keyboard (KB) 7. First, when input from the keyboard (KB) 7 is supplied, an interrupt signal is sent to the CP.
Sent to U1. In response, the CPU 1 reads various control programs stored in the ROM 5, and various controls are performed according to these control programs.

【0022】図2は、CRT12に表示される画面構成
の例を示した図である。図2において、DSPは表示画
面全体を、TSはテキスト画面を意味する。TSにはテ
キストバツフア(TEXT)に記憶されている文書の内
容が表示される。また、KSは、ソフトキーを表示する
エリアであり、操作状況によつて必要なキー、例えば選
択キー、変換キー等を表示させ、キーボード(KB)7
の対応する位置のキーを押下することにより、それぞれ
の機能が働く。WDSPは、ウインドウ表示画面であり
、かな漢字変換処理後に作成された文字列候補が、表示
されるエリアである。YSは、かな漢字変換の読み入力
を表示するエリアである。
FIG. 2 is a diagram showing an example of the screen configuration displayed on the CRT 12. In FIG. 2, DSP means the entire display screen, and TS means the text screen. The contents of the document stored in the text buffer (TEXT) are displayed in the TS. In addition, KS is an area for displaying soft keys, and displays necessary keys depending on the operating situation, such as selection keys, conversion keys, etc., and keyboard (KB) 7
Each function works by pressing the key at the corresponding position. WDSP is a window display screen, and is an area where character string candidates created after the kana-kanji conversion process are displayed. YS is an area for displaying reading input for kana-kanji conversion.

【0023】図3〜図5は、入力された読みをかな漢字
変換辞書(KNCNVDIC)を参照して変換した文字
列中に難読度の高い異体字漢字がある場合に、難読度の
低い文字列を変換候補として合わせて表示し、所望の文
字列を選択させる一連の処理において、CRT12に表
示される画面の変化を時系列に示した図である。
[0023] Figures 3 to 5 show that when there is a variant kanji with a high degree of difficulty in reading in a character string whose reading has been converted by referring to the Kana-Kanji Conversion Dictionary (KNCNVDIC), a character string with a low degree of difficulty in reading is converted. FIG. 4 is a diagram chronologically showing changes in the screen displayed on the CRT 12 in a series of processes in which a desired character string is displayed as a conversion candidate and selected.

【0024】まず文書処理装置が文書作成可能となった
状態で、操作者がキーボード(KB)7のひらがなキー
により読み(ここでは、“がくげいしんぶん”)を入力
すると、図3(a)に示すように、かな漢字変換の読み
入力を表示するエリア(YS)にその読みが表示される
。ここで、キーボード(KB)7の変換キーを押下する
と、図3(b)に示すようにウインドウ表示画面(WD
SP)に、かな漢字変換された文字列候補が表示される
。図3(b)において、ウインドウ表示画面(WDSP
)には、かな漢字変換辞書(KNCNVDIC)を参照
して変換された「學藝新聞」の文字列が変換候補として
まず表示される。ここで、「學」及び「藝」の文字各々
は、常用外漢字識別辞書(JOGAIDIC)に格納さ
れている後述の常用外識別フラグ情報によると常用外と
定義されており、かつ、異体字辞書(ITAIJDIC
)に格納されている俗字・略字などの異体字漢字として
認められるので、「學」及び「藝」の基準字体である「
学」及び「芸」へ異体字変換を施し「学芸新聞」という
文字列をもう1つの変換候補として表示する。
First, when the document processing device is ready to create a document, when the operator inputs a reading (in this case, "gakugeishinbun") using the hiragana key on the keyboard (KB) 7, the result shown in FIG. 3(a) is The reading is displayed in the area (YS) that displays the reading input for kana-kanji conversion. Here, when you press the conversion key on the keyboard (KB) 7, a window display screen (WD
SP) displays character string candidates that have been converted into kana-kanji. In FIG. 3(b), the window display screen (WDSP
), the character string "Gakugeishinbun" converted with reference to the Kana-Kanji Conversion Dictionary (KNCNVDIC) is first displayed as a conversion candidate. Here, each of the characters "孝" and "藝" is defined as non-commonly used according to non-commonly used identification flag information, which will be described later, stored in the non-commonly used kanji identification dictionary (JOGAIDIC), and (ITAIJDIC
) are recognized as variant kanji such as slang characters and abbreviations, so the standard font for ``學'' and ``藝'' is
The character string ``Gakugei Shimbun'' is displayed as another conversion candidate by performing variant character conversion on ``Gaku'' and ``Gei''.

【0025】ここで、操作者は、図3(c)に示すよう
にキーボード(KB)7のカーソル移動キーを用いてカ
ーソル位置を「学芸新聞」に移動させ、「選択」キーを
押下することにより、図4(a)に示すように文字列「
学芸新聞」をテキストバツフア(TEXT)入力し、テ
キスト画面(TS)に「学芸新聞」が表示される。
[0025] Here, the operator uses the cursor movement keys on the keyboard (KB) 7 to move the cursor to "Gakugei Shimbun" and presses the "select" key, as shown in FIG. 3(c). As shown in Figure 4(a), the character string “
``Gakugei Shimbun'' is input in the text buffer (TEXT), and ``Gakugei Shimbun'' is displayed on the text screen (TS).

【0026】以下同様にして、図4(b)に示すように
、操作者はキーボード(KB)7のひらがなキーにより
読みを入力すると、読み入力表示エリア(YS)にその
読みが表示される。ここで、変換キーを押下すると、ウ
インドウ表示画面(WDSP)に、図5(a)に示すよ
うに、かな漢字変換された文字列候補が表示される。 図5(a)において、かな漢字変換辞書(KNCNVD
IC)を参照して変換された文字列「四條」が変換候補
として、まず表示される。ここで、文字「條」は、常用
外漢字識別辞書(JOGAIDIC)に格納されている
後述の常用外識別フラグ情報が常用外となっていて、か
つ、異体字辞書(ITAIJDIC)に文字「條」が俗
字・略字などの異体字漢字の1つとして存在するので、
これを基準字体の漢字(「条」)へ異体字変換してもう
文字列「四条」を1つの変換候補として表示する。
Similarly, as shown in FIG. 4(b), when the operator inputs a reading using the hiragana keys on the keyboard (KB) 7, the reading is displayed in the reading input display area (YS). When the conversion key is pressed here, character string candidates converted to kana-kanji are displayed on the window display screen (WDSP), as shown in FIG. 5(a). In Figure 5(a), the Kana-Kanji Conversion Dictionary (KNCNVD)
The character string "Shijo" converted with reference to IC) is first displayed as a conversion candidate. Here, the character ``jo'' is stored in the non-common kanji identification dictionary (JOGAIDIC) and the non-common identification flag information (described below) is non-common, and the variant kanji dictionary (ITAIJDIC) contains the character ``jo''. exists as one of the variant kanji such as slang and abbreviations,
This is converted into a standard kanji character ("jo"), and then the character string "shijo" is displayed as one conversion candidate.

【0027】次に、操作者はキーボード(KB)7のカ
ーソル移動キーを用いて図5(b)に示すように、カー
ソル位置を「四条」に移動させ、「選択」キーを押下す
ることにより、図5(c)に示すように、文字列「四条
」がテキストバツフア(TEXT)に入力され、テキス
ト画面(TS)に文字列「四条」が表示される。
Next, the operator uses the cursor movement keys on the keyboard (KB) 7 to move the cursor to "Shijo" as shown in FIG. 5(b), and presses the "select" key. As shown in FIG. 5(c), the character string "Shijo" is input to the text buffer (TEXT), and the character string "Shijo" is displayed on the text screen (TS).

【0028】図6は、本実施例における異体字辞書(I
TAIJDIC)の内部構成を示した図である。図6に
おいて、異体字辞書(ITAIJDIC)は、異体字変
換数(n)情報、基準字体の漢字コード情報、(n−1
)個分の俗字・略字等の異体字漢字コード情報から構成
される。この異体字辞書(ITAIJDIC)は、基準
字体の漢字を異体字漢字へ変換するために、また、異体
字漢字を基準字体の漢字あるいは他の異体字漢字へ変換
するために参照される。本実施例においては、この異体
字辞書(ITAIJDIC)内の情報は、基準字体の漢
字コード情報の文字コード(JISX0208コード)
に従って昇順に格納される。
FIG. 6 shows the variant character dictionary (I
FIG. 2 is a diagram showing the internal configuration of TAIJDIC. In FIG. 6, the variant character dictionary (ITAIJDIC) includes information on the number of variant character conversions (n), standard kanji code information, (n-1
) Contains kanji code information for individual slang characters, abbreviations, etc. This variant Kanji dictionary (ITAIJDIC) is referred to in order to convert a Kanji in a standard font into a variant Kanji, and to convert a variant Kanji into a Kanji in a standard font or another variant Kanji. In this embodiment, the information in this variant character dictionary (ITAIJDIC) is the character code (JISX0208 code) of the kanji code information of the standard font.
are stored in ascending order according to

【0029】例えば、「学」という基準字体の漢字コー
ド情報に対し、その異体字変換数が3であると、3−1
(=2)個分の俗字・略字等の異体字漢字コード情報、
つまり、「學」と「斈」のコード情報が格納されている
For example, for the kanji code information of the standard font "Gaku", if the number of variant character conversions is 3, then 3-1
(=2) Variant kanji code information such as slang characters and abbreviations,
In other words, code information for "學" and "斈" is stored.

【0030】図7は、テキストバツフア(TEXT)の
構成を示した図である。テキストは複数個の固定長から
なる行データより構成される。各行データは同じく複数
個の文字データより構成される。各文字データは1文字
2バイトで構成され、例えば、文字コードJISX02
08に従って格納される。また、各文字の位置は行を示
すY座標と、その行内の文字位置を示すX座標により指
定される。例えば、テキスト先頭より3行目で左から4
文字目の文字はX座標=4,Y座標=3で指定される。 同様に、カーソルの現在位置も、このX座標、Y座標で
管理される。
FIG. 7 is a diagram showing the structure of the text buffer (TEXT). Text consists of multiple lines of fixed length data. Each line of data is similarly composed of a plurality of character data. Each character data consists of 1 character and 2 bytes. For example, character code JISX02
08. Further, the position of each character is specified by the Y coordinate indicating the line and the X coordinate indicating the character position within the line. For example, in the third line from the beginning of the text, 4 from the left
The character numbered is specified by X coordinate=4 and Y coordinate=3. Similarly, the current position of the cursor is also managed using the X and Y coordinates.

【0031】図8は、本実施例で用いる常用外漢字識別
辞書(JOGAIDIC)の内部構成を示した図である
。常用外漢字識別辞書(JOGAIDIC)は、漢字J
ISコード情報及び常用外識別フラグ情報から構成され
、参照された漢字が常用漢字であるか、或は、常用外漢
字であるかを判別するために用いられる。
FIG. 8 is a diagram showing the internal structure of the commonly used kanji identification dictionary (JOGAIDIC) used in this embodiment. The non-commonly used kanji identification dictionary (JOGAIDIC) is a kanji J
It is composed of IS code information and non-commonly used identification flag information, and is used to determine whether the referenced kanji is a commonly used kanji or a non-commonly used kanji.

【0032】常用外識別フラグ情報は、辞書内に格納さ
れている漢字コード各々に付加された情報であり、その
フラグが“0”の場合は対応する漢字が「常用漢字であ
る」ことを、“1”の場合は対応する漢字が「常用外漢
字である」ことを示す。例えば、「條(5B6A)」と
いう常用外漢字識別辞書(JOGAIDIC)の漢字J
ISコード情報(5B6A)に対し、その常用外識別フ
ラグ情報“1”(常用外漢字である)が格納されている
[0032] Non-commonly used identification flag information is information added to each kanji code stored in the dictionary, and when the flag is "0", it indicates that the corresponding kanji is "commonly used kanji". A value of "1" indicates that the corresponding kanji is "a kanji not commonly used." For example, the kanji J in the Commonly Used Kanji Identification Dictionary (JOGAIDIC) is ``條 (5B6A)''.
For the IS code information (5B6A), non-commonly used identification flag information “1” (it is a non-commonly used kanji) is stored.

【0033】また、本実施例では常用外漢字識別辞書(
JOGAIDIC)に格納される漢字コードは、漢字J
ISコード情報の文字コード(JISX0208コード
)に従って、昇順に格納される。例えば、図8において
、文字「上(JISコード:3E65)」が、文字「中
(JISコード:4366)」より先に収容されている
[0033] In addition, in this embodiment, a commonly used kanji identification dictionary (
The kanji code stored in JOGAIDIC) is kanji J.
They are stored in ascending order according to the character code (JISX0208 code) of the IS code information. For example, in FIG. 8, the character "upper (JIS code: 3E65)" is stored before the character "middle (JIS code: 4366)".

【0034】次に、本実施例の文書処理装置が実行する
かな漢字変換処理について、図9〜図10に示すフロー
チヤートを参照しながら説明する。特に、ここでは、か
な漢字変換辞書(KNCNVDIC)を参照して変換さ
れた文字列に難読度の高い文字が存在する場合、これに
、異体字変換を施して難読度の低い文字を変換候補とし
て表示する処理について説明する。
Next, the kana-kanji conversion process executed by the document processing apparatus of this embodiment will be explained with reference to the flowcharts shown in FIGS. 9 and 10. In particular, if there are characters with a high degree of difficulty in reading in a character string converted by referring to the Kana-Kanji Conversion Dictionary (KNCNVDIC), the characters with a high degree of difficulty in reading are displayed as conversion candidates by performing variant character conversion. The process to do this will be explained.

【0035】まず、ステップS10では、キーボード(
KB)7からの指示入力待ち状態となっている。ここで
、何らかの入力を受け付けると、その入力データをキー
ボードバツフア(KBBUF)に取り込み、処理はステ
ップS15に進む。ステップS15では、キーボードバ
ツフア(KBBUF)先頭にある入力データがどのよう
な指示であるかを調べる。ここで、その指示が、ひらが
なキー押下によるかな入力であれば、処理はステツプS
25に進み、変換キー押下による指示であれば、処理は
ステップS20に進み、それ以外のキー押下ならば、処
理はステップS10に戻る。
First, in step S10, the keyboard (
It is in a state of waiting for an instruction input from KB)7. Here, if any input is accepted, the input data is taken into the keyboard buffer (KBBUF), and the process proceeds to step S15. In step S15, it is checked what kind of instruction the input data at the beginning of the keyboard buffer (KBBUF) is. Here, if the instruction is kana input by pressing the hiragana key, the process goes to step S.
25, if the instruction is a conversion key press, the process proceeds to step S20; if any other key is pressed, the process returns to step S10.

【0036】ステップS25では、キーボードバツフア
(KBBUF)に格納されている“ひらがな読み”を、
読み入力バツフア(YOMIBUF)へ追加する処理を
行なう。続いて、ステップS30では、図3(a)に示
すようにキーボードバツフア(KBBUF)に格納され
ている“ひらがな読み”を、かな漢字変換の読み入力を
表示するエリア(YS)に追加表示する。
In step S25, the "hiragana reading" stored in the keyboard buffer (KBBUF) is read.
Performs processing to add to the reading input buffer (YOMIBUF). Subsequently, in step S30, as shown in FIG. 3A, the "hiragana reading" stored in the keyboard buffer (KBBUF) is additionally displayed in the area (YS) for displaying the reading input for kana-kanji conversion.

【0037】ステップS20では、図10に示すフロー
チャートを参照して後に詳述するが、かな漢字変換辞書
(KNCNVDIC)を参照しながら読み入力に基づい
て、かな漢字変換候補を作成する。この時、その変換候
補文字列中に、常用外漢字識別辞書(JOGAIDIC
)に格納されている常用外漢字が存在するかどうかを調
べる。ここで対応する文字が存在する場合は、異体字辞
書(ITAIJDIC)を参照して、その常用外漢字に
対応する基準字体の漢字及び、俗字・略字などの異体字
漢字が存在するかどうかを調べる。ここで、対応する基
準字体の漢字及び、俗字・略字などの異体字漢字が存在
すると判断された場合は、異体字辞書(ITAIJDI
C)を参照して、変換候補文字列中の異体字を異体字変
換させた変換候補文字列を作成し、これを候補出力バツ
フア(KOUHOBUF)へ出力する。
In step S20, which will be described in detail later with reference to the flowchart shown in FIG. 10, kana-kanji conversion candidates are created based on the reading input while referring to the kana-kanji conversion dictionary (KNCNVDIC). At this time, in the conversion candidate character string, there is a
) Checks whether the non-common kanji stored in the file exists. If the corresponding character exists here, refer to the variant character dictionary (ITAIJDIC) and check whether there are kanji in the standard font that corresponds to the non-commonly used kanji and variant kanji such as slang or abbreviated characters. . Here, if it is determined that there are kanji in the corresponding standard font and variant kanji such as slang or abbreviations, the variant kanji dictionary (ITAIJDI)
With reference to C), a conversion candidate character string is created by converting the variant characters in the conversion candidate character string to variant characters, and this is output to the candidate output buffer (KOUHOBUF).

【0038】ステップS35では、ステップS20にお
けるかな漢字変換候補作成処理で作成された候補出力バ
ツフア(KOUHOBUF)内の文字列群を、図3(b
)及び図5(a)に示すように、ウインドウ表示画面(
WDSP)に表示させて、装置の操作者に変換候補から
所望の文字列を選択させる。
In step S35, the character string group in the candidate output buffer (KOUHOBUF) created in the kana-kanji conversion candidate creation process in step S20 is converted into the character string group in FIG.
) and as shown in Figure 5(a), the window display screen (
WDSP) and allows the operator of the device to select a desired character string from conversion candidates.

【0039】次にステップS40では、キーボード(K
B)7からの入力待ちとなり、変換候補文字列の選択指
示待ち状態となる。ここで、何らかの入力を受け付ける
とデータをキーボードバツフア(KBBUF)に取り込
み、処理はステップS45に進む。ステップS45では
、キーボードバツフア(KBBUF)に格納された指示
の種類について調べる。ここで、与えられた指示が上下
カーソルキーによるカーソルの移動指示であれば、処理
はステップS50に進み、選択キー押下による指示であ
れば、処理はステップS55に進み、上下カーソルキー
、選択キー以外の指示ならば、処理はステップS40に
戻る。
Next, in step S40, the keyboard (K
B) The process waits for an input from 7, and waits for an instruction to select a conversion candidate character string. Here, if any input is accepted, the data is taken into the keyboard buffer (KBBUF) and the process proceeds to step S45. In step S45, the type of instruction stored in the keyboard buffer (KBBUF) is checked. Here, if the given instruction is an instruction to move the cursor using the up/down cursor keys, the process proceeds to step S50, and if the given instruction is an instruction to move the cursor by pressing the selection key, the process proceeds to step S55. If the instruction is , the process returns to step S40.

【0040】ステップS50では、かな漢字変換候補作
成処理で作成された候補出力バツフア(KOUHOBU
F)の文字列群を、ウインドウ表示画面(WDSP)に
表示させたまま、候補を選択させるウインドウ表示画面
(WDSP)のカーソル位置を上下カーソルキーの入力
に従つて移動する。その後、処理はステップS40に戻
る。
In step S50, the candidate output buffer (KOUHOBU) created in the kana-kanji conversion candidate creation process is
While displaying the character string group F) on the window display screen (WDSP), move the cursor position on the window display screen (WDSP) for selecting a candidate according to the input of the up and down cursor keys. After that, the process returns to step S40.

【0041】ステップS55では、ウインドウ表示画面
(WDSP)に表示された文字列群の中で、カーソルが
位置する場所にある文字列を、選択された候補文字列と
見なして、テキストバツフア(TEXT)における編集
処理を行なう。続いて、ステップS60では、図4(a
)及び図5(c)に示すように、ウインドウ表示画面(
WDSP)を消去するとともに、テキスト画面(TS)
に選択された候補文字列を表示編集する。
[0041] In step S55, the character string located at the position of the cursor among the character strings displayed on the window display screen (WDSP) is regarded as the selected candidate character string, and the text buffer (TEXT ). Subsequently, in step S60, the process shown in FIG.
) and as shown in Figure 5(c), the window display screen (
WDSP) and erase the text screen (TS).
Display and edit the selected candidate string.

【0042】図10は、図9のステップS20で示した
、かな漢字変換候補作成処理の詳細な処理を示すフロー
チャートである。
FIG. 10 is a flowchart showing detailed processing of the kana-kanji conversion candidate creation processing shown in step S20 of FIG.

【0043】先ず、ステップS70では、読み入力バツ
フア(YOMIBUF)の読みに対し、かな漢字変換辞
書(KNCNVDIC)を参照して変換候補を作成し、
候補出力バツフア(KOUHOBUF)へ出力する。次
に、ステップS75では、ステップS70で作成された
全ての変換候補に対し、ステップS80以降の処理を終
了したかどうか調べる。ここで、全ての変換候補に対し
、ステップS80以降の処理を終了したと判断されたな
らば、処理はステップS20に戻り、前述のステップS
35以降の処理を行う。これに対して全ての変換候補に
対し、ステップS80以降の処理を終了していないと判
断されたなら、処理はステップS80へ進む。
First, in step S70, a conversion candidate is created for the reading of the reading input buffer (YOMIBUF) by referring to the kana-kanji conversion dictionary (KNCNVDIC).
Output to the candidate output buffer (KOUHOBUF). Next, in step S75, it is checked whether the processing from step S80 onwards has been completed for all conversion candidates created in step S70. Here, if it is determined that the processing from step S80 onwards has been completed for all conversion candidates, the process returns to step S20, and the process returns to step S20.
Processing after 35 is performed. On the other hand, if it is determined that the processing from step S80 onwards has not been completed for all conversion candidates, the processing proceeds to step S80.

【0044】ステップS80では、ステップS70にお
いて作成された変換候補文字列の内の未処理の一候補に
ついて、変換候補文字列中に、常用外漢字識別辞書(J
OGAIDIC)に格納されている常用外漢字が存在す
るかどうかを調べる。続いてステップS81では、ステ
ップS80の処理結果を判断して、変換候補文字列中に
常用外漢字が存在すれば処理をステップS82に進め、
常用外漢字が存在しなければ処理はステップS75に戻
る。
[0044] In step S80, for one unprocessed candidate among the conversion candidate character strings created in step S70, the common non-standard kanji identification dictionary (J) is included in the conversion candidate character string.
Check whether the commonly used kanji stored in OGAIDIC exists. Subsequently, in step S81, the processing result of step S80 is judged, and if a non-common kanji is present in the conversion candidate character string, the process proceeds to step S82,
If the non-commonly used kanji does not exist, the process returns to step S75.

【0045】ステップS82では、ステップS80にお
いて識別された変換候補文字列中の常用外漢字が、異体
字辞書(ITAIJDIC)に格納された基準字体の漢
字及び、俗字・略字などの異体字漢字であるかどうかを
調べる。
[0045] In step S82, the non-commonly used kanji in the conversion candidate character string identified in step S80 are kanji in the standard font stored in the variant character dictionary (ITAIJDIC) and variant kanji such as slang characters and abbreviations. Find out if.

【0046】続いて、ステップS85では、ステップS
82の処理結果を判断する。ここで、変換候補文字列中
の常用外漢字に、基準字体の漢字及び、俗字・略字など
の異体字漢字が存在しなければ処理はステップS75に
戻り、存在すれば処理はステップS90へ進む。
Subsequently, in step S85, step S85
82 is judged. Here, if a standard font kanji or a variant kanji such as a slang character or abbreviation does not exist among the non-common kanji characters in the conversion candidate character string, the process returns to step S75, and if they exist, the process proceeds to step S90.

【0047】ステップS90では、異体字辞書(ITA
IJDIC)を参照して、変換候補文字列中の異体字を
異体字変換させて変換候補文字列を作成し、その文字列
を候補出力バツフア(KOUHOBUF)へ出力する。 その後、処理は、ステップS75に戻る。
[0047] In step S90, a dictionary of variant characters (ITA
IJDIC), the variant characters in the conversion candidate character string are converted into variant characters to create a conversion candidate character string, and the character string is output to the candidate output buffer (KOUHOBUF). After that, the process returns to step S75.

【0048】従って本実施例に従えば、入力された平仮
名読み列にかな漢字変換を施して得られた変換候補の文
字列内に常用外漢字が含まれるなら、これを異体字辞書
(ITAIJDIC)を参照して異体字変換させて難読
度の低い(読み易い)文字列を、もう1つの変換候補と
して表示させることができる。
Therefore, according to this embodiment, if a conversion candidate character string obtained by performing kana-kanji conversion on an input hiragana reading string contains a non-common kanji, it is converted to a variant character dictionary (ITAIJDIC). A character string that is less difficult to read (easier to read) can be displayed as another conversion candidate by referring to the character string and converting it to a different character.

【0049】なお本実施例においては、かな漢字変換を
施して得られた変換候補の文字列内に存在する難読度の
高い(読み難い)文字を、単純に難読度の低い(読み易
い)文字に変換する場合について説明したが、本発明は
これに限定されるものではない。例えば、難読度の高い
(読み難い)文字に難易度を設け、その難易度の閾値を
外部から設定できるように構成することもできる。これ
により、装置を扱う操作者のレベルに応じたかな漢字変
換を実現できる。
In this embodiment, characters with a high degree of difficulty in reading (hard to read) existing in a character string of conversion candidates obtained by performing kana-kanji conversion are simply converted into characters with a degree of difficulty in reading (easy to read). Although the case of conversion has been described, the present invention is not limited to this. For example, it is also possible to set a difficulty level to characters that are highly difficult to read (hard to read), and to set the threshold value of the difficulty level from the outside. Thereby, it is possible to realize kana-kanji conversion according to the level of the operator handling the device.

【0050】この場合、例えば、図8に示す常用外漢字
識別辞書(JOGAIDIC)の内部に、小学校、中学
校ぞれぞれの学年で学習すべき漢字を区別する情報を付
加することにより、また、装置外部より、装置を扱う児
童生徒の学年を指定できるようにして、その指定に基づ
いて常用外漢字の区別を行うことにより実現される。ま
た別の例として、難読度の高い(読み難い)文字にユー
ザ個人が難易度を設定できるように構成することもでき
る。
In this case, for example, by adding information to distinguish the kanji to be learned in each grade of elementary school and junior high school to the inside of the commonly used kanji identification dictionary (JOGAIDIC) shown in FIG. This is achieved by making it possible to specify the grade level of the students handling the device from outside the device, and distinguishing between commonly used kanji based on the designation. As another example, it may be configured such that the individual user can set the difficulty level for characters that are difficult to read (difficult to read).

【0051】この場合、例えば、図8に示す常用外漢字
識別辞書(JOGAIDIC)をユーザが登録可能な漢
字難易度設定欄を設けることにより実現される。
[0051] In this case, for example, this can be realized by providing a kanji difficulty level setting column in which the user can register the commonly used kanji identification dictionary (JOGAIDIC) shown in FIG.

【0052】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器からなる装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによつて達成される場合にも適用で
きることは言うまでもない。
The present invention may be applied to a system made up of a plurality of devices, or to an apparatus made up of one device. It goes without saying that the present invention can also be applied to cases where the present invention is achieved by supplying a program to a system or device.

【0053】[0053]

【発明の効果】以上説明したように本発明によれば、入
力された平仮名読み列をかな漢字文字列に変換した後、
その文字列に難読度の高い漢字が含まれているかを調べ
、難読度の高い漢字が含まれている場合には、その漢字
を難読度の低い(読み易い)漢字に自動的に変換して表
示することができるので、異体字変換に伴う煩雑な操作
がなくなり、誤操作や誤入力が防止されるという効果が
ある。
[Effects of the Invention] As explained above, according to the present invention, after converting an input hiragana reading string into a kana-kanji character string,
Checks whether the character string contains kanji that are difficult to read, and if it contains kanji that are difficult to read, automatically converts the kanji to kanji that are less difficult to read (easier to read). Since it can be displayed, there is no need for complicated operations associated with variant character conversion, and there is an effect that erroneous operations and erroneous inputs are prevented.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明の代表的な実施例である文書処理装置の
構成を示すブロツク図である。
FIG. 1 is a block diagram showing the configuration of a document processing device that is a typical embodiment of the present invention.

【図2】文書処理装置のCRTに表示される画面の構成
を示す図である。
FIG. 2 is a diagram showing the configuration of a screen displayed on a CRT of a document processing device.

【図3】[Figure 3]

【図4】[Figure 4]

【図5】一連のかな漢字変換及び異体字変換処理に従う
表示画面の時系列な推移を示す図である。
FIG. 5 is a diagram showing a chronological transition of a display screen according to a series of kana-kanji conversion and variant character conversion processes.

【図6】異体字辞書の内部構成を示す図である。FIG. 6 is a diagram showing the internal structure of a variant character dictionary.

【図7】テキストバツフアの構成を示す図である。FIG. 7 is a diagram showing the structure of a text buffer.

【図8】常用外漢字識別辞書の内部構成を示す図である
FIG. 8 is a diagram showing the internal structure of a commonly used non-common kanji identification dictionary.

【図9】[Figure 9]

【図10】異体字変換処理を示すフローチヤートである
FIG. 10 is a flowchart showing variant character conversion processing.

【符号の説明】 1  CPU 2  アドレスバス 3  制御バス 4  データバス 5  ROM(読み出し専用メモリ) 6  RAM(ランダムアクセスメモリ)7  キーボ
ード(KB) 8  ハードディスク(DISK) 9  カーソルレジスタ(CR) 10  データバッファ(DBUF) 11  CRTコントローラ 12  CRT
[Explanation of symbols] 1 CPU 2 Address bus 3 Control bus 4 Data bus 5 ROM (read-only memory) 6 RAM (random access memory) 7 Keyboard (KB) 8 Hard disk (DISK) 9 Cursor register (CR) 10 Data buffer ( DBUF) 11 CRT controller 12 CRT

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】  平仮名読み列と前記平仮名読み列に対
応するかな漢字文字列を格納するかな漢字辞書と、かな
漢字文字列と前記かな漢字文字列に対応する異体字のか
な漢字文字列を格納する異体字辞書と、漢字の難読度情
報を格納した難読度辞書とを用いる文字処理方法におい
て、平仮名読み列を入力する入力工程と、前記入力工程
によって入力された前記平仮名読み列をかな漢字変換す
るように指示する指示工程と、前記指示工程による指示
に基づいて、前記入力工程によって入力された前記平仮
名読み列を前記かな漢字辞書に基づいて、かな漢字文字
列に変換する変換工程と、前記変換工程によって変換さ
れた前記かな漢字文字列を表示する第1表示工程と、前
記変換工程によって変換された前記かな漢字文字列に難
読度の高い漢字が含まれているかどうかを、前記難読度
辞書を用いて検索する検索工程と、前記検索工程によっ
て前記かな漢字文字列に難読度の高い漢字が検索された
とき、前記異体字辞書を用いて、前記難読度の高い漢字
を難読度の低い漢字に変換する異体字変換工程と、前記
変換工程によって変換された前記かな漢字文字列に含ま
れる前記難読度の高い漢字を前記異体字変換工程によっ
て変換された前記難読度の低い漢字で置換して表示する
第2表示工程とを有することを特徴とする文字処理方法
1. A kana-kanji dictionary that stores a hiragana reading string and a kana-kanji string corresponding to the hiragana reading string; and a variant dictionary that stores a kana-kanji string and a kana-kanji string of variant characters corresponding to the kana-kanji string. , an input step of inputting a hiragana reading string, and an instruction to convert the hiragana reading string inputted in the input step into kana-kanji in a character processing method using a reading difficulty dictionary storing reading difficulty information of kanji. a conversion step of converting the hiragana pronunciation input in the input step into a kana-kanji character string based on the kana-kanji dictionary based on instructions from the instruction step; a first display step of displaying a character string; a search step of searching using the difficulty level dictionary to determine whether or not the Kana-Kanji character string converted in the conversion step includes a kanji with a high degree of difficulty in reading; a variant character conversion step of converting the highly difficult to read kanji into a less difficult to read kanji using the variant character dictionary when a kanji with a high degree of difficulty is found in the kana-kanji character string in the search step; A second display step of replacing and displaying the highly difficult to read kanji included in the kana kanji character string converted by the step with the kanji having a low degree of readability converted by the variant character conversion step. Character processing method.
【請求項2】  平仮名読み列と前記平仮名読み列に対
応するかな漢字文字列を格納するかな漢字辞書と、かな
漢字文字列と前記かな漢字文字列に対応する異体字のか
な漢字文字列を格納する異体字辞書と、漢字の難読度情
報を格納した難読度辞書とを有する文字処理装置におい
て、平仮名読み列を入力する入力手段と、前記入力手段
によって入力された前記平仮名読み列をかな漢字変換す
るように指示する指示手段と、前記指示手段による指示
に基づいて、前記入力手段によって入力された前記平仮
名読み列を前記かな漢字辞書に基づいて、かな漢字文字
列に変換する変換手段と、前記変換手段によって変換さ
れた前記かな漢字文字列を表示する第1表示手段と、前
記変換手段によって変換された前記かな漢字文字列に難
読度の高い漢字が含まれているかどうかを、前記難読度
辞書を用いて検索する検索手段と、前記検索手段によっ
て前記かな漢字文字列に難読度の高い漢字が検索された
とき、前記異体字辞書を用いて、前記難読度の高い漢字
を難読度の低い漢字に変換する異体字変換手段と、前記
変換手段によって変換された前記かな漢字文字列に含ま
れる前記難読度の高い漢字を前記異体字変換手段によっ
て変換された前記難読度の低い漢字で置換して表示する
第2表示手段とを有することを特徴とする文字処理装置
2. A kana-kanji dictionary that stores a hiragana reading sequence and a kana-kanji character string corresponding to the hiragana reading sequence; and a variant character dictionary that stores a kana-kanji character string and a kana-kanji character string of a variant character that corresponds to the kana-kanji character string. , an input means for inputting a hiragana reading sequence, and an instruction for instructing to convert the hiragana reading sequence inputted by the input means into kana-kanji in a character processing device having a reading difficulty dictionary storing reading difficulty information of kanji; means, converting means for converting the hiragana pronunciation inputted by the input means into a kana-kanji character string based on the kana-kanji dictionary, based on instructions from the instruction means, and the kana-kanji characters converted by the converting means. a first display means for displaying a character string; a search means for searching, using the difficulty level dictionary, whether or not the Kana-Kanji character string converted by the conversion means includes a kanji with a high degree of difficulty in reading; variant character converting means for converting the highly difficult to read kanji into a less difficult to read kanji using the variant character dictionary when the search means searches for a kanji with a high degree of difficulty in reading in the kana-kanji character string; and a second display means for replacing and displaying the highly difficult-to-read kanji included in the kana-kanji character string converted by the means with the less difficult-to-read kanji converted by the variant character conversion means. Character processing device.
JP3101114A 1991-05-07 1991-05-07 Method and device for processing character Withdrawn JPH04332073A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3101114A JPH04332073A (en) 1991-05-07 1991-05-07 Method and device for processing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3101114A JPH04332073A (en) 1991-05-07 1991-05-07 Method and device for processing character

Publications (1)

Publication Number Publication Date
JPH04332073A true JPH04332073A (en) 1992-11-19

Family

ID=14292049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3101114A Withdrawn JPH04332073A (en) 1991-05-07 1991-05-07 Method and device for processing character

Country Status (1)

Country Link
JP (1) JPH04332073A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5635733U (en) * 1979-08-28 1981-04-07
JPS6195940A (en) * 1984-10-18 1986-05-14 出光石油化学株式会社 Manufacture of laminate
JPH0319182Y2 (en) * 1986-06-27 1991-04-23
JPH03104955U (en) * 1990-02-15 1991-10-30

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5635733U (en) * 1979-08-28 1981-04-07
JPS6195940A (en) * 1984-10-18 1986-05-14 出光石油化学株式会社 Manufacture of laminate
JPH0319182Y2 (en) * 1986-06-27 1991-04-23
JPH03104955U (en) * 1990-02-15 1991-10-30

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Similar Documents

Publication Publication Date Title
JPH04332073A (en) Method and device for processing character
JP3103179B2 (en) Document creation device and document creation method
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH04332074A (en) Method and device for processing character
JP2786260B2 (en) Kana-Kanji conversion device
JP2846655B2 (en) Character correction method
JPH0619882A (en) Method and device for processing character
JP2833650B2 (en) Document processing device
JPH0380363A (en) Document processor
JPH0697455B2 (en) Kana-Kanji conversion device
JPH0922411A (en) Document processing method and its device
JPS62119665A (en) Word processor
JPH0520316A (en) Character processor
JPH10187700A (en) Document processor
JPH04155467A (en) Character processor
JPH0115105B2 (en)
JPH05135007A (en) Character input processing method
JPH0922412A (en) Document processing method and its device
JPH06187486A (en) Handwritten character input device
JPH0351959A (en) Electronic dictionary
JPH08194701A (en) Character processor
JPH01200470A (en) Character processor
JPH0628062B2 (en) Character processing apparatus and method
JPS6338737B2 (en)
JPH103475A (en) Character processor

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980806