JPH07295974A - Character processor - Google Patents

Character processor

Info

Publication number
JPH07295974A
JPH07295974A JP6090177A JP9017794A JPH07295974A JP H07295974 A JPH07295974 A JP H07295974A JP 6090177 A JP6090177 A JP 6090177A JP 9017794 A JP9017794 A JP 9017794A JP H07295974 A JPH07295974 A JP H07295974A
Authority
JP
Japan
Prior art keywords
word
document
registered
unknown
word dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6090177A
Other languages
Japanese (ja)
Inventor
Hironori Suzuki
大記 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6090177A priority Critical patent/JPH07295974A/en
Publication of JPH07295974A publication Critical patent/JPH07295974A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To easily register an unknown word by a user by extracting a word not stored in a word dictionary means or a registered word dictionary means from a prepared document by an unknown word extraction means and registering the extracted word in a registered word dictionary by an unknown word registration means. CONSTITUTION:A KANA (Japanese syllabary) character string inputted from a keyboard KB is converted to a character string to be the object of KANJI (Chinese character) conversion by an exchange key CON by referring to a word dictionary DIC. The word not stored in the word dictionary DIC or the registered word dictionary TDIC is extracted from the document prepared by the KANA/KANJI conversion. The extracted word is registered in the registered word dictionary TDIC by an unknown word extraction utility execution key GUTL. Thus, the conversion rate of the KANA/KANJI conversion is improved in addition and change for the prepared document and the preparation of a new document relating to the document.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は日本語の処理に関し、特
にかな漢字変換において、正しい表記の文章を迅速に作
成する文字処理装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to Japanese language processing, and more particularly to a character processing apparatus for rapidly creating a correctly written sentence in Kana-Kanji conversion.

【0002】[0002]

【従来の技術】一般的に日本語ワードプロセッサなどの
文字処理装置における日本語の入力はかな漢字変換を使
って行われている。このかな漢字変換の変換候補は、単
語の読み、表記、品詞等の単語の情報を格納した単語辞
書を用いて作成されている。さらに、このような文字処
理装置には単語辞書に格納されていない単語(以後、未
知語と呼ぶ)をユーザーが自分で登録するための登録単
語辞書が設けられている。この辞書に未知語を登録すれ
ば、かな漢字変換候補にその単語が出現することになり
効率よく変換結果を得られることになる。
2. Description of the Related Art Generally, Japanese input in a character processing device such as a Japanese word processor is performed by using kana-kanji conversion. The conversion candidates for this Kana-Kanji conversion are created using a word dictionary that stores information about words such as reading, notation, and part of speech. Further, such a character processing device is provided with a registered word dictionary that allows a user to register a word (hereinafter referred to as an unknown word) that is not stored in the word dictionary. If an unknown word is registered in this dictionary, that word will appear in the kana-kanji conversion candidates, and the conversion result can be obtained efficiently.

【0003】[0003]

【発明が解決しようとする課題】しかし、すでに作成済
の文書に追加する場合あるいはそれらの関連文書を作成
する場合においては、その作成済文書が作られたときに
作成者が登録したと思われる登録単語辞書を得られない
場合が多い。殊にその文書が他人の作成した文書である
場合はなおさらである。そのため作成済の文書の未知語
を新規入力中に使用する場合、その未知語はかな漢字変
換候補にはならず効率よく変換結果が得られないことに
なる。
However, in the case of adding to an already created document or creating those related documents, it is considered that the creator registered when the created document was created. In many cases, you cannot get a registered word dictionary. Especially when the document is a document created by another person. Therefore, when an unknown word of a created document is used during new input, the unknown word does not become a kana-kanji conversion candidate and the conversion result cannot be obtained efficiently.

【0004】本発明の目的は、すでに作成済である文書
に使用されている未知語をユーザーが容易に登録できる
文字処理装置を提供することにある。
It is an object of the present invention to provide a character processing device which allows a user to easily register an unknown word used in a document that has already been created.

【0005】[0005]

【課題を解決するための手段】以上の目的を達成するた
め、本発明は、文字を入力する入力手段と、単語の読み
がなに対応して、表示文字列を含む当該単語の情報を格
納した単語辞書手段と、前記入力手段より入力されたか
な文字列を、前記単語辞書手段を参照して前記表記文字
列に変換するかな漢字変換手段と、前記単語辞書手段に
格納されていない単語の情報を登録するための登録単語
辞書手段と、前記かな漢字変換によって作成された文書
から前記単語辞書手段または前記登録単語辞書手段に格
納されていない単語を抽出する未知語抽出手段と、当該
抽出された単語を前記登録単語辞書に登録する未知語登
録手段とを具備することを特徴とするものである。
In order to achieve the above object, the present invention stores the information of the word including the display character string corresponding to the input means for inputting the character and the reading of the word. And a kana-kanji conversion means for converting the kana character string input by the input means into the notation character string by referring to the word dictionary means, and information of words not stored in the word dictionary means. A registered word dictionary means for registering a word, an unknown word extracting means for extracting a word not stored in the word dictionary means or the registered word dictionary means from the document created by the kana-kanji conversion, and the extracted word. And unknown word registration means for registering in the registered word dictionary.

【0006】[0006]

【作用】以上のように構成された本発明によれば、未知
語抽出手段は単語辞書手段または登録単語辞書手段に格
納されていない単語を作成済の文書から抽出し、この抽
出された単語は未知語登録手段によって登録単語辞書に
登録することができるので、ユーザーはすでにある文書
内に出現する未知語を抽出してその未知語を登録するこ
とが可能となる。これにより、その文書の追加、変更あ
るいは関連文書の作成時の変換効率を上げることができ
る。
According to the present invention configured as described above, the unknown word extracting means extracts a word which is not stored in the word dictionary means or the registered word dictionary means from the prepared document, and the extracted word is Since it can be registered in the registered word dictionary by the unknown word registration means, the user can extract an unknown word that already appears in a document and register the unknown word. This makes it possible to improve conversion efficiency when adding or changing the document or creating a related document.

【0007】[0007]

【実施例】以下、図面を参照して本発明を詳細に説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described in detail below with reference to the drawings.

【0008】図1は本発明の一実施例の全体構成を示す
ブロック図である。
FIG. 1 is a block diagram showing the overall construction of an embodiment of the present invention.

【0009】図1に示した構成において、CPUは、マ
イクロプロセッサであり、文字処理のための演算、論理
判断等を行なうとともに、アドレスバスAB、コントロ
ールバスCB、データバスDBを介して、それらのバス
に接続された各構成要素を制御する。
In the configuration shown in FIG. 1, the CPU is a microprocessor, which performs arithmetic operations for character processing, logical judgments, and the like, and at the same time, those via the address bus AB, control bus CB and data bus DB. It controls each component connected to the bus.

【0010】アドレスバスABはマイクロプロセッサC
PUの制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロプロセ
ッサCPUの制御の対象とする各構成要素のコントロー
ル信号を転送して印加する。データバスDBは各構成機
器相互間のデータの転送を行なう。
The address bus AB is a microprocessor C
An address signal for instructing a component to be controlled by the PU is transferred. The control bus CB transfers and applies a control signal of each constituent element to be controlled by the microprocessor CPU. The data bus DB transfers data between the constituent devices.

【0011】次にROMは、読出し専用の固定メモリで
ある。ここで、PAは、マイクロプロセッサCPUが実
行する後述する制御手順等を記憶させたプログラムエリ
アである。
The ROM is a read-only fixed memory. Here, PA is a program area in which control procedures and the like to be described later executed by the microprocessor CPU are stored.

【0012】また、RAMは、1ワード16ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。ここ
で、TBUFは文書バッファであり、キーボードKBよ
り入力された文書情報を蓄えるためのメモリである。Y
BUFはキーボードKBより入力された読みを格納する
入力読みバッファ・メモリである。DICはかな漢字変
換を行なうための単語辞書である。GDICはかな漢字
変換の学習データを格納する学習データ辞書である。T
DICはかな漢字変換を行なうための単語を登録できる
登録単語辞書である。この登録単語辞書TDICに登録
できる単語はその表記が漢字である必要はなく、どのよ
うな表記の単語でもよい。DBPOOLはYBUFの読
みを文節に解析・変換した情報を格納する同音語候補格
納メモリである。LRNDATは個々の単語の学習状態
を格納するための学習データ格納メモリである。FZT
BLは付属語を単語辞書DICに格納されている結合情
報に対応させるための付属語列変換テーブルである。
The RAM is a writable random access memory having a structure of 1 word 16 bits, and is used for temporary storage of various data from each constituent element. Here, TBUF is a document buffer, which is a memory for storing the document information input from the keyboard KB. Y
BUF is an input reading buffer memory for storing readings input from the keyboard KB. DIC is a word dictionary for performing kana-kanji conversion. The GDIC is a learning data dictionary that stores learning data for kana-kanji conversion. T
DIC is a registered word dictionary in which words for performing kana-kanji conversion can be registered. The words that can be registered in this registered word dictionary TDIC do not need to be written in Kanji, and any written word may be used. DBPOOL is a homophone candidate storage memory that stores information obtained by analyzing and converting YBUF readings into phrases. LRNDAT is a learning data storage memory for storing the learning state of each word. FZT
BL is an adjunct word string conversion table for associating an adjunct word with the combined information stored in the word dictionary DIC.

【0013】KBはキーボードであって、アルファベッ
トキー、ひらがなキー、カタカナキー等の文字記号入力
キーに加えて、変換を指示する変換キーなどの各種のフ
ァンクションキーを備えている。
The KB is a keyboard which is provided with various function keys such as conversion keys for instructing conversion, in addition to character / symbol input keys such as alphabet keys, hiragana keys, and katakana keys.

【0014】このキーボードKBにおいて、YOMIは
読みを入力するためのキー、COMは入力した読みを変
換するための変換指示キー、NXTは変換候補を変更し
て次候補に変換するための次候補変換指示キー、SEL
は現在の同音語表示候補に確定し同時にその候補表記を
学習することを指示するための選択キー、LISTはメ
モリDISKに記憶されている文書の一覧を表示するた
めの文書一覧キー、CALLはメモリDISKから文書
を文書バッファTBUFに呼び出す文書呼出キー、SA
VEは文書バッファTBUFの文書をメモリDISKに
記憶させるための文書保存キー、GUTLは未知語抽出
ユーティリティを実行させるためのユーティリティ実行
キー、OKは処理を確認し実行を指示する実行キー、N
OKは処理を中止し取り消すための取消キーをそれぞれ
示している。
In this keyboard KB, YOMI is a key for inputting a reading, COM is a conversion instruction key for converting the input reading, NXT is a next candidate conversion for changing a conversion candidate and converting it to a next candidate. Instruction key, SEL
Is a selection key for instructing to fix the current homophone display candidate and learning the candidate notation simultaneously, LIST is a document list key for displaying a list of documents stored in the memory DISK, and CALL is a memory. SA, a document call key that calls a document from the DISK to the document buffer TBUF
VE is a document save key for storing the document in the document buffer TBUF in the memory DISK, GUTL is a utility execution key for executing the unknown word extraction utility, OK is an execution key for confirming the process and instructing execution, N
OK indicates a cancel key for canceling and canceling the processing.

【0015】DISKは定型文書を記憶するためのメモ
リであり、作成された文書の保管を行ない、保管された
文書はキーボードKBの指示により、必要な時呼び出さ
れる。
DISK is a memory for storing a fixed form document. The created document is stored, and the stored document is called when necessary by an instruction of the keyboard KB.

【0016】CRはカーソルレジスタである。マイクロ
プロセッサCPUにより、カーソルレジスタCRの内容
は読み書きされる。また、後述するCRTコントローラ
CRTCは、ここに蓄えられたアドレスに対応する表示
装置CRT上の位置にカーソルを表示する。
CR is a cursor register. The contents of the cursor register CR are read and written by the microprocessor CPU. The CRT controller CRTC, which will be described later, displays a cursor at the position on the display device CRT corresponding to the address stored here.

【0017】DBUFは表示用バッファメモリで、文書
バッファTBUFに蓄えられた文書情報等のパターンを
蓄える。
DBUF is a display buffer memory for storing patterns such as document information stored in the document buffer TBUF.

【0018】CRTコントローラCRTCはカーソルレ
ジスタCRおよび表示用バッファメモリDBUFに蓄え
られた内容を表示装置CRTに表示する役割を担う。ま
た、CRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成のパターンおよびカ
ーソルの表示はCRTコントローラCRTCによって制
御される。
The CRT controller CRTC plays a role of displaying the contents stored in the cursor register CR and the display buffer memory DBUF on the display device CRT. The CRT is a display device using a cathode ray tube or the like, and the display of the dot configuration pattern and the cursor on the display device CRT is controlled by the CRT controller CRTC.

【0019】さらに、CGはキャラクタジェネレータで
あって、表示装置CRTに表示する文字、記号のパター
ンを記憶するものである。
Further, CG is a character generator, which stores a pattern of characters and symbols to be displayed on the display device CRT.

【0020】このように構成された本発明に係る文字処
理装置は、キーボードKBからの各種の入力に応じて作
動するものであって、キーボードKBからの入力が供給
されると、まず、インタラプト信号がマイクロプロセッ
サCPUに送られ、そのマイクロプロセッサCPUがR
OM内に記憶してある各種の制御信号を読出し、それら
の制御信号に従って、各種の制御が行なわれる。
The character processing device according to the present invention thus constructed operates in response to various inputs from the keyboard KB. When the input from the keyboard KB is supplied, the interrupt signal is first sent. Is sent to the microprocessor CPU, and the microprocessor CPU
Various control signals stored in the OM are read out, and various controls are performed in accordance with those control signals.

【0021】以下、このように構成された本実施例装置
における文書からの未知語の抽出、登録について図2か
ら図15までを参照して説明する。
Extraction and registration of an unknown word from a document in the apparatus of this embodiment having the above configuration will be described below with reference to FIGS. 2 to 15.

【0022】図2はすでに作成済の文書を表示している
画面例である。図中において21はカーソルを示す。こ
の状態は、表示されている文書に文を追加しようとして
ユーザーが次の段落位置へカーソルを移動させている状
態である。
FIG. 2 shows an example of a screen displaying a document that has already been created. In the figure, 21 indicates a cursor. In this state, the user is moving the cursor to the next paragraph position in order to add a sentence to the displayed document.

【0023】図3は、図2に示した状態からツール起動
キーGUTLが入力されたときの画面例である。未知語
を抽出し登録するツールである「未知語抽出ユーティリ
ティ」の起動を確認するウィンドウが表示されている。
ここで実行キーが入力されると未知語の抽出が行なわれ
る。呼び出された作成済の文書を辞書を使って構文解析
を行ない、辞書に存在しない未知語を抽出する。取消キ
ーが押されるとユーティリティを終了し図2の画面に戻
ることになる。
FIG. 3 is an example of a screen when the tool start key GUTL is input from the state shown in FIG. A window is displayed confirming that the "Unknown word extraction utility", which is a tool for extracting and registering unknown words, is started.
When the execution key is input here, the unknown word is extracted. Parse the created document that has been called using a dictionary and extract unknown words that do not exist in the dictionary. When the cancel key is pressed, the utility is terminated and the screen shown in FIG. 2 is returned to.

【0024】図4は、未知語の抽出を終了した状態の画
面例である。ユーザーが抽出された未知語を認識できる
ように、表示されている文書上で未知語は編みかけ表示
でマーキングされている。
FIG. 4 is an example of a screen in a state where extraction of unknown words has been completed. The unknown words are marked in a knitted display on the displayed document so that the user can recognize the extracted unknown words.

【0025】図5は、図4でマーキングされた未知語の
一つをユーザーが選択したときの画面例である。選択し
た未知語においてシステムが判断した属性を表示し、ユ
ーザーはここで登録内容の確認をする。ここで実行キー
が入力されると表示されている未知語を登録単語辞書に
登録する。
FIG. 5 is an example of a screen when the user selects one of the unknown words marked in FIG. Displays the attributes judged by the system in the selected unknown word, and the user confirms the registered contents here. When the execution key is input here, the displayed unknown word is registered in the registered word dictionary.

【0026】図6は、システムが判断した未知語の属性
をユーザーが変更しようとしている画面例である。この
例では図5で表示されていた単語の属性のうち、品詞属
性を変更しようとしている。このツールでは品詞を変更
しようとする場合、変更可能な品詞がサブウィンドウの
中に候補行として表示され、ユーザーがその中から選択
するようになっている。
FIG. 6 is an example of a screen in which the user is trying to change the attribute of an unknown word judged by the system. In this example, of the attributes of the word displayed in FIG. 5, the part-of-speech attribute is being changed. With this tool, when you try to change the part of speech, the part of speech that can be changed is displayed as a candidate line in the sub-window, and the user can select from it.

【0027】図7はすべての単語について登録あるいは
取消を実行した後、すなわちツールにより必要な未知語
のみが登録単語辞書に登録された後に、文書を入力して
いる画面例である。
FIG. 7 shows an example of a screen for inputting a document after registration or cancellation of all the words, that is, after only the unknown words required by the tool have been registered in the registered word dictionary.

【0028】図8は図7の状態で変換指示キーCONが
押された場合の変換結果を示す画面例である。ツールに
よって登録された未知語が正しく変換されていることが
分かる。
FIG. 8 is an example of a screen showing the conversion result when the conversion instruction key CON is pressed in the state of FIG. You can see that the unknown words registered by the tool are converted correctly.

【0029】次に上述したような本実施例の動作をフロ
ーチャートに従って説明する。
The operation of this embodiment as described above will be described below with reference to a flow chart.

【0030】図9は本実施例のマイクロプロセッサCP
Uの動作手順を示すフローチャートである。
FIG. 9 shows the microprocessor CP of this embodiment.
It is a flowchart which shows the operation procedure of U.

【0031】ステップS9−1においてキーボードKB
より何らかのキーが押下され、割り込みが発生するのを
待つ。キーが入力されるとステップS9−2においてこ
のキーを判別し、キーの種類に応じてステップS9−
3、ステップS9−4、ステップS9−5、ステップS
9−6、ステップS9−7、ステップS9−8、ステッ
プS9−9、ステップS9−10、、ステップS9−1
1、、ステップS9−12のいずれかのステップに分岐
する。
In step S9-1, the keyboard KB
Wait for some more key to be pressed and interrupt to occur. When a key is input, this key is discriminated in step S9-2, and step S9- is selected according to the type of key.
3, step S9-4, step S9-5, step S
9-6, step S9-7, step S9-8, step S9-9, step S9-10, step S9-1.
1, and branches to any one of steps S9-12.

【0032】ステップS9−3は読み入力キーYOMI
が押下されたときの処理であり、押下された読みのコー
ドを入力読みバッファメモリYBUFに蓄える。
Step S9-3 is a reading input key YOMI.
This is the process when is pressed, and the pressed reading code is stored in the input reading buffer memory YBUF.

【0033】ステップS9−4は変換キーCONが押下
されたときの処理であり、ステップS9−3で入力され
て入力読みバッファメモリYBUFに蓄えられているか
な漢字変換の対象となる文字列を変換し、出力バッファ
DBUFに出力する。
Step S9-4 is a process when the conversion key CON is pressed, and the character string to be subjected to the kana-kanji conversion input in step S9-3 and stored in the input reading buffer memory YBUF is converted. , To the output buffer DBUF.

【0034】ステップS9−5は次候補キーNXTが押
下されたときの処理であり、ステップS9−4で出力さ
れた出力バッファDBUF中の同音語の別の候補を表示
する。
Step S9-5 is the processing when the next candidate key NXT is pressed, and another candidate of the same word in the output buffer DBUF output in step S9-4 is displayed.

【0035】ステップS9−6は選択キーSELが押下
されたときの処理であり、画面に表示されている出力バ
ッファDBUF中の同音語の中から1つの文字列を確定
し、確定された文字列を文書中に出力する。
Step S9-6 is a process when the selection key SEL is pressed, and one character string is decided from the homophones in the output buffer DBUF displayed on the screen, and the decided character string is decided. Is output in the document.

【0036】ステップS9−7は文書一覧キーLIST
が押下されたときの処理であり、メモリDISCに記憶
されている文書を一覧表示する処理を行う。
Step S9-7 is a document list key LIST.
This is a process when is pressed, and a process of displaying a list of documents stored in the memory DISC is performed.

【0037】ステップS9−8は文書呼出キーCALL
が押下されたときの処理であり、呼出先であるメモリD
ISKに記憶されている文書の一覧表示を行い、ユーザ
ーが文書を選択した後、その文書を文書バッファTBU
FにメモリDISCから呼び出す処理を行う。
Step S9-8 is the document call key CALL.
Is the process when is pressed, and the memory D that is the callee
A list of documents stored in ISK is displayed, and after the user selects a document, the document is stored in the document buffer TBU.
F is called from the memory DISC.

【0038】ステップS9−9はユーティリティ実行キ
ーGULTが押下されたときの処理であり、文書バッフ
ァTBUF内の文書から未知語を抽出し登録単語辞書T
DICに格納する処理を行う。この処理については後に
詳述する。
Step S9-9 is a process when the utility execution key GULT is pressed, and an unknown word is extracted from the document in the document buffer TBUF and the registered word dictionary T is extracted.
The process of storing in the DIC is performed. This processing will be described later in detail.

【0039】ステップS9−10はYOMI,CON,
NXT,SEL,LIST,CALL,GULT以外の
キー(たとえば、カーソル移動キーなどの文書編集で用
いるキーなど)が押下された場合の処理であり、各キー
に対応した処理が実行される。
In step S9-10, YOMI, CON,
This is a process when a key other than NXT, SEL, LIST, CALL, and GULT (for example, a key used for document editing such as a cursor movement key) is pressed, and a process corresponding to each key is executed.

【0040】ステップS9−11は上記の各処理の結果
を表示する表示処理である。文書中のデータ1文字を読
んではパターンに展開し、表示バッファDBUFに出力
するという通常広く行われている処理である。
Step S9-11 is a display process for displaying the results of the above processes. This is a widely-used process of reading one character of data in a document, developing it into a pattern, and outputting it to the display buffer DBUF.

【0041】図10はステップS9−9のユーティリテ
ィ実行処理を詳細化したフローチャートである。
FIG. 10 is a detailed flowchart of the utility execution process of step S9-9.

【0042】ステップS10−1は未知語抽出ユーティ
リティの実行をユーザーが確認する処理である。ここで
実行キーOKが押下されるとステップS10−2の抽出
処理が行われる。取消キーNOKが押下されるとステッ
プS10−10の終了処理が行われユーティリティ実行
処理を終了する。
In step S10-1, the user confirms the execution of the unknown word extraction utility. When the execution key OK is pressed here, the extraction process of step S10-2 is performed. When the cancel key NOK is pressed, the end processing of step S10-10 is performed and the utility execution processing is ended.

【0043】ステップS10−2は文書バッファTBU
Fの文書から、単語辞書DIC、登録単語辞書TDIC
に格納されていない未知語を抽出する処理である。文書
バッファTBUF内に呼び出された文書を単語辞書DI
C、登録単語辞書TDICを用いて構文解析を行い未知
語を抽出する。構文解析処理は機会翻訳装置で一般に行
われている処理である。表示に漢字が含まれている場合
は単漢レベルで漢字かな変換を行い、その漢字の読みを
得る。また解析結果から品詞を推定する。
Step S10-2 is the document buffer TBU.
From the document of F, word dictionary DIC, registered word dictionary TDIC
This is a process of extracting an unknown word that is not stored in. The document called in the document buffer TBUF contains the word dictionary DI
C, syntactic analysis is performed using the registered word dictionary TDIC to extract unknown words. The syntactic analysis process is a process generally performed by the opportunity translation device. If the display contains kanji, kanji-kana conversion is performed at the single kanji level, and the kanji reading is obtained. The part of speech is estimated from the analysis result.

【0044】ステップS10−3はステップS10−2
で抽出された未知語をユーザーにわかるよう、図4に示
したように表示する処理である。
Step S10-3 is step S10-2.
This is a process of displaying the unknown word extracted in step 4 as shown in FIG.

【0045】ステップS10−4は未知語表示状態にお
いてキーボードより何らかのキーが押下され、割り込み
が発生するのを待つ。キーが入力されるとステップS1
0−5においてこのキーを判別し、ステップS10−
6、ステップS10−7、ステップS10−8、ステッ
プS10−9、ステップS10−10のいずれかのステ
ップに分岐する。
Step S10-4 waits until an interrupt is generated by pressing any key on the keyboard in the unknown word display state. When the key is entered, step S1
This key is discriminated in 0-5, and step S10-
6, step S10-7, step S10-8, step S10-9, and step S10-10.

【0046】ステップS10−6は表示されている未知
語の一つをユーザーが選択したときの処理である。その
未知語の読み、表記、品詞等の登録内容である属性情報
を表示し、ユーザーに登録実行の確認を取る。
Step S10-6 is a process when the user selects one of the displayed unknown words. The attribute information, which is the registered content such as reading, notation, and part of speech of the unknown word, is displayed, and the user is asked to confirm the registration execution.

【0047】ステップS10−7は登録する未知語の属
性情報を変更する処理である。この処理は図6に示した
ような画面を見ながらユーザーによってなされる。
Step S10-7 is a process for changing the attribute information of the unknown word to be registered. This process is performed by the user while looking at the screen as shown in FIG.

【0048】ステップS10−8はユーザーから指定の
あった未知語を登録単語辞書TDICに実際に格納する
処理である。
In step S10-8, the unknown word designated by the user is actually stored in the registered word dictionary TDIC.

【0049】ステップS10−9は未知語の指定、属性
変更、登録、終了以外の入力があったときの処理であ
る。
Step S10-9 is the processing when there is an input other than the designation of the unknown word, the attribute change, the registration, and the end.

【0050】ステップS10−10はユーティリティの
終了処理である。未知語の編みかけ表示を取り消し、ユ
ーティリティを終了する。
Step S10-10 is a utility termination process. Cancel the knitting display of unknown words and exit the utility.

【0051】ステップS10−11は上記の各処理の結
果、変更された部分があれば、その部分を表示する表示
処理である。
Step S10-11 is a display process for displaying the changed part, if any, as a result of the above processes.

【0052】上述したように、本実施例によれば文書か
ら未知語を抽出する未知語抽出手段と抽出された未知語
を登録単語に登録する未知語登録手段を具えているの
で、作成済の文書に対する追加や変更、またその文書に
関連した新規文書の作成においてユーザーに変換効率の
高いかな漢字変換を提供することが可能となる。
As described above, according to the present embodiment, since the unknown word extracting means for extracting the unknown word from the document and the unknown word registering means for registering the extracted unknown word as the registered word are provided, it has already been created. It becomes possible to provide a user with high conversion efficiency kana-kanji conversion for addition or modification of a document and creation of a new document related to the document.

【0053】(他の実施例)前述した実施例では、抽出
された候補それぞれに対してユーザーが選択し登録を実
行するものであった。第2の実施例では、抽出された単
語を一括して登録するものである。図11は、未知語を
抽出後に抽出された単語を一括して登録することをユー
ザーが確認するためのウィンドウが表示されている画面
例である、この状態で実行キーが入力されると抽出され
た単語がウィンドウ上に表示されている属性で一括登録
される。本実施例では1語ずつ確認する手間が省けるの
で、特に文書量が大きい場合に有効である。
(Other Embodiments) In the above-described embodiments, the user selects and executes registration for each of the extracted candidates. In the second embodiment, the extracted words are collectively registered. FIG. 11 is a screen example in which a window for the user to confirm that the extracted words are registered in a batch after extracting the unknown word is displayed. When the execution key is input in this state, the window is extracted. The registered words are registered in a batch with the attributes displayed on the window. In the present embodiment, it is possible to save the trouble of checking the words one by one, and it is particularly effective when the document amount is large.

【0054】また第3の実施例では抽出した未知語をリ
ストアップしたウィンドウを用いて登録を行うものであ
る。図12は、未知語を抽出後に抽出された単語をリス
トアップした一覧ウィンドウを示した画面例である。リ
ストアップされた単語は個別に解除、属性変更、登録、
一括登録を指示することができる。ここでは、単語を指
示するために編みかけ状のカーソルが表示されている。
図13はリストアップされた単語のいくつかを個別に指
定した場合の一覧ウィンドウを示した画面例である。
「読み」欄の左上にマークされた二重丸が現在指定され
ている単語であることを示している。図14は、図13
の状態で指定された単語を一括登録する指示を入力した
場合に登録実行を確認するためのウィンドウを示した画
面例である。
In the third embodiment, registration is carried out using a window listing the extracted unknown words. FIG. 12 is an example of a screen showing a list window listing the extracted words after extracting the unknown word. Listed words can be individually canceled, attribute changed, registered,
You can instruct bulk registration. Here, a braided cursor is displayed to indicate a word.
FIG. 13 is an example of a screen showing a list window when some of the listed words are individually designated.
The double circle marked in the upper left of the "reading" column indicates that the word is currently specified. 14 is the same as FIG.
7 is an example of a screen showing a window for confirming the registration execution when an instruction to collectively register the designated words in the state is input.

【0055】また以上の実施例では未知語の読みは解析
終了後に単漢字レベルで辞書を使って漢字かな変換を行
っていたが、解析過程で得られる読みを利用することも
可能である。また、かな漢字変換の入力中の読みを変換
結果と共に文書中に格納する手段を設けることにより、
未知語に対応する読みをそこから得るようにすることも
できる。
Further, in the above-mentioned embodiment, the kanji conversion is performed using the dictionary at the single kanji level for the reading of the unknown word after the analysis is finished, but it is also possible to use the reading obtained in the analysis process. Also, by providing a means for storing the reading during input of Kana-Kanji conversion in the document together with the conversion result,
It is also possible to get the reading corresponding to the unknown word from it.

【0056】また以上の各実施例の説明においては、ユ
ーザーが意図的に未知語の抽出を指示するユーティリテ
ィ起動キーを用意しているが、たとえば文書呼出時に自
動的に実行させるようにしてもよい。さらに、抽出以降
ユーザーに登録の確認を行っているが。これも自動的に
行わせ、このような登録をユーザーに意識させないこと
も可能である。
Further, in the above description of each embodiment, the utility starting key for intentionally instructing the extraction of the unknown word by the user is prepared, but it may be automatically executed when the document is called, for example. . In addition, we have confirmed the registration with the user since the extraction. This can also be done automatically so that the user is not aware of such registration.

【0057】また以上の各実施例の説明においては、未
知語の選択等をキーによる操作で行っていたが、マウス
等のポインティングデバイスを使用することも可能であ
る。図15は未知語の選択にマウスを使用しているとき
の画面例である。
In the above description of each embodiment, the unknown word is selected by operating the keys, but it is also possible to use a pointing device such as a mouse. FIG. 15 is a screen example when the mouse is used to select an unknown word.

【0058】本発明は、単体の装置に限らず、複数の装
置からなるシステムにも適用可能であり、また、文字処
理を専用とした装置に限らず、かな漢字変換によって漢
字かな混じり文字列を出力する機能を具えた装置または
システムに適用可能であることは勿論である。更に、装
置またはシステムに、ソフトウェアを提供することによ
っても、実現可能であることは言うまでもない。
The present invention is applicable not only to a single device but also to a system composed of a plurality of devices, and is not limited to a device dedicated to character processing, and outputs a kana-kana mixed character string by kana-kanji conversion. It is needless to say that the present invention can be applied to a device or system having a function to perform. Further, it goes without saying that it can be realized by providing software to the device or system.

【0059】[0059]

【発明の効果】上述したように、本発明によれば作成済
の文書から、かな漢字変換で使用している辞書にない単
語を抽出して登録することができ、それ以後にその文書
への追加や文章の変更を行う場合、またはその文書に関
連する新規文書を作成する場合にかな漢字変換の変換率
を向上させることができて効率よく入力することができ
る。
As described above, according to the present invention, it is possible to extract and register a word that is not in the dictionary used for Kana-Kanji conversion from a created document and add it to the document thereafter. It is possible to improve the conversion rate of kana-kanji conversion and efficiently input data when changing a text or a sentence, or when creating a new document related to the text.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の文字処理装置の全体構成を
示すブロック図である。
FIG. 1 is a block diagram showing an overall configuration of a character processing device according to an embodiment of the present invention.

【図2】作成済の文書を表示している例を示した説明図
である。
FIG. 2 is an explanatory diagram showing an example in which a created document is displayed.

【図3】未知語を抽出し登録するユーティリティを起動
した状態での画面例を示した説明図である。
FIG. 3 is an explanatory diagram showing an example of a screen in a state where a utility for extracting and registering an unknown word is activated.

【図4】未知語を抽出し表示を行っている画面例を示し
た説明図である。
FIG. 4 is an explanatory diagram showing an example of a screen on which unknown words are extracted and displayed.

【図5】抽出された未知語をユーザーが選択し登録の確
認を行っている画面例を示した説明図である。
FIG. 5 is an explanatory diagram showing an example of a screen in which a user selects an extracted unknown word and confirms registration.

【図6】登録する未知語の属性の変更を行うときの画面
例を示した説明図である。
FIG. 6 is an explanatory diagram showing a screen example when an attribute of an unknown word to be registered is changed.

【図7】登録後に文書を入力している画面例を示した説
明図である。
FIG. 7 is an explanatory diagram showing a screen example in which a document is input after registration.

【図8】登録後にかな漢字変換を行った結果を表示して
いる画面例を示した説明図である。
FIG. 8 is an explanatory diagram showing an example of a screen displaying a result of performing kana-kanji conversion after registration.

【図9】図1に示す本実施例の動作全体の処理手順の一
例を示すフローチャートである。
9 is a flowchart showing an example of a processing procedure of the entire operation of the present exemplary embodiment shown in FIG.

【図10】未知語を抽出し登録するユーティリティの処
理手順の一例を示すフローチャートである。
FIG. 10 is a flowchart showing an example of a processing procedure of a utility for extracting and registering an unknown word.

【図11】抽出した未知語を一括して登録する場合の画
面例を示した説明図である。
FIG. 11 is an explanatory diagram showing an example of a screen when collectively registering extracted unknown words.

【図12】抽出した未知語をリストアップした一覧画面
を表示する場合の画面例を示した説明図である。
FIG. 12 is an explanatory diagram showing a screen example when a list screen listing the extracted unknown words is displayed.

【図13】未知語一覧画面において未知語を個別に選択
している画面例を示した説明図である。
FIG. 13 is an explanatory diagram showing a screen example in which unknown words are individually selected on the unknown word list screen.

【図14】未知語一覧画面において個別に選択した未知
語を一括登録する場合の画面例を示した説明図である。
FIG. 14 is an explanatory diagram showing a screen example in the case of collectively registering unknown words individually selected on the unknown word list screen.

【図15】抽出した未知語をマウスによって選択する場
合の画面例を示した説明図である。
FIG. 15 is an explanatory diagram showing a screen example when the extracted unknown word is selected with a mouse.

【符号の説明】[Explanation of symbols]

CALL 文書呼出キー CG キャラクタジェネレータ CON 変換指示キー CPU マイクロプロセッサ CR カーソルレジスタ CRT 表示装置 CRTC CRTコントローラ DBPOOL 同音語候補格納メモリ DBUF 表示用バッファメモリ DIC 単語辞書 DISK メモリ FZTBL 付属語列変換テーブル GDIC 学習データ辞書 GUTL 未知語抽出ユーティリティ実行キー KB キーボード LIST 文書一覧キー LRNDAT 学習データ格納メモリ NOK 取消キー NXT 次候補変換指示キー OK 実行キー PA プログラムエリア RAM ランダムアクセスメモリ ROM 固定メモリ SAVE 文書保存キー SEL 選択キー TBUF 文書バッファ TDIC 登録単語辞書 YBUF 入力読みバッファメモリ YOMI 読み入力キー CALL Document call key CG Character generator CON Conversion instruction key CPU Microprocessor CR Cursor register CRT display device CRTC CRT controller DBPOOL Homophone candidate storage memory DBUF Display buffer memory DIC word dictionary DISK memory FZTBL attached word string conversion table GDIC learning data dictionary GUTL Unknown word extraction utility Execution key KB Keyboard LIST Document list key LRNDAT Learning data storage memory NOK Cancel key NXT Next candidate conversion instruction key OK Execution key PA Program area RAM Random access memory ROM Fixed memory SAVE Document storage key SEL selection key TBUF Document buffer TCID Registered word dictionary YBUF input reading buffer memory YOMI reading input Over

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 文字を入力する入力手段と、 単語の読みがなに対応して、表示文字列を含む当該単語
の情報を格納した単語辞書手段と、 前記入力手段より入力されたかな文字列を、前記単語辞
書手段を参照して前記表記文字列に変換するかな漢字変
換手段と、 前記単語辞書手段に格納されていない単語の情報を登録
するための登録単語辞書手段と、 前記かな漢字変換によって作成された文書から前記単語
辞書手段または前記登録単語辞書手段に格納されていな
い単語を抽出する未知語抽出手段と、 当該抽出された単語を前記登録単語辞書に登録する未知
語登録手段とを具備することを特徴とする文字処理装
置。
1. An input means for inputting characters, a word dictionary means for storing information of the word including a display character string corresponding to the reading of the word, and a kana character string input by the input means. Is referred to by the word dictionary means to convert into the written character string, kana-kanji conversion means, registered word dictionary means for registering information of words not stored in the word dictionary means, and created by the kana-kanji conversion An unknown word extracting means for extracting a word that is not stored in the word dictionary means or the registered word dictionary means from the extracted document; and an unknown word registering means for registering the extracted word in the registered word dictionary. A character processing device characterized by the above.
JP6090177A 1994-04-27 1994-04-27 Character processor Withdrawn JPH07295974A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6090177A JPH07295974A (en) 1994-04-27 1994-04-27 Character processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6090177A JPH07295974A (en) 1994-04-27 1994-04-27 Character processor

Publications (1)

Publication Number Publication Date
JPH07295974A true JPH07295974A (en) 1995-11-10

Family

ID=13991209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6090177A Withdrawn JPH07295974A (en) 1994-04-27 1994-04-27 Character processor

Country Status (1)

Country Link
JP (1) JPH07295974A (en)

Similar Documents

Publication Publication Date Title
JP2000105662A (en) Computer system and method with touch screen keyboard support for multibyte character language
JPH07295974A (en) Character processor
JPH0785027A (en) Document editor
JPS6068425A (en) Kana/kanji converter having learning function
JP2786260B2 (en) Kana-Kanji conversion device
JPS5844528A (en) Selecting system of homonym
JPH07295976A (en) Character processor
JPH04332074A (en) Method and device for processing character
JP2003173332A (en) Kana-kanji conversion method and character processor
JPH11175511A (en) Chinese input conversion processor and method therefor and storage medium storing chinese input conversion processing program
JP3032399B2 (en) Kana-Kanji conversion device
JPH0619882A (en) Method and device for processing character
JPH11195022A (en) Character processor, method for character processing and record medium
JPH05135006A (en) Method and device for processing character
JPH0981555A (en) Method and device for document processing
JPS6265162A (en) Kana-kanji converting system
JPH06236360A (en) Word processor
JPH0962666A (en) Document processing method and device therefor
JPH1074199A (en) Character processing device and method and storage medium storing character processing program
JPH05342197A (en) Japanese word processor
JPH03286251A (en) Character processor
JPH0271360A (en) Document name changing system
JPH01200470A (en) Character processor
JPH11195019A (en) Document processing method and document processor
JPH11195020A (en) Document processing method and document processor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040305

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20040430