JPS60122465A - Language information processing unit - Google Patents

Language information processing unit

Info

Publication number
JPS60122465A
JPS60122465A JP59176593A JP17659384A JPS60122465A JP S60122465 A JPS60122465 A JP S60122465A JP 59176593 A JP59176593 A JP 59176593A JP 17659384 A JP17659384 A JP 17659384A JP S60122465 A JPS60122465 A JP S60122465A
Authority
JP
Japan
Prior art keywords
information
word
frequency information
dictionary
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59176593A
Other languages
Japanese (ja)
Inventor
Koji Kodama
児玉 皓次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59176593A priority Critical patent/JPS60122465A/en
Publication of JPS60122465A publication Critical patent/JPS60122465A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

PURPOSE:To expand the practicality by outputting a new word registered by the user in a dictionary with the highest priority, applying the unit to an information processing unit such as a word processor having a Kana(Japanese syllabary) Kanji(Chinese character) converting function to relieve the load selecting homonyms. CONSTITUTION:A dictionary read control circuit 21 reads word information of the same reading from a dictionary storage device 14 and the result is outputted from a frequency information control circuit 22. The control circuit 22 selects the frequency information of the highest priority and outputs it to a frequency information provision circuit 23. The frequency information for a new word is formed by adding N to the frequency information and also word information of the new word is formed by providing a frequency information. Thus, the word information of the new word has the frequency information with higher priority than that of the existing information. If no nomonym exists in the storage device 14, the frequency information is given by the frequency information provision circuit 23, the result is written in the dictionary storage device 14 by the control circuit 24 and the registration of the new word is finished. Even if homonyms exist, a CPU reads the word information of new registration from the storage device 14, converts it into the pattern information and outputs it to the display section of an input display device with priority.

Description

【発明の詳細な説明】 本発明は言語情報処理装置に関し、特に単語辞書に新語
を登録した際の出力を適切に行なえる言語情報処理装置
に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a linguistic information processing device, and more particularly to a linguistic information processing device that can appropriately output when a new word is registered in a word dictionary.

従来、言語処理を行なう場合、参照すべき辞書として、
多数の単語が登録されている記憶装置を設け、この記憶
装置内の辞書の単語を引くことKよって各種の処理を行
なってきた。ところで、日本語の場合、単語の中如は同
音異字語等があって、一義的に決定できない単語が多い
ことはよく知られている。このため単語の使用頻度等を
調査し、この結果を用いて予め辞書の単語に出現頻度を
つけておき、例えば出現頻度の大きい順に単語を参照で
きるように構成された装置が考えられている。このよう
な装置では、単語の重要度の目安となる頻度情報は固定
されていた。一方、この種の装置の使用者によっては、
単語の使用頻度は著しく異り、使用者が特によく使用す
る単語であっても、一般的に出現頻度が低ければ、常に
、同音異字語の候補として下位の位置におかれ、辞書参
照時間を多く費してしまうことになる。
Conventionally, when performing language processing, dictionaries to be referred to are:
A storage device in which a large number of words are registered has been provided, and various processes have been performed by looking up words in a dictionary within this storage device. By the way, in the case of Japanese, it is well known that there are many words that cannot be unambiguously determined because the word chunyo has homophones and allographs. For this reason, a device has been devised in which the frequency of use of words is investigated, and the results are used to assign frequency of appearance to words in a dictionary in advance, so that the words can be referenced in descending order of frequency of appearance, for example. In such devices, frequency information, which is a measure of the importance of words, is fixed. On the other hand, some users of this type of equipment
The frequency of word usage varies significantly, and even if a word is particularly frequently used by a user, if it occurs generally infrequently, it will always be ranked lower as a homophone candidate and save dictionary reference time. You will end up spending a lot.

このような欠点を補うものの一例として、使用者に最も
適した単語の出現頻度構成を持った辞書を得ることがで
きる辞書自動更新装置が考えられている。
As an example of something that can compensate for these shortcomings, an automatic dictionary update device is being considered that can obtain a dictionary with a word frequency structure that is most suitable for the user.

この装置は例えば特開昭52−132653号公報に記
載されており、使用者が同音異字語から1つの単語を指
定すると同時に、自動的にその単語の頻度情報をカウン
トアツプし、その内容を頻度に従って分類した後、再び
、辞書に格納することによって、辞書内の単語をその使
用者に応じた単語の出現頻度構成を持つようにできてい
る。
This device is described, for example, in Japanese Patent Application Laid-open No. 52-132653, and when a user specifies a word from homophones, it automatically counts up the frequency information of that word and displays the frequency of the content. After the words are classified according to the classification criteria, the words are stored in the dictionary again, so that the words in the dictionary have a frequency structure according to the user.

しかしながら、このような装置においてもなお、使用者
によっては辞書内に登録されている単語だけでは不十分
な場合があり、辞書に使用者が必要とする新規な単語を
登録して、これを使用することが望まれる。この点に鑑
みて、辞書に予め登録されている単語では不十分な場合
、使用者が所望の新語を辞書に登録できる機能を持つ言
語情報処理装置が開発されている。しかし、こうした装
置でも、新語に対して頻度情報が付与される場合、ある
特定の値を定めて登録する方法でしかなかった。従って
、この方法では既存の単語と新規に登録された単語の頻
度情報が有機的に結合された制御ではないので、最適な
処理が行なえない。即ち、使用者が単語を登録したにも
かかわらず既存の単語(同音異字語)を優先を行なって
いたのでは同音異字語の選択に手間をかけることになり
、処理がそれだけ遅くなる欠点となる。
However, even with such a device, depending on the user, the words registered in the dictionary may not be enough, and the user may register new words needed by the user in the dictionary and use them. It is desirable to do so. In view of this point, linguistic information processing devices have been developed that have a function that allows a user to register a desired new word in the dictionary when the words previously registered in the dictionary are insufficient. However, even with these devices, when frequency information is assigned to a new word, the only method available is to determine and register a specific value. Therefore, in this method, optimal processing cannot be performed because the frequency information of existing words and newly registered words is not organically combined. In other words, if the user registers a word but gives priority to the existing word (homophone), it will take time and effort to select the homophone, which has the disadvantage of slowing down the process accordingly. .

[本発明は上記の事情に鑑みなされたもので、単語辞書
に新語を登録した場合に、該新語に係る同音異字語の選
択操作に手間をかけることのない言語情報処理装置を提
供することを目的とする。」以下、図面を参照して本発
明の一実施例を説明する。第1図は本発明を適応した言
語情報処理装置の全体の構成を示すブロック図である。
[The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a linguistic information processing device that does not require effort in selecting homophones for a new word when the new word is registered in a word dictionary. purpose. ” Hereinafter, one embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the overall configuration of a linguistic information processing device to which the present invention is applied.

図において、10は装置全体の制御を司どる中央処理装
置(以下CPUと称す)である。11はこの装置で処理
される言語情報、およびこの装置を制御するための指令
等を入力する入力部(例えばキーボード、タブレット)
表、CPUl0で編集された情報を表示する表示部(例
えばCRTディスプレイ)とを備えた入力表示装置であ
る。12はこの装置によって作成された文書情報を印刷
する印刷装置である、113はこの装置により作成され
る文書情報や、制御情報を記憶しておくための補助記憶
装置である。14はこの装置において参照される単語情
報を記憶しておくための辞書記憶装置である。
In the figure, 10 is a central processing unit (hereinafter referred to as CPU) that controls the entire apparatus. Reference numeral 11 denotes an input unit (e.g. keyboard, tablet) for inputting language information to be processed by this device and instructions for controlling this device.
It is an input display device that includes a table and a display section (for example, a CRT display) that displays information edited by CPU10. 12 is a printing device for printing document information created by this device; 113 is an auxiliary storage device for storing control information and document information created by this device. 14 is a dictionary storage device for storing word information referred to in this device.

上記のように構成された言語情報処理装置の動作を簡単
に説明する。まず、入力表示装置11の入力部から入力
された指令情報および言語情報はCPU10へ転送され
る。CPUl0は上記の情報に基づき辞書記憶装置14
から単語情報を読み出し、その単語情報からパターン情
報を取り出し、入力表示装置i11の表示部に表示する
。こうして作成される文書に対して、更に、編集・校正
を行ない、所望の文書情報を作成して行く。そして、作
成された文書情報は補助記憶装置f13に記憶され、ま
た印刷装置12において印刷される。
The operation of the linguistic information processing device configured as described above will be briefly described. First, command information and language information input from the input section of the input display device 11 are transferred to the CPU 10. CPUl0 uses the dictionary storage device 14 based on the above information.
Word information is read out from the word information, pattern information is extracted from the word information, and displayed on the display section of the input display device i11. The document thus created is further edited and proofread to create desired document information. The created document information is then stored in the auxiliary storage device f13 and printed by the printing device 12.

さて、本発明においては、使用者が入力表示装置】1か
ら新規に登録したい単語(即ち新語)を入力することが
でき、またCPUl0は入力表示装置11において、新
語の単語情報に付与される頻度情報としは既存の単語の
頻度情報と関連させた最適な値が設定できるように構成
されている。
Now, in the present invention, the user can input a new word (that is, a new word) to be registered from the input/display device 1, and the CPU 10 inputs a frequency to be added to the word information of the new word on the input/display device 11. The information is configured so that an optimal value can be set in relation to existing word frequency information.

第2図は上記機能を実現する本発明の詳細な構成を示し
たブロック図である。図において、2oは入力表示装置
側W設けられた新語情報入力回路である。
FIG. 2 is a block diagram showing a detailed configuration of the present invention that implements the above functions. In the figure, 2o is a new word information input circuit provided on the input display device side W.

14は第1図と同じ辞書記憶装置である。この辞書記憶
装置14に記憶されている各種の単語情報は第:3図に
示すように、少なくとも「読み」、「見出し」、「頻度
」、の情報を含んでいる。そして、本発明を実施するた
めに、辞書読出制御回路21、明度情報制御回路22、
頻度情報付与回路23、辞書書込制御回路24が設けら
れている。辞書読出制御回路21は登録される新語の読
み情報に基づき、辞書記憶装置14から同−読みの単語
(即ち同音異字語)全すべて読み出すことができる。頻
度情報制御回路22は辞書読出制御回路21から出力さ
れるすべての単語情報の中から頻度情報の最大値を選び
出す制御を行なう。即ち、この頻度情報制御回路22に
よって最も優先度の高い状態如ある単語の頻度情報が選
出される。頻度情報付与回路23は頻度情報制御回路2
2から出力される頻度情報に定数N(例えばN=1など
の整数)を加算し、新語の頻度情報部に付与する。しか
し辞書記憶装置14内に登録される新語と同じ読みの単
語が存在しない場合には、頻度情報付与回路23におい
て一義的に定められる値が新語の頻度情報部に付与され
る。辞書書込制御回路24け頻度情報付与回路23から
出力される頻度情報を辞書記憶装fli ] 4に書き
込む制御を行なう。
14 is the same dictionary storage device as in FIG. As shown in FIG. 3, the various word information stored in the dictionary storage device 14 includes at least information such as "pronunciation", "heading", and "frequency". In order to implement the present invention, a dictionary reading control circuit 21, a brightness information control circuit 22,
A frequency information adding circuit 23 and a dictionary writing control circuit 24 are provided. The dictionary reading control circuit 21 can read out all words with the same reading (that is, homophone and allographs) from the dictionary storage device 14 based on the registered reading information of the new word. The frequency information control circuit 22 performs control to select the maximum value of frequency information from all the word information output from the dictionary reading control circuit 21. That is, the frequency information control circuit 22 selects the frequency information of a word with the highest priority. The frequency information providing circuit 23 is the frequency information control circuit 2
A constant N (for example, an integer such as N=1) is added to the frequency information output from step 2, and the result is added to the frequency information section of the new word. However, if there is no word with the same pronunciation as the new word registered in the dictionary storage device 14, a value uniquely determined by the frequency information adding circuit 23 is added to the frequency information section of the new word. Dictionary writing control circuit 24 controls writing frequency information outputted from frequency information adding circuit 23 into dictionary storage device fli]4.

次に、上記のように構成された本発明の詳細な説明する
。新語情報入力回路20から登録しようとする新語の読
み情報および見出し情報等が入力される。
Next, the present invention configured as described above will be explained in detail. The pronunciation information, heading information, etc. of the new word to be registered are input from the new word information input circuit 20.

辞書読出制御回路21け入力された読み情報を用いて辞
書記憶装置14から同−読みの単語情報をすべて読み出
し、頻度情報制御回路22へ出力する。頻度情報制御回
路22けすべての単語情報の中から最も優先度の高い状
態にある単語情報の頻度情報を選出し、類IW情報付与
回路23へ出力する。頻度情報付与回路23け入力され
た頻度情報にNを加算し、新語の頻度情報を作成すると
共に、新語情報入力回路20より入力された読み、見出
し情報に作成した頻度情報を付与して新語の単語情報を
作成する。従って、新語の単語情報は既存の同音異字語
よりも更に優先度の高い頻度情報金有することができる
。ただし、辞書記憶装置14内に同音異字語が存在しな
い場合、頻度情報付与回路23にて所望の頻度情報が付
与される。そして、頻度情報付与回路23から出力され
た単語情報が辞書書込制御回路24によって辞書記憶装
置14に書き込捷れ、新語登録が完了する。次に入力表
示装置11の入力部から新規に登録した単語の読みが入
力されると、CPUl0は該読みに対する同音異字語が
存在する場合でも、新規に登録した単語情報を辞書記憶
装置J4から読み出し、パターン情報に変換して入力表
示装置11の表示部へ優先して出力する。
The dictionary reading control circuit 21 uses the input reading information to read out all word information with the same reading from the dictionary storage device 14 and outputs it to the frequency information control circuit 22. The frequency information control circuit 22 selects the frequency information of the word information having the highest priority from all the word information, and outputs it to the class IW information adding circuit 23. The frequency information adding circuit 23 adds N to the input frequency information to create new word frequency information, and adds the created frequency information to the pronunciation and heading information input from the new word information input circuit 20 to create the new word. Create word information. Therefore, the word information of the new word can have higher priority frequency information than the existing homonyms. However, if the homophone and allograph does not exist in the dictionary storage device 14, the frequency information adding circuit 23 adds desired frequency information. Then, the word information output from the frequency information adding circuit 23 is written into the dictionary storage device 14 by the dictionary writing control circuit 24, and the new word registration is completed. Next, when the pronunciation of a newly registered word is input from the input section of the input display device 11, the CPU 10 reads out the newly registered word information from the dictionary storage device J4 even if there is a homonym for the pronunciation. , and converts it into pattern information and outputs it to the display section of the input display device 11 with priority.

従って、本発明によれば、使用者が辞書に登録した新語
が最優先して出力されるため、カナ漢字変換機能を有す
る日本語ワードプロセッサあるいは自動翻訳装置等の言
語情報処理装置に利用すると同音異字語を選択する手間
を少なくでき、実用性大なる効果を発揮する。
Therefore, according to the present invention, new words registered in the dictionary by the user are output with the highest priority, so when used in a linguistic information processing device such as a Japanese word processor or an automatic translation device that has a kana-kanji conversion function, homophones and allographs are output. The effort required to select words can be reduced and the practical effect is great.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明を適応した言語情報処理装置の全体の構
成を示すブロック図、第2図は本発明の詳細な構成を示
すブロック図、第3図は頻度情報のフォーマットを示す
図である。 14・・・・・・辞書記憶装置 20・・・・・・新語情報入力回路 21・・・・・・辞書読出制御回路 22・・・・・・頻度情報制御回路 23・・・・・・頻度情報付与回路 24・・・・・・辞書書込制御回路 (7317)代理人弁理士 則 近 憲 佑(ほか1名
FIG. 1 is a block diagram showing the overall configuration of a linguistic information processing device to which the present invention is applied, FIG. 2 is a block diagram showing the detailed configuration of the present invention, and FIG. 3 is a diagram showing the format of frequency information. . 14... Dictionary storage device 20... New word information input circuit 21... Dictionary read control circuit 22... Frequency information control circuit 23... Frequency information provision circuit 24...Dictionary writing control circuit (7317) Representative patent attorney Noriyuki Chika (and one other person)

Claims (1)

【特許請求の範囲】[Claims] 辞書記憶装置に使用者によって作成された単語情報を登
録する辞書登録機能を有する言語情報処理装置において
、上記辞書記憶装置に登録された上記単語の読みが入力
部から入力された場合、上記単語情報に対応するパター
ン情報を他の同音異字語より優先して表示部に出力する
手段金膜けたことを特徴とする言語情報処理装置。
In a linguistic information processing device having a dictionary registration function that registers word information created by a user in a dictionary storage device, when the pronunciation of the word registered in the dictionary storage device is input from the input unit, the word information 1. A linguistic information processing device comprising a means for outputting pattern information corresponding to a homonym to a display unit with priority over other homophones and allographs.
JP59176593A 1984-08-27 1984-08-27 Language information processing unit Pending JPS60122465A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59176593A JPS60122465A (en) 1984-08-27 1984-08-27 Language information processing unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59176593A JPS60122465A (en) 1984-08-27 1984-08-27 Language information processing unit

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP3335380A Division JPS56129973A (en) 1980-03-18 1980-03-18 Processor for language information

Publications (1)

Publication Number Publication Date
JPS60122465A true JPS60122465A (en) 1985-06-29

Family

ID=16016278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59176593A Pending JPS60122465A (en) 1984-08-27 1984-08-27 Language information processing unit

Country Status (1)

Country Link
JP (1) JPS60122465A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357431A (en) * 1992-01-27 1994-10-18 Fujitsu Limited Character string retrieval system using index and unit for making the index

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5472918A (en) * 1977-11-24 1979-06-11 Toshiba Corp Information selector
JPS5491138A (en) * 1977-12-28 1979-07-19 Canon Inc Character processing unit
JPS554663A (en) * 1978-06-27 1980-01-14 Fujitsu Ltd Character row conversion processor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5472918A (en) * 1977-11-24 1979-06-11 Toshiba Corp Information selector
JPS5491138A (en) * 1977-12-28 1979-07-19 Canon Inc Character processing unit
JPS554663A (en) * 1978-06-27 1980-01-14 Fujitsu Ltd Character row conversion processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357431A (en) * 1992-01-27 1994-10-18 Fujitsu Limited Character string retrieval system using index and unit for making the index

Similar Documents

Publication Publication Date Title
JPS60122465A (en) Language information processing unit
JPS607514A (en) Word processor
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH0594430A (en) Document processor
JPH0380363A (en) Document processor
JPS5943433A (en) Japanese input system
JPS60253572A (en) Blank filling printing system
JP3577741B2 (en) Character input device
JPS60238966A (en) Kana and kanji reverse conversion processing system
JPH0640325B2 (en) Writing device
JPS5932031A (en) Processor of japanese word information
JPS6373363A (en) Electronic dictionary device capable of outputting frequency data of referring to dictionary
JPH096772A (en) Character processor
JPH04133166A (en) Kana/kanji converter
JPS63234350A (en) Sentence processor
JPS6275760A (en) Kana-kanji conversion device
JPS6319061A (en) Method and device for inputting kanji
JPS63121967A (en) Japanese word processor
JPH06259414A (en) Method and device for outputting furikana (japanese pronunciation of chinese character) for word processor
JPH03286251A (en) Character processor
JPS6091434A (en) Document producer
JPH02291059A (en) Japanese language processor
JPS63276166A (en) Document producing device
JPH05158923A (en) Information processor
JPH04133165A (en) Kana/kanji converter