JPS6255189B2 - - Google Patents

Info

Publication number
JPS6255189B2
JPS6255189B2 JP54031885A JP3188579A JPS6255189B2 JP S6255189 B2 JPS6255189 B2 JP S6255189B2 JP 54031885 A JP54031885 A JP 54031885A JP 3188579 A JP3188579 A JP 3188579A JP S6255189 B2 JPS6255189 B2 JP S6255189B2
Authority
JP
Japan
Prior art keywords
information
word
frequency
frequency information
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54031885A
Other languages
English (en)
Other versions
JPS55124862A (en
Inventor
Koji Kodama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP3188579A priority Critical patent/JPS55124862A/ja
Publication of JPS55124862A publication Critical patent/JPS55124862A/ja
Publication of JPS6255189B2 publication Critical patent/JPS6255189B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 この発明は言語情報処理装置に係り、特に辞書
情報をその使用頻度に応じて自動的に更新する頻
度制御装置に関する。
従来、言語処理を行なう場合、参照すべき辞書
として多数の単語を記憶する装置を設け、このよ
うな辞書の単語を引くことによつて各種処理を行
なつてきた。ところで単語の中には同音異義語等
があつて一義的に決定できない場合が多いことは
よく知られている。このため単語の使用頻度等を
調査し、この結果を用いて予め辞書の単語に出現
頻度をつけておき、例えば出現頻度の大きい順に
単語を参照できるように構成された装置が考えら
れている。このような装置では、単語の重要度の
目安となる頻度情報は固定されている。一方この
種の装置の使用者によつては単語の使用頻度は著
しく異なり、使用者が特によく使用する単語であ
つても、一般的な出現頻度が低ければ、常に同音
異義の候補として下位の位置におかれ、辞書参照
時間を多く費してしまうことになる。
このような欠点を補うものとして、使用者に最
も適した単語の出現頻度構成をもつた辞書を得る
ことができる辞書自動更新装置が考えられた。こ
の装置は例えば特開昭52―132653号公報に記載さ
れており、辞書の単語の頻度情報を、使用者が同
音異義語から1つの単語を指定すると同時に、自
動的にその単語の頻度情報をカウントアツプし、
その内容を頻度に従つて分類した後、再び辞書に
格納することによつて、辞書内の単語をその使用
者に応じた単語の出現頻度構成をもつようにする
ものである。
しかしながら、このような装置では通常、頻度
情報を格納するエリアが有限なため、長期間使用
を重ねて行くうちに、このエリア(例えばカウン
タ等)がオーバーフローしてしまうことが起こ
る。通常カウンタではオーバーフローした時点で
そのカウント内容が0に戻つてしまい、その単語
の頻度情報は最下位に落ちてしまうことになる。
このような事態をさけるためにカウンタのカウン
ト内容が最大値に達した時点で、それ以後このカ
ウンタのカウントアツプを止めてしまう方法も考
えられるが、その場合でも他の単語の使用頻度は
次第に上つていき、それぞれのカウント内容も次
第に最大値に達し飽和してしまうことになる。
この発明は上記のような事情を考慮してなされ
たものであり、その目的とするところは、恒久的
に頻度情報を有効に維持することができる頻度制
御装置を提供することにある。
以下図面を参照して、この発明をカナ漢字変換
処理システムに実施した場合の実施例を説明す
る。第1図はこの発明に係る頻度制御装置の一実
施例の構成を示すブロツク図である。図において
1は辞書記憶装置、2は辞書読出回路、3は編集
回路、4は頻度情報検出・圧接制御回路、5は単
語並び換え回路、6は辞書書込回路、7は入力部
である。上記入力部7は日本語情報をカナで鍵盤
入力する。そして上記入力読み情報が漢字である
場合に辞書読出回路2が駆動され、この辞書読出
回路2は与えられた読みを持つ単語を上記辞書記
憶装置1から読み出し編集回路3を供給する。
辞書記憶装置1は漢字あるいは熟語を1単語と
して記憶しており、これらの単語は例えば磁気デ
イスク上にコードで記述され、その読みで分類さ
れている。そして第2図に単語のフオーマツトの
一例を示す。図において“読み”部分は単語の読
みを表わし、“見出し”部分は“読み”部分の読
みをもつ単語を表わしている。また頻度部分はこ
の単語が使用された回数を示す情報を有してい
る。第3図aは“こうか”という読みをもつ単語
を示していて、右欄の数字は対応する左欄の単語
が現在までに使用された回数すなわち頻度情報を
表わしている。
第4図は上記編集回路3を詳細に示すブロツク
図である。上記辞書読出回路2より供給される単
語情報は一時記憶回路11にいつたん記憶され、
表示部12はこの記憶情報に基ずいて単語情報を
表示するようになつている。この後オペレータが
単語選択回路13を操作することにより上記表示
されている単語のうち特定の単語を選択すると、
制御部14は上記一時記憶回路11に予め記憶さ
れた単語情報のうちから1つの単語を取り出し
て、この情報を外部回路に出力するようになつて
いる。さらに制御部14は上記外部回路に出力し
た単語情報のうちの頻度情報を更新するようにな
つている。すなわち、ここでは以前の頻度情報レ
ベルに+1加算が行なわれ、この更新された頻度
情報が再び一時記憶回路11に記憶されるように
なつている。そして単語情報選択後、上記一時記
憶回路11に記憶されている単語情報は頻度情報
検出・圧縮制御回路4に供給される。
上記頻度情報検出・圧縮制御回路4は、上記編
集回路3の一時記憶回路11から供給される単語
情報の頻度情報レベルを検出し、そのレベルが前
記辞書記憶装置1の頻度情報を記憶するエントリ
の最大記憶可能レベル例えば255を越える場合
に、単語情報の各頻度情報を一様に1/2に圧縮す
るようになつている。
単語並び換え回路5は上記頻度情報検出・圧縮
制御回路4から供給される単語情報をその頻度情
報に従う頻度順に並び換えるものであり、その並
び換えられた単語情報は辞書書込回路6によつ
て、前記辞書記憶装置1のその読みに対応するエ
ントリに記憶されるようになつている。
次に上記のように構成された装置の動作を説明
する。いま第1図において、“こうか”という読
み情報が辞書読出回路2に供給されたものとす
る。一方辞書記憶装置1が前記第3図aに示すよ
うな“こうか”という読みを持つ9種の単語を記
憶しているならば、それぞれの単語の見出しおよ
びその頻度情報が編集回路3に供給される。この
編集回路3では上記9種の単語の見出しに応じた
単語が表示部12で表示される。そこでオペレー
タは単語選択回路13を操作して正しい特定の単
語例えば“工科”を選択すれば、制御部14は一
時記憶回路11からこの単語情報“工科”を取り
出してこの情報を外部回路に出力する。これによ
りカナ漢字変換処理は終了する。一方制御部14
はこの単語情報の頻度情報レベルに+1加算を行
なう。すなわち、工科の頻度情報レベル20に1を
加算して再び一時記憶回路11に記憶させる。こ
の後頻度情報検出・圧縮制御回路4は上記一時記
憶回路11に記憶された単語情報の各頻度情報レ
ベルを検出する。この場合いずれの単語の頻度情
報レベルも255を越えることはないので、ここで
は単語情報は何の制御を受けずに単語並び換え回
路5に供給される。上記単語並び換え回路5は、
上記編集回路3で特定の単語の頻度情報が更新さ
れたので、単語情報を改めて頻度順に並び換え
る。なお第3図bは並び換えられた単語情報を示
している。そしてこの後上記単語情報は辞書書込
回路6によつて、前記辞書記憶装置1の読み“こ
うか”に対応したエントリに記憶される。
このような動作が繰り返し行なわれることによ
つて、使用者ここではオペレータが良く使用する
単語はいつも多数候補の先頭に位置し、検索が極
めて容易となる。
次に順次検索を繰り返すことにより、“こう
か”という読みを持つ9種の単語が第5図aに示
すような状態になつている場合について説明す
る。すなわち、このときは辞書記憶装置11にお
いて単語の“効果”に対応した頻度情報レベルが
その最大記憶可能レベル255となつているもので
ある。そしていま前記と同様に、“こうか”とい
う読み状報が辞書読出回路2に供給されたものと
する。そこで次にオペレータは単語選択回路13
を操作して今度は“効果”という単語を選択す
る。これにより制御部14は一時記憶回路11か
らこの単語情報“効果”を取り出して外部回路に
出力する。さらに制御部14はこの単語情報の頻
度情報レベル255に+1加算を行なう。この結
果、単語“効果”の頻度情報レベルは255を越え
た256となる。この後頻度情報検出・圧縮制御回
路4は上記単語“効果”の頻度情報レベルが255
を越えたことを検出する。これにより頻度情報検
出・圧縮制御回路4は編集回路3から供給される
単語情報の各頻度情報を1/2に圧縮する。この圧
縮制御は頻度情報検出・圧縮制御回路4で自動的
に行なつても良いし、オペレータの介入により制
御の形をとつても良い。またこの圧縮制御の方法
としては、2進カウンタを用いるならばそのカウ
ント情報を1ビツトシフトするだけで良く、端数
は切拾てとする。第5図bは圧縮制御後の状態を
示すものである。このように圧縮制御前と後でも
各単語情報の頻度順は変化することなく、しかも
圧縮制御後の各単語情報の頻度情報相互間のレベ
ル比率は圧縮制御前とほぼ等しくなる。
この後単語並び換え回路5は編集回路3で特定
の単語の頻度情報が更新されたので、単語情報を
改めて頻度順して並び換えるが、その頻度順は以
前と変わらないので、第5図bに示す単語情報が
辞書書込回路6によつて、前記辞書記憶装置1の
読み“こうか”に対応したエントリに記憶され
る。
このようにして単語の頻度情報は恒久的にしか
も有効に維持することができる。
第6図はこの発明の他の実施例の構成を示すブ
ロツク図である。図において21は辞書記憶装
置、22は辞書読出回路、23は編集回路、24
は頻度情報検出・圧縮制御回路、25は単語並び
換え回路、26は辞書書欠回路、27は入力部、
28は頻度計数回路である。辞書読出回路22に
よつて辞書記憶装置21から読み出された単語情
報は、単語並び換え回路25によつてその出現頻
度順に並び換えられて編集回路23に供給され
る。そして編集回路23において表示された単語
情報のうち正しいものがオペレータによつて選択
されると、頻度計数回路28はその選択された単
語情報の頻度情報エリアの数のみをカウントアツ
プすることにより頻度情報を更新する。さらに頻
度情報検出・圧縮制御回路24は、上記頻度計数
回路28のカウント数が辞書記憶回路装置21の
頻度情報を記憶するエントリの最大記憶可能レベ
ル例えば255を越えていない場合には、単語情報
をそのまま辞書書込回路26に供給する。この後
辞書書込回路26はその頻度情報が更新された単
語情報を再び辞書記憶装置21の読みに従う正し
いエントリに書き込む。一方頻度計数回路28に
おいてカウントアツプ後、そのカウント数が255
を越えている場合には、頻度情報検出・圧縮制御
回路は頻度計数回路28の各頻度情報エリアのカ
ウント数をそれぞれ1/2に圧縮して辞書書込回路
26に供給する。その後辞書書込回路26は頻度
情報が更新された単語情報を辞書記憶装置21の
正しい読みに対応したエントリに記憶される。
このように上記実施例では、辞書記憶装置21
において単語の配列位置が変わらず、その頻度情
報のみが変化すると共に、単語の頻度情報は恒久
的にしかも有効に維持することができる。
なお、この発明は上記した実施例に限定される
ものではなく、例えば上記実施例では頻度情報検
出・圧縮制御回路はその検出頻度情報レベルが辞
書記憶装置の頻度情報を記憶するエントリの最大
記憶可能レベルを越えた場合に、各頻度情報を圧
縮するものと説明したが、これは最大記憶可能レ
ベルに達する場合に圧縮するようにしても良い。
またこの圧縮方法としては各頻度情報を一様に1/
2にする場合について説明したがこれに限定され
るものではない。
さらに上記実施例ではこの発明をカナ漢字変換
処理システムに実施した場合について説明した
が、各アイテムの間で一義的に決定ができず、頻
度によつてその順位を定めている場合などに、オ
ペレータとの対話によつてそのアイテムの頻度を
カウントアツプすることにより使用者向けのシス
テムとするようなシステムにおいても適用するこ
とができる。
以上説明したようにこの発明によれば、更新さ
れた頻度情報レベルが規定レベルに達する点ある
いは規定レベルを越えた点を検出することによ
り、上記更新された頻度情報を含む各頻度情報を
圧縮するようにしたことにより、頻度情報を恒久
的にしかも有効に維持することができる頻度制御
装置を提供することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の構成を示すブロ
ツク図、第2図は辞書のフオーマツトの一例を示
す図、第3図a,bは辞書内容の一例を示す図、
第4図は第1図における編集回路を詳細に示すブ
ロツク図、第5図a,bは上記実施例を説明する
ための辞書内容の一例を示す図、第6図はこの発
明の他の実施例の構成を示すブロツク図である。 1,21…辞書記憶装置、2,22…辞書読出
回路、3,23…編集回路、4,24…頻度情報
検出・圧縮制御回路、5,25…単語並び換え回
路、6,26…辞書書込回路、7,27…入力
部、28…頻度計数回路、11…一時記憶回路、
12…表示部、13…単語選択回路、14…制御
部。

Claims (1)

  1. 【特許請求の範囲】 1 複数の単語の読み情報および該単語の頻度情
    報を記憶する辞書記憶装置と、入力読み情報に対
    応する少くとも1つの単語を前記辞書記憶装置か
    ら読み出す手段と、この手段から読み出された単
    語から特定の単語を選択する手段と、この手段に
    よつて選択された単語の頻度情報を更新する手段
    と、この手段で更新される頻度情報レベルが規定
    レベルに達する点あるいは規定レベルを越えた点
    を検出することにより、上記更新される頻度情報
    を含む前記読出手段から読み出された単語の頻度
    情報を圧縮する手段と、この手段を通過し前記読
    出手段によつて読み出された単語情報をその頻度
    情報に従う頻度順に並び換える手段と、この手段
    によつて並び換えられた前記単語を前記辞書記憶
    装置に書き込む手段とを具備したことを特徴とす
    る頻度制御装置。 2 複数の単語の読み情報および該単語の頻度情
    報を記憶する辞書記憶装置と、入力読み情報に対
    応する少くとも1つの単語を前記辞書記憶装置か
    ら読み出す手段と、この手段によつて読み出され
    た単語をその頻度情報に従う頻度順に並び換える
    手段と、この手段によつて頻度順に並べられた単
    語から特定の単語を選択する手段と、この手段に
    よつて選択された単語の頻度情報を更新する手段
    と、この手段で更新される頻度情報レベルが規定
    レベルに達する点あるいは規定レベルを越えた点
    を検出することにより、上記更新される頻度情報
    を含む前記読出手段から読み出された単語の頻度
    情報を圧縮する手段と、この手段を通過し頻度情
    報を更新あるいは圧縮された単語情報を前記辞書
    記憶装置に書き込む手段とを具備したことを特徴
    とする頻度制御装置。
JP3188579A 1979-03-19 1979-03-19 Frequency control unit Granted JPS55124862A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3188579A JPS55124862A (en) 1979-03-19 1979-03-19 Frequency control unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3188579A JPS55124862A (en) 1979-03-19 1979-03-19 Frequency control unit

Publications (2)

Publication Number Publication Date
JPS55124862A JPS55124862A (en) 1980-09-26
JPS6255189B2 true JPS6255189B2 (ja) 1987-11-18

Family

ID=12343482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3188579A Granted JPS55124862A (en) 1979-03-19 1979-03-19 Frequency control unit

Country Status (1)

Country Link
JP (1) JPS55124862A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776964B2 (ja) * 1982-11-26 1995-08-16 株式会社日立製作所 日本文入力方法
JPS59205668A (ja) * 1983-04-15 1984-11-21 Casio Comput Co Ltd 電子式売上デ−タ処理装置
JPS61109148A (ja) * 1984-11-01 1986-05-27 Agency Of Ind Science & Technol プロダクシヨン・ル−ルの競合解消方式
JPH0750486B2 (ja) * 1986-08-20 1995-05-31 松下電器産業株式会社 キ−ワ−ド抽出装置
JP3622668B2 (ja) * 1995-09-04 2005-02-23 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法

Also Published As

Publication number Publication date
JPS55124862A (en) 1980-09-26

Similar Documents

Publication Publication Date Title
US5357431A (en) Character string retrieval system using index and unit for making the index
US5713033A (en) Electronic equipment displaying translated characters matching partial character input with subsequent erasure of non-matching translations
JPS6255189B2 (ja)
JPH0125098B2 (ja)
US5404517A (en) Apparatus for assigning order for sequential display of randomly stored titles by comparing each of the titles and generating value indicating order based on the comparison
EP0539965A2 (en) An electronic dictionary including a pointer file and a word information correction file
JPH0612548B2 (ja) 文書処理装置
JP3260439B2 (ja) ファイル名一覧表示方式
JP3273607B2 (ja) 文書処理装置
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH0797371B2 (ja) 文字データ記憶装置
JPS6336551B2 (ja)
JPS6361345A (ja) 外部記憶装置の制御装置
JPS5853768B2 (ja) 漢字辞書を有する文書作成装置
JPS63253431A (ja) インバ−テツド構造のデ−タベ−ス検索方式
JPS6214857B2 (ja)
JPS5852719A (ja) 文字デ−タ入力方法
JPH052596A (ja) 顧客情報管理装置
JP2000137734A (ja) 郵便番号検索装置とその検索方法
JPS59160338U (ja) 文字入力装置
JPH0578057B2 (ja)
JP2001022745A (ja) 仮名漢字変換装置
JPS60252949A (ja) 情報検索方法
JPH04242473A (ja) 漢字変換装置
JPH0581262A (ja) かな漢字変換装置