JPS619755A - かな漢字変換方式 - Google Patents

かな漢字変換方式

Info

Publication number
JPS619755A
JPS619755A JP59130473A JP13047384A JPS619755A JP S619755 A JPS619755 A JP S619755A JP 59130473 A JP59130473 A JP 59130473A JP 13047384 A JP13047384 A JP 13047384A JP S619755 A JPS619755 A JP S619755A
Authority
JP
Japan
Prior art keywords
information
kanji
kana
priority
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59130473A
Other languages
English (en)
Inventor
Masanori Morita
森田 正典
Yoshiro Fujioka
芳郎 藤岡
Akio Kuwabara
桑原 昭夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP59130473A priority Critical patent/JPS619755A/ja
Publication of JPS619755A publication Critical patent/JPS619755A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はかな漢字変換方式、特に変換用辞書に同音異義
語が含まれている場合のかな漢字変換方式に関する。
〔従来の技術〕
日本語向きのワードプロセッサは、キーボードあるいは
音声入力装置から語句の読み方を示す情報、すなわちか
な情報を入力し、かな情報のうちの漢字で表記できる部
分を漢字に変換して、変換結果を示す漢字情報7発生す
るかな漢字変換方式を採用したものが多い。かな情報を
漢字情報に変換するときに参照する辞書は通常、−通り
の読み方に対応する漢字表記が複数秒類ある同音異義語
を含んでいる。同音異義語の中から所望の表記を選択す
るには、同音異義語を全て表示装置に表示させて入力オ
ペレータに所望の表記を選択させる第一の方法と、同音
異義語におのおの優先順位を付与しておきその順位に従
って各表記を順次に表示させて入力オペレータに所望の
表記を選択させる第二の方法とがおる。
特定の部門るるいは個人は、同音異義語中の特定の表記
を頻用する傾向が強い。従って過去の使用頻度が最高の
表記あるいは最終使用の表記に最高の優先順位を与え、
使用頻度あるいは使用履歴に従って各表記に優先順位を
付与して、上記の第二の選択方法を適用すれば、入力時
の同音異義語の選択に要する時間が短縮できる。
第3図は従来のかな漢字変換方式を説明するためのブロ
ック図である。入力部1はキーボードおるいは音声入力
装置を具備した入力手段でおり、かな情報を発生して制
御部2へ送る。制御部2は、入力部1から送られてぐる
かな情報を受信し、語句の最初の一文字分のかな情報に
対応するアドレス信号を発生して、これをアドレスバス
Aを介して記憶部3へ送る。記憶部3は書込み読出し両
用メモIJ(RAM)を具備しており、そのRAMには
使用開始時に外部記憶装置例えば70ツピーデイスク(
図示省略)内の変換用辞書の情報が転写し書込まれてい
る。記憶部3は、制御部2から送られてくるアドレス信
号に応答して、RAM中のアドレス信号が示す場所に格
納されている見出し語情報を読出して、これをデータバ
スDを通して制御部2へ送る。RAM中の見出し語情報
は予め定めた順序、例えば辞書式に五十音jllfiで
格納されてお9%制御部2はアドレス信号が示す番地を
順次変えて上記の記憶部3へのアクセスを行い、例えば
最長−散性によりかな情報と一致する見出し語情報を検
索する。かな情報と一致する見出し語情報が検索できた
ときには、制御部2は該見出し語情報に対応する漢字表
記を示す漢字コードを記憶部3のRIM内の辞書から読
出す。このとき。
同音異義語が有る場合には、そのうちから優先順位が最
高の表記を示す漢字コードを読出す。このあと、制御部
2は読出した漢字コードを含んだ所定のフォーマットの
文字情報を作成して送出する。
この文字情報が表示装置へ送られて漢字表記で表示され
ると、入力オペレータは表示された表記が所望のもので
あるか否かを判断して、所望の表記であれば変換完了を
示す操作を行い、また所望の表記でなければ再選択を示
す操作を行う。この操作に応じて、入力部1から制御部
2へ、変換完了あるいは再選択を示す情報が送られる。
制御部2は、変換完了情報を受信したときには、同音異
義語中のいずれが選択されたかに応じて記憶部3のRA
MK書込まれている表記の優先順位を書替え、また再選
択情報を受信したときには、前回送出した表記の次に優
先順位が高い表記を示す漢字コードをRAMから読出し
て文字情報を作成し送出する。
このような構成により、記憶部30RAMに同音異義語
の各表記の使用状況を書込んで、特定の部門あるいは個
人の表記使用状況を学習させ、所望の表記の的中率を高
め入力操作の能率を上げることができる。
〔発明が解決しようとする問題点〕
しかしながら、従来のこの種のかな漢字変換方式では、
記憶部3のFLAMには、同音異義語の各表記の優先順
位のほかに見出し語、漢字コードなどを示す大量の情報
が格納されているので、記憶部3のRAMの容量が大き
くなり、記憶部3が大形化して、これを用いたワードプ
ロセッサが大形化し且つ高価格化するという欠点がある
本発明の目的は、上記の欠点を除去し小形で且つ低価格
のワードプロセッサに好適なかな漢字変換方式を提供す
ることにある。
〔問題点を解決するための手段〕 本発明の方式は、漢字表記の読+を示す見出し語情報か
ら成る第一の情報群と各前記見出し語情報に対応する前
記漢字表記を示す漢字コード情報から成る第二の情報群
とを含む辞書情報を予め格納した読出し専用メモIJ(
ROM)を有する第一の記憶手段と、 複数の前記漢字表記をもつ前記見出し語情報のおのおの
に対応して複数の該漢字表記使用の優先順位を示す優先
度情報を格納するための書込み読出し両用メモリ (R
AM)を有する第二の記憶手段と、 漢字語句の読みを示すかな情報を受信しこれに応答して
、該かな情報と整合する前記見出し語情報を前記R,O
M内から検索し、該検索の結果に対応する前記漢字表記
が複数あるときには前記RAM内の該検索結果に対応す
る前記優先度情報が示す優先順位で該漢字表記を前記R
OMから読出す読出し制御手段とを備えている。
〔実施例〕
次に図面を参照して本発明について説明する。
第1図は本発明の一実施例を示すブロック図である。記
憶部5は変換用辞書の情@を格納した読出し専用メモリ
(ROM)を具備しており、記憶部6は辞書中の同音異
義語の各表記の優先順位を示す情報を格納するための書
込み読出し両用メモリ(RAM)を具備してiる。制御
部4は、入力部1から送られてくるかな情報を受信する
と、記憶部5のFtNM中の辞書を検索し、検索結果の
見出し語が同音異義語を有する場合には、その見出し語
の各表記の優先順位を示す情報を記憶部6のRAMから
読出して最高の優先順位をもつ表記を検索し、この検索
結果により最高優先順位の表記を示す漢字コードを記憶
部5のIt、OMから読出す。
このあと、制御部4は読出した漢字コードを包んだ所定
のフォーマットの文字情報を作成して送出する。
第2図(a)および(b)はそれぞれ、記憶部5のRO
Mおよび記憶部6のRAMの格納情報内容を例示するデ
ータ構成図である。記憶部5のROMのA番地の場所に
は、同図(a)に示tごとく、見出し語情報DA、同音
異義語の個数を示す情報(同図(a)では3個ある場合
を例示しているので、3個であることを示す情報r3J
 )、同音異義語の各表示の優先順位を示す情報が格納
されている記憶部6のRAMの番地を示す情報rdAJ
、 ならびに各表示を示す漢字コードC1,C2および
C3が格納されている。これに対応して、記憶部6のR
AMのdA 番地の場所には、同図(b)に示すごとく
漢字コードC1,C,およびC3の優先順位、例えば使
用頻度を示す情報F’1.F2およびF3が格納されて
いる。
ROM中の辞書の検索結果が見出し語情報へであった場
合、制御部4岐個数悄@「3」および番地情報dA を
ROMから読出して、同音異義語が3個あると判定し、
記憶部6のRAMのdAA番地ら使用頻度情報F□、F
2およびF3を読出して使用頻度の大小を互いに比較し
、瞳大頻度のものを選択する。例えば、使用頻度情報F
□1i12およびF′3のうちで情報F□が耐大頻度を
示しておれば、制御部4は記憶部50ROMから漢字コ
ードC工を読出し、これを含んだ文字情報を発生して送
出する。
このめと、入力オペレータが見出し語情報DAの表記の
再選択操作を行なったときには、制御部4は入力部1か
ら再選択情報を受信する度に、前回送出した表記の次に
優先度が高い表記を示す漢字コードを記憶部5のROM
から読出して文字情報を作成し送出する。このとき、3
種の漢字コードC□、C2およびC3が全て選択済みで
あれば、辞書の範囲内で漢字への変換が不可能であるこ
とを示す変換不能情報を発圧し、これを文字情報として
送出し、入力オペレータに変換が不可能なことを表示し
知らせる。
また入力オペレータが変換終了操作を行なったときには
、制御部4は入力部1から変換終了情報を受信して、変
換使用された表記の使用頻度情報、例えば漢字コードC
1が使用された場合には使用頻度情報F□を一つ増やし
た値に書替える。
本実施例では、同音異義語の各表記の優先順位を使用頻
度順に設定する場合を例示したが、各表記の優先順位を
最終使用語優先で設定する他の実施例を、次に説明する
この場合には、第2図(b)において、使用頻度情報F
1.F2およびF3の代りに、漢字コードC1゜C2お
よびC3の使用履歴を最終使用語優先の順位で示す使用
履歴情報を書込む。例えば、漢字コードC1,C2およ
びC3をそれぞれ示す2ビツトのコードroIJ、rl
OJおよび「11」に対応させておき、またコード「0
0」で該当する漢字コードが無いことを示す。RAMの
dA番地には、おのおの2ビツトのコードを3個書込め
るよう、6ビツト長の書込みスペースを設定しておく。
初期設定時には、dA番地の3個のコードをすべてコー
ド「oOJとの込む。そのちと漢字コードC1,C2お
よびC3の使用された履歴をdA 番地に書込んでいく
が、最初の2ビツトには最終使用語(第1順位語)を、
次の2ビツトには最終使用語μ外でその直前に使用した
語(第2順位語)を、また最後の2ビツトには第1およ
び第2順位語以外でその直前に使用した語(第3順位語
)をそれぞれ示す2ビツトのコードが書込まれる。すな
わち、ROMでの検索結果が見出し語情報り、fあれば
、制御部4はまずRIMのdA番地から最初の2ビツト
のコードを読出し、このコードが示す漢字コードをR,
OMから読出して、これを含む文字情報を送出する。(
このときの2ビツトのコードが「OO」であれば、RO
M内の配列順に従ってまず漢字コードC1を読出す。)
このあと、制御部4は再選択情報を受信する毎に、前回
送出した表記の次に順位が高い表記を示す漢字コードを
ROMから読出して文字情報を作成し送出する。
変換終了情報を受信したとき、制御部4は変換終了時に
使用された漢字コードを示す2とットコードと、R,A
MのdA 番地の第1順位語を示す2ビツトコードとを
比較して、下記のようにRAMのdA番地の書込み内容
の書替えを行う。但し、両者が一致しているときには、
書替えを行わない。
両者が一致しない場合には、まず第2順位以下の各2ビ
ツトコードがいずれも使用語を示す2ビツトコードと一
致しなければ、第1および第2順位語をおのおの1位ず
つ下げて第2および第3順位語の場所に移し、第1順位
梧の場所には使用語を示す2ビツトコードを書込む。ま
た第2順位μ下の各2ビツトコードのうちの一つが使用
語を示す2ビツトコードと一致しておれば、この一致し
た2ビツトコードの順位を超える語の順位は寂の象の1
位ずつ丁げた場所に移しく従って使用語と一致した2ビ
ツトコードは、既に督込まれている内容から一旦削除さ
れる)、第1順位語の場所には使用語を示す2ビツトコ
ードを書込む。このような書替え処理を行えば、r4A
fviのdA 番地にコードl”OOJ以外の2ビツト
コード(f−重複さぜず、同晋IA義語の使用履歴f:
書込むこと〃;できる。
以上では、同音異義語が3個ある場合の例を説明したが
、一般に同行異義語がN個(Nは2以上の整数)ある場
合、値数Nを2進数表示したどきのピット長をbNとす
れば、その同音異義語の使用履歴を嘗込むために要する
[(、A Mのスペースは、(bNxN)ビットだけ設
定すれば良い。従って、)LAMに同音穴義語の使用頻
度を書込む場合に比べて、R,A RJの所要容量を大
幅に減少できる。
上記の実施例で、同音異義語の各表示の優先順位を、使
用頻度順に設定する場合と、最終使用語優先で設定する
場合との二つの場合を例示したが、この両者を併用する
ように変更するのは容易であり、いずれの場合も同音異
義語の使用状況を学習させて表記の的中率を向上できる
このように、従来一括してRAMに格納していた大量の
情報のうち、特に量が多い辞書情報の部分を記憶部5の
ROMに格納し、比較的量が少い優先順位情報の部分だ
けを記憶部6のFIMに格納するようにして、回路集積
度が高く且つ低価格のROMと1回路集積度が低く且つ
高価格のRAMとを使い分けることにより、記憶部5お
よび6を従来の記憶部3よりも小形化し且つ低価格化で
きる。
〔発明の効果〕
以上の説明から明らかなように、本発明には漢字表記を
検索するための情報群を格納する記憶部を小形化且つ低
価格化することにより小形で低価格のワードプロセッサ
に好適なかな漢字変換方式を実現できるという効果があ
る。
【図面の簡単な説明】
第3図は従来のかな漢字変換方式を示すブロック図、第
1図は本発明の一実施例を示すブロック図、第2図(a
)および(b)は本発明の一実施例を示すデータ構成図
である。 1・・・・・・入力部、2,4・・・・・・制御部、3
,5,6・・・・・・記憶部。 亨 3 盟 ギ l 又 (a) (dA駿)■耳口 (b) 第 2TgJ

Claims (2)

    【特許請求の範囲】
  1. (1)漢字表記の読みを示す見出し語情報から成る第一
    の情報群と各前記見出し語情報に対応する前記漢字表記
    を示す漢字コード情報から成る第二の情報群とを含む辞
    書情報を予め格納した読出し専用メモリ(ROM)を有
    する第一の記憶手段と、 複数の前記漢字表記をもつ前記見出し語情報のおのおの
    に対応して複数の該漢字表記使用の優先順位を示す優先
    度情報を格納するための書込み読出し両用メモリ(RA
    M)を有する第二の記憶手段と、 漢字語句の読みを示すかな情報を受信しこれに応答して
    、該かな情報と整合する前記見出し語情報を前記ROM
    内から検索し、該検索の結果に対応する前記漢字表記が
    複数あるときには前記RAM内の該検索結果に対応する
    前記優先度情報が示す優先順位で該漢字表記を前記RO
    Mから読出す読出し制御手段とを備えたことを特徴とす
    るかな漢字変換方式。
  2. (2)前記読出し制御手段は、前記第二の記憶手段の前
    記RAMに対して、複数の前記漢字表記の使用順の履歴
    を示す情報を前記優先度情報として書込み且つ読出すこ
    とを特徴とする特許請求の範囲第(1)項記載のかな漢
    字変換方式。
JP59130473A 1984-06-25 1984-06-25 かな漢字変換方式 Pending JPS619755A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59130473A JPS619755A (ja) 1984-06-25 1984-06-25 かな漢字変換方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59130473A JPS619755A (ja) 1984-06-25 1984-06-25 かな漢字変換方式

Publications (1)

Publication Number Publication Date
JPS619755A true JPS619755A (ja) 1986-01-17

Family

ID=15035083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59130473A Pending JPS619755A (ja) 1984-06-25 1984-06-25 かな漢字変換方式

Country Status (1)

Country Link
JP (1) JPS619755A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62293468A (ja) * 1986-06-12 1987-12-21 Nec Corp 日本語入力装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5945536A (ja) * 1982-09-08 1984-03-14 Toshiba Corp 日本語処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5945536A (ja) * 1982-09-08 1984-03-14 Toshiba Corp 日本語処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62293468A (ja) * 1986-06-12 1987-12-21 Nec Corp 日本語入力装置

Similar Documents

Publication Publication Date Title
JPH07114568A (ja) データ検索装置
JP3071570B2 (ja) 複合のターゲット語に関する辞書データを決定するための装置及び方法
JPS619755A (ja) かな漢字変換方式
JPH0612548B2 (ja) 文書処理装置
JPH0452500B2 (ja)
JPS5814688B2 (ja) 同音異義語順次表示を行なう漢字まじり文入力装置
JP3272536B2 (ja) 仮名漢字変換方法
JP2634926B2 (ja) かな漢字変換装置
JPS58168180A (ja) 情報検索装置
JPH0215903B2 (ja)
JPS60570A (ja) 情報検索方法および装置
JPH03118661A (ja) 単語検索装置
JPH0236988B2 (ja)
JPH0352102B2 (ja)
JP3526074B2 (ja) 文字処理装置
JPH03137768A (ja) 文書処理装置
JPS6029823A (ja) 適応型記号列変換方式
JPH03192464A (ja) 文書作成装置
JPH0531192B2 (ja)
JPS6278673A (ja) 仮名漢字変換装置
JPH03176759A (ja) 文字処理装置及びその方法
JPH0556553B2 (ja)
JPH03138755A (ja) 文書作成方法
JPS62189569A (ja) 漢字かな変換装置
JPS62251962A (ja) ワ−ドプロセツサ