JPH02255943A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH02255943A
JPH02255943A JP1014764A JP1476489A JPH02255943A JP H02255943 A JPH02255943 A JP H02255943A JP 1014764 A JP1014764 A JP 1014764A JP 1476489 A JP1476489 A JP 1476489A JP H02255943 A JPH02255943 A JP H02255943A
Authority
JP
Japan
Prior art keywords
kana
character string
kanji
word
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1014764A
Other languages
English (en)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1014764A priority Critical patent/JPH02255943A/ja
Publication of JPH02255943A publication Critical patent/JPH02255943A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、かな漢字変換装置に関するものであり、さら
に詳細には、かな漢字変換の際に、辞書に登録されてい
ない単語の登録効率の改善を図ったかな漢字変換装置に
関する。
(従来の技術) 計算機による文書処理技術の向上に伴い、日本語ワード
プロセッサをはじめとした文書処理装置が一般的に使用
されるようになってきた。文書処理装置の利用者は、各
種機能を使用することにより、効率よく文書を作成する
ことができる。この種の日本語処理装置で採用されてい
る、かな漢字変換とは、所望の漢字かな混じり文字列を
その読み情報によって入力した後に、単語辞書検索や文
法検定処理によって漢字かな混じり文字列に変換する処
理のことである。かな漢字変換処理により、字種の多い
漢字かな混じり文字列を、仮名やローマ字の形態でキー
ボードなどの標準高速文字入力手段から入力するだけで
漢字かな混じり文が得られるから、文書処理装置ではか
な漢字変換処理が広く普及している。
しかしながら、かな漢字変換には、辞書に単語が登録さ
れていないと変換ができないという欠点がある。このた
め利用者は、自らの手で、未登録単語を登録する作業を
行う必要があり、これが利用者にとって大きな負担にな
っていた。
この問題を打開するための従来技術として、特開昭63
−25766 r日本語入力装置」が提案されている。
これは、利用者に単語が登録されているか否かを意識せ
ずにかな文字列の入力および単語区切りや同音語選択を
行わせ、得られた漢字かな混じり文字列と入力かな文字
列をもとに未登録単語を判別して、単語辞書に登録する
ものである。例えば、「日常」という単語が登録されて
いないと仮定する。利用者は、はじめに「にちでん」と
入力してかな漢字変換を試みる。しかし、「日常」が未
登録であるため、変換に失敗する。このため利用者は、
入力されたかな文字列を「にち」と「でん」に区切って
からかな漢字変換を行うことによって「日」 「電」 
(漢語の造語成分も単語と見なしている)を得て、結果
的にこれらを結合した「日常」が得られる。これと同時
に、上記「日本語人力装置」は、入力されたかな文字列
「にちでん」が読みであり、かつ最終的に得られた漢字
かな混じり文字列「日常」を表記とする単語を、単語辞
書に登録することができるから、利用者は次回からは、
「日常」を即座に得ることができる。
(発明が解決しようとする課題) 以上述べたように、従来技術では、入力されたかな文字
列が読みであり得られた漢字かな混じり文字列が表記で
ある未登録単語を自動的に辞書登録することができる。
しかしながら、従来の方式では、利用者がかな文字列を
誤って入力したために誤った漢字かな文字列が表示され
た場合、かな文字列を修正して正しい漢字かな混じり文
字列を得ると、最初に入力した誤ったかな文字列が読み
で、正しい漢字かな混じり文字列を表記とする単語が自
動的に登録されて°しまう。
また、従来の方式では、未登録語と判断されたすべての
単語候補をもれなく単語辞書に登録するから、出現頻度
の小さい単語も自動登録され、結果的に辞書容量の増大
を招いてしまう。
このように、不正な単語や出現頻度の小さい単語の単語
辞書への登録を防ぐための方策の一つとして、主記憶上
などに仮辞書を設け、これらの単語を仮辞書に登録する
ことが考えられる。しかしながら、仮辞書上の単語は、
入力編集処理終了後装置のに電源を切った時点で消滅し
てしまう。
(課題を解決するための手段) 本発明は、前述の従来技術にみられた欠点を克服し、入
力かな文字列を修正して得た登録単語候補のうちで、出
現頻度の高いもののみを単語辞書に登録することができ
るかな漢字変換装置を提供する。
本発明によれば、かな文字列を入力する入力手段と、該
かな文字列を一時記憶しておくかな文字列記憶手段と、
少なくとも単語の読みと表記を備えた単語辞書と、かな
文字列をもとに前記単語辞書の参照や同音語選択などの
手段によって漢字かな混じり文字列を生成するかな漢字
変換手段と、該漢字かな混じり文字列を修正する修正手
段と、前記漢字かな混じり文字列を一時記憶しておく漢
字かな混じり文字列記憶手段と、前記漢字かな混じり文
字列を出力する出力手段とを備えたかな漢字変換装置に
おいて、 前記修正手段によって漢字かな混じり文字列が修正され
た場合に、前記かな文字列記憶手段内のかな文字列と前
記漢字かな文字列記憶手段内の漢字かな混じり文字列を
対応づけて単語登録候補として記憶する単語登録候補記
憶手段と、前記単語登録候補が前記かな漢字変換手段か
ら参照された参照頻度を記憶する参照頻度記憶手段と、
前記単語登録候補が参照された場合に前記参照頻度を計
数し設定する参照頻度設定手段と、前記参照頻度が予め
定められたしきい値を上回った前記単語登録候補を前記
単語辞書に登録する単語登録手段とを備えたことを特徴
とするかな漢字変換装置を提供することができる。
(作用) 本発明では、利用者がかな文字列を人力してかな漢字変
換を試み、その後、修正処理によって漢字かな混じり文
字列を修正した場合に、入力かな文字列と修正により得
られた漢字かな混じり文字列を単語登録候補として記憶
しておく。この単語候補は、かな漢字変換時に参照され
るから、利用者側は次回の入力時からは修正処理を行わ
ずに、所望の漢字かな混じり文字列を得ることが出来る
また、この時参照された単語候補の参照頻度が計数・設
定される。そして設定された参照頻度が別途定めたしき
い値を上回ったときに、該単語登録候補を単語辞書に登
録し、この単語を単語登録候補から削除する。
(実施例) 以下、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。図
において、1は全体の動作を制御する制御部であり、2
はかな漢字変換に使用するかな文字列の入力、同音語選
択指示や区切り位置の指定、かな文字列の修正などの漢
字かな混じり文字列生成に必要な指示を行う入力手段で
あり、3は入力手段2によって入力されたかな文字列を
一時記憶するためのかな文字列記憶手段であり、4は少
なくとも単語の読みと表記を備えた単語辞書であり、5
は単語辞書4の参照や文法解析、同音語選択などの手段
によって漢字かな混じり文字列を生成するかな漢字変換
手段であり、6はかな漢字変換手段5によって得られた
漢字かな混じり文字列を一時記憶する漢字かな文字列記
憶手段であり、7は漢字かな文字列記憶手段6の内容を
出力する出力手段であり、8は少なくともかな文字列記
憶手段3のかな文字列および漢字かな文字列記憶手段6
内の漢字かな混じり文字列を記憶する単語登録候補記憶
手段であり、9は単語登録候補記憶手段8内の候補の出
現頻度をを計数し設定する参照頻度設定手段であり、1
0は参照頻度設定手段9の設定結果を記憶する参照頻度
記憶手段であり、11は参照頻度記憶手段10の内容に
応じて単語登録候補を単語辞書4に登録する単語登録手
段である。
以下、「日電」という単語辞書4に登録されていない未
登録語を複数回入力することで、これを単語辞書4に自
動登録する手順を例として、本実施例を説明する。なお
、第2図(a)、  (b)は、本発明の動作の流れを
示した流れ図であり、図中の(201)〜(214)は
、以下の説明の便宜上凸処理に付与した識別番号である
。また、単語辞書4への登録は、登録単語候補が3回出
現した場合(しきい値−2を越えた場合)に行われるも
のとする。また、第3図は、参照頻度記憶手段10の一
具体例を表わした概念図であり、単語登録候補の読み、
表記およびその出現頻度が対になって記憶されている。
はじめに、利用者は、入力手段2よりかな文字列「にち
でん」を入力する(201)。入力されたかな文字列は
、かな文字列記憶手段3に一時記憶され(202)、そ
の後制御部1の指示により、かな漢字変換手段5に渡さ
れる。かな漢字変換手段5は単語辞書4および単語登録
候補記憶手段8の参照や文法検定などの処理によって、
かな文字列を漢字かな混じり文字列に変換する(203
)。
ここでは、「にちでん」を読みとする単語「日電」が単
語辞書4と単語登録候補記憶手段8のいずれにも登録さ
れていないから、所望の漢字かな混じり文字列は得られ
ない(204)。このため利用者は、所望の漢字かな混
じり文字列を得るために、修正処理(前述の、入力かな
文字列を部分毎にかな漢字変換する方法などで実現され
る)を行う(205)。このようにして得られた漢字か
な文字列が所望のものである場合、利用者がその旨を制
御部1に伝えると、かな漢字変換処理が終了し、文字列
「8電」は、漢字かな文字列記憶手段6に格納される(
206)。この時、かな漢字変換手段5は、制御部1に
対して修正処理が行われたことを知らせる。なお、かな
文字列記憶手段3内のかな文字列「にちでんJは、上記
の変換・修正処理の最中にも変更されず格納されている
ものとする。漢字かな文字列記憶手段6内の「8電」は
、制御部1によって出力手段7に読み出され(207)
、画面表示や印刷、ワードプロセッサにおける編集処理
などに利用される。さらに制御部1は、(205)で修
正作業を行ったか否かを判断しく20g)、修正した場
合には、かな文字列記憶手段3内の「にちでん」と、漢
字かな文字列記憶手段6内の「8電」を対にして、単語
登録候補記憶手段8に記憶しく209)、参照頻度設定
手段9は、単語登録候補「8電」の出現頻度を1として
参照頻度記憶手段10に設定する(211)。
この時、単語登録手段11は、参照頻度記憶手段10内
の「8電」の出現頻度が、予め設定されたしきい値を越
えているか否かを判断する(212)。本説明の例では
、この時点で「8電」の出現頻度は1であり、しきい値
を越えていないので、単語登録は行われず、一連の流れ
が終了する。
次に、利用者が、再び「8電」を入力するために、入力
手段2より「にちでん」を入力したものとする。すると
、前述の場合と同様に、かな文字列がかな文字列記憶手
段3に格納された後でかな漢字変換処理が行われる((
201)〜C203))。今回は、「にちでん」に対応
する「8電」は単語辞書4には存在しないが単語登録候
補記憶手段8に登録されているので、修正処理なしに所
望の「8電」が得られ、漢字かな文字列記憶手段6への
登録と出力手段7の出力が行われる( (204)〜(
207))。また、修正処理は行われず(208)、単
語登録候補記憶手段8が参照されたので(210)、参
照頻度設定手段9は参照頻度記憶手段10内の「8電」
の出現頻度を1加算し、再設定する(211)。この時
点では、「8電」の出現頻度は2であるため、単語登録
は行われない。
さらに、利用者が「8電」を入力すると、前述の(20
1)〜(20g)および(210’)〜(211)が実
行される。この時点で、「8電」の出現頻度が3となる
。単語登録手段11は参照頻度記憶手段10内の「8電
」の出現頻度を調べ(212)、t、きい値(−2)を
越えるから、単語登録候補記憶手段8内の登録候補「8
電」を単語辞書4に登録する(213)。さらに単語登
録が終了した時点で、単語登録候補記憶手段8内の「8
電」は削除される(214)。以上の手順により、利用
者の3回目の入力で、「8電」は単語辞書4に登録され
る。
(発明の効果) 本発明を用いることにより、利用者が最初に入力したか
な文字列から、入力かな文字列の修正や区切り指定など
の修正操作で所望の漢字かな混じり文字列を得た場合に
、入力した単語候補が自動的に登録されるから、以降、
利用者が所望の単語を効率よく得ることができる。また
、本発明の装置では、出現頻度の計数を行うから、よく
使用される正しい単語のみを登録することが出来る。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図(
a)、(b)は第1図実施例における処理の流れの例を
示す流れ図、第3図は単語登録候補記憶手段8の具体例
を説明するための概念図である。 1・・・制御部、2・・・入力手段、3・・・かな文字
列記憶手段、4・・・単語辞書、5・・・かな漢字変換
手段、6・・・漢字かな文字列記憶手段、7・・・出力
手段、8・・・単語登録候補記憶手段、9・・・参照頻
度設定手段、10・・・参照頻度記憶手段、11・・・
単語登録手段。 第1図 第2図 (b) 第2図 (a) 第3図

Claims (2)

    【特許請求の範囲】
  1. (1)かな文字列を入力する入力手段と、該かな文字列
    を一時記憶しておくかな文字列記憶手段と、少なくとも
    単語の読みと表記を備えた単語辞書と、かな文字列をも
    とに前記単語辞書の参照や同音語選択などの手段によっ
    て漢字かな混じり文字列を生成するかな漢字変換手段と
    、該漢字かな混じり文字列を修正する修正手段と、前記
    漢字かな混じり文字列を一時記憶しておく漢字かな混じ
    り文字列記憶手段と、前記漢字かな混じり文字列を出力
    する出力手段とを備えたかな漢字変換装置において、 前記修正手段によって漢字かな混じり文字列が修正され
    た場合に、前記かな文字列記憶手段内のかな文字列と前
    記漢字かな文字列記憶手段内の漢字かな混じり文字列を
    対応づけて単語登録候補として記憶する単語登録候補記
    憶手段と、前記単語登録候補が前記かな漢字変換手段か
    ら参照された参照頻度を記憶する参照頻度記憶手段と、
    前記単語登録候補が参照された場合に前記参照頻度を計
    数し設定する参照頻度設定手段と、前記参照頻度が予め
    定められたしきい値を上回った前記単語登録候補を前記
    単語辞書に登録する単語登録手段とを備えたことを特徴
    とするかな漢字変換装置。
  2. (2)前記かな漢字変換手段は、かな漢字変換の際に前
    記単語辞書と前記単語登録候補記憶手段の両者を参照す
    ることを特徴とする請求項1記載のかな漢字変換装置。
JP1014764A 1989-01-24 1989-01-24 かな漢字変換装置 Pending JPH02255943A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1014764A JPH02255943A (ja) 1989-01-24 1989-01-24 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1014764A JPH02255943A (ja) 1989-01-24 1989-01-24 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH02255943A true JPH02255943A (ja) 1990-10-16

Family

ID=11870146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1014764A Pending JPH02255943A (ja) 1989-01-24 1989-01-24 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH02255943A (ja)

Similar Documents

Publication Publication Date Title
JPH02255943A (ja) かな漢字変換装置
JPH02255944A (ja) かな漢字変換装置
JP2624484B2 (ja) 中国語の入力処理方法
JP2833650B2 (ja) 文書処理装置
JP3036005B2 (ja) かな漢字変換装置
JPH0291762A (ja) かな漢字変換装置
JPH0329054A (ja) かな漢字変換装置
JPS6128160A (ja) 同音語の学習機能を持つかな漢字変換装置
JPH02122367A (ja) かな漢字変換装置
JPH05108615A (ja) 非優先学習日本語入力システム
JPH05143577A (ja) カナ漢字変換装置
JPH0388061A (ja) 日本語入力装置
JPH01303514A (ja) キー入力装置
JPH07146858A (ja) 情報処理システム
JPH05257582A (ja) 入力制御方式
JPH02224064A (ja) 翻訳方法及び翻訳装置
JPH02297248A (ja) 文書作成支援装置
JPH01220062A (ja) ワードプロセッサ
JPS6091434A (ja) 文書作成装置
JPH0394367A (ja) 日本語入力方式
JPH04177565A (ja) かな漢字変換方法およびその装置
JPH01128157A (ja) 日本語文書作成装置
JPH01111267A (ja) 文字変換装置
JPH04357550A (ja) 文字列登録/学習方式
JPS6339075A (ja) 質問応答システムの日本語入力処理方式