JPH02255944A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH02255944A
JPH02255944A JP1016882A JP1688289A JPH02255944A JP H02255944 A JPH02255944 A JP H02255944A JP 1016882 A JP1016882 A JP 1016882A JP 1688289 A JP1688289 A JP 1688289A JP H02255944 A JPH02255944 A JP H02255944A
Authority
JP
Japan
Prior art keywords
kana
character string
kanji
word
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1016882A
Other languages
English (en)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1016882A priority Critical patent/JPH02255944A/ja
Publication of JPH02255944A publication Critical patent/JPH02255944A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、かな漢字変換装置に関するものであり、さら
に詳細には、かな漢字変換の際に、辞書に未登録の単語
を効率よく登録するためのかな漢字変換装置に関する。
(従来の技術) 計算機による文書処理技術の向上に伴い、日本語ワード
プロセッサをはじめとした文書処理装置が一般的に使用
されるようになってきた0文書処理装置の利用者は、各
種機能を使用することにより、効率よく文書を作成する
ことができる。この種の日本語処理装置で採用されてい
るかな漢字変換とは、所望の漢字かな混じり文字列をそ
の読み情報によって入力した後に、単語辞書検索や文法
検定処理によって漢字かな混じり文字列に変換する処理
のことである。かな漢字変換処理により、字種の多い漢
字かな混じり文字列を、仮名やローマ字の形態でキーボ
ードなどの標準高速文字入力手段から入力するだけで漢
字かな混じり文が得られるから、文書処理装置ではかな
漢字変換処理が広く背反している。
しかしながら、かな漢字変換には、辞書に単語が登録さ
れていないと変換ができないという欠点がある。このた
め利用者は、自らの手で、未登録単語を登録する作業を
行う必要があり、これが利用者にとって大きな負担にな
っていた。
この問題を打開するだめの従来技術として、特開昭63
−25766 r日本語入力装置」が提案されている。
これは、利用者に単語が登録されているか否かを意識せ
ずにかな文字列の入力および単語区切りや同音語選択を
行わせ、得られた漢字かな混じり文字列と入力かな文字
列をもとに未登録m語を判別して、単語辞書に登録する
ものである。例えば、「口重」という単語が登録されて
いないと仮定する。利用者は、はじめに「にちでん」と
入力してかな漢字変換を試みる。しかし、「口重」が未
登録であるため、変換に失敗する。このため利用者は、
入力されなかな文字列を「にち」と「でん」に区切って
からかな漢字変換を行うことによって「日」 「電」 
(漢語の造語成分も単語と見なしている)を得て、結果
的にこれらを結合した「口重」が得られる。これと同時
に、上記「日本語入力装置」は、入力されたがな文字列
「にちでん」が読みであり、かつ最終的に得られた漢字
かな混じり文字列「口重」を表記とする単語を、単語辞
書に登録することができるから、利用者は次回からは、
「口重」を即座に得ることができる。
〈発明が解決しようとする課題) 以上述べたように、従来技術では、入力されなかな文字
列が読みであり得られた漢字かな混じり文字列が表記で
ある未登録単語を自動的に辞書登録することができる。
しかしながら、従来の方式では、利用者がかな文字列を
誤って入力したために誤った漢字かな文字列が表示され
た場合、かな文字列を修正して正しい漢字かな混じり文
字列を得ると、最初に入力した誤ったかな文字列が読み
で、正しい漢字かな混じり文字列を表記とする単語が自
動的に登録されてしまう。
また、従来の方式では、未登録語と判断されたすべての
単語候補をもれなく単語辞書に登録するから、出現頻度
の小さい単語も自動登録され、結果的に辞書容量の増大
を招いてしまう。
(課題を解決するための手段) 本発明は、前述の従来技術にみられた欠点を克服し、入
力かな文字列を修正して得た登録単語候補のうちで、出
現頻度の高いもののみを単語辞書に登録することができ
るかな漢字変換装置を提供する。
本発明によれば、かな文字列を入力する入力手段と、該
かな文字列を一時記憶しておくかな文字列記憶手段と、
少なくとも単語の読みと表記を備えた単語辞書と、かな
文字列をもとに前記単語辞書の参照や同音語選択などの
手段によって漢字かな混じり文字列を育成するかな漢字
変換手段と、該漢字かな混じり文字列を修正する修正手
段と、前記漢字かな混じり文字列を一時記憶しておく漢
字かな混じり文字列記憶手段と、前記漢字かな混じり文
字列を出力する出力手段とを備えたかな漢字変換装置に
おいて、 前記修正手段によって漢字かな混じり文字列が修正され
た場合に、前記かな文字列記憶手段内のかな文字列と前
記漢字かな文字列記憶手段内の漢字かな混じり文字列を
対応づけて単語登録候補として記憶する単語登録候補記
憶手段と、該単語登録候補記憶手段内の前記単語登録候
補各々の出現頻度を計数する出現頻度計数手段と、前記
出現頻度が予め定められたしきい値を上回った前記単語
登録候補を前記単語辞書に登録する単語登録手段とを備
えたことを特徴とするかな漢字変換装置を提供すること
ができる。
(作用) 本発明では、利用者がかな文字列を入力してかな漢字変
換を試み、その後、修正処理によって漢字かな混じり文
字列を修正した場合に、入力かな文字列と修正により得
られた漢字かな混じり文字列を単語登録候補として記憶
しておく、そして、単語登録候補としての出現頻度があ
るしきい値を上回ったときに、該単語登録候補を単語辞
書に登録し、この単語を単語登録候補から削除する。
(実施例) 以下、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である0図
において、1は全体の動作を制御する制御部であり、2
はかな漢字変換に使用するかな文字列の入力、同音語選
択指示や区切り位置の指定、かな文字列の修正などの漢
字かな混じり文字列生成に必要な指示を行う入力手段で
あり、3は入力手段2によって入力されたかな文字列を
一時記憶するためのかな文字列記、憶手段であり、4は
少なくとも単語の読みと表記を備えた単語辞書であり、
5は単語辞書4の参照や文法解析、同音語選択などの手
段によって漢字かな混じり文字列を生成するかな漢字変
換手段であり、6はかな漢字変換手段5によって得られ
た漢字かな混じり文字列を一時記憶する漢字かな文字列
記憶手段であり、7は漢字かな文字列記憶手段6の内容
を出力する出力手段であり、8は少なくともかな文字列
記憶手段3のかな文字列および漢字かな文字列記憶手段
6内の漢字かな混じり文字列を記憶する単語登録候補記
憶手段であり、9は単語登録候補記憶手段8内の候補の
出現頻度を計数する出現頻度計数手段であり、10は出
現頻度計数手段9の計数結果に応じて単語登録候補記憶
手段8の内容を単語辞書4に登録する単語登録手段であ
る。
以下、「8電」という単語辞書4に登録されていない未
登録語を複数回入力することで、これを単語辞書4に自
動登録する手順を例として、本実施例を説明する。なお
、第2図は、第1図実施例の動作の流れを示した流れ図
であり、図中の(201)〜(213)は、以下の説明
の便宜上多処理に付与した識別番号である。また、単語
辞書4への登録は、登録単語候補が3回出現した場合(
しきい値=2を越えた場合)に行われるものとする。
はじめに、利用者は、入力手段2よりかな文字列「にち
でん」を入力する(201)、入力されたかな文字列は
、かな文字列記憶手段3に一時記憶され(202)、そ
の後制御部1の指示により、かな漢字変換手段5に渡さ
れる。かな漢字変換手段5は単語辞書4の参照や文法検
定などの処理によって、かな文字列を漢字かな混じり文
字列に変換する(203)、ここでは「にちでん」を読
みとする単語「8電」が単語辞書4に登録されていない
から、所望の漢字かな混じり文字列は得られない(20
4)、このため利用者は、所望の漢字かな混じり文字列
を得るために、修正処理(前述の、入力かな文字列を部
分毎にかな漢字変換する方法などで実現される)を行う
(205)、このようにして得られた漢字かな文字列が
所望のものである場合、利用者がその旨を制御部1に伝
えると、かな漢字変換処理が終了し、文字列「8電」は
、漢字かな文字列記憶手段6に格納される(206)、
この時、かな漢字変換手段5は、制御部1に対して修正
処理が行われたことを知らせる。なお、かな文字列記憶
手段3内のかな文字列「にちでん」は、上記の変換・修
正処理の最中にも変更されず格納されているものとする
。漢字かな文字列記憶手段6内の「8電」は、制御部1
によって主力手段7に読み出され(207) 、画面表
示や印刷、ワードプロセッサにおける編集処理などに利
用される。さらに制御部1は、(205)で修正作業を
行ったか否かを判断しく208)、修正した場合には、
かな文字列記憶手段3内の「にちでん」と、漢字かな文
字列記憶手段6内の「8電」を対にして、単語登録候補
記憶手段8に記憶する<209>、次に、出現頻度計数
手段9は、制御部1の指示を受けて、単語登録候補記憶
手段8内の単語登録候補「8電」の出現回数を計数しく
210)、予め設定されたしきい値を越えているか否か
を判断する(211)、本説明の例では、この時点で「
8電」の出現回数は1であり、しきい値を越えていない
ので、単語登録は行われない。
ここで、利用者が、再び「8電」を入力したものとする
。すると、前述の(201)〜(211)が再度行われ
る。この時点では、「8電」の出現頻度は2であるため
、単語登録は行われない、さらに、利用者が「8電」を
入力すると、前述の(201)〜(211)が再度行わ
れる。この時点で、「8電」の出現頻度が3となり、し
きい値(=2)を越えるなめ、出現頻度計数手段9は、
「8電」の出現回数がしきい値を越えたことを単語登録
手段10に伝える。単語登録手段10は、単語登録候補
記憶手段8内の登録候補「8電Jを単語辞書4に登録す
る(212>、単語登録が終了した時点で、単語登録候
補記憶手段8内の「8電」は削除される(213)、以
上の手順により、利用者の3回目の入力で、「8電」は
単品辞書4に自動的に登録される。なお、入力手段2、
かな文字列記憶手段3、単語辞書4、かな漢字変換手段
5、漢字かな文字列記憶手段6、出力手段7は、従来の
日本語ワードプロセッサなどにおいて実現されていたも
のであり、また、単語登録手段10は、登録に使用する
文字列が単語登録候補記憶手段8から提供されることを
除けば従来の日本語ワードグロセッサなどにおいて実現
されている。
また、単語登録候補記憶手段8は、第3図(a)のよう
に、与えられた登録候補をすべて記憶する方法や、第3
図(b)のように、その出現回数値と対応づけて記憶す
る方法などで実現され、いずれの場合でも出現頻度計数
手段9も容易に実現可能である。
(発明の効果) 本発明を用いることにより、利用者が最初に入力したか
な文字列から、入力かな文字列の修正や区切り指定など
の修正操作で所望の漢字かな混じり文字列を得た場合に
、入力した単語候補が自動的に登録されるから、以降、
利用者が所望の単語を効率よく得ることができる。また
、本発明の装置では、出現頻度の計数を行うから、よく
使用さ!しるもののみを登録することが出来る。
第1図
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図実施例における処理の流れの例を示す流れ図、第
3図(a)、(b)は単語登録候補記憶手段8の具体例
を説明するための概念図である。 1・・・制御部、2・・・入力手段、3・・・がな文字
列記憶手段、4・・・単語辞書、5・・・がな漢字変換
手段、6・・・漢字かな文字列記憶手段、7・・・出力
手段、8・・・単語登録候補記憶手段、9・・・出現頻
度計数手段、10・・・単語登録手段。 代理人  弁理士  本庄 仲介 第2図 第3図 (a) (b)

Claims (1)

  1. 【特許請求の範囲】 かな文字列を入力する入力手段と、該かな文字列を一時
    記憶しておくかな文字列記憶手段と、少なくとも単語の
    読みと表記を備えた単語辞書と、かな文字列をもとに前
    期単語辞書の参照や同音語選択などの手段によって漢字
    かな混じり文字列を生成するかな漢字変換手段と、該漢
    字かな混じり文字列を修正する修正手段と、前記漢字か
    な混じり文字列を一時記憶しておく漢字かな混じり文字
    列記憶手段と、前記漢字かな混じり文字列を出力する出
    力手段とを備えたかな漢字変換装置において、 前記修正手段によって漢字かな混じり文字列が修正され
    た場合に、前記かな文字列記憶手段内のかな文字列と前
    期漢字かな文字列記憶手段内の漢字かな混じり文字列を
    対応づけて単語登録候補として記憶する単語登録候補記
    憶手段と、該単語登録候補記憶手段内の前記単語登録候
    補各々の出現頻度を計数する出現頻度計数手段と、前記
    出現頻度が予め定められたしきい値を上回った前記単語
    登録候補を前記単語辞書に登録する単語登録手段とを備
    えたことを特徴とするかな漢字変換装置。
JP1016882A 1989-01-26 1989-01-26 かな漢字変換装置 Pending JPH02255944A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1016882A JPH02255944A (ja) 1989-01-26 1989-01-26 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1016882A JPH02255944A (ja) 1989-01-26 1989-01-26 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH02255944A true JPH02255944A (ja) 1990-10-16

Family

ID=11928545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1016882A Pending JPH02255944A (ja) 1989-01-26 1989-01-26 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH02255944A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253261A (ja) * 1991-01-29 1992-09-09 Sanyo Electric Co Ltd かな漢字変換装置
JP2007328533A (ja) * 2006-06-07 2007-12-20 Toshiba Corp データ処理装置およびデータ処理プログラム
WO2009016729A1 (ja) * 2007-07-31 2009-02-05 Fujitsu Limited 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253261A (ja) * 1991-01-29 1992-09-09 Sanyo Electric Co Ltd かな漢字変換装置
JP2007328533A (ja) * 2006-06-07 2007-12-20 Toshiba Corp データ処理装置およびデータ処理プログラム
WO2009016729A1 (ja) * 2007-07-31 2009-02-05 Fujitsu Limited 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法
JP5141687B2 (ja) * 2007-07-31 2013-02-13 富士通株式会社 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法

Similar Documents

Publication Publication Date Title
JPH02255944A (ja) かな漢字変換装置
JPS63311471A (ja) かな漢字変換装置
JPH01259448A (ja) 漢字入力方式
JPH02255943A (ja) かな漢字変換装置
JP3036005B2 (ja) かな漢字変換装置
JPH0291762A (ja) かな漢字変換装置
JPH05128099A (ja) ワードプロセツサ
JP2710442B2 (ja) 姓名フリガナ―漢字変換方式
JPH02122367A (ja) かな漢字変換装置
JPH047620A (ja) ワードプロセッサ
JPH064523A (ja) 辞書登録方式およびかな漢字変換方式
JPH05143577A (ja) カナ漢字変換装置
JPH05108615A (ja) 非優先学習日本語入力システム
JPH0683809A (ja) 文書処理装置
JPH09218868A (ja) 漢字指定方法及び装置
JPS6128160A (ja) 同音語の学習機能を持つかな漢字変換装置
JPH1021232A (ja) 文書作成装置及び外部辞書検索方法
JPH04357550A (ja) 文字列登録/学習方式
JPH0329054A (ja) かな漢字変換装置
JPH04253261A (ja) かな漢字変換装置
JPH06131337A (ja) 文字入力装置
JPH01128157A (ja) 日本語文書作成装置
JPH02224064A (ja) 翻訳方法及び翻訳装置
JP2000057131A (ja) 文字列変換装置およびそのプログラム記録媒体
JPH04133165A (ja) かな漢字変換装置