JPH1125083A - かな漢字変換装置及びコンピュータ読取可能な記憶媒体 - Google Patents

かな漢字変換装置及びコンピュータ読取可能な記憶媒体

Info

Publication number
JPH1125083A
JPH1125083A JP9180910A JP18091097A JPH1125083A JP H1125083 A JPH1125083 A JP H1125083A JP 9180910 A JP9180910 A JP 9180910A JP 18091097 A JP18091097 A JP 18091097A JP H1125083 A JPH1125083 A JP H1125083A
Authority
JP
Japan
Prior art keywords
kana
frequency information
sample document
kanji conversion
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9180910A
Other languages
English (en)
Inventor
Miyoshi Ando
美佳 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9180910A priority Critical patent/JPH1125083A/ja
Publication of JPH1125083A publication Critical patent/JPH1125083A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 サンプル文書を解析して得た頻度情報を反映
・記憶・選択できるようにすることにより、効率よくか
な漢字変換処理を行うことができるかな漢字変換装置及
びそれを動作させるプログラムを格納したコンピュータ
読取可能な記憶媒体を提供する。 【解決手段】 入力されたサンプル文書(かな漢字混じ
り文)を形態素解析し(S52)、単語の使用頻度を測
定する(S54)。測定された使用頻度を学習領域28
にある頻度情報に反映させるか否かが判断され(S5
6)、反映させる指示であった場合には(S56:
Y)、学習領域28にある頻度情報と演算がなされる
(S58)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語ワードプロ
セッサ等のかな漢字変換装置及びコンピュータ読取可能
な記憶媒体に関するものである。
【0002】
【従来の技術】従来、かな漢字変換装置は、基本辞書中
に読みに対する表記を多数記憶し、独自の単語使用頻度
情報(読みに対する単語の使用頻度)を持っている。そ
して、ユーザーの利用によって、さらにユーザー独自の
単語使用頻度が学習され、ユーザーが読み文字列を入力
して漢字変換する際には、頻度の高い単語表記を候補と
して表示することによって、効率のよいかな漢字変換処
理ができるようになっている。
【0003】例えば、「とる」という読み文字列は、基
本辞書により「取る」という単語表記(候補文字列)が
初回で変換され、表示される。しかし、ユーザーがカメ
ラについての文章を入力していく場合、「とる」という
読み文字列に対して「撮る」という単語表記が多用さ
れ、「撮る」の使用頻度があがっていく。そうして「撮
る」が初回で変換されるようになる。
【0004】
【発明が解決しようとする課題】しかしながら、内部的
に頻度学習するようなかな漢字変換装置だと、ある程度
文章をうった段階でないとその頻度情報を用いられな
い。そのうえ、いったん別の分野の文章をうちこむと、
単語の頻度情報は全く違うものになってしまい、文章を
うつたびに単語の頻度情報が変わるという問題点があっ
た。
【0005】例えば、カメラについての文章をうつ場
合、「うつす」という読み文字列を「写す」という単語
表記に変換したいのに、基本辞書頻度情報により「移
す」という単語表記が初回で変換されることがある。
【0006】また、いったんカメラについての文章をう
ちこんでいくと単語の頻度情報は書き換えられ「写す」
が初回で変換されるようになるが、次に医学についての
文章を大量にうちこんでいった場合、一度学習した頻度
情報は書き換えられ、再びカメラについての文章を書こ
うとした際には新たに学習しなおすという煩わしさがあ
った。
【0007】本発明は、上述した問題点を解決するため
になされたものであり、サンプル文書を解析して得た頻
度情報を反映・記憶・選択できるようにすることによ
り、効率よくかな漢字変換処理を行うことができるかな
漢字変換装置及びそれを動作させるプログラムを格納し
たコンピュータ読取可能な記憶媒体を提供することを目
的としている。
【0008】
【課題を解決するための手段】この目的を達成するため
に、請求項1記載のかな漢字変換装置は、かな読み文字
列を入力するための入力手段と、読み文字列及び候補文
字列等を表示する表示手段と、読みとその読みに対する
単語表記とその単語表記の使用頻度とを記憶する基本辞
書と、前記基本辞書に基づいてかな漢字変換を行うかな
漢字変換手段とを備えたかな漢字変換装置において、か
な漢字混じり文のサンプル文書を入力・解析し、解析さ
れた単語の頻度情報を記憶するサンプル文書解析手段
と、前記サンプル文書解析手段によって記憶された頻度
情報と前記基本辞書の頻度情報とのいずれか一方を選択
する選択手段とを備えている。
【0009】従って、請求項1に記載のかな漢字変換装
置においては、サンプル文書解析手段によりサンプル文
書の単語が解析され、選択手段により解析された頻度情
報か基本辞書に記憶されている頻度情報のいずれか一方
が選択されてかな漢字変換が行われる。
【0010】また、請求項2に記載のかな漢字変換装置
は、請求項1の構成を備え、さらに、前記サンプル文書
解析手段が、サンプル文書ごとに測定した頻度情報を複
数記憶するように構成され、前記選択手段は、前記サン
プル文書解析手段で記憶された頻度情報から一つ選択す
るように構成されている。
【0011】従って、請求項2記載のかな漢字変換装置
においては、サンプル文書解析手段が複数の頻度情報を
持ち、選択手段により作成する文書に応じて適当な頻度
情報を選択されうる。
【0012】さらに、請求項3に記載のコンピュータ読
取可能な記憶媒体は、読みと、その読みに対する単語表
記と、その単語表記の使用頻度とを記憶する基本辞書を
使用してかな漢字変換を行うかな漢字変換装置を動作さ
せるためのプログラムを格納したコンピュータ読取可能
な記憶媒体であって、かな漢字混じり文のサンプル文書
を入力・解析し、解析された単語の使用頻度を記憶する
サンプル文書解析プログラムと、前記サンプル文書解析
プログラムによって記憶された頻度情報と前記基本辞書
の頻度情報とのいずれか一方を選択する選択プログラム
とを備えている。
【0013】従って、請求項3に記載のコンピュータ読
取可能な記憶媒体によれば、サンプル文書解析プログラ
ムによりサンプル文書の単語が解析され、選択プログラ
ムにより前記の解析された頻度情報か基本辞書に記憶さ
れている頻度情報のいずれかが選択される。
【0014】さらに、請求項4に記載のコンピュータ読
取可能な記憶媒体は、請求項3の構成を備え、さらに、
前記サンプル文書解析プログラムが、サンプル文書ごと
に解析した頻度情報を複数記憶するように設定され、前
記選択プログラムは、前記サンプル文書解析プログラム
で記憶された頻度情報から一つ選択するように設定され
ている。
【0015】従って、請求項4に記載のコンピュータ読
取可能な記憶媒体によれば、サンプル文書解析プログラ
ムにより複数の頻度情報が記憶されることになり、選択
プログラムにより作成する文書に応じて適当な頻度情報
を選択できる。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0017】図1は、本発明を具体化したかな漢字変換
装置の構成を示すブロック図である。装置全体を制御す
るための中央処理装置(以下CPUと称す)12には、
入力装置10、出力装置60、RAM20,及びROM
40が接続されている。
【0018】入力装置10はかな漢字変換をするかな文
字列を入力するためのキーボード等であり、かな文字列
を入力するための文字キーやかな漢字変換処理を指示す
る変換キーや変換文字列を確定する実行キー、カーソル
移動のための上下左右キーなどを有している。
【0019】出力装置60はかな漢字変換結果の文字列
等を出力するCRTやプリンタ等である。
【0020】RAM20はCPU12に接続され、入力
されたかな読み文字列を記憶するための読み入力バッフ
ァ領域22と、変換後のかな漢字文字列を記憶するため
の出力バッファ領域24と、サンプル文書から得た単語
の頻度情報を記憶するための記憶領域26と、後述の基
本辞書52にある頻度情報がいったん転送され、ユーザ
ーの単語使用状況に応じて使用頻度が加算されていく学
習領域28と、ポインタ情報やフラグ情報等を記憶する
ワークエリア30とから構成されている。
【0021】ROM40は、装置全体を制御するための
プログラムを記憶したプログラム部42とかな漢字変換
の際に使用する辞書部50とからなる。
【0022】プログラム部42は、かな漢字変換プログ
ラム44とサンプル文書解析プログラム46と選択プロ
グラム48とを記憶している。かな漢字変換プログラム
44は一連のかな漢字変換処理を行うためのプログラム
を記憶しており、サンプル文書解析プログラム46はか
な漢字混じり文のサンプル文書を入力・解析し、解析し
た単語の使用頻度を記憶するプログラムを記憶してい
る。また、選択プログラム48は、サンプル文書解析プ
ログラム46によって記憶された頻度情報と基本辞書の
頻度情報とのいずれか一方を選択するプログラムを記憶
している。
【0023】辞書部50は基本辞書52と接続テーブル
54とから構成されており、そのうち接続テーブル54
は、単語同士の接続関係を品詞情報により規定するデー
タとして記憶されている。また、基本辞書52は、読み
と、その読みに対する単語表記と、その単語表記の使用
頻度とを記憶している。
【0024】本発明の請求項1の入力手段は入力装置1
0に相当し、表示手段は出力装置60に、かな漢字変換
手段はかな漢字変換プログラム44に、サンプル文書解
析手段はサンプル文書解析プログラム46および記憶領
域26・学習領域28に、選択手段は選択プログラム4
8およびカーソルキー・実行キーに、それぞれ相当して
いる。
【0025】次に、このように構成されたかな漢字変換
装置の動作を図2のフローチャートを参照して説明す
る。
【0026】まず、入力装置10からのキー入力を受け
取り(ステップ10、以下S10とする)、サンプル文
書を解析する場合は(S12:Y)、サンプル文書解析
処理が行われ(S14)、サンプル文書を解析しない場
合は(S12:N)、頻度情報を選択するか否かを判断
する(S16)。選択の指示であった場合には(S1
6:Y)、選択処理が行われる(S18)。キー入力
が、サンプル文書解析の指示もなく(S12:N)、頻
度情報を選択する指示もない(S16:N)場合には、
基本辞書をもとに読み文字列であるか否か判定が行われ
る(S20)。
【0027】そして、その入力が読み文字列であった場
合には(S20:Y)、そのかな文字コードがRAM2
0内の読み入力バッファ領域22に記憶される(S2
2)。また、入力が読み文字列でない場合は(S20:
N)、変換を指示する変換キーであるか否かが判断され
(S24)、変換キーでもない場合には(S24;
N)、その他の処理が行われる(S26)。
【0028】そして、キー入力が変換キーの場合(S2
4:Y)、かな漢字変換が行われ、ROM40内のかな
漢字変換プログラム44により基本辞書52と接続テー
ブル54に基づいて、読み入力バッファ領域22に記憶
されているかな文字コードがかな漢字混じり文に変換さ
れる(S28)。
【0029】その変換結果はそのまま出力バッファ領域
24に格納され、出力装置60に表示される。この際、
ステップS16の選択により、そのときの前記基本辞書
の頻度情報がそのまま使用されてかな漢字変換される
か、選択処理S18で選択された頻度情報と基本辞書5
2の頻度情報とで演算がなされた頻度情報が使用されて
かな漢字変換が行われるのである。かな漢字変換は頻度
情報を使用して、読み文字列に対応して使用頻度が高い
単語表記(候補文字列)を表示するものであるので、S
16の選択により分野の異なる文章を作成する場合でも
効率の良い(次候補表示させる回数の少ない)かな漢字
変換が可能である。
【0030】その後、ユーザーからのキー入力による指
示を受け取り(S32)、入力キーが確定の指示であっ
た場合は(S34:Y)、確定処理が行われ(S3
6)、かな漢字変換処理を終了する。また、キー入力が
確定の指示でない場合には(S34:N)、次候補変換
を指示するキーであるかどうかの判定が行われ(S3
8)、次候補変換の指示であった場合には(S38:
Y)、次候補変換処理が行われる(S39)。キー入力
が、確定の指示ではなく(S34:N)、次候補変換の
指示でもない(S38:N)場合には、文節カーソルの
移動等のその他の処理が行われる(S40)。
【0031】ここで、サンプル文書解析プログラム46
によって実現されるサンプル文書解析処理(S14)の
詳細を図3のフローチャートに基づいて説明する。
【0032】サンプル文書解析処理(S14)では、ま
ずサンプル文書を入力する(S50)。そして、入力さ
れたサンプル文書(かな漢字混じり文)を形態素解析し
(S52)、単語の使用頻度を測定する(S54)。次
に、測定された使用頻度を学習領域28にある頻度情報
に反映させるか否かが判断され(S56)、反映させる
指示であった場合には(S56:Y)、学習領域28に
ある頻度情報と演算がなされる(S58)。演算方法は
様々であり、例えば、ユーザーがサンプル文書の頻度情
報を選択した時点で、選んだ頻度情報をN倍(例えば1
0倍)にして学習領域にある頻度情報に加算する。つま
り、サンプル文書中の各単語の頻度情報をN倍(Nは2
以上の自然数であって10以上が好ましい)して学習領
域の頻度情報に加算するので、学習領域に記憶されてい
る各単語の頻度情報がサンプル文書の頻度情報を反映し
たものに変更される。この場合は、サンプル文書にない
単語については、それまでの学習した頻度がそのまま残
ることとなる。
【0033】一方、反映させない指示であった場合には
(S56:N)、サンプル文書を解析して得た頻度情報
を保存させるために、そのサンプル文書のキーワードを
入力し(S60)、記憶領域26に記憶させる(S6
2)。
【0034】次に、サンプル文書解析処理(S14)に
よって記憶させた複数の頻度情報を、選択プログラム4
8をもとに選択する選択処理(S18)の詳細を図4の
フローチャートに基づいて説明する。
【0035】選択処理(S18)では、まず頻度情報を
選択するキーワードの一覧を表示させる(S70)。そ
して、その一覧からキーワードを選択し(S72)、そ
のキーワードが持つ頻度情報を、学習領域28にある頻
度情報に前述したように反映させる(S74)。
【0036】このように、本実施例のかな漢字変換装置
及び記憶媒体によれば、ユーザーがサンプル文書から得
た頻度情報を用いることができ、さらに、作成する文書
に応じて単語の頻度情報を選択することができるので、
文書を作成する際には最初から容易な変換を実現でき
る。
【0037】なお、本発明は前述した実施形態にのみ限
定されるものではなく、種々の変形が可能である。例え
ば、サンプル文書解析手段としてはサンプル文書のファ
イルを外部から入力する方法として、作成済みの文書フ
ァイルをフロッピーディスク等から読み込む実施形態だ
けでなく、有線もしくは無線により外部の情報処理装置
から読み込み入力する実施形態とすることも可能であ
る。選択手段としては、キーワードを一覧表示する実施
形態だけでなく、キーワードを直接入力する実施形態も
採用可能である。このキーワードとしては、サンプル文
書を識別可能なものであれば何でも良いが技術分野を示
すものが特に好ましい。キーワードそのものについては
文字や記号、図形等を任意に使用できる。
【0038】また、前述の実施形態では、かな漢字変換
装置を動作させるためのプログラムを格納したコンピュ
ータ読取可能な記憶媒体としては、前記ROM40が相
当するものであるが、この実施形態にのみ限定されない
ことはもちろんである。例えば、サンプル文書解析プロ
グラムや選択プログラムをフロッピーディスクやCD−
ROM等に格納したものを読みとり装置により読みとっ
てインストールさせて動作させることができる。また、
有線もしくは無線回線を使用して外部情報処理装置から
プログラムを読み込んで動作させることができる。この
場合、前記フロッピーディスクやCD−ROMや、外部
情報処理装置の当該プログラムを格納したメモリが本発
明の記録媒体を構成することになる。
【0039】
【発明の効果】以上説明したことから明かなように、請
求項1記載のかな漢字変換装置は、サンプル文書を解析
して得た頻度情報と、基本辞書の頻度情報とどちらか一
方を選択できるので、作成する文章の分野を変更した直
後から効率のよいかな漢字変換が行えるという大変実用
的な効果を有する。
【0040】さらに、請求項2記載のかな漢字変換装置
は、サンプル文書解析手段により複数の頻度情報を記憶
することができるため、ユーザーは作成する文書に応じ
て適当な頻度情報を選択でき、多数の分野の文書を初め
から効率よく作成していくことができるという効果を有
する。
【0041】また、請求項3記載のコンピュータ読取可
能な記憶媒体は、サンプル文書解析プログラムによりサ
ンプル文書の単語が解析され、選択プログラムにより解
析された頻度情報か基本辞書に記憶されている頻度情報
かのいずれかの選択ができるので、作成する文章の分野
を変更した直後から効率のよいかな漢字変換が行えると
いう大変実用的な効果を有する。
【0042】さらに、請求項4に記載のコンピュータ読
取可能な記憶媒体は、サンプル文書プログラムにより複
数の頻度情報を記憶することができるため、ユーザーは
作成する文書に応じて適当な頻度情報を選択でき、多数
の分野の文書を初めから効率よく作成していくことがで
きるという効果を有する。
【図面の簡単な説明】
【図1】本実施形態のかな漢字変換装置のブロック図で
ある。
【図2】本実施形態のかな漢字変換装置の動作を示すフ
ローチャート図である。
【図3】本実施形態のサンプル文書解析処理を示すフロ
ーチャート図である。
【図4】本実施形態の選択処理を示すフローチャート図
である。
【符号の説明】
10 入力装置 12 中央処理装置 20 RAM 22 読み入力バッファ領域 24 出力バッファ領域 26 記憶領域 28 学習領域 30 ワークエリア 40 ROM 42 プログラム部 44 かな漢字変換プログラム 46 サンプル文書解析プログラム 48 選択プログラム 50 辞書部 52 基本辞書 54 接続テーブル 60 出力装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 かな読み文字列を入力するための入力手
    段と、 読み文字列及び候補文字列等を表示する表示手段と、 読みと、その読みに対する単語表記と、その単語表記の
    使用頻度とを記憶する基本辞書と、 前記基本辞書に基づいて、かな漢字変換を行うかな漢字
    変換手段とを備えたかな漢字変換装置において、 かな漢字混じり文のサンプル文書を入力・解析し、解析
    された単語の頻度情報を記憶するサンプル文書解析手段
    と、 前記サンプル文書解析手段に記憶された頻度情報と、前
    記基本辞書の頻度情報とのいずれか一方を選択する選択
    手段とを備えたことを特徴とするかな漢字変換装置。
  2. 【請求項2】 前記サンプル文書解析手段は、サンプル
    文書ごとに解析した頻度情報を複数記憶するように構成
    され、前記選択手段は、前記サンプル文書解析手段で記
    憶された頻度情報から一つ選択するように構成されてい
    ることを特徴とする請求項1に記載のかな漢字変換装
    置。
  3. 【請求項3】 読みと、その読みに対する単語表記と、
    その単語表記の使用頻度とを記憶する基本辞書を使用し
    てかな漢字変換を行うかな漢字変換装置を動作させるた
    めのプログラムを格納したコンピュータ読取可能な記憶
    媒体であって、 かな漢字混じり文のサンプル文書を入力・解析し、解析
    された単語の頻度情報を記憶するサンプル文書解析プロ
    グラムと、 前記サンプル文書解析プログラムによって記憶された頻
    度情報と、前記基本辞書の頻度情報とのいずれか一方を
    選択する選択プログラムとを備えたことを特徴とするコ
    ンピュータ読取可能な記憶媒体。
  4. 【請求項4】 前記サンプル文書解析プログラムは、サ
    ンプル文書ごとに解析した頻度情報を複数記憶するよう
    に設定され、前記選択プログラムは、前記サンプル文書
    解析プログラムで記憶された頻度情報から一つ選択する
    ように設定されていることを特徴とする請求項3に記載
    のコンピュータ読取可能な記憶媒体。
JP9180910A 1997-07-07 1997-07-07 かな漢字変換装置及びコンピュータ読取可能な記憶媒体 Pending JPH1125083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9180910A JPH1125083A (ja) 1997-07-07 1997-07-07 かな漢字変換装置及びコンピュータ読取可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9180910A JPH1125083A (ja) 1997-07-07 1997-07-07 かな漢字変換装置及びコンピュータ読取可能な記憶媒体

Publications (1)

Publication Number Publication Date
JPH1125083A true JPH1125083A (ja) 1999-01-29

Family

ID=16091440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9180910A Pending JPH1125083A (ja) 1997-07-07 1997-07-07 かな漢字変換装置及びコンピュータ読取可能な記憶媒体

Country Status (1)

Country Link
JP (1) JPH1125083A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355003A (ja) * 2003-05-27 2004-12-16 Microsoft Corp 名前付きエンティティ認識を機能強化するユーザモデル化のシステムおよび方法。
JP2019191713A (ja) * 2018-04-19 2019-10-31 ヤフー株式会社 決定プログラム、決定方法、及び決定装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355003A (ja) * 2003-05-27 2004-12-16 Microsoft Corp 名前付きエンティティ認識を機能強化するユーザモデル化のシステムおよび方法。
JP2019191713A (ja) * 2018-04-19 2019-10-31 ヤフー株式会社 決定プログラム、決定方法、及び決定装置

Similar Documents

Publication Publication Date Title
JP5513898B2 (ja) 共有された言語モデル
JP2010520531A (ja) 統合ピンイン及び画入力
JP5012083B2 (ja) 学習支援装置及び学習支援プログラム
JPH1125083A (ja) かな漢字変換装置及びコンピュータ読取可能な記憶媒体
JP5397199B2 (ja) 電子機器及び情報表示プログラム
JPH07271774A (ja) 文章入力装置
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP2006012188A (ja) 文書処理方法及び装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP3340124B2 (ja) かな漢字変換装置
JP4114695B2 (ja) 情報表示制御装置及びプログラム
JPH0267676A (ja) 漢数字変換処理装置
JPH0991278A (ja) 文書作成装置
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH04305769A (ja) 機械翻訳装置
JP2001134557A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH11161641A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH0467227B2 (ja)
JP2001265765A (ja) 電子辞書
JPH11312161A (ja) 変換装置
JPH09120400A (ja) 文書作成装置及び変換結果出力制御方法
JP2000099498A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH11328159A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH10254869A (ja) かな漢字変換装置
JP2003016058A (ja) 文字変換方法、ワードプロセッサ装置、変換辞書及びプログラム