JPH04349565A - かな漢字変換方法およびかな漢字変換装置 - Google Patents

かな漢字変換方法およびかな漢字変換装置

Info

Publication number
JPH04349565A
JPH04349565A JP3123470A JP12347091A JPH04349565A JP H04349565 A JPH04349565 A JP H04349565A JP 3123470 A JP3123470 A JP 3123470A JP 12347091 A JP12347091 A JP 12347091A JP H04349565 A JPH04349565 A JP H04349565A
Authority
JP
Japan
Prior art keywords
word
dictionary
adjunct
accessory
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3123470A
Other languages
English (en)
Inventor
Masaaki Tsunekawa
恒川 昌昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3123470A priority Critical patent/JPH04349565A/ja
Publication of JPH04349565A publication Critical patent/JPH04349565A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサや計
算機などにおいて、読みで指定した日本語文章を漢字か
な交じりの日本語文字表記列に変換するかな漢字変換方
法およびかな漢字変換装置に関するものである。
【0002】
【従来の技術】近年、文節区切りマーク等の付加情報な
しに句読点を含む読みかな通りに入力することにより変
換できる、いわゆるべた書き入力方式のかな漢字変換装
置が広く利用されている。一般にべた書き入力方式のか
な漢字変換装置では、単語辞書と付属語辞書とを用いて
文節を決定していき、複数の文節候補が成立した場合、
二文節の長さが一番長くなる文節候補の組の一文節目を
正解とする、いわゆる二文節最長一致法が採用されてい
る。しかしこの二文節最長一致法では、二文節合わせた
文節の長さが同じ場合は、二文節目の長さが長いほうを
正解とすることから、文節の区切り位置を間違うことが
ある。
【0003】図5は従来のかな漢字変換装置の構成図で
、文字列を入力する入力部21と、入力部21で入力さ
れた文字列を単語辞書検索部25で検索された単語と付
属語辞書検索部24で検索された付属語とを使ってかな
漢字変換を行うかな漢字変換部22と、入力文字列およ
び変換結果を出力する出力部23と、付属語辞書26を
読みで検索する付属語辞書検索部24と、単語辞書27
を読みで検索する単語辞書検索部25と、付属語の読み
と品詞とが登録されている付属語辞書26と、単語の読
みと表記および品詞とが対で登録されている単語辞書2
7とにより構成されている。
【0004】図6は従来のかな漢字変換装置による変換
過程の説明図で、図中「/」の記号は文節の区切りを表
す。いま、「ここまでは以下の」という文章を得るため
に、入力部21から「ここまではいかの」という入力文
字列を入力すると(図6(a))、かな漢字変換部22
は、単語辞書検索部25を起動する。単語辞書検索部2
5は、入力部21から入力された読み文字列「ここまで
はいかの」に対して単語辞書27を検索し、「ここ」、
「配下」、「以下」という単語をかな漢字変換部22に
返す(図6(b))。続いてかな漢字変換部22は、付
属語辞書検索部24を起動する。付属語辞書検索部24
は、検索された単語に続く読み文字列に対して付属語辞
書26を検索し、「まで」、「は」、「の」という付属
語をかな漢字変換部22に返す(図6(c))。次にか
な漢字変換部22は、検索された単語と付属語との接続
性をチェックした結果、文節の候補として、「ここまで
配下の」と「ここまでは以下の」との2つの文節候補を
得る(図6(d))。そしてかな漢字変換部22は、得
られた文節候補の中から、二文節最長一致法に則って、
変換結果「ここまで配下の」を出力部23に出力する(
図6(e))。最後に求める変換結果を得るために、オ
ペレータが操作して「ここまで」の文節を伸ばす必要が
ある(図6(f))。
【0005】
【発明が解決しようとする課題】上記従来のかな漢字変
換装置では、「は」という副助詞のようによく使う付属
語を持つ文節であってもうまく変換できず、文節の長さ
を変更するなどのオペレータによる修正処理が必要であ
るという問題点を有していた。本発明はかかる事情に鑑
みて成されたものであり、文章の変換を効率よく行うこ
とができるかな漢字変換方法およびかな漢字変換装置を
提供することを目的とする。
【0006】
【課題を解決するための手段】請求項1の発明は、日本
語の読み列を対応する漢字かな交じり列に変換するに際
して、単語の読みと表記および品詞とを保持する単語辞
書を検索する単語辞書検索ステップと、付属語の読みと
品詞とを保持する付属語辞書および付属語の読みと頻度
とを保持する付属語頻度辞書を検索する付属語辞書検索
ステップと、この付属語辞書検索ステップにより検索さ
れた付属語の頻度情報により文節候補の優先度を決定す
るかな漢字変換ステップとを実行することを特徴として
いる。
【0007】請求項2の発明は、単語の読みと表記およ
び品詞とを保持する単語辞書と、付属語の読みと品詞と
を保持する付属語辞書と、付属語の読みと頻度とを保持
する付属語頻度辞書と、前記単語辞書を検索する単語辞
書検索部と、前記付属語辞書と付属語頻度辞書とを検索
する付属語辞書検索部と、日本語の読み列を対応する漢
字かな交じり列に変換するに際して前記付属語辞書検索
部により検索された付属語の頻度情報により文節候補の
優先度を決定するかな漢字変換部とを備えたことを特徴
としている。
【0008】請求項3の発明は、日本語の読み列を対応
する漢字かな交じり列に変換するに際して、単語の読み
と表記および品詞とを保持する単語辞書を検索する単語
辞書検索ステップと、付属語の読みと品詞とを保持する
付属語辞書および付属語の読みと頻度とを保持する付属
語頻度辞書ならびに付属語の学習情報を保持する付属語
学習辞書を検索する付属語辞書検索ステップと、前記付
属語学習辞書に付属語の学習情報を登録する付属語登録
ステップと、前記付属語辞書検索ステップにより検索さ
れた付属語の学習情報と頻度情報とにより文節候補の優
先度を決定するかな漢字変換ステップとを実行すること
を特徴としている。
【0009】請求項4の発明は、単語の読みと表記およ
び品詞とを保持する単語辞書と、付属語の読みと品詞と
を保持する付属語辞書と、付属語の読みと頻度とを保持
する付属語頻度辞書と、付属語の学習情報を保持する付
属語学習辞書と、前記単語辞書を検索する単語辞書検索
部と、前記付属語辞書と付属語頻度辞書と付属語学習辞
書とを検索する付属語辞書検索部と、前記付属語学習辞
書に付属語の学習情報を登録する付属語登録部と、日本
語の読み列を対応する漢字かな交じり列に変換するに際
して前記付属語辞書検索部により検索された付属語の学
習情報と頻度情報とにより文節候補の優先度を決定する
かな漢字変換部とを備えたことを特徴としている。
【0010】
【作用】請求項1の発明においては、日本語の読み列を
対応する漢字かな交じり列に変換するに際して、単語の
読みと表記および品詞とを保持する単語辞書を検索し、
付属語の読みと品詞とを保持する付属語辞書および付属
語の読みと頻度とを保持する付属語頻度辞書を検索し、
検索された付属語の頻度情報により文節候補の優先度を
決定する。
【0011】請求項2の発明において、単語辞書は、単
語の読みと表記および品詞とを保持する。付属語辞書は
、付属語の読みと品詞とを保持する。付属語頻度辞書は
、付属語の読みと頻度とを保持する。単語辞書検索部は
、単語辞書を検索する。付属語辞書検索部は、付属語辞
書と付属語頻度辞書とを検索する。かな漢字変換部は、
日本語の読み列を対応する漢字かな交じり列に変換する
に際して付属語辞書検索部により検索された付属語の頻
度情報により文節候補の優先度を決定する。
【0012】請求項3の発明においては、日本語の読み
列を対応する漢字かな交じり列に変換するに際して、単
語の読みと表記および品詞とを保持する単語辞書を検索
し、付属語の読みと品詞とを保持する付属語辞書および
付属語の読みと頻度とを保持する付属語頻度辞書ならび
に付属語の学習情報を保持する付属語学習辞書を検索し
、付属語学習辞書に付属語の学習情報を登録し、検索さ
れた付属語の学習情報と頻度情報とにより文節候補の優
先度を決定する。
【0013】請求項4の発明において、単語辞書は、単
語の読みと表記および品詞とを保持する。付属語辞書は
、付属語の読みと品詞とを保持する。付属語頻度辞書は
、付属語の読みと頻度とを保持する。付属語学習辞書は
、付属語の学習情報を保持する。単語辞書検索部は、単
語辞書を検索する。付属語辞書検索部は、付属語辞書と
付属語頻度辞書と付属語学習辞書とを検索する。付属語
登録部は、付属語学習辞書に付属語の学習情報を登録す
る。かな漢字変換部は、日本語の読み列を対応する漢字
かな交じり列に変換するに際して付属語辞書検索部によ
り検索された付属語の学習情報と頻度情報とにより文節
候補の優先度を決定する。
【0014】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の一実施例におけるかな漢字変
換装置の構成図で、このかな漢字変換装置は、入力部1
と、かな漢字変換部2と、出力部3と、付属語辞書検索
部4と、付属語登録部5と、単語辞書検索部6と、付属
語頻度辞書7と、付属語辞書8と、付属語学習辞書9と
、単語辞書10とにより構成されている。入力部1は、
文字列を入力する。単語辞書10は、単語の読みと表記
および品詞とが対で登録されている。単語辞書検索部6
は、単語辞書10を読みで検索する。付属語辞書8は、
付属語の読みと品詞とが対で登録されている。付属語頻
度辞書7は、付属語の読みが頻度情報と共に登録されて
いる。付属語学習辞書9は、付属語の使用された履歴情
報が登録されている。付属語辞書検索部4は、付属語辞
書8と付属語頻度辞書7および付属語学習辞書9とを読
みで検索する。付属語登録部5は、付属語の学習情報を
付属語学習辞書9に登録する。かな漢字変換部2は、入
力部1で入力された文字列を単語辞書検索部6で検索さ
れた単語と、付属語辞書検索部4で検索された付属語と
を使ってかな漢字変換を行う。出力部3は、入力文字列
および変換結果を出力する。実際にはこれ以外にも、オ
ペレータが変換を指示する機能や、変換候補中から所望
の候補を選択する機能などを実現するために種々の構成
要素を必要とするが、本発明の要旨とは直接関係がなく
、また周知の構成であるので説明を省略する。
【0015】上記かな漢字変換装置の動作について、図
2のフローチャートを参照しながら説明する。オペレー
タが日本語の文章を得るために入力部1より読み文字列
を入力すると(ステップS1)、かな漢字変換部2が単
語辞書検索部6を起動する。単語辞書検索部6は、入力
部1から入力された読み文字列に対して単語辞書10を
検索し(ステップS2)、結果をかな漢字変換部2に返
す。続いてかな漢字変換部2は、付属語辞書検索部4を
起動する。付属語辞書検索部4は、検索された単語に続
く読み文字列に対して付属語辞書8を検索し(ステップ
S3)、付属語の品詞をかな漢字変換部2に返す。続い
て付属語辞書検索部4は、検索された単語に続く読み文
字列に対して付属語頻度辞書7を検索し(ステップS4
)、付属語の頻度をかな漢字変換部2に返す。引き続き
付属語辞書検索部4は、検索された単語に続く読み文字
列に対して付属語学習辞書9を検索し(ステップS5)
、学習された付属語があればそれをかな漢字変換部2に
返す。次にかな漢字変換部2は、検索された単語と付属
語との接続性をチェックした結果、文節として成り立つ
候補を得る(ステップS6)。次にかな漢字変換部2は
、得られた文節候補の中から、それぞれの文節に含まれ
る付属語が付属語学習辞書9に登録されているものを最
優先する。その次にその付属語の頻度情報に基づいて候
補の優先度を決定し、もっとも優先度の高い候補を変換
結果として出力部3に出力する(ステップS7)。 これによりオペレータが変換結果に応じて文節の長さの
変更や同音語の候補の選択を行なうと(ステップS8)
、かな漢字変換部2が付属語登録部5を起動する。 付属語登録部5は、選択された候補に含まれる付属語を
付属語学習辞書9に登録する(ステップS9)。
【0016】上記動作をさらに具体的に説明する。図3
は上記かな漢字変換装置による変換過程の説明図である
。いま、「ここまでは以下の」という文章を得るために
入力部1から「ここまではいかの」という入力文字列を
入力すると(図3(a))、かな漢字変換部2が単語辞
書検索部6を起動する。単語辞書検索部6は、入力部1
より入力された読み文字列「ここまではいかの」に対し
て単語辞書10を検索し、「ここ」、「配下」、「以下
」という単語をかな漢字変換部2に返す(図3(b))
。続いてかな漢字変換部2は、付属語辞書検索部4を起
動する。付属語辞書検索部4は、検索された単語に続く
読み文字列に対して付属語辞書8を検索し、「まで」、
「は」、「の」という付属語をかな漢字変換部2に返す
(図3(c))。続いて付属語辞書検索部4は、検索さ
れた単語に続く読み文字列に対して付属語頻度辞書7を
検索し、付属語の頻度「まで:1112」、「は:10
723」、「の:28448」をかな漢字変換部2に返
す(図3(d))。引き続き付属語辞書検索部4は、検
索された単語に続く読み文字列に対して付属語学習辞書
9を検索するが、現在は何も登録されていないので何も
返さない。次にかな漢字変換部2は、検索された付属語
に対して単語との接続性をチェックした結果、文節の候
補として、「ここまで配下の」と「ここまでは以下の」
との2つの候補を得る(図3(e))。次にかな漢字変
換部2は、得られた文節候補の中から、それぞれの文節
に含まれる付属語の学習情報と頻度情報とに基づいて文
節を決定する。この場合、学習情報は何も登録されてい
ないので、「まで」の頻度が「1112」、「は」の頻
度が「10723」であることから、変換結果「ここま
では以下の」を出力部3に出力する(図3(f))。オ
ペレータは、正解が得られたので、変換結果をそのまま
選択する。最後にかな漢字変換部2は、付属語登録部5
を起動する。付属語登録部5は、選択された候補に含ま
れる付属語「まで」、「は」、「の」を付属語学習辞書
9に登録する(図3(g))。
【0017】次に、「ここには何もない」という文章を
変換する場合について説明する。図4はこの場合の変換
過程の説明図である。いま、「ここには何もない」とい
う文章を得るために、入力部1から「ここにはなにもな
い」という入力文字列を入力すると(図4(a))、か
な漢字変換部2が単語辞書検索部6を起動する。単語辞
書検索部6は、入力部1より入力された読み文字列「こ
こにはなにもない」に対して単語辞書10を検索し、「
ここ」、「何」、「花」、「な(い)」という単語をか
な漢字変換部2に返す(図4(b))。続いてかな漢字
変換部2は、付属語辞書検索部4を起動する。付属語辞
書検索部4は、検索された単語に続く読み文字列に対し
て付属語辞書8を検索し、「に」、「は」、「も」とい
う付属語をかな漢字変換部2に返す(図4(c))。 続いて付属語辞書検索部4は、検索された単語に続く読
み文字列に対して付属語頻度辞書7を検索し、付属語の
頻度、「に:13525」、「は:10723」、「も
:2828」をかな漢字変換部2に返す(図4(d))
。引き続き付属語辞書検索部4は、検索された単語に続
く読み文字列に対して付属語学習辞書9を検索し、「は
」という付属語が学習されていることをかな漢字変換部
2に返す(図4(e))。次にかな漢字変換部2は、検
索された付属語に対して単語との接続性をチェックした
結果、文節の候補として、「ここに花にもない」と「こ
こには何もない」との2つの候補を得る(図4(f))
。次にかな漢字変換部2は、得られた文節候補の中から
、それぞれの文節に含まれる付属語の学習情報と頻度情
報とに基づいて文節を決定する。この場合、「は」とい
う付属語は学習されているが、「に」という付属語は学
習されていないことから、変換結果「ここには何も」を
出力部3に出力する(図4(g))。このとき、もしも
付属語「は」が付属語学習辞書9に登録されていなけれ
ば、「に」の頻度が「13525」、「は」の頻度が「
10723」であることから、変換結果は「ここに花に
もない」となってしまう。オペレータは、正解が得られ
たので、変換結果をそのまま選択する。最後にかな漢字
変換部2は、付属語登録部5を起動する。 付属語登録部5は、選択された候補に含まれる付属語「
は」、「も」を付属語学習辞書9に登録する(図3(h
))。
【0018】このように、付属語の頻度情報によって文
節を決定するので、文章の変換を効率よく行うことがで
きる。また、オペレータの使い方に応じて付属語を学習
するので、作成する文章の内容に応じた精度の高いかな
漢字変換が行え、文節の区切り位置を修正するなどの余
分な操作を行う必要がなくなる。なお上記実施例におい
ては付属語の学習情報と頻度情報とにより文節を決定し
たが、付属語の頻度情報のみにより文節を決定してもよ
い。
【0019】また上記実施例においては付属語の学習情
報と頻度情報とのみに基づいて文節を決定したが、それ
以外の例えば自立語の長さなどと付属語の学習情報と頻
度情報とを兼ね合わせて文節を決定してもよい。また上
記実施例においては付属語の学習情報として履歴情報を
用いたが、使用した頻度情報を用いてもよい。
【0020】また上記実施例においては付属語の学習情
報を頻度情報より優先させたが、付属語の学習情報と頻
度情報とを変数とする評価関数を用いて文節を決定して
もよい。
【0021】
【発明の効果】以上説明したように本発明によれば、付
属語の頻度情報に基づいて文節を決定するので、文章の
変換を効率よく行うことができる。またオペレータの使
い方に応じて付属語を学習していくようにすれば、よく
使われる付属語を持つ文節を優先させることにより、作
成する文章の内容に応じた精度の高いかな漢字変換を行
え、オペレータが文節の区切り位置を修正するなどの余
分な操作を行う必要がなくなるという優れた効果を奏す
る。
【図面の簡単な説明】
【図1】本発明の一実施例におけるかな漢字変換装置の
構成図である。
【図2】本発明の一実施例におけるかな漢字変換装置の
動作を説明するフローチャートである。
【図3】本発明の一実施例におけるかな漢字変換装置に
よる変換過程の説明図である。
【図4】本発明の一実施例におけるかな漢字変換装置に
よる変換過程の説明図である。
【図5】従来のかな漢字変換装置の構成図である。
【図6】従来のかな漢字変換装置による変換過程の説明
図である。
【符号の説明】
2    かな漢字変換部 4    付属語辞書検索部 5    付属語登録部 6    単語辞書検索部 7    付属語頻度辞書 8    付属語辞書 9    付属語学習辞書 10    単語辞書

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  日本語の読み列を対応する漢字かな交
    じり列に変換するに際して、単語の読みと表記および品
    詞とを保持する単語辞書を検索する単語辞書検索ステッ
    プと、付属語の読みと品詞とを保持する付属語辞書およ
    び付属語の読みと頻度とを保持する付属語頻度辞書を検
    索する付属語辞書検索ステップと、この付属語辞書検索
    ステップにより検索された付属語の頻度情報により文節
    候補の優先度を決定するかな漢字変換ステップとを実行
    することを特徴とするかな漢字変換方法。
  2. 【請求項2】  単語の読みと表記および品詞とを保持
    する単語辞書と、付属語の読みと品詞とを保持する付属
    語辞書と、付属語の読みと頻度とを保持する付属語頻度
    辞書と、前記単語辞書を検索する単語辞書検索部と、前
    記付属語辞書と付属語頻度辞書とを検索する付属語辞書
    検索部と、日本語の読み列を対応する漢字かな交じり列
    に変換するに際して前記付属語辞書検索部により検索さ
    れた付属語の頻度情報により文節候補の優先度を決定す
    るかな漢字変換部とを備えたことを特徴とするかな漢字
    変換装置。
  3. 【請求項3】  日本語の読み列を対応する漢字かな交
    じり列に変換するに際して、単語の読みと表記および品
    詞とを保持する単語辞書を検索する単語辞書検索ステッ
    プと、付属語の読みと品詞とを保持する付属語辞書およ
    び付属語の読みと頻度とを保持する付属語頻度辞書なら
    びに付属語の学習情報を保持する付属語学習辞書を検索
    する付属語辞書検索ステップと、前記付属語学習辞書に
    付属語の学習情報を登録する付属語登録ステップと、前
    記付属語辞書検索ステップにより検索された付属語の学
    習情報と頻度情報とにより文節候補の優先度を決定する
    かな漢字変換ステップとを実行することを特徴とするか
    な漢字変換方法。
  4. 【請求項4】  単語の読みと表記および品詞とを保持
    する単語辞書と、付属語の読みと品詞とを保持する付属
    語辞書と、付属語の読みと頻度とを保持する付属語頻度
    辞書と、付属語の学習情報を保持する付属語学習辞書と
    、前記単語辞書を検索する単語辞書検索部と、前記付属
    語辞書と付属語頻度辞書と付属語学習辞書とを検索する
    付属語辞書検索部と、前記付属語学習辞書に付属語の学
    習情報を登録する付属語登録部と、日本語の読み列を対
    応する漢字かな交じり列に変換するに際して前記付属語
    辞書検索部により検索された付属語の学習情報と頻度情
    報とにより文節候補の優先度を決定するかな漢字変換部
    とを備えたことを特徴とするかな漢字変換装置。
JP3123470A 1991-05-28 1991-05-28 かな漢字変換方法およびかな漢字変換装置 Pending JPH04349565A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3123470A JPH04349565A (ja) 1991-05-28 1991-05-28 かな漢字変換方法およびかな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3123470A JPH04349565A (ja) 1991-05-28 1991-05-28 かな漢字変換方法およびかな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH04349565A true JPH04349565A (ja) 1992-12-04

Family

ID=14861428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3123470A Pending JPH04349565A (ja) 1991-05-28 1991-05-28 かな漢字変換方法およびかな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH04349565A (ja)

Similar Documents

Publication Publication Date Title
JPS5821287B2 (ja) カナ漢字変換装置
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH04349565A (ja) かな漢字変換方法およびかな漢字変換装置
JPH0460754A (ja) 仮名漢字変換方法
JPS63316162A (ja) 文書作成装置
JPS62177656A (ja) 文書作成装置
JPH09288494A (ja) 音声認識装置および音声認識方法
JPH05242075A (ja) かな漢字変換方法およびかな漢字変換装置
JPS62140165A (ja) 仮名漢字変換方式
JPH0991278A (ja) 文書作成装置
JPS6210764A (ja) 仮名漢字変換方式
JP2002351868A (ja) 電子辞書
JPH0350669A (ja) 情報処理装置
JPH0719254B2 (ja) カナ漢字変換装置
JPH06309302A (ja) 漢字変換装置
JPS62180465A (ja) 仮名漢字変換方式
JPH07141349A (ja) かな漢字変換装置
JPS6210762A (ja) 仮名漢字変換方式
JPH07141350A (ja) かな漢字変換装置
JPH0589094A (ja) かな漢字変換装置
JPS62180463A (ja) 仮名漢字変換方式
JPH0394367A (ja) 日本語入力方式
JPS6339075A (ja) 質問応答システムの日本語入力処理方式
JPH07219956A (ja) 機械翻訳装置
JPS6215654A (ja) 日本語文章入力装置