JPH08287058A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH08287058A
JPH08287058A JP7089198A JP8919895A JPH08287058A JP H08287058 A JPH08287058 A JP H08287058A JP 7089198 A JP7089198 A JP 7089198A JP 8919895 A JP8919895 A JP 8919895A JP H08287058 A JPH08287058 A JP H08287058A
Authority
JP
Japan
Prior art keywords
kana
learning
maximum likelihood
candidate
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7089198A
Other languages
English (en)
Inventor
Shigeki Hataya
茂樹 畑谷
Hiroyuki Kumai
裕之 隈井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7089198A priority Critical patent/JPH08287058A/ja
Publication of JPH08287058A publication Critical patent/JPH08287058A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】接尾語及び接頭語の変換精度を向上させて漢字
かな混じり文字の入力の効率を向上させる。 【構成】学習手段105は、接頭語及び接尾語について
は単独では学習せずにその前後の名詞との組み合わせで
学習するようにし、最尤候補抽出手段104は、学習情
報取得手段106と意味関連取得手段107を利用して
最尤候補を抽出して表示手段108に表示するようにし
た。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コンピュータやワード
プロセッサなどの日本語入力手段として用いるかな漢字
変換装置に関する。
【0002】
【従来の技術】コンピュータやワードプロセッサにおけ
る漢字かな混じりの日本語文字列の入力は、かな文字列
を入力して対応する漢字をかな漢字変換辞書から抽出す
ることによって行っている。かな文字列を複数通りの漢
字かな混じりの文字列に変換できる場合には、かな漢字
変換手段は、最も尤度の高い漢字かな混じり文字列を第
1の変換候補として提示する。そして、外部からの指示
により変更された変換候補を単語単位あるいは複数の単
語の組み合わせで記憶し、その後は記憶した単語を優先
して第1の変換候補にする学習手段が設けられる。この
ようなかな漢字変換装置は、特開昭58−68180号
公報に開示されている。このかな漢字変換装置では、同
じ読みかな文字列を入力した場合は、ユーザが以前に選
択した変換候補が優先して表示される。
【0003】また、後続する単語との意味的関連に従っ
て変換の第1候補を決める方式のかな漢字変換装置が特
開昭60−157659号公報に開示されている。この
方式を用いたかな漢字変換装置では、意味的に正しいつ
ながりをもった単語が優先される。
【0004】更に、これらの両機能を備えたかな漢字変
換装置がある。この装置は、先ず、ユーザが以前に選択
した変換候補を優先し、次に意味的に正しいつながりを
もった単語を優先する。
【0005】
【発明が解決しようとする課題】しかし、このようなか
な漢字変換装置では、接尾語や接頭語が外部からの指示
で変更されてある名詞との組み合わせになった場合、こ
の接尾語や接頭語はその名詞との組み合わせばかりでは
なく単独でも学習情報が記憶される。従って、この接尾
語や接頭語の読みが入力されると、前出の名詞との組み
合わせでない場合でも前記単独の学習情報が影響してこ
の接尾語や接頭語が変換候補として優先表示される。こ
の変換候補は、一般的には、正しい変換候補ではない
(誤変換)場合が多い。
【0006】本発明の目的は、接尾語や接頭語が学習機
能の影響で変換候補として誤って優先表示されることを
防止することにある。
【0007】
【課題を解決するための手段】本発明の1つの特徴は、
かな文字を入力する入力手段と、読みかなを索引として
単語の表記,品詞,意味情報を格納している辞書と、該
辞書から検索した単語を前後の単語と接続検定して複数
の変換候補を作成する形態素解析手段と、該形態素解析
手段により作成された複数の変換候補の中から学習情報
を参照して最も尤度の高いものを抽出する最尤候補抽出
手段と、外部から変更指示された変換候補の前記学習情
報を記憶する学習手段と、入力された読みかな文字及び
変換候補を表示する表示手段を備えたかな漢字変換装置
において、前記学習手段は、接尾語については学習情報
を単独では記憶せずに直前の名詞との組み合わせで記憶
するようにしたことにある。
【0008】そして、前記最尤候補抽出手段は、接尾語
については前記学習手段に記憶された学習情報がない場
合には後続する用言との意味情報の組み合わせに従って
最尤候補を決定するようにしたことを特徴とする。
【0009】また、前記最尤候補抽出手段は、接尾語に
ついては後続する用言との意味情報の組み合わせに従っ
て変換候補を決定することができなかった場合は、直前
の名詞との意味情報の組み合わせに従って最尤候補を決
定するようにしたことを特徴とする。
【0010】また、本発明の他の特徴は、かな文字を入
力する入力手段と、読みかなを索引として単語の表記,
品詞,意味情報を格納している辞書と、該辞書から検索
した単語を前後の単語と接続検定して複数の変換候補を
作成する形態素解析手段と、該形態素解析手段により作
成された複数の変換候補の中から学習情報を参照して最
も尤度の高いものを抽出する最尤候補抽出手段と、外部
から変更指示された変換候補の前記学習情報を記憶する
学習手段と、入力された読みかな文字及び変換候補を表
示する表示手段を備えたかな漢字変換装置において、前
記学習手段は、接頭語については学習情報を単独では記
憶せずに直後の名詞との組み合わせで記憶するようにし
たことにある。
【0011】そして、前記最尤候補抽出手段は、接頭語
については前記学習手段に記憶された学習情報がない場
合には直後の名詞との意味情報の組み合わせに従って最
尤候補を決定するようにしたことを特徴とする。
【0012】本発明の更に他の特徴は、かな文字を入力
する入力手段と、読みかなを索引として単語の表記,品
詞,意味情報を格納している辞書と、該辞書から検索し
た単語を前後の単語と接続検定して複数の変換候補を作
成する形態素解析手段と、該形態素解析手段により作成
された複数の変換候補の中から学習情報を参照して最も
尤度の高いものを抽出する最尤候補抽出手段と、外部か
ら変更指示された変換候補の前記学習情報を記憶する学
習手段と、入力された読みかな文字及び変換候補を表示
する表示手段を備えたかな漢字変換装置において、前記
学習手段は、接尾語及び接頭語については単独では学習
情報を記憶せず、接尾語は直前の名詞との組み合わせで
記憶し、接頭語は直後の名詞との組み合わせで学習情報
を記憶するようにしたことにある。
【0013】そして、前記最尤候補抽出手段は、接尾語
については前記学習手段に記憶された学習情報がない場
合には後続する用言との意味情報の組み合わせに従って
最尤候補を決定し、接頭語については前記学習手段に記
憶された学習情報がない場合には直後の名詞との意味情
報の組み合わせに従って最尤候補を決定するようにした
ことを特徴とする。
【0014】
【作用】学習手段は、接頭語及び接尾語については、該
接頭語及び接尾語の前後の名詞との組み合わせで学習情
報を記憶する。最尤候補抽出手段は、学習情報取得手段
と意味関連取得手段を利用して変換候補の中から最も尤
度の高いものを抽出するので、ユーザが以前に選択した
組み合わせがある場合はその組み合わせが最尤候補と
し、それ以外の場合は意味的に妥当な組み合わせが最尤
候補とするので、接尾語及び接頭語の変換精度が向上し
て漢字かな混じり文列入力の効率を向上することができ
る。
【0015】
【実施例】本発明の実施例を図面を用いて説明する。
【0016】図1は、本発明になるかな漢字変換装置の
基本構成を示すブロック図である。入力手段101は、
かな文字及び英数文字データや機能指示を入力する機能
をもったキーボードで構成される。辞書102は、読み
かな文字列を索引として対応する単語の品詞情報,表記
情報,意味情報を記憶している。形態素解析手段103
は、入力手段101から入力された読みかな文字列に基
づいて辞書102を検索して複数の変換候補を作成す
る。最尤候補抽出手段104は、形態素解析手段103
により作成された複数の変換候補の中から最も尤度の高
いものを抽出する。学習手段105は、最尤候補抽出手
段104により抽出された最尤候補が外部からの指示で
変更された場合には、変更された後の変換候補を記憶す
る。学習情報取得手段106は、学習手段105により
記憶された学習情報を取得する。意味関連取得手段10
7は、辞書102を検索して単語同士の意味的関連を調
べる。表示手段108は、入力手段101から入力され
た読みかな文字列や形態素解析手段103により作成さ
れた複数の変換候補、また、最尤候補抽出手段104に
より抽出された最尤候補を表示する。この表示手段10
8は、CRTディスプレイ装置やCRTディスプレイ装
置により実現できる。
【0017】図2は、辞書102の登録内容を示してい
る。辞書102の1レコードには、単語の読みかな文字
201,品詞情報202,表記情報203,意味情報2
04を記憶している。
【0018】図3は、学習手段105に記憶された学習
情報を示している。学習情報の1レコードには、前単語
の読みかな文字301,品詞情報302,表記情報30
3,後単語の読みかな文字304,品詞情報305,表
記情報306を記憶している。但し、単語単独の学習の
場合は、後単語の情報は何も記憶されない。
【0019】従来のかな漢字変換装置では、接尾語及び
接頭語を単独で学習すると、「しゅっちょうしゃ」を
「出張者」と変換した後では、「商用車」を入力するた
めに「しょうようしゃ」を入力すると「商用者」に変換
されてしまう。接尾語及び接頭語は漢字1文字で表され
る単語が多く、読みかなが重複するものが多い。例え
ば、「自社製」と「独立性」,「消費量」と「借用
料」,「最重要」と「再検討」等である。
【0020】接頭語及び接尾語は必ず名詞との組み合わ
せで現れるので、これを単独で学習するのは行き過ぎで
あり、学習によって前述したように誤変換の原因とな
る。本発明は、このようなことから、接尾語及び接頭語
は単独では学習せずに、名詞+接尾語あるいは接頭語+
名詞の組み合わせでのみ学習するようにしている。図3
に示した学習情報では、「商用」という名詞は単独でも
学習しているが、「車」という接尾語は「商用」という
名詞との組み合わせでのみ学習している。
【0021】図4は、意味的関連を示す情報を詳細に示
している。意味的関連を示す情報の1レコードには、前
側と後側のそれぞれについて、意味情報または単語の読
みかな,品詞情報,表記情報が記憶されている。
【0022】接尾語は、それを含む句が表すものを決め
ることが多い。そこで、接尾語は、辞書102の意味情
報を用いて、「…会を開く」や「…室に入る」等のよう
に、その後に続く用言との意味的関連で決定する。若し
もこれで決まらない場合は、直前の名詞との意味的関連
で決定する。例えば「(状態や性質を表す名詞)性」や
「(動作や行為を表わす名詞)者」等である。また、接
頭語も、直後の名詞との意味的関連で決定する。例えば
「再(動作や行為を表わす名詞)」等である。
【0023】接尾語及び接頭語は、名詞に比べて単語の
種類がかなり少ないので、接尾語や接頭語との意味的関
連で変換候補を決定ことは、名詞同士の意味的関連で変
換候補を決定するよりもは遥かに有効且つ実用的であ
る。
【0024】図5は、本実施例におけるかな漢字変換処
理フローである。先ず、ステップ501で処理を開始す
ると、ステップ502では入力手段101からの読みか
な文字列を入力し、ステップ503では形態素解析手段
103がこの読みかなをもとにして辞書102を検索し
て複数の変換候補を作成する。ステップ504において
最尤候補抽出手段104は、学習情報取得手段106と
意味関連取得手段107を利用してこの複数の変換候補
の中から最尤候補を抽出する。ステップ505において
最尤候補が変更されたことを検出した場合は、ステップ
506において学習手段105は変更された変換候補を
記憶する。
【0025】図6は、前記ステップ504において接尾
語に関する最尤候補を抽出するための手順を示す処理フ
ローである。先ず、ステップ601において複数の変換
候補を検証する。ステップ602で学習情報取得手段1
06により学習情報を調べて接尾語に関する学習情報が
あった場合、具体的には、接尾語と直前名詞の学習情報
があった場合には、ステップ605に移ってその名詞と
接尾語の組み合わせを最尤候補とする。学習情報がなか
った場合には、ステップ603で意味関連取得手段10
7が辞書102を検索して接尾語と後に続く用言との意
味的関連を調べ、これがあればステップ605に移って
その接尾語と用言の組み合わせを最尤候補とする。これ
で決まらない場合は、ステップ604において意味関連
取得手段107が辞書102を検索して接尾語と直前の
名詞との意味的関連を調べ、これがあればステップ60
5に移ってその接尾語と名詞の組み合わせを最尤候補と
する。これでも決まらない場合は、ステップ605にお
いて既定の優先度に従って最尤候補を決定する。
【0026】図7は前記ステップ504において接頭語
に関する最尤候補を抽出するための手順を示す処理フロ
ーである。先ず、ステップ701で複数の変換候補を検
証する。ステップ702では学習情報取得手段106に
より学習情報を調べて接頭語に関する学習情報があった
場合、具体的には、接頭語と直後の名詞の学習情報があ
った場合には、ステップ704に移ってその名詞と接頭
語の組み合わせを最尤候補とする。学習情報がなかった
場合には、ステップ703で意味関連取得手段107が
辞書102を検索して接頭語と直後の名詞との意味的関
連を調べ、これがあればステップ704に移ってその接
頭語と名詞の組み合わせを最尤候補とする。これでも決
まらない場合は、ステップ704において既定の優先度
に従って最尤候補を決定する。
【0027】
【発明の効果】以上に説明したように本発明によれば、
学習手段は接尾語及び接頭語については単独では学習せ
ずに該接頭語及び接尾語の前後の名詞との組み合わせで
学習情報を記憶するようにしたのでかな漢字変換精度を
高めて漢字かな混じり文字列入力の手間を軽減すること
ができる。
【図面の簡単な説明】
【図1】本発明になるかな漢字変換装置の基本構成を示
すブロック図である。
【図2】本発明になるかな漢字変換装置における辞書の
登録内容を示す図である。
【図3】本発明になるかな漢字変換装置における学習情
報を示す図である。
【図4】本発明になるかな漢字変換装置における意味的
関連情報を示す図である。
【図5】本発明になるかな漢字変換装置におけるかな漢
字変換処理フローチャートである。
【図6】本発明になるかな漢字変換装置における接尾語
に関する最尤候補抽出手順を示すフローチャートであ
る。
【図7】本発明になるかな漢字変換装置における接頭語
に関する最尤候補抽出手順を示すフローチャートであ
る。
【符号の説明】
101…入力手段、102…辞書、103…形態素解析
手段、104…最尤候補抽出手段、105…学習手段、
106…学習情報取得手段、107…意味関連取得手
段、108…出力手段。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】かな文字を入力する入力手段と、読みかな
    を索引として単語の表記,品詞,意味情報を格納してい
    る辞書と、該辞書から検索した単語を前後の単語と接続
    検定して複数の変換候補を作成する形態素解析手段と、
    該形態素解析手段により作成された複数の変換候補の中
    から学習情報を参照して最も尤度の高いものを抽出する
    最尤候補抽出手段と、外部から変更指示された変換候補
    の前記学習情報を記憶する学習手段と、入力された読み
    かな文字及び変換候補を表示する表示手段を備えたかな
    漢字変換装置において、 前記学習手段は、接尾語については学習情報を単独では
    記憶せずに直前の名詞との組み合わせで記憶するように
    したことを特徴とするかな漢字変換装置。
  2. 【請求項2】請求項1において、前記最尤候補抽出手段
    は、接尾語については前記学習手段に記憶された学習情
    報がない場合には後続する用言との意味情報の組み合わ
    せに従って最尤候補を決定するようにしたことを特徴と
    するかな漢字変換装置。
  3. 【請求項3】請求項2において、前記最尤候補抽出手段
    は、接尾語については後続する用言との意味情報の組み
    合わせに従って変換候補を決定することができなかった
    場合は、直前の名詞との意味情報の組み合わせに従って
    最尤候補を決定するようにしたことを特徴とするかな漢
    字変換装置。
  4. 【請求項4】かな文字を入力する入力手段と、読みかな
    を索引として単語の表記,品詞,意味情報を格納してい
    る辞書と、該辞書から検索した単語を前後の単語と接続
    検定して複数の変換候補を作成する形態素解析手段と、
    該形態素解析手段により作成された複数の変換候補の中
    から学習情報を参照して最も尤度の高いものを抽出する
    最尤候補抽出手段と、外部から変更指示された変換候補
    の前記学習情報を記憶する学習手段と、入力された読み
    かな文字及び変換候補を表示する表示手段を備えたかな
    漢字変換装置において、 前記学習手段は、接頭語については学習情報を単独では
    記憶せずに直後の名詞との組み合わせで記憶するように
    したことを特徴とするかな漢字変換装置。
  5. 【請求項5】請求項4において、前記最尤候補抽出手段
    は、接頭語については前記学習手段に記憶された学習情
    報がない場合には直後の名詞との意味情報の組み合わせ
    に従って最尤候補を決定するようにしたことを特徴とす
    るかな漢字変換装置。
  6. 【請求項6】かな文字を入力する入力手段と、読みかな
    を索引として単語の表記,品詞,意味情報を格納してい
    る辞書と、該辞書から検索した単語を前後の単語と接続
    検定して複数の変換候補を作成する形態素解析手段と、
    該形態素解析手段により作成された複数の変換候補の中
    から学習情報を参照して最も尤度の高いものを抽出する
    最尤候補抽出手段と、外部から変更指示された変換候補
    の前記学習情報を記憶する学習手段と、入力された読み
    かな文字及び変換候補を表示する表示手段を備えたかな
    漢字変換装置において、 前記学習手段は、接尾語及び接頭語については単独では
    学習情報を記憶せず、接尾語は直前の名詞との組み合わ
    せで記憶し、接頭語は直後の名詞との組み合わせで学習
    情報を記憶するようにしたことを特徴とするかな漢字変
    換装置。
  7. 【請求項7】請求項6において、前記最尤候補抽出手段
    は、接尾語については前記学習手段に記憶された学習情
    報がない場合には後続する用言との意味情報の組み合わ
    せに従って最尤候補を決定し、接頭語については前記学
    習手段に記憶された学習情報がない場合には直後の名詞
    との意味情報の組み合わせに従って最尤候補を決定する
    ようにしたことを特徴とするかな漢字変換装置。
JP7089198A 1995-04-14 1995-04-14 かな漢字変換装置 Pending JPH08287058A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7089198A JPH08287058A (ja) 1995-04-14 1995-04-14 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7089198A JPH08287058A (ja) 1995-04-14 1995-04-14 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH08287058A true JPH08287058A (ja) 1996-11-01

Family

ID=13964022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7089198A Pending JPH08287058A (ja) 1995-04-14 1995-04-14 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH08287058A (ja)

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH09198395A (ja) 文書検索装置
JP2007122660A (ja) 文書データ処理装置および文書データ処理プログラム
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP5583230B2 (ja) 情報検索装置及び情報検索方法
JPH08287058A (ja) かな漢字変換装置
JPS61248160A (ja) 文書情報登録方式
JP2002073656A (ja) 異表記正規化処理・異表記展開処理方法および該処理方法による文書検索方法、該処理装置および文書検索装置並びにプログラム記録媒体
JPH11259469A (ja) 人名作成方法及び装置並びに記憶媒体
JP3118880B2 (ja) 日本語文章処理装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH01185766A (ja) かな漢字変換装置
JPH06332934A (ja) 電子辞書引き装置
JPH05120331A (ja) 同音異義語認識装置
JPH09231212A (ja) 自立語判別方法
JPH04256159A (ja) かな漢字変換装置
JPH0546612A (ja) 文章誤り検出装置
JPH09167156A (ja) かな漢字変換システムおよびかな漢字変換方法
JPH11238061A (ja) 日本語テキスト解析方法
JPH05282290A (ja) 文章作成支援装置
JPH01205371A (ja) 仮名漢字変換装置
JPH0468466A (ja) かな漢字変換装置
JPH0267676A (ja) 漢数字変換処理装置
JPH07129577A (ja) 文書校正支援装置
JPH01128157A (ja) 日本語文書作成装置