JPH02150956A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH02150956A
JPH02150956A JP63304655A JP30465588A JPH02150956A JP H02150956 A JPH02150956 A JP H02150956A JP 63304655 A JP63304655 A JP 63304655A JP 30465588 A JP30465588 A JP 30465588A JP H02150956 A JPH02150956 A JP H02150956A
Authority
JP
Japan
Prior art keywords
word
kana
clause
phrase
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63304655A
Other languages
English (en)
Other versions
JP3049502B2 (ja
Inventor
Yasuo Koyama
小山 泰男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP63304655A priority Critical patent/JP3049502B2/ja
Publication of JPH02150956A publication Critical patent/JPH02150956A/ja
Application granted granted Critical
Publication of JP3049502B2 publication Critical patent/JP3049502B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、かな文字列を受は取り、かな漢字混り文に変
換するかな漢字変換装置に関する。
[従来の技術] 従来の技術では、かな漢字変換を行ない、文節候補を選
択し確定した結果を学習する場合、文節単位に自立語の
使用頻度情報を積算し、この頻度の高い単語を優先的に
候補とするか、あるいは最も最近使用した単語を最初の
候補とするという単語学習は一般に行なわれている。
さらに、文節区切りを学習するため2文節を対にして見
出しを付け、文節学習辞書とし、かな漢字変換の際これ
を自立語辞書と同様に参照し、文節学習辞書の内容を優
先して文節区切りを行っていた。
例えば、かな文字列「ごく9つのだいがく」の文節区切
りの候補が「国立の/大学」「国立のだ/医学」と2通
り存在し、かな漢字変換装置が何の文節学習情報がなけ
れ―後者を採用する場合で、オペレータが文節区切りを
変更し「国立の/大学」を選択し確定すると文節学習辞
書に「ごく9つのだいがく=国立の/大学」と登録し、
次に「こく9つのだいがく」と入力されたならば、かな
漢字変換装置は文節学習辞書を参照し「国立の/大学」
という文節区切りを採択するという方法である。
[発明が解決しようとする課題] 従来の技術では、2文節をそのまま登録するため、これ
に何らかの付属語の結合は許されず、前の例をとれば、
「ごく9つのだいがく=国立の/大学」が登録された場
合、次に「こくりつのだいかくにゆく」と入力された場
合、文節学習辞書の内容を優先に採択すれば「国立の/
大学/荷/行く」となり、そうでなければ「国立のだ/
医学に/行く」とまったく文節学習辞書の内容が反映さ
れない結果となってしまう。
また「こく9つのだいがく=国立の/大学」は学習され
ていても、自立語が同一で付属語の違う組み合わせ例え
ば「こく9つもだいかく」を変換する場合には全く適用
できず「国立もだ/医学」と変換されてしまうという問
題点があった。
本発明は、上記欠点を解消し、変換効率の良いかな漢字
変換装置を提供する事を目的とする。
[課題を解決する為の手段] これらの問題を解決する為、本発明は、入力されたかな
文字を受は取るかな受取部、かな漢字変換に用いる自立
語辞書、付属語辞書、単語の結合の可否を検定するため
の単語結合テーブル、文節間の結合の強度を検定する文
節コストテーブル、自立語辞書、付属語辞書、単語結合
テーブル、文節コストテーブル、単語間学習辞書を利用
してかな文字列をかな漢字混り文字列に変換するかな漢
字変換部、かな漢字変換中に単語候補を格納する単語候
補格納部、かな漢字変換結果を文節候補選択のため一時
格納しておく文節候補格納部、文節候補を選択する候補
選択部、文節区切りが間違った場合オペレータの文節区
切り位置の修正情報をかな漢字変換に通知し、これに適
合する文節候補を再度作成せしめる文節区切り変更部、
所望のかな漢字変換結果を得たならば確定し出力部に出
力する漢字出力部、確定結果に基づき文節単位に確定さ
れた自立語を自立語辞書における同一見出し単語の先頭
に位置付けると共に、単語間学習辞書に2文節間の情報
を格納する変換結果学習部と2文節間の付属語(助詞、
助動詞、活用語尾、補助用言)を除く自立語部分を対に
して単語間の結合情報として、これを格納する事を特徴
とする。
[作用] 本発明の場合、キーボード等の入力装置より入力された
、べた書きかな文字列をかな漢字混り文に変換し、出力
部に出力するかな漢字変換装置において、まずかな受取
部がかな文字列を受は取る。
このかな文字列をかな漢字変換部が受は取り、自立語辞
書と付属語辞書を検索しながら、単語候補を単語候補格
納部に格納し、これを基に自立語と付属語が結合するか
否かを単語結合テーブルにより検定し、自立語に対し結
合するすべての付属語ならびに、その付属語に結合しう
る付属語にいたるまで自立語+付属語群を形成し文節に
組み上げ文節候補格納部に格納する。
文節コストテーブルには2文節間の結合の強度を指定す
るため共起性に基づく接合コスト(例えば0〜2)が登
録されている。文節候補は自文節コスト(例えば2)と
先頭文節から自文節までの文節コストの和より接合コス
トの和を引いた最少の値(以降総コストとい・う)とを
持っている。総コストは、当該文節の前に付く文節に自
文節コストを加え、接合コストを引くと共に、単語間学
習辞書を検索し、連接する2文節の自立語が一致した場
合は、最も接合しやすいと判断し、さらに学習コスト(
例えば2)を引いた最少の値を総コストとする。またこ
こで学習コストを引いた文節候補には、学習マークを付
ける。
かな漢字変換部は、文節候補をすべて作成し終わると、
最終文節の総コストが最少の文節を最終文節とする接合
可能な文節列の文節区切りをかな漢字変換の結果として
認識する。ここで同一コストで複数の文節区切りが存在
した場合は、学習マークの付いた文節を含む文節区切り
を採用する。これでも特定できない場合は、最初に作成
された文節区切りを採用する。
文節区切りができあがったら、文節区切り単位に同音異
字語を選択するため候補選択部は、当該文節区切りに基
づき第1文節候補群を表示部に表示し、オペレータの指
示に従い文節候補格納部から当該文節の前候補・次候補
を表示する。オペレータは、これにより文節単位に同音
異字語を選択し、所望のかな漢字文字列を確定するが、
文節区切りそのものが所望のものでない場合は、オペレ
ータは文節区切り変更部により文節区切り位置を変更す
る。文節区切り変更部は文節区切りが変更されると、位
置の修正情報をかな漢字変換に通知する。
かな漢字変換部は、文節候補格納部より、これに適合す
る文節候補を検索するが、存在しない場合は、当該文節
区切りを1文節とするよう自立語辞書と付属語辞書を検
索し、最初の変換と同様に単語結合テーブルを用いて文
節候補を作成し、再度文節区切りを作成し、候補選択部
に新たな文節区切りによる文節候補を選択せしめるよう
指示を与え、候補選択部により、オペレータは新たな文
節候補による文節候補選択を行うことになる。
ここで所望の文節候補を得たならば確定し、漢字出力部
は、指定された文節候補を1文章として出力部に出力す
る。この時、変換結果学習部は確定されたの文節候補群
をかな漢字変換部より受は取り、2文節単位に前文節の
自立語と後文節の自立語をセットにして、各々の自立語
の見出しをもつ状態で単語間学習辞書に登録する。すな
わち、[前文節自立語見出し]+c後文節自立語見出し
]+[前文節自立語]+[後文節自立語]という形式で
登録する([]で区切られる部分はセパレータなどで完
全に区切れるものとする。)[実施例] ここで、以下に本発明の詳細を示した実施例に基づいて
、説明する。
第1図は、本発明のかな漢字変換装置を示す図である。
図中符号1は入力部2より入力されたデータに基づきシ
ステム全体の制御を行う中央処理装置(CPU)である
。このCPUにより総ての装置の制御がおこなわれ、入
力部2と出力部3はCPUIと入出力制御部5により段
階的に制御される。
入力部2で入力された仮名文字列はべた書きで変換部6
に送られ、変換部6では、まず、がな受取部9により入
力部2から入力されたかな文字を受は取り、かな漢字変
換部8に送る。
かな漢字変換部8はこのがな文字列に基づき、自立語辞
書12と付属語辞書11を検索しながら、単語候補を単
語候補格納部10に格納し、これを基に自立語と付属語
が結合するか否かを単語結合テーブル14により検定し
、自立語に対し結合するすべての付属語、ならびに、そ
の付属語に結合しうる付属語にいたるまで自立語+付属
語群を形成し文節に組み上げ文節候補格納部9に格納す
る。
文節コストテーブル15には2文節間の結合の強度を指
定するため共起性に基づく接合コスト(あらかじめO〜
2に分類しておく。)が登録されている。文節候補は自
文節コスト(2とする。)と先頭文節から自文節までの
文節コストの和より接合コストの和を引いた最少の値(
以降総コストという)とを持っている。総コストは、当
該文節の前に付く文節に自文節コストを加え、接合コス
トを引くと共に、単語間学習辞書13を検索し、連接す
る2文節の自立語が一致した場合は、最も接合しやすい
と判断し、さらに学習コスト(2とする。)を引いた最
少の値を総コストとする。またここで学習コストを引い
た文節候補には、学習マークを付ける。
かな漢字変換部8は、文節候補をすべて作成し終わると
、最終文節の総コストが最少の文節を最終文節とする接
合可能な文節列の文節区切りをかな漢字変換の結果とし
て認識する。ここで同一コストで複数の文節区切りが存
在した場合は、学習マークの付いた文節を含む文節区切
りを採用する。
これでも特定できない場合は、最初に作成された文節区
切りを採用する。
文節区切りができあがったら、文節区切り単位に同音異
字語を選択するため候補選択部18は、当該文節区切り
に基づき第1文節候補群を表示部4に表示し、オペレー
タの指示に従い文節候補格納部9から当該文節の前候補
・次候補を表示する。
オペレータは、これにより文節単位に同音異字語を選択
し、所望のかな漢字文字列を確定するが、文節区切りそ
のものが所望のものでない場合は、オペレータは文節区
切り変更部17により文節区切り位置を変更する。文節
区切り変更部17は文節区切りが変更されると、位置の
修正情報をかな漢字変換8に通知する。
かな漢字変換部8は、文節候補格納部9より、これに適
合する文節候補を検索し、再度文節区切りを作成するが
、存在しない場合は、当該文節区切りを1文節とするよ
う自立語辞書12と付属語辞書11を検索し、最初の変
換と同様に単語結合テーブル14を用いて文節候補を作
成し、再度文節区切りを作成し、候補選択部18に新た
な文節区切りによる文節候補を選択せしめるよう指示を
与え、候補選択部18により、オペレータは新たな文節
候補による文節候補選択を行うことになる。
ここで所望の文節候補を得たならば確定し、漢字出力部
19は、指定された文節候補を1文章として出力部3に
出力する。この時、変換結果学習部16は確定されたの
文節候補群をかな漢字変換部8より受は取り、2文節単
位に前文節の自立語と後文節の自立語をセットにして、
各々の自立語の見出しをもつ状態、すなわち[前文節自
立語見出し] [かな区切りマーク][後文節自立詔見
出し] [見出し終了マーク] [前文節自立語] [
漢字区切りマーク][後文節自立語] [1単語間学習
データ終了マーク]というレコード形式で単語間学習辞
書13に登録する。
第2図は、本発明のかな漢字変換装置の単語間学習辞書
に何も登録されていない場合の変換例である。図中20
は入力がな文字列であり、21はその桁位置、22は自
文節コスト、23は総コスト、24は文節候補文字列と
する。
かな第1桁より自立語辞書、付属語辞書を検索し順次文
節候補を作成してゆくと図のようなコスト付けがなされ
る。また、ここでは当該桁位置の文節候補の前候補とな
る文節でかつ結合可能で最少コストとなるものと当該位
置の文節候補との連接を行い、それ以外の文節とは連接
させない。したがって、当該桁位置の文節候補の前候補
となる文節でかつ結合可能で最少コストとなるもの以外
の文節は、当該文節の成文節には何ら影響を与えないこ
とになる。
第2図によれば、最終文節の最低コストの文節候補を採
用するためr本屋がよ/異本を」が採択される。ここで
オペレータが文節区切り変更を行い「本屋が/良い7本
を」という文節区切りを得、この文節候補で確定したと
する。この場合、文節間学習辞書には、「本屋−良い」
「良い一本」とが共起しやすいとの情報が記憶される。
第3図は、本発明のかな漢字変換装置の単語間学習辞書
に図中31.32の情報が登録されている場合の変換例
である。
この場合、33のr本屋が−良い」の結合時の総コスト
計算と、34の「良い一本」の結合時の総コスト計算で
各々学習コスト2が引かれ総コストが低くなっている。
これにより最終文節の最低コストの文節候補を採用する
ためr本屋が/良い7本を」が採択される。
第4図は、本発明のかな漢字変換装置の単語間学習辞書
に、第3図の31.32と同じ図中41゜42の情報が
登録されており、入力文字列の4桁目が異なる場合の変
換例である。
この場合、図3と同様に43の「本屋は−良い」の結合
時の総コスト計算と、44の「良い一本」の結合時の総
コスト計算で各々学習コスト2が引かれ総コストが低く
なっている。これにより最終文節の最低コストの文節候
補を採用するためr本屋は/良い7本を」が採択され、
単語間学習辞書に登録する元になった文章と異なる文章
に対しても単語間学習辞書の内容が効力を発している事
を示す。
[発明の効果] 本発明は、次のような効果がある。
(1)文節間の共起性を学習するために、2文節間の自
立語のみに着目しているため、付属語の変化にも耐え得
る文節学習を行える。
(2)文節間の共起性を学習するために、2文節間の自
立語のみに着目し、付属語の変化にも耐え得る文節学習
を行えるため、より自然なかな漢字変換が行え、的中率
が向上する。
(3)文節間の共起性を学習するために、2文節間の自
立語のみに着目した単語間学習辞書を持つことによりよ
り単純な方法で文節学習を行え処理速度が速い。
【図面の簡単な説明】
第1図は、本発明の文節変換装置を示すプロヅク図であ
る。 第2図は、本発明のかな漢字変換装置の単語間学習辞書
に何も登録されていない場合の変換例を示す図である。 第3図は、本発明のかな漢字変換装置の単語間学習辞書
に有効な情報が登録されている場合の変換例を示す図で
ある。 第4図は、第3図の単語間学習辞書と同じ情報で、第3
図の入力文字列と若干異なる文字列を入力した場合の変
換例を示す図である。 13 ・ 16 ・ ・単語間学習辞書 ・変換結果学習部 以 上 出願人  セイコーエプソン株式会社

Claims (1)

    【特許請求の範囲】
  1. キーボード等の入力装置より入力された、べた書きかな
    文字列をかな漢字混り文に変換し、出力部に出力するか
    な漢字変換装置において、入力されたかな文字を受け取
    るかな受取部、かな漢字変換に用いる自立語辞書、付属
    語辞書、単語の結合の可否を検定するための単語結合テ
    ーブル、文節間の結合の強度を検定する文節コストテー
    ブル、自立語辞書、付属語辞書、単語結合テーブル、文
    節コストテーブル、単語間学習辞書を利用してかな文字
    列をかな漢字混り文字列に変換するかな漢字変換部、か
    な漢字変換中に単語候補を格納する単語候補格納部、か
    な漢字変換結果を文節候補選択のため一時格納しておく
    文節候補格納部、文節候補を選択する候補選択部、文節
    区切りが間違った場合オペレータの文節区切り位置の修
    正情報をかな漢字変換に通知し、これに適合する文節候
    補を再度作成せしめる文節区切り変更部、所望のかな漢
    字変換結果を得たならば確定し出力部に出力する漢字出
    力部、確定結果に基づき文節単位に確定された自立語を
    自立語辞書における同一見出し単語の先頭に位置付ける
    と共に、単語間学習辞書に2文節間の情報を格納する変
    換結果学習部とを有し、前記単語辞書は2文節間の付属
    語(助詞、助動詞、活用語尾、補助用言)を除く自立語
    部分を対にして単語間の結合情報として格納することを
    特徴とするかな漢字変換装置。
JP63304655A 1988-12-01 1988-12-01 かな漢字変換装置 Expired - Lifetime JP3049502B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63304655A JP3049502B2 (ja) 1988-12-01 1988-12-01 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63304655A JP3049502B2 (ja) 1988-12-01 1988-12-01 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPH02150956A true JPH02150956A (ja) 1990-06-11
JP3049502B2 JP3049502B2 (ja) 2000-06-05

Family

ID=17935639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63304655A Expired - Lifetime JP3049502B2 (ja) 1988-12-01 1988-12-01 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JP3049502B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58166435A (ja) * 1982-03-29 1983-10-01 Fujitsu Ltd 確率マトリツクスを用いたカナ漢字変換方式
JPS60189069A (ja) * 1984-03-08 1985-09-26 Matsushita Electric Ind Co Ltd かな漢字変換装置
JPS60235271A (ja) * 1984-05-08 1985-11-21 Toshiba Corp かな漢字変換装置
JPS62121570A (ja) * 1985-11-22 1987-06-02 Fujitsu Ltd 接続確率に基づく連文節変換処理方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58166435A (ja) * 1982-03-29 1983-10-01 Fujitsu Ltd 確率マトリツクスを用いたカナ漢字変換方式
JPS60189069A (ja) * 1984-03-08 1985-09-26 Matsushita Electric Ind Co Ltd かな漢字変換装置
JPS60235271A (ja) * 1984-05-08 1985-11-21 Toshiba Corp かな漢字変換装置
JPS62121570A (ja) * 1985-11-22 1987-06-02 Fujitsu Ltd 接続確率に基づく連文節変換処理方式

Also Published As

Publication number Publication date
JP3049502B2 (ja) 2000-06-05

Similar Documents

Publication Publication Date Title
JP2000298667A (ja) 構文情報による漢字変換装置
JPH02150956A (ja) かな漢字変換装置
JPS6210763A (ja) 仮名漢字変換処理装置
JP2862236B2 (ja) 文字処理装置
JPS5832418B2 (ja) 漢字まじり文入力装置
JPH03129568A (ja) 文書処理装置
JPS63106070A (ja) 中文入力方式
JPS6061822A (ja) 仮名漢字変換装置
JPS608922A (ja) 日本語処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JPS59161722A (ja) 文字処理装置
JPS62154022A (ja) 音声タイプライタ
JPH07141349A (ja) かな漢字変換装置
JPS63173156A (ja) 言語情報提供装置
JPH01274272A (ja) 中国語の語音区切方式および語音漢字変換方式
JPH0465753A (ja) かな漢字変換装置
JPS62271175A (ja) 辞書補正方式
JPH03296856A (ja) 文書処理装置
Saitō Genchō-hishi Zenshaku [Annotations to The Secret History of the Mongols]. By Shigeo Ozawa. Tokyo: Kazama-shobō. Vol. 1: 1984, xiv, 504, ii pp.¥ 20,000. Vol. 2: 1985, x, 532 pp.¥ 19,000. Vol. 3: 1986, x, 596 pp.¥ 26,000.-Genchō-hishi Zenshaku Zokkō [Sequel to Annotations to The Secret History of the Mongols]. By Shigeo Ozawa. Tokyo: Kazama-shobō. Vol. 1: 1987, x, 630 pp.¥ 24,000. Vol. 2: 1988, x, 538 pp.¥ 24,000. Vol. 3: 1989, x, 732 pp.¥ 27,000.
JPS6057425A (ja) カナ漢字変換処理装置
JPS63214872A (ja) かな漢字変換方式
JPS6365566A (ja) カナ漢字変換装置
JPS6175472A (ja) かな漢字変換装置
JPH0798702A (ja) 文書作成装置
JPS6339075A (ja) 質問応答システムの日本語入力処理方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080331

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090331

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090331

Year of fee payment: 9