JPH0827795B2 - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0827795B2
JPH0827795B2 JP61096291A JP9629186A JPH0827795B2 JP H0827795 B2 JPH0827795 B2 JP H0827795B2 JP 61096291 A JP61096291 A JP 61096291A JP 9629186 A JP9629186 A JP 9629186A JP H0827795 B2 JPH0827795 B2 JP H0827795B2
Authority
JP
Japan
Prior art keywords
phrase
kana
candidate
combination
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61096291A
Other languages
English (en)
Other versions
JPS62251960A (ja
Inventor
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP61096291A priority Critical patent/JPH0827795B2/ja
Publication of JPS62251960A publication Critical patent/JPS62251960A/ja
Publication of JPH0827795B2 publication Critical patent/JPH0827795B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、カナコードで入力された日本語文章をかな
漢字混じり文に変換して出力するかな漢字変換装置に関
する。
〔従来の技術〕
従来のキー入力等により入力された日本語かな文章に
対して自動的に文節区切りを行ない、複数文節を解析し
文節単位に候補を確定していく事を特徴とするかな漢字
変換装置においては文節を(自立語+付属語)等と仮定
し自立語の単語の長さを最長とする候補を次々と確定し
ていく方法(最長一致法)あるいは、単語の候補総てを
洗い出しその接合を検定し文節数が最小となる単語の並
びを総て候補とする方法(文節数最小法)などの方法が
とられていた。
前者の場合は、自立語の長さが最長のものが候補とな
り易いという経験則に基づいている為の誤変換の可能性
が高い事と文節を文の先頭から確定していく為、解析に
失敗した場合のバック・トラッキング(誤った地点まで
後戻りして解析をし直す事)に時間がかかる為、実際に
は多くのかな漢字変換装置において、バック・トラッキ
ングを行なわず、無理やり自立語を当てはめるなどの事
による誤変換が高い事などの不都合が多く、後者の場合
は全単語を基本的には展開する必要がある為莫大な辞書
検索を必要とし、特に付属語が助詞、助動詞単位等短区
間で登録されている場合は、この傾向が特に顕著であ
り、処理時間が長くなるという不都合があった。
かな漢字変換は、使用者がより高速に誤変換の少ない
かな漢字候補を求めるものであり、最初の候補をユーザ
ーの求める最も可能性の高い候補を出力し、その後はユ
ーザーの希望で再度解析をすれば良いという特徴を持
ち、入力とかな漢字変換処理とを同時平行的に行なわな
い場合、これらを2つに分割する事は可能である。
〔発明が解決しようとする問題点〕
前述の従来技術に対して、より誤変換の少ない第1候
補を、より高速に出力する為には、前記の様に、文節区
切りに誤りの少ない方法で文節区切りを行ない第1候補
文節列を出力し、その後に文節単位に解析を深める手段
が必要となる。
[問題点を解決するための手段および作用] 前述の問題点を解決するために、本発明は、次の構成
を採った。即ち、本発明は、 かな文字列を入力し、該かな文字列を辞書を参照して
変換するかな漢字変換装置であって、 前記入力されたかな文字列について、所定の解析によ
り文節区切りを行ない、「自立語」+「付属語」の組合
わせに従って前記かな文字列を構成する第1の語の組合
わせを得る文節区切手段と、 該文節区切手段により一旦区切られた文節の一つを指
定する文節指定手段と、 該指定された文節について、更なる候補の作成を指示
する候補作成指示手段と、 該候補作成指示手段により候補作成の指示がなされた
とき、前記指定された文節について、その内部を、前記
「自立語」+「付属語」とは異なる組合わせであって、
当該文節を構成し得る語の組合わせとして再解析し、新
たな語の組合わせを得る再解析手段と を備えたことを要旨とする。
このかな漢字変換装置は、入力されたかな文字列に対
し、まず所定の解析により文節区切りを行なって、「自
立語」+「付属語」の組合わせに従って第1の語の組み
合わせを得ておき、更なる文節候補の作成の指示がある
と、文節指定手段により指定された文節について、その
内部を、この「自立語」+「付属語」とは異なる組み合
わせであって、かつ当該文節を構成し得る語の組合わせ
として再解析し、新たな語の組合わせを得る。この新た
な語の組合わせは、「自立語」+「付属語」の組合わせ
が同一で異なる語候補(いわゆる次候補)とは全く異な
るものである。本発明では、更なる候補の作成が指示さ
れると、次候補とは別に、例えば「自立語」+「接尾
語」+「付属語」など、文法上の規則が異なる語の組合
わせを得るのである。
こうした再解析は、「自立語」+「付属語」として一
旦解析された文節内部を、接辞を含む語の組合わせとし
て再度解析するといった処理などを意味する。
〔実施例〕
ここで、以下に本発明の詳細を図示した実施例に基づ
いて説明する。
第1図は本発明のかな漢字変換装置の一実施例を示す
図である。図中符号1は入力部2(キーボード等)より
入力されたデータに基づき、システム全体の制御を行な
う中央処理装置である。入力部2により読み込まれた文
字列および制御コードは、かな漢字変換装置8に送られ
かな漢字変換が行なわれる。
かな文字入力部9により取り込まれた(401)かな文
字列は文節区切り部10により、辞書展開区分11におい
て、自立語辞書13及び付属語辞書12より単語候補を抽出
しながら単語検定語11により相互の連結の可能性を検定
しながら、単語間の連接によるコスト付けを行ないなが
ら、文節単位に候補を並べると共に文節末に対応した桁
単位の総合コストテーブルに該当桁で文節末となる文節
までの総コストの最小値を持ち、新たに候補として展開
された文節でこの値よりも総コストが大きいものを候補
としないという処理を行ない、最終的に文節の総コスト
の最小のバスを候補として、文節区切りが確定され、さ
らに、ここで作成された文節候補は、文節候補格納部17
に格納される(402)。
これらの解析が終了した段階で、かな漢字候補選択部
3により、表示要求が出され、文節候補格納部17より最
初の文節候補群が文節候補表示部4により、表示部5に
表示される。ユーザーは、かな漢字候補選択部3により
文節単位に、前候補・次候補を表示し、求めるかな漢字
文節を選択するが、ここで次候補を行なおうとして、当
該文節の次には、もはや文節候補が無い場合、再変換指
定部15に対して単文節変換要求を出すと単文節解析部16
は文節候補がどこまで展開したかを確認し、要求の都
度、文節を次の形態であると仮定し、順次解析結果を要
求の都度出力する(403)。
(1)自立語+接尾語+付属語 (2)接頭語+自立語+付属語 (3)接頭語+自立語+接尾語+付属語 これにより作成された文節候補は、文節候補格納部17
に文節区切りの位置に格納され、その第1候補は文節候
補表示部4により表示部5に表示されユーザーの選択を
待つ。
さらに、ユーザーは文節区切りそのものに誤りがある
場合は、再文節範囲指定部7で文節の長さを調整でき、
これにより指定された文節範囲で、再変換指定部15によ
り単文節変換が前記と同様に実施され、その候補は文節
候補格納部17に格納され、さらに、文節指定の残りのか
な文字列については、1つの文字列として再度この部分
に対して文節区切り部10で文節区切りを行ない、その候
補を文節候補格納部17に格納し、最新の文節区切りとす
る。
この様にして、文節の選択と再変換を繰り返して、ユ
ーザーは目的のかな漢字文字列を選択し、全部が求める
ものとなった段階で、文節候補確定部6により候補を確
定する。
第2図は、文節の粗区切りを行なう際の状態を示す図
であり、まず1桁目から文節の候補を文節の形式に組立
てた状態で作成し、全部が終了したら、その最長のもの
の次の桁、例では7桁目より解析を再開する。この様に
続けていくと図の様な候補群が展開でき、この場合でい
えば、「車ですら/箱を/運んでいる。」が候補とな
り、文節区切りは1−6,7−9,10−15,16となる。
第3図は、文節の候補が作成されたのちに再度単文節
解析を行なった場合の図であり、細い枠囲いが文節区切
り処理中に、文節を自立語+付属語と仮定して作成され
たものであり、この後1回目の再変換により、上気
(1)が適応され、文節を自立語+接尾語+付属語とし
た場合の図中の太い枠囲いの「木業」「具体化」が候補
として作成される。この場合「業」「化」は接尾語であ
る。又、以上の実施例では、当初の文節区切りにおい
て、極小値となるようにしたが、重み付けを変えて、や
れば極大値となるよう区切ってもよい。
また、この実施例を拡張して、文節区切りを一意に確
定せず、総ての最小コストの文節区切りを区切り情報と
して持ち、これをも切り換えるように変更した場合、更
にかな漢字変換の精度を向上することができる。
[発明の効果] 以上説明したように、本発明のかな漢字変換装置によ
れば、更なる候補作成の指示があると、既に得られた文
節の内部を、先に解析を行なった「自立語」+「付属
語」とは異なる組み合わせであって、かつ当該文節を構
成し得る語の組合わせとして再解析し、新たな語の組合
わせを得る。従って、同じ組み合わせで語候補のみ異な
るもの(いわゆる次候補)のみならず、異なる文節候補
(例えば接辞を含む文節候補など)を作成することがで
きる。この結果、一旦区切られた文節に対して、より多
種類の文節候補を作成でき、使用者の使い勝手を向上す
ることができる。
【図面の簡単な説明】
第1図は本発明のかな漢字変換装置の概略を示す機能ブ
ロック図である。 第2図は本発明における文節区切りを行なう場合の候補
作成の概略例を示す図である。 第3図は本発明における文節再変換を行なう場合の候補
作成の概略例を示す図である。 第4図は本発明の処理内容を示すフローチャートであ
る。 8……かな漢字変換装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】かな文字列を入力し、該かな文字列を辞書
    を参照して変換するかな漢字変換装置であって、 前記入力されたかな文字列について、所定の解析により
    文節区切りを行ない、「自立語」+「付属語」の組合わ
    せに従って前記かな文字列を構成する第1の語の組合わ
    せを得る文節区切手段と、 該文節区切手段により一旦区切られた文節の一つを指定
    する文節指定手段と、 該指定された文節について、更なる候補の作成を指示す
    る候補作成指示手段と、 該候補作成指示手段により候補作成の指示がなされたと
    き、前記指定された文節について、その内部を、前記
    「自立語」+「付属語」とは異なる組合わせであって、
    当該文節を構成し得る語の組合わせとして再解析し、新
    たな語の組合わせを得る再解析手段と を備えるかな漢字変換装置。
  2. 【請求項2】前記再解析手段は、当該文節を、接辞を含
    む語の組合わせとして解析する手段である請求項1記載
    のかな漢字変換装置。
JP61096291A 1986-04-25 1986-04-25 かな漢字変換装置 Expired - Lifetime JPH0827795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61096291A JPH0827795B2 (ja) 1986-04-25 1986-04-25 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61096291A JPH0827795B2 (ja) 1986-04-25 1986-04-25 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPS62251960A JPS62251960A (ja) 1987-11-02
JPH0827795B2 true JPH0827795B2 (ja) 1996-03-21

Family

ID=14160965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61096291A Expired - Lifetime JPH0827795B2 (ja) 1986-04-25 1986-04-25 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0827795B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2798683B2 (ja) * 1988-11-16 1998-09-17 株式会社リコー 自然言語処理システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5880771A (ja) * 1981-11-06 1983-05-14 Mitsubishi Electric Corp かな漢字変換処理装置
JPS60189069A (ja) * 1984-03-08 1985-09-26 Matsushita Electric Ind Co Ltd かな漢字変換装置

Also Published As

Publication number Publication date
JPS62251960A (ja) 1987-11-02

Similar Documents

Publication Publication Date Title
JPH0567144A (ja) 前編集支援方法およびその装置
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH0827795B2 (ja) かな漢字変換装置
JPS61166676A (ja) 文字処理装置における辞書作成方式
JPS62121570A (ja) 接続確率に基づく連文節変換処理方式
JP2634596B2 (ja) かな漢字変換装置
KR860000681B1 (ko) 한글/한자 워드프로 세서
JPH1115825A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH1063651A (ja) 中国語入力装置
JP2738386B2 (ja) 仮名漢字変換装置
JPH0610804B2 (ja) かな漢字変換装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH10307822A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPS6265162A (ja) かな漢字変換方法及び装置
JPS61198361A (ja) かな漢字変換装置
JPS61118869A (ja) かな漢字変換文章編集装置
JPH0528425B2 (ja)
JPS6336366A (ja) 仮名漢字変換装置
JPH0131229B2 (ja)
JPH0128977B2 (ja)
JPH03164859A (ja) かな漢字変換装置
JPS6243769A (ja) 仮名漢字変換装置
JPH05189413A (ja) かな漢字変換装置
JPH07160700A (ja) 文書処理方法及びその装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term