JPH0844730A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0844730A
JPH0844730A JP7135870A JP13587095A JPH0844730A JP H0844730 A JPH0844730 A JP H0844730A JP 7135870 A JP7135870 A JP 7135870A JP 13587095 A JP13587095 A JP 13587095A JP H0844730 A JPH0844730 A JP H0844730A
Authority
JP
Japan
Prior art keywords
word
kana
phrase
input
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7135870A
Other languages
English (en)
Inventor
Yasuo Koyama
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP7135870A priority Critical patent/JPH0844730A/ja
Publication of JPH0844730A publication Critical patent/JPH0844730A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 該当単語辞書にない場合、最低限の対応によ
り残る文字列をできる限り有効に解析処理し、再入力動
作を最低限におさえ、経済的な入力を可能とするかな漢
字変換装置を提供する。 【構成】 キー入力等により入力された日本語かな文章
を自動的に文節区切りを行ない複数文節を解析して文節
単位に候補を確定していく構成とする。さらに、この構
成に、文節末に位置する語が文節末語として適当である
か否か判定する文節候補展開手段3と、該文節候補展開
手段3により文節末語として適当でないと判定された語
を抜き出し残りの入力文字列の解析を続行させるための
不定語発生手段6とを設けた構成とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、カナコードで入力され
た日本語文章をかな漢字混じり文に変換して出力する、
かな漢字変換装置に関する。
【0002】
【従来の技術および発明が解決しようとする課題】従来
のかな漢字変換装置においては、国語辞書を検索し、該
当単語のない場合、あるいは、文法チェックにより、該
当データがすべてエラーになった場合、かな漢字変換処
理すべてをエラーとして無効にしていた。しかし、この
ような場合、オペレータの誤操作による不定なデータが
混じった場合も多く、特に複数文節変換等を行なう場合
は、長いかな文字列を入力しており、1入力文字のミス
で総てをエラーにする事は、非常に不経済であった。
【0003】本発明は、この様な問題に鑑み、該当単語
辞書にない場合、最低限の対応により残る文字列をでき
る限り有効に解析処理し、再入力動作を最低限におさ
え、経済的な入力を可能とするかな漢字変換装置を提供
することを目的とする。
【0004】
【課題を解決するための手段】本発明の特徴は、キー入
力等によって入力された日本語かな文章を漢字かな混じ
り文に変換する装置において、該当単語が国語辞書にな
い場合、1文字のかな不定語文節を自動的に生成し、の
こる文字列を有効として、解析を行なう事を特徴とす
る。
【0005】
【実施例】ここで、以下に本発明の詳細を図示した実施
例に基づいて説明する。図1は本発明のかな漢字変換装
置の一実施例を示す概略ブロック図である。図中符号1
は、キーボード等によるデータ入力部である。このデー
タ入力部1で入力されたデータのうち、かなデータのみ
が、かな文字文章受取格納部2に蓄積され、データ入力
部1による解析開始の制御情報により、文節候補展開手
段3が、かな桁位置1桁目より、それを基点として、国
語辞書検索手段4により、国語辞書5を索引し、文節候
補展開手段3が、文節候補格納部7に文節候補を格納
し、この際、文節末となる候補の終り桁位置も格納す
る。
【0006】そして、基点のかな桁位置に1を加算し、
つぎの基点による解析に入るが、この時、この基点以後
に文節末となる桁位置がない場合は、不定語発生手段6
により、1桁のかな不定語文節を発生しこの桁を文節末
とする。この様にして、文節候補が展開され、文節候補
バッファ8に格納されたら、文節候補接合検定手段9が
文法チェック部10により、文法情報をチェックし、文
法エラーデータは、文節候補バッファ8内のデータにエ
ラーフラグを立てる。
【0007】さらにこの処理が終了したら、文書候補再
編集手段11が文節候補バッファ8のデータに対して、
不定語無しで、全体の結合状態が保てるかを検定し、そ
れが可能であれば、不定語データをエラーとして文書候
補接合検定手段9によりエラーとなったデータと共に削
除し、有効データを文節候補バッファ8に再編成する。
【0008】これらの一連の作業が終了すると、文節候
補出力手段12が、再編成された文節候補バッファ8の
データを、CRTなどに出力する。
【0009】次に図2のフローチャートを用いて図1の
実施例の動作をさらに詳細に説明する。
【0010】まず、データ入力部1により入力されかな
文字文章受取格納部2に蓄積されているかな文字列の桁
位置を示すかな文字桁位置ポインタ(図示せず)の値が
1にセットされる(<1>)。次に、かな文字桁位置ポ
インタと入力されたかな文字列の桁数が比較され(<2
>)、かな文字桁位置ポインタの値が、入力かな文字列
の値以下なら<3>の処理となり、入力かな文字列の値
よりかな文字列ポインタの値が大きくなると後述の<1
0>以下の処理となる。
【0011】<3>においては、国語辞書検索手段4が
国語辞書5を索引してさらに文節候補展開手段3が文節
候補格納部7に文節候補を格納し、その際、文節末とな
る候補の終わり桁位置も格納する。この点について図3
を用いてさらに詳しく説明する。
【0012】図3において30は、データ入力部1より
入力されたかな文字列であり、31は、その桁位置に対
応した文節末桁テーブルであり、文末の語が存在する桁
位置に対応した場所にフラグが立つものである。
【0013】今、例を挙げて説明すると、まず、「わた
し」という自立語が見つけられて、(正確には、わ
(輪)という自立語があるが説明の都合上、わたしでも
って説明する。)、その後に続く語尾として「は」が見
つけられ、「わたしは」という語が切り出される。そし
て、この文節末が正しいか、文節候補展開手段3によっ
て検定され、今の場合のように文節末として正しい語が
続いている場合には対応する桁位置の文節末桁テーブル
にフラグを立てる。しかし、例えば、「は」の換わりに
「ん」が入力されている場合には、文節末の検定によっ
てこの文節末の語は正しくないと判定され、文節末桁テ
ーブルにはフラグはたたない。
【0014】次に再び図2のフローチャートに戻り動作
の説明を続ける。<3>の後、次に切り出された自立語
等の語幹からみて最も近い後方の文節末位置(図3の例
でいうなら「は」の位置)に文節末テーブルフラグがた
っているか調べられ(<4>)、もし、フラグが立って
いれば、そのフラグの立っている桁位置に1つ加算した
値をかな文字桁位置ポインタの値とし(<5>),<2
>の処理にもどる。又、<4>の処理においてフラグが
立っていない場合には、不定語発生手段6によって1文
字の不定語が発生される(<6>)。すなわち、本来な
らフラグが立っているべき桁位置にあるかな文字が不定
語とされる。<6>の後ではかな文字桁位置ポインタの
値は、それまでの値(不定語の桁位置を示している。)
に+1加算した値となり(<7>)、さらにその後<2
>の処理にもどる。
【0015】又、<2>の処理においてかな文字桁位置
ポインタの値がかな文字列の入力桁数を越えている場合
には、次に文章末の語が文末の語として正しいかどうか
が判定され(<10>)、正しくない場合には文末の語
を不定語にして(<11>)処理を終了し、正しい場合
にはそのまま終了する。
【0016】図4は、図1における文書候補展開手段3
により不定語発生手段6で不定語が候補として発生した
例である。例として比較的ミス入力してしまうケースで
「きょうはてんきが」と入力すべきところを「きょぅは
てんきが」と入力されてしまった場合をあげている。
【0017】ただし、この時使用した国語辞書には、便
宣上記入されているものだけが登録されているものとす
る。この場合は、第2,3文字目の「ょ」と「ぅ」が不
定語として1文字単位に発生している。これによると、
前半の「きょうは」に相当する「きょぅは」の解析に失
敗しているが、後半の「てんきが」に相当する部分の解
析には、成功している事がわかる。
【0018】
【発明の効果】以上説明したように本発明によれば、文
節候補展開手段が文節末の語を検定しその語が文節末語
として正しくないと判定された時には、その語を不定語
発生手段が不正語として文節候補格納部に格納する構造
をとるので、入力のミスあるいは、国語辞書の不備によ
り、かな漢字入力データの1部の解析に失敗しても、全
入力を無効とし、再入力をする必要がなく、最低限の損
害で解析を行なえ、かつ単純な構造により装置の負担も
少ないという効果がある。特に、かなデータを多量に蓄
積して、一括で解析する場合は、途中で文章の全体又
は、一部が解析不能とならず最低限は、解析でき有効で
ある。
【図面の簡単な説明】
【図1】本発明のかな漢字変換装置の1実施例の概略を
示す機能ブロック図である。
【図2】この実施例の動作のブロックフローチャートで
ある。
【図3】図2のブロックフローチャートの一部をさらに
詳細に説明するための図である。
【図4】本発明の適用された、具体的な文節候補展開例
である。
【符号の説明】
3・・・・・・文節候補展開手段 6・・・・・・不定語発生手段
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成7年6月7日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項1
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0004
【補正方法】変更
【補正内容】
【0004】
【課題を解決するための手段】本発明のかな漢字変換装
置は、キー入力等により入力されたかな文字列について
複数文節を解析し、かな漢字変換を行なうかな漢字変換
装置において、前記入力されたかな文字列に基づき辞書
を検索して文節候補を生成する文節候補生成手段と、該
生成された文節候補と、該文節候補の後部であって該文
節候補の属する文節の区切り位置に位置する文節末語と
の接続を文法的に解析する文節末語検定手段と、該文節
末語検定手段により前記接続が文法的に正しいと判定さ
れたとき、前記入力されたかな文字列の各桁位置に対応
した記憶エリアの内、前記文節末語の桁位置に対応した
記憶エリアにフラグを立てるフラグ発生手段と、前記文
節末語の桁位置に対応した記憶エリアに前記フラグが立
っているか否かを判定するフラグ判定手段と、該フラグ
判定手段により前記フラグが立っていないと判定された
とき、前記文節末語の桁位置に対応する語を不定語とし
て抜き出す不定語発生手段とを備えることを特徴とす
る。
【作用】以上のように構成された本発明のかな漢字変換
装置は、文節候補と文節末語との接続を、文節末語検定
手段により文法的に解析し、その接続が文法的に正しい
と判定されると、フラグ発生手段により、記憶エリアの
内のその文節末語の桁位置に対応した位置にフラグを立
てる。そして、そのフラグが立っているか否かを、フラ
グ判定手段により判定し、フラグが立っていないと判定
されると、文節末語の桁位置に対応する語を不定語とし
て抜き出す。このため、ごく少数の語句の組合せについ
てのみ調べ、その結果をフラグから知ることで、不定語
が抽出できる。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0018
【補正方法】変更
【補正内容】
【0018】
【発明の効果】以上説明したように本発明によれば、
成された文節候補と、該文節候補の後部であって該文節
候補の属する文節の区切り位置に位置する語との接続を
文法的に解析し、その結果をフラグを利用することによ
り知ることで不定語を抜き出すので、不定語の抽出が簡
単かつ、短時間に行なえる。また、文法的な解析に基づ
いているので、誤入力の結果、文法的には接続しない単
語の羅列(例えば、「わたしあ」の様に個々の単語は辞
書に有るケース)となった場合でも不定語の抽出が可能
となる。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 キー入力等により入力された日本語かな
    文章を自動的に文節区切りを行ない複数文節を解析して
    文節単位に候補を確定していくかな漢字変換装置におい
    て、文節末に位置する語が文節末語として適当であるか
    否か判定する文節候補展開手段と、該文節候補展開手段
    により文節末語として適当でないと判定された語を抜き
    出し残りの入力文字列の解析を続行させるための不定語
    発生手段とから成ることを特徴とするかな漢字変換装
    置。
JP7135870A 1995-05-08 1995-05-08 かな漢字変換装置 Pending JPH0844730A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7135870A JPH0844730A (ja) 1995-05-08 1995-05-08 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7135870A JPH0844730A (ja) 1995-05-08 1995-05-08 かな漢字変換装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP59194307A Division JPH0630098B2 (ja) 1984-09-17 1984-09-17 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH0844730A true JPH0844730A (ja) 1996-02-16

Family

ID=15161701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7135870A Pending JPH0844730A (ja) 1995-05-08 1995-05-08 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0844730A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS576623A (en) * 1980-06-11 1982-01-13 Hiroaki Kataoka Post
JPS5880726A (ja) * 1981-11-06 1983-05-14 Nec Corp 和文情報入力装置
JPS5880771A (ja) * 1981-11-06 1983-05-14 Mitsubishi Electric Corp かな漢字変換処理装置
JPS58175074A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 構文分析方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS576623A (en) * 1980-06-11 1982-01-13 Hiroaki Kataoka Post
JPS5880726A (ja) * 1981-11-06 1983-05-14 Nec Corp 和文情報入力装置
JPS5880771A (ja) * 1981-11-06 1983-05-14 Mitsubishi Electric Corp かな漢字変換処理装置
JPS58175074A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 構文分析方式

Similar Documents

Publication Publication Date Title
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JP2004038976A (ja) 用例ベースの機械翻訳システム
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
US5079701A (en) System for registering new words by using linguistically comparable reference words
JPH0844730A (ja) かな漢字変換装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JPH0630098B2 (ja) かな漢字変換装置
JPH07244669A (ja) 文書検索方式
JPH01114976A (ja) 文書処理装置の辞書構造
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JPS63118868A (ja) 日本語文章校正装置
JPH0531186B2 (ja)
JP2798683B2 (ja) 自然言語処理システム
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JP2951486B2 (ja) 漢字変換装置
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH05225232A (ja) テキスト自動前編集装置
Zupeng et al. An improved approach for Chinese parsing
JPH11282837A (ja) 日本語形態素解析装置、日本語形態素解析方法および記録媒体
JPH0687239B2 (ja) 文字処理装置
JPH0388066A (ja) 日本文誤り自動検出・訂正装置
JPH06332938A (ja) 自然言語解析装置および機械翻訳装置
JPH05342260A (ja) 単語綴りチェック装置
JPH0836575A (ja) 統語解析装置
JP2001202365A (ja) 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体