JPH0465751A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0465751A
JPH0465751A JP2178736A JP17873690A JPH0465751A JP H0465751 A JPH0465751 A JP H0465751A JP 2178736 A JP2178736 A JP 2178736A JP 17873690 A JP17873690 A JP 17873690A JP H0465751 A JPH0465751 A JP H0465751A
Authority
JP
Japan
Prior art keywords
kana
character string
words
kanji
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2178736A
Other languages
English (en)
Inventor
Hiroichi Yoshida
広市 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2178736A priority Critical patent/JPH0465751A/ja
Publication of JPH0465751A publication Critical patent/JPH0465751A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、日本語ワードプロセッサや日本語による文
書作成が可能なコンピュータなどの文書処理装置に用い
られ、入力されたかな文字列を漢字かな交じり文に変換
するかな漢字変換装置に関する。
(ロ)従来の技術 従来のかな漢字変換装置においては、一般に連文節と呼
ばれる複数の文節を一度にかな漢字変換する場合、辞書
に記憶された単語で読みが一致するものの内、最も長い
ものを採用するという、最長一致や、あるいは、適当な
位置に文節の区切を入れて、各文節について最長一致の
方法で該当する単語を選択するという、二文節最長一致
などの方法を用いてかな漢字変換を行うようにしている
(ハ)発明が解決しようとする課題 しかしながら、接尾語に関しては、はとんど無条件に名
詞に接続されるようになっており、それによって多くの
無意味語を作ったり、その結果、その文字以降の文節の
区切がずれてしまうといった不具合が生じることがある
この発明は、このような事情を考慮してなされたもので
、名詞に対して接尾語が付加可能であるかどうかを記憶
すると共に、接尾語が付加された場合の他の単語との接
続条件を記憶しておき、かな漢字変換時にはそれらを参
照してかな漢字変換を行い、接尾語が付加された場合の
無意味語への変換を防止するようにしたかな漢字変換装
置を提供するものである。
(ニ)課題を解決するための手段 第1図はこの発明の構成を示すブロック図である。
図に示すように、この発明は、漢字を含む多数の自立語
と接尾語からなる単語をその読み情報と共に記憶した辞
書手段101と、自立語に対する接尾語の付加条件をテ
ーブルとして記憶した付加条件記憶手段102と、単語
どうしの接続条件を記憶した接続条件記憶手段103と
、かな文字列を入力するための入力手段104と、入力
されたかな文字列を記憶する文字列記憶手段105と、
記憶されたかな文字列を文節単位に区切る解析手段10
6と、区切られた各文節に対応する単語を辞書手段10
1から読出す読出し手段107と、続出された単語につ
いての接尾語の付加の可否を付加条件記憶手段102に
記憶されたテーブルに基づいて判定すると共に接尾語が
付加された単語について接続条件記憶手段103に記憶
された接続条件を変更する変更手段108と、単語の接
続の可否を接続条件記憶手段103に記憶された接続条
件に基づいて判定する判定手段109と、判定手段10
9の判定に基づいて文字列記憶手段105に記憶された
かな文字列を漢字かな交じり文に変換する変換手段11
0を備えてなるかな漢字変換装置である。
なお、この発明において、辞書手段101、付加条件記
憶手段102及び接続条件記憶手段103としては、R
OMのような内部メモリや、フロッピーディスク装置、
磁気ディスク装置等の外部メモリが用いられる。
また、入力手段104としては、かな文字ダ1!の入力
が可能なキーボード装置やタブレット装置などが用いら
れる。
さらに、解析手段106、読出し手段107、変更手段
108、判定手段109及び変換手段1!Oとしては、
CPU、ROM、RAM、I10ポートからなるマイク
ロコンピュータを用いるのが便利であり、文字列記憶手
段105としては、通常、その中のRAMが用いられる
(ホ)作用 この発明によれば、辞書手段101には、漢字を含む多
数の自立語と接尾語からなる単語がその読み情報と共に
記憶されており、付加条件記憶手段102には、自立語
に対する接尾語の付加条件がテーブルとして記憶され、
接続条件記憶手段103には、単語どうしの接続条件が
記憶されているー 入力手段104からかな文字列が入力されると、そのか
な文字列は文字列記憶手段105に記憶され、解析手段
106により、文節単位に区切られて、読出し手段10
7により、区切られた各文節に対応する単語が辞書手段
lotから続出される。
続いて、変更手段108により、続出された単語につい
ての接尾語の付加の可否が付加条件記憶手段102に記
憶されたテーブルに基づいて判定されると共に、接尾語
が付加された単語については接続条件記憶手段103に
記憶された接続条件が変更される。そして、判定手段1
09により、単語の接続の可否が接続条件記憶手段10
3に記憶された接続条件に基づいて判定され、変換手段
110により、判定手段109の判定に基づいて文字列
記憶手段工05に記憶されたかな文字列が漢字かな交じ
り文に変換される。
シタ力って、接尾語処理においては、単語ニついて接尾
語の付加の可否を調べ、接尾語が付加される場合には単
語どうしの接続条件を変更した後、単語どうしの接続の
可否を調べてかな漢字変換を行うので、無意味語への変
換が防止され、かな漢字変換の変換効率が向上する。
(へ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述する
。なお、これによってこの発明が限定されるものではな
い。
第2図はこの発明を日本語ワードプロセッサに適用した
一実施例の構成を示すブロック図である。
この図において、lはかな文字キーやファンクションキ
ー等を備えたキーボードであり、各種のかな文字列を制
御部2に入力する。
制御部2は、CPU、ROM、RAM、I10ポートか
らなるマイクロコンピュータによって構成され、ROM
に書き込まれている制御プログラムにより後述する各種
のデータ処理を行う。
3はCRTデイスプレィ装置やLC(液晶)デイスプレ
ィ装置、あるいはELデイスプレィ装置等からなる表示
装置である。
4はかな文字列を漢字かな交じり文に変換するためのマ
イクロプロセッサからなるかな漢字変換装置である。
5は漢字を含む多数の自立語をその読み情報と共に記憶
したROMからなるかな漢字変換辞書、6は各自立語に
ついての後述する意味による分類を記憶したROMから
なるかな漢字変換用意味辞書である。
7は漢字を含む多数の接尾語をその読み情報と共に記憶
したROMからなる接尾語辞書、8は各接尾語について
の意味による分類を記憶したROMからなる接尾語用意
味辞書である。
9は自立語に対する接尾語の付加条件を意味による分類
別にテーブルとして記憶したROMからなる付加条件辞
書である。すなわち、この付加条件辞書9には、かな漢
字変換辞書5に収録された自立語に対して接尾語辞書7
に収録された接尾語が付加可能であるのか否かの付加条
件と、付加可能である場合にはどのような意味による分
類となるのかの情報が記憶されている。
第3面は自立語の意味による分類の体系を示す説明図で
あり、かな漢字変換辞書5に登録されている各自立語は
、図に示すような体系に基づいて分類され、その分類コ
ードがかな漢字変換用意味辞書6に記憶されている。
すなわち、大分類としては、自然、文化・・・・・・等
に分類され、中分類としては、例えば、大分類が自然で
あれば、天文、地勢、植物、・・・・・・等に、大分類
が文化であれば、社会、学芸・・・・・・等に分類され
ている。
また、中分類の項目はさらに小分類に分けられ、例えば
、中分類が学芸であれば、小分類としては、文学、音楽
、美術・・・・・・等に分類されている。
各分類項目に付したかっこ“()”付きの数字は、各自
立語の意味分類を示すための分類コードであり、大分類
に付した数字は先頭桁のコードを、中分類の数字は先頭
の次桁のコードを、小分類の数字は先頭の次々桁のコー
ドを、それぞれ表している。
この例に従えば、「犬」、「猫」、「魚」、「牛」−・
・・・・という自立語は“動物”の意味分類に属し、「
人」、「大人」、「子供」、「男」、「女」・・・・・
・という自立語は“人”の意味分類に属している。
第4図はかな漢字変換用意味辞書6に登録された意味に
よる分類の一例を示す説明図であり、この図に示すよう
に、かな漢字変換辞書5に登録された各自立語について
は、各自立語の意味を示す分類コードが、意味分類コー
ドとしてかな漢字変換用意味辞書6に登録されている。
例えば、第3図に示した「牛」の場合には、自然(0)
、動物(3)であるので、先頭コードは“0”、次コー
ドは“3“となり、意味分類コードは“03・・・・・
・“となる。また、「トランペット」の場合には、文化
(1)、学芸(1)、音楽(1)であるので、意味分類
コードは、先頭から、“l!I・・・・・・”となる。
接尾語用意味辞書8においても上記のかな漢字変換用意
味辞書6と同様に、各接尾語の意味を示す分類コードが
意味分類コードとして登録されている。
また、かな漢字変換装置4は、単語どうしの接続条件を
意味による分類別に用例として記憶した用例記t!部(
図示しない)を有しており、かな漢字変換時には、この
用例を参照することにより意味解析を行って、無意味語
への変換を防止するようにしている。
例えば、「(動物)十鳴<J、r(人)十泣く」等の意
味分類による用例を記憶しておき、「うしがなくJとい
うかな文字列を漢字かな交じり文に変換する場合には、
「牛」の意味分類コードを参照することにより「(動物
)十鳴く」を得、「牛が鳴くJと正しくかな漢字変換す
る。
このような意味解析処理においては、一般に自立語に接
尾語が付加された場合、自立語の意味分類が消え、接尾
語の意味分類が残る。また、自立語に接尾語が付くか付
かないかは、自立語と接尾語によって規則性がなく決ま
る。
第5図は付加条件辞書9のg2憶内容の一例を示す説明
図であり、この図に示すように、付加条件辞書9には、
自立語と接尾語が接続可能であるのか否かということと
、接続された場合の意味分類とが記憶されている。第5
図においては、例えば自立語「芸術」と接尾語「化」と
は接続されず、自立語「芸術」が接尾語「家」と接続さ
れた場合には、”工芸”の意味分類であった「芸術」と
いう自立語は、「芸術家」として“人゛の意味分類にな
る事を示している。
制御部2は、キーボードlからかな文字列が入力される
と、それを表示装置3に表示する。また、キーボードl
のかな漢字変換キー(図示しない)が押されると、入力
されたかな文字列をかな漢字変換装置4に送る。かな漢
字変換装置4は、かな漢字変換辞書5を利用し、そのか
な文字列に対応する自立語を探す。例えば、「芸術家」
と入力された場合には「芸術」を探す。次に、接尾語辞
書7から「化、家、科、課」を候補として探す。そして
、付加条件辞書9の参照により、「芸術」に対してそれ
らの接尾語の付加が可能か否かをチエツクする。「げい
じゅつか」の場合は「芸術」と「化、家、科、課」の内
、「家」と「科」のみが接続可能であり、この場合、「
芸術家」の意味分類は“人”  「芸術科」の意味分類
は“学科”となる。
その後、「芸術家」または「芸術科」という単語と他の
単語とが接続可能であるか否かを用例記憶部の参照によ
りチエツクする。
このように、付加条件辞書9を参照することにより、「
芸術化」、「芸術課」などの無意味語への変換を防止す
ることができる。また、意味解析処理においては、細か
い意味分類の設定が可能となる。
次に、このような制御部2の処理動作の内容を第6図に
示すフローチャートに従い説明する。
キーボードlからかな文字列が入力されると、制御部2
は、そのかな文字列をかな漢字変換装置4に送る。かな
漢字変換装置4は、そのかな文字列をRAM内にセット
しくステップl IL二文節最長一致の方法で、そのか
な文字列に対応する単語をかな漢字変換辞書5からサー
チする(ステップ12)。
対応する単語がかな漢字変換辞書5に無い場合には(ス
テップI3)、セットしたかな文字列の一つ前の単語に
戻ってかな漢字変換辞書5のサーチをやり直しくステッ
プ14)、対応する単語がかな漢字変換辞書5に有る場
合には、その単語の後ろの単語が接尾語であるかどうか
を調べ(ステップ15)、接尾語である場合には付加条
件辞書9を参照して接尾語が付加可能であるか否かのチ
エツクを行う(ステップ16)。ここで、付加可能であ
るときには(ステップ17)、意味分類を変更しくステ
ップ18)、意味解析を行って他の単語との接続をチエ
ツクしくステップI9)、セットしたかな文字列につい
てのかな漢字変換が完了するまでステップ12以降を繰
り返しくステップ20)、完了すれば処理を終える。ま
た、ステップ■7において付加が不可能であるときには
ステップI4に進み、一つ前の単語に戻ってかな漢字変
換辞書5のサーチをやり直す。
ステップL5において、後方の単語が接尾語でない場合
には、かな漢字変換用意味辞書6の意味分類に従って単
語どうしの接続をチエツクしくステップ21)、単語ど
うしが接続可能であればステップ19に進んで意味解析
を行い、単語どうしが接続不可能であればステップ14
に進んで一つ前の単語に戻り、かな漢字変換辞書5のサ
ーチをやり直す。
このようにして、名詞に対して接尾語が付加可能である
のか否かをチエツクし、付加可能である場合には意味分
類を変更することにより、無意味後への変換を防止する
ことができ、意味解析においても細かい対応が可能とな
る。
(ト)発明の効果 この発明によれば、接尾語処理においては、単語につい
ての接尾語の付加の可否を判定し、接尾語が付加された
単語については単語どうしの接続条件を変更するように
したので、無意味語への変換を防止して、より正確にか
な漢字変換を行うことができる。
【図面の簡単な説明】
第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図は自
立語の意味分類の体系を示す説明図、第4図はかな漢字
変換用意味辞書に登録された意味分類の一例を示す説明
図、第5図は付加条件辞書の記憶内容の一例を示す説明
図、第6図は実施例の動作を示すフローチャートである
。 ■・・・・・キーボード、2・・・・・・制御部、3・
・・・・・表示装置、4・・・・・・かな漢字変換装置
、5・・・・・かな漢字変換辞書、 6・・・・・・かな漢字変換用意味辞書、7・・・・・
・接尾語辞書、8・・・・・・接尾語用意味辞書、9・
・・・・・付加条件辞書。 第1図 第3図 第4図 ×:接続不可 第 図 第 図

Claims (1)

    【特許請求の範囲】
  1. 1、漢字を含む多数の自立語と接尾語からなる単語をそ
    の読み情報と共に記憶した辞書手段と、自立語に対する
    接尾語の付加条件をテーブルとして記憶した付加条件記
    憶手段と、単語どうしの接続条件を記憶した接続条件記
    憶手段と、かな文字列を入力するための入力手段と、入
    力されたかな文字列を記憶する文字列記憶手段と、記憶
    されたかな文字列を文節単位に区切る解析手段と、区切
    られた各文節に対応する単語を辞書手段から読出す読出
    し手段と、読出された単語についての接尾語の付加の可
    否を付加条件記憶手段に記憶されたテーブルに基づいて
    判定すると共に接尾語が付加された単語について接続条
    件記憶手段に記憶された接続条件を変更する変更手段と
    、単語の接続の可否を接続条件記憶手段に記憶された接
    続条件に基づいて判定する判定手段と、判定手段の判定
    に基づいて文字列記憶手段に記憶されたかな文字列を漢
    字かな交じり文に変換する変換手段を備えてなるかな漢
    字変換装置。
JP2178736A 1990-07-05 1990-07-05 かな漢字変換装置 Pending JPH0465751A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2178736A JPH0465751A (ja) 1990-07-05 1990-07-05 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2178736A JPH0465751A (ja) 1990-07-05 1990-07-05 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH0465751A true JPH0465751A (ja) 1992-03-02

Family

ID=16053690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2178736A Pending JPH0465751A (ja) 1990-07-05 1990-07-05 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0465751A (ja)

Similar Documents

Publication Publication Date Title
Habash et al. MADA+ TOKAN: A toolkit for Arabic tokenization, diacritization, morphological disambiguation, POS tagging, stemming and lemmatization
Christopher et al. Introduction to information retrieval
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
JPH03172966A (ja) 類似文書検索装置
JP2948159B2 (ja) データベース装置
JPH0465751A (ja) かな漢字変換装置
JPS60254367A (ja) 文章分析装置
JP2958044B2 (ja) かな漢字変換方法及び装置
JPH0412866B2 (ja)
Chaware et al. Information retrieval in multilingual environment
JPH0746355B2 (ja) かな漢字変換装置
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
JPS646499B2 (ja)
JP3888701B2 (ja) 文字変換装置
JPS61177575A (ja) 日本語文章作成装置
JPH04220767A (ja) 文脈処理方式
JPH03229367A (ja) テキストベース検索方式
JP2819766B2 (ja) 外国語電子辞書検索方式
Poibeau Content annotation for the Semantic Web
JP2580060B2 (ja) かな漢字変換方法及び装置
JPH0474262A (ja) 文書処理装置
JPH0462665A (ja) データ検索装置
JPS63116269A (ja) 日本語処理の仮名漢字変換装置
JPH06187329A (ja) 自然言語処理装置
JPH04372047A (ja) 仮名漢字変換装置