JPH0225970A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH0225970A
JPH0225970A JP63174996A JP17499688A JPH0225970A JP H0225970 A JPH0225970 A JP H0225970A JP 63174996 A JP63174996 A JP 63174996A JP 17499688 A JP17499688 A JP 17499688A JP H0225970 A JPH0225970 A JP H0225970A
Authority
JP
Japan
Prior art keywords
candidate
classification
memory
candidates
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63174996A
Other languages
English (en)
Inventor
Hiroshi Chikakiyo
近清 博志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP63174996A priority Critical patent/JPH0225970A/ja
Publication of JPH0225970A publication Critical patent/JPH0225970A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は1日本語ワードプロセッサ等の仮名漢字変換
装置に関する。
[発明の概要] この発明は、日本語ワードプロセッサ等において、仮名
漢字変換時に複数の候補が検索された場合、例えば、入
力文字列「きたいをあらう」に対応して複数の候補文「
気体を洗う」、「機体を洗う」、「期待を洗う」が検索
された場合、予め決められている「気体」、「機体」、
「期待」に対応する意味分類と、「洗う」の意味分類と
が予め決められている連語関係にあるか否かを調べ、構
文士連語関係が起こりづらい候補「期待」を候補所定の
方式にしたがって選択するようにしている群の中から削
除するようにしたものである。
[従来の技術] 近年、ワードプロセッサ等の仮名漢字変換装置において
、入力された文字列をかな漢字混じり文に変換する時に
、複数の候補文が得られた場合、そのいずれを選択する
かを決める為の情報として、単語間の関係を示す連語情
報を用いて行う技術(NTT研究実用化報告第36巻第
10号(1987年])が提案されている。
[発明が解決しようとする課題] しかしながら、この種のものにおいては、意味分類毎に
、すべての意味分類に対する連接可能性を示す為の情報
をメモリに記憶しておかなければならない為、メモリ容
量が極めて膨大なものとなる。また、複数の候補文の中
から連語情報を用いて候補の絞り込みを行う場合、候補
文の全体が日本語として構文上酸も連語関係が適切な候
補文をが、連語関係だけでは必ずしも高い正答率を期待
することはできない。
この発明の課題は、連語情報を記憶するメモリ容量を大
幅に削減することができると共に、高い正答率を得るこ
とができるようにすることである。
[課題を解決するための手段] この発明の手段は次の通りである。
辞書メモリl(第1図の機能ブロック図を参照、以下同
じ)は、漢字もしくは熟語に対応してその読みを記憶す
ると共に予め決められているその意味分類を示す分類デ
ータを記憶するかな漢字変換用の辞書メモリである。こ
こで、意味分類とは、辞書メモリ1内に記憶されている
漢字もしくは熟語を例えば、「自然」、「性状」、「変
動」・・・・・・「物品」等のように意味分類別に分け
ることをいう。
テーブルメモリ2は連語関係が起こりづらい意味分類同
士の分類データを対応して記憶する。即ち、テーブルメ
モリ2は日本語として構文上連なる可能性のない意味分
類同士の分類データを対応して記憶するものである。
候補検索手段3は入力された文字列に対応する候補を辞
書メモリ1から検索する。
判別手段4はこの候補検索手段3で複数の候補が検索さ
れた際に、テーブルメモリ2を参照することにより、当
該各候補に対応して辞書メモリlに記憶されている分類
データが示す意味分類と候補に連なる他の語の意味分類
との連語関係を判別する。
削除手段5は判別手段4で連語関係が起こりづらいと判
別された際に、候補検索手段3で検索された複数の候補
の中から当該候補を削除する。
[作 用] この発明の手段の作用は次の通りである。
いま、かな文字列として「きたいをあらう」を入力する
と、候補検索手段3は入力文字列に基づいて辞書メモリ
1を検索するが、この場合、複数の候補文、例えば、「
気体を洗う」、「機体を洗う」 「期待を洗う」という
かな漢字混じり文が得られたものとする。
このように複数の候補文が検索された際1判別手段4は
テーブルメモリ2を参照することにより、当該各候補「
気体」、「機体」、「期待」に対応して辞書メモリlに
記憶されている分類データが示す意味分類とこの候補に
連なる他の語「洗う」の意味分類との連Jb関係を判別
する。ここで、テーブルメモリ2に「期待」の分類デー
タに対応して「洗う」の分類データが記憶されているも
のとすると1判別手段4はテーブルメモリ2を参照する
ことにより、「期待」と「洗う」とが構文上連なる可能
性がないものと判別する。
このように連語関係がないものと判別された候補「期待
」は、削除手段5によって候補群の中から削除される。
このように、3つの候補文が検索されたとしても「洗う
」に対して連語関係のない候補「期待」は候補群の中か
ら除外されるが、この場合、残った2つの候補「気体」
、「機体」のうち、そのいずれを選択するかは、通常の
学習機ス七によって得られた出現頻度や最新使用語を用
いることにより、最終的に「機体を洗う」というかな漢
字混じり文を第1候補として選択することができる。
このように、テーブルメモリ2を設けたとしてもテーブ
ルメモリ2は構文上連語関係が起こりづらい意味分類同
士、つまり、構文上達なる可能性のない意味分類同士の
分類データを対応して記憶する構成であるから、そのメ
モリ容量は極めて少なくて済む、また、複数候補が検索
された場合にはテーブルメモリ2を参照することによっ
て構文−ト連語関係の起こりづらい候補を削除するよう
にしたから、候補の絞り込みを適切に行うことができる
。この場合、2以上の候補が残ったとしてもその選択を
通常の学習機能に基づく情報に基づいて行うようにすれ
ばよい。
したがって、使用メモリの清約および正答率の点で極め
て優れたものとなる。
[実施例] 以下、第2図〜第6図を参照して一実施例を説明する。
第2図は日本語ワードプロセッサの基本的な構成を示し
たブロック回路図である。
CPUIIはコントロールROM12に予め格納されて
いるシステムプログラム等にしたがって文書作成処理を
行う、即ち、CPUIIはキーボード13から入力され
た文字列データ(例えばかな文字列)をCR7表示部1
4のテキスト画面に表示させたり、入力文バッファ15
に一時格納する。入力文バッファ15は少なくとも1文
の文字列を記憶aTt@にもので、CPUIIはキーボ
ード13からの変換指令に応答して入力文バッファ15
の内容を読み出し、辞書ROM16を用いて仮名漢字変
換(連文節変換)を行うと共に、これによって得られた
仮名漢字混じり文を文書メモリを構成するRAM17に
格納する。この場合、CPUIIは仮名漢字変換時に複
数の候補文が得られた場合には連語情報テーブルメモリ
18を参照することにより所定の候補文を削除して候補
の絞り込みを行うが、これによっても2以上の候補が存
在する場合には、辞書ROM16を参照することにより
、辞書ROM16内の出現頻度等の情報から第1候補を
選択する。第3図は辞書ROM16内に設けられている
仮名漢字変換辞書20の一部を概念的に示した図である
。仮名漢字変換辞書メモリ20は辞書陽に対応して漢字
もしくは熟語の読みおよびその表記の他、意味分類陥お
よび出現頻度、最新使用語を示す情報等を記憶する構成
となっている。
第4図は連語情報テーブルメモリ18の一部を概念的に
示した図である。この連語情報テーブルメモリエ8は構
文上連語関係の起こりづらい意味分類同士の意味分類動
を対応して記憶すると共に、例えば、意味分類Nor3
5」に対応、して記憶されている複数の意味分類1t)
r12J、「43」、「93」や意味分類勤「08」に
対応して記憶されている複数の意味分類F&yr23」
、「26」、「37」、r81J 、r79Jは夫々連
語関係の起こりづらい順に配列記憶され、その順位は図
中rl」、r2.+、「3」、「4」、「5」によって
表わされている(以下同じ)。
ここで、意味分類尚の概念を第5図を参照して詳述する
。第5図は仮名漢字変換辞書メモリ20内の漢字もしく
は熟語をその意味に基づいて公知の分類の仕方により例
えば10X10=100項目の分類に分けて体系化した
ものである。即ち、角用類語新辞典にある分類慟を使用
し、先ず、ro(自然)」、「1(性状)」、「2(変
動)Jr4(行動)」、・・・・・・「9(物品)」の
10項目の分類に分け、更に、その1つ1つを10項目
の分類に分けたものである。したがって、例えば、「O
(自然)」という分類は更に「00(天文)」、roi
(暦l])」、ro2(気象)」、・・・・・・という
10項目の分類に分けられている。
次に1本実施例の動作を説明する。いま、キーボード1
3から仮名文字列「きたいをあらう」を入力したものと
すると、入力された仮名文字列は入力文バッファ15に
順次格納されてゆく。
ここで、キーボード13に設けられている変換キー(図
示せず)が操作されると、CPUIIは第6図のフロー
チャートにしたがった処理動作を実行し、入力文バッフ
ァ15内の文字列を仮名漢字混じり文に変換する。
即ち、CPUIIは入力文バッファ15内の文字列を読
み出して辞書ROM16内の仮名漢字変換辞書メモリ2
0を検索する(ステップS1)。
この場合、入力文字列「きたいをあらう」に対応して「
気体を洗う」、「機体を洗う」、「期待を洗う」の3つ
の候補文が検索されたものとする。
このように複数候補が検索されると、ステップS2でそ
のことが検出されてステップS3に進む。
ここでは、仮名漢字変換辞書メモリ20内から各候補「
気体」、「機体」、「期待」の意味分類崩を読み出すと
共にそれらに連なる語「洗う」の意味分類間を読み出す
、ここで、「気体」・・・・・・「08」、「機体」・
・・・・・「99」、「期待」・・・・・・r42J、
r洗う」・・・・・・「35」となる、そして、連語情
報テーブルメモリ18を参照し、各候補の意味分類ND
r08J、「99」、「43」に対応して連語情報テー
ブルメモリ18に記憶されている意味分類陥を調べる。
この場合、「気体」、「機体」の意味分類間「08」、
「99」に対応して「洗う」の意味分類Pk)r35J
は記憶されていないが、「期待ノの意味分類1’br4
3Jに対応して「洗う」の意味分類4r35Jは記憶さ
れている。このように、連語情報テーブルメモリ18内
に1つでも該当する意味分類間が記憶されている場合に
はステップS4でそのことが検出されてステップS5に
進み、候補群の中から該当候補「期待」を削除する。
即ち、連語情報テーブルメモリ18を参照することによ
り、意味分類N0r43Jに属する語(例えば「期待」
)と意味分類Nor35..+に属する語(例えば「洗
う」)との連語関係は、構文上絶対に起こらないか、極
めて起こりづらい関係にあることが分るので、このよう
な候補を候補群の中から削除する。
これによって、いま2つの候補文、つまり、「気体を洗
う」と「機体を洗う」が残るが、この2つの候補文のう
ちどちらを選択するかは、通常の学習機能に基づく情報
(仮名漢字変換辞書メモリ20内の出現頻度、最新使用
語)にしたがって第1候補の選択を行う(ステップS6
)、この結果、「機体を洗う」が第1候補として選択さ
れ。
CR7表示部14に表示出力される(ステップS7)。
なお、ステップS2で複数候補が検索されなかった場合
には、ステップS7に進み、それが第1候補として表示
出力される。またステップS4で複数候補の全てがそれ
に連なる語と連語関係にあると判断された場合には、ス
テップS6に進み、通常の学習機能に基づいて第1候補
を選択したのちそれを表示出力する(ステー2プS7)
なお、上記実施例は複文節変換によって入力文バッファ
15内の文字列を一括変換するようにしたが、単文節変
換によって1単語ずつ変換する場合にも適用可上である
。この場合、変換候補の前に連なる語との連語関係をチ
エツクするようにすればよい。
[発明の効果〕 この発明は、テーブルメモリに構文上連語関係が起こり
づらい意味分類同士の分類データを記憶するようにした
からメモリ容量は極めて少なくて済み、メモリの節約が
可能となると共に、構文上連語関係の起こりづらい候補
を削除するようにしたから、候補の絞り込みを適切に行
うことができ、正答率を著しく高めることができる。
【図面の簡単な説明】
第1図はこの発明の機能ブロック図、第2図〜第6図は
実施例を示し、第2図は日本語ワードプロセッサの基本
的な構成を示すブロック回路図、第3図は第2図で示し
た辞書1(0M16内に設けられている仮名漢字変換辞
書メモリ20の一部を概念的に示した図、第4図は第2
図で示した連語情報テーブルメモリ18の一部を概念的
に示した図、第5図は意味分類を説明する為の図、第6
図は変換キーの操作に応答して実行される仮名漢字変換
処理を示したフローチャートである。 11・・・・・・CPU、12・・・・・・コントロー
ルROM、13・・・・・・キーボード、15・・・・
・・入力文バッファ、16・・・・・・辞書ROM、1
8・・・・・・連語情報テーブルメモリ、20・・・・
・・仮名漢字変換辞書メモリ。 特 許 出 願 人 カシオ計算機株式会社 り広′二カj 第 図

Claims (1)

  1. 【特許請求の範囲】 漢字もしくは熟語に対応してその読みを記憶すると共に
    、予め決められているその意味分類を示す分類データを
    記憶する仮名漢字変換用の辞書メモリと、 連語関係が起こりづらい前記意味分類同士の分類データ
    を対応して記憶するテーブルメモリと、入力された文字
    列に対応する候補を前記辞書メモリから検索する候補検
    索手段と、この候補検索手段で複数の候補が検索された
    際に、前記テーブルメモリを参照することにより、当該
    各候補に対応して前記辞書メモリに記憶されている分類
    データが示す意味分類と候補に連なる他の語の意味分類
    との連語関係を判別する判別手段と、 この判別手段で連語関係が起こりづらいと判別された際
    に、前記候補検索手段で検索された複数の候補の中から
    当該候補を削除する削除手段と、を具備したことを特徴
    とする仮名漢字変換装置。
JP63174996A 1988-07-15 1988-07-15 仮名漢字変換装置 Pending JPH0225970A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63174996A JPH0225970A (ja) 1988-07-15 1988-07-15 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63174996A JPH0225970A (ja) 1988-07-15 1988-07-15 仮名漢字変換装置

Publications (1)

Publication Number Publication Date
JPH0225970A true JPH0225970A (ja) 1990-01-29

Family

ID=15988397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63174996A Pending JPH0225970A (ja) 1988-07-15 1988-07-15 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0225970A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581241A (ja) * 1991-09-24 1993-04-02 Nec Corp 同音意義語処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581241A (ja) * 1991-09-24 1993-04-02 Nec Corp 同音意義語処理方式

Similar Documents

Publication Publication Date Title
EP0610760B1 (en) Document detection system with improved document detection efficiency
CN100594470C (zh) 用于对用户输入的多义性输入序列进行多义性消除的系统和方法
US6182062B1 (en) Knowledge based information retrieval system
JP3532780B2 (ja) 音声仮名文字の入力順序を生成するための入力システム
JPH0225970A (ja) 仮名漢字変換装置
JP2792147B2 (ja) 文字処理方法およびその装置
JP3492981B2 (ja) 音声仮名文字の入力順序を生成するための入力システム
JPS628259A (ja) かな漢字変換方式
JPS6162970A (ja) 仮名漢字変換装置
JPH0271362A (ja) 仮名漢字変換装置
JPS6198475A (ja) 日本語文章入力装置
JP3585944B2 (ja) データ処理方法及びその装置
JP3021224B2 (ja) 辞書検索装置
JPH0380363A (ja) 文書処理装置
JPH04281558A (ja) 文書検索方法および装置
JPH08153112A (ja) 文書作成装置及び文書作成方法
JPH0465751A (ja) かな漢字変換装置
JPH0474262A (ja) 文書処理装置
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH03164859A (ja) かな漢字変換装置
JPH0267676A (ja) 漢数字変換処理装置
JPS62109160A (ja) カナコ−ド入力方式
JPH03229353A (ja) かな漢字変換装置
JPH0695330B2 (ja) 文書作成装置
JPH0652152A (ja) 文書処理装置