JPH04343163A - 用例辞書及びこの用例辞書を備えた文章処理装置 - Google Patents
用例辞書及びこの用例辞書を備えた文章処理装置Info
- Publication number
- JPH04343163A JPH04343163A JP3115047A JP11504791A JPH04343163A JP H04343163 A JPH04343163 A JP H04343163A JP 3115047 A JP3115047 A JP 3115047A JP 11504791 A JP11504791 A JP 11504791A JP H04343163 A JPH04343163 A JP H04343163A
- Authority
- JP
- Japan
- Prior art keywords
- code
- word
- classification
- dictionary
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 6
- 240000000220 Panda oleosa Species 0.000 abstract description 6
- 238000009795 derivation Methods 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 14
- 241001465754 Metazoa Species 0.000 description 11
- 244000144972 livestock Species 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 206010011469 Crying Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】この発明はかな漢字変換機能を備
えた文章処理装置に関し、特に変換効率を高めるための
用例辞書を備えた文章処理装置に関する。
えた文章処理装置に関し、特に変換効率を高めるための
用例辞書を備えた文章処理装置に関する。
【0002】
【従来の技術】従来この種の文章処理装置においては、
かな漢字変換辞書の各単語に単語の意味上の分類をコー
ド化した意味コードを付加することにより、かな漢字変
換の向上を図るようにしている。すなわち、“犬”、“
猫”、“牛”等の単語には、それらに共通する「家畜」
の意味コードを付加し、“彼”、“彼女”、“私”等の
単語には「人」の意味コードを付加してそれぞれ単語を
記憶している。そして用例辞書に「家畜+鳴く」、「人
間+泣く」という関連を意味用例として登録しておくこ
とにより、文字列「いぬがなく」と入力された場合に「
犬が泣く」ではなく「犬が鳴く」という単語に正しくか
な漢字変換できるようにしている。
かな漢字変換辞書の各単語に単語の意味上の分類をコー
ド化した意味コードを付加することにより、かな漢字変
換の向上を図るようにしている。すなわち、“犬”、“
猫”、“牛”等の単語には、それらに共通する「家畜」
の意味コードを付加し、“彼”、“彼女”、“私”等の
単語には「人」の意味コードを付加してそれぞれ単語を
記憶している。そして用例辞書に「家畜+鳴く」、「人
間+泣く」という関連を意味用例として登録しておくこ
とにより、文字列「いぬがなく」と入力された場合に「
犬が泣く」ではなく「犬が鳴く」という単語に正しくか
な漢字変換できるようにしている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
文章処理装置における用例辞書では、意味コード分類が
細かくなればなるほど、意味上で複数の分類にまたがる
用例が現れ、細分類単独ではまかないきれなくなってい
た。具体的には図3に示す意味分類においても、細分類
では「家畜+鳴く」、「獣+鳴く」、「鳥+鳴く」とい
うように、複数の用例を登録しなければならない。この
ように、かな漢字変換の変換精度を高めるために、意味
コードのグループ化を細分化すればするほど意味コード
用例辞書の容量が増加するという欠点があった。この発
明は以上の事情を考慮してなされたもので、複数で登録
していた用例を単独で登録することにより用例辞書の圧
縮を実現した文章処理装置を提供する。
文章処理装置における用例辞書では、意味コード分類が
細かくなればなるほど、意味上で複数の分類にまたがる
用例が現れ、細分類単独ではまかないきれなくなってい
た。具体的には図3に示す意味分類においても、細分類
では「家畜+鳴く」、「獣+鳴く」、「鳥+鳴く」とい
うように、複数の用例を登録しなければならない。この
ように、かな漢字変換の変換精度を高めるために、意味
コードのグループ化を細分化すればするほど意味コード
用例辞書の容量が増加するという欠点があった。この発
明は以上の事情を考慮してなされたもので、複数で登録
していた用例を単独で登録することにより用例辞書の圧
縮を実現した文章処理装置を提供する。
【0004】
【課題を解決するための手段】図1はこの発明の基本構
成を明示するブロック図である。同図に示すように、こ
の発明は、単語の読みを入力する入力手段1と、漢字を
含む多数の単語をその読みと対応して記憶するとともに
、各単語について意味上の分類コードが付されている辞
書手段2と、各単語の有効な組み合わせを分類コードの
組み合わせで記憶している用例辞書手段3と、入力手段
1から入力された単語の読みに対応する単語を、辞書手
段2および用例辞書手段3に基づいて漢字かな交じり文
に変換する変換手段4と、単語の読みおよび変換された
漢字かな交じり文を出力する出力手段5とを備え、前記
用例辞書手段3が、分類コードの各組み合わせに共通す
る分類コード部分を特定コードに置き換えた共通コード
と、その共通コードから派生する派生コードとの組み合
わせによって構成されたことを特徴とする文章処理装置
である。
成を明示するブロック図である。同図に示すように、こ
の発明は、単語の読みを入力する入力手段1と、漢字を
含む多数の単語をその読みと対応して記憶するとともに
、各単語について意味上の分類コードが付されている辞
書手段2と、各単語の有効な組み合わせを分類コードの
組み合わせで記憶している用例辞書手段3と、入力手段
1から入力された単語の読みに対応する単語を、辞書手
段2および用例辞書手段3に基づいて漢字かな交じり文
に変換する変換手段4と、単語の読みおよび変換された
漢字かな交じり文を出力する出力手段5とを備え、前記
用例辞書手段3が、分類コードの各組み合わせに共通す
る分類コード部分を特定コードに置き換えた共通コード
と、その共通コードから派生する派生コードとの組み合
わせによって構成されたことを特徴とする文章処理装置
である。
【0005】この発明における入力手段1、変換手段4
、出力手段5は当該分野で公知のものが使用できる。 例えば入力手段1としては、かな文字列を入力できるも
のであればよく、キーボード、マウス、タブレット入力
装置、OCR等から構成できる。変換手段4は主要な構
成要素としてはマイクロプロセッサ、そのマイクロプロ
セッサを制御するプログラムを記憶したプログラムメモ
リ等を備えたものである。出力手段5はCRT、LCD
等の表示装置で構成することができ、この出力手段5に
はプリンタも含まれる。
、出力手段5は当該分野で公知のものが使用できる。 例えば入力手段1としては、かな文字列を入力できるも
のであればよく、キーボード、マウス、タブレット入力
装置、OCR等から構成できる。変換手段4は主要な構
成要素としてはマイクロプロセッサ、そのマイクロプロ
セッサを制御するプログラムを記憶したプログラムメモ
リ等を備えたものである。出力手段5はCRT、LCD
等の表示装置で構成することができ、この出力手段5に
はプリンタも含まれる。
【0006】この発明における辞書手段2および用例辞
書手段3は、漢字を含む単語の読み、表記、意味上の分
類コードおよび用例を単語ごとに多数記憶できるもので
あればよく、大容量のROM、フロッピーディスクやハ
ードディスク等の磁気記録媒体とその駆動装置等から構
成される。
書手段3は、漢字を含む単語の読み、表記、意味上の分
類コードおよび用例を単語ごとに多数記憶できるもので
あればよく、大容量のROM、フロッピーディスクやハ
ードディスク等の磁気記録媒体とその駆動装置等から構
成される。
【0007】
【作用】この発明に従えば、入力手段1からかな文字列
を入力し、変換キーを押すと、辞書手段2から該当する
単語候補が呼び出され、次に単語に付されている意味コ
ードの組み合わせが存在するかどうかのチェックが用例
辞書手段3を参照することにより行われる。用例辞書手
段3の分類コードは、分類コードの各組み合わせに共通
する分類コード部分を特定コードに置き換えた共通コー
ドと、その共通コードから派生する派生コードとの組み
合わせによって構成されているため、チェックされる単
語が共通コード内に含まれる場合は、派生コードとの組
み合わせをチェックするだけで素早く単語候補を出力す
ることができる。
を入力し、変換キーを押すと、辞書手段2から該当する
単語候補が呼び出され、次に単語に付されている意味コ
ードの組み合わせが存在するかどうかのチェックが用例
辞書手段3を参照することにより行われる。用例辞書手
段3の分類コードは、分類コードの各組み合わせに共通
する分類コード部分を特定コードに置き換えた共通コー
ドと、その共通コードから派生する派生コードとの組み
合わせによって構成されているため、チェックされる単
語が共通コード内に含まれる場合は、派生コードとの組
み合わせをチェックするだけで素早く単語候補を出力す
ることができる。
【0008】
【実施例】以下図に示す実施例に基づいてこの発明を詳
述する。なお、これによってこの発明は限定されるもの
ではない。図2はこの発明を日本語ワードプロセッサに
適用した一実施例の構成を示すブロック図である。同図
において、10はかな文字列を入力するためのかなキー
や各種のファンクションキーを備えたキーボードであり
、かなによる文章の読みや編集に関する指示を制御部1
1に与える。
述する。なお、これによってこの発明は限定されるもの
ではない。図2はこの発明を日本語ワードプロセッサに
適用した一実施例の構成を示すブロック図である。同図
において、10はかな文字列を入力するためのかなキー
や各種のファンクションキーを備えたキーボードであり
、かなによる文章の読みや編集に関する指示を制御部1
1に与える。
【0009】制御部11は、マイクロプロセッサから構
成され、ROMからなるプログラムメモリ12に書き込
まれている制御プログラムに従い、各種のデータ処理を
行う。13はキーボード10から入力されたかな文字列
を漢字に変換するためのかな漢字変換辞書である。この
かな漢字変換辞書13は、漢字を含む多数の単語をその
読みと対応して記憶するとともに、各単語について意味
上の分類コードが付されている。
成され、ROMからなるプログラムメモリ12に書き込
まれている制御プログラムに従い、各種のデータ処理を
行う。13はキーボード10から入力されたかな文字列
を漢字に変換するためのかな漢字変換辞書である。この
かな漢字変換辞書13は、漢字を含む多数の単語をその
読みと対応して記憶するとともに、各単語について意味
上の分類コードが付されている。
【0010】14は用例辞書であり、各単語の有効な組
み合わせパターンを分類コードの組み合わせで記憶して
いる。15はかな漢字変換された文章データを保存する
ためのRAMからなる文章メモリである。16はLCD
ディスプレイからなる表示装置である。
み合わせパターンを分類コードの組み合わせで記憶して
いる。15はかな漢字変換された文章データを保存する
ためのRAMからなる文章メモリである。16はLCD
ディスプレイからなる表示装置である。
【0011】次にこの実施例の特徴である用例辞書14
の構成について説明する。かな漢字変換辞書13に格納
されている単語は、図3に示すように、意味上で分類さ
れている。すなわち、大分類としては、物品、人物、社
会、学芸、自然等であり、中分類としては例えば大分類
が自然の場合は、天文、地勢、動物、植物等に分類され
る。また、中分類の項目はさらに小分類と細分類とに分
けられ、例えば中分類が動物の場合は、その小分類は、
生物、動物、魚介、虫類等に分けられ、小分類が動物の
場合は、その細分類は、家畜、獣、鳥等に分けられる。
の構成について説明する。かな漢字変換辞書13に格納
されている単語は、図3に示すように、意味上で分類さ
れている。すなわち、大分類としては、物品、人物、社
会、学芸、自然等であり、中分類としては例えば大分類
が自然の場合は、天文、地勢、動物、植物等に分類され
る。また、中分類の項目はさらに小分類と細分類とに分
けられ、例えば中分類が動物の場合は、その小分類は、
生物、動物、魚介、虫類等に分けられ、小分類が動物の
場合は、その細分類は、家畜、獣、鳥等に分けられる。
【0012】各分類項目に付されている符号は分類を示
すための意味コードであり、大分類に付された符号から
下に向けて4桁のコードが構成される。すなわち、分類
の内容に応じて下記のコード例が構成される。 自然(4)+動物(2)+動物(1)+家畜(0)
の場合は家畜=4210、 自然(4)+動物(2)
+動物(1)+獣(1) の場合は獣=4211、
自然(4)+動物(2)+動物(1)+鳥(2)
の場合は鳥=4212、 人物(1)+・・・・・・
・+・・・・・・・+・・・・・ の場合は人=1*
**となる。 ただし記号*は何でも受け付けるものとする。
すための意味コードであり、大分類に付された符号から
下に向けて4桁のコードが構成される。すなわち、分類
の内容に応じて下記のコード例が構成される。 自然(4)+動物(2)+動物(1)+家畜(0)
の場合は家畜=4210、 自然(4)+動物(2)
+動物(1)+獣(1) の場合は獣=4211、
自然(4)+動物(2)+動物(1)+鳥(2)
の場合は鳥=4212、 人物(1)+・・・・・・
・+・・・・・・・+・・・・・ の場合は人=1*
**となる。 ただし記号*は何でも受け付けるものとする。
【0013】これに対し用例辞書14は、家畜(421
0)と“鳴く”とが対応して、また、獣(4211)と
“鳴く”が対応して、また、鳥(4212)と“鳴く”
が対応して、さらに、人(1***)と“泣く”が対応
して組み合わされることによって変換候補の用例をチェ
ックすることが可能となる。
0)と“鳴く”とが対応して、また、獣(4211)と
“鳴く”が対応して、また、鳥(4212)と“鳴く”
が対応して、さらに、人(1***)と“泣く”が対応
して組み合わされることによって変換候補の用例をチェ
ックすることが可能となる。
【0014】そこで(1)大分類、中分類、小分類等の
ように大きな分類で分けられる場合、すなわち、上記の
コードにおいて上位から3桁(421)は各分類におい
て共通するコードであり、したがって421*は家畜、
獣、鳥等の小分類単位(レベル)のすべてを含むと規定
する。また、1***は人の大分類単位のすべてを含む
と規定する。なお、記号*は共通コードから派生するコ
ードを表す派生コードと呼ぶ。(2)小分類などの単位
では分けられない場合は範囲を指定する。すなわち、(
4220+02)と“鳴く”とを対応させて登録し、(
1000+998)と“泣く”とを対応させて登録する
。上記の(4220+02)は、4220,4221,
4222を表し、それにより範囲を指定することができ
る。このように範囲を指定する場合は、用例が広い範囲
にまたがっていても対象を特定することができる。また
、この場合02が派生コードとなる。
ように大きな分類で分けられる場合、すなわち、上記の
コードにおいて上位から3桁(421)は各分類におい
て共通するコードであり、したがって421*は家畜、
獣、鳥等の小分類単位(レベル)のすべてを含むと規定
する。また、1***は人の大分類単位のすべてを含む
と規定する。なお、記号*は共通コードから派生するコ
ードを表す派生コードと呼ぶ。(2)小分類などの単位
では分けられない場合は範囲を指定する。すなわち、(
4220+02)と“鳴く”とを対応させて登録し、(
1000+998)と“泣く”とを対応させて登録する
。上記の(4220+02)は、4220,4221,
4222を表し、それにより範囲を指定することができ
る。このように範囲を指定する場合は、用例が広い範囲
にまたがっていても対象を特定することができる。また
、この場合02が派生コードとなる。
【0015】上記したように、この実施例の用例辞書1
4は、分類コードの各組み合わせに共通する分類コード
部分を特定コードに置き換えた共通コードと、その共通
コードから派生する派生コードとの組み合わせによって
構成されている。
4は、分類コードの各組み合わせに共通する分類コード
部分を特定コードに置き換えた共通コードと、その共通
コードから派生する派生コードとの組み合わせによって
構成されている。
【0016】
【発明の効果】この発明によれば、複数で登録していた
用例を単数で登録することができるため、辞書容量を圧
縮することができる。また、用例検索に要する時間を短
縮させることができる。
用例を単数で登録することができるため、辞書容量を圧
縮することができる。また、用例検索に要する時間を短
縮させることができる。
【図1】この発明の基本構成を示すブロック図である。
【図2】この発明の一実施例の構成を示すブロック図で
ある。
ある。
【図3】実施例にて説明する単語の意味上の分類を示す
説明図である。
説明図である。
1 入力手段
2 辞書手段
3 用例辞書手段
4 変換手段
5 出力手段
Claims (1)
- 【請求項1】 単語の読みを入力する入力手段と、漢
字を含む多数の単語をその読みと対応して記憶するとと
もに、各単語について意味上の分類コードが付されてい
る辞書手段と、各単語の有効な組み合わせを分類コード
の組み合わせで記憶している用例辞書手段と、入力手段
から入力された単語の読みに対応する単語を、辞書手段
および用例辞書手段に基づいて漢字かな交じり文に変換
する変換手段と、単語の読みおよび変換された漢字かな
交じり文を出力する出力手段とを備え、前記用例辞書手
段が、分類コードの各組み合わせに共通する分類コード
部分を特定コードに置き換えた共通コードと、その共通
コードから派生する派生コードとの組み合わせによって
構成されたことを特徴とする文章処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03115047A JP3115635B2 (ja) | 1991-05-20 | 1991-05-20 | 用例辞書及びこの用例辞書を備えた文章処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03115047A JP3115635B2 (ja) | 1991-05-20 | 1991-05-20 | 用例辞書及びこの用例辞書を備えた文章処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04343163A true JPH04343163A (ja) | 1992-11-30 |
JP3115635B2 JP3115635B2 (ja) | 2000-12-11 |
Family
ID=14652872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03115047A Expired - Fee Related JP3115635B2 (ja) | 1991-05-20 | 1991-05-20 | 用例辞書及びこの用例辞書を備えた文章処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3115635B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59109939A (ja) * | 1982-12-15 | 1984-06-25 | Comput Basic Mach Technol Res Assoc | 用例辞書 |
JPH01228058A (ja) * | 1988-03-08 | 1989-09-12 | Ricoh Co Ltd | かな漢字変換装置 |
-
1991
- 1991-05-20 JP JP03115047A patent/JP3115635B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59109939A (ja) * | 1982-12-15 | 1984-06-25 | Comput Basic Mach Technol Res Assoc | 用例辞書 |
JPH01228058A (ja) * | 1988-03-08 | 1989-09-12 | Ricoh Co Ltd | かな漢字変換装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3115635B2 (ja) | 2000-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bradshaw et al. | A survey of the behavioural characteristics of pure‐bred dogs in the United Kingdom | |
US5153830A (en) | Method and apparatus for providing assistance with respect to the development, selection and evaluation of ideas and concepts | |
US20160006456A1 (en) | Compression device, compression method, dictionary generation device, dictionary generation method, decompression device, decompression method, information processing system, and recording medium | |
Love | Environment and goals jointly direct category acquisition | |
JPH04343163A (ja) | 用例辞書及びこの用例辞書を備えた文章処理装置 | |
Piegorsch | Encyclopedia of environmetrics | |
Froggatt et al. | Galton's ‘Law of Ancestral Heredity’: its influence on the early development of human genetics | |
CN114242038A (zh) | 一种语音合成方法及系统 | |
Gabay et al. | CORPUS17: a philological corpus for 17th c. French | |
Greensmith | New frontiers for an artificial immune system | |
Azzi et al. | Fortia1@ the NTCIR-14 FinNum task: enriched sequence labeling for numeral classification | |
JP2819339B2 (ja) | ユーザー辞書登録方法及び装置 | |
Schamberger | Customizable Anonymization of German Legal Court Rulings using Domain-specific Named Entity Recognition | |
Ryder | Zoological parks and the conservation of biological diversity: linking ex situ and in situ conservation efforts | |
JPS6028027B2 (ja) | 韓国語ソ−ト制御方式 | |
Porch et al. | Design Document: Content Module; LAP Version I. | |
Fugmann | Bridging the gap between database indexing and book indexing | |
KR920006874A (ko) | 소정의 포맷을 갖는 문서의 인식방법 | |
Dowling | A Scientific Investigation Of The Concept That A Good Man Is Considered A Great Loss To His Community As Seen In Newspaper Reports | |
Garrido et al. | Input and Output | |
Jonsson | Institutions and incentives in monetary and fiscal policy | |
Gittleman | The Giant Pandas of Wolong by George B. Schaller Hu Jinchu Pan Wenshi Zhu Jing | |
Ahmad et al. | Impact of JIT, QM, and EDI on supply chain management: Attaining superior delivery performance | |
Marcelino et al. | Package ‘SoundexBR’ | |
Corlett et al. | Navigation Bar |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |