JPS6180450A - カナ漢字変換装置 - Google Patents
カナ漢字変換装置Info
- Publication number
- JPS6180450A JPS6180450A JP59203427A JP20342784A JPS6180450A JP S6180450 A JPS6180450 A JP S6180450A JP 59203427 A JP59203427 A JP 59203427A JP 20342784 A JP20342784 A JP 20342784A JP S6180450 A JPS6180450 A JP S6180450A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- kanji
- dictionary
- kanji conversion
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、入力されたカナ列を一般的な日本語表記に変
換するカナ漢字変換装置に関する。
換するカナ漢字変換装置に関する。
従来例の構成とその問題点
カナ漢字変換には種々のレベルが存在する、低レベルか
ら並べると音訓変換・熟語変換・分節変換・複文節変換
・べた書き変換である。この内、分節変換・複文節変換
・べた書き変換は文法処理が必要になる。近年、日本語
ワードプロセッサが普及されるにつれて高度なカナ漢字
変換への要求はますます高くなりつつある。
ら並べると音訓変換・熟語変換・分節変換・複文節変換
・べた書き変換である。この内、分節変換・複文節変換
・べた書き変換は文法処理が必要になる。近年、日本語
ワードプロセッサが普及されるにつれて高度なカナ漢字
変換への要求はますます高くなりつつある。
一般にカナ漢字変換辞書の構成は見出し・漢字表記・品
詞の3部門から構成されている。これを従来の構成でま
とめると1単語当り約10バイトの記憶が必要になる。
詞の3部門から構成されている。これを従来の構成でま
とめると1単語当り約10バイトの記憶が必要になる。
一方辞書の語数としては一般語として3万語、固有名詞
(人名・地名など)としては1万語程度なくては、普通
の用途には容易には使用できない。結局4万語程度の辞
書が必要になる。1単語10バイトで4万語だと合計4
00にバイトになる。
(人名・地名など)としては1万語程度なくては、普通
の用途には容易には使用できない。結局4万語程度の辞
書が必要になる。1単語10バイトで4万語だと合計4
00にバイトになる。
半導体の値段は年々減少の傾向にあるが、 400にバ
イトの記憶容量はかなりの大きさである。特に低価格の
ワープロにとっては重大な間厘である。
イトの記憶容量はかなりの大きさである。特に低価格の
ワープロにとっては重大な間厘である。
充実したカナ漢字変換を構築するために、できるだけ辞
書を圧縮する必要がある。
書を圧縮する必要がある。
発明の目的
本発明の目的は、上記の問題点を解消するために、辞書
中の単語は通常アイウェオ順にならべであるがそれをで
きるだけ有効に利用し、各単語の見出しと漢字表記と品
詞情報はできるだけ前に出てきた単語のそれぞれの情報
を利用することにより強力に圧縮したカナ漢字変換用圧
縮辞書を具備したカナ漢字変換装置を提出することであ
る。
中の単語は通常アイウェオ順にならべであるがそれをで
きるだけ有効に利用し、各単語の見出しと漢字表記と品
詞情報はできるだけ前に出てきた単語のそれぞれの情報
を利用することにより強力に圧縮したカナ漢字変換用圧
縮辞書を具備したカナ漢字変換装置を提出することであ
る。
発明の構成
本発明は、日本語文章の読みをカタカナで入力するキー
ボードと、前記キーボードから入力されたカナ文字列を
一時記憶したり必要に応じて出力する入力装置制御部と
、見出しと漢字表記と品詞から成り、各単語は一定の順
番に並べられ各単語 。
ボードと、前記キーボードから入力されたカナ文字列を
一時記憶したり必要に応じて出力する入力装置制御部と
、見出しと漢字表記と品詞から成り、各単語は一定の順
番に並べられ各単語 。
の見出しと漢字表記と品詞情報は前に出てくる単語のそ
れぞれの情報をできるだけ使用することによって圧縮し
た圧縮辞書と、前記圧縮辞書から所望の単語を検索し元
の形に復元する圧縮辞書検索部と、前記入力装置制御部
から得られるカナ文字列と前記圧縮辞書検索部から得ら
れる辞書情報を使ってカナ文字列から日本語の一般表記
に変換するカナ漢字変換制御部と1日本語を表示するデ
ィスプレイと、前記カナ漢字変換制御部から得られた日
本語表記を前記ディスプレイに表示させる出力装置制御
部を具備するように構成したものであり、これにより非
常にコンパクトな辞書でカナ漢字変換が可能となる。
れぞれの情報をできるだけ使用することによって圧縮し
た圧縮辞書と、前記圧縮辞書から所望の単語を検索し元
の形に復元する圧縮辞書検索部と、前記入力装置制御部
から得られるカナ文字列と前記圧縮辞書検索部から得ら
れる辞書情報を使ってカナ文字列から日本語の一般表記
に変換するカナ漢字変換制御部と1日本語を表示するデ
ィスプレイと、前記カナ漢字変換制御部から得られた日
本語表記を前記ディスプレイに表示させる出力装置制御
部を具備するように構成したものであり、これにより非
常にコンパクトな辞書でカナ漢字変換が可能となる。
実施例の説明
以下本発明の一実施例について、図面を参照しながら説
明する。
明する。
第1図は本発明の一実施例を示す要部ブロック構成図で
ある。
ある。
同図において、キーボード1から入力されたカナ文字を
入力装置制御部2で一時記憶する。カナ漢字変換用辞書
は圧縮された形で圧縮辞書了に記憶され、圧縮辞書検索
部eによって検索され元の形に復元される。入力装置制
御部2で得られたカナ列と、圧縮辞書検索部6で得られ
たカナ漢字変換用辞書情報を参照して、カナ漢字変換制
御部3は入力カナ列に対応した日本語文字列を作成する
。
入力装置制御部2で一時記憶する。カナ漢字変換用辞書
は圧縮された形で圧縮辞書了に記憶され、圧縮辞書検索
部eによって検索され元の形に復元される。入力装置制
御部2で得られたカナ列と、圧縮辞書検索部6で得られ
たカナ漢字変換用辞書情報を参照して、カナ漢字変換制
御部3は入力カナ列に対応した日本語文字列を作成する
。
カナ漢字変換制御部3で得られた日本語文字列は出力装
置制御部4がディスプレイS上に表示する。
置制御部4がディスプレイS上に表示する。
次に本発明の実施例の動作について説明する。
カナ漢字変換用の辞書は基本的に3つの部分からなりだ
っている。見出し部と漢字表記部と品詞部である。−膜
形を第2図に示す。カナ漢字変換辞書には単語がアイウ
ェオ順に記憶されている。
っている。見出し部と漢字表記部と品詞部である。−膜
形を第2図に示す。カナ漢字変換辞書には単語がアイウ
ェオ順に記憶されている。
アイウェオ順に記憶されている為、′前後の見出しが同
じになったり、前後の漢字表記が同じになることがある
。例を第3図に示す。「ウマレ」の見出しで始まる語に
、漢字表記「生まれ」品詞は名詞が存在する。「ウマレ
オチ」の見出しで始まる語に、漢字表記「生まれ落ち」
品詞は名詞が存在する。見出し「ウマレオチ」は前出の
見出し「ウマレ」と前3文字は全く同一である。同様に
漢字表記「生まれ落ち」は前出の漢字表記「生まれ」と
前3文字は全く同一である。このような場合前出の情報
をできるだけ使用して記憶容量を減らすことにする。
じになったり、前後の漢字表記が同じになることがある
。例を第3図に示す。「ウマレ」の見出しで始まる語に
、漢字表記「生まれ」品詞は名詞が存在する。「ウマレ
オチ」の見出しで始まる語に、漢字表記「生まれ落ち」
品詞は名詞が存在する。見出し「ウマレオチ」は前出の
見出し「ウマレ」と前3文字は全く同一である。同様に
漢字表記「生まれ落ち」は前出の漢字表記「生まれ」と
前3文字は全く同一である。このような場合前出の情報
をできるだけ使用して記憶容量を減らすことにする。
第3図の圧縮形が第4図になる。「ウマレオチ」の前3
文字は前出の見出しを使用して結局r(m3)オチ」と
なる。(m3)は前出の見出し3文字コピーの意味であ
る。漢字表記「生まれ落ち」の前3文字は前出の漢字表
記を使用して結局r(k3)落ち」となる。
文字は前出の見出しを使用して結局r(m3)オチ」と
なる。(m3)は前出の見出し3文字コピーの意味であ
る。漢字表記「生まれ落ち」の前3文字は前出の漢字表
記を使用して結局r(k3)落ち」となる。
容量的にどれほど圧縮できたか計算してみる。
見出しはすべてカタカナであるので1文字当り1バイト
を要する。見出し「ウマレオチ」では5バイト、見出し
r(m3)オチ」では3バイトの長さになる。ただし、
(m3)は見出し語をリピートする1バイトの特殊コー
ドでちる。漢字は全て2文字で表現する。漢字表記は「
生まれ落ち」は全体で10バイト、漢字表記r(k3)
落ち」は全体で6バイトの長さになる。ただしくk3)
は漢字表記をリピートする1バイトの特殊コードである
。この結果を第5図に示す016バイトが9バイトに圧
縮される。このように前出の見出し、漢字表記をできる
だけ繰り返して使用することによって大幅に辞書容量を
減らすことが可能となる。
を要する。見出し「ウマレオチ」では5バイト、見出し
r(m3)オチ」では3バイトの長さになる。ただし、
(m3)は見出し語をリピートする1バイトの特殊コー
ドでちる。漢字は全て2文字で表現する。漢字表記は「
生まれ落ち」は全体で10バイト、漢字表記r(k3)
落ち」は全体で6バイトの長さになる。ただしくk3)
は漢字表記をリピートする1バイトの特殊コードである
。この結果を第5図に示す016バイトが9バイトに圧
縮される。このように前出の見出し、漢字表記をできる
だけ繰り返して使用することによって大幅に辞書容量を
減らすことが可能となる。
第6図に本発明の実施例の具体的な回路例を示す。これ
はマイクロコンピュータ12 、 RAM(ランダムア
クセスメモリ)8、プログラムROM(リードオンリー
メモリ)9、漢字辞書10.キーボード11、表示回路
13.2次記憶装置14がそれぞれ接続された構成にな
っている。
はマイクロコンピュータ12 、 RAM(ランダムア
クセスメモリ)8、プログラムROM(リードオンリー
メモリ)9、漢字辞書10.キーボード11、表示回路
13.2次記憶装置14がそれぞれ接続された構成にな
っている。
キーボード11から入力された読みは一時RAM8に記
憶され、その読みに対応する日本語表記を漢字辞書10
を使って変換し、その出力結果を表示回路13に表示し
た!112次記憶装置14に記憶するものである。プロ
グラムROM9には、すべての手順が書かれたプログラ
ムと一部の辞書が記憶されている。
憶され、その読みに対応する日本語表記を漢字辞書10
を使って変換し、その出力結果を表示回路13に表示し
た!112次記憶装置14に記憶するものである。プロ
グラムROM9には、すべての手順が書かれたプログラ
ムと一部の辞書が記憶されている。
次に上記のようにして構成したカナ漢字変換装置におけ
る辞書の読み出し動作を第7図のフローチャートで説明
する。
る辞書の読み出し動作を第7図のフローチャートで説明
する。
まず、ステップ16で圧縮辞書から見出し語を1つ読み
出す。ステップ16で読み出された見出し語中に省略記
号が存在するかどうか調べて、もし存在すればステップ
17で前出の見出し語を参考にして見出し語を作成する
。次に、ステップ゛18で漢字表記を読み込む。ステッ
プ19で漢字表記中に省略記号が存在するかどうか調べ
て、もし存在すればステップ2oで前出の漢字表記を参
照して漢字表記を作成する。最後にステップ21で品詞
を読み込んで1つの単語の処理を終える。
出す。ステップ16で読み出された見出し語中に省略記
号が存在するかどうか調べて、もし存在すればステップ
17で前出の見出し語を参考にして見出し語を作成する
。次に、ステップ゛18で漢字表記を読み込む。ステッ
プ19で漢字表記中に省略記号が存在するかどうか調べ
て、もし存在すればステップ2oで前出の漢字表記を参
照して漢字表記を作成する。最後にステップ21で品詞
を読み込んで1つの単語の処理を終える。
発明の効果
本発明は、キーボードから入力されたカナ列を入力装置
制御部で一時記憶し、各単語の見出しと漢字表記と品詞
情報はできるだけ辞書中の前に出現した単語のそれぞれ
の情報を繰9返して使用することにより圧縮したカナ漢
字変換用辞書を有し、その圧縮辞書を検索し使いやすい
形に作り変える圧縮辞書検索部を有し、入力装置制御部
の出力であるカナ列と圧縮辞書検索部の出力である辞書
情報を使用して日本語表記をカナ漢字変換側脚部で作成
し、その出力結果を出力装置制御部でディスプレイに出
力するように構成しているので、その結果小容量の辞書
でもカナ漢字変換が可能となるという効果が得られる。
制御部で一時記憶し、各単語の見出しと漢字表記と品詞
情報はできるだけ辞書中の前に出現した単語のそれぞれ
の情報を繰9返して使用することにより圧縮したカナ漢
字変換用辞書を有し、その圧縮辞書を検索し使いやすい
形に作り変える圧縮辞書検索部を有し、入力装置制御部
の出力であるカナ列と圧縮辞書検索部の出力である辞書
情報を使用して日本語表記をカナ漢字変換側脚部で作成
し、その出力結果を出力装置制御部でディスプレイに出
力するように構成しているので、その結果小容量の辞書
でもカナ漢字変換が可能となるという効果が得られる。
【図面の簡単な説明】
第1図は本発明の一実施例によるカナ漢字変換装置の要
部ブロック図、第2図はカナ漢字変換用辞書の一般形式
図、第3図 第4図 第5図は辞書の圧縮過程を説明す
る図、第6図は上記実施例の要部ブロック図、第7図は
同実施例におけるカナ漢字変換辞書検索のためのプログ
ラムの一例を示すフローチャートである。 1・・・・・・キーボード、2・・・・・・入力装置制
御部、3・・・・・カナ漢字変換制御部、4・・・・・
・出力装置制御部、5・・・・・・ディスプレイ、6・
・・・・・圧縮辞書検索部、7・・・・・・圧縮辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 筒3図 第4図 第5図 第 6 図
部ブロック図、第2図はカナ漢字変換用辞書の一般形式
図、第3図 第4図 第5図は辞書の圧縮過程を説明す
る図、第6図は上記実施例の要部ブロック図、第7図は
同実施例におけるカナ漢字変換辞書検索のためのプログ
ラムの一例を示すフローチャートである。 1・・・・・・キーボード、2・・・・・・入力装置制
御部、3・・・・・カナ漢字変換制御部、4・・・・・
・出力装置制御部、5・・・・・・ディスプレイ、6・
・・・・・圧縮辞書検索部、7・・・・・・圧縮辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 筒3図 第4図 第5図 第 6 図
Claims (1)
- 日本語文章の読みをカタカナで入力するキーボードと、
前記キーボードから入力されたカナ文字列を一時記憶し
たり必要に応じて出力する入力装置制御部と、カナ漢字
変換に用いられ、見出しと漢字表記と品詞から成り、各
単語は一定の順番に並べられ各単語の見出しと漢字表記
と品詞情報は前に出てくる単語のそれぞれの情報をでき
るだけ使用することによって圧縮した圧縮辞書と、前記
圧縮辞書から所望の単語を検索し元の形に復元する圧縮
辞書検索部と、前記入力装置制御部から得られるカナ文
字列と前記圧縮辞書検索部から得られる辞書情報を使っ
てカナ文字列から日本語の一般表記に変換するカナ漢字
変換制御部と、日本語を表示するディスプレイと、前記
カナ漢字変換制御部から得られた日本語表記を前記ディ
スプレイに表示させる出力装置制御部を具備しているこ
とを特徴とするカナ漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59203427A JPS6180450A (ja) | 1984-09-28 | 1984-09-28 | カナ漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59203427A JPS6180450A (ja) | 1984-09-28 | 1984-09-28 | カナ漢字変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6180450A true JPS6180450A (ja) | 1986-04-24 |
Family
ID=16473899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59203427A Pending JPS6180450A (ja) | 1984-09-28 | 1984-09-28 | カナ漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6180450A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57150070A (en) * | 1981-03-12 | 1982-09-16 | Sharp Corp | Dictionary for "kana"-"kanji" conversion |
JPS57185575A (en) * | 1981-05-11 | 1982-11-15 | Sharp Corp | Kana(japanese syllable)-kanji(chinese character) converting processor |
-
1984
- 1984-09-28 JP JP59203427A patent/JPS6180450A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57150070A (en) * | 1981-03-12 | 1982-09-16 | Sharp Corp | Dictionary for "kana"-"kanji" conversion |
JPS57185575A (en) * | 1981-05-11 | 1982-11-15 | Sharp Corp | Kana(japanese syllable)-kanji(chinese character) converting processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6180450A (ja) | カナ漢字変換装置 | |
JPH0140372B2 (ja) | ||
JPS59140545A (ja) | 仮名漢字変換装置 | |
JPS6180449A (ja) | カナ漢字変換装置 | |
JPS6154561A (ja) | 日本語処理装置 | |
JP2837006B2 (ja) | 文章圧縮装置 | |
JPS61286966A (ja) | 言語処理装置 | |
JPS60217452A (ja) | 日本語入力処理装置 | |
JPH0350306B2 (ja) | ||
JPH0140371B2 (ja) | ||
JPH01102613A (ja) | 文字処理装置 | |
JPS60207948A (ja) | カナ漢字変換処理装置 | |
JPS59153232A (ja) | 文字変換装置 | |
JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
JPH04156668A (ja) | 形態素解析装置 | |
JPS62189569A (ja) | 漢字かな変換装置 | |
JPS6327965A (ja) | 文書作成装置 | |
JPS62241064A (ja) | かな漢字変換装置 | |
JPH0758489B2 (ja) | 日本語処理装置 | |
JPH10154141A (ja) | かな漢字変換装置 | |
JPH0447365A (ja) | 辞書装置 | |
JPH02289039A (ja) | 固有名詞変換機能付き文書処理装置 | |
JPS61169961A (ja) | ユ−ザ辞書を備えた文字処理装置 | |
JPH0695330B2 (ja) | 文書作成装置 | |
JPS62241065A (ja) | かな漢字変換装置 |