JPH0766380B2 - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPH0766380B2 JPH0766380B2 JP61058666A JP5866686A JPH0766380B2 JP H0766380 B2 JPH0766380 B2 JP H0766380B2 JP 61058666 A JP61058666 A JP 61058666A JP 5866686 A JP5866686 A JP 5866686A JP H0766380 B2 JPH0766380 B2 JP H0766380B2
- Authority
- JP
- Japan
- Prior art keywords
- kana
- kanji
- character string
- dictionary
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、日本語文章を入力する為に、入力されたかな
文字列を、かな漢字混じり文章に変換するかな漢字変換
装置における単語辞書検索に関する。
文字列を、かな漢字混じり文章に変換するかな漢字変換
装置における単語辞書検索に関する。
従来のかな漢字変換における単語辞書検索の高速化の方
式としては、大きく分けて以下の様な方法がとられてい
た。
式としては、大きく分けて以下の様な方法がとられてい
た。
(1) 単語辞書を高速検索媒体(ROM)上に構築す
る。
る。
(2) 単語辞書検索用の検索テーブル(インデック
ス)をできるだけ多く、手記憶装置に常駐する。
ス)をできるだけ多く、手記憶装置に常駐する。
(3) 単語辞書を木構造化し、アクセス回数を減少す
る。
る。
しかし、(1)の方法では、読み専用記憶装置の為、使
用頻度に基づく完全な単語学習が不可能であり、
(2),(3)の方法は、文節分かち書き処理より単語
辞書を直接検索している為低速な記憶媒体を使用する場
合、検索時間が多く掛かるという欠点があった。
用頻度に基づく完全な単語学習が不可能であり、
(2),(3)の方法は、文節分かち書き処理より単語
辞書を直接検索している為低速な記憶媒体を使用する場
合、検索時間が多く掛かるという欠点があった。
以上述べた様に、文節分かち書き処理より単語辞書を直
接検索していると低速な記憶媒体を使用する場合、検索
時間が多く掛かり、かな漢字変換処理時間を増大してし
まう。特に、「二文節最長一致法」「文節数最小法」等
辞書検索回数の多い変換方式の場合、検索時間の低減が
必要である。
接検索していると低速な記憶媒体を使用する場合、検索
時間が多く掛かり、かな漢字変換処理時間を増大してし
まう。特に、「二文節最長一致法」「文節数最小法」等
辞書検索回数の多い変換方式の場合、検索時間の低減が
必要である。
[問題点を解決する為の手段] これらの問題点を解決する為、本発明は、かな漢字変換
装置において、かな見出しと漢字文字列と品詞とを含
み、かな文字列と漢字文字列とを対応づけるための単語
辞書と、前記単語辞書に含まれる漢字文字列を含まず、
前記単語辞書に含まれるかな見出しと品詞に対応するか
な見出しと品詞とを含み、内部記憶装置上に展開された
文節解析様辞書と、前記入力されたかな文字列から文節
候補として抽出されるかな文字列の品詞を前記文節解析
用辞書から検索しつつ、各文節候補の品詞に基づいて前
記入力されたかな文字列に対し文節分かち書き処理を実
行する文節分かち書き手段と、該文節分かち書き手段に
より文節分かち書き処理されたかな文字列を漢字文字列
に変換する処理を、前記単語辞書を使用して実行する変
換手段と、を備えることを特徴とする。
装置において、かな見出しと漢字文字列と品詞とを含
み、かな文字列と漢字文字列とを対応づけるための単語
辞書と、前記単語辞書に含まれる漢字文字列を含まず、
前記単語辞書に含まれるかな見出しと品詞に対応するか
な見出しと品詞とを含み、内部記憶装置上に展開された
文節解析様辞書と、前記入力されたかな文字列から文節
候補として抽出されるかな文字列の品詞を前記文節解析
用辞書から検索しつつ、各文節候補の品詞に基づいて前
記入力されたかな文字列に対し文節分かち書き処理を実
行する文節分かち書き手段と、該文節分かち書き手段に
より文節分かち書き処理されたかな文字列を漢字文字列
に変換する処理を、前記単語辞書を使用して実行する変
換手段と、を備えることを特徴とする。
[作用] 本発明のかな漢字変換装置では、内部記憶装置上に展開
された文節解析用辞書を用いて文節分かち書き処理が実
行される。
された文節解析用辞書を用いて文節分かち書き処理が実
行される。
ここで、以下に本発明の詳細を図示した実施例に基づい
て説明する。
て説明する。
第1図は本発明のかな漢字変換装置を示す図である。図
中符号1は入力部2より入力されたデータに基づきシス
テム全体の制御を行なう中央処理装置(以下CPUと略
す)である。まずかな漢字変換装置7の起動時点で文法
処理用辞書作成部8により、単語辞書12より文法処理用
辞書11を作成し、以降かな漢字変換処理に入る。
中符号1は入力部2より入力されたデータに基づきシス
テム全体の制御を行なう中央処理装置(以下CPUと略
す)である。まずかな漢字変換装置7の起動時点で文法
処理用辞書作成部8により、単語辞書12より文法処理用
辞書11を作成し、以降かな漢字変換処理に入る。
入力部2により読み込まれた文字列はかな漢字変換装置
7に送られ、かな漢字変換が行なわれる。かな漢字変換
装置7内では、文節分かち書き部10が文法処理用辞書11
を検索し、文節分かち書きを行なう。この文節分かち書
きデータの候補は、漢字候補作成部13に送られ、単語辞
書12を検索しながら文節候補が作成され、文節候補出力
部14により順次文節単位に候補が出力される。なお、文
節のかな漢字変換処理を実行する際には、単語辞書12を
内部記憶装置上に展開しておいてもよい。文法処理用辞
書11は単語辞書12に比べてデータ量が少ないので、単語
辞書12が内部記憶装置上に展開されている場合にも文法
処理用辞書11を使用することによって文節分かち書き処
理を高速化する効果がある。
7に送られ、かな漢字変換が行なわれる。かな漢字変換
装置7内では、文節分かち書き部10が文法処理用辞書11
を検索し、文節分かち書きを行なう。この文節分かち書
きデータの候補は、漢字候補作成部13に送られ、単語辞
書12を検索しながら文節候補が作成され、文節候補出力
部14により順次文節単位に候補が出力される。なお、文
節のかな漢字変換処理を実行する際には、単語辞書12を
内部記憶装置上に展開しておいてもよい。文法処理用辞
書11は単語辞書12に比べてデータ量が少ないので、単語
辞書12が内部記憶装置上に展開されている場合にも文法
処理用辞書11を使用することによって文節分かち書き処
理を高速化する効果がある。
かな漢字変換が行なわれた文節候補群は、文節候補表示
部4により表示され、文節候補選択部3により、逐次文
節候補が文節候補確定部5により確定される。全文節が
確定すると、そのデータは文章格納部6に格納されると
共に、かな漢字変換装置7内の確定文節受取部15に送ら
れ、これをもとに使用頻度学習部16は、漢字候補作成部
13に蓄積された解析データに基づき、文法処理用辞書11
と単語辞書12に単語の使用頻度学習を行なう。
部4により表示され、文節候補選択部3により、逐次文
節候補が文節候補確定部5により確定される。全文節が
確定すると、そのデータは文章格納部6に格納されると
共に、かな漢字変換装置7内の確定文節受取部15に送ら
れ、これをもとに使用頻度学習部16は、漢字候補作成部
13に蓄積された解析データに基づき、文法処理用辞書11
と単語辞書12に単語の使用頻度学習を行なう。
この一連の動作により、かな漢字変換において最大の処
理時間を要する文節分かち書き処理の単語検索処理時間
を削減でき、高速なかな漢字変換を可能とする。
理時間を要する文節分かち書き処理の単語検索処理時間
を削減でき、高速なかな漢字変換を可能とする。
第2図は、本発明の動作を説明するフローチャートであ
る。
る。
ここで、200において、かな漢字変換の始まる前に文法
処理用辞書が作成される。
処理用辞書が作成される。
201において、かな文字列が入力され、これが終了符号
であった場合202により終了処理となる。終了でない場
合は203により文法処理用辞書11を検索/参照しながら
文節分かち書きが成され、このデータをもとに204によ
り、単語辞書12が検索/参照されて、文節分かち書きさ
れた漢字候補データが出力され、205で文節単位にユー
ザにより、候補の選択,確定がなされ取消の符号が入力
されれば、201の処理にもどり、そうでないなら207によ
り単語辞書の使用頻度学習が成され、208により文法処
理用辞書の使用頻度学習が成され、かな入力201と戻り
一連の動作が繰り返される。
であった場合202により終了処理となる。終了でない場
合は203により文法処理用辞書11を検索/参照しながら
文節分かち書きが成され、このデータをもとに204によ
り、単語辞書12が検索/参照されて、文節分かち書きさ
れた漢字候補データが出力され、205で文節単位にユー
ザにより、候補の選択,確定がなされ取消の符号が入力
されれば、201の処理にもどり、そうでないなら207によ
り単語辞書の使用頻度学習が成され、208により文法処
理用辞書の使用頻度学習が成され、かな入力201と戻り
一連の動作が繰り返される。
第3図は、本発明の文法処理用辞書11と単語辞書の構造
を示す図である。単語辞書は、図の様にブロック化され
た12bは、複数のブロックより成る。漢字部12bと、その
ブロックを示すインデクス部12aより成り、インデクス
部12aはブロックの最大見出し12cを羅列している。また
漢字部12bは、かな見出し12d,品詞12e,漢字12fを1レコ
ードとして持っている。
を示す図である。単語辞書は、図の様にブロック化され
た12bは、複数のブロックより成る。漢字部12bと、その
ブロックを示すインデクス部12aより成り、インデクス
部12aはブロックの最大見出し12cを羅列している。また
漢字部12bは、かな見出し12d,品詞12e,漢字12fを1レコ
ードとして持っている。
文法処理用辞書は、文節分かち書きに必要な情報を持つ
だけでよい為、図の様にブロック化されたデータ部11b
(11b)は、複数のブロックより成る。)と、そのブロ
ックを示すインデクス部11aより成り、インデクス部11a
はブロックの最大見出し11cを羅列している。またデー
タ部11bは、かな見出し11d,品詞11eを1レコードとして
持ち、漢字情報を持たない。
だけでよい為、図の様にブロック化されたデータ部11b
(11b)は、複数のブロックより成る。)と、そのブロ
ックを示すインデクス部11aより成り、インデクス部11a
はブロックの最大見出し11cを羅列している。またデー
タ部11bは、かな見出し11d,品詞11eを1レコードとして
持ち、漢字情報を持たない。
なお、文法処理用辞書11は漢字データを含まないので比
較的データ量が少なく、内部記憶装置上に展開される。
従って、この文法処理用辞書11を用いて文節分かち書き
処理を高速に行なうことができる。
較的データ量が少なく、内部記憶装置上に展開される。
従って、この文法処理用辞書11を用いて文節分かち書き
処理を高速に行なうことができる。
本来、文節分かち書きに必要な情報とは、単語のかな見
出しと文法情報である品詞のみであり、かな文字列を漢
字文字列に変換するものは文節分かち書き用に検索され
た単語の内、文法的に適当と思われる一部のもののみで
ある。文節分から書きを主記憶上(内部記憶装置上)で
高速に行ない、かな文字列を漢字文字列に変換する時の
み、単語辞書を使用することにより、大幅にかな漢字変
換処理全体を高速化できる。
出しと文法情報である品詞のみであり、かな文字列を漢
字文字列に変換するものは文節分かち書き用に検索され
た単語の内、文法的に適当と思われる一部のもののみで
ある。文節分から書きを主記憶上(内部記憶装置上)で
高速に行ない、かな文字列を漢字文字列に変換する時の
み、単語辞書を使用することにより、大幅にかな漢字変
換処理全体を高速化できる。
なお、この考え方を応用して、ホスト・コンピュータに
単語辞書を置き、ターミナルコンピュータに文法処理用
辞書を置き、必要な分の漢字データのみをホスト・コン
ピュータより転送利用するなどの応用も図れる。
単語辞書を置き、ターミナルコンピュータに文法処理用
辞書を置き、必要な分の漢字データのみをホスト・コン
ピュータより転送利用するなどの応用も図れる。
[発明の効果] 以上説明したように、本発明によれば、内部記憶装置上
に展開された文節解析用辞書を使用して文節分かち書き
処理を実行するので、文節分かち書き処理を高速に実行
することができる。また、文節解析用辞書は、単語辞書
に含まれるかな見出しと品詞に対応するかな見出しと品
詞とを含むので、文節分かち書き処理とかな文字列の変
換処理とに整合性を持たせることができる。この結果、
かな漢字変換処理全体を高速化することができるという
効果がある。
に展開された文節解析用辞書を使用して文節分かち書き
処理を実行するので、文節分かち書き処理を高速に実行
することができる。また、文節解析用辞書は、単語辞書
に含まれるかな見出しと品詞に対応するかな見出しと品
詞とを含むので、文節分かち書き処理とかな文字列の変
換処理とに整合性を持たせることができる。この結果、
かな漢字変換処理全体を高速化することができるという
効果がある。
第1図は本発明のかな漢字変換装置を示すブロック図で
ある。 第2図は本発明のかな漢字変換装置の動作を示すフロー
チャート図である。 第3図は本発明のかな漢字変換装置の文法処理用辞書と
単語辞書の構造を示す図である。
ある。 第2図は本発明のかな漢字変換装置の動作を示すフロー
チャート図である。 第3図は本発明のかな漢字変換装置の文法処理用辞書と
単語辞書の構造を示す図である。
Claims (1)
- 【請求項1】入力されたかな文字列を同音異字語を選択
しつつ漢字かな混じり文に変換する、かな漢字変換装置
において、 かな見出しと漢字文字列と品詞とを含み、かな文字列と
漢字文字列とを対応づけるための単語辞書と、 前記単語辞書に含まれる漢字文字列を含まず、前記単語
辞書に含まれるかな見出しと品詞に対応するかな見出し
と品詞とを含み、内部記憶装置上に展開された文節解析
用辞書と、 前記入力されたかな文字列から文節候補として抽出され
るかな文字列の品詞を前記文節解析用辞書から検索しつ
つ、各文節候補の品詞に基づいて前記入力されたかな文
字列に対し文節文かち書き処理を実行する文節文かち書
き手段と、 該文節文かち書き手段により文節分かち書き処理された
かな文字列を漢字文字列に変換する処理を、前記単語辞
書を使用して実行する変換手段と、 を備えることを特徴とするかな漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61058666A JPH0766380B2 (ja) | 1986-03-17 | 1986-03-17 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61058666A JPH0766380B2 (ja) | 1986-03-17 | 1986-03-17 | かな漢字変換装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62214468A JPS62214468A (ja) | 1987-09-21 |
JPH0766380B2 true JPH0766380B2 (ja) | 1995-07-19 |
Family
ID=13090907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61058666A Expired - Lifetime JPH0766380B2 (ja) | 1986-03-17 | 1986-03-17 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0766380B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0833886B2 (ja) * | 1988-10-14 | 1996-03-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | かな漢字変換装置および方法 |
JPH0469766A (ja) * | 1990-07-10 | 1992-03-04 | Pfu Ltd | かな漢字変換装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59112328A (ja) * | 1982-12-20 | 1984-06-28 | Fujitsu Ltd | カナ漢字変換処理方式 |
-
1986
- 1986-03-17 JP JP61058666A patent/JPH0766380B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS62214468A (ja) | 1987-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
CN101470701A (zh) | 支持基于有限状态机的语义规则的文本分析器及其方法 | |
KR100288144B1 (ko) | 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법 | |
JP3532780B2 (ja) | 音声仮名文字の入力順序を生成するための入力システム | |
JPH0766380B2 (ja) | かな漢字変換装置 | |
CN102147796B (zh) | 一种词汇检索方法及其装置 | |
JPH1027183A (ja) | データ登録方法および装置 | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
JP2002132789A (ja) | 文書検索方法 | |
JP3628565B2 (ja) | 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体 | |
JPS6057421A (ja) | 文書作成装置 | |
JP2959769B2 (ja) | 日本語文字列の形態素解析方法及び装置 | |
JP2668205B2 (ja) | 文章検索装置 | |
JP2695772B2 (ja) | 仮名漢字変換装置 | |
JPS59100939A (ja) | 日本語入力装置 | |
JPH0830631A (ja) | 辞書検索方式 | |
JP2001034394A (ja) | 音声仮名文字の入力順序を生成するための入力システム | |
JPH0350669A (ja) | 情報処理装置 | |
JPH07160700A (ja) | 文書処理方法及びその装置 | |
JPH10334085A (ja) | 文字入力装置 | |
JPS6243769A (ja) | 仮名漢字変換装置 | |
JPS6118065A (ja) | カナ漢字変換処理装置 | |
JPH0628391A (ja) | 辞書生成システム | |
JPH0833884B2 (ja) | 仮名漢字変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |