JPH0766380B2 - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0766380B2
JPH0766380B2 JP61058666A JP5866686A JPH0766380B2 JP H0766380 B2 JPH0766380 B2 JP H0766380B2 JP 61058666 A JP61058666 A JP 61058666A JP 5866686 A JP5866686 A JP 5866686A JP H0766380 B2 JPH0766380 B2 JP H0766380B2
Authority
JP
Japan
Prior art keywords
kana
kanji
character string
dictionary
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61058666A
Other languages
English (en)
Other versions
JPS62214468A (ja
Inventor
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP61058666A priority Critical patent/JPH0766380B2/ja
Publication of JPS62214468A publication Critical patent/JPS62214468A/ja
Publication of JPH0766380B2 publication Critical patent/JPH0766380B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、日本語文章を入力する為に、入力されたかな
文字列を、かな漢字混じり文章に変換するかな漢字変換
装置における単語辞書検索に関する。
〔従来の技術〕
従来のかな漢字変換における単語辞書検索の高速化の方
式としては、大きく分けて以下の様な方法がとられてい
た。
(1) 単語辞書を高速検索媒体(ROM)上に構築す
る。
(2) 単語辞書検索用の検索テーブル(インデック
ス)をできるだけ多く、手記憶装置に常駐する。
(3) 単語辞書を木構造化し、アクセス回数を減少す
る。
しかし、(1)の方法では、読み専用記憶装置の為、使
用頻度に基づく完全な単語学習が不可能であり、
(2),(3)の方法は、文節分かち書き処理より単語
辞書を直接検索している為低速な記憶媒体を使用する場
合、検索時間が多く掛かるという欠点があった。
〔発明が解決しようとする問題点〕
以上述べた様に、文節分かち書き処理より単語辞書を直
接検索していると低速な記憶媒体を使用する場合、検索
時間が多く掛かり、かな漢字変換処理時間を増大してし
まう。特に、「二文節最長一致法」「文節数最小法」等
辞書検索回数の多い変換方式の場合、検索時間の低減が
必要である。
[問題点を解決する為の手段] これらの問題点を解決する為、本発明は、かな漢字変換
装置において、かな見出しと漢字文字列と品詞とを含
み、かな文字列と漢字文字列とを対応づけるための単語
辞書と、前記単語辞書に含まれる漢字文字列を含まず、
前記単語辞書に含まれるかな見出しと品詞に対応するか
な見出しと品詞とを含み、内部記憶装置上に展開された
文節解析様辞書と、前記入力されたかな文字列から文節
候補として抽出されるかな文字列の品詞を前記文節解析
用辞書から検索しつつ、各文節候補の品詞に基づいて前
記入力されたかな文字列に対し文節分かち書き処理を実
行する文節分かち書き手段と、該文節分かち書き手段に
より文節分かち書き処理されたかな文字列を漢字文字列
に変換する処理を、前記単語辞書を使用して実行する変
換手段と、を備えることを特徴とする。
[作用] 本発明のかな漢字変換装置では、内部記憶装置上に展開
された文節解析用辞書を用いて文節分かち書き処理が実
行される。
〔実施例〕
ここで、以下に本発明の詳細を図示した実施例に基づい
て説明する。
第1図は本発明のかな漢字変換装置を示す図である。図
中符号1は入力部2より入力されたデータに基づきシス
テム全体の制御を行なう中央処理装置(以下CPUと略
す)である。まずかな漢字変換装置7の起動時点で文法
処理用辞書作成部8により、単語辞書12より文法処理用
辞書11を作成し、以降かな漢字変換処理に入る。
入力部2により読み込まれた文字列はかな漢字変換装置
7に送られ、かな漢字変換が行なわれる。かな漢字変換
装置7内では、文節分かち書き部10が文法処理用辞書11
を検索し、文節分かち書きを行なう。この文節分かち書
きデータの候補は、漢字候補作成部13に送られ、単語辞
書12を検索しながら文節候補が作成され、文節候補出力
部14により順次文節単位に候補が出力される。なお、文
節のかな漢字変換処理を実行する際には、単語辞書12を
内部記憶装置上に展開しておいてもよい。文法処理用辞
書11は単語辞書12に比べてデータ量が少ないので、単語
辞書12が内部記憶装置上に展開されている場合にも文法
処理用辞書11を使用することによって文節分かち書き処
理を高速化する効果がある。
かな漢字変換が行なわれた文節候補群は、文節候補表示
部4により表示され、文節候補選択部3により、逐次文
節候補が文節候補確定部5により確定される。全文節が
確定すると、そのデータは文章格納部6に格納されると
共に、かな漢字変換装置7内の確定文節受取部15に送ら
れ、これをもとに使用頻度学習部16は、漢字候補作成部
13に蓄積された解析データに基づき、文法処理用辞書11
と単語辞書12に単語の使用頻度学習を行なう。
この一連の動作により、かな漢字変換において最大の処
理時間を要する文節分かち書き処理の単語検索処理時間
を削減でき、高速なかな漢字変換を可能とする。
第2図は、本発明の動作を説明するフローチャートであ
る。
ここで、200において、かな漢字変換の始まる前に文法
処理用辞書が作成される。
201において、かな文字列が入力され、これが終了符号
であった場合202により終了処理となる。終了でない場
合は203により文法処理用辞書11を検索/参照しながら
文節分かち書きが成され、このデータをもとに204によ
り、単語辞書12が検索/参照されて、文節分かち書きさ
れた漢字候補データが出力され、205で文節単位にユー
ザにより、候補の選択,確定がなされ取消の符号が入力
されれば、201の処理にもどり、そうでないなら207によ
り単語辞書の使用頻度学習が成され、208により文法処
理用辞書の使用頻度学習が成され、かな入力201と戻り
一連の動作が繰り返される。
第3図は、本発明の文法処理用辞書11と単語辞書の構造
を示す図である。単語辞書は、図の様にブロック化され
た12bは、複数のブロックより成る。漢字部12bと、その
ブロックを示すインデクス部12aより成り、インデクス
部12aはブロックの最大見出し12cを羅列している。また
漢字部12bは、かな見出し12d,品詞12e,漢字12fを1レコ
ードとして持っている。
文法処理用辞書は、文節分かち書きに必要な情報を持つ
だけでよい為、図の様にブロック化されたデータ部11b
(11b)は、複数のブロックより成る。)と、そのブロ
ックを示すインデクス部11aより成り、インデクス部11a
はブロックの最大見出し11cを羅列している。またデー
タ部11bは、かな見出し11d,品詞11eを1レコードとして
持ち、漢字情報を持たない。
なお、文法処理用辞書11は漢字データを含まないので比
較的データ量が少なく、内部記憶装置上に展開される。
従って、この文法処理用辞書11を用いて文節分かち書き
処理を高速に行なうことができる。
本来、文節分かち書きに必要な情報とは、単語のかな見
出しと文法情報である品詞のみであり、かな文字列を漢
字文字列に変換するものは文節分かち書き用に検索され
た単語の内、文法的に適当と思われる一部のもののみで
ある。文節分から書きを主記憶上(内部記憶装置上)で
高速に行ない、かな文字列を漢字文字列に変換する時の
み、単語辞書を使用することにより、大幅にかな漢字変
換処理全体を高速化できる。
なお、この考え方を応用して、ホスト・コンピュータに
単語辞書を置き、ターミナルコンピュータに文法処理用
辞書を置き、必要な分の漢字データのみをホスト・コン
ピュータより転送利用するなどの応用も図れる。
[発明の効果] 以上説明したように、本発明によれば、内部記憶装置上
に展開された文節解析用辞書を使用して文節分かち書き
処理を実行するので、文節分かち書き処理を高速に実行
することができる。また、文節解析用辞書は、単語辞書
に含まれるかな見出しと品詞に対応するかな見出しと品
詞とを含むので、文節分かち書き処理とかな文字列の変
換処理とに整合性を持たせることができる。この結果、
かな漢字変換処理全体を高速化することができるという
効果がある。
【図面の簡単な説明】
第1図は本発明のかな漢字変換装置を示すブロック図で
ある。 第2図は本発明のかな漢字変換装置の動作を示すフロー
チャート図である。 第3図は本発明のかな漢字変換装置の文法処理用辞書と
単語辞書の構造を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力されたかな文字列を同音異字語を選択
    しつつ漢字かな混じり文に変換する、かな漢字変換装置
    において、 かな見出しと漢字文字列と品詞とを含み、かな文字列と
    漢字文字列とを対応づけるための単語辞書と、 前記単語辞書に含まれる漢字文字列を含まず、前記単語
    辞書に含まれるかな見出しと品詞に対応するかな見出し
    と品詞とを含み、内部記憶装置上に展開された文節解析
    用辞書と、 前記入力されたかな文字列から文節候補として抽出され
    るかな文字列の品詞を前記文節解析用辞書から検索しつ
    つ、各文節候補の品詞に基づいて前記入力されたかな文
    字列に対し文節文かち書き処理を実行する文節文かち書
    き手段と、 該文節文かち書き手段により文節分かち書き処理された
    かな文字列を漢字文字列に変換する処理を、前記単語辞
    書を使用して実行する変換手段と、 を備えることを特徴とするかな漢字変換装置。
JP61058666A 1986-03-17 1986-03-17 かな漢字変換装置 Expired - Lifetime JPH0766380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61058666A JPH0766380B2 (ja) 1986-03-17 1986-03-17 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61058666A JPH0766380B2 (ja) 1986-03-17 1986-03-17 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPS62214468A JPS62214468A (ja) 1987-09-21
JPH0766380B2 true JPH0766380B2 (ja) 1995-07-19

Family

ID=13090907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61058666A Expired - Lifetime JPH0766380B2 (ja) 1986-03-17 1986-03-17 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0766380B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833886B2 (ja) * 1988-10-14 1996-03-29 インターナショナル・ビジネス・マシーンズ・コーポレーション かな漢字変換装置および方法
JPH0469766A (ja) * 1990-07-10 1992-03-04 Pfu Ltd かな漢字変換装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59112328A (ja) * 1982-12-20 1984-06-28 Fujitsu Ltd カナ漢字変換処理方式

Also Published As

Publication number Publication date
JPS62214468A (ja) 1987-09-21

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JP3532780B2 (ja) 音声仮名文字の入力順序を生成するための入力システム
JPH0766380B2 (ja) かな漢字変換装置
CN102147796B (zh) 一种词汇检索方法及其装置
JPH1027183A (ja) データ登録方法および装置
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JP2002132789A (ja) 文書検索方法
JP3628565B2 (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPS6057421A (ja) 文書作成装置
JP2959769B2 (ja) 日本語文字列の形態素解析方法及び装置
JP2668205B2 (ja) 文章検索装置
JP2695772B2 (ja) 仮名漢字変換装置
JPS59100939A (ja) 日本語入力装置
JPH0830631A (ja) 辞書検索方式
JP2001034394A (ja) 音声仮名文字の入力順序を生成するための入力システム
JPH0350669A (ja) 情報処理装置
JPH07160700A (ja) 文書処理方法及びその装置
JPH10334085A (ja) 文字入力装置
JPS6243769A (ja) 仮名漢字変換装置
JPS6118065A (ja) カナ漢字変換処理装置
JPH0628391A (ja) 辞書生成システム
JPH0833884B2 (ja) 仮名漢字変換装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term