JPH10171797A - 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体 - Google Patents

辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体

Info

Publication number
JPH10171797A
JPH10171797A JP8325388A JP32538896A JPH10171797A JP H10171797 A JPH10171797 A JP H10171797A JP 8325388 A JP8325388 A JP 8325388A JP 32538896 A JP32538896 A JP 32538896A JP H10171797 A JPH10171797 A JP H10171797A
Authority
JP
Japan
Prior art keywords
unit
pointer
dictionary
headword
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8325388A
Other languages
English (en)
Inventor
Akira Hamada
明 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8325388A priority Critical patent/JPH10171797A/ja
Publication of JPH10171797A publication Critical patent/JPH10171797A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 高速な見出し語検索を可能にする。 【解決手段】 見出し語のアドレスに対応する単語情報
を格納した辞書本体と、見出し語を構成する全文字コー
ドのアドレスと対応づけられるポインタ列を格納したポ
インタユニットを見出し語の文字列に応じて接続したユ
ニット部と、見出し語となる文字列等の入力や辞書検索
を指示する入力装置と、入力された文字列に対応するポ
インタを前記ユニット部の各ポインタユニットから順次
検索して見出し語のアドレスに変換する見出し語検索C
PUとを備えた構成にする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、仮名漢字変換、文
書校正等の自然言語処理用の辞書の構造を備えた辞書見
出し語検索装置とそれを用いた仮名漢字変換装置並びに
辞書見出し語検索装置制御プログラムを記憶した媒体に
関する。
【0002】
【従来の技術】図9は従来の辞書見出し語検索装置の構
成を示す説明図である。図9に示すように、従来の自然
言語処理用辞書は、見出し語902と単語情報903を
対にして格納している。例えば、先頭文字のインデック
ス901によって区切られた見出し語902が文字コー
ド順に配列されており、入力された文字列と見出し語9
02の文字列のマッチングを逐次取っていき、マッチし
た見出し語902を対応する単語情報903に変換する
ようになっている。この辞書検索は、検索速度が遅いの
で、例えば、以下の辞書検索方法が提案されている。
【0003】特開昭57−185575号公報に記載の
仮名漢字変換処理装置では、見出し部を可変長差分構造
にし、単語辞書をブロックに分け、そのブロックの語数
を示すインデックスを付加することで、余分なマッチン
グを省いて検索時間を短縮している。また、特開昭61
−005369号公報に記載のかな漢字変換用辞書で
は、漢字表記部の位置を示すポインタを有する木構造の
かな見出し部と、それに対応する漢字表記を可変長で記
憶する漢字表記部を備えることで、かな見出し部の記憶
容量を圧縮するとともに余分なマッチングを省いて検索
時間を短縮している。
【0004】
【発明が解決しようとする課題】しかしながら、いずれ
にしてもマッチングによる辞書検索はマッチしない場合
のやり直し(バックトラック)を含んでいるため、語数
の増大とともに検索時間も増大していた。 このため、
実用的な大語彙の辞書を持つ自然言語処理では、辞書検
索に要する時間が全体の処理時間のなかで大きな比重を
占め、検索した単語情報を用いた言語処理を圧迫するよ
うな状況も発生している。
【0005】本発明は以上の事情を考慮してなされたも
のであり、例えば、マッチングなしで辞書の見出し語を
検索することにより辞書検索時間を大幅に短縮すること
ができる辞書見出し語検索装置とそれを用いた仮名漢字
変換装置並びに辞書見出し語検索装置制御プログラムを
記憶した媒体を提供するものである。
【0006】
【課題を解決するための手段】図1は本発明の辞書見出
し語検索装置の基本構成を示すブロック図である。図1
に示すように、本発明は、見出し語のアドレスに対応す
る単語情報を格納した辞書部101と、見出し語を構成
する全文字コードのアドレスと対応づけられるポインタ
列を格納したポインタユニットを見出し語の文字列に応
じて接続されたユニット部102と、見出し語となる文
字列等の入力や辞書検索を指示する入力部103と、入
力された文字列に対応するポインタを前記ユニット部1
02の各ポインタユニットを順次検索して見出し語のア
ドレスに変換する見出し語検索部104とを備えてなる
辞書見出し語検索装置である。
【0007】なお、本発明において、辞書部101、ユ
ニット部102、見出し語検索部104は、CPU、R
OM、RAM、I/Oポートからなるマイクロコンピュ
ータで構成される。辞書部101は、この中のROMで
構成される。ユニット部102はROM、RAMで構成
される。入力部103はキーボード、マウス、ペン・タ
ブレット等の入力装置で構成される。
【0008】本発明によれば、入力された文字列の文字
コードと見出し語の文字コードとのマッチングをとる必
要がなく、マッチング処理によるバックトラックのない
高速な見出し語検索が実現できる。これにより、高速な
辞書検索が可能になる。
【0009】前記ユニット部102の各ポインタユニッ
トは、前記見出し語検索部104によって検索された一
つ前のポインタユニットのポインタに対応するアドレス
を一つの見出し語のアドレスとして登録する領域を設け
た構成にすることができる。前記構成によれば、入力さ
れた文字列の一部を見出し語のアドレスとして変換する
ことができる。
【0010】前記ユニット部102は、複数の文字を一
つのアドレスに対応したポインタユニットで構成するこ
とができる。前記構成によれば、拗音で構成される複数
の文字を一つのポインタユニットで構成して、ユニット
部のポインタ容量を低減することができる。
【0011】前記ユニット部102は、複数のポインタ
ユニットを一つの文字コードのアドレスに対応して構成
することができる。前記構成によれば、漢字コードなど
2バイトで構成される文字コードに対して同じポインタ
ユニットを対応させることができる。
【0012】前記ユニット部102は、予め分割された
見出し語の後半部のアドレスと前半部のアドレスが接続
可能に設定されたポインタユニットで構成することがで
きる。前記構成によれば、長い見出し語は予め分割し
て、見出し語の後半部のアドレスと入力文字列から検索
した見出し語の前半部のアドレスと接続することによ
り、ユニット部のポインタ容量を低減することができ
る。
【0013】また、本発明によれば、見出し語のアドレ
スに対応する単語情報を格納した辞書部101と、見出
し語を構成する全文字コードのアドレスと対応づけられ
るフラグ列を格納したフラグユニットを見出し語の文字
列に応じて接続されたユニット部102、見出し語とな
る文字列等の入力や辞書検索を指示する入力部103
と、入力された文字列に対応するフラグを前記ユニット
部102の各フラグユニットから順次検索して見出し語
のアドレスに変換する見出し語検索部104とを備えて
なる辞書見出し語検索装置が提供される。本発明によれ
ば、ポインタをフラグに切り替えることより、ユニット
部の検索ビット容量を削減することができる。
【0014】前記ユニット部102の各フラグユニット
は、前記見出し語検索部によって検索された一つ前のフ
ラグユニットのフラグに対応するアドレスを一つの見出
し語のアドレスとして登録する領域を設けた構成にする
ことができる。
【0015】前記ユニット部102は、複数の文字を一
つのアドレスに対応したフラグユニットで構成すること
ができる。
【0016】前記ユニット部102は、複数のフラグユ
ニットを一つの文字コードのアドレスに対応して構成す
ることができる。
【0017】前記ユニット部102は、予め分割された
見出し語の後半部のアドレスと前半部のアドレスが接続
可能に設定されたフラグユニットで構成することができ
る。
【0018】また、本発明によれば、見出し語のアドレ
スに対応する漢字情報を格納した辞書部101と、見出
し語を構成する全文字コードのアドレスと対応づけられ
るポインタ列を格納したポインタユニットを見出し語の
文字列に応じて接続されたユニット部102と、見出し
語となる文字列等の入力や辞書検索を指示する入力部1
03と、入力された文字列に対応するポインタを前記ユ
ニット部102の各ポインタユニットから順次検索して
見出し語のアドレスに変換する見出し語検索部104
と、入力された文字列を前記辞書部101を参照して検
索された見出し語のアドレスに対応する漢字情報に変換
して表示部106に出力する変換部105とを備えたこ
とを特徴とする仮名漢字変換装置が提供される。
【0019】なお、本発明において、変換部105はマ
イクロコンピュータで構成される。表示部106はCR
Tディスプレイ、LCD(液晶)ディスプレイ、プラズ
マディスプレイなどの表示装置で構成される。入力され
た文字列を一括漢字変換するための形態素解析部107
をさらに備えた構成にしてもよい。形態素解析部107
はマイクロコンピュータで構成される。
【0020】また、本発明によれば、見出し語のアドレ
スに対応する単語情報を格納した辞書部101と、見出
し語を構成する全文字コードのアドレスと対応づけられ
るポインタ列を格納したポインタユニットを見出し語の
文字列に応じて接続されたユニット部102と、見出し
語となる文字列等の入力や辞書検索を指示する入力部1
03とを有する辞書見出し語検索装置をコンピュータに
よって制御するためのプログラムを記憶した媒体であっ
て、該制御プログラムはコンピュータに、入力された文
字列に対応するポインタを前記ユニット部102の各ポ
インタユニットから順次検索して見出し語のアドレスに
変換させることを特徴とする辞書見出し語検索装置制御
プログラムを記憶した媒体が提供される。
【0021】
【発明の実施の形態】以下、図に示す実施例に基づいて
本発明を詳述する。なお、これによって本発明は限定さ
れるのではない。
【0022】図2は本発明を適用した仮名漢字変換装置
の構成を示すブロック図である。同図において、1はC
PU、ROM、RAM、I/Oポートからなるマイクロ
コンピュータで構成される制御部であり、制御プログラ
ムにより装置の各部を制御する(図1の見出し語検索
部、変換部として機能する)。2はROMからなる見出
し語検索部であり、辞書本体3に格納された単語情報に
対応する見出し語のアドレスを検索するポインタユニッ
ト、フラグユニットで構成される(図1のユニット部、
見出し語検索部として機能する)。3はROMからなる
辞書本体であり、漢字表記や品詞情報などの単語情報が
格納され、見出し語検索部2によって検索された見出し
語のアドレスにより、単語情報が検索できるようになっ
ている。4はCRTディスプレイ、LCD(液晶)ディ
スプレイ、またはプラズマディスプレイからなる表示部
であり、入力の文字列や辞書検索結果から生成された変
換候補からなる文書データを表示する(図1の表示部と
して機能する)。
【0023】5はキーボード、マウス、ペン・タブレッ
ト等からなる入力部であり、仮名文字の入力や仮名漢字
変換の指示などを行う(図1の入力部として機能す
る)。6はポインタであり、入力バッファ7のどの位置
の文字を検索対象としているか、また、どの位置の文字
まで検索が進んでいるかを示している。7はRAMから
なる入力バッファであり、入力部5から入力された被変
換文字列を格納する。8はRAMからなる検索状況バッ
ファであり、入力バッファ7の各位置からの検索中の情
報を格納する。
【0024】9はRAMからなるアドレスバッファであ
り、検索された見出しの辞書本体3でのアドレスを格納
する。10はROM、RAMからなるメモリであり、仮
名漢字変換用の文法テーブル(形態素解析テーブル)、
制御プログラム、変換結果バッファなどを含んでいる。
11は外部記憶装置であり、ROM、EEPROMから
なるメモリーカード、ハードディスク、フロッピーディ
スク、CD−ROM等で構成した記憶媒体を読み出すよ
う構成されている。
【0025】本発明において、仮名漢字変換装置の見出
し語検索部のコンピュータに、入力された文字列に対応
するポインタをユニット部の各ポインタユニットから順
次検索して見出し語のアドレスに変換させ、入力された
文字列を辞書本体を参照して検索された見出し語のアド
レスに対応する単語情報に変換して表示部4に出力する
るさせる制御プログラムを、ROM、EEPROMから
なるメモリーカード、ハードディスク、フロッピーディ
スク、CD−ROM等で構成した記憶媒体に記憶させ、
汎用の制御プログラムとして利用できるように構成して
もよい。
【0026】図3は本発明の見出し語検索部の基本構成
を示す説明図である。図3において、20〜26は、辞
書本体3の見出し語として使用される全文字コードと対
応させたポインタの集合である見出し語検索用のポイン
タユニットを示している。文字コードとポインタを対応
させるために、例えば、文字コード順にポインタを配列
し、ポインタユニット先頭からのポインタのアドレスは
文字コードから演算できる構成になっている。
【0027】20は1文字目のポインタを示すポインタ
ユニットで、「あ」と対応するポインタは21を示し、
「わ」と対応するポインタは24を示している。21は
1文字目が「あ」で、1文字目「あ」に続く2文字目の
ポインタを示すポインタユニットである。22は1文字
目が「あ」、2文字目が「い」、すなわち文字列「あ
い」に続く3文字目のポインタを示すポインタユニット
である。23は文字列「あいこ」に続く4文字目のポイ
ンタを示すポインタユニットである。
【0028】ポインタユニット20の「ぁ」やポインタ
ユニット24の「わ」など、辞書本体3に見出し語(辞
書データ)として登録されていない文字の箇所は、特定
の値のアドレスを示すダミーのポインタになっており、
そこで見出し語検索処理を打ち切れるようになってい
る。ポインタユニット先頭のポインタは直前までに経由
したポインタユニットに対応する辞書データを示すよう
になっており、例えば、ポインタユニット22の先頭ポ
インタは文字列「あい」に対応する見出し語を示してい
る。見出し語とする辞書データがない場合は、ダミーの
ポインタになっている。
【0029】ポインタユニット先頭のポインタだけでな
く、それほど長い見出し語がない場合はポインタユニッ
ト23の「あいこう」、「あいこく」のような文字列と
対応したポインタを見出し語としてもよい。各文字と対
応させて、他のポインタユニットを示すポインタと見出
し語を示すポインタの両方を設けてもよいが、ダミーの
ポインタが多くなる。
【0030】以上のように、見出し語に使用される全文
字コードと対応させたポインタの集合をユニット化し、
入力された文字列の文字コードから演算することで文字
コードと対応するポインタをポインタユニット毎にたど
って、見出し語のアドレスを検索するように構成したの
で、入力された文字列の文字コードと見出し語の文字コ
ードとのマッチングをとる必要がなく、マッチング処理
によるバックトラックのない高速な検索が実現できる。
また、文書校正や連文節の仮名漢字変換など、入力され
た文字列の複数箇所から辞書検索を行ったり、文字入力
と共に辞書検索を開始する文書処理装置においては、辞
書検索の高速化が期待できる。
【0031】図4は本発明の見出し語検索部のポインタ
ユニット/フラグユニットの構成を示す説明図である。
図4において、図4(a)は、図3に示す見出し語検索
部のポインタユニット23の構成を示す。図4(b)は
改良型の見出し語検索部のフラグユニット(ポインタユ
ニット)33の構成を示す。図4(a)に示すポインタ
ユニット23の構成は、ダミーのポインタが含むのでダ
ミーのポインタの容量が莫大になってしまう。図4
(b)に示す改良型のフラグユニット33の構成は、実
際には、図3に示すポインタユニットと同じ機能である
が、文字コードとポインタを直接対応させるのではな
く、文字コードにはフラグ列331を対応させ、不必要
なダミーのポインタを除いた構成にしている。
【0032】すなわち、次のフラグユニットへつながる
か、見出し語に含むまれる文字に対応するフラグは
“1”に設定されており、見出し語に含まれない文字に
対応するフラグは“0”に設定されている。また、33
2は、フラグ列331が“1”にセットされている文字
と対応するポインタが集められたポインタ列を示す。図
4(b)において、図3に示すポインタユニット20、
21、22、24、25、26も、改良型のフラグユニ
ット33と同じ構成にすることができる。同様に、ポイ
ンタユニット20、21、22、24、25、26→フ
ラグユニット30、31、32、34、35、36とな
るように構成しているものとする(図示せず)。
【0033】図5は本発明の見出し語検索処理の手順を
示すフローチャートである。図3、図4を用いて、図5
のフローチャートを説明する。ここでは、仮名文字を例
としているが、文字コードとしてはJISX0208の
下位バイトを使用しているものとする。例えば、「ぁ」
21H、「あ」22H〜「ん」73Hとなっている。長
音記号は仮名文字の割り当てられていない77Hであ
る。)
【0034】ステップS200:1文字目のフラグユニ
ット(ポインタユニット)を選択し、被検索文字列の1
文字目を取り出す。 ステップS201:選択されているフラグユニットのフ
ラグ列の先頭フラグを調べる。 ステップS202:1
文字目のフラグユニットのフラグが“0”ならステップ
204へ進む。フラグが“1”ならステップS203へ
進む(フラグユニット33ではフラグが“1”)。
【0035】ステップS203:図4(b)のようにポ
インタの集合332の先頭ポインタは、それまでに経由
して来たポインタユニットに対応する文字列(この場合
「あいこ」)に対応する辞書データ)を示しているの
で、その辞書データを検索状況バッファへ格納する。 ステップS204:被検索文字列から次の対象となる文
字コードを取り出し対応するフラグを調べる。具体的に
は、フラグ列(331)の先頭を0番として、(〔文字
コード〕−20H)番目のフラグを調べる。「あ」なら
22Hで2番目(02H)のフラグ、「と」なら48H
で40番目(28H)のフラグを調べる。
【0036】ステップS205:例えば、「あいこん」
で始まる見出し語が辞書に登録されていない場合、図4
(b)で対象文字が「ん」ならフラグは“0”であり、
処理を終了する。図4(b)で対象文字が「く」や
「と」なら、フラグは“1”であり、ステップS206
へ進む。
【0037】ステップS206:フラグ列331の先頭
から対象となる文字の直前までの“1”の個数を求め
る。つまり、0番目から(〔文字コード〕−21H)番
目までのフラグの“1”の個数を求める。ポインタの集
合332の先頭を0番目として、求めたフラグの“1”
に対応するポインタを取り出す。図4(b)で、「く」
なら先頭と「う」に“1”があるので2番目のポインタ
を取り出す。
【0038】ステップS207:ポインタが辞書データ
を示していれば、ステップS208へ進む。ポインタが
他のポインタユニットを示していれば、ステップS20
9へ進む。 ステップSS208:ポインタの示す辞書データを検索
状況バッファへ格納して、見出し語検索処理を終了す
る。図4(b)で、対象となる文字が「う」なら、ポイ
ンタは「あいこう」に対応する辞書データを示している
ことになる。 ステップS209:ポインタの示すポインタユニットを
選択し、対象となる文字を被検索文字列の次の文字に設
定し、ステップS201に戻る。前記構成によれば、見
出し語検索部の記憶容量を少なくして、辞書検索に要す
る時間を短縮している。
【0039】上記では被検索文字列の1文字毎に文字コ
ードを割り当て、見出し語検索用のポインタユニットを
用意する例を示したが、「きょ」、「しゅ」、「ちゃ」
など複数の文字(拗音)に対して文字コードを割り当て
るようにしてもよい。逆に、漢字が見出し語になる場合
は、2段階のポインタユニットで1つの漢字に対応する
ようにしてもよい。JISX0208では「亜」に対し
て3021Hなど2バイトのコードが割り振られている
が、2段階のポインタユニットに上位バイトと下位バイ
トを振り分けるようにしてもよい(図5参照)。
【0040】図6は本発明の漢字交じり見出し語を検索
する見出し語検索部の構成を示す説明図である。図6に
おいて、20’〜26’は、辞書本体3の見出し語とし
て使用される漢字交じりの文字コードと対応させたポイ
ンタの集合である見出し語検索用の各ポインタユニット
を示し、2段階のポインタユニットで1つの漢字に対応
している。文字コードとポインタを対応させるために、
例えば、文字コード順にポインタを配列し、ポインタユ
ニット先頭からのポインタのアドレスは文字コードから
演算できる構成になっている。
【0041】20’と21’の2ポインタユニットで1
文字目の「あ」と対応するポインタを示している。2
2’と23’の2ポインタユニットで2文字目が「あ」
のポインタを示している。20’と24’の2ポインタ
ユニットで1文字目の「齷」と対応するポインタを示し
ている。25’と26’の2ポインタユニットで2文字
目が「齪」のポインタを示している。図6において、ポ
インタユニット20’、21’、22’、23’、2
4’、25’、26’も、図4(b)に示す改良型のフ
ラグユニット33と同じ構成にすることができる。
【0042】さらに、長い見出し語は分割して検索でき
るようにしてもよい。図7は本発明の長い文字列の見出
し語を分割検索する見出し語検索部の構成を示す説明図
である。図7に示すように、単語情報703と併せて分
割した後半の文字列に対応する辞書データのアドレス7
04を持たせておく。この例では、「あいすくりーむ」
や「あいすぼっくす」は、「あいすく」や「あいすぼ」
まで検索した時点で単語情報を仮にバッファへ蓄えると
ともに、「くりーむ」や「ぼっくす」の辞書データのア
ドレスも記録しておく。
【0043】後の検索で、「く」なり「ぼ」からの検索
を行った際に、記録しておいた「くりーむ」や「ぼっく
す」が検索できれば、仮に蓄えた単語情報を正式に蓄
え、検索できなければ仮に蓄えた単語情報を無効にす
る。これにより、見出し語の容量をさらに節減するとと
もに、1つの被検索文字列の複数箇所から辞書検索を行
う場合には無駄なポインタの検索を省くことができる。
【0044】図4(b)に示すフラグユニット33のよ
うに、フラグ列331を集めて重複を省いてテーブル化
し、ポインタユニット側にはテーブルのフラグ列へのポ
インタを持たせて、さらに容量の削減を図ってもよい。
さらに、ポインタ列332も1ヵ所に集めフラグユニッ
トには332へのポインタを持つようにすれば、フラグ
ユニットが固定長となるので、他のフラグユニットへの
フラグをアドレスの代わりに順番で表現するようにして
もよい。
【0045】ポインタ列332を絶対アドレスではなく
相対的なアドレスや順番として容量の削減を図ってもよ
い。他のポインタユニット(フラグユニット)へのポイ
ンタは現在のポインタユニットからの相対値、辞書デー
タへのポインタであればそれまでに経由したポインタユ
ニットで参照した辞書データからの相対値で表現するこ
ともできる。例えば、図3のような場合なら、「あい
こ」や「あいこう」は「あい」からの相対値で表現すれ
ばよい。「わ」から「わーるど」の相対値が大きすぎる
ようなら、「わー」に対してダミーの辞書データを設け
ることも考えられる。ポインタ列332を可変長化して
辞書データへのポインタの代わりに辞書データ自体を格
納してもよい。
【0046】図8は本発明の文書処理装置の各バッファ
内に格納された各データを示す説明図である。図8にお
いて、6はポインタ、7は入力バッファ、8は検索状況
バッファ8、9はアドレスバッファを示す(図2参
照)。検索状況バッファ8のうち81は、各開始位置か
ら入力バッファ7のどこまで見出し語の解析が進んだか
を示している。82は各開始位置について検索がどの見
出し語検索用のポインタユニットまで進んでいるかを示
している。例えば、入力バッファ7のn番目からの検索
は、図2のポインタユニット13まで進んでいることを
示している。0番目の“−−”は「わ」から始まった検
索が完了していることを示している。
【0047】ポインタ6が1ずつ増えて、バッファ7に
文字が逐次格納されていく場合には、281のうちポイ
ンタ6が示すものと同じ値で、対応する82にポインタ
ユニットの番号が格納されているものが検索処理を継続
することになる。そのポインタユニットでポインタ6が
示す箇所に格納された文字と対応するポインタを調べ、
次のポインタユニットへのポインタであればその値を8
2に格納し、辞書本体3へのポインタがあればアドレス
バッファ9に格納する。
【0048】次のポインタユニットへのポインタが無け
れば、82を検索完了を示すようにマークしておく。検
索を行ったものについては81を1増加しておく。ポイ
ンタ6が指している位置については、81にはポインタ
6の値、82には先頭のポインタユニットである20を
入れて検索を開始する。
【0049】例えば、「後退」キー等の操作によって、
ポインタ6が前に戻って入力バッファ7に文字が入った
場合は、81の値がポインタ6が示す位置より大きなも
のは最初から検索をやり直す。「変換」キーが押された
ら、上記のようにアドレスバッファ9に格納された辞見
出し語を用いて変換を行い、変換結果の漢字表記を生成
する。前記構成のように、漢字交じりの文字列が入力さ
れる装置では、図3の代わりに図6のように漢字表記に
対して見出しを同様に構成した辞書を用いればよい。
【0050】
【発明の効果】入力された文字列の文字コードと見出し
語の文字コードとのマッチングをとる必要がなく、マッ
チング処理によるバックトラックのない高速な見出し語
検索が実現できる。これにより高速な辞書検索が可能に
なる。
【図面の簡単な説明】
【図1】本発明の辞書見出し語検索装置の基本構成を示
すブロック図である。
【図2】本発明を適用した仮名漢字変換装置の構成を示
すブロック図である。
【図3】本発明の見出し語検索部の基本構成を示す説明
図である。
【図4】本発明の見出し語検索部のポインタユニットの
構成を示す説明図である。
【図5】本発明の見出し語検索処理の手順を示すフロー
チャートである。
【図6】本発明の漢字交じり見出し語を検索する見出し
語検索部の構成を示す説明図である。
【図7】本発明の長い文字列の見出し語を分割検索する
見出し語検索部の構成を示す説明図である。
【図8】本発明の文書処理装置の各バッファ内に格納さ
れた各データを示す説明図である。
【図9】従来の辞書見出し語検索装置の構成を示す説明
図である。
【符号の説明】
1 制御部 2 見出し語検索部 3 辞書本体 4 表示部 5 入力部 6 ポインタ 7 入力バッファ 8 検索状況バッファ 9 アドレスバッファ 10 メモリ 11 外部記憶装置

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 見出し語のアドレスに対応する単語情報
    を格納した辞書部と、見出し語を構成する全文字コード
    のアドレスと対応づけられるポインタ列を格納したポイ
    ンタユニットを見出し語の文字列に応じて接続されたユ
    ニット部と、見出し語となる文字列等の入力や辞書検索
    を指示する入力部と、入力された文字列に対応するポイ
    ンタを前記ユニット部の各ポインタユニットから順次検
    索して見出し語のアドレスに変換する見出し語検索部と
    を備えてなる辞書見出し語検索装置。
  2. 【請求項2】 前記ユニット部の各ポインタユニット
    は、前記見出し語検索部によって検索された一つ前のポ
    インタユニットのポインタに対応するアドレスを一つの
    見出し語のアドレスとして登録する領域を設けたことを
    特徴とする請求項1記載の辞書見出し語検索装置。
  3. 【請求項3】 前記ユニット部は、複数の文字を一つの
    アドレスに対応したポインタユニットで構成されること
    を特徴とする請求項1記載の辞書見出し語検索装置。
  4. 【請求項4】 前記ユニット部は、複数のポインタユニ
    ットを一つの文字コードのアドレスに対応して構成され
    ることを特徴とする請求項1記載の辞書見出し語検索装
    置。
  5. 【請求項5】 前記ユニット部は、予め分割した見出し
    語の後半部のアドレスと前半部のアドレスが接続可能に
    設定されたポインタユニットで構成されることを特徴と
    する請求項1記載の辞書見出し語検索装置。
  6. 【請求項6】 見出し語のアドレスに対応する単語情報
    を格納した辞書部と、見出し語を構成する全文字コード
    のアドレスと対応づけられるフラグ列を格納したフラグ
    ユニットを見出し語の文字列に応じて接続されたユニッ
    ト部と、見出し語となる文字列等の入力や辞書検索を指
    示する入力部と、入力された文字列に対応するフラグを
    前記ユニット部の各フラグユニットから順次検索して見
    出し語のアドレスに変換する見出し語検索部とを備えて
    なる辞書見出し語検索装置。
  7. 【請求項7】 前記ユニット部の各フラグユニットは、
    前記見出し語検索部によって検索された一つ前のフラグ
    ユニットのフラグに対応するアドレスを一つの見出し語
    のアドレスとして登録する領域を設けたことを特徴とす
    る請求項5記載の辞書見出し語検索装置。
  8. 【請求項8】 前記ユニット部は、複数の文字を一つの
    アドレスに対応したフラグユニットで構成されることを
    特徴とする請求項5記載の辞書見出し語検索装置。
  9. 【請求項9】 前記ユニット部は、複数のフラグユニッ
    トを一つの文字コードのアドレスに対応して構成される
    ことを特徴とする請求項5記載の辞書見出し語検索装
    置。
  10. 【請求項10】 前記ユニット部は、予め分割された見
    出し語の後半部のアドレスと前半部のアドレスが接続可
    能に設定されたフラグユニットで構成されることを特徴
    とする請求項5記載の辞書見出し語検索装置。
  11. 【請求項11】 見出し語のアドレスに対応する漢字情
    報を格納した辞書部と、見出し語を構成する全文字コー
    ドのアドレスと対応づけられるポインタ列を格納したポ
    インタユニットを見出し語の文字列に応じて接続された
    ユニット部と、見出し語となる文字列等の入力や辞書検
    索を指示する入力部と、入力された文字列に対応するポ
    インタを前記ユニット部の各ポインタユニットから順次
    検索して見出し語のアドレスに変換する見出し語検索部
    と、入力された文字列を前記辞書部を参照して検索され
    た見出し語のアドレスに対応する漢字情報に変換して表
    示部に出力する変換部とを備えたことを特徴とする仮名
    漢字変換装置。
  12. 【請求項12】 入力された文字列を一括漢字変換する
    ための形態素解析部をさらに備えたことを特徴とする請
    求項11記載の仮名漢字変換装置。
  13. 【請求項13】 見出し語のアドレスに対応する漢字情
    報を格納した辞書部と、見出し語を構成する全文字コー
    ドのアドレスと対応づけられるフラグ列を格納したフラ
    グユニットを見出し語の文字列に応じて接続されたユニ
    ット部と、見出し語となる文字列等の入力や辞書検索を
    指示する入力部と、入力された文字列に対応するフラグ
    を前記ユニット部の各フラグユニットから順次検索して
    見出し語のアドレスに変換する見出し語検索部と、入力
    された文字列を前記辞書部を参照して検索された見出し
    語のアドレスに対応する漢字情報に変換して表示部に出
    力する変換部とを備えたことを特徴とする仮名漢字変換
    装置。
  14. 【請求項14】 入力された文字列を一括漢字変換する
    ための形態素解析部をさらに備えたことを特徴とする請
    求項13記載の仮名漢字変換装置。
  15. 【請求項15】 見出し語のアドレスに対応する単語情
    報を格納した辞書部と、見出し語を構成する全文字コー
    ドのアドレスと対応づけられるポインタ列を格納したポ
    インタユニットを見出し語の文字列に応じて接続された
    ユニット部と、見出し語となる文字列等の入力や辞書変
    換を指示する入力部とを有する辞書見出し語検索装置を
    コンピュータによって制御するためのプログラムを記憶
    した媒体であって、該制御プログラムはコンピュータ
    に、入力された文字列に対応するポインタを前記ユニッ
    ト部の各ポインタユニットから順次検索して見出し語の
    アドレスに変換させることを特徴とする辞書見出し語検
    索装置制御プログラムを記憶した媒体。
JP8325388A 1996-12-05 1996-12-05 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体 Pending JPH10171797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8325388A JPH10171797A (ja) 1996-12-05 1996-12-05 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8325388A JPH10171797A (ja) 1996-12-05 1996-12-05 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体

Publications (1)

Publication Number Publication Date
JPH10171797A true JPH10171797A (ja) 1998-06-26

Family

ID=18176283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8325388A Pending JPH10171797A (ja) 1996-12-05 1996-12-05 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体

Country Status (1)

Country Link
JP (1) JPH10171797A (ja)

Similar Documents

Publication Publication Date Title
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
JPH07114558A (ja) 漢字変換訂正処理方式
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH10171797A (ja) 辞書見出し語検索装置とそれを用いた仮名漢字変換装置並びに辞書見出し語検索装置制御プログラムを記憶した媒体
JPH05113964A (ja) 電子辞書
JPH0140372B2 (ja)
JP3585944B2 (ja) データ処理方法及びその装置
JP2862236B2 (ja) 文字処理装置
JPH10154141A (ja) かな漢字変換装置
JP2744241B2 (ja) 文字処理装置
JPH04671A (ja) 電子辞書の検索方式
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JP3537888B2 (ja) かな漢字変換装置
JPS60262263A (ja) 情報検索装置
JPH07152756A (ja) 文書処理装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPS6116117B2 (ja)
JPH0140371B2 (ja)
JPS6175954A (ja) 漢字デ−タ入力方式
JPS62282364A (ja) 文字列検索方式
JPS6257055A (ja) 日本語ワ−ド・プロセツサ
JPS60251461A (ja) 仮名漢字変換装置
JPS6243769A (ja) 仮名漢字変換装置
JPH10228478A (ja) 情報検索方法及び装置
JPH08314915A (ja) 情報の表現態様変換装置