JP2903501B2 - 電子化辞書検索装置 - Google Patents
電子化辞書検索装置Info
- Publication number
- JP2903501B2 JP2903501B2 JP2335088A JP33508890A JP2903501B2 JP 2903501 B2 JP2903501 B2 JP 2903501B2 JP 2335088 A JP2335088 A JP 2335088A JP 33508890 A JP33508890 A JP 33508890A JP 2903501 B2 JP2903501 B2 JP 2903501B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- dictionary
- character
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】 産業上の利用分野 本発明は、ワードプロセッサ、翻訳装置などの自然言
語処理装置等に用いられる電子化辞書検索装置に関する
ものである。
語処理装置等に用いられる電子化辞書検索装置に関する
ものである。
従来の技術 近年、自然言語処理等の情報処理技術、およびLSI技
術の発展に伴いワードプロセッサは普及し、さらに翻訳
装置も市場に出まわっている。
術の発展に伴いワードプロセッサは普及し、さらに翻訳
装置も市場に出まわっている。
以下図面を参照しながら、従来の電子化辞書検索装置
の一例について説明する。
の一例について説明する。
第3図(a)は、従来の電子化辞書検索装置のブロッ
ク図を示すものであり、同図において、33aは単語がコ
ード順に格納されている辞書、34aは、辞書33aの各単語
の1文字目の文字(以下インデックスという)を基準と
して、文字毎に、その文字から始まる各種単語のエンド
アドレスを持つインデックス・テーブル、31は検索すべ
き単語の検索要求を行なう検索要求部、32はその検索要
求部31から検索要求された単語の1文字目をインデック
ス・テーブル34aに参照して、辞書33aの検索すべき位置
のスタートアドレスとエンドアドレスを求め検索要求部
31から検索要求された単語を辞書33aから検索する辞書
検索部である。
ク図を示すものであり、同図において、33aは単語がコ
ード順に格納されている辞書、34aは、辞書33aの各単語
の1文字目の文字(以下インデックスという)を基準と
して、文字毎に、その文字から始まる各種単語のエンド
アドレスを持つインデックス・テーブル、31は検索すべ
き単語の検索要求を行なう検索要求部、32はその検索要
求部31から検索要求された単語の1文字目をインデック
ス・テーブル34aに参照して、辞書33aの検索すべき位置
のスタートアドレスとエンドアドレスを求め検索要求部
31から検索要求された単語を辞書33aから検索する辞書
検索部である。
また、第3図(b)において、33bは辞書33aの具体
例、34bはインデックス・テーブル34aの具体例である。
例、34bはインデックス・テーブル34aの具体例である。
以上のように構成された従来例の電子化辞書検索装置
について、次にその動作を説明する。
について、次にその動作を説明する。
まず、検索要求部31は辞書検索部32に対して、検索す
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部32は、まず、検索要求部31から検索要求された
単語の1文字目の文字(インデックス)の1つ前のイン
デックスのエンドアドレスと検索要求部31から検索要求
された単語の1文字目の文字(インデックス)のエンド
アドレスをインデックス・テーブル34aから参照する。
また検索要求された単語のインデックスのスタートアド
レスは、検索要求された単語の1つ前のインデックスの
エンドアドレス+1であるが、検索要求された単語の1
つ前のインデックスが存在しないときは検索要求された
単語のインデックスのスタートアドレスは1である。最
後に辞書検索部32は、辞書33aの前記スタートアドレス
とエンドアドレスとの間を検索する。
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部32は、まず、検索要求部31から検索要求された
単語の1文字目の文字(インデックス)の1つ前のイン
デックスのエンドアドレスと検索要求部31から検索要求
された単語の1文字目の文字(インデックス)のエンド
アドレスをインデックス・テーブル34aから参照する。
また検索要求された単語のインデックスのスタートアド
レスは、検索要求された単語の1つ前のインデックスの
エンドアドレス+1であるが、検索要求された単語の1
つ前のインデックスが存在しないときは検索要求された
単語のインデックスのスタートアドレスは1である。最
後に辞書検索部32は、辞書33aの前記スタートアドレス
とエンドアドレスとの間を検索する。
さらに、具体的な例をあげて、従来例の実施例を説明
する。
する。
はじめに、検索要求部31は辞書検索部32に対して
「『亜鉛』という単語を検索しろ」という検索要求を行
なう。この検索要求を受けて辞書検索部32は、まず、イ
ンデックスである『亜』の1つ前のインデックスのエン
ドアドレスと『亜』のインデックスのエンドアドレスを
インデックス・テーブル34a(34b)を参照する。この場
合、『亜』の1つ前のインデックスは存在しないので、
『亜』から始まる単語のスタートアドレスは1となり、
またエンドアドレスは5となる。最後に辞書検索部32
は、辞書33a(33b)のアドレス=1からアドレス=5の
間を検索して、アドレス=2に『亜鉛』という単語を検
索する。
「『亜鉛』という単語を検索しろ」という検索要求を行
なう。この検索要求を受けて辞書検索部32は、まず、イ
ンデックスである『亜』の1つ前のインデックスのエン
ドアドレスと『亜』のインデックスのエンドアドレスを
インデックス・テーブル34a(34b)を参照する。この場
合、『亜』の1つ前のインデックスは存在しないので、
『亜』から始まる単語のスタートアドレスは1となり、
またエンドアドレスは5となる。最後に辞書検索部32
は、辞書33a(33b)のアドレス=1からアドレス=5の
間を検索して、アドレス=2に『亜鉛』という単語を検
索する。
発明が解決しようとする課題 しかしながら、上記のような構成では、自然言語の形
態素解析(最長一致法等の処理手法を用いる)等に用い
る電子化辞書検索装置として、以下のような課題を有し
ていた。
態素解析(最長一致法等の処理手法を用いる)等に用い
る電子化辞書検索装置として、以下のような課題を有し
ていた。
1.辞書に格納されていない長い語長の単語の検索要求が
されると、そのような長い語長の単語が無いにも関わら
ず、存在するところまで一語づつ縮めながら、無駄な検
索をしてしまう。従って検索時間が長くなってしまう
(課題1)。
されると、そのような長い語長の単語が無いにも関わら
ず、存在するところまで一語づつ縮めながら、無駄な検
索をしてしまう。従って検索時間が長くなってしまう
(課題1)。
2.辞書に格納されていない異なった文字種で構成される
単語の検索要求がされると、無駄な検索をしてしまう。
従って検索時間が長くなってしまう(課題2)。
単語の検索要求がされると、無駄な検索をしてしまう。
従って検索時間が長くなってしまう(課題2)。
そこで、課題2を解決するために、従来は、文字種の
境界を利用した仮文節分解を用いて単語検索が行われて
きたが、これを用いると、異なった文字種で構成される
単語が、検索できない(課題2′)。
境界を利用した仮文節分解を用いて単語検索が行われて
きたが、これを用いると、異なった文字種で構成される
単語が、検索できない(課題2′)。
本発明は、上記従来の電子化辞書検索装置の課題を解
決するもので、検索時間が短く、プログラムサイズが小
さく、検索性能の良い優れた電子化辞書検索装置を提供
することを目的とするものである。
決するもので、検索時間が短く、プログラムサイズが小
さく、検索性能の良い優れた電子化辞書検索装置を提供
することを目的とするものである。
課題を解決するための手段 上記課題1の「辞書に格納されていない長い語長の単
語の検索要求がされると、無駄な検索をしてしまう。し
たがって検索時間が長くなってしまう。」を解決するた
めに、本発明の電子化辞書検索装置は、単語がコード順
に格納されている辞書と、辞書の各単語の1文字目の文
字毎にその文字から始まる単語のアドレス情報とその文
字から始まる単語の最長語長情報とを持つインデックス
・テーブルと、検索要求された単語長がインデックス・
テーブルに格納されている最長語長より長いときは、イ
ンデックス・テーブルに格納されている最長語長で検索
を打ち切る機能を持ち、前記インデックス・テーブルに
格納されているアドレス情報に示された部分のみ前記辞
書を最長一致検索する辞書検索手段とを備えている。
語の検索要求がされると、無駄な検索をしてしまう。し
たがって検索時間が長くなってしまう。」を解決するた
めに、本発明の電子化辞書検索装置は、単語がコード順
に格納されている辞書と、辞書の各単語の1文字目の文
字毎にその文字から始まる単語のアドレス情報とその文
字から始まる単語の最長語長情報とを持つインデックス
・テーブルと、検索要求された単語長がインデックス・
テーブルに格納されている最長語長より長いときは、イ
ンデックス・テーブルに格納されている最長語長で検索
を打ち切る機能を持ち、前記インデックス・テーブルに
格納されているアドレス情報に示された部分のみ前記辞
書を最長一致検索する辞書検索手段とを備えている。
また、上記課題2の「辞書に格納されていない異なっ
た文字種で構成される単語の検索要求がされると、無駄
な検索をしてしまう。従って検索時間が長くなってしま
う。」を解決するために本発明の電子化辞書検索装置
は、単語がコード順に格納されている辞書と、辞書の各
単語の1文字目の文字毎にその文字から始まる単語のア
ドレス情報とその文字から始まる単語が異なる文字種か
ら構成されているか否かという情報とを持つインデック
ス・テーブルと、検索要求された単語長が異なる文字種
から構成されており、前記インデックス・テーブルに格
納されている情報がその文字から始まる単語で異なる文
字種から構成されているものがないときは、検索要求さ
れた単語の先頭から同一の文字種分だけで検索を打ち切
る機能を持ち、前記インデックス・テーブルに格納され
ているアドレス情報に示された部分のみ前記辞書を検索
する辞書検索手段とを有している。
た文字種で構成される単語の検索要求がされると、無駄
な検索をしてしまう。従って検索時間が長くなってしま
う。」を解決するために本発明の電子化辞書検索装置
は、単語がコード順に格納されている辞書と、辞書の各
単語の1文字目の文字毎にその文字から始まる単語のア
ドレス情報とその文字から始まる単語が異なる文字種か
ら構成されているか否かという情報とを持つインデック
ス・テーブルと、検索要求された単語長が異なる文字種
から構成されており、前記インデックス・テーブルに格
納されている情報がその文字から始まる単語で異なる文
字種から構成されているものがないときは、検索要求さ
れた単語の先頭から同一の文字種分だけで検索を打ち切
る機能を持ち、前記インデックス・テーブルに格納され
ているアドレス情報に示された部分のみ前記辞書を検索
する辞書検索手段とを有している。
作用 請求項1の本発明では、まず辞書検索手段は検索要求
された単語の1文字目の文字をインデックス・テーブル
に参照して、インデックス・テーブルに格納されている
アドレスの情報とその文字から始まる単語の最長語長情
報とを求める。次に辞書検索手段は前記インデックス・
テーブルに格納されているアドレス情報に示された部分
のみ前記辞書を検索する。この検索の際、検索要求され
た単語の語長がインデックス・テーブルに格納されてい
る最長語長より長いときはインデックス・テーブルに格
納されている最長語長で検索を打ち切る。
された単語の1文字目の文字をインデックス・テーブル
に参照して、インデックス・テーブルに格納されている
アドレスの情報とその文字から始まる単語の最長語長情
報とを求める。次に辞書検索手段は前記インデックス・
テーブルに格納されているアドレス情報に示された部分
のみ前記辞書を検索する。この検索の際、検索要求され
た単語の語長がインデックス・テーブルに格納されてい
る最長語長より長いときはインデックス・テーブルに格
納されている最長語長で検索を打ち切る。
以上のように本発明では、辞書に格納されていない長
い語長の単語の検索要求がされても、無駄な検索を少な
くすることができる。従って検索時間を短くすることが
できる。
い語長の単語の検索要求がされても、無駄な検索を少な
くすることができる。従って検索時間を短くすることが
できる。
また、請求項2の本発明では、まず辞書検索手段は検
索要求された単語の1文字目の文字をインデックス・テ
ーブルに参照して、インデックス・テーブルに格納され
ているアドレスの情報とその文字から始まる単語が異な
る文字種から構成されているか否かという情報を求め
る。次に辞書検索手段は前記インデックス・テーブルに
格納されているアドレス情報に示された部分のみ前記辞
書を検索する。この検索の際、検索要求された単語が異
なる文字種から構成されており、インデックス・テーブ
ルに格納されている情報がその文字から始まる単語で異
なる文字種から構成されているものがないときは、検索
要求された単語の先頭から同一の文字種分だけで検索を
打ち切る。
索要求された単語の1文字目の文字をインデックス・テ
ーブルに参照して、インデックス・テーブルに格納され
ているアドレスの情報とその文字から始まる単語が異な
る文字種から構成されているか否かという情報を求め
る。次に辞書検索手段は前記インデックス・テーブルに
格納されているアドレス情報に示された部分のみ前記辞
書を検索する。この検索の際、検索要求された単語が異
なる文字種から構成されており、インデックス・テーブ
ルに格納されている情報がその文字から始まる単語で異
なる文字種から構成されているものがないときは、検索
要求された単語の先頭から同一の文字種分だけで検索を
打ち切る。
以上のように本発明では、辞書に格納されていない異
なった文字種で構成される単語の検索要求がされても、
無駄な検索を少なくすることができる。従って検索時間
を短くすることができる。
なった文字種で構成される単語の検索要求がされても、
無駄な検索を少なくすることができる。従って検索時間
を短くすることができる。
実施例 以下本発明の実施例について図面を参照して説明す
る。
る。
第1図(a),(b)は本発明の電子化辞書検索装置
の第1の実施例であり、これは請求項1の本発明の実施
例に対応する。
の第1の実施例であり、これは請求項1の本発明の実施
例に対応する。
第1図(a)は本発明の電子化辞書検索装置の第1の
実施例のブロック図を示すものであり、同図において、
13aは単語がコード順に格納されている辞書、14aは辞書
13aの各単語の1文字目の文字(インデックス)毎にそ
の文字から始まる単語のエンドアドレスと、その文字か
ら始まる単語の最長語長情報とを持つインデックス・テ
ーブル、11は検索すべき単語の検索要求を行なう検索要
求手段としての検索要求部、12はその検索要求部11から
検索要求された単語の1文字目(インデックス)からイ
ンデックス・テーブル14aを参照して、辞書13aの検索す
べき位置のスタートアドレスと、エンドアドレスと、そ
の文字から始まる単語の最長語長とを求め、検索要求部
11から検索要求された単語を辞書13aから検索する辞書
検索手段としての辞書検索部である。この際、辞書検索
部12は検索要求部11から検索要求された単語の語長がイ
ンデックス・テーブル14aに格納されているその文字か
ら始まる単語の最長語長より長いときは、インデックス
・テーブル14aに格納されている最長語長で検索を打ち
切るようになっている。
実施例のブロック図を示すものであり、同図において、
13aは単語がコード順に格納されている辞書、14aは辞書
13aの各単語の1文字目の文字(インデックス)毎にそ
の文字から始まる単語のエンドアドレスと、その文字か
ら始まる単語の最長語長情報とを持つインデックス・テ
ーブル、11は検索すべき単語の検索要求を行なう検索要
求手段としての検索要求部、12はその検索要求部11から
検索要求された単語の1文字目(インデックス)からイ
ンデックス・テーブル14aを参照して、辞書13aの検索す
べき位置のスタートアドレスと、エンドアドレスと、そ
の文字から始まる単語の最長語長とを求め、検索要求部
11から検索要求された単語を辞書13aから検索する辞書
検索手段としての辞書検索部である。この際、辞書検索
部12は検索要求部11から検索要求された単語の語長がイ
ンデックス・テーブル14aに格納されているその文字か
ら始まる単語の最長語長より長いときは、インデックス
・テーブル14aに格納されている最長語長で検索を打ち
切るようになっている。
また、第1図(b)において、13bは辞書13aの具体
例、14bはインデックス・テーブル14aの具体例である。
例、14bはインデックス・テーブル14aの具体例である。
なお、検索要求部11、辞書13a、13bは従来例と同じも
のである。
のである。
以上のように構成された本発明の電子化辞書検索装置
の第1の実施例について、その動作を説明する。
の第1の実施例について、その動作を説明する。
まず、検索要求部11は辞書検索部12に対して、検索す
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部12は、まず、検索要求部11から検索要求された
単語の1文字目の文字(インデックス)の1つ前のイン
デックスのエンドアドレスと、検索要求部11から検索要
求された単語のインデックスのエンドアドレスと、検索
要求部11から検索要求された単語のインデックスから始
まる単語の最長語長情報とをインデックス・テーブル14
aから参照する。
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部12は、まず、検索要求部11から検索要求された
単語の1文字目の文字(インデックス)の1つ前のイン
デックスのエンドアドレスと、検索要求部11から検索要
求された単語のインデックスのエンドアドレスと、検索
要求部11から検索要求された単語のインデックスから始
まる単語の最長語長情報とをインデックス・テーブル14
aから参照する。
検索要求された単語のインデックスのスタートアドレ
スは、検索要求された単語のインデックスの1つ前のイ
ンデックスのエンドアドレス+1であるが、検索要求さ
れた単語の1つ前のインデックスが存在しないときは検
索要求された単語のインデックスのスタートアドレスは
1である。最後に辞書検索部12は、辞書13aの前記スタ
ートアドレスとエンドアドレスとの間を検索する。
スは、検索要求された単語のインデックスの1つ前のイ
ンデックスのエンドアドレス+1であるが、検索要求さ
れた単語の1つ前のインデックスが存在しないときは検
索要求された単語のインデックスのスタートアドレスは
1である。最後に辞書検索部12は、辞書13aの前記スタ
ートアドレスとエンドアドレスとの間を検索する。
この際、辞書検索部12は検索要求部11から検索要求さ
れた単語の語長がインデックス・テーブル14aに格納さ
れているその文字から始まる単語の最長語長より長いと
きは、インデックス・テーブル14aに格納されている最
長語長で検索を打ち切る。
れた単語の語長がインデックス・テーブル14aに格納さ
れているその文字から始まる単語の最長語長より長いと
きは、インデックス・テーブル14aに格納されている最
長語長で検索を打ち切る。
さらに、具体的な例をあげて、その本発明の電子化辞
書検索装置の第1の実施例を説明する。
書検索装置の第1の実施例を説明する。
はじめに、検索要求部11は辞書検索部12に対して
「『亜寒帯夏雨気候』という単語を検索しろ」という検
索要求を行なう。この検索要求を受けて辞書検索部12
は、まず、『亜』の1つ前のインデックスのエンドアド
レスと、『亜』のインデックスのエンドアドレスをイン
デックス・テーブル14a(14b)に参照する。『亜』の1
つ前のインデックスは存在しないので、『亜』から始ま
る単語のスタートアドレスは1となり、またエンドアド
レスは5となる。
「『亜寒帯夏雨気候』という単語を検索しろ」という検
索要求を行なう。この検索要求を受けて辞書検索部12
は、まず、『亜』の1つ前のインデックスのエンドアド
レスと、『亜』のインデックスのエンドアドレスをイン
デックス・テーブル14a(14b)に参照する。『亜』の1
つ前のインデックスは存在しないので、『亜』から始ま
る単語のスタートアドレスは1となり、またエンドアド
レスは5となる。
つぎに、辞書検索部12は、『亜』の最長語長をインデ
ックス・テーブル14a(14b)を参照して、『亜』から始
まる単語の最長語長=2を検出する。検索要求された単
語は『亜寒帯夏雨気候』と7文字であるが、インデック
ス・テーブル14a(14b)に格納されている『亜』から始
まる単語の最長語長=2なので、検索は『亜寒』で打ち
切る。
ックス・テーブル14a(14b)を参照して、『亜』から始
まる単語の最長語長=2を検出する。検索要求された単
語は『亜寒帯夏雨気候』と7文字であるが、インデック
ス・テーブル14a(14b)に格納されている『亜』から始
まる単語の最長語長=2なので、検索は『亜寒』で打ち
切る。
最後に、辞書検索部12は、辞書13a(13b)のアドレス
=1から5の間を『亜寒』を検索するが、この場合、辞
書13a(13b)に『亜寒』は格納されておらず、検索単語
長を、1減じて、アドレス=1で『亜』という単語を検
索して見つける。
=1から5の間を『亜寒』を検索するが、この場合、辞
書13a(13b)に『亜寒』は格納されておらず、検索単語
長を、1減じて、アドレス=1で『亜』という単語を検
索して見つける。
以上のように本発明によれば、辞書13aの各単語の1
文字目の文字毎にその文字から始まる単語の最長語長情
報を持つインデックス・テーブル14aと、検索要求され
た単語がインデックス・テーブル14aに格納されている
各単語の1文字目の文字毎にその文字から始まる単語の
最長語長情報より長いとき、最長語長で検索を打ち切る
辞書検索部12を備えたことにより検索時間を短くするこ
とができる。
文字目の文字毎にその文字から始まる単語の最長語長情
報を持つインデックス・テーブル14aと、検索要求され
た単語がインデックス・テーブル14aに格納されている
各単語の1文字目の文字毎にその文字から始まる単語の
最長語長情報より長いとき、最長語長で検索を打ち切る
辞書検索部12を備えたことにより検索時間を短くするこ
とができる。
第2図(a)、(b)は本発明の電子化辞書検索装置
の第2の実施例であり、これは請求項1、2の本発明の
実施例に対応する。
の第2の実施例であり、これは請求項1、2の本発明の
実施例に対応する。
第2図(a)は本発明の電子化辞書検索装置の第2の
実施例のブロック図を示すものであり、同図において、
23aは単語がコード順に格納されている辞書、24aは辞書
23aの各単語の1文字目の文字毎にその文字から始まる
単語のエンドアドレスと、その文字から始まる単語の最
長語長情報と、その文字から始まる単語が異なる文字種
から構成されているか否かという情報とを持つインデッ
クス・テーブル、21は検索すべき単語の検索要求を行な
う検索要求手段としての検索要求部、22はその検索要求
部21から検索要求された単語の1文字目をインデックス
・テーブル24aで参照して辞書23aの検索すべき位置のス
タートアドレスとエンドアドレスと、最長語長と、その
文字から始まる単語が異なる文字種から構成されている
か否かという情報とを求め、検索要求部21から検索要求
された単語を、辞書23aから検索する辞書検索手段とし
ての辞書検索部である。この際、辞書検索部22は検索要
求部21から検索要求された単語が異なる文字種から構成
されており、一方、その文字から始まる単語で異なる文
字種から構成されているものはないとの情報がインデッ
クス・テーブル24aに格納されているときは、検索要求
された単語の先頭から同一の文字種分だけで検索を打ち
切る。
実施例のブロック図を示すものであり、同図において、
23aは単語がコード順に格納されている辞書、24aは辞書
23aの各単語の1文字目の文字毎にその文字から始まる
単語のエンドアドレスと、その文字から始まる単語の最
長語長情報と、その文字から始まる単語が異なる文字種
から構成されているか否かという情報とを持つインデッ
クス・テーブル、21は検索すべき単語の検索要求を行な
う検索要求手段としての検索要求部、22はその検索要求
部21から検索要求された単語の1文字目をインデックス
・テーブル24aで参照して辞書23aの検索すべき位置のス
タートアドレスとエンドアドレスと、最長語長と、その
文字から始まる単語が異なる文字種から構成されている
か否かという情報とを求め、検索要求部21から検索要求
された単語を、辞書23aから検索する辞書検索手段とし
ての辞書検索部である。この際、辞書検索部22は検索要
求部21から検索要求された単語が異なる文字種から構成
されており、一方、その文字から始まる単語で異なる文
字種から構成されているものはないとの情報がインデッ
クス・テーブル24aに格納されているときは、検索要求
された単語の先頭から同一の文字種分だけで検索を打ち
切る。
また、第2図(b)において、23bは辞書23aの具体
例、24bはインデックス・テーブル24aの具体例である。
例、24bはインデックス・テーブル24aの具体例である。
なお、検索要求部21、辞書23a、23bは従来例と同じも
のである。
のである。
以上のように構成された本発明の電子化辞書検索装置
の第2の実施例について、その動作を説明する。
の第2の実施例について、その動作を説明する。
まず、検索要求部21は辞書検索部22に対して、検索す
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部22は、まず、検索要求部21から検索要求された
単語のインデックスの1つ前のインデックスのエンドア
ドレスと、検索要求部21から検索要求された単語のイン
デックスのエンドアドレスと、検索要求部21から検索要
求された単語のインデックスから始まる単語が異なる文
字種から構成されているか否かという情報とをインデッ
クス・テーブル24aから参照する。検索要求された単語
のインデックスのスタートアドレスは、検索要求された
単語のインデックスの1つ前のインデックスのエンドア
ドレス+1であるが、検索要求された単語のインデック
スの1つ前のインデックスが存在しないときは検索要求
された単語のインデックスのスタートアドレスは1であ
る。最後に辞書検索部22は、辞書23aの前記スタートア
ドレスとエンドアドレスとの間を検察する。この際、辞
書検索部22は検索要求部21から検索要求された単語が異
なる文字種から構成されており、一方、その文字から始
まる単語で異なる文字種から構成されているものはない
との情報がインデックス・テーブル24aに格納されてい
るときは、検索要求された単語の先頭から同一の文字種
分だけで検索を打ち切る。
べき単語の検索要求を行なう。この検索要求を受けて辞
書検索部22は、まず、検索要求部21から検索要求された
単語のインデックスの1つ前のインデックスのエンドア
ドレスと、検索要求部21から検索要求された単語のイン
デックスのエンドアドレスと、検索要求部21から検索要
求された単語のインデックスから始まる単語が異なる文
字種から構成されているか否かという情報とをインデッ
クス・テーブル24aから参照する。検索要求された単語
のインデックスのスタートアドレスは、検索要求された
単語のインデックスの1つ前のインデックスのエンドア
ドレス+1であるが、検索要求された単語のインデック
スの1つ前のインデックスが存在しないときは検索要求
された単語のインデックスのスタートアドレスは1であ
る。最後に辞書検索部22は、辞書23aの前記スタートア
ドレスとエンドアドレスとの間を検察する。この際、辞
書検索部22は検索要求部21から検索要求された単語が異
なる文字種から構成されており、一方、その文字から始
まる単語で異なる文字種から構成されているものはない
との情報がインデックス・テーブル24aに格納されてい
るときは、検索要求された単語の先頭から同一の文字種
分だけで検索を打ち切る。
さらに、具体的な例をあげて、本発明の電子化辞書検
索装置の第2の実施例を説明する。
索装置の第2の実施例を説明する。
はじめに、検索要求部21は辞書検索部22に対して
「『亜鉛と銅』という単語を検索しろ」という検索要求
を行なう。この検索要求を受けて辞書検索部22は、ま
ず、インデックス『亜』の1つ前のインデックスのエン
ドアドレスと『亜』のインデックスのエンドアドレスを
インデックス・テーブル24a(24b)に参照する。『亜』
の1つ前のインデックスは存在しないので、『亜』から
始まる単語のスタートアドレスは1となり、またエンド
アドレスは5となる。
「『亜鉛と銅』という単語を検索しろ」という検索要求
を行なう。この検索要求を受けて辞書検索部22は、ま
ず、インデックス『亜』の1つ前のインデックスのエン
ドアドレスと『亜』のインデックスのエンドアドレスを
インデックス・テーブル24a(24b)に参照する。『亜』
の1つ前のインデックスは存在しないので、『亜』から
始まる単語のスタートアドレスは1となり、またエンド
アドレスは5となる。
つぎに、辞書検索部22は、『亜』から始まる単語が異
なる文字種から構成されているか否かという情報をイン
デックス・テーブル24a(24b)から参照し、『亜』から
始まる単語で異る文字種から構成されているものの最長
語長=0(存在しない)を検出する。検索要求された単
語は『亜鉛と銅』であるが、インデックス・テーブル24
a(24b)に格納されている『亜』から始まる単語で異る
文字種から構成されているものの最長語長が0なので、
検索対象は、『亜鉛』で打ち切る。
なる文字種から構成されているか否かという情報をイン
デックス・テーブル24a(24b)から参照し、『亜』から
始まる単語で異る文字種から構成されているものの最長
語長=0(存在しない)を検出する。検索要求された単
語は『亜鉛と銅』であるが、インデックス・テーブル24
a(24b)に格納されている『亜』から始まる単語で異る
文字種から構成されているものの最長語長が0なので、
検索対象は、『亜鉛』で打ち切る。
最後に、辞書検索部22は、辞書23a(23b)のアドレス
=1から5の間を『亜鉛』を検索し、アドレス=2に
『亜鉛』という単語を検出する。
=1から5の間を『亜鉛』を検索し、アドレス=2に
『亜鉛』という単語を検出する。
さらに別の具体的な例をあげて、本発明の電子化辞書
検索装置の第2の実施例を説明する。
検索装置の第2の実施例を説明する。
はじめに、検索要求部21は辞書検索部22に対して
「『哀れみ深い』という単語を検索しろ」という検索要
求を行なう。この検索要求を受けて辞書検索部22は、ま
ず、インデックス『哀』の1つ前のインデックスのエン
ドアドレスと『哀』のインデックスのエンドアドレスを
インデックス・テーブル24a(24b)に参照する。『哀』
から始まる単語のスタートアドレス=26、またエンドア
ドレス=40となる。次に、辞書検索部22は、『哀』から
始まる単語が異なる文字種から構成されているか否かと
いう情報をインデックス・テーブル24a(24b)に参照
し、『哀』から始まる単語で異る文字種から構成されて
いるものの最長語長=4を検出する。検索要求された単
語は、『哀れみ深い』であるが、インデックス・テーブ
ル24a(24b)に格納されている『哀』から始まる単語で
異る文字種から構成されているものの最長語長=4なの
で、検索対象は、『哀れみ深』までとなる。最後に、辞
書検索部22は、辞書23a(23b)のアドレス=26から40の
間を『哀れみ深』を検索し、アドレス=26に『哀れみ
深』という単語を検出する。なお、異なる文字種から構
成されていないとしても、第1の実施例のように、最長
語長を判断して、検索を打ち切ることはもちろん出来
る。
「『哀れみ深い』という単語を検索しろ」という検索要
求を行なう。この検索要求を受けて辞書検索部22は、ま
ず、インデックス『哀』の1つ前のインデックスのエン
ドアドレスと『哀』のインデックスのエンドアドレスを
インデックス・テーブル24a(24b)に参照する。『哀』
から始まる単語のスタートアドレス=26、またエンドア
ドレス=40となる。次に、辞書検索部22は、『哀』から
始まる単語が異なる文字種から構成されているか否かと
いう情報をインデックス・テーブル24a(24b)に参照
し、『哀』から始まる単語で異る文字種から構成されて
いるものの最長語長=4を検出する。検索要求された単
語は、『哀れみ深い』であるが、インデックス・テーブ
ル24a(24b)に格納されている『哀』から始まる単語で
異る文字種から構成されているものの最長語長=4なの
で、検索対象は、『哀れみ深』までとなる。最後に、辞
書検索部22は、辞書23a(23b)のアドレス=26から40の
間を『哀れみ深』を検索し、アドレス=26に『哀れみ
深』という単語を検出する。なお、異なる文字種から構
成されていないとしても、第1の実施例のように、最長
語長を判断して、検索を打ち切ることはもちろん出来
る。
以上のように本発明によれば、辞書23aの各単語の1
文字目の文字毎にその文字から始まる単語が異なる文字
種から構成されているか否かという情報を持つインデッ
クス・テーブル24aと、検索要求部21から検索要求され
た単語が異なる文字種から構成されており、一方、その
文字から始まる単語で異なる文字種から構成されている
ものはないとの情報がインデックス・テーブル24aに格
納されているときは、検索要求された単語の先頭から同
一の文字種分だけで検索を打ち切る辞書検索部22を備え
たことにより検索時間を短くすることができる。
文字目の文字毎にその文字から始まる単語が異なる文字
種から構成されているか否かという情報を持つインデッ
クス・テーブル24aと、検索要求部21から検索要求され
た単語が異なる文字種から構成されており、一方、その
文字から始まる単語で異なる文字種から構成されている
ものはないとの情報がインデックス・テーブル24aに格
納されているときは、検索要求された単語の先頭から同
一の文字種分だけで検索を打ち切る辞書検索部22を備え
たことにより検索時間を短くすることができる。
発明の効果 以上説明したところから明らかなように、本発明は、
単語がコード順に格納されている辞書と、辞書の各単語
の1文字目の文字毎にその文字から始まる単語のアドレ
ス情報とその文字から始まる単語の最長語長情報とを持
つインデックス・テーブルと、検索要求された単語長が
インデックス・テーブルに格納されている最長語長より
長いときはインデックス・テーブルに格納されている最
長語長で検索を打ち切る機能を持ち、前記インデックス
・テーブルに格納されているアドレス情報に示された部
分のみ前記辞書を最長一致検索する辞書検索手段とを備
えているので、辞書に格納されていない長い語長の単語
の検索要求がされても、無駄な検索を少なくすることが
できる。従って検索時間を短くすることができる。
単語がコード順に格納されている辞書と、辞書の各単語
の1文字目の文字毎にその文字から始まる単語のアドレ
ス情報とその文字から始まる単語の最長語長情報とを持
つインデックス・テーブルと、検索要求された単語長が
インデックス・テーブルに格納されている最長語長より
長いときはインデックス・テーブルに格納されている最
長語長で検索を打ち切る機能を持ち、前記インデックス
・テーブルに格納されているアドレス情報に示された部
分のみ前記辞書を最長一致検索する辞書検索手段とを備
えているので、辞書に格納されていない長い語長の単語
の検索要求がされても、無駄な検索を少なくすることが
できる。従って検索時間を短くすることができる。
また、本発明は、単語がコード順に格納されている辞
書と、辞書の各単語の1文字目の文字毎にその文字から
始まる単語のアドレス情報とその文字から始まる単語が
異なる文字種から構成されているか否かという情報とを
持つインデックス・テーブルと、検索要求された単語長
が異なる文字種から構成されており、インデックス・テ
ーブルに格納されている情報がその文字から始まる単語
で異なる文字種から構成されているものがないときは、
検索要求された単語の先頭から同一の文字種分だけで検
索を打ち切る機能を持ち、前記インデックス・テーブル
に格納されているアドレス情報に示された部分のみ前記
辞書を検索する辞書検索手段とを備えているので、辞書
に格納されていない異なった文字種で構成される単語の
検索要求がされても、無駄な検索を、少なくすることが
できる。従って検索時間を短くすることができる。
書と、辞書の各単語の1文字目の文字毎にその文字から
始まる単語のアドレス情報とその文字から始まる単語が
異なる文字種から構成されているか否かという情報とを
持つインデックス・テーブルと、検索要求された単語長
が異なる文字種から構成されており、インデックス・テ
ーブルに格納されている情報がその文字から始まる単語
で異なる文字種から構成されているものがないときは、
検索要求された単語の先頭から同一の文字種分だけで検
索を打ち切る機能を持ち、前記インデックス・テーブル
に格納されているアドレス情報に示された部分のみ前記
辞書を検索する辞書検索手段とを備えているので、辞書
に格納されていない異なった文字種で構成される単語の
検索要求がされても、無駄な検索を、少なくすることが
できる。従って検索時間を短くすることができる。
第1図(a)は本発明の電子化辞書検索装置の第1の実
施例のブロック図、第1図(b)は本発明の第1の実施
例の辞書および、インデックス・テーブル具体例を示す
情報構成図、第2図(a)は本発明の電子化辞書検索装
置の第2の実施例のブロック図、第2図(b)は本発明
の第2の実施例の辞書および、インデックス・テーブル
の具体例を示す情報構成図、第3図(a)は従来例の電
子化辞書検索装置のブロック図、第3図(b)は従来例
の辞書および、インデックス・テーブルの具体例を示す
情報構成図である。 11、21、31……検索要求部、12、32、32、32……辞書検
索部、13a、23a、33a……辞書、14a、24a、34a……イン
デックス・テーブル、13b、23b、33b……辞書の具体的
実施例、14b、24b、34b……インデックス・テーブルの
内容。
施例のブロック図、第1図(b)は本発明の第1の実施
例の辞書および、インデックス・テーブル具体例を示す
情報構成図、第2図(a)は本発明の電子化辞書検索装
置の第2の実施例のブロック図、第2図(b)は本発明
の第2の実施例の辞書および、インデックス・テーブル
の具体例を示す情報構成図、第3図(a)は従来例の電
子化辞書検索装置のブロック図、第3図(b)は従来例
の辞書および、インデックス・テーブルの具体例を示す
情報構成図である。 11、21、31……検索要求部、12、32、32、32……辞書検
索部、13a、23a、33a……辞書、14a、24a、34a……イン
デックス・テーブル、13b、23b、33b……辞書の具体的
実施例、14b、24b、34b……インデックス・テーブルの
内容。
Claims (2)
- 【請求項1】検索を要求する検索要求手段と、各種単語
がコード順に格納されている辞書と、その辞書の各単語
の1文字目の文字(インデックス)毎にその文字から始
まる単語のアドレス情報とその文字から始まる単語の最
長語長情報とを持つインデックス・テーブルと、前記検
索要求手段から検索要求された単語長が前記インデック
ス・テーブルに格納されている最長語長より長いとき
は、前記インデックス・テーブルに格納されている最長
語長を越えるところの検索を打ち切る機能を持ち、前記
インデックス・テーブルに格納されているアドレス情報
に示された部分で、前記辞書を最長一致検索する辞書検
索手段とを備えたことを特徴とする電子化辞書検索装
置。 - 【請求項2】検索を要求する検索要求手段と、単語がコ
ード順に格納されている辞書と、その辞書の各単語の1
文字目の文字(インデックス)毎にその文字から始まる
単語のアドレス情報とその文字から始まる単語が異なる
文字種から構成されているか否かという情報とを少なく
とも持つインデックス・テーブルと、前記検索要求手段
により検索要求された単語が異なる文字種から構成され
ており、前記インデックス・テーブルに格納されている
情報がその文字から始まる単語で異なる文字種から構成
されているものがないときは、検索要求された単語の先
頭から同一の文字種分だけで検索を打ち切る機能を持
ち、前記インデックス・テーブルに格納されているアド
レス情報に示された部分で前記辞書を検索する辞書検索
手段とを持つことを特徴とする電子化辞書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2335088A JP2903501B2 (ja) | 1990-11-29 | 1990-11-29 | 電子化辞書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2335088A JP2903501B2 (ja) | 1990-11-29 | 1990-11-29 | 電子化辞書検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04199466A JPH04199466A (ja) | 1992-07-20 |
JP2903501B2 true JP2903501B2 (ja) | 1999-06-07 |
Family
ID=18284639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2335088A Expired - Fee Related JP2903501B2 (ja) | 1990-11-29 | 1990-11-29 | 電子化辞書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2903501B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2684138B2 (ja) * | 1992-09-17 | 1997-12-03 | 株式会社シーエスケイ | 日本語形態素解析システム及び見出し切り出し方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63153632A (ja) * | 1986-12-17 | 1988-06-27 | Fujitsu Ltd | 文字列検索方式 |
-
1990
- 1990-11-29 JP JP2335088A patent/JP2903501B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04199466A (ja) | 1992-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10685017B1 (en) | Methods and systems for efficient query rewriting | |
JP3160719B2 (ja) | コンピュータのネットワークからワールドワイドウェッブ上のページを捜し出したり、ドキュメントを捜し出したりするためのシステム及び方法 | |
US5099426A (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
US9158764B2 (en) | Method and apparatus for utilizing user feedback to improve signifier mapping | |
US7426544B2 (en) | Method and apparatus for local IP address translation | |
US5307494A (en) | File name length augmentation method | |
JPH11195025A (ja) | ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置 | |
US8522128B1 (en) | Systems and methods for modifying the order of links presented in a document | |
US5950184A (en) | Indexing a database by finite-state transducer | |
KR20100045337A (ko) | 번역 결과가 합성된 만화 컨텐츠를 제공하고 이러한 만화 컨텐츠에 대한 정보를 키워드 검색에 노출시키기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2903501B2 (ja) | 電子化辞書検索装置 | |
KR100269114B1 (ko) | 캐쉬 운영방법 | |
US11841841B2 (en) | Stand in tables | |
US6928616B2 (en) | Method and apparatus for allowing one bookmark to replace another | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP2817103B2 (ja) | データ検索装置及びデータ検索方法 | |
US6735582B2 (en) | Pre-load cursor in a database method and system | |
JPH05204962A (ja) | 電子化辞書検索装置 | |
JPH07168848A (ja) | 単語辞書検索装置 | |
JP2001092845A (ja) | 文書取得方法及び記録媒体 | |
JP2638777B2 (ja) | かな漢字変換装置 | |
JPH087712B2 (ja) | キャッシュ・メモリ装置 | |
JPS61136145A (ja) | キヤツシユメモリ制御回路 | |
JPS61150069A (ja) | 翻訳編集装置 | |
KR910003980A (ko) | 전자교환기 데이터 베이스 관리 시스템의 디스크 상주 데이터 처리방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |