JP2001125907A - 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体 - Google Patents

辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体

Info

Publication number
JP2001125907A
JP2001125907A JP30413099A JP30413099A JP2001125907A JP 2001125907 A JP2001125907 A JP 2001125907A JP 30413099 A JP30413099 A JP 30413099A JP 30413099 A JP30413099 A JP 30413099A JP 2001125907 A JP2001125907 A JP 2001125907A
Authority
JP
Japan
Prior art keywords
word
search
pointer
dictionary
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP30413099A
Other languages
English (en)
Other versions
JP3628565B2 (ja
Inventor
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP30413099A priority Critical patent/JP3628565B2/ja
Publication of JP2001125907A publication Critical patent/JP2001125907A/ja
Application granted granted Critical
Publication of JP3628565B2 publication Critical patent/JP3628565B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 効率的な辞書検索を可能にする。 【解決手段】 まず、ステップ201で文を入力する。
次に、ステップ202に、辞書から入力文と等しいか、
入力文より小さい語を検索する。ステップ203に、検
索された語が入力文の先頭部分と完全に一致するかどう
か判定する。完全一致するならば、ステップ208にそ
の語を検索語リスト103に記憶する。完全一致しなけ
れば、ステップ204〜206でに辞書102に記載さ
れたポインタをたどり、完全一致する語を探す。ステッ
プ208の後、ステップ209で、完全一致した語にポ
インタが記載されていれば、ポインタをたどり、ステッ
プ210で検索語と、ポインタを順にたどって得られた
語を検索語リスト103に記憶する。最後のステップ2
11で、検索語リスト103の語を出力装置に出力す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は辞書検索方法および
装置に関する。
【0002】
【従来の技術】自然言語を形態素に分割する形態素解析
装置は日本語の仮名漢字変換装置や、情報検索装置、機
械翻訳システム、音声認識装置などの自然言語処理シス
テムに広く用いられる。
【0003】日本語や中国語のように単語間に空白など
の区切り記号がない言語の形態素解析では、語がどの文
字から始まっているかが容易には判定できないため、入
力文の部分文字列のうち単語の可能性があるものをすべ
て列挙することが必要である。また、英語など語間に空
白がある言語でも、音声認識の場合には語間の区切りが
明らかでないため、やはり語の可能性があるものすべて
を列挙する必要がある。
【0004】長さnの入力文中に含まれる可能性のある
すべての語を得るために、1文字めから始まる長さ1の
語、長さ2の語、と順に辞書を検索し、次に2文字めか
ら始まる長さ1の語、長さ2の語、と順に検索する方法
がある。この方法でもすべての語が得られるが、この場
合、n(n+1)/2回の辞書検索が必要となり、効率
的ではなかった。
【0005】また、高速な辞書構成方法としてはトライ
構造(例えば「岩波講座ソフトウエア科学15 自然言
語処理」)が知られているが、1文字ごとに木構造をた
どる処理が必要なため、それぞれの回の検索の効率があ
まりよくないという問題があった。
【0006】
【発明が解決しようとする課題】従来、高速な辞書構成
方法として知られているトライ構造では、文字ごとに分
岐する木構造で単語を格納する。この構造を用いた辞書
検索でも、n回の検索で入力文に含まれている可能性の
ある単語をすべて得られるが、1文字ごとに木構造をた
どる処理が必要なため、それぞれの回の検索の効率があ
まりよくないという問題があった。
【0007】本発明の目的は、効率的な検索が可能な辞
書検索方法、装置、および辞書検索プログラムを記録し
た記録媒体を提供することにある。
【0008】
【課題を解決するための手段】本発明の第1の辞書検索
装置は、辞書の各登録語に、その語の先頭部分と完全一
致し、かつその語より短い語へのポインタを記載し、最
長一致する語を検索するだけで、入力文の先頭部分と一
致するすべての語を一度の辞書検索で、すべて得られる
ようにしたものである。
【0009】本発明の第2の辞書検索装置は、第1の辞
書検索装置にさらに、入力文を1文字づつずらしながら
(先頭の1文字を除きながら)検索するようにしたもの
で、これにより入力文長がnの場合、n回の辞書検索で
入力文に含まれている可能性のあるすべての語が得られ
る。
【0010】本発明の第3の辞書検索装置は、第1の辞
書検索装置にさらに、各語に後続語の可能性のある語の
リストをあらかじめ与えることにより、入力文の先頭部
分と一致するすべての語と2文字目から始まる可能性の
ある語のリストを一度の辞書検索で得られるようにした
ものである。
【0011】本発明の第4の辞書検索装置は、第3の辞
書検索装置にさらに、入力文を1文字ずらしながら(先
頭の1文字を除きながら)検索するようにしたものであ
る。これにより、入力文長がnの場合、n回以下の辞書
検索で、入力文に含まれている可能性のある単語が全て
得られる。また、1回の検索を狭い範囲で行うので効率
がよい。
【0012】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0013】図1は本発明の第1の実施形態の辞書検索
装置の構成図である。
【0014】本実施形態の辞書検索装置は、文を入力す
るための入力装置101と、各登録語に、該語の先頭部
分文字列と完全一致し、かつ該語よりも短かい語のう
ち、最長の語へのポインタが記載されている辞書102
と、検索語リスト103と、入力文の先頭部分と完全一
致する語を辞書102から検索し、検索した語を検索語
リスト103に記憶する処理装置104と、検索語リス
ト103の内容を出力(表示または印字)する出力装置
105で構成されている。
【0015】図2は処理装置104の処理内容を示すフ
ローチャートである。まず、ステップ201に、入力装
置101から文を入力する。次に、ステップ202に、
辞書102から入力文と等しいか、入力文より小さい
(入力文より前にある)語を検索する。この検索は二分
探索などにより行うことができる。ステップ203に、
検索された語が入力文の先頭部分と完全に一致するかど
うか判定する。完全一致するならば、ステップ208で
その語を検索語リスト103に記憶する。完全一致しな
ければ、ステップ204で辞書102に記載されたポイ
ンタをたどり、ステップ205で完全一致するかどうか
判定する。完全一致すれば、ステップ208に行く。完
全一致しなければ、ステップ204で、次のポインタの
語を探索する。ステップ206で、ポインタがなけれ
ば、完全一致する語がないことになり、ステップ207
で、「該当語なし」を出力装置105に出力する。ステ
ップ208の後、ステップ209で、完全一致した語に
ポインタが記載されていれば、ポインタをたどり、ステ
ップ210に、完全一致した語と、その語のポインタを
順にたどって得られた語を検索語リスト103に記憶す
る。最後のステップ211で、検索語リスト103の語
を出力装置105に出力する。
【0016】なお、ステップ208はステップ210と
一緒にしてもよい。
【0017】次に、本実施形態の辞書検索装置を日本語
の検索に用いた場合で、「くるまでまつ」を検索する場
合を例にとって本辞書検索装置の動作を説明する。辞書
102には表1の語があったものとする。なお、括弧内
の記述は動作の説明のために記載したもので、辞書検索
装置の動作には関係がない。
【0018】
【表1】
【0019】「くるまえび」には「くるま」へのポイン
タが記載されており、「くるま」には「くる」へのポイ
ンタが記載されており、「でし」と「でんたく」には
「で」へのポインタが記載されている。
【0020】「で」は助詞の「で」と助動詞「だ」の連
用形の2種類があるが、このような同形語の場合、辞書
には1つのエントリのみを設ける。辞書検索終了後に複
数の語に展開するのが容易なことは明らかである。
【0021】まず、ステップ201で「くるまでまつ」
が入力され、ステップ202で「くるまでまつ」が検索
される。辞書順の比較で(「くるまでまつ」<「で」)
で、かつ(「くるまえび」<「くるまでまつ」)である
ので、「3:くるまえび」を得る。次に、ステップ20
3で「くるまでまつ」と「くるまえび」が比較され、
「くるまえび」は「くるまでまつ」の先頭部分と完全一
致しないので、ステップ204でポインタをたどり、
「2:くるま」を得る。ステップ205で「くるまでま
つ」と「くるま」を比較し、「くるま」は「くるまでま
つ」の先頭部分と完全一致するので、ステップ208で
「2:くるま」を検索語リスト103に格納する。ステ
ップ209で「2:くるま」のポインタをたどり、
「1:くる」を得、ステップ210で「1:くる」を検
索語リスト103に格納する。「1:くる」のポインタ
には記載がないので、ステップ211に進み、検索語リ
スト103の「2:くるま」と「1:くる」を出力す
る。
【0022】図3は本発明の第2の実施形態の辞書検索
装置の構成図である。
【0023】本実施形態の辞書検索装置は、文を入力す
るための入力装置301と、各登録語に、該語の先頭部
分文字列と完全一致し、かつ該語よりも短かい語のう
ち、最長の語へのポインタが記載されている辞書302
と、検索語リスト303と、入力文の先頭部分と完全一
致する語を辞書302から検索し、検索した語を検索語
リスト303に記憶し、以降入力文の先頭の1文字ずら
した各文について同様の処理を行う処理装置304と、
検索語リスト303の内容を出力(表示または印字)す
る出力装置305で構成されている。
【0024】図4は処理装置304の処理内容を示すフ
ローチャートである。ステップ401〜410,413
の処理は図2中のステップ201〜210,211と同
じである。本実施形態では、ステップ410の後、ステ
ップ411で、入力文を1文字ずらし、すなわち先頭の
1文字を削除した文についてステップ402以降の処理
を、入力文が無くなるまで繰り返す。
【0025】次に、本実施形態2の辞書検索装置を同様
に日本語の検索に用いた場合で、「くるまでまつ」を検
索した場合を例にとって本辞書検索装置の動作を説明す
る。辞書302として第1の実施形態と同じ辞書102
を用いる。
【0026】まず、「くるまでまつ」が入力され、ステ
ップ402で「くるまでまつ」が検索される。以下、第
1の実施形態と同様の処理がされて「1:くる」と
「2:くるま」の2語が得られ、この2語が検索語リス
ト303に格納される。ステップ411で入力文「くる
までまつ」を1文字ずらし「るまでまつ」で辞書302
を検索する。「るまでまつ」を辞書検索にかけるが、語
の候補は得られない。次に、「までまつ」を辞書検索に
かけ、「3:まで」の1語が得られ、検索語リスト30
3に格納される。次に、「でまつ」を辞書検索にかけ
る。この場合、ステップ402の検索では「5:でし」
が得られるが、入力文の先頭部分とは完全一致しないの
でステップ404で短い語をたどり、「4:で」を得、
この語は先頭部分と完全一致するので「4:で」の1語
が出力される。したがって、検索語リスト303には
「4:で」の1語が格納される。次に、「まつ」を辞書
検索にかけ、「7:まつ」の1語が得られ、検索語リス
ト303に格納される。次に、「つ」を辞書検索にかけ
るが、語の候補は得られない。
【0027】結果として、検索語リスト303には、表
2の語が得られ、「くるまでまつ」に含まれる可能性の
ある語がすべて得られている。
【0028】
【表2】
【0029】図5は本発明の第3の実施形態の辞書検索
装置の構成図である。
【0030】本実施形態の辞書検索装置は、文を入力す
るための入力装置501と、各登録語に、該語の先頭部
分文字列と完全一致し、かつ該語よりも短かい語のう
ち、最長の語へのポインタと、該語の2文字目以降を先
頭に持つ語である可能後続語(FL)が記載されている
辞書502と、可能後続語リスト503と、検索語リス
ト504と、入力文の先頭部分と完全一致する語を辞書
502から検索し、検索した語を検索語リスト504に
記憶し、また完全一致した語の、辞書502に記載され
ている可能後続語を可能後続語リスト503に記憶する
処理装置505と、検索語リスト504と可能後続語リ
スト503の内容を出力(表示または印字)する出力装
置506で構成されている。
【0031】図6は処理装置505の処理内容を示すフ
ローチャートである。ステップ601〜607,60
9,610の処理は図2中のステップ201〜207,
209,210と同じである。本実施形態では、ステッ
プ603で完全一致するならば、ステップ608で、辞
書502に記載されている、完全一致する語の可能後続
語を可能後続語リスト503に格納する。最後のステッ
プ611では、可能後続語リスト503と検索語リスト
504に格納された語を全て出力する。
【0032】なお、ステップ601と602は順序が入
れ替ってもよく、またステップ608はステップ610
の後でもよい。
【0033】次に、本実施形態の辞書検索装置を同様に
日本語の検索に用いた場合で、「くるまでまつ」を辞書
502中の全語から検索した場合を例にとって本辞書検
索装置の動作を説明する。辞書502には表3の語があ
ったものとする。なお、括弧内の記述は動作の説明のた
めに記載したもので、辞書検索装置の動作には関係がな
い。
【0034】
【表3】
【0035】「くる」の可能後続語としては、「9:る
まん」と「10:るもい」が記載されている。これは
「くる」の2文字目から始まる語としてはこの2語の可
能性があることを示している。「くるま」の可能後続語
としては、「9:るまん」のみが記載されている。これ
は「くるま」の2文字目から始まる語としては「るま
ん」のみが可能性があることを示している。「くるまえ
び」の場合には、2文字目から始まる、すなわち「るま
えび」で始まる語が辞書502に存在していないため、
可能後続語欄には“なし”と記載されている。同様に、
「まで」の可能後続語には「4:で」から「6:でんた
く」の語が記載されており、その他の語が「まで」の2
文字目(で)から始まる可能性がないことを示してい
る。
【0036】まず、ステップ601で「くるまでまつ」
が入力される。ステップ602で第1の実施形態のステ
ップ202と同様の処理で「3:くるまえび」を得、ス
テップ603〜607で第1の第1の実施形態のステッ
プ203〜207と同様の処理で、「2:くるま」を得
る。ステップ608では「2:くるま」に記載されてい
る可能後続語「9:るまん」を可能後続語リスト503
に格納する。ステップ609,610では第1の実施形
態のステップ209,210と同様の処理で、検索語リ
スト504に「2:くるま」と「1:くる」の2語を格
納する。ステップ611では、検索語として「2:くる
ま」と「1:くる」の2語を、可能後続語として「9:
るまん」を出力装置506に出力する。
【0037】図7は本発明の第4の実施形態の辞書検索
装置の構成図である。
【0038】本実施形態の辞書検索装置は、文を入力す
るための入力装置701と、各登録語に、該語の先頭部
分文字列と完全一致し、かつ該語よりも短かい語のう
ち、最長の語へのポインタと、該語の可能後続語(F
L)が記載されている辞書702と、可能後続語リスト
703と、検索語リスト704と、入力文の先頭部分と
完全一致する語を辞書702から検索し、検索した語を
検索語リスト704に記憶し、また完全一致した語の、
辞書702に記載されている可能後続語を可能後続語リ
スト703に記憶し、以後入力文を1文字ずらし、すな
わち先頭の1文字を順次除いた文について同様の処理を
行う処理装置705と、検索語リスト704と可能後続
語リスト703の内容を出力(表示または印字)する出
力装置706で構成されている。
【0039】図8は本実施形態の処理装置705の処理
内容を示すフローチャートである。図8中、ステップ8
01、803〜808、810〜812、816の処理
は図6中のステップ601、602〜607、608〜
610、611と同じである。ステップ802では辞書
702の検索範囲を「辞書中の全語」に初期化する。ス
テップ809で検索語が無かった場合、ステップ813
で辞書702の検索範囲を「辞書中の全語」に設定す
る。ステップ814,815の処理は図4中のステップ
411,412と同じである。
【0040】なお、ステップ801と802の順序が入
れ替っていてもよい。
【0041】次に、同様に、本実施形態の辞書検索装置
を日本語の検索に用いた場合で、「くるまでまつ」を検
索した場合を例にとって本辞書検索装置の動作を説明す
る。辞書702として第3の実施形態と同じ辞書502
を用いる。
【0042】まず、ステップ801で「くるまでまつ」
が入力され、ステップ802で検索範囲は「辞書中の全
語」、すなわち(1〜10)と初期化される。ステップ
803で「くるまでまつ」が検索範囲の中から検索され
る。検索によって前記実施形態と同様の処理をして
「1:くる」と「2:くるま」の2語と可能後続語リス
ト(9〜9)が得られる。ステップ810で(9〜9)
を可能後続語リスト703に格納する。ステップ812
で「1:くる」と「2:くるま」の2語を検索語リスト
704に格納する。
【0043】次に、ステップ814で入力文を1文字ず
らし、「るまでまつ」を与える。ステップ803では、
「るまでまつ」を範囲(9〜9)から検索する。この場
合、「るまん」は「るまでまつ」の先頭部分と完全一致
しないので、語の候補が得られないことが、辞書全体か
ら検索するよりも狭い検索範囲で判明する。検索語がな
かったのでステップ813で検索範囲を「辞書中の全
語」に設定する。
【0044】次に、「までまつ」を辞書検索にかけ、
「辞書中の全語」から検索する。その結果「8:まで」
の1語が得られ、検索語リスト704に格納される。次
に、「でまつ」を検索する。同様に、「4:で」から
「6:でんたく」の範囲から検索し、「4:で」の1語
が検索され検索語リスト704に格納される。
【0045】次に、「まつ」を辞書検索にかけ、「4:
で」の可能後続語(1〜10)のすべてから検索し、
「7:まつ」の1語が得られ、検索語リスト704に格
納される。
【0046】「7:まつ」の可能後続語は“なし”と記
載されているため、ステップ803で「つ」から始まる
語は存在しないことを即座に判定し、語の候補は得られ
ない。
【0047】結果として、第2の実施形態と同様に表2
の検索結果リストが得られ、「くるまでまつ」に含まれ
る可能性のある語がすべて得られている。
【0048】図9は第1の実施形態の辞書検索装置をパ
ソコン等のコンピュータで実施する場合の構成図であ
る。
【0049】入力装置901は入力装置101に対応
し、キーボード等である。記憶装置902,903はそ
れぞれ辞書102、検索語リスト103に相当する。記
憶装置904はハードディスクである。出力装置905
は出力装置105に相当し、プリンタ、ディスプレイ等
である。記録媒体906は処理装置104の処理(図
2)を辞書検索プログラムとして記録した、フロッピィ
・ディスク、CD−ROM、光磁気ディスク等の記録媒
体である。データ処理装置907は記録媒体906から
辞書検索プログラムを読み込んで、これを実行するCP
Uである。
【0050】なお、第2、第3、第4の実施形態の辞書
検索装置も同様に、パソコン等のコンピュータ上で実施
することができる。
【0051】
【発明の効果】以上説明したように、本発明によれば、
下記のような効果がある。
【0052】請求項1の発明では、入力文の先頭部分と
一致する可能性のある語が一度の検索で得られる。請求
項2の発明では、請求項1の辞書検索装置を、入力文を
1文字づつずらしながら検索するため、入力文長がnの
場合、n回の辞書検索で入力文に含まれる可能性のある
すべての語が得られるため、高速な形態素解析が実現で
きる。請求項3の発明では、各文字から始まる語の検索
の際に自動的に後続語の可能性の範囲が絞られるため、
2文字目以降の辞書検索でより効率的な辞書検索が実現
できる。請求項4の発明によって、さらに高速な形態素
解析が実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の辞書検索装置の構成
図である。
【図2】第1の実施形態の処理の流れを示すフローチャ
ートである。
【図3】本発明の第2の実施形態の辞書検索装置の構成
図である。
【図4】第2の実施形態の処理の流れを示すフローチャ
ートである。
【図5】本発明の第3の実施形態の辞書検索装置の構成
図である。
【図6】第3の実施形態の処理の流れを示すフローチャ
ートである。
【図7】本発明の第4の実施形態の辞書検索装置の構成
図である。
【図8】第4の実施形態の処理の流れを示すフローチャ
ートである。
【図9】第1の実施形態の辞書検索装置をパソコン等の
コンピュータ上で実施する場合の構成図である。
【符号の説明】
101,301,501,701 入力装置 102,302,502,702 辞書 103,303,504,704 検索語リスト 104,304,505,705 処理装置 105,305,506,706 出力装置 503,703 可能後続語リスト 201〜211,401〜413,601〜611,8
01〜816 ステップ 901 入力装置 902,903,904 記憶装置 905 出力装置 906 記録媒体 907 データ処理装置

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文を入力するステップと、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタが記
    載されている辞書から前記入力文と等しいか、前記入力
    文より小さい語を検索するステップと、 検索語が前記入力文の先頭部分と完全一致するかどうか
    判定するステップと、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどるステップと、 完全一致した後にポインタが記載されていれば、ポイン
    タを順にたどるステップと、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶するステップと、 前記検索語リストを出力するステップを有する辞書検索
    方法。
  2. 【請求項2】 文を入力するステップと、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタが記
    載されている辞書から前記入力文と等しいか、前記入力
    文より小さい語を検索するステップと、 検索語が入力文の先頭部分と完全一致するかどうか判定
    するステップと、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどるステップと、 完全一致した後にポインタが記載されていれば、ポイン
    タを順にたどるステップと、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶するステップと、 前記入力文の先頭の1文字、2文字,・・・を除いた各
    文について、前記検索するステップから、前記検索語リ
    ストに記憶するステップまでの処理を繰り返すステップ
    と、 前記検索語リストを出力するステップを有する辞書検索
    方法。
  3. 【請求項3】 文を入力するステップと、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタと、
    該語の2文字目以降を先頭に持つ語である可能後続語が
    記載されている辞書から前記入力文と等しいか、前記入
    力文より小さい語を検索するステップと、 検索語が前記入力文の先頭部分と完全一致するかどうか
    判定するステップと、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどるステップと、 完全一致した語の、前記辞書に記載されている可能後続
    語を可能後続語リストに記憶するステップと、 完全一致した語にポインタが記載されていれば、その語
    のポインタを順にたどるステップと、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶するステップと、 前記検索語リストと前記可能後続語リストを出力するス
    テップを有する辞書検索方法。
  4. 【請求項4】 文を入力するステップと、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタと、
    該語の2文字目以降を先頭に持つ語である可能後続語が
    記載されている辞書の検索範囲を辞書中の全語に初期化
    するステップと、 前記辞書から前記検索範囲の、前記入力文と等しいか、
    前記入力文より小さい語を検索し、検索語が前記入力文
    の先頭部分と完全一致するかどうか判定し、完全一致し
    ていなければ、完全一致する語が見つかるまでポインタ
    を順にたどり、完全一致した語の、前記辞書に記載され
    ている可能後続語を可能後続語リストに記憶し、完全一
    致した語にポインタが記載されていれば、その語のポイ
    ンタを順にたどり、完全一致した語と、その語のポイン
    タを順にたどって得られた語を検索語リストに記憶し、
    完全一致した語が見つからなければ辞書の検索範囲を全
    語に設定するステップと、 前記入力文の先頭の1文字,2文字,・・・を除いた各
    文について、前記検索するステップから、検索範囲を設
    定するステップまでの処理を繰り返すステップと、 前記検索語リストと前記可能後続語リストを出力するス
    テップを有する辞書検索方法。
  5. 【請求項5】 各登録語に、該語の先頭部分文字列と完
    全一致し、かつ該語よりも短かい語のうち、最長の語へ
    のポインタが記載されている辞書と、 検索語リストと、 文を入力する入力装置と、 前記辞書から前記入力文と等しいか、前記入力文より小
    さい語を検索し、検索語が前記入力文の先頭部分と完全
    一致するかどうか判定し、完全一致していなければ、完
    全一致する語が見つかるまでポインタを順にたどり、完
    全一致した語にポインタが記載されていれば、ポインタ
    を順にたどり、完全一致した語と、その語のポインタを
    順にたどって得られた語を前記検索語リストに記憶する
    処理装置と、 前記検索語リストを出力する出力装置を有する辞書検索
    装置。
  6. 【請求項6】 各登録語に、該語の先頭部分文字列と完
    全一致し、かつ該語よりも短かい語のうち、最長の語へ
    のポインタが記載されている辞書と、 検索語リストと、 文を入力する入力装置と、 前記辞書から前記入力文と等しいか、前記入力文より小
    さい語を検索し、検索語が前記入力文の先頭部分と完全
    一致するかどうか判定し、完全一致していなければ、完
    全一致する語が見つかるまでポインタを順にたどり、完
    全一致した語にポインタが記載されていれば、ポインタ
    を順にたどり、完全一致した語と、その語のポインタを
    順にたどって得られた語を前記検索語リストに記憶し、
    前記入力文の先頭の1文字,2文字,・・・を除いた各
    文について、前記の検索から前記検索語リストへの記憶
    までの処理を繰り返す処理装置と、 前記検索語リストを出力する出力装置を有する辞書検索
    装置。
  7. 【請求項7】 各登録語に、該語の先頭部分文字列と完
    全に一致し、かつ該語よりも短かい語のうち、最長の語
    へのポインタと、該語の2文字目以降を先頭に持つ語で
    ある可能後続語が記載されている辞書と、 検索語リストと、 可能後続語リストと、 文を入力する入力装置と、 前記辞書から前記入力文と等しいか、前記入力文より小
    さい語を検索し、検索語が前記入力文の先頭部分と完全
    一致するかどうか判定し、完全一致しなければ、完全一
    致する語が見つかるまで順にポインタをたどり、完全一
    致した語の前記辞書に記載されている可能後続語を前記
    可能後続語リストに記憶し、完全一致した語にポインタ
    が記載されていれば、その語のポインタを順にたどり、
    完全一致した語と、その語のポインタを順にたどって得
    られた語を前記検索語リストに記憶する処理装置と、 前記検索語リストおよび前記可能後続語リストを出力す
    る出力装置を有する辞書検索装置。
  8. 【請求項8】 各登録語に、該語の先頭部分文字列と完
    全に一致し、かつ該語よりも短かい語のうち、最長の語
    へのポインタと、該語の2文字目以降を先頭に持つ語で
    ある可能後続語が記載されている辞書と、 検索語リストと、 可能後続語リストと、 文を入力する入力装置と、 前記辞書の検索範囲を辞書中の全語に初期化し、前記入
    力文と等しいか、前記入力文より小さい語を検索し、検
    索語が前記入力文の先頭部分と完全一致するかどうか判
    定し、完全一致しなければ、完全一致する語が見つかる
    まで順にポインタをたどり、完全一致した語の、前記辞
    書に記載されている可能後続語を前記可能後続語リスト
    に記憶し、完全一致した語にポインタが記載されていれ
    ば、その語のポインタを順にたどり、完全一致した語
    と、その語のポインタを順にたどって得られた語を前記
    検索語リストに記憶し、完全一致した語が見つからなけ
    れば辞書の検索範囲を全語に設定し、前記入力文の先頭
    の1文字,2文字,・・・を除いた各文について、前記
    の検索から前記検索範囲の設定までの処理を繰り返す処
    理装置と、 前記検索語リストおよび前記可能後続語リストを出力す
    る出力装置を有する辞書検索装置。
  9. 【請求項9】 文を入力する手順と、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタが記
    載されている辞書から前記入力文と等しいか、前記入力
    文より小さい語を検索する手順と、 検索語が前記入力文の先頭部分と完全一致するかどうか
    判定する手順と、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどる手順と、 完全一致した語にポインタが記載されていれば、ポイン
    タを順にたどる手順と、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶する手順と、 前記検索語リストを出力する手順をコンピュータに実行
    させるための辞書検索プログラムを記録した記録媒体。
  10. 【請求項10】 文を入力する手順と、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタが記
    載されている辞書から前記入力文と等しいか、前記入力
    文より小さい語を検索する手順と、 検索語が入力文の先頭部分と完全一致するかどうか判定
    する手順と、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどる手順と、 完全一致した語にポインタが記載されていれば、ポイン
    タを順にたどる手順と、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶する手順と、 前記入力文の先頭の1文字,2文字,・・・を除いた各
    文について、前記検索する手順から、検索語リストに記
    憶する手順までの処理を繰り返す手順と、 前記検索語リストを出力する手順をコンピュータに実行
    させるための辞書検索プログラムを記録した記録媒体。
  11. 【請求項11】 文を入力する手順と、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタと、
    該語の2文字目以降を先頭に持つ語である可能後続語が
    記載されている辞書から前記入力文と等しいか、前記入
    力文より小さい語を検索する手順と、 検索語が前記入力文の先頭部分と完全一致するかどうか
    判定する手順と、 完全一致していなければ、完全一致する語が見つかるま
    でポインタを順にたどる手順と、 完全一致した語の、前記辞書に記載されている可能後続
    語を可能後続語リストに記憶する手順と、 完全一致した語にポインタが記載されていれば、その語
    のポインタを順にたどる手順と、 完全一致した語と、その語のポインタを順にたどって得
    られた語を検索語リストに記憶する手順と、 前記検索語リストと前記可能後続語リストを出力する手
    順をコンピュータに実行させるための辞書検索プログラ
    ムを記録した記録媒体。
  12. 【請求項12】 文を入力する手順と、 各登録語に、該語の先頭部分文字列と完全一致し、かつ
    該語よりも短かい語のうち、最長の語へのポインタと、
    該語の2文字目以降を先頭に持つ語である可能後続語が
    記載されている辞書の検索範囲を辞書中の全語に初期化
    する手順と、 前記辞書から前記検索範囲の、前記入力文と等しいか、
    前記入力文より小さい語を検索し、検索語が前記入力文
    の先頭部分と完全一致するかどうか判定し、完全一致し
    ていなければ、完全一致する語が見つかるまでポインタ
    を順にたどり、完全一致した語の、前記辞書に記載され
    ている可能後続語を可能後続語リストに記憶し、完全一
    致した語にポインタが記載されていれば、その語のポイ
    ンタを順にたどり、完全一致した語と、その語のポイン
    タを順にたどって得られた語を検索語リストに記憶し、
    完全一致した語が見つからなければ辞書の検索範囲を全
    語に設定する手順と、 前記入力文の先頭の1文字,2文字,・・・を除いた各
    文について、前記検索する手順から、前記検索範囲を設
    定する手順までの処理を繰り返す手順と、 前記検索語リストと前記可能後続語リストを出力する手
    順をコンピュータに実行させるための辞書検索プログラ
    ムを記録した記録媒体。
JP30413099A 1999-10-26 1999-10-26 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体 Expired - Fee Related JP3628565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30413099A JP3628565B2 (ja) 1999-10-26 1999-10-26 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30413099A JP3628565B2 (ja) 1999-10-26 1999-10-26 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001125907A true JP2001125907A (ja) 2001-05-11
JP3628565B2 JP3628565B2 (ja) 2005-03-16

Family

ID=17929411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30413099A Expired - Fee Related JP3628565B2 (ja) 1999-10-26 1999-10-26 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3628565B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5497230B1 (ja) * 2013-06-10 2014-05-21 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP5586772B1 (ja) * 2013-11-22 2014-09-10 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212523A (ja) * 1996-01-30 1997-08-15 Oki Electric Ind Co Ltd 全文検索方法
JPH10177582A (ja) * 1996-12-18 1998-06-30 Nippon Telegr & Teleph Corp <Ntt> 最長一致検索方法及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212523A (ja) * 1996-01-30 1997-08-15 Oki Electric Ind Co Ltd 全文検索方法
JPH10177582A (ja) * 1996-12-18 1998-06-30 Nippon Telegr & Teleph Corp <Ntt> 最長一致検索方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5497230B1 (ja) * 2013-06-10 2014-05-21 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP2014238772A (ja) * 2013-06-10 2014-12-18 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP5586772B1 (ja) * 2013-11-22 2014-09-10 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP2014238808A (ja) * 2013-11-22 2014-12-18 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法

Also Published As

Publication number Publication date
JP3628565B2 (ja) 2005-03-16

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP4459443B2 (ja) 中国語テキストにおける単語分割
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP4001283B2 (ja) 形態素解析装置および自然言語処理装置
JP2960936B2 (ja) 係り受け解析装置
JP2002503849A (ja) 漢字文における単語区分方法
JP3628565B2 (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPH1011431A (ja) 漢字検索装置および方法
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP3048793B2 (ja) 文字変換装置
JP2655711B2 (ja) 同形語読み分け方式
JP2560224B2 (ja) 文脈構造解析装置
TWI364749B (en) Method of synthesizing pronunciation of chinese sentence
JPH03229367A (ja) テキストベース検索方式
JP2933367B2 (ja) 日本語形態素抽出方法
JP2729342B2 (ja) 仮名漢字変換方法および装置
JP2695772B2 (ja) 仮名漢字変換装置
JP2000311168A (ja) 形態素解析システム及びその方法並びにこの形態素解析プログラムを記録した記録媒体
JPS62282364A (ja) 文字列検索方式
JPH0916575A (ja) 発音辞書装置
JPH10334122A (ja) 類似名検索システムおよび記録媒体
JPS6118065A (ja) カナ漢字変換処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040728

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040927

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040927

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071217

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081217

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101217

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees