JP2005182408A - Term retrieval support system, term retrieval support method and term retrieval support program - Google Patents
Term retrieval support system, term retrieval support method and term retrieval support program Download PDFInfo
- Publication number
- JP2005182408A JP2005182408A JP2003421429A JP2003421429A JP2005182408A JP 2005182408 A JP2005182408 A JP 2005182408A JP 2003421429 A JP2003421429 A JP 2003421429A JP 2003421429 A JP2003421429 A JP 2003421429A JP 2005182408 A JP2005182408 A JP 2005182408A
- Authority
- JP
- Japan
- Prior art keywords
- term
- search
- character string
- index
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明はコンピュータを用いた用語検索技術に係り、特にかな文字を含む検索文字列に対応可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムに関する。 The present invention relates to a term search technology using a computer, and more particularly to a term search support system, a term search support method, and a term search support program that can handle a search character string including kana characters.
インターネットに代表される情報ネットワークは情報の宝庫といわれる。しかし、従来の検索システムは入力した文字列と同一の文字列が含まれるホームページのファイルのみ検索するため、インターネットのユーザは検索システムに入力する検索文字列を正確に選択する必要があった。そのため、ユーザの検索文字列選択の負担軽減のため、事前にカテゴリ別に用語が分類されたカテゴリ参照辞書を用意し、入力された検索文字列と一致する文字列を含むホームページが検索されない場合にも、入力された検索文字列と同じカテゴリにある文字列をカテゴリ参照辞書から抽出し、ユーザに表示する検索システムが(例えば特許文献1参照。)が提案されていた。
しかし、あらかじめカテゴリ参照辞書を用意しても、ユーザが検索文字列そのものを正しい漢字を使用せずに入力した場合には対処することができない。例えば、従来の検索システムを児童等が使用する場合、児童等は学年によって未習漢字があるために正しい漢字を用いて検索文字列を入力できない場合があるため、「かな」のみを用いた文字列や、「漢字」と「かな」が交じった文字列を入力された場合、従来の検索システムでは入力された検索文字列を正しい漢字を用いた用語に変換してホームページを検索することができなかった。また、ユーザが検索文字列として正しい漢字を用いた用語を入力した場合においても、用語がひらがな等で掲載されているホームページを検索することができなかった。またユーザが文字列に含まれる文字の一部を誤入力する場合もあり、このような場合に正しい用語を修正候補として表示し、検索を続行するかクライアントに助言する検索システムが望まれていた。 However, even if a category reference dictionary is prepared in advance, it cannot be handled when the user inputs the search character string itself without using the correct kanji. For example, when children use a conventional search system, children may not be able to enter a search string using the correct kanji because there are unlearned kanji depending on the grade, so characters using only “kana” When a string or a character string that mixes “kanji” and “kana” is entered, the conventional search system can convert the entered search string into terms using the correct kanji and search the home page. There wasn't. Further, even when the user inputs a term using the correct kanji as the search character string, the home page where the term is published in hiragana or the like cannot be retrieved. In some cases, the user may mistakenly enter a part of the characters included in the character string. In such a case, a search system that displays correct terms as correction candidates and continues the search or advises the client is desired. .
本発明は上記問題点を鑑み、入力された検索文字列を漢字変換処理し、漢字変換処理後の検索文字列に対応する用語を掲載しているホームページ等のファイルを検索し、検索文字列の一部が誤入力された場合も正しい用語を助言することが可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムを提供することを目的とする。 In view of the above-mentioned problems, the present invention performs an input search character string conversion process on the input search character string, searches a file such as a home page in which terms corresponding to the search character string after the Chinese character conversion process are posted, It is an object of the present invention to provide a term search support system, a term search support method, and a term search support program that can advise correct terms even when a part is erroneously input.
上記目的を達成するために本発明の特徴は、(イ)検索文字列を取得する接続装置と、(ロ)入力された検索文字列を漢字変換処理し、補正検索文字列を出力する漢字変換部と、(ハ)ファイルに含まれる掲載用語を漢字変換処理した索引用語を保存する検索用インデックステーブル保存部と、(ニ)補正検索文字列と一致する索引用語を検索する索引用語検索部と、(ホ)索引用語に対応するファイルの情報を取得する情報取得部とを備える用語検索支援システムであることを要旨とする。 To achieve the above object, the present invention is characterized by (a) a connection device that acquires a search character string, and (b) kanji conversion that performs an input search character string conversion process and outputs a corrected search character string. And (c) a search index table storage unit that stores index terms obtained by performing Kanji conversion processing on the published terms included in the file, and (d) an index term search unit that searches for index terms that match the corrected search character string. (E) The gist of the present invention is a term search support system including an information acquisition unit that acquires information of a file corresponding to an index term.
本発明の第2の特徴は、(イ)接続装置が検索文字列を取得するステップと、(ロ)漢字変換部が、検索文字列を漢字変換処理し、補正検索文字列を出力するステップと、(ハ)インデックス作成部が、ファイルに含まれる掲載用語を漢字変換処理した索引用語を検索用インデックステーブル保存部に保存するステップと、(ニ)索引用語検索部が、補正検索文字列と一致する索引用語を検索するステップと、(ホ)情報取得部が、索引用語に対応するファイルの情報を取得するステップとを含む用語検索支援方法であることを要旨とする。 The second feature of the present invention is that (a) the connecting device acquires a search character string, and (b) a kanji conversion unit performs kanji conversion processing on the search character string and outputs a corrected search character string; (C) The index creation unit stores the index terms obtained by converting the published terms contained in the file into Kanji, and (d) the index term search unit matches the corrected search character string. The gist of the present invention is a term search support method including a step of searching for an index term to be performed, and (e) an information acquisition unit acquiring a file information corresponding to the index term.
本発明の第3の特徴は、コンピュータに、(イ)検索文字列を取得する手順と、(ロ)検索文字列を漢字変換処理し、補正検索文字列を出力する手順と、(ハ)ファイルに含まれる掲載用語を漢字変換処理した索引用語を取得する手順と、(ニ)補正検索文字列と一致する索引用語を検索する手順と、(ホ)索引用語に対応するファイルの情報を取得する手順とを実行させるための用語検索支援プログラムであることを要旨とする。 The third feature of the present invention is: (b) a procedure for obtaining a search character string; (b) a procedure for converting the search character string into a kanji character and outputting a corrected search character string; To obtain index terms that have been converted from Kanji to Kanji conversion terms, (d) to retrieve index terms that match the corrected search string, and (e) to obtain file information corresponding to the index terms This is a term search support program for executing the procedure.
本発明によれば、入力された検索文字列を漢字変換処理し、漢字変換処理後の検索文字列に対応する用語が掲載されているファイルを検索し、検索文字列の一部が誤入力された場合も正しい用語を助言することが可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムを提供することができる。 According to the present invention, an input search character string is subjected to kanji conversion processing, a file containing terms corresponding to the search character string after the kanji conversion processing is searched, and a part of the search character string is erroneously input. In this case, it is possible to provide a term search support system, a term search support method and a term search support program that can advise correct terms.
次に図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。なお以下の示す実施の形態は、この発明の技術的思想を具体化するための装置や方法を例示するものであって、この発明の技術的思想は構成部品の配置等を下記のものに特定するものではない。この発明の技術的思想は、特許請求の範囲において種々の変更を加えることができる。 Next, embodiments of the present invention will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals. The embodiments shown below exemplify apparatuses and methods for embodying the technical idea of the present invention, and the technical idea of the present invention specifies the arrangement of components and the like as follows. Not what you want. The technical idea of the present invention can be variously modified within the scope of the claims.
本発明の実施の形態にかかる用語検索支援システム1は図1に示すように、インターネット5を介して複数のクライアントコンピュータ10A, 10B, 10C, ・・・・・, 10N及び複数のホームページサーバ20A, 20B, 20C, ・・・・・, 20Nに接続されている。ホームページサーバ20A〜20Nのそれぞれは、学習目的、趣味目的等の様々な情報を含むホームページのファイルを保存するコンピュータである。クライアントコンピュータ10A〜10Nのそれぞれは、企業、学校等の教育機関あるいは家庭等に配置されるパーソナルコンピュータである。
As shown in FIG. 1, the term
さらに用語検索支援システム1は、図2に示すように、中央処理装置(CPU)100、記憶装置200、接続装置300、入力装置302、プログラム記憶装置230及びデータ記憶装置231を備える。さらにCPU100は、漢字変換部110、索引用語検索部112、インデックス作成部111、情報取得部113、類似用語変換部114及び表示指示部116を備え、記憶装置200は用語辞書201、検索用インデックステーブル保存部202及び検索対象メタデータ203を備える。
Furthermore, the term
ここで接続装置300は、図1に示したインターネット5に接続可能なルータ、ターミナルアダプタ(TA)及びモデム等が使用可能である。接続装置300はインターネット5を介してクライアントコンピュータ10A〜10N及びホームページサーバ20A〜20Nと情報の送受信を行う。
Here, as the
図2に示す検索対象メタデータ203は、図1に示したホームページサーバ20A〜20Nで提供されているホームページのファイルに含まれる情報の目録である。検索対象メタデータ203には、複数のホームページそれぞれについてのタイトル、ホームページアドレス、検索用識別番号、概要、分野、対象年齢、著作権、利用制限等の情報が登録されている。さらに階層構造を有するホームページについては、各階層のファイルごとにそれぞれ目録を保存している。
The
用語辞書201は、各分野で使用される用語の一覧と、それぞれの用語に含まれる漢字の一部あるいは全部をひらがなに変換したものを含む用語データベースである。図3は用語辞書201に含まれる用語データベースの一例であり、「原子」という登録用語に対しては、含まれる漢字の一部又は全部をひらがなに変換した「げん子」、「原し」及び「げんし」のそれぞれが登録されている。また、例えば学校教育用に、用語辞書201に含まれる用語をひらがなに変換したものについては、文部科学省発行の学習指導要領に定められている学年別漢字配当表と、文化庁が定めている学校種で習う音訓対応表に従ってひらがなに変換したものに限定しても良い。さらに、用語辞書201は学年別漢字配当表に従って、学年別に対応した用語を含めることとしてもよい。
The
漢字変換部110は、入力された文字列と用語辞書201に登録されている用語を比較し、かな漢字変換処理を行う。例えば、入力された文字列が「げんし」のように「かな」のみを含む場合、あるいは「げん子」又は「原し」のように「漢字」と「かな」の両方を含む場合は、漢字変換部110は用語辞書201を参照して入力された文字列を「原子」に漢字変換する。また、入力された文字列がすでに「原子」のように漢字で表されている場合は、入力された文字列を維持する。また漢字変換部110は、入力された文字列にの文字種を統一し、例えば、半角文字と全角文字が混合している場合は、アルファベットは半角文字に、かな漢字は全角文字に統一する。
The
インデックス作成部111は、検索対象メタデータ203に登録されているインターネット上の複数のホームページのファイルのそれぞれに含まれる掲載文字列を取得する。またインデックス作成部111は、取得した掲載文字列を形態素解析等により単語単位に分かち書きし、さらに分かち書きされた単語から記号等の不要な要素を抽出して掲載用語と定義する。
The
検索用インデックステーブル保存部202は、インデックス作成部111が抽出した掲載用語を漢字処理した索引用語と、索引用語に対応する複数のホームページのファイルのそれぞれの、検索対象メタデータ203に保存されている検索用識別番号と同じ検索用識別番号を保存する。
The index table storage unit for
索引用語検索部112は、接続装置300が取得した検索文字列を漢字変換部110で漢字変換処理した補正検索文字列と一致する索引用語が検索用インデックステーブル保存部202に登録されているか検索する。
The index
情報取得部113は、索引用語検索部112が検索した索引用語に対応するホームページの検索用識別番号を検索用インデックステーブル保存部202から取得し、検索対象メタデータ203に含まれる対応する検索用識別番号を検索する。さらに情報取得部113は検索用識別番号に該当するホームページの情報を検索対象メタデータ203から取得する。
The
表示指示部116は、接続装置300に図1に示したインターネット5を介して接続されたクライアントコンピュータ10A〜10Nの表示部に、図4に示すユーザーインターフェース30を表示させる。ユーザーインターフェース30は、検索文字列入力領域32、検索ボタン34及び検索結果表示領域36を備える。検索文字列入力領域32は、クライアントコンピュータ10A〜10Nのそれぞれのユーザに、キーボード等の入力装置から検索文字列の入力を促す領域である。検索ボタン34はクライアントコンピュータ10A〜10Nのそれぞれのユーザに、マウス等の入力装置から検索文字列入力領域32に入力した検索文字列の検索開始の指示を促すボタンである。検索結果表示領域36は、情報取得部113が取得した情報等を表示する領域である。
The
類似用語変換部114は、内部カウンタnを保有し、内部カウンタnの値に応じて、入力された検索文字列とn文字違いの類似用語が用語辞書201に登録されているか検索する。n文字違いの類似用語が検索されない場合は、内部カウンタnの値は順次1が加算される。例えば、内部カウンタnの値が1の場合、類似用語変換部114は入力された検索文字列と1文字違いの類似用語が用語辞書201に登録されているか検索し、登録されていなかった場合は内部カウンタnの値が2となり、類似用語変換部114は2文字違いの類似用語を検索する。また類似用語変換部114は、文字違い制限値X及び用語制限値Zのそれぞれの変数を保有する。「文字違い制限値X」は内部カウンタnの上限値であり、例えば文字違い制限値Xに2が指定されていた場合は、類似用語変換部114は検索文字列と2文字違いの類似用語の検索までを行う。「用語制限値Z」は用語辞書201から検索されるn文字違いの類似用語の数に対して、ユーザ、システム管理者等が設定する上限値である。類似用語変換部114は、用語制限値Zを超える数の類似用語が検索される場合は検索を中止する。文字違い制限値X及び用語制限値Zのそれぞれの値は入力装置302等から入力される。
The similar
プログラム記憶装置230は、CPU100に接続された装置間のデータ送受信の制御等をCPU100に実行させるためのプログラムを保存している。データ記憶装置231は、CPU100の演算過程でのデータを一時的に保存する。入力装置302としては、キーボード等が使用可能である。
The
次に、実施の形態にかかる用語検索支援方法に利用される図2に示した検索用インデックステーブル保存部202の作成方法の説明を、図5を用いて説明する。
Next, a description will be given of a method of creating the search index
(a) ステップS401で、図2に示したインデックス作成部111は、検索対象メタデータ203に登録されているホームページを運用している図1に示したホームページサーバ20A〜20Nのいずれかに図2に示した接続装置300を介してアクセスし、ホームページのファイルに含まれる掲載文字列を取得する。さらにインデックス作成部111は、取得した掲載文字列に含まれる全角文字のアルファベットを半角文字に、半角文字のカタカナを全角文字に変換する。
(a) In step S401, the
(b) ステップS402でインデックス作成部111は取得した掲載文字列を形態素解析し、掲載文字列から掲載用語を分割し抽出する。例えば、文章に「とび箱(台上前転)」という文字列が含まれていた場合には、「とび箱」と「(台上前転)」に分割する。さらにステップS403で、インデックス作成部111は用語に付されている引用符、括弧及び記号等を削除する。例えば、「(台上前転)」の場合は括弧が削除され「台上前転」と変換される。
(b) In step S402, the
(c) ステップS404でインデックス作成部111は、ステップS402及びS403で抽出した掲載用語を漢字変換部110に送り、漢字変換部110は用語辞書201を参照して掲載用語を漢字変換処理する。例えば、掲載用語が「とび箱」であれば、「跳び箱」に変換する。さらにステップS405でインデックス作成部111は漢字変換処理された検索用語を索引用語として、検索対象メタデータ203に登録されているホームページの識別番号と共に検索用インデックステーブル保存部202に保存する。ここでは「跳び箱」と「台上前転」の二つの索引用語が検索用インデックステーブル保存部202に保存される。
(c) In step S404, the
以上の方法によれば、例えばホームページのファイルに「とびばこのれんしゅう」の記載があれば、検索用インデックステーブル保存部202には「跳び箱」と「練習」が索引用語として保存される。また、「とび箱のうんどう」の記載があれば、検索用インデックステーブル保存部202には「跳び箱」と「運動」が索引用語として保存される。
According to the above method, for example, if “Tobibako Renshu” is described in the homepage file, “jumping box” and “practice” are stored as index terms in the search index
次に図6及び図7を用いて、図2に示した用語検索支援システム1を利用した実施の形態に係る用語検索支援方法を説明する。
Next, the term search support method according to the embodiment using the term
(a) ステップS601で図2に示した表示指示部116は、図1に示したクライアントコンピュータ10A〜10Nのいずれかで接続装置300に接続されたものの表示部に、図4に示したユーザーインターフェース30を表示させる。ここで、クライアントコンピュータ10A〜10Nいずれかのユーザから検索文字列入力領域32に検索文字列が入力され、検索ボタン34をマウス等でクリックされることにより、接続装置300はインターネット5を経由して送信された検索文字列を取得する。次にステップS602で接続装置300は漢字変換部110に取得した検索文字列を与え、漢字変換部110は検索文字列に全角文字のアルファベットが含まれている場合には半角文字のアルファベットに、半角文字のカタカナが含まれている場合は全角文字のカタカナに変換する。
(a) In step S601, the
(b) さらにステップS603で、漢字変換部110は用語辞書201を参照して検索文字列を漢字変換処理し、補正検索文字列を出力する。例えば、検索文字列として「とびばこ」あるいは「とび箱」が入力された場合は、漢字変換部110は用語辞書201に含まれる図3に示すデータベースを参照して「跳び箱」と漢字変換し、補正検索文字列として出力する。また、検索文字列と同じ用語が用語辞書201に登録されていない場合には、漢字変換部は検索文字列を未変換のまま補正検索文字列と新たに定義する。漢字変換部110は、補正検索文字列を索引用語検索部112に出力する。
(b) Further, in step S603, the
(c) ステップS604で、索引用語検索部112は検索用インデックステーブル保存部202にアクセスし、さらにステップS605で索引用語検索部112は検索用インデックステーブル保存部202に補正検索文字列と一致する索引用語が存在するか検索する。ステップS606で索引用語検索部112は補正検索文字列と一致する索引用語が検索用インデックステーブル保存部202に存在するか否か判断し、存在する場合は情報取得部113に検索用インデックステーブル保存部202に登録されている索引用語に対応する識別番号を与えステップS607に進む。
(c) In step S604, the index
(d) ステップS607で、情報取得部113は検索対象メタデータ203にアクセスし、抽出されたホームページの識別番号を照会し、ホームページのアドレス、概要、対象ユーザ、著作権及び利用制限等の情報を取得し、取得した情報を表示指示部116に出力する。次に表示指示部116は検索文字列を送信した図1に示したクライアントコンピュータ10A〜10Nのいずれかに取得したホームページの情報をモニタ等の表示部に表示するよう、接続装置300を経由して指示を与える。クライアントコンピュータ10A〜10Nのいずれかの表示部に表示されているユーザーインターフェース30の検索結果表示領域36には、図8に示すように、索引用語検索部112により検索されたホームページについて検索対象メタデータ203に登録されているタイトル、概要、著作権等の情報が表示され、用語検索支援方法を終了する。
(d) In step S607, the
(e) ステップS606で補正検索文字列と一致する用語が検索用インデックステーブル保存部202に存在しないと索引用語検索部112が判断した場合は、索引用語検索部112は補正検索文字列を類似用語変換部114に与えて図7のステップS701に進み、類似用語変換部114は内部カウンタnを1と定義する。
(e) If the index
(f) ステップS702で類似用語変換部114は、ステップS601で入力された検索文字列とn文字違いの類似用語が用語辞書201に存在するか検索する。例えば、内部カウンタnが1であり、ステップS601で「飛び箱」が検索文字列として入力されていた場合には、1文字違いで正しい漢字を用いた用語「跳び箱」が検索される。ステップS703で、類似用語変換部114はn文字違いの類似用語が用語辞書201に存在したか否か判断し、用語辞書201にn文字違いの類似用語が存在した場合はステップS704に進み、存在しなかった場合はステップS707に進む。
(f) In step S702, the similar
(g) ステップS704で、類似用語変換部114は用語辞書201から検索した検索文字列とn文字違いの類似用語の数と、設定された用語制限値Zとを比較する。例えば用語制限値が5と設定されていた場合、n文字違いの類似用語が5以下検索された場合はステップS705に進み、6以上検索された場合は、ステップS706に進む。ステップS705で、索引用語検索部112は検索されたn文字違いの類似用語をリストアップし表示指示部116に与える。表示指示部116は、図1に示したライアントコンピュータ10A〜10Nのいずれかの表示部に表示されているユーザーインターフェース30の検索結果表示領域36に、図9に示すようにn文字違いの類似用語を表示させ、用語検索支援方法を終了する。
(g) In step S704, the similar
(h) ステップS707において、類似用語変換部114は内部カウンタnに1を加算し、新たな内部カウンタnを定義する。さらにステップS708で索引用語検索部112は内部カウンタnの値が文字違い制限値Xより大きいか否か判断する。内部カウンタnの値が文字違い制限値X以下の場合はステップS702に戻り、n文字違いの類似用語の検索を繰り返す。内部カウンタnが文字違い制限値Xより大きい場合にはステップS706に進む。ステップS706において、表示指示部116はステップS601で入力された検索文字列に該当するホームページが検索されなかった旨を図1に示したクライアントコンピュータ10A〜10Nのいずれかの表示部に表示させ、用語検索支援方法を終了する。
(h) In step S707, the similar
以上、実施の形態にかかる図2に示した用語検索支援システム1と、図6及び図7に示した用語検索支援方法によれば、検索文字列として「かな」のみを用いた文字列や、「漢字」と「かな」が交じった文字列が入力された場合でも、図2に示した漢字変換部110が用語辞書201を参照して検索文字列を漢字変換処理し、図5に示す方法で作成された検索用インデックステーブル保存部202を参照することにより、検索文字列に対応する正しい漢字を用いた用語が掲載されたホームページを検索することが可能となる。また検索文字列として正しい漢字を用いた用語が入力され、ホームページには用語が「かな」のみで表現されている場合でも、図2に示した検索用インデックステーブル保存部202を参照することにより、用語が「かな」のみで掲載されているホームページの検索をすることも可能となる。そのため、児童等が漢字かな交じりの検索文字列を入力した場合も、かなのみで表された用語を含むホームページの検索が可能であり、また児童等の保護者等が正確な用語を用いて検索文字列を入力した場合も、用語がかな書きされたホームページを検索する事も可能となる。
As described above, according to the term
さらに、検索文字列に一部誤った漢字が含まれていた場合も、類似用語変換部114が用語辞書201を参照して、類似用語を抽出してユーザに示すので、ユーザは正しい漢字を用いた検索文字列によりホームページ検索を再開することが可能となる。また、類似用語が多数抽出された場合は、むしろユーザに検索結果がないと表示した方が適切な場合もある。これに対し図7に示した用語検索支援方法によれば、ステップS704で類似用語の数と、用語制限値Zとを比較することにより、ユーザに示す類似用語の数の上限を定めることも可能となる。
Furthermore, even if a part of the search character string contains an incorrect Chinese character, the similar
また、用語辞書201に含まれる用語を学年別漢字配当表に含まれる漢字を使用する用語に限定すれば、学校教育での利用において、より高速かつ的確に用語検索を行うことも可能である。
In addition, if terms included in the
また上述した用語検索支援方法は、時系列的につながった一連の処理あるいは操作として表現可能である。したがって、用語検索支援方法をコンピュータシステムで実行するために、コンピュータシステム内のプロセッサなどが果たす複数の機能を特定するコンピュータプログラム製品で図5、図6及び図7に示した用語検索支援方法を実現可能である。ここで、コンピュータプログラム製品は、図2に示したプログラム記憶装置230等のコンピュータシステムに入出力可能な記録装置あるいは記録媒体等をいう。記録媒体としては、メモリ装置、磁気ディスク装置、光ディスク装置、その他のプログラムを記録することができるような装置が含まれる。
The term search support method described above can be expressed as a series of processes or operations connected in time series. Therefore, in order to execute the term search support method in the computer system, the term search support method shown in FIGS. 5, 6, and 7 is realized by a computer program product that specifies a plurality of functions performed by a processor in the computer system. Is possible. Here, the computer program product refers to a recording device or a recording medium that can be input and output to a computer system such as the
(その他の実施の形態)
上記のように、本発明は実施の形態によって記載したが、この開示の一部をなす記述及び図面はこの発明を限定するものであると理解するべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかになるはずである。例えば、図2に示した用語辞書201に登録する用語を分野に応じた用語に限定し、検索対象メタデータ203に登録するホームページも特定分野のものに限定すれば、分野別のホームページを高速かつ効率よく検索することが可能となる。また、実施の形態においてはインターネット上のホームページを検索する場合を示したが、LAN等の情報ネットワーク上のファイル検索や、スタンドアロンのコンピュータのハードディスク内のファイル検索にも本発明が適用可能であるのは勿論である。このように、本発明はここでは記載していない様々な実施の形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲の発明特定事項によってのみ限定されるものである。
(Other embodiments)
As described above, the present invention has been described according to the embodiment. However, it should not be understood that the description and drawings constituting a part of this disclosure limit the present invention. From this disclosure, various alternative embodiments, examples and operational techniques should be apparent to those skilled in the art. For example, if the terms to be registered in the
1…用語検索支援システム
5…インターネット
10A, 10B, 10C, ・・・・・, 10N…クライアントコンピュータ
20A, 20B, 20C, ・・・・・, 20N…ホームページサーバ
30…ユーザーインターフェース
32…検索文字列入力領域
34…検索ボタン
36…検索結果表示領域
100…中央処理装置(CPU)
110…漢字変換部
111…インデックス作成部
112…索引用語検索部
113…情報取得部
114…類似用語変換部
116…表示指示部
200…記憶装置
201…用語辞書
202…検索用インデックステーブル保存部
203…検索対象メタデータ
230…プログラム記憶装置
231…データ記憶装置
300…接続装置
302…入力装置
1 ... Term search support system
5 ... Internet
10A, 10B, 10C, ..., 10N ... Client computer
20A, 20B, 20C, ..., 20N ... Homepage server
30… User interface
32 ... Search string input area
34 ... Search button
36 ... Search result display area
100 ... Central processing unit (CPU)
110… Kanji conversion part
111 ... Index creation section
112 ... Index term search part
113 ... Information acquisition unit
114… Similar term conversion part
116 ... Display instruction section
200 ... Storage device
201 ... Term dictionary
202… Search index table storage
203 ... Search target metadata
230 ... Program storage device
231 ... Data storage device
300 ... Connecting device
302 ... Input device
Claims (7)
入力された前記検索文字列を漢字変換処理し、補正検索文字列を出力する漢字変換部と、
ファイルに含まれる掲載用語を漢字変換処理した索引用語を保存する検索用インデックステーブル保存部と、
前記補正検索文字列と一致する前記索引用語を検索する索引用語検索部と、
前記索引用語に対応する前記ファイルの情報を取得する情報取得部
とを備えることを特徴とする用語検索支援システム。
A connected device that retrieves the search string;
A kanji conversion unit that performs a kanji conversion process on the input search character string and outputs a corrected search character string;
An index table storage unit for search that stores index terms obtained by converting Kanji conversion of published terms contained in the file;
An index term search unit that searches for the index terms that match the corrected search character string;
A term search support system comprising: an information acquisition unit that acquires information of the file corresponding to the index term.
を更に備えることを特徴とする請求項1記載の用語検索支援システム。
The term search support system according to claim 1, further comprising a similar term conversion unit that searches for similar terms similar to the search character string.
The term search support system according to claim 1, further comprising an index creation unit that performs a morphological analysis on a posted character string included in the file and extracts the posted term.
漢字変換部が、前記検索文字列を漢字変換処理し、補正検索文字列を出力するステップと、
インデックス作成部が、ファイルに含まれる掲載用語を漢字変換処理した索引用語を検索用インデックステーブル保存部に保存するステップと、
索引用語検索部が、前記補正検索文字列と一致する前記索引用語を検索するステップと、
情報取得部が、前記索引用語に対応する前記ファイルの情報を取得するステップ
とを含むことを特徴とする用語検索支援方法。
The connected device obtains a search string;
A kanji conversion unit performing kanji conversion processing on the search character string and outputting a corrected search character string;
An index creating unit storing an index term obtained by converting the published term contained in the file into a kanji character in a search index table storing unit;
An index term search unit searching for the index term that matches the corrected search character string;
An information acquisition unit includes the step of acquiring information of the file corresponding to the index term.
The term search support method according to claim 4, further comprising a step of searching for a similar term similar to the search character string by the similar term conversion unit.
6. The step of storing in the search index table storage unit includes a step in which an index creation unit performs morphological analysis on a posted character string included in the file and extracts the posted term. The term search support method described.
検索文字列を取得する手順と、
前記検索文字列を漢字変換処理し、補正検索文字列を出力する手順と、
ファイルに含まれる掲載用語を漢字変換処理した索引用語を取得する手順と、
前記補正検索文字列と一致する前記索引用語を検索する手順と、
前記索引用語に対応する前記ファイルの情報を取得する手順
とを実行させるための用語検索支援プログラム。
On the computer,
Get the search string,
A procedure for converting the search character string into kanji and outputting a corrected search character string;
To obtain index terms that have been converted from Kanji to the published terms contained in the file,
Searching the index terms that match the corrected search string;
A term search support program for executing the procedure of acquiring information of the file corresponding to the index term.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003421429A JP2005182408A (en) | 2003-12-18 | 2003-12-18 | Term retrieval support system, term retrieval support method and term retrieval support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003421429A JP2005182408A (en) | 2003-12-18 | 2003-12-18 | Term retrieval support system, term retrieval support method and term retrieval support program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005182408A true JP2005182408A (en) | 2005-07-07 |
Family
ID=34782663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003421429A Pending JP2005182408A (en) | 2003-12-18 | 2003-12-18 | Term retrieval support system, term retrieval support method and term retrieval support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005182408A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008243155A (en) * | 2007-03-29 | 2008-10-09 | Roland Corp | Lyric retrieving device and lyric retrieval program |
JP2009505221A (en) * | 2005-08-11 | 2009-02-05 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
-
2003
- 2003-12-18 JP JP2003421429A patent/JP2005182408A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009505221A (en) * | 2005-08-11 | 2009-02-05 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
JP4866421B2 (en) * | 2005-08-11 | 2012-02-01 | アマゾン テクノロジーズ インコーポレーテッド | A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior |
JP2008243155A (en) * | 2007-03-29 | 2008-10-09 | Roland Corp | Lyric retrieving device and lyric retrieval program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101554293B1 (en) | Cross-language information retrieval | |
KR101088983B1 (en) | Data search system and data search method using a global unique identifier | |
US9323827B2 (en) | Identifying key terms related to similar passages | |
EP2181405B1 (en) | Automatic expanded language search | |
US7783644B1 (en) | Query-independent entity importance in books | |
US20060195435A1 (en) | System and method for providing query assistance | |
JPH11250105A (en) | Method and system for retrieving multi-language information | |
CN106156111B (en) | Patent document retrieval method, device and system | |
McCutcheon | Basic, fuller, fullest: Treatment options for electronic theses and dissertations | |
CN109815390B (en) | Method, device, computer equipment and computer storage medium for retrieving multilingual information | |
JP4160548B2 (en) | Document summary creation system, method, and program | |
JP2004341753A (en) | Retrieval support device, retrieval support method and program | |
JP2006072744A (en) | Document processor, control method therefor, program and storage medium | |
CN112015907A (en) | Method and device for quickly constructing discipline knowledge graph and storage medium | |
JP7122773B2 (en) | DICTIONARY CONSTRUCTION DEVICE, DICTIONARY PRODUCTION METHOD, AND PROGRAM | |
JP2005182408A (en) | Term retrieval support system, term retrieval support method and term retrieval support program | |
JP2009129176A (en) | Structured document retrieval device, method, and program | |
JP2007200252A (en) | Abbreviation generation/validity evaluation method, synonym database generation/update method, abbreviation generation/validity evaluation device, synonym database generation/update device, program, and recording medium | |
JP5104329B2 (en) | Document search system | |
JP4497337B2 (en) | Concept search device and recording medium recording computer program | |
JP2010009237A (en) | Multi-language similar document retrieval device, method and program, and computer-readable recording medium | |
JP2004157965A (en) | Search support device and method, program and recording medium | |
JP4384736B2 (en) | Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device | |
JP4368550B2 (en) | Document search apparatus, document search method, and program causing computer to execute the method | |
Yilmaz et al. | Snippet Generation Using Local Alignment for Information Retrieval (LAIR) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090721 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091117 |