JP2005182408A - Term retrieval support system, term retrieval support method and term retrieval support program - Google Patents

Term retrieval support system, term retrieval support method and term retrieval support program Download PDF

Info

Publication number
JP2005182408A
JP2005182408A JP2003421429A JP2003421429A JP2005182408A JP 2005182408 A JP2005182408 A JP 2005182408A JP 2003421429 A JP2003421429 A JP 2003421429A JP 2003421429 A JP2003421429 A JP 2003421429A JP 2005182408 A JP2005182408 A JP 2005182408A
Authority
JP
Japan
Prior art keywords
term
search
character string
index
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003421429A
Other languages
Japanese (ja)
Inventor
Yasutaka Shimizu
康敬 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AVELIO SYSTEMS KK
Original Assignee
AVELIO SYSTEMS KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AVELIO SYSTEMS KK filed Critical AVELIO SYSTEMS KK
Priority to JP2003421429A priority Critical patent/JP2005182408A/en
Publication of JP2005182408A publication Critical patent/JP2005182408A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a term retrieval support system capable of performing the Kanji (Chinese character) conversion processing of an entered retrieval character string, retrieving a homepage and suggesting a correct term even if part of the retrieval character string is erroneously inputted. <P>SOLUTION: The term retrieval support system is provided with a central processing unit (CPU) 100, a storage device 200, a connection device 300 which acquires a retrieval character string, a program storage device 230, and a data storage device 231. Further, the storage device 200 is provided with a term dictionary 201, a retrieval index table preservation part 202 for preserving index terms for which listed terms included in a file are converted to Kanji, and retrieval object meta data 203. Further, the CPU 100 is provided with a Kanji conversion part 110 for performing the Kanji conversion processing of the entered retrieval character string and outputting a Kanji-converted retrieval character string, an index term retrieval part 112 for retrieving the index term matched with the Kanji-converted character string, an information acquisition part 113 for acquiring the information of the homepage corresponding to the index term, an index preparation part 111, and a similar term conversion part 114. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明はコンピュータを用いた用語検索技術に係り、特にかな文字を含む検索文字列に対応可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムに関する。   The present invention relates to a term search technology using a computer, and more particularly to a term search support system, a term search support method, and a term search support program that can handle a search character string including kana characters.

インターネットに代表される情報ネットワークは情報の宝庫といわれる。しかし、従来の検索システムは入力した文字列と同一の文字列が含まれるホームページのファイルのみ検索するため、インターネットのユーザは検索システムに入力する検索文字列を正確に選択する必要があった。そのため、ユーザの検索文字列選択の負担軽減のため、事前にカテゴリ別に用語が分類されたカテゴリ参照辞書を用意し、入力された検索文字列と一致する文字列を含むホームページが検索されない場合にも、入力された検索文字列と同じカテゴリにある文字列をカテゴリ参照辞書から抽出し、ユーザに表示する検索システムが(例えば特許文献1参照。)が提案されていた。
特開2002-132808号公報
An information network represented by the Internet is said to be a treasure trove of information. However, since a conventional search system searches only a homepage file that includes the same character string as the input character string, the Internet user has to select the search character string to be input to the search system accurately. Therefore, in order to reduce the burden of user search string selection, a category reference dictionary in which terms are classified by category is prepared in advance, and even when a homepage that includes a string that matches the input search string is not searched. A search system that extracts a character string in the same category as the input search character string from the category reference dictionary and displays it to the user has been proposed (see, for example, Patent Document 1).
JP 2002-132808 JP

しかし、あらかじめカテゴリ参照辞書を用意しても、ユーザが検索文字列そのものを正しい漢字を使用せずに入力した場合には対処することができない。例えば、従来の検索システムを児童等が使用する場合、児童等は学年によって未習漢字があるために正しい漢字を用いて検索文字列を入力できない場合があるため、「かな」のみを用いた文字列や、「漢字」と「かな」が交じった文字列を入力された場合、従来の検索システムでは入力された検索文字列を正しい漢字を用いた用語に変換してホームページを検索することができなかった。また、ユーザが検索文字列として正しい漢字を用いた用語を入力した場合においても、用語がひらがな等で掲載されているホームページを検索することができなかった。またユーザが文字列に含まれる文字の一部を誤入力する場合もあり、このような場合に正しい用語を修正候補として表示し、検索を続行するかクライアントに助言する検索システムが望まれていた。   However, even if a category reference dictionary is prepared in advance, it cannot be handled when the user inputs the search character string itself without using the correct kanji. For example, when children use a conventional search system, children may not be able to enter a search string using the correct kanji because there are unlearned kanji depending on the grade, so characters using only “kana” When a string or a character string that mixes “kanji” and “kana” is entered, the conventional search system can convert the entered search string into terms using the correct kanji and search the home page. There wasn't. Further, even when the user inputs a term using the correct kanji as the search character string, the home page where the term is published in hiragana or the like cannot be retrieved. In some cases, the user may mistakenly enter a part of the characters included in the character string. In such a case, a search system that displays correct terms as correction candidates and continues the search or advises the client is desired. .

本発明は上記問題点を鑑み、入力された検索文字列を漢字変換処理し、漢字変換処理後の検索文字列に対応する用語を掲載しているホームページ等のファイルを検索し、検索文字列の一部が誤入力された場合も正しい用語を助言することが可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムを提供することを目的とする。   In view of the above-mentioned problems, the present invention performs an input search character string conversion process on the input search character string, searches a file such as a home page in which terms corresponding to the search character string after the Chinese character conversion process are posted, It is an object of the present invention to provide a term search support system, a term search support method, and a term search support program that can advise correct terms even when a part is erroneously input.

上記目的を達成するために本発明の特徴は、(イ)検索文字列を取得する接続装置と、(ロ)入力された検索文字列を漢字変換処理し、補正検索文字列を出力する漢字変換部と、(ハ)ファイルに含まれる掲載用語を漢字変換処理した索引用語を保存する検索用インデックステーブル保存部と、(ニ)補正検索文字列と一致する索引用語を検索する索引用語検索部と、(ホ)索引用語に対応するファイルの情報を取得する情報取得部とを備える用語検索支援システムであることを要旨とする。   To achieve the above object, the present invention is characterized by (a) a connection device that acquires a search character string, and (b) kanji conversion that performs an input search character string conversion process and outputs a corrected search character string. And (c) a search index table storage unit that stores index terms obtained by performing Kanji conversion processing on the published terms included in the file, and (d) an index term search unit that searches for index terms that match the corrected search character string. (E) The gist of the present invention is a term search support system including an information acquisition unit that acquires information of a file corresponding to an index term.

本発明の第2の特徴は、(イ)接続装置が検索文字列を取得するステップと、(ロ)漢字変換部が、検索文字列を漢字変換処理し、補正検索文字列を出力するステップと、(ハ)インデックス作成部が、ファイルに含まれる掲載用語を漢字変換処理した索引用語を検索用インデックステーブル保存部に保存するステップと、(ニ)索引用語検索部が、補正検索文字列と一致する索引用語を検索するステップと、(ホ)情報取得部が、索引用語に対応するファイルの情報を取得するステップとを含む用語検索支援方法であることを要旨とする。   The second feature of the present invention is that (a) the connecting device acquires a search character string, and (b) a kanji conversion unit performs kanji conversion processing on the search character string and outputs a corrected search character string; (C) The index creation unit stores the index terms obtained by converting the published terms contained in the file into Kanji, and (d) the index term search unit matches the corrected search character string. The gist of the present invention is a term search support method including a step of searching for an index term to be performed, and (e) an information acquisition unit acquiring a file information corresponding to the index term.

本発明の第3の特徴は、コンピュータに、(イ)検索文字列を取得する手順と、(ロ)検索文字列を漢字変換処理し、補正検索文字列を出力する手順と、(ハ)ファイルに含まれる掲載用語を漢字変換処理した索引用語を取得する手順と、(ニ)補正検索文字列と一致する索引用語を検索する手順と、(ホ)索引用語に対応するファイルの情報を取得する手順とを実行させるための用語検索支援プログラムであることを要旨とする。   The third feature of the present invention is: (b) a procedure for obtaining a search character string; (b) a procedure for converting the search character string into a kanji character and outputting a corrected search character string; To obtain index terms that have been converted from Kanji to Kanji conversion terms, (d) to retrieve index terms that match the corrected search string, and (e) to obtain file information corresponding to the index terms This is a term search support program for executing the procedure.

本発明によれば、入力された検索文字列を漢字変換処理し、漢字変換処理後の検索文字列に対応する用語が掲載されているファイルを検索し、検索文字列の一部が誤入力された場合も正しい用語を助言することが可能な用語検索支援システム、用語検索支援方法及び用語検索支援プログラムを提供することができる。   According to the present invention, an input search character string is subjected to kanji conversion processing, a file containing terms corresponding to the search character string after the kanji conversion processing is searched, and a part of the search character string is erroneously input. In this case, it is possible to provide a term search support system, a term search support method and a term search support program that can advise correct terms.

次に図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。なお以下の示す実施の形態は、この発明の技術的思想を具体化するための装置や方法を例示するものであって、この発明の技術的思想は構成部品の配置等を下記のものに特定するものではない。この発明の技術的思想は、特許請求の範囲において種々の変更を加えることができる。   Next, embodiments of the present invention will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals. The embodiments shown below exemplify apparatuses and methods for embodying the technical idea of the present invention, and the technical idea of the present invention specifies the arrangement of components and the like as follows. Not what you want. The technical idea of the present invention can be variously modified within the scope of the claims.

本発明の実施の形態にかかる用語検索支援システム1は図1に示すように、インターネット5を介して複数のクライアントコンピュータ10A, 10B, 10C, ・・・・・, 10N及び複数のホームページサーバ20A, 20B, 20C, ・・・・・, 20Nに接続されている。ホームページサーバ20A〜20Nのそれぞれは、学習目的、趣味目的等の様々な情報を含むホームページのファイルを保存するコンピュータである。クライアントコンピュータ10A〜10Nのそれぞれは、企業、学校等の教育機関あるいは家庭等に配置されるパーソナルコンピュータである。   As shown in FIG. 1, the term search support system 1 according to the embodiment of the present invention includes a plurality of client computers 10A, 10B, 10C,..., 10N and a plurality of homepage servers 20A, via the Internet 5. 20B, 20C, ..., connected to 20N. Each of the homepage servers 20A to 20N is a computer that stores a homepage file including various information such as a learning purpose and a hobby purpose. Each of the client computers 10A to 10N is a personal computer arranged in an educational institution such as a company or a school or a home.

さらに用語検索支援システム1は、図2に示すように、中央処理装置(CPU)100、記憶装置200、接続装置300、入力装置302、プログラム記憶装置230及びデータ記憶装置231を備える。さらにCPU100は、漢字変換部110、索引用語検索部112、インデックス作成部111、情報取得部113、類似用語変換部114及び表示指示部116を備え、記憶装置200は用語辞書201、検索用インデックステーブル保存部202及び検索対象メタデータ203を備える。   Furthermore, the term search support system 1 includes a central processing unit (CPU) 100, a storage device 200, a connection device 300, an input device 302, a program storage device 230, and a data storage device 231 as shown in FIG. The CPU 100 further includes a kanji conversion unit 110, an index term search unit 112, an index creation unit 111, an information acquisition unit 113, a similar term conversion unit 114, and a display instruction unit 116. The storage device 200 includes a term dictionary 201, a search index table. A storage unit 202 and search target metadata 203 are provided.

ここで接続装置300は、図1に示したインターネット5に接続可能なルータ、ターミナルアダプタ(TA)及びモデム等が使用可能である。接続装置300はインターネット5を介してクライアントコンピュータ10A〜10N及びホームページサーバ20A〜20Nと情報の送受信を行う。   Here, as the connection device 300, a router, a terminal adapter (TA), a modem, and the like that can be connected to the Internet 5 shown in FIG. 1 can be used. The connection device 300 transmits / receives information to / from the client computers 10A to 10N and the homepage servers 20A to 20N via the Internet 5.

図2に示す検索対象メタデータ203は、図1に示したホームページサーバ20A〜20Nで提供されているホームページのファイルに含まれる情報の目録である。検索対象メタデータ203には、複数のホームページそれぞれについてのタイトル、ホームページアドレス、検索用識別番号、概要、分野、対象年齢、著作権、利用制限等の情報が登録されている。さらに階層構造を有するホームページについては、各階層のファイルごとにそれぞれ目録を保存している。   The search target metadata 203 shown in FIG. 2 is a list of information included in the homepage file provided by the homepage servers 20A to 20N shown in FIG. In the search target metadata 203, information such as a title, a home page address, a search identification number, an outline, a field, a target age, a copyright, and a use restriction for each of a plurality of home pages is registered. Further, for a homepage having a hierarchical structure, a catalog is stored for each file of each hierarchy.

用語辞書201は、各分野で使用される用語の一覧と、それぞれの用語に含まれる漢字の一部あるいは全部をひらがなに変換したものを含む用語データベースである。図3は用語辞書201に含まれる用語データベースの一例であり、「原子」という登録用語に対しては、含まれる漢字の一部又は全部をひらがなに変換した「げん子」、「原し」及び「げんし」のそれぞれが登録されている。また、例えば学校教育用に、用語辞書201に含まれる用語をひらがなに変換したものについては、文部科学省発行の学習指導要領に定められている学年別漢字配当表と、文化庁が定めている学校種で習う音訓対応表に従ってひらがなに変換したものに限定しても良い。さらに、用語辞書201は学年別漢字配当表に従って、学年別に対応した用語を含めることとしてもよい。   The term dictionary 201 is a term database including a list of terms used in each field and a part or all of kanji included in each term converted into hiragana. FIG. 3 shows an example of a term database included in the term dictionary 201. For the registered term “atom”, “genko”, “harashi” Each “Genshi” is registered. In addition, for example, for school education, the terms in the term dictionary 201 converted to hiragana are determined by the Kanji distribution table by school year and the Agency for Cultural Affairs, which are stipulated in the Study Guideline issued by the Ministry of Education, Culture, Sports, Science and Technology. It may be limited to the one converted to hiragana according to the correspondence table for learning lessons learned by school type. Further, the term dictionary 201 may include terms corresponding to each grade according to the kanji distribution table for each grade.

漢字変換部110は、入力された文字列と用語辞書201に登録されている用語を比較し、かな漢字変換処理を行う。例えば、入力された文字列が「げんし」のように「かな」のみを含む場合、あるいは「げん子」又は「原し」のように「漢字」と「かな」の両方を含む場合は、漢字変換部110は用語辞書201を参照して入力された文字列を「原子」に漢字変換する。また、入力された文字列がすでに「原子」のように漢字で表されている場合は、入力された文字列を維持する。また漢字変換部110は、入力された文字列にの文字種を統一し、例えば、半角文字と全角文字が混合している場合は、アルファベットは半角文字に、かな漢字は全角文字に統一する。   The kanji conversion unit 110 compares the input character string with the terms registered in the term dictionary 201 and performs kana-kanji conversion processing. For example, if the input string contains only “Kana” such as “Genshi”, or contains both “Kanji” and “Kana” such as “Genko” or “Harashi”, The kanji conversion unit 110 converts the character string input with reference to the term dictionary 201 into kanji characters. If the input character string is already expressed in Chinese characters such as “Atom”, the input character string is maintained. The kanji conversion unit 110 unifies the character types in the input character string. For example, when half-width characters and full-width characters are mixed, the alphabet is unified into half-width characters, and the kana-kanji characters are unified into full-width characters.

インデックス作成部111は、検索対象メタデータ203に登録されているインターネット上の複数のホームページのファイルのそれぞれに含まれる掲載文字列を取得する。またインデックス作成部111は、取得した掲載文字列を形態素解析等により単語単位に分かち書きし、さらに分かち書きされた単語から記号等の不要な要素を抽出して掲載用語と定義する。   The index creation unit 111 acquires a posted character string included in each of a plurality of homepage files on the Internet registered in the search target metadata 203. Further, the index creating unit 111 divides the acquired posted character string into words by morphological analysis or the like, and extracts unnecessary elements such as symbols from the divided words and defines them as posted terms.

検索用インデックステーブル保存部202は、インデックス作成部111が抽出した掲載用語を漢字処理した索引用語と、索引用語に対応する複数のホームページのファイルのそれぞれの、検索対象メタデータ203に保存されている検索用識別番号と同じ検索用識別番号を保存する。   The index table storage unit for search 202 is stored in the search target metadata 203 for each of the index terms obtained by performing kanji processing on the posted terms extracted by the index creation unit 111 and the files of a plurality of websites corresponding to the index terms. The same search identification number as the search identification number is stored.

索引用語検索部112は、接続装置300が取得した検索文字列を漢字変換部110で漢字変換処理した補正検索文字列と一致する索引用語が検索用インデックステーブル保存部202に登録されているか検索する。   The index term search unit 112 searches the search index table storage unit 202 for an index term that matches the corrected search character string obtained by converting the search character string acquired by the connection device 300 into the kanji conversion unit 110. .

情報取得部113は、索引用語検索部112が検索した索引用語に対応するホームページの検索用識別番号を検索用インデックステーブル保存部202から取得し、検索対象メタデータ203に含まれる対応する検索用識別番号を検索する。さらに情報取得部113は検索用識別番号に該当するホームページの情報を検索対象メタデータ203から取得する。   The information acquisition unit 113 acquires the search identification number of the homepage corresponding to the index term searched by the index term search unit 112 from the search index table storage unit 202, and the corresponding search identification included in the search target metadata 203 Search for a number. Further, the information acquisition unit 113 acquires information on the homepage corresponding to the search identification number from the search target metadata 203.

表示指示部116は、接続装置300に図1に示したインターネット5を介して接続されたクライアントコンピュータ10A〜10Nの表示部に、図4に示すユーザーインターフェース30を表示させる。ユーザーインターフェース30は、検索文字列入力領域32、検索ボタン34及び検索結果表示領域36を備える。検索文字列入力領域32は、クライアントコンピュータ10A〜10Nのそれぞれのユーザに、キーボード等の入力装置から検索文字列の入力を促す領域である。検索ボタン34はクライアントコンピュータ10A〜10Nのそれぞれのユーザに、マウス等の入力装置から検索文字列入力領域32に入力した検索文字列の検索開始の指示を促すボタンである。検索結果表示領域36は、情報取得部113が取得した情報等を表示する領域である。   The display instruction unit 116 displays the user interface 30 shown in FIG. 4 on the display units of the client computers 10A to 10N connected to the connection device 300 via the Internet 5 shown in FIG. The user interface 30 includes a search character string input area 32, a search button 34, and a search result display area 36. The search character string input area 32 is an area that prompts each user of the client computers 10A to 10N to input a search character string from an input device such as a keyboard. The search button 34 is a button for prompting each user of the client computers 10A to 10N to start searching for a search character string input to the search character string input area 32 from an input device such as a mouse. The search result display area 36 is an area for displaying information acquired by the information acquisition unit 113.

類似用語変換部114は、内部カウンタnを保有し、内部カウンタnの値に応じて、入力された検索文字列とn文字違いの類似用語が用語辞書201に登録されているか検索する。n文字違いの類似用語が検索されない場合は、内部カウンタnの値は順次1が加算される。例えば、内部カウンタnの値が1の場合、類似用語変換部114は入力された検索文字列と1文字違いの類似用語が用語辞書201に登録されているか検索し、登録されていなかった場合は内部カウンタnの値が2となり、類似用語変換部114は2文字違いの類似用語を検索する。また類似用語変換部114は、文字違い制限値X及び用語制限値Zのそれぞれの変数を保有する。「文字違い制限値X」は内部カウンタnの上限値であり、例えば文字違い制限値Xに2が指定されていた場合は、類似用語変換部114は検索文字列と2文字違いの類似用語の検索までを行う。「用語制限値Z」は用語辞書201から検索されるn文字違いの類似用語の数に対して、ユーザ、システム管理者等が設定する上限値である。類似用語変換部114は、用語制限値Zを超える数の類似用語が検索される場合は検索を中止する。文字違い制限値X及び用語制限値Zのそれぞれの値は入力装置302等から入力される。   The similar term conversion unit 114 has an internal counter n, and searches whether a similar term that is different from the input search character string by n characters is registered in the term dictionary 201 according to the value of the internal counter n. When a similar term of n characters is not searched, the value of the internal counter n is incremented by 1. For example, when the value of the internal counter n is 1, the similar term conversion unit 114 searches whether the similar term that is different from the input search character string by one character is registered in the term dictionary 201, and when it is not registered The value of the internal counter n is 2, and the similar term conversion unit 114 searches for similar terms that differ by two characters. In addition, the similar term conversion unit 114 holds variables for the character difference limit value X and the term limit value Z. `` Character difference limit value X '' is the upper limit value of the internal counter n. For example, if 2 is specified for the character difference limit value X, the similar term conversion unit 114 selects a similar term that is two characters different from the search character string. Do the search. The “term limit value Z” is an upper limit value set by the user, the system administrator, etc., for the number of similar terms with n characters that are searched from the term dictionary 201. The similar term conversion unit 114 stops the search when the number of similar terms exceeding the term limit value Z is searched. Each of the character difference limit value X and the term limit value Z is input from the input device 302 or the like.

プログラム記憶装置230は、CPU100に接続された装置間のデータ送受信の制御等をCPU100に実行させるためのプログラムを保存している。データ記憶装置231は、CPU100の演算過程でのデータを一時的に保存する。入力装置302としては、キーボード等が使用可能である。   The program storage device 230 stores a program for causing the CPU 100 to execute control of data transmission / reception between devices connected to the CPU 100. The data storage device 231 temporarily stores data in the calculation process of the CPU 100. As the input device 302, a keyboard or the like can be used.

次に、実施の形態にかかる用語検索支援方法に利用される図2に示した検索用インデックステーブル保存部202の作成方法の説明を、図5を用いて説明する。   Next, a description will be given of a method of creating the search index table storage unit 202 shown in FIG. 2 used in the term search support method according to the embodiment with reference to FIG.

(a) ステップS401で、図2に示したインデックス作成部111は、検索対象メタデータ203に登録されているホームページを運用している図1に示したホームページサーバ20A〜20Nのいずれかに図2に示した接続装置300を介してアクセスし、ホームページのファイルに含まれる掲載文字列を取得する。さらにインデックス作成部111は、取得した掲載文字列に含まれる全角文字のアルファベットを半角文字に、半角文字のカタカナを全角文字に変換する。  (a) In step S401, the index creating unit 111 shown in FIG. 2 operates as one of the homepage servers 20A to 20N shown in FIG. 1 that operates the homepage registered in the search target metadata 203. To access the character string included in the homepage file. Further, the index creating unit 111 converts the full-width character alphabet contained in the acquired posted character string into a half-width character, and the half-width character katakana into a full-width character.

(b) ステップS402でインデックス作成部111は取得した掲載文字列を形態素解析し、掲載文字列から掲載用語を分割し抽出する。例えば、文章に「とび箱(台上前転)」という文字列が含まれていた場合には、「とび箱」と「(台上前転)」に分割する。さらにステップS403で、インデックス作成部111は用語に付されている引用符、括弧及び記号等を削除する。例えば、「(台上前転)」の場合は括弧が削除され「台上前転」と変換される。  (b) In step S402, the index creation unit 111 performs a morphological analysis on the acquired posted character string, and divides and extracts the posted term from the posted character string. For example, if the text includes the character string “Tobi box (front forward)”, the text is divided into “top box” and “(front forward)”. Further, in step S403, the index creating unit 111 deletes quotation marks, parentheses, symbols, and the like attached to the terms. For example, in the case of “(forward on table)”, the parentheses are deleted and converted to “forward on table”.

(c) ステップS404でインデックス作成部111は、ステップS402及びS403で抽出した掲載用語を漢字変換部110に送り、漢字変換部110は用語辞書201を参照して掲載用語を漢字変換処理する。例えば、掲載用語が「とび箱」であれば、「跳び箱」に変換する。さらにステップS405でインデックス作成部111は漢字変換処理された検索用語を索引用語として、検索対象メタデータ203に登録されているホームページの識別番号と共に検索用インデックステーブル保存部202に保存する。ここでは「跳び箱」と「台上前転」の二つの索引用語が検索用インデックステーブル保存部202に保存される。  (c) In step S404, the index creation unit 111 sends the posted terms extracted in steps S402 and S403 to the kanji conversion unit 110, and the kanji conversion unit 110 performs a kanji conversion process on the posted terms with reference to the term dictionary 201. For example, if the posting term is “flying box”, it is converted to “jumping box”. Further, in step S405, the index creating unit 111 stores the search term subjected to the Kanji conversion process as an index term in the search index table storage unit 202 together with the homepage identification number registered in the search target metadata 203. Here, the two index terms “jump box” and “table-forward” are stored in the search index table storage unit 202.

以上の方法によれば、例えばホームページのファイルに「とびばこのれんしゅう」の記載があれば、検索用インデックステーブル保存部202には「跳び箱」と「練習」が索引用語として保存される。また、「とび箱のうんどう」の記載があれば、検索用インデックステーブル保存部202には「跳び箱」と「運動」が索引用語として保存される。   According to the above method, for example, if “Tobibako Renshu” is described in the homepage file, “jumping box” and “practice” are stored as index terms in the search index table storage unit 202. Further, if there is a description of “the box of jumping box”, “jumping box” and “movement” are stored as index terms in the search index table storage unit 202.

次に図6及び図7を用いて、図2に示した用語検索支援システム1を利用した実施の形態に係る用語検索支援方法を説明する。   Next, the term search support method according to the embodiment using the term search support system 1 shown in FIG. 2 will be described using FIG. 6 and FIG.

(a) ステップS601で図2に示した表示指示部116は、図1に示したクライアントコンピュータ10A〜10Nのいずれかで接続装置300に接続されたものの表示部に、図4に示したユーザーインターフェース30を表示させる。ここで、クライアントコンピュータ10A〜10Nいずれかのユーザから検索文字列入力領域32に検索文字列が入力され、検索ボタン34をマウス等でクリックされることにより、接続装置300はインターネット5を経由して送信された検索文字列を取得する。次にステップS602で接続装置300は漢字変換部110に取得した検索文字列を与え、漢字変換部110は検索文字列に全角文字のアルファベットが含まれている場合には半角文字のアルファベットに、半角文字のカタカナが含まれている場合は全角文字のカタカナに変換する。  (a) In step S601, the display instruction unit 116 illustrated in FIG. 2 is displayed on the display unit connected to the connection device 300 in any of the client computers 10A to 10N illustrated in FIG. Display 30. Here, when a search character string is input to the search character string input area 32 from any of the users of the client computers 10A to 10N and the search button 34 is clicked with a mouse or the like, the connection device 300 is connected via the Internet 5. Get sent search string. Next, in step S602, the connection apparatus 300 gives the acquired search character string to the kanji conversion unit 110, and the kanji conversion unit 110 converts the half-width character alphabet into a half-width character if the search character string includes the full-width character alphabet. If it contains a katakana character, it is converted to a katakana character.

(b) さらにステップS603で、漢字変換部110は用語辞書201を参照して検索文字列を漢字変換処理し、補正検索文字列を出力する。例えば、検索文字列として「とびばこ」あるいは「とび箱」が入力された場合は、漢字変換部110は用語辞書201に含まれる図3に示すデータベースを参照して「跳び箱」と漢字変換し、補正検索文字列として出力する。また、検索文字列と同じ用語が用語辞書201に登録されていない場合には、漢字変換部は検索文字列を未変換のまま補正検索文字列と新たに定義する。漢字変換部110は、補正検索文字列を索引用語検索部112に出力する。  (b) Further, in step S603, the kanji conversion unit 110 performs kanji conversion processing on the search character string with reference to the term dictionary 201, and outputs a corrected search character string. For example, when “Tobibako” or “Tobi Box” is input as a search character string, the Kanji conversion unit 110 converts Kanji into “Jump Box” by referring to the database shown in FIG. And output as a corrected search character string. If the same term as the search character string is not registered in the term dictionary 201, the kanji conversion unit newly defines the search character string as a corrected search character string without conversion. The kanji conversion unit 110 outputs the corrected search character string to the index term search unit 112.

(c) ステップS604で、索引用語検索部112は検索用インデックステーブル保存部202にアクセスし、さらにステップS605で索引用語検索部112は検索用インデックステーブル保存部202に補正検索文字列と一致する索引用語が存在するか検索する。ステップS606で索引用語検索部112は補正検索文字列と一致する索引用語が検索用インデックステーブル保存部202に存在するか否か判断し、存在する場合は情報取得部113に検索用インデックステーブル保存部202に登録されている索引用語に対応する識別番号を与えステップS607に進む。  (c) In step S604, the index term search unit 112 accesses the search index table storage unit 202, and in step S605, the index term search unit 112 in the search index table storage unit 202 matches the corrected search character string. Search for a term. In step S606, the index term search unit 112 determines whether or not an index term that matches the corrected search character string exists in the search index table storage unit 202. If it exists, the information acquisition unit 113 stores the index term search unit. An identification number corresponding to the index term registered in 202 is given, and the process proceeds to step S607.

(d) ステップS607で、情報取得部113は検索対象メタデータ203にアクセスし、抽出されたホームページの識別番号を照会し、ホームページのアドレス、概要、対象ユーザ、著作権及び利用制限等の情報を取得し、取得した情報を表示指示部116に出力する。次に表示指示部116は検索文字列を送信した図1に示したクライアントコンピュータ10A〜10Nのいずれかに取得したホームページの情報をモニタ等の表示部に表示するよう、接続装置300を経由して指示を与える。クライアントコンピュータ10A〜10Nのいずれかの表示部に表示されているユーザーインターフェース30の検索結果表示領域36には、図8に示すように、索引用語検索部112により検索されたホームページについて検索対象メタデータ203に登録されているタイトル、概要、著作権等の情報が表示され、用語検索支援方法を終了する。  (d) In step S607, the information acquisition unit 113 accesses the search target metadata 203, queries the extracted homepage identification number, and provides information such as the homepage address, summary, target user, copyright, and usage restrictions. The acquired information is output to the display instruction unit 116. Next, the display instruction unit 116 transmits the search character string via the connection device 300 so as to display the homepage information acquired in any of the client computers 10A to 10N shown in FIG. 1 on a display unit such as a monitor. Give instructions. In the search result display area 36 of the user interface 30 displayed on one of the display units of the client computers 10A to 10N, as shown in FIG. 8, the search target metadata for the home page searched by the index term search unit 112 is displayed. Information such as the title, outline, and copyright registered in 203 is displayed, and the term search support method ends.

(e) ステップS606で補正検索文字列と一致する用語が検索用インデックステーブル保存部202に存在しないと索引用語検索部112が判断した場合は、索引用語検索部112は補正検索文字列を類似用語変換部114に与えて図7のステップS701に進み、類似用語変換部114は内部カウンタnを1と定義する。  (e) If the index term search unit 112 determines that the term matching the corrected search character string does not exist in the search index table storage unit 202 in step S606, the index term search unit 112 uses the corrected search character string as a similar term. The process proceeds to step S701 in FIG. 7 after being given to the conversion unit 114, and the similar term conversion unit 114 defines the internal counter n as 1.

(f) ステップS702で類似用語変換部114は、ステップS601で入力された検索文字列とn文字違いの類似用語が用語辞書201に存在するか検索する。例えば、内部カウンタnが1であり、ステップS601で「飛び箱」が検索文字列として入力されていた場合には、1文字違いで正しい漢字を用いた用語「跳び箱」が検索される。ステップS703で、類似用語変換部114はn文字違いの類似用語が用語辞書201に存在したか否か判断し、用語辞書201にn文字違いの類似用語が存在した場合はステップS704に進み、存在しなかった場合はステップS707に進む。  (f) In step S702, the similar term conversion unit 114 searches the term dictionary 201 for a similar term that differs from the search character string input in step S601 by n characters. For example, if the internal counter n is 1 and “jumping box” has been input as a search character string in step S601, the term “jumping box” using the correct kanji character by one character is searched. In step S703, the similar term conversion unit 114 determines whether or not a similar term having n characters differs in the term dictionary 201. If a similar term having n characters is present in the term dictionary 201, the process proceeds to step S704. If not, the process proceeds to step S707.

(g) ステップS704で、類似用語変換部114は用語辞書201から検索した検索文字列とn文字違いの類似用語の数と、設定された用語制限値Zとを比較する。例えば用語制限値が5と設定されていた場合、n文字違いの類似用語が5以下検索された場合はステップS705に進み、6以上検索された場合は、ステップS706に進む。ステップS705で、索引用語検索部112は検索されたn文字違いの類似用語をリストアップし表示指示部116に与える。表示指示部116は、図1に示したライアントコンピュータ10A〜10Nのいずれかの表示部に表示されているユーザーインターフェース30の検索結果表示領域36に、図9に示すようにn文字違いの類似用語を表示させ、用語検索支援方法を終了する。  (g) In step S704, the similar term conversion unit 114 compares the search character string searched from the term dictionary 201 with the number of similar terms different in n characters and the set term limit value Z. For example, when the term limit value is set to 5, if similar terms different in n characters are searched for 5 or less, the process proceeds to step S705, and if 6 or more are searched, the process proceeds to step S706. In step S705, the index term search unit 112 lists the similar terms that have been searched for n characters and supplies them to the display instruction unit 116. As shown in FIG. 9, the display instruction unit 116 displays a similar term with n character differences in the search result display area 36 of the user interface 30 displayed on one of the display units of the client computers 10A to 10N shown in FIG. Is displayed and the term search support method is terminated.

(h) ステップS707において、類似用語変換部114は内部カウンタnに1を加算し、新たな内部カウンタnを定義する。さらにステップS708で索引用語検索部112は内部カウンタnの値が文字違い制限値Xより大きいか否か判断する。内部カウンタnの値が文字違い制限値X以下の場合はステップS702に戻り、n文字違いの類似用語の検索を繰り返す。内部カウンタnが文字違い制限値Xより大きい場合にはステップS706に進む。ステップS706において、表示指示部116はステップS601で入力された検索文字列に該当するホームページが検索されなかった旨を図1に示したクライアントコンピュータ10A〜10Nのいずれかの表示部に表示させ、用語検索支援方法を終了する。  (h) In step S707, the similar term conversion unit 114 adds 1 to the internal counter n to define a new internal counter n. Further, in step S708, the index term search unit 112 determines whether or not the value of the internal counter n is larger than the character difference limit value X. If the value of the internal counter n is equal to or less than the character difference limit value X, the process returns to step S702 and the search for similar terms with n character differences is repeated. If the internal counter n is greater than the character difference limit value X, the process proceeds to step S706. In step S706, the display instruction unit 116 displays on the display unit of any of the client computers 10A to 10N shown in FIG. 1 that the home page corresponding to the search character string input in step S601 has not been searched, and the term End the search support method.

以上、実施の形態にかかる図2に示した用語検索支援システム1と、図6及び図7に示した用語検索支援方法によれば、検索文字列として「かな」のみを用いた文字列や、「漢字」と「かな」が交じった文字列が入力された場合でも、図2に示した漢字変換部110が用語辞書201を参照して検索文字列を漢字変換処理し、図5に示す方法で作成された検索用インデックステーブル保存部202を参照することにより、検索文字列に対応する正しい漢字を用いた用語が掲載されたホームページを検索することが可能となる。また検索文字列として正しい漢字を用いた用語が入力され、ホームページには用語が「かな」のみで表現されている場合でも、図2に示した検索用インデックステーブル保存部202を参照することにより、用語が「かな」のみで掲載されているホームページの検索をすることも可能となる。そのため、児童等が漢字かな交じりの検索文字列を入力した場合も、かなのみで表された用語を含むホームページの検索が可能であり、また児童等の保護者等が正確な用語を用いて検索文字列を入力した場合も、用語がかな書きされたホームページを検索する事も可能となる。   As described above, according to the term search support system 1 shown in FIG. 2 and the term search support method shown in FIGS. 6 and 7 according to the embodiment, a character string using only “Kana” as a search character string, Even when a character string in which “kanji” and “kana” are mixed is input, the kanji conversion unit 110 shown in FIG. 2 performs kanji conversion processing on the search character string by referring to the term dictionary 201, and the method shown in FIG. By referring to the search index table storage unit 202 created in the above, it is possible to search a home page on which terms using correct kanji corresponding to the search character string are posted. In addition, even when terms using correct kanji are input as a search character string and the terms are expressed only on the homepage as “Kana”, by referring to the search index table storage unit 202 shown in FIG. It is also possible to search for websites that contain only the term “kana”. Therefore, even when a child or the like enters a search string of kanji or kana, it is possible to search a home page that includes terms expressed only in kana, and parents or guardians such as children can search using accurate terms. Even when a character string is entered, it is possible to search a home page on which terms are written in kana.

さらに、検索文字列に一部誤った漢字が含まれていた場合も、類似用語変換部114が用語辞書201を参照して、類似用語を抽出してユーザに示すので、ユーザは正しい漢字を用いた検索文字列によりホームページ検索を再開することが可能となる。また、類似用語が多数抽出された場合は、むしろユーザに検索結果がないと表示した方が適切な場合もある。これに対し図7に示した用語検索支援方法によれば、ステップS704で類似用語の数と、用語制限値Zとを比較することにより、ユーザに示す類似用語の数の上限を定めることも可能となる。   Furthermore, even if a part of the search character string contains an incorrect Chinese character, the similar term conversion unit 114 refers to the term dictionary 201 to extract the similar term and presents it to the user, so the user uses the correct Chinese character. The home page search can be resumed by the search character string. Further, when many similar terms are extracted, it may be more appropriate to display that the user has no search result. On the other hand, according to the term search support method shown in FIG. 7, it is possible to determine the upper limit of the number of similar terms shown to the user by comparing the number of similar terms with the term limit value Z in step S704. It becomes.

また、用語辞書201に含まれる用語を学年別漢字配当表に含まれる漢字を使用する用語に限定すれば、学校教育での利用において、より高速かつ的確に用語検索を行うことも可能である。   In addition, if terms included in the term dictionary 201 are limited to terms that use kanji in the grade-specific kanji distribution table, it is possible to perform term search more quickly and accurately in use in school education.

また上述した用語検索支援方法は、時系列的につながった一連の処理あるいは操作として表現可能である。したがって、用語検索支援方法をコンピュータシステムで実行するために、コンピュータシステム内のプロセッサなどが果たす複数の機能を特定するコンピュータプログラム製品で図5、図6及び図7に示した用語検索支援方法を実現可能である。ここで、コンピュータプログラム製品は、図2に示したプログラム記憶装置230等のコンピュータシステムに入出力可能な記録装置あるいは記録媒体等をいう。記録媒体としては、メモリ装置、磁気ディスク装置、光ディスク装置、その他のプログラムを記録することができるような装置が含まれる。   The term search support method described above can be expressed as a series of processes or operations connected in time series. Therefore, in order to execute the term search support method in the computer system, the term search support method shown in FIGS. 5, 6, and 7 is realized by a computer program product that specifies a plurality of functions performed by a processor in the computer system. Is possible. Here, the computer program product refers to a recording device or a recording medium that can be input and output to a computer system such as the program storage device 230 shown in FIG. The recording medium includes a memory device, a magnetic disk device, an optical disk device, and other devices capable of recording other programs.

(その他の実施の形態)
上記のように、本発明は実施の形態によって記載したが、この開示の一部をなす記述及び図面はこの発明を限定するものであると理解するべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかになるはずである。例えば、図2に示した用語辞書201に登録する用語を分野に応じた用語に限定し、検索対象メタデータ203に登録するホームページも特定分野のものに限定すれば、分野別のホームページを高速かつ効率よく検索することが可能となる。また、実施の形態においてはインターネット上のホームページを検索する場合を示したが、LAN等の情報ネットワーク上のファイル検索や、スタンドアロンのコンピュータのハードディスク内のファイル検索にも本発明が適用可能であるのは勿論である。このように、本発明はここでは記載していない様々な実施の形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲の発明特定事項によってのみ限定されるものである。
(Other embodiments)
As described above, the present invention has been described according to the embodiment. However, it should not be understood that the description and drawings constituting a part of this disclosure limit the present invention. From this disclosure, various alternative embodiments, examples and operational techniques should be apparent to those skilled in the art. For example, if the terms to be registered in the term dictionary 201 shown in FIG. 2 are limited to terms corresponding to the field, and the home page to be registered in the search target metadata 203 is also limited to a specific field, a home page for each field can be created at high speed. It becomes possible to search efficiently. In the embodiment, the case where a homepage on the Internet is searched is shown. However, the present invention can also be applied to a file search on an information network such as a LAN or a file search in a hard disk of a stand-alone computer. Of course. Thus, it should be understood that the present invention includes various embodiments and the like not described herein. Therefore, the present invention is limited only by the invention specifying matters in the scope of claims reasonable from this disclosure.

本発明の実施の形態に係る用語検索支援システムが接続されるインターネットの模式図である。1 is a schematic diagram of the Internet to which a term search support system according to an embodiment of the present invention is connected. 本発明の実施の形態に係る用語検索支援システムを示すブロック図である。It is a block diagram which shows the term search assistance system which concerns on embodiment of this invention. 本発明の実施の形態に係る用語辞書に含まれる表の一例である。It is an example of the table | surface contained in the term dictionary which concerns on embodiment of this invention. 本発明の実施の形態に係る用語検索支援システムに接続されるコンピュータに表示される表示画面の一例(その1)である。It is an example (the 1) of the display screen displayed on the computer connected to the term search assistance system which concerns on embodiment of this invention. 本発明の実施の形態に係る用語検索支援方法を示すフローチャート図(その1)である。FIG. 4 is a flowchart (part 1) illustrating a term search support method according to an embodiment of the present invention. 本発明の実施の形態に係る用語検索支援方法を示すフローチャート図(その2)である。FIG. 5 is a flowchart (part 2) illustrating the term search support method according to the embodiment of the present invention. 本発明の実施の形態に係る用語検索支援方法を示すフローチャート図(その3)である。FIG. 9 is a flowchart (part 3) illustrating the term search support method according to the embodiment of the present invention. 本発明の実施の形態に係る用語検索支援システムに接続されるコンピュータに表示される表示画面の一例(その2)である。It is an example (the 2) of the display screen displayed on the computer connected to the vocabulary search assistance system which concerns on embodiment of this invention. 本発明の実施の形態に係る用語検索支援システムに接続されるコンピュータに表示される表示画面の一例(その3)である。It is an example (the 3) of the display screen displayed on the computer connected to the vocabulary search assistance system which concerns on embodiment of this invention.

符号の説明Explanation of symbols

1…用語検索支援システム
5…インターネット
10A, 10B, 10C, ・・・・・, 10N…クライアントコンピュータ
20A, 20B, 20C, ・・・・・, 20N…ホームページサーバ
30…ユーザーインターフェース
32…検索文字列入力領域
34…検索ボタン
36…検索結果表示領域
100…中央処理装置(CPU)
110…漢字変換部
111…インデックス作成部
112…索引用語検索部
113…情報取得部
114…類似用語変換部
116…表示指示部
200…記憶装置
201…用語辞書
202…検索用インデックステーブル保存部
203…検索対象メタデータ
230…プログラム記憶装置
231…データ記憶装置
300…接続装置
302…入力装置
1 ... Term search support system
5 ... Internet
10A, 10B, 10C, ..., 10N ... Client computer
20A, 20B, 20C, ..., 20N ... Homepage server
30… User interface
32 ... Search string input area
34 ... Search button
36 ... Search result display area
100 ... Central processing unit (CPU)
110… Kanji conversion part
111 ... Index creation section
112 ... Index term search part
113 ... Information acquisition unit
114… Similar term conversion part
116 ... Display instruction section
200 ... Storage device
201 ... Term dictionary
202… Search index table storage
203 ... Search target metadata
230 ... Program storage device
231 ... Data storage device
300 ... Connecting device
302 ... Input device

Claims (7)

検索文字列を取得する接続装置と、
入力された前記検索文字列を漢字変換処理し、補正検索文字列を出力する漢字変換部と、
ファイルに含まれる掲載用語を漢字変換処理した索引用語を保存する検索用インデックステーブル保存部と、
前記補正検索文字列と一致する前記索引用語を検索する索引用語検索部と、
前記索引用語に対応する前記ファイルの情報を取得する情報取得部
とを備えることを特徴とする用語検索支援システム。
A connected device that retrieves the search string;
A kanji conversion unit that performs a kanji conversion process on the input search character string and outputs a corrected search character string;
An index table storage unit for search that stores index terms obtained by converting Kanji conversion of published terms contained in the file;
An index term search unit that searches for the index terms that match the corrected search character string;
A term search support system comprising: an information acquisition unit that acquires information of the file corresponding to the index term.
前記検索文字列に類似する類似用語を検索する類似用語変換部
を更に備えることを特徴とする請求項1記載の用語検索支援システム。
The term search support system according to claim 1, further comprising a similar term conversion unit that searches for similar terms similar to the search character string.
前記ファイルに含まれる掲載文字列を形態素解析し、前記掲載用語を抽出するインデックス作成部を更に備えることを特徴とする請求項1又は2記載の用語検索支援システム。
The term search support system according to claim 1, further comprising an index creation unit that performs a morphological analysis on a posted character string included in the file and extracts the posted term.
接続装置が検索文字列を取得するステップと、
漢字変換部が、前記検索文字列を漢字変換処理し、補正検索文字列を出力するステップと、
インデックス作成部が、ファイルに含まれる掲載用語を漢字変換処理した索引用語を検索用インデックステーブル保存部に保存するステップと、
索引用語検索部が、前記補正検索文字列と一致する前記索引用語を検索するステップと、
情報取得部が、前記索引用語に対応する前記ファイルの情報を取得するステップ
とを含むことを特徴とする用語検索支援方法。
The connected device obtains a search string;
A kanji conversion unit performing kanji conversion processing on the search character string and outputting a corrected search character string;
An index creating unit storing an index term obtained by converting the published term contained in the file into a kanji character in a search index table storing unit;
An index term search unit searching for the index term that matches the corrected search character string;
An information acquisition unit includes the step of acquiring information of the file corresponding to the index term.
類似用語変換部が、前記検索文字列に類似する類似用語を検索するステップを更に含むことを特徴とする請求項4記載の用語検索支援方法。
The term search support method according to claim 4, further comprising a step of searching for a similar term similar to the search character string by the similar term conversion unit.
前記検索用インデックステーブル保存部に保存するステップは、インデックス作成部が前記ファイルに含まれる掲載文字列を形態素解析し、前記掲載用語を抽出するステップを含むことを特徴とする請求項4又は5に記載の用語検索支援方法。
6. The step of storing in the search index table storage unit includes a step in which an index creation unit performs morphological analysis on a posted character string included in the file and extracts the posted term. The term search support method described.
コンピュータに、
検索文字列を取得する手順と、
前記検索文字列を漢字変換処理し、補正検索文字列を出力する手順と、
ファイルに含まれる掲載用語を漢字変換処理した索引用語を取得する手順と、
前記補正検索文字列と一致する前記索引用語を検索する手順と、
前記索引用語に対応する前記ファイルの情報を取得する手順
とを実行させるための用語検索支援プログラム。
On the computer,
Get the search string,
A procedure for converting the search character string into kanji and outputting a corrected search character string;
To obtain index terms that have been converted from Kanji to the published terms contained in the file,
Searching the index terms that match the corrected search string;
A term search support program for executing the procedure of acquiring information of the file corresponding to the index term.
JP2003421429A 2003-12-18 2003-12-18 Term retrieval support system, term retrieval support method and term retrieval support program Pending JP2005182408A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003421429A JP2005182408A (en) 2003-12-18 2003-12-18 Term retrieval support system, term retrieval support method and term retrieval support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003421429A JP2005182408A (en) 2003-12-18 2003-12-18 Term retrieval support system, term retrieval support method and term retrieval support program

Publications (1)

Publication Number Publication Date
JP2005182408A true JP2005182408A (en) 2005-07-07

Family

ID=34782663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003421429A Pending JP2005182408A (en) 2003-12-18 2003-12-18 Term retrieval support system, term retrieval support method and term retrieval support program

Country Status (1)

Country Link
JP (1) JP2005182408A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243155A (en) * 2007-03-29 2008-10-09 Roland Corp Lyric retrieving device and lyric retrieval program
JP2009505221A (en) * 2005-08-11 2009-02-05 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009505221A (en) * 2005-08-11 2009-02-05 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior
JP4866421B2 (en) * 2005-08-11 2012-02-01 アマゾン テクノロジーズ インコーポレーテッド A method to identify alternative spelling of search string by analyzing user's self-correcting search behavior
JP2008243155A (en) * 2007-03-29 2008-10-09 Roland Corp Lyric retrieving device and lyric retrieval program

Similar Documents

Publication Publication Date Title
KR101554293B1 (en) Cross-language information retrieval
KR101088983B1 (en) Data search system and data search method using a global unique identifier
US9323827B2 (en) Identifying key terms related to similar passages
EP2181405B1 (en) Automatic expanded language search
US7783644B1 (en) Query-independent entity importance in books
US20060195435A1 (en) System and method for providing query assistance
JPH11250105A (en) Method and system for retrieving multi-language information
CN106156111B (en) Patent document retrieval method, device and system
McCutcheon Basic, fuller, fullest: Treatment options for electronic theses and dissertations
CN109815390B (en) Method, device, computer equipment and computer storage medium for retrieving multilingual information
JP4160548B2 (en) Document summary creation system, method, and program
JP2004341753A (en) Retrieval support device, retrieval support method and program
JP2006072744A (en) Document processor, control method therefor, program and storage medium
CN112015907A (en) Method and device for quickly constructing discipline knowledge graph and storage medium
JP7122773B2 (en) DICTIONARY CONSTRUCTION DEVICE, DICTIONARY PRODUCTION METHOD, AND PROGRAM
JP2005182408A (en) Term retrieval support system, term retrieval support method and term retrieval support program
JP2009129176A (en) Structured document retrieval device, method, and program
JP2007200252A (en) Abbreviation generation/validity evaluation method, synonym database generation/update method, abbreviation generation/validity evaluation device, synonym database generation/update device, program, and recording medium
JP5104329B2 (en) Document search system
JP4497337B2 (en) Concept search device and recording medium recording computer program
JP2010009237A (en) Multi-language similar document retrieval device, method and program, and computer-readable recording medium
JP2004157965A (en) Search support device and method, program and recording medium
JP4384736B2 (en) Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device
JP4368550B2 (en) Document search apparatus, document search method, and program causing computer to execute the method
Yilmaz et al. Snippet Generation Using Local Alignment for Information Retrieval (LAIR)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091117