JP5179564B2 - Query segment position determination device - Google Patents
Query segment position determination device Download PDFInfo
- Publication number
- JP5179564B2 JP5179564B2 JP2010292481A JP2010292481A JP5179564B2 JP 5179564 B2 JP5179564 B2 JP 5179564B2 JP 2010292481 A JP2010292481 A JP 2010292481A JP 2010292481 A JP2010292481 A JP 2010292481A JP 5179564 B2 JP5179564 B2 JP 5179564B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- query
- segment position
- separator
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003909 pattern recognition Methods 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 18
- 238000012217 deletion Methods 0.000 claims description 14
- 230000037430 deletion Effects 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 11
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 241000556720 Manga Species 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005315 distribution function Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000010923 batch production Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、検索エンジン等における検索クエリに対する操作技術に関する。 The present invention relates to an operation technique for a search query in a search engine or the like.
インターネット上には、膨大な情報の中から所望の情報を探し出すためのツールとして検索エンジンと呼ばれるサイトが設けられている。 A site called a search engine is provided on the Internet as a tool for searching for desired information from a vast amount of information.
検索エンジンには、予め機械的あるいは人的に、検索キーワードと当該検索キーワードが含まれるページとを対応付けた検索DB(Data Base)が設けられており、ユーザが端末装置から入力した検索クエリに基づいて検索DBを検索し、ヒットしたページのタイトルやスニペット等をURL(Uniform Resource Locator)リンクを伴って検索結果として端末装置に表示する。ユーザはタイトルやスニペット等を見た上で実際のページを見てみようと思った場合、タイトル等を選択することでリンクされたページに画面が遷移する。 The search engine is provided with a search DB (Data Base) in which a search keyword and a page including the search keyword are associated with each other in advance mechanically or manually, and a search query input by a user from a terminal device is provided. Based on the search DB, the title or snippet of the hit page is displayed on the terminal device as a search result with a URL (Uniform Resource Locator) link. When the user wants to see the actual page after viewing the title, snippet, etc., the screen transitions to the linked page by selecting the title, etc.
ところで、検索クエリとしては、一つの単語等を指定する場合のほかに、「まんが□立ち読み」といったように、スペース「□」等をセパレータとして指定する場合が多い。この場合、「まんが」と「立ち読み」の両者を含むページが検索(AND検索)される。検索エンジンは、「まんが」に基づく検索結果と「立ち読み」に基づく検索結果とをAND演算し、最終的な検索結果としてユーザに返す。なお、セパレータにより区切ることはセグメンテーションと呼ばれ、検索クエリ上のセパレータの位置はクエリセグメント位置と呼ばれる。 By the way, as a search query, in addition to designating a single word or the like, a space “□” or the like is often designated as a separator, such as “Manga □ browsing”. In this case, a page including both “manga” and “browsing” is searched (AND search). The search engine performs an AND operation on the search result based on “manga” and the search result based on “browsing” and returns the result to the user as a final search result. Separation by a separator is called segmentation, and the position of the separator on the search query is called a query segment position.
しかし、ユーザが適切な位置にセパレータを入れるとは限らず、セパレータを除けば同じ文字列であっても、クエリセグメント位置の違いによって検索結果が変わってしまい、所望の検索結果が得られない場合がある。例えば、上記の例「まんが□立ち読み」に代えて「まんが立ち□読み」と入力された場合、検索エンジンは「まんが立ち」と「読み」を個別に検索し、それぞれの検索結果のAND演算を行うため、「まんが□立ち読み」の最終的な検索結果とは異なってしまう。より現実的な例としては、芸能人の楽曲のタイトル等を検索しようとした場合、楽曲のタイトルが2つ以上の語に分割できる場合に、連続して検索クエリにした場合と途中にセパレータを入れて検索クエリにした場合とで検索結果が異なってしまう。この場合、楽曲のタイトルは分割されずに検索DBに登録される場合が多いため、分割せずに連続して検索クエリにした場合は所望の検索結果が得られるが、分割した場合は一般用語のノイズに紛れて所望の検索結果が見つけられないことが多い。 However, the user does not always put a separator at an appropriate position, and the search result changes depending on the query segment position and the desired search result cannot be obtained even if the character string is the same except for the separator. There is. For example, if “Manga standing reading” is entered instead of “Manga standing reading” in the above example, the search engine searches for “Manga standing” and “reading” separately, and performs an AND operation on each search result. This is different from the final search result of “Manga □ Browsing”. As a more realistic example, when trying to search for a celebrity song title, etc., when the song title can be divided into two or more words, a separator is inserted between the search query and the search query. The search results will differ depending on the search query. In this case, since the title of the music is often registered in the search DB without being divided, a desired search result can be obtained when the search query is made continuously without being divided, but in the case of dividing the general term In many cases, the desired search results cannot be found due to noise.
上述したようにユーザの入力した検索クエリに基づいて単に検索を行ったのでは検索精度の低下を招くこととなり、検索精度を向上する対策が求められていた。 As described above, simply performing a search based on a search query input by the user causes a decrease in search accuracy, and a countermeasure for improving the search accuracy has been demanded.
一方、特許文献1には、テキストデータベースに蓄積されたテキストデータに対してテキストセグメンテーションを行う技術が開示されているが、検索クエリを対象としたものではない。
On the other hand,
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、ユーザにより入力された検索クエリのクエリセグメント位置を適正な位置に修正することで、検索精度を高めることにある。 The present invention has been proposed in view of the above-described conventional problems, and its object is to improve search accuracy by correcting the query segment position of a search query input by a user to an appropriate position. There is.
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、検索ログを取得する検索ログ取得手段と、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、分割された文字列に基づいて検索データベースを検索する第1検索手段と、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段とを備えるクエリセグメント位置決定装置を要旨としている。
In order to solve the above-described problems, in the present invention, as described in
また、請求項2に記載されるように、請求項1に記載のクエリセグメント位置決定装置において、前記クエリ分割手段は、形態素解析により検索クエリを複数の文字列に分割するようにすることができる。
In addition, as described in
また、請求項3に記載されるように、請求項1に記載のクエリセグメント位置決定装置において、前記クエリ分割手段は、検索ログから最も分割数の多いパターンを選択することで検索クエリを複数の文字列に分割するようにすることができる。
Moreover, as described in
また、請求項4に記載されるように、請求項1に記載のクエリセグメント位置決定装置において、前記クエリ分割手段は、検索ログから文字列の結合モデルを複数生成することで検索クエリを複数の文字列に分割するようにすることができる。
In addition, as described in claim 4, in the query segment position determination device according to
また、請求項5に記載されるように、検索ログを取得する検索ログ取得手段と、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、分割された文字列に基づいて検索データベースを検索する第1検索手段と、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段と、ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段と、修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段とを備える検索装置として構成することができる。 In addition, as described in claim 5, a search log acquisition unit that acquires a search log, a separator deletion unit that deletes a separator from a search query of the acquired search log, and a plurality of search queries from which the separator has been deleted Query dividing means for dividing the character string, first search means for searching the search database based on the divided character string, and one divided character string based on the search result are connected to the adjacent character string. Analyzing means for calculating the frequency of occurrence as a score, query segment position determining means for determining a query segment position based on the calculated score, and learning means for learning the pattern recognition unit based on the determined query segment position And the search query input from the user is judged by the pattern recognition unit to determine the suitability of the query segment position. It can be constructed and query correction means corrects the segment position as a search device and a second search means for searching the search database based on the modified search query.
また、請求項6に記載されるように、ユーザから検索クエリを受け付ける受付手段と、受け付けた検索クエリからセパレータを削除するセパレータ削除手段と、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、分割された文字列に基づいて検索データベースを検索する第1検索手段と、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段と、修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段とを備える検索装置として構成することができる。 In addition, as described in claim 6, a receiving unit that receives a search query from a user, a separator deleting unit that deletes a separator from the received search query, and a search query from which the separator has been deleted is divided into a plurality of character strings. Query dividing means, first search means for searching a search database based on the divided character strings, and frequency of one divided character string concatenated with adjacent character strings based on the search result Analyzing means for calculating as a score, query segment position determining means for determining a query segment position based on the calculated score, query correcting means for correcting a search query based on the determined query segment position determining means, and correction And a second search means for searching the search database based on the search query. It can be.
また、請求項7に記載されるように、検索装置の制御部が、検索ログを取得する検索ログ取得工程と、前記制御部が、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除工程と、前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、前記制御部が、決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習工程と、前記制御部が、ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正工程と、前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程とを備える検索制御方法として構成することができる。 In addition, as described in claim 7, a search log acquisition step in which the control unit of the search device acquires a search log, and a separator deletion step in which the control unit deletes a separator from the search query of the acquired search log A query dividing step in which the control unit divides the search query from which the separator has been deleted into a plurality of character strings; and a first search step in which the control unit searches a search database based on the divided character strings; The control unit calculates, as a score, the frequency at which one divided character string is concatenated and co-occurs with an adjacent character string based on the search result; and the control unit is based on the calculated score. A query segment position determining step for determining a query segment position, and a learning step in which the control unit learns the pattern recognition unit based on the determined query segment position; The control unit determines the suitability of the query segment position by the pattern recognition unit for the search query input from the user, and corrects the query segment position to an appropriate query segment position, and the control unit performs the corrected search. It can comprise as a search control method provided with the 2nd search process of searching the search database based on a query.
また、請求項8に記載されるように、検索装置の制御部が、ユーザから検索クエリを受け付ける受付工程と、前記制御部が、受け付けた検索クエリからセパレータを削除するセパレータ削除工程と、前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、前記制御部が、決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正工程と、前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程とを備える検索制御方法として構成することができる。 In addition, as described in claim 8, the control unit of the search device receives a search query from a user, the separator delete step of deleting the separator from the received search query, and the control A query dividing step of dividing the search query from which the separator is removed into a plurality of character strings, a first search step of searching the search database based on the divided character strings, and the control unit An analysis step of calculating, as a score, the frequency with which one divided character string is concatenated and co-occurring with an adjacent character string based on the search result, and the control unit determines a query segment position based on the calculated score A query segment position determining step for determining the query, and the control unit correcting the search query based on the determined query segment position determining means When the control unit can be configured as a search control method and a second search step of searching the search database based on the modified search query.
また、請求項9に記載されるように、検索装置を構成するコンピュータを、検索ログを取得する検索ログ取得手段、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、分割された文字列に基づいて検索データベースを検索する第1検索手段、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段、ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段、修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段として機能させる検索制御プログラムとして構成することができる。 According to a ninth aspect of the present invention, a computer constituting the search device includes a search log acquisition unit that acquires a search log, a separator deletion unit that deletes a separator from a search query of the acquired search log, and the separator is deleted. Query dividing means for dividing the search query into a plurality of character strings, first search means for searching the search database based on the divided character strings, and characters adjacent to one divided character string based on the search results Analyzing means for calculating the frequency of concatenated co-occurrence with a column as a score, query segment position determining means for determining a query segment position based on the calculated score, and learning of the pattern recognition unit based on the determined query segment position The learning means determines whether the query segment position is appropriate by the pattern recognition unit based on the search query input by the user. Sectional and can be configured as an appropriate query correction means corrects the query segment location, the search control program to function as the second searching means for searching the search database based on the modified search query.
また、請求項10に記載されるように、検索装置を構成するコンピュータを、ユーザから検索クエリを受け付ける受付手段、受け付けた検索クエリからセパレータを削除するセパレータ削除手段、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、分割された文字列に基づいて検索データベースを検索する第1検索手段、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段、修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段として機能させる検索制御プログラムとして構成することができる。 According to a tenth aspect of the present invention, a computer constituting the search device includes: a reception unit that receives a search query from a user; a separator deletion unit that deletes a separator from the received search query; and a search query from which the separator has been deleted. Query dividing means for dividing into a plurality of character strings, first search means for searching a search database based on the divided character strings, and one divided character string connected to an adjacent character string based on the search result Analyzing means for calculating the frequency of occurrence as a score, query segment position determining means for determining a query segment position based on the calculated score, query correcting means for correcting a search query based on the determined query segment position determining means, Second search means for searching the search database based on the corrected search query It can be configured as a search control program to function.
本発明にあっては、ユーザにより入力された検索クエリのクエリセグメント位置を適正な位置に修正することで、検索精度を高めることができる。 In the present invention, it is possible to improve the search accuracy by correcting the query segment position of the search query input by the user to an appropriate position.
以下、本発明の好適な実施形態につき説明する。 Hereinafter, preferred embodiments of the present invention will be described.
<第1の実施形態>
図1は本発明の第1の実施形態にかかるシステムの構成例を示す図である。
<First Embodiment>
FIG. 1 is a diagram showing a configuration example of a system according to the first embodiment of the present invention.
図1において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、携帯電話、PDA(Personal Digital
Assistants)等のユーザ端末2が複数接続されている。ユーザ端末2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper
Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。
In FIG. 1, a
A plurality of
It has a function of requesting / acquiring / displaying page data written in a language such as Text Markup Language) and transmitting form data.
一方、ネットワーク1には、ユーザの操作するユーザ端末2のブラウザ21からのアクセスに対してWeb検索を行って検索結果をユーザ端末2のブラウザ21に返送する検索装置3が接続されている。
On the other hand, the
検索装置3は、機能部として、クエリセグメント位置学習部301とパターン認識部309と検索クエリ受付部310と検索クエリ修正部311と検索部312と検索結果応答部313とを備えている。クエリセグメント位置学習部301は、検索ログ取得部302とセパレータ削除部303とクエリ分割部304と検索部305と検索結果解析部306とクエリセグメント位置決定部307と学習データ生成・学習要求部308とを備えている。
The
これらの機能部は、検索装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only
Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
These functional units include a CPU (Central Processing Unit) and a ROM (Read Only) of the computer constituting the
The present invention is realized by a computer program executed on hardware resources such as a memory (RAM) and a random access memory (RAM). These functional units do not need to be arranged on a single computer, and may be distributed as necessary.
また、検索装置3が利用するデータベースとして、検索ログ314と検索DB315とが設けられている。これらのデータベースは、検索装置3を構成するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。なお、検索ログ314と検索DB315は検索装置3内に配置される必要はなく、他の装置上に配置してもよい。
A
図2は検索ログ314のデータ構造例を示す図である。検索ログ314は、検索ログ生データと検索ログ集計データとを含んでいる。検索ログ生データは、「検索日時」「検索クエリ」等の項目を含んでいる。「検索日時」は検索が実行された日時である。「検索クエリ」は検索に用いられた検索式である。検索ログ集計データは、「検索クエリ」「検索回数(頻度)」等の項目を含んでいる。「検索クエリ」は、検索に用いられた検索式である。「検索回数(頻度)」は、同じ検索クエリについて検索された回数もしくは頻度である。
FIG. 2 is a diagram showing an example of the data structure of the
図3は検索DB315のデータ構造例を示す図である。検索DB315は、「検索キーワード」「ページURL」「タイトル」「要約」等の項目を含んでいる。「検索キーワード」は、検索に用いた文字列である。「ページURL」は、検索キーワードが含まれるページのアドレスである。「タイトル」は、ページのタイトルである。「要約」は、ページの内容の一部もしくは全部の文字列である。
FIG. 3 is a diagram illustrating an example of the data structure of the
図1に戻り、検索装置3のクエリセグメント位置学習部301は、バッチ処理として動作し、検索ログ314に基づいて検索DB315を検索し、適正なクエリセグメント位置を決定して、SVM(Support Vector Machine)等のパターン認識部309を学習させる機能を有している。
Returning to FIG. 1, the query segment
検索ログ取得部302は、検索ログ314の検索ログ生データから検索クエリを取得する機能を有している。
The search
セパレータ削除部303は、検索ログ取得部302の取得した検索クエリからスペース等のセパレータを削除する機能を有している。
The
クエリ分割部304は、セパレータ削除部303でセパレータが削除された検索クエリを意味のある範囲で複数の文字列に分割する機能を有している。
The
検索部305は、クエリ分割部304で分割された複数の文字列に基づいて検索DB315を検索する機能を有している。
The
検索結果解析部306は、検索部305の検索で得られた検索結果を解析し、クエリ分割部304で分割された複数の文字列のそれぞれが隣接する文字列と接続された状態でページ上に存在(連接共起)する頻度を表わすスコアを算出する機能を有している。
The search
クエリセグメント位置決定部307は、検索結果解析部306の算出したスコアに基づいて適正なクエリセグメント位置を決定する機能を有している。
The query segment
学習データ生成・学習要求部308は、クエリセグメント位置決定部307で決定されたクエリセグメント位置の特徴を示す学習データを生成し、その学習データに基づいてパターン認識部309に学習を行うことを要求する機能を有している。
The learning data generation /
パターン認識部309は、周知のSVM等のメカニズムを有し、特徴ベクトルおよび教師信号に基づいて学習を行い、パターン認識時には、入力された特徴ベクトルがいずれのクラス(本例では、検索クエリとしてクエリセグメント位置が適正か否か)に属するかを示す認識結果を出力する機能を有している。
The
検索クエリ受付部310は、ユーザ端末2のブラウザ21からの検索要求時に検索クエリを受け付ける機能を有している。
The search
検索クエリ修正部311は、検索クエリ受付部310の受け付けた検索クエリのクエリセグメント位置が適正か否かパターン認識部309によって、全ての文字列間を順番にクエリセグメント位置をずらすことで検索クエリを修正する機能を有している。
The search
検索部312は、検索クエリ修正部311を経由した検索クエリ(必要に応じて修正された検索クエリ)に基づいて検索DB315を検索する機能を有している。
The
検索結果応答部313は、検索部312の検索結果を要求元のユーザ端末2のブラウザ21に返送する機能を有している。
The search
図4は検索装置3のハードウェア構成例を示す図である。
FIG. 4 is a diagram illustrating a hardware configuration example of the
図4において、検索装置3は、システムバス31に接続されたCPU32、ROM33、RAM34、NVRAM(Non-Volatile Random Access Memory)35、I/F(Interface)36と、I/F36に接続された、キーボード、マウス、モニタ、CD/DVD(Compact Disk/Digital Versatile Disk)ドライブ等のI/O(Input/Output Device)37、HDD(Hard Disk Drive)38、NIC(Network Interface Card)39等を備えている。Mはプログラムもしくはデータが格納されたCD/DVD等のメディア(記録媒体)である。
In FIG. 4, the
図5は第1の実施形態の処理例を示すフローチャートである。 FIG. 5 is a flowchart illustrating an example of processing according to the first embodiment.
図5(a)において、処理を開始すると(ステップS101)、検索装置3のクエリセグメント位置学習部301の検索ログ取得部302は、検索ログ314の検索ログ生データから検索クエリを取得する(ステップS102)。図6(a)は取得した検索クエリの例を示している。
5A, when the process is started (step S101), the search
次いで、図5(a)に戻り、クエリセグメント位置学習部301のセパレータ削除部303は、検索ログ取得部302の取得した検索クエリからスペース等のセパレータを削除する(ステップS103)。図6(b)は図6(a)の検索クエリからセパレータを削除した状態を示している。
5A, the
次いで、図5(a)に戻り、クエリセグメント位置学習部301のクエリ分割部304は、セパレータを削除した検索クエリを意味のある範囲で複数の文字列に分割する(ステップS104)。検索クエリの分割手法としては、例えば、次の3つの手法がある。
Next, returning to FIG. 5A, the
(1)形態素解析により分割する手法:この手法では、一定の精度で分割が可能であるメリットがある反面、辞書に登録されていない未知語に弱いというデメリットがある。 (1) Method of dividing by morphological analysis: This method has a merit that it can be divided with a certain accuracy, but has a demerit that it is weak against unknown words that are not registered in the dictionary.
(2)検索ログから最も分割数の多いパターンを選択する手法:すなわち、検索ログ314からスペース等のセパレータを削除した状態で同一となる検索クエリを全て抽出し、その中で最も分割数の多いものを選択する。また、相対的に検索回数(頻度)の低い検索クエリや、文字列の連接確率モデルより顕著に確率の低い検索クエリは棄却する。この手法では、形態素解析辞書にあまり入っていないようなテレビゲーム名やアイドルグループ名など、具体的な固有名詞についてもデータを有する可能性が高いのでこれらの分割に強いというメリットがある反面、棄却する基準となる頻度が明確でないというデメリットがある。
(2) A method of selecting a pattern with the largest number of divisions from the search log: In other words, all the same search queries are extracted from the
(3)検索ログから計算した文字列の連接確率モデルで分割する手法:この手法では、未知語にも対応できるメリットがある反面、意味のない文字列が含まれるというデメリットがある。 (3) A method of dividing by a character string concatenation probability model calculated from a search log: This method has a merit of dealing with unknown words, but has a demerit of including meaningless character strings.
上記の各手法を採用する選択基準としては、素早く実装し、適当な精度を得たい場合は(1)を、未知語の分割も行ない、更に検索精度も考慮したい場合は(2)か(3)がよい。(2)は最適な分割のパターンを選択するだけなので実装が容易である。(3)は文字列間毎に分割するかどうかを解析する必要がありコストの高い実装である。(2)と(3)は精度で大きな差は少ないが、(3)の方が細かい単位で文字列が分割されるため、より精度改善が期待される。 The selection criteria for adopting each of the above methods are (1) when it is quickly implemented and appropriate accuracy is obtained, and (2) or (3) when unknown words are divided and search accuracy is considered. ) Is good. (2) is easy to implement because it only selects an optimal division pattern. (3) is a costly implementation because it is necessary to analyze whether to divide between character strings. Although (2) and (3) are small in accuracy, there is little difference in accuracy, but in (3), the character string is divided in finer units, so that further improvement in accuracy is expected.
図6(c)は図6(b)の状態から分割を行った状態を示している。 FIG. 6C shows a state where the division is performed from the state of FIG.
次いで、図5(a)に戻り、クエリセグメント位置学習部301の検索部305は、クエリ分割部304で分割された検索クエリの個々の文字列に基づいて検索DB315を検索する(ステップS105)。
Next, returning to FIG. 5A, the
次いで、クエリセグメント位置学習部301の検索結果解析部306は、検索部305の検索で得られた検索結果を解析し、個々の文字列のヒット件数の他に、検索結果として得られた要約(スニペット)おいて、分割された複数の文字列のそれぞれが隣接する文字列と接続された状態でページ上に存在する連接共起数をカウントし、連接共起頻度を表わすスコアを算出する(ステップS106)。スコアとしては、シンプソン係数や相互情報量が用いられる。
Next, the search
シンプソン係数によるスコア
=(word1とword2の連接状態でのヒット数)/min(word1のヒット数,word2のヒット数)
相互情報量によるスコア
=log(P(word1,word2))/(P(word1)P(word2))
ここで、minは括弧内の数値のうち小さい方を表わす。また、P(word1,word2)はword1とword2の同時分布関数、P(word1)はword1の周辺確率分布関数、P(word2)はword2の周辺確率分布関数である。
Simpson coefficient score = (number of hits when word1 and word2 are connected) / min (number of word1 hits, number of word2 hits)
Score based on mutual information = log (P (word1, word2)) / (P (word1) P (word2))
Here, min represents the smaller one of the numerical values in parentheses. P (word1, word2) is a simultaneous distribution function of word1 and word2, P (word1) is a marginal probability distribution function of word1, and P (word2) is a marginal probability distribution function of word2.
なお、検索結果解析部306で要約(スニペット)から連接共起数をカウントすることに代え、検索部305で隣接する文字列を接続した状態で検索DB315の検索を行ってもよい。
Instead of counting the number of connected co-occurrence from the summary (snippet) by the search
次いで、クエリセグメント位置学習部301のクエリセグメント位置決定部307は、検索結果解析部306の算出したスコアに基づいて適正なクエリセグメント位置を決定する(ステップS107)。図6(d)では「まんが□立ち」のスコアが、設定した閾値のスコアより低いとすると、図6(e)のように「まんが」と「立ち」の間を適正なクエリセグメント位置と決定する。
Next, the query segment
次いで、図5(a)に戻り、クエリセグメント位置学習部301の学習データ生成・学習要求部308は、クエリセグメント位置決定部307で決定されたクエリセグメント位置の特徴を示す学習データを生成し、その学習データに基づいてパターン認識部309に学習を行うことを要求する(ステップS108)。
5A, the learning data generation /
図7は「まんが□立ち読み」の学習データの例を示しており、窓幅を「3」とした例である。すなわち、学習データの各行は、「評価値:文字列特徴」という形式をとっている。「1-gram」「2-gram」「3-gram」はN-gramのタイプを表わすとともに、評価値として例えば「1」を示している。「Qcount」は検索クエリの検索回数(頻度)を示し、「Wcount」はWeb検索のヒット件数を示している。「L_All/」はクエリセグメント位置より左の全文字列を示し、「R_All/」はクエリセグメント位置より右の全文字列を示している。「I*/」は注目しているクエリセグメント位置を跨いでる文字列を示している。 FIG. 7 shows an example of learning data of “Manga □ Browsing”, in which the window width is “3”. That is, each line of the learning data takes the form of “evaluation value: character string feature”. “1-gram”, “2-gram”, and “3-gram” represent N-gram types and, for example, “1” as an evaluation value. “Qcount” indicates the number of searches (frequency) of the search query, and “Wcount” indicates the number of hits in the Web search. “L_All /” indicates all character strings to the left of the query segment position, and “R_All /” indicates all character strings to the right of the query segment position. “I * /” indicates a character string straddling the query segment position of interest.
次いで、図5(a)に戻り、処理を終了する(ステップS109)。 Next, returning to FIG. 5A, the process is terminated (step S109).
次に、上述した学習の行われたパターン認識部309を用いた実際の検索処理について説明する。
Next, an actual search process using the above-described learned
図5(b)において、処理を開始すると(ステップS111)、検索装置3の検索クエリ受付部310は、ユーザ端末2のブラウザ21からの検索要求時に検索クエリを受け付ける(ステップS112)。
In FIG.5 (b), if a process is started (step S111), the search
次いで、検索装置3の検索クエリ修正部311は、検索クエリ受付部310の受け付けた検索クエリのクエリセグメント位置が適正か否かパターン認識部309によって、全ての文字列間を順番にクエリセグメント位置をずらすことで検索クエリを修正する(ステップS113)。予めクエリセグメント位置を変えた候補を作成し、いずれが適正かをパターン認識により判断するようにしてもよい。
Next, the search
図8は受け付けた検索クエリからクエリセグメント位置を修正する処理例を示したものであり、受け付けた検索クエリの特徴を示す「1-gram:〜」「2-gram:〜」「3-gram:〜」を各文字列間毎にクエリセグメント位置をずらしながら生成し、パターン認識部309に入力する。この場合のクエリセグメント位置は適正でない箇所があるため、適正でない箇所でパターン認識の結果は不適正となる。そして、パターン認識の結果が適正を示す位置にクエリセグメント位置を決定し、検索クエリを修正する。
FIG. 8 shows an example of processing for correcting the query segment position from the accepted search query. “1-gram: ˜”, “2-gram: ˜”, “3-gram:” showing the characteristics of the accepted search query. Are generated while shifting the query segment position for each character string and input to the
次いで、図5(b)に戻り、検索装置3の検索部312は修正後(適正であるため修正されない場合もある)の検索クエリで検索DB315を検索し(ステップS114)、検索装置3の検索結果応答部313は、検索部312の検索結果を要求元のユーザ端末2のブラウザ21に返送する(ステップS115)。そして、処理を終了する(ステップS116)。
Next, returning to FIG. 5B, the
<第2の実施形態>
図9は本発明の第2の実施形態にかかるシステムの構成例を示す図である。前述した第1の実施形態ではバッチ処理によりクエリセグメント位置の学習を行い、学習結果に基づいて受け付けた検索クエリを修正する場合について説明したが、この第2の実施形態では、受け付けた検索クエリを逐次に修正するようにしている。
<Second Embodiment>
FIG. 9 is a diagram showing a configuration example of a system according to the second embodiment of the present invention. In the first embodiment described above, the query segment position is learned by batch processing and the received search query is corrected based on the learning result. In the second embodiment, the received search query is I am trying to correct it sequentially.
図9において、検索装置3は、検索クエリ受付部310とセパレータ削除部303とクエリ分割部304と検索部305と検索結果解析部306とクエリセグメント位置決定部307と検索クエリ修正部311と検索部312と検索結果応答部313と検索DB315とを備えている。図1とは各部の配置が若干異なっているが、同じ名称で同じ符号を付した機能部はほぼ同様の機能を有している。
9, the
図10は第2の実施形態の処理例を示すフローチャートである。 FIG. 10 is a flowchart illustrating an example of processing according to the second embodiment.
図10において、処理を開始すると(ステップS201)、検索装置3の検索クエリ受付部310は、ユーザ端末2のブラウザ21からの検索要求時に検索クエリを受け付ける(ステップS202)。
In FIG. 10, when processing is started (step S201), the search
次いで、検索装置3のセパレータ削除部303は、検索クエリ受付部310の受け付けた検索クエリからスペース等のセパレータを削除する(ステップS203)。
Next, the
次いで、検索装置3のクエリ分割部304は、セパレータを削除した検索クエリを意味のある範囲で複数の文字列に分割する(ステップS204)。
Next, the
次いで、検索装置3の検索部305は、クエリ分割部304で分割された検索クエリの個々の文字列に基づいて検索DB315を検索する(ステップS205)。
Next, the
次いで、検索装置3の検索結果解析部306は、検索部305の検索で得られた検索結果を解析し、個々の文字列のヒット件数の他に、検索結果として得られた要約(スニペット)おいて、分割された複数の文字列のそれぞれが隣接する文字列と接続された状態でページ上に存在する連接共起数をカウントし、連接共起頻度を表わすスコアを算出する(ステップS206)。なお、検索結果解析部306で要約(スニペット)から連接共起数をカウントすることに代え、検索部305で隣接する文字列を接続した状態で検索DB315の検索を行ってもよい。
Next, the search
次いで、検索装置3のクエリセグメント位置決定部307は、検索結果解析部306の算出したスコアに基づいて適正なクエリセグメント位置を決定する(ステップS207)。
Next, the query segment
次いで、検索装置3の検索クエリ修正部311は、クエリセグメント位置決定部307で決定されたクエリセグメント位置に基づいて検索クエリを修正する(ステップS208)。
Next, the search
次いで、検索装置3の検索部312は、修正後(適正であるため修正されない場合もある)の検索クエリで検索DB315を検索し(ステップS209)、検索結果応答部313は、検索部312の検索結果を要求元のユーザ端末2のブラウザ21に返送する(ステップS210)。そして、処理を終了する(ステップS211)。
Next, the
<総括>
以上説明したように、本実施形態によれば、ユーザにより入力された検索クエリのクエリセグメント位置を適正な位置に修正することで、検索精度を高めることができる。
<Summary>
As described above, according to the present embodiment, the search accuracy can be improved by correcting the query segment position of the search query input by the user to an appropriate position.
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。 The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.
1 ネットワーク
2 ユーザ端末
21 ブラウザ
3 検索装置
301 クエリセグメント位置学習部
302 検索ログ取得部
303 セパレータ削除部
304 クエリ分割部
305 検索部
306 検索結果解析部
307 クエリセグメント位置決定部
308 学習データ生成・学習要求部
309 パターン認識部
310 検索クエリ受付部
311 検索クエリ修正部
312 検索部
313 検索結果応答部
314 検索ログ
315 検索DB
DESCRIPTION OF
Claims (10)
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と
を備えたことを特徴とするクエリセグメント位置決定装置。 A search log acquisition means for acquiring a search log;
Separator deletion means for deleting the separator from the search query of the acquired search log,
Query splitting means for splitting the search query with the separator removed into multiple strings,
First search means for searching a search database based on the divided character strings;
An analysis means for calculating, as a score, the frequency at which one divided character string is connected and co-occurring with an adjacent character string, based on the search results;
A query segment position determining device comprising: query segment position determining means for determining a query segment position based on the calculated score.
前記クエリ分割手段は、形態素解析により検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 The query segment position determination apparatus according to claim 1, wherein
The query segment position determining device divides a search query into a plurality of character strings by morphological analysis.
前記クエリ分割手段は、検索ログから最も分割数の多いパターンを選択することで検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 The query segment position determination apparatus according to claim 1, wherein
The query segment position determining device divides a search query into a plurality of character strings by selecting a pattern having the largest number of divisions from a search log.
前記クエリ分割手段は、検索ログから文字列の結合モデルを複数生成することで検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 The query segment position determination apparatus according to claim 1, wherein
The query segment position determining device divides a search query into a plurality of character strings by generating a plurality of character string combination models from a search log.
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、
決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段と、
ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段と、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段と
を備えたことを特徴とする検索装置。 A search log acquisition means for acquiring a search log;
Separator deletion means for deleting the separator from the search query of the acquired search log,
Query splitting means for splitting the search query with the separator removed into multiple strings,
First search means for searching a search database based on the divided character strings;
An analysis means for calculating, as a score, the frequency at which one divided character string is connected and co-occurring with an adjacent character string, based on the search results;
Query segment position determining means for determining a query segment position based on the calculated score;
Learning means for learning the pattern recognition unit based on the determined query segment position;
Query correction means for determining whether or not a query segment position is appropriate by the pattern recognition unit for a search query input by a user, and correcting the query query position to an appropriate query segment position;
A search device comprising: second search means for searching the search database based on a corrected search query.
受け付けた検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、
決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段と、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段と
を備えたことを特徴とする検索装置。 A receiving means for receiving a search query from a user;
A separator deleting means for deleting the separator from the received search query;
Query splitting means for splitting the search query with the separator removed into multiple strings,
First search means for searching a search database based on the divided character strings;
An analysis means for calculating, as a score, the frequency at which one divided character string is connected and co-occurring with an adjacent character string, based on the search results;
Query segment position determining means for determining a query segment position based on the calculated score;
Query modifying means for modifying the search query based on the determined query segment position determining means;
A search device comprising: second search means for searching the search database based on a corrected search query.
前記制御部が、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除工程と、
前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、
前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、
前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、
前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、
前記制御部が、決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習工程と、
前記制御部が、ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正工程と、
前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程と
を備えたことを特徴とする検索制御方法。 A search log acquisition step in which the control unit of the search device acquires the search log;
The control unit deletes a separator from the search query of the acquired search log;
A query dividing step for dividing the search query from which the separator is deleted into a plurality of character strings;
A first search step in which the control unit searches a search database based on the divided character string;
An analysis step in which the control unit calculates, as a score, the frequency at which one divided character string is connected and co-occurs with an adjacent character string, based on a search result;
A query segment position determining step in which the control unit determines a query segment position based on the calculated score;
A learning step in which the control unit learns the pattern recognition unit based on the determined query segment position;
A query correcting step in which the control unit determines whether or not a query segment position is appropriate by the pattern recognition unit for a search query inputted by a user, and corrects the query query to an appropriate query segment position;
A search control method comprising: a second search step in which the control unit searches the search database based on a corrected search query.
前記制御部が、受け付けた検索クエリからセパレータを削除するセパレータ削除工程と、
前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、
前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、
前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、
前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、
前記制御部が、決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正工程と、
前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程と
を備えたことを特徴とする検索制御方法。 The control unit of the search device accepts a search query from the user;
A separator deletion step in which the control unit deletes the separator from the accepted search query;
A query dividing step for dividing the search query from which the separator is deleted into a plurality of character strings;
A first search step in which the control unit searches a search database based on the divided character string;
An analysis step in which the control unit calculates, as a score, the frequency at which one divided character string is connected and co-occurs with an adjacent character string, based on a search result;
A query segment position determining step in which the control unit determines a query segment position based on the calculated score;
A query correcting step for correcting the search query based on the determined query segment position determining means;
A search control method comprising: a second search step in which the control unit searches the search database based on a corrected search query.
検索ログを取得する検索ログ取得手段、
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、
分割された文字列に基づいて検索データベースを検索する第1検索手段、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、
決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段、
ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段
として機能させる検索制御プログラム。 The computers that make up the search device
Search log acquisition means for acquiring search logs,
Separator deletion means for deleting the separator from the search query of the acquired search log,
Query splitting means that splits the search query with the separator removed into multiple strings,
First search means for searching a search database based on the divided character string;
An analysis means for calculating, as a score, a frequency at which one divided character string is connected and co-occurring with an adjacent character string, based on the search result;
Query segment position determining means for determining a query segment position based on the calculated score;
Learning means for learning the pattern recognition unit based on the determined query segment position;
Query correction means for determining whether or not a query segment position is appropriate by the pattern recognition unit for a search query input by a user, and correcting the query segment position to an appropriate query segment position;
A search control program that functions as second search means for searching the search database based on a corrected search query.
ユーザから検索クエリを受け付ける受付手段、
受け付けた検索クエリからセパレータを削除するセパレータ削除手段、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、
分割された文字列に基づいて検索データベースを検索する第1検索手段、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、
決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段
として機能させる検索制御プログラム。
The computers that make up the search device
Accepting means for receiving search queries from users,
Separator deletion means for deleting separators from received search queries,
Query splitting means that splits the search query with the separator removed into multiple strings,
First search means for searching a search database based on the divided character string;
An analysis means for calculating, as a score, a frequency at which one divided character string is connected and co-occurring with an adjacent character string, based on the search result;
Query segment position determining means for determining a query segment position based on the calculated score;
Query correcting means for correcting the search query based on the determined query segment position determining means;
A search control program that functions as second search means for searching the search database based on a corrected search query.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010292481A JP5179564B2 (en) | 2010-12-28 | 2010-12-28 | Query segment position determination device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010292481A JP5179564B2 (en) | 2010-12-28 | 2010-12-28 | Query segment position determination device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141681A JP2012141681A (en) | 2012-07-26 |
JP5179564B2 true JP5179564B2 (en) | 2013-04-10 |
Family
ID=46677941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010292481A Active JP5179564B2 (en) | 2010-12-28 | 2010-12-28 | Query segment position determination device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5179564B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6571053B2 (en) * | 2016-08-15 | 2019-09-04 | 株式会社トヨタマップマスター | FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM |
JP6577925B2 (en) * | 2016-09-20 | 2019-09-18 | 株式会社トヨタマップマスター | FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM |
JP6813776B2 (en) * | 2016-10-27 | 2021-01-13 | キヤノンマーケティングジャパン株式会社 | Information processing device, its control method and program |
JP7258988B2 (en) * | 2019-02-08 | 2023-04-17 | ヤフー株式会社 | Information processing device, information processing method and information processing program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003005776A (en) * | 2001-06-21 | 2003-01-08 | Nec Corp | Voice synthesizing device |
JP2006079454A (en) * | 2004-09-10 | 2006-03-23 | Fujitsu Ltd | Search keyword analysis method, search keyword analysis program and search keyword analysis apparatus |
JP5041802B2 (en) * | 2006-12-26 | 2012-10-03 | ヤフー株式会社 | Query analysis server, evaluation viewpoint word database, and phrase database generation method |
JP5314493B2 (en) * | 2009-05-15 | 2013-10-16 | 日本電信電話株式会社 | Information search method, information search device, and information search program |
-
2010
- 2010-12-28 JP JP2010292481A patent/JP5179564B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012141681A (en) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
US7769771B2 (en) | Searching a document using relevance feedback | |
JP4961043B2 (en) | Sorting user browser history based on relevance | |
US8713024B2 (en) | Efficient forward ranking in a search engine | |
CA2638558C (en) | Topic word generation method and system | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
JP2009525520A (en) | Evaluation method for ranking and sorting electronic documents in search result list based on relevance, and database search engine | |
KR20100047221A (en) | Dictionary word and phrase determination | |
JP2008515049A (en) | Displaying search results based on document structure | |
KR20070092755A (en) | Local item extraction | |
CN105550217B (en) | Scene music searching method and scene music searching device | |
JP5179564B2 (en) | Query segment position determination device | |
JP2000200281A (en) | Device and method for information retrieval and recording medium where information retrieval program is recorded | |
KR20020022977A (en) | Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources | |
JP2010123036A (en) | Document retrieval device, document retrieval method and document retrieval program | |
JP2001265774A (en) | Method and device for retrieving information, recording medium with recorded information retrieval program and hypertext information retrieving system | |
JP2008077252A (en) | Document ranking method, document retrieval method, document ranking device, document retrieval device, and recording medium | |
JP5364529B2 (en) | Dictionary registration device, document label determination system, and dictionary registration program | |
JP5127553B2 (en) | Information processing apparatus, information processing method, program, and recording medium | |
JP5332128B2 (en) | Information retrieval apparatus, information retrieval method and program thereof | |
JP6173958B2 (en) | Program, apparatus and method for searching using a plurality of hash tables | |
JP4959032B1 (en) | Web page analysis apparatus and web page analysis program | |
JP4426893B2 (en) | Document search method, document search program, and document search apparatus for executing the same | |
JP2010282403A (en) | Document retrieval method | |
US8005845B2 (en) | System and method for automatically ranking lines of text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5179564 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |