JP4818170B2 - Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program - Google Patents
Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program Download PDFInfo
- Publication number
- JP4818170B2 JP4818170B2 JP2007067239A JP2007067239A JP4818170B2 JP 4818170 B2 JP4818170 B2 JP 4818170B2 JP 2007067239 A JP2007067239 A JP 2007067239A JP 2007067239 A JP2007067239 A JP 2007067239A JP 4818170 B2 JP4818170 B2 JP 4818170B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- browsing
- content
- identifiers
- identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、コンテンツを検索する技術に関する。 The present invention relates to a technology for searching for content.
従来、インターネット上に設けられた情報検索システムでは、文章や図面等のコンテンツをデータベースに蓄積し、ユーザにより与えられた検索キーワードに関連するコンテンツをそのデータベースから取り出して、検索結果としてユーザに提示する技術が用いられていた。 2. Description of the Related Art Conventionally, in an information search system provided on the Internet, contents such as sentences and drawings are accumulated in a database, contents related to a search keyword given by a user are taken out from the database, and presented as search results to the user. Technology was used.
そして、検索対象であるコンテンツを提示する際には、通常、検索式に含まれる各検索語の使用頻度に基づいて、検索式と検索結果の各コンテンツとの文章関連度を求め、その文章関連度の高い順番でコンテンツを表示する方法が利用されている(非特許文献1参照)。 When presenting the content that is the search target, usually, the text relevance between the search formula and each content of the search result is obtained based on the frequency of use of each search term included in the search formula, and the text related A method of displaying contents in descending order is used (see Non-Patent Document 1).
しかしながら、検索語の使用頻度が高い場合であっても、ユーザが期待するコンテンツであるとは限らない。逆に、使用頻度が低いコンテンツであっても、期待するコンテンツである可能性もある。故に、文章関連度を用いて順序付けられた検索結果は、ユーザの所望する順番で表示された検索結果に一致するものではなく、所望するコンテンツに辿り着く迄には多くの試行錯誤や時間をユーザに与えるという問題があった。 However, even if the search term is frequently used, the content is not necessarily expected by the user. Conversely, even content that is used infrequently may be expected content. Therefore, the search results ordered using the text relevance level do not match the search results displayed in the order desired by the user, and the user needs a lot of trial and error and time until the desired content is reached. There was a problem of giving to.
そこで、特許文献1では、ユーザによる閲覧要求の回数を記録し、この回数を用いて前述の文章関連度を補正することで、ユーザの求めるコンテンツをより上位に表示する技術が開示されている。これにより、閲覧要求の多いコンテンツはより上位に表示され、閲覧要求の少ないコンテンツはより下位に表示されることになる。
しかしながら、表示されたコンテンツを選択して閲覧要求を行う場合、上位に表示されたコンテンツはより多く選択され、下位のコンテンツはより少なく選択される傾向にあることが知られている(非特許文献2参照)。故に、この閲覧要求時におけるユーザの癖により、特許文献1で開示された技術を用いて検索対象となるコンテンツを順序付けた場合であっても、いわゆる正フィードバックの現象が発生するため、検索結果として表示されるコンテンツの順番が固定的に成り易いという問題があった。
However, when making a browsing request by selecting the displayed content, it is known that more content displayed at the upper level tends to be selected and less content at the lower level tends to be selected (non-patent document). 2). Therefore, even if the content to be searched is ordered using the technique disclosed in
本発明は、上記を鑑みてなされたものであり、ユーザの趣向を反映した順番でコンテンツを表示することを課題とする。 This invention is made | formed in view of the above, and makes it a subject to display a content in the order reflecting a user preference.
請求項1に記載の本発明は、コンテンツと該コンテンツの識別子とを関連付けて格納しておくコンテンツ格納手段と、コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて格納しておく閲覧履歴格納手段と、検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する検索手段と、前記検索手段で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する適合度合成手段と、該複数の識別子を、前記得点に基づいて出力する検索結果出力手段と、を有することを要旨とする。
The present invention according to
本発明にあっては、検索要求に包含された検索語を受信した場合に、この検索語を含む複数のコンテンツをコンテンツ格納手段から読み出して、この検索語が複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、この複数のコンテンツにそれぞれ対応する識別子をコンテンツ格納手段から更に読み出して、この識別子に一致する閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、この識別子に一致する閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、この平均値よりも高い表示順位を有する閲覧履歴格納手段に格納された識別子の数に対して、この平均値と同等な表示順位を有する閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、閲覧要求回数を補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する検索手段と、この検索手段でコンテンツ格納手段から読み出された複数の識別子に対し、文章適合度と閲覧重要度とを合成した得点をそれぞれ算出する適合度合成手段と、この複数の識別子を、この得点に基づいて出力する検索結果出力手段とを有するため、検索結果が固定的に表示されることを防止し、ユーザの趣向を反映した順番でコンテンツの識別子を出力することができる。 In the present invention, when a search word included in a search request is received, a plurality of contents including the search word are read from the content storage unit, and the frequency at which the search word appears in the plurality of contents is indicated. The sentence matching degree is calculated, the identifier corresponding to each of the plurality of contents is further read out from the content storage means, and the number of identifiers stored in the browsing history storage means that matches this identifier is obtained as the number of browsing requests. The average value of the display order corresponding to the identifier stored in the browsing history storage means that matches this identifier is calculated, and the number of identifiers stored in the browsing history storage means having a display order higher than this average value is calculated. On the other hand, the ratio of the number of identifiers stored in the browsing history storage means having the display order equivalent to the average value is obtained to correct the correction. Search means for calculating the browsing importance by dividing the number of browsing requests by the number of browsing requests for correction, and sentence matching and browsing for a plurality of identifiers read from the content storage means by the searching means Since there is a fitness synthesis unit that calculates the score obtained by combining the importance and a search result output unit that outputs the plurality of identifiers based on the score, the search result is displayed in a fixed manner. Content identifiers can be output in an order that reflects the user preferences.
請求項2に記載の本発明は、請求項1に記載の発明において、前記検索手段が、前記検索要求に包含された検索語に一致する前記閲覧履歴格納手段に格納された検索語の数を求めて検索語利用回数とし、前記閲覧重要度は、前記閲覧要求回数を前記補正用閲覧要求回数で除した値を、更に該検索語利用回数で除した値であることを要旨とする。 According to a second aspect of the present invention, in the first aspect of the present invention, the search means determines the number of search words stored in the browsing history storage means that matches the search word included in the search request. The search term usage count is obtained, and the browsing importance is summarized as a value obtained by dividing the browsing request count by the correction browsing request count and further dividing by the search term usage count.
本発明にあっては、検索手段が、検索要求に包含された検索語に一致する閲覧履歴格納手段に格納された検索語の数を求めて検索語利用回数とし、閲覧重要度は、閲覧要求回数を補正用閲覧要求回数で除した値を、更に検索語利用回数で除した値であるため、検索語の違いによる閲覧要求回数の大きさの偏りを正規化することができる。即ち、どのような検索語が与えられた場合であっても、閲覧要求回数を補正用閲覧要求回数で除した値を一定の領域に納めることができる。 In the present invention, the search means obtains the number of search terms stored in the browsing history storage means that matches the search term included in the search request and sets the number of search terms used. Since the value obtained by dividing the number of times by the number of browsing requests for correction is further divided by the number of times the search word is used, it is possible to normalize the bias in the size of the number of browsing requests due to the difference in the search terms. That is, regardless of what search terms are given, a value obtained by dividing the number of browsing requests by the number of browsing requests for correction can be stored in a certain area.
請求項3に記載の本発明は、請求項1又は2のいずれか1項に記載の発明において、前記平均値よりも高い表示順位が、1位であることを要旨とする。
The gist of the present invention described in
本発明にあっては、平均値よりも高い表示順位が1位であるため、検索結果が固定的に表示されることをより確実に防止し、ユーザの趣向をより反映した順番でコンテンツの識別子を出力することができる。 In the present invention, since the display order higher than the average value is first, it is possible to more reliably prevent the search result from being fixedly displayed, and the content identifiers in an order more reflecting the user's preference. Can be output.
請求項4に記載の本発明は、コンテンツと該コンテンツの識別子とを関連付けてコンテンツ格納手段に格納しておく第1のステップと、コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2のステップと、検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3のステップと、前記第3のステップで前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4のステップと、該複数の識別子を、前記得点に基づいて出力する第5のステップと、を有することを要旨とする。
The present invention as set forth in
請求項5に記載の本発明は、請求項4に記載の発明において、前記第3のステップが、前記検索要求に包含された検索語に一致する前記閲覧履歴格納手段に格納された検索語の数を求めて検索語利用回数とし、前記閲覧重要度は、前記閲覧要求回数を前記補正用閲覧要求回数で除した値を、更に該検索語利用回数で除した値であることを要旨とする。 According to a fifth aspect of the present invention, in the invention according to the fourth aspect, the third step is a process of searching for a search word stored in the browsing history storage means that matches the search word included in the search request. The number is used as the number of search word usage, and the browsing importance is a value obtained by dividing the number of browsing request times by the number of correction browsing request times and further dividing by the number of search word usage times. .
請求項6に記載の本発明は、請求項4又は5のいずれか1項に記載の発明において、前記平均値よりも高い表示順位が、1位であることを要旨とする。
The gist of the present invention described in claim 6 is that, in the invention described in any one of
請求項7に記載の本発明は、コンテンツと該コンテンツの識別子とを関連付けてコンテンツ格納手段に格納しておく第1の処理と、コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2の処理と、検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3の処理と、前記第3の処理で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4の処理と、該複数の識別子を、前記得点に基づいて出力する第5の処理と、をコンピュータに実行させることを要旨とする。
The present invention according to
請求項8に記載の本発明は、請求項7に記載の発明において、前記第3の処理が、前記検索要求に包含された検索語に一致する前記閲覧履歴格納手段に格納された検索語の数を求めて検索語利用回数とし、前記閲覧重要度は、前記閲覧要求回数を前記補正用閲覧要求回数で除した値を、更に該検索語利用回数で除した値であることを要旨とする。 According to an eighth aspect of the present invention, in the invention according to the seventh aspect of the invention, the third process includes the processing of the search term stored in the browsing history storage means that matches the search term included in the search request. The number is used as the number of search word usage, and the browsing importance is a value obtained by dividing the number of browsing request times by the number of correction browsing request times and further dividing by the number of search word usage times. .
請求項9に記載の本発明は、請求項7又は8のいずれか1項に記載の発明において、前記平均値よりも高い表示順位が、1位であることを要旨とする。
The gist of the present invention according to
請求項10に記載の本発明は、コンテンツと該コンテンツの識別子とを関連付けてコンテンツ格納手段に格納しておく第1の処理と、コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2の処理と、検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3の処理と、前記第3の処理で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4の処理と、該複数の識別子を、前記得点に基づいて出力する第5の処理と、をコンピュータに実行させることを要旨とする。
The present invention according to
請求項11に記載の本発明は、請求項10に記載の発明において、前記第3の処理が、前記検索要求に包含された検索語に一致する前記閲覧履歴格納手段に格納された検索語の数を求めて検索語利用回数とし、前記閲覧重要度は、前記閲覧要求回数を前記補正用閲覧要求回数で除した値を、更に該検索語利用回数で除した値であることを要旨とする。 According to an eleventh aspect of the present invention, in the invention according to the tenth aspect, in the third aspect, the third processing includes a search word stored in the browsing history storage means that matches the search word included in the search request. The number is used as the number of search word usage, and the browsing importance is a value obtained by dividing the number of browsing request times by the number of correction browsing request times and further dividing by the number of search word usage times. .
請求項12に記載の本発明は、請求項10又は11のいずれか1項に記載の発明において、前記平均値よりも高い表示順位が、1位であることを要旨とする。
The gist of the present invention according to
本発明によれば、ユーザの趣向を反映した順番でコンテンツを表示することができる。 According to the present invention, it is possible to display contents in an order that reflects user preferences.
〔第1の実施の形態〕
図1は、第1の実施の形態における情報検索システム1の構成を示す構成図である。本実施の形態における情報検索システム1は、ユーザ端末2と情報検索装置3とを備えた構成であり、互いにネットワーク4を介して接続されている。
[First Embodiment]
FIG. 1 is a configuration diagram showing a configuration of an
ユーザ端末2は、モニタ,キーボード等の入力手段や、ネットワーク4に対する通信手段等を備え、利用者(以下、単に「ユーザ」と称する)による検索要求を受け付けて、その検索要求に包含された検索語を、ネットワーク4を介して後述する情報検索装置3の検索語受信部31に送信する。また、ユーザ端末2は、ネットワーク4を介して情報検索装置3の検索結果出力部35から送信された検索要求に対する検索結果を受信し、画面に表示することでユーザに検索結果を提示する。
The
更に、ユーザ端末2は、検索結果を閲覧したユーザにより選択された所望のコンテンツに対する閲覧要求を受け付けて、ネットワーク4を介してその閲覧要求を情報検索装置3の閲覧要求受信部36に送信する。また、ネットワーク4を介して情報検索装置3のコンテンツ出力部38から送信された閲覧要求に対するコンテンツを受信して、そのコンテンツを画面に表示する。
Furthermore, the
情報検索装置3は、検索語受信部31と、コンテンツ検索部32と、閲覧履歴検索部33と、適合度合成部34と、検索結果出力部35と、閲覧要求受信部36と、閲覧履歴更新部37と、コンテンツ出力部38と、コンテンツ検索部32に接続されたコンテンツ格納部301と、閲覧履歴検索部33に接続された閲覧履歴格納部302とを備えた構成である。以下、これら各部が有する機能について説明する。
The
検索語受信部31は、ネットワーク4に接続されており、ユーザ端末2から送信された検索語をコンテンツ検索部32及び閲覧履歴検索部33に送信する。
The search
コンテンツ検索部32は、検索語受信部31から送信された検索語を受信して、その検索語を用いてコンテンツ格納部301を検索し、その検索結果に基づいて文章適合度を算出して、コンテンツ識別子と文章適合度とを含む検索結果を閲覧履歴検索部33及び適合度合成部34に送信する。また、コンテンツ検索部32は、閲覧要求受信部36を介してユーザ端末2から送信された閲覧要求に対し、対応するコンテンツの所在場所をコンテンツ格納部301から検索し、検索された所在場所に格納されたコンテンツを取得する。
The
閲覧履歴検索部33は、検索語受信部31から送信された検索語とコンテンツ検索部32から送信された検索結果とを受信して、閲覧履歴格納部302を参照して閲覧重要度を算出し、その閲覧重要度を適合度合成部34に送信する。
The browsing
適合度合成部34は、コンテンツ検索部32から送信された検索結果と閲覧履歴検索部33から送信された閲覧重要度とを受信して、文章適合度と閲覧重要度とを用いて最終的な得点を算出し、検索結果出力部35に送信する。
The matching
検索結果出力部35は、適合度合成部34から送信された得点を受信し、ネットワーク4を介して得点順に並び替えたコンテンツのコンテンツ識別子をユーザ端末2に出力する。
The search
閲覧要求受信部36は、ネットワーク4を介してユーザ端末2から送信された閲覧要求を受信し、この閲覧要求をコンテンツ検索部32及び閲覧履歴更新部37に送信する。
The browsing
閲覧履歴更新部37は、ユーザの閲覧履歴を閲覧履歴格納部302に追加し、閲覧履歴を更新する。
The browsing
コンテンツ出力部38は、コンテンツ検索部32で取得されたコンテンツを受信して、ネットワーク4を介してユーザ端末2に出力する。
The
コンテンツ格納部301には、図2に示すように、コンテンツ自身を示すコンテンツ文章情報と、このコンテンツを識別可能なコンテンツ識別子と、このコンテンツが格納されているコンテンツ所在場所とが関連付けて格納されている。コンテンツ文章情報とは、コンテンツの内容を示す文章であり、例えば、コンテンツがウェブ上のサーバに格納されたページであれば、そのページに記された文章を意味する。コンテンツ識別子とは、あるコンテンツを他のコンテンツから識別可能とするものであり、例えば、コンテンツがウェブ上のサーバに格納されたページであれば、そのページのURL(Uniform Resource Locator)を意味する。また、コンテンツ所在場所とは、コンテンツのファイルが格納されている場所であり、例えば、ローカルの計算機にコンテンツが格納されている場合には、図2に示すようなパス情報が格納され、ウェブ上のコンテンツの場合には、URLが格納される。
As shown in FIG. 2, the
閲覧履歴格納部302には、過去の閲覧要求に対する閲覧履歴が格納されており、図3に示すように、コンテンツ識別子と、検索要求に包含された検索語と、コンテンツ識別子が検索結果として表示された順位を示す表示順位とが関連付けて格納されている。例えば、図3の上から2行目は、検索語を「goo」とする検索要求で得られた検索結果において、表示順位が「4」番目である「www.goo.ne.jp/」が閲覧要求されたことを意味している。なお、閲覧履歴格納部302は、検索語に対してコンテンツ識別子及び表示順位が格納されている。
The browsing
なお、コンテンツ検索部32及び閲覧履歴検索部33が備える前述の機能を、一つの検索部が備える構成とすることも可能であり、適合度合成部34をその検索部に更に加える構成であっても、何ら効果に影響を与えるものではない。
Note that the above-described functions of the
ネットワーク4は、例えば、LAN(Local Area Network)、インターネット、公衆回線網、ケーブルテレビ網等を利用することができる。なお、インターネットとは、所定のプロトコルに基づいて相互リンクされたネットワークの集合体である。
As the
続いて、本発明の実施の形態における情報検索装置3の処理の流れについて説明する。この処理の流れは、主に、ユーザが検索要求を行って検索結果を得るまでの検索要求段階と、検索結果に基づいてユーザが所望のコンテンツを要求して閲覧するまでの閲覧要求段階との2段階で構成されている。以下、それぞれの段階について、フローチャートを用いて説明する。
Next, the flow of processing of the
最初に、検索要求段階の処理の流れについて、図4を用いて説明する。 First, the flow of processing at the search request stage will be described with reference to FIG.
まず、検索語受信部31は、ネットワーク4を介してユーザ端末2から送信された検索要求に包含された検索語を受信し、その検索語をコンテンツ検索部32及び閲覧履歴検索部33に送信する(S101)。
First, the search
次に、コンテンツ検索部32は、検索語受信部31から送信された検索語を受信し、その検索語を含む複数のコンテンツ及びコンテンツ識別子をコンテンツ格納部301から読み出して、検索語が各コンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、コンテンツ識別子と文章適合度とを含む検索結果を閲覧履歴検索部33及び適合度合成部34に送信する(S102)。
Next, the
ここで、文章適合度とは、検索語がコンテンツに出現する頻度を意味するものであり、例えば、TF(Term Frequency)法や、TF/IDF(Term Frequency/Inverse Document Frequency)法などが一般的に利用されている。 Here, the sentence suitability means the frequency with which a search word appears in the content, and for example, TF (Term Frequency) method, TF / IDF (Term Frequency / Inverse Document Frequency) method, etc. are common. Has been used.
続いて、閲覧履歴検索部33は、検索語受信部31から送信された検索語と、コンテンツ検索部32から送信された検索結果とを受信して、各コンテンツ識別子に対する閲覧重要度をそれぞれ算出し、その閲覧重要度を適合度合成部34に送信する(S103)。なお、閲覧重要度の算出方法については後述する。
Subsequently, the browsing
適合度合成部34は、コンテンツ検索部32から送信された検索結果と、閲覧履歴検索部33から送信された閲覧重要度とを受信し、文章重要度と閲覧重要度とを合成した得点を算出する(S104)。なお、得点の算出方法は、加算に限られるものではなく、乗算等であっても良い。
The matching
(S103)及び(S104)の処理を、(S102)で検索された全てのコンテンツ識別子に対して繰り返し行う(S105)。 The processes of (S103) and (S104) are repeated for all content identifiers searched in (S102) (S105).
最後に、検索結果出力部35は、適合度合成部34から送信された各コンテンツ識別子に対する得点を受信し、そのコンテンツ識別子を得点が高い順番に並び替えて、ネットワーク4を介してユーザ端末2に出力する(S106)。
Finally, the search
その後、ユーザ端末2では、例えば図5に示すような検索結果が画面に出力される。
Thereafter, in the
次に、(S103)における閲覧重要度の計算方法について説明する。図6は、閲覧重要度の計算方法を示すフローチャートである。閲覧重要度の計算は、(S102)で得られた各コンテンツ識別子について、閲覧履歴検索部33が、閲覧履歴格納部302を参照して算出する。
Next, the browsing importance calculation method in (S103) will be described. FIG. 6 is a flowchart illustrating a browsing importance calculation method. The browsing importance level is calculated by the browsing
最初に、閲覧履歴検索部33は、閲覧履歴格納部302からコンテンツ識別子を読み出して、コンテンツ検索部32から送信されたコンテンツ識別子に一致するコンテンツ識別子の数を算出し、そのコンテンツ識別子の数を閲覧要求回数(C)とする(S201)。
First, the browsing
例えば、コンテンツ検索部32から送信されたコンテンツ識別子が「www.goo.ne.jp/」であり、閲覧履歴格納部302に図3で示すコンテンツ識別子等を格納されている場合には、閲覧要求回数は3回(C=3)となる。
For example, when the content identifier transmitted from the
次に、閲覧履歴検索部33は、そのコンテンツ識別子に対応する表示順位の平均値を算出し、その平均値よりも高い表示順位を有する閲覧履歴格納部302に格納された識別子の数に対して、その平均値に同等な表示順位を有する閲覧履歴格納部302に格納されたコンテンツ識別子の数の比率を求めて、その比率を補正用閲覧要求回数(R)とする(S202)。
Next, the browsing
例えば、図3の場合には、平均値は(4+2+8)/3=約4.6となる。ここで、小数点以下を四捨五入し、平均値を整数値である5とする。そして、この平均値である5よりも高い表示順位、例えば1位を有するコンテンツ識別子の数と、この平均値である5と同等な表示順位である5位を有するコンテンツ識別子の数とを求める。ここで、表示順位を1位とするコンテンツ識別子の数が160、表示順位を5位とするコンテンツ識別子の数が80の場合、補正用閲覧要求回数は80/160=0.5(R=0.5)となる。 For example, in the case of FIG. 3, the average value is (4 + 2 + 8) / 3 = about 4.6. Here, the fractional part is rounded off and the average value is set to 5 which is an integer value. Then, the number of content identifiers having a display rank higher than 5, which is the average value, for example, the first rank, and the number of content identifiers having the fifth rank, which is a display rank equivalent to the average value of 5, are obtained. Here, when the number of content identifiers with the first display order is 160 and the number of content identifiers with the fifth display order is 80, the correction browsing request count is 80/160 = 0.5 (R = 0). .5).
続いて、閲覧履歴検索部33は、検索語受信部31から送信された検索語に一致する閲覧履歴格納部302に格納された検索語の数を求めて、検索語利用回数(N)とする(S203)。
Subsequently, the browsing
なお、(S201),(S202),(S203)における計算の順番は、上記に限られるものではなく、(S202)→(S201)→(S203)や、(S203)→(S201)→(S202)等、任意の順番であってもよく、何ら得られる効果に影響を与えるものではない。 The order of calculation in (S201), (S202), and (S203) is not limited to the above, and (S202) → (S201) → (S203) or (S203) → (S201) → (S202). ) Etc., and may be in any order, and does not affect the effects obtained.
最後に、閲覧履歴検索部33は、(S201)で算出された閲覧要求回数(C)と、(S202)で算出された補正用閲覧要求回数(R)と、(S203)で算出された検索語利用回数(N)とを用いて、次式に基づく閲覧重要度(S)を算出する(S204)。
Finally, the browsing
S=C/R/N ・・・式(1)
式(1)で示す閲覧重要度(S)は、閲覧要求回数(C)に比例し、より多く閲覧要求されたコンテンツについてはその値が大きくなるので、ユーザの嗜好を考慮することができ、ユーザの所望するコンテンツをより上位に出力することができる。
S = C / R / N (1)
The browsing importance (S) shown in the formula (1) is proportional to the number of browsing requests (C), and the value of the browsing requested content becomes larger, so that the user's preference can be taken into account. The content desired by the user can be output higher.
また、同式における閲覧重要度(S)は、閲覧要求回数(C)を補正用閲覧要求回数(R)で除算するので、より上位に表示されたコンテンツ識別子に対する閲覧要求は閲覧重要度(S)に対してより少なく寄与し、より下位に表示されたコンテンツ識別子に対する閲覧要求はより大きく寄与することになる。即ち、同式で示す閲覧重要度(S)に基づいて順序付けがなされた検索結果が表示され、ユーザにより閲覧要求が行われることで閲覧履歴格納部302が更新された後に、他のユーザが同じ検索語で検索する等の複数の検索要求が行われる状況を想定した場合に、検索結果として表示されるコンテンツ識別子の順番がユーザの所望する順番ではなく、固定的に表示される要因を排除することができる。より具体的な説明は後述する。
Further, the browsing importance (S) in the same formula divides the number of browsing requests (C) by the number of browsing requests for correction (R), so that the browsing request for the content identifier displayed at a higher level is the browsing importance (S ) And a browsing request for a content identifier displayed at a lower level will contribute more greatly. That is, the search results ordered based on the browsing importance (S) indicated by the same formula are displayed, and after the browsing
更に、同式における閲覧重要度(S)は、閲覧要求回数(C)を補正用閲覧要求回数(R)で除算した値を、更に検索語利用回数(N)で除算するので、検索語の違いによる閲覧要求回数(C)の大きさの偏りを正規化することが可能となる。即ち、どのような検索語が与えられた場合であっても、閲覧要求回数を補正用閲覧要求回数で除した値(S/N)の値を一定の値域に納めることが可能となる。 Further, the browsing importance level (S) in the above formula is obtained by dividing the value obtained by dividing the number of browsing requests (C) by the number of browsing requests for correction (R) by the number of times of search word usage (N). It is possible to normalize the deviation in the size of the number of browsing requests (C) due to the difference. That is, regardless of what search terms are given, the value (S / N) obtained by dividing the number of browsing requests by the number of browsing requests for correction can be stored in a certain range.
なお、式(1)の変形例として、式(2)を用いることもできる。 Note that, as a modification of the formula (1), the formula (2) can also be used.
S=C/R ・・・式(2)
また、閲覧要求回数(C),補正用閲覧要求回数(R),検索語利用回数(N)の値をそのまま用いることなく、式(3)〜式(5)で示すように、対数を用いた場合であっても、同様の効果を得ることができる。
S = C / R (2)
In addition, the logarithm is used as shown in Expressions (3) to (5) without using the values of the number of browsing requests (C), the number of browsing requests for correction (R), and the number of times of using search words (N) as they are. Even in such a case, the same effect can be obtained.
S=log(C)/R/N ・・・式(3)
S=log(C)/log(R)/log(N) ・・・式(4)
S=C/R/log(N) ・・・式(5)
次に、閲覧要求段階の処理の流れについて、図7を用いて説明する。
S = log (C) / R / N (3)
S = log (C) / log (R) / log (N) (4)
S = C / R / log (N) (5)
Next, the flow of processing at the browsing request stage will be described with reference to FIG.
まず、閲覧要求受信部36が、ネットワーク4を介してユーザ端末2から送信された閲覧要求をコンテンツ検索部32及び閲覧履歴更新部37に送信し、閲覧履歴更新部37は、その閲覧要求を閲覧履歴格納部302に追加して閲覧履歴を更新する(S301)。
First, the browsing
次に、コンテンツ検索部32は、閲覧要求に包含されたコンテンツ識別子に対応するコンテンツ所在場所をコンテンツ格納部301から検索し、検索された所在場所に格納されたコンテンツを取得する(S302)。
Next, the
コンテンツ出力部38は、コンテンツ検索部32で取得されたコンテンツを受信して、ネットワーク4を介してユーザ端末2に出力する(S303)。
The
最後に、式(1)〜式(5)で示す閲覧重要度(S)を用いることにより、検索結果の順番がユーザの所望する順番ではなく、固定的に表示される要因を排除することについて、図8を用いてより具体的に説明する。 Finally, by using the browsing importance (S) shown in the formulas (1) to (5), the search result order is not the order desired by the user, but the factor that is fixedly displayed is eliminated. This will be described more specifically with reference to FIG.
例えば、4つのコンテンツが存在し、そのコンテンツにそれぞれ対応するコンテンツ識別子をC1,C2,C3,C4とし、ユーザが所望するコンテンツはC4であると仮定する。また、ユーザが、何らかの検索語を用いて検索したとし、その検索語に対するそれぞれのコンテンツの文章適合度は、図8(a)の初期状態に示すように、10,9,8,7であるとする。この初期状態における各コンテンツの閲覧要求回数(C)はいずれも0件なので、算出される得点は文章適合度のみで決まり、当然ながら、検索結果の表示順位は1,2,3,4となる。 For example, it is assumed that there are four contents, the content identifiers corresponding to the contents are C1, C2, C3, and C4, and the content desired by the user is C4. Also, assuming that the user searches using a certain search term, the sentence suitability of each content for that search term is 10, 9, 8, 7 as shown in the initial state of FIG. And Since the number of browsing requests (C) for each content in this initial state is zero, the calculated score is determined only by the text suitability, and naturally, the display order of search results is 1, 2, 3, 4. .
この表示順位を有する検索結果をユーザに一定期間提示し、(S301)で追加される閲覧要求の数を観察した場合、ユーザが所望するC4に対する閲覧要求の数が最も多くなることが予想される。 When the search results having this display order are presented to the user for a certain period and the number of browsing requests added in (S301) is observed, the number of browsing requests for C4 desired by the user is expected to be the largest. .
しかしながら、検索結果は、図8(a)で示す順番で表示されるので、前述したように、より上位のコンテンツについては、例えば図9に示すように、自然と閲覧要求が多くなされる傾向となる。従い、実際の閲覧要求回数(C)は、例えば、10,7,5,5となる。 However, since the search results are displayed in the order shown in FIG. 8A, as described above, as shown in FIG. 9, for example, as shown in FIG. Become. Accordingly, the actual number of browsing requests (C) is, for example, 10, 7, 5, 5.
これらの閲覧要求が閲覧履歴格納部302に格納された状態で、新たに同じ検索語によって検索要求がされた場合の検索結果について説明する。なお、以下では、閲覧要求回数を閲覧重要度とする場合(S=C)と、閲覧要求回数を補正用閲覧要求回数(R)で除算した値を閲覧重要度とする場合(S=C/R)と、で計算した場合の違いについて説明する。
A search result when a search request is newly made by the same search word in a state where these browsing requests are stored in the browsing
S=Cの場合、適合度合成部34で算出される得点は、文章適合度と閲覧重要度とを加算した結果となるので、図8(b)に示すように、20,16,13,12となり、検索結果の表示順位は1,2,3,4となる。即ち、ユーザが所望するC4の表示順位は、初期状態の表示順位と同じになる。つまり、検索結果は、固定的に表示されることになり、ユーザの所望するコンテンツを上位に浮上することができない。
In the case of S = C, the score calculated by the fitness
一方、S=C/Rの場合、例えば、Rの値が図9に示すように、1位から順番に1,0.7,0.5,0.4であった場合に、Rの計算では検索語の差異によらずに閲覧要求の回数を集計するので、ユーザが所望するC4が4位にあるという現象を全体的に平準化することができる。故に、適合度合成部34で算出される得点は、図8(c)に示すように、20,19,18,19.5となり、検索結果の表示順位は1,3,4,2となる。このように、S=C/Rの場合には、ユーザの所望するC4を初期状態の4位から2位に浮上することができ、ユーザは容易に所望のコンテンツに到達することが可能となる。
On the other hand, when S = C / R, for example, when the value of R is 1, 0.7, 0.5, 0.4 in order from the first place as shown in FIG. Then, since the number of browsing requests is counted regardless of the difference in the search terms, the phenomenon that the user-desired C4 is in the fourth place can be leveled as a whole. Therefore, as shown in FIG. 8C, the scores calculated by the
このように、閲覧重要度(S)の計算において、閲覧要求回数(C)を補正用閲覧要求回数(R)で除することにより、検索結果においてより上位に表示されたコンテンツ識別子に対する閲覧要求を相対的に低く評価し、逆に、より下位に表示されたコンテンツ識別子に対する閲覧要求を相対的に高く評価するので、表示順位の固定化を防止し、ユーザの所望コンテンツをより上位に浮上させることが可能となる。他のC1,C2,C3についても同様に、ユーザの所望する度合いに応じて、表示順位が浮上、又は沈下することになる。結果として、S=C/Rの場合には、初期状態の如何に関わらず、検索結果の表示順位をユーザの所望する順序へと変化させることが可能となる。 In this way, in the calculation of the browsing importance (S), by dividing the number of browsing requests (C) by the number of browsing requests for correction (R), browsing requests for content identifiers displayed higher in the search results are made. Relatively low evaluation, and conversely, high evaluation of browsing requests for content identifiers displayed at lower levels prevents the display order from being fixed and raises the user's desired content to higher levels. Is possible. Similarly, the display order of other C1, C2, and C3 rises or falls depending on the degree desired by the user. As a result, in the case of S = C / R, it is possible to change the display order of the search results to the order desired by the user regardless of the initial state.
本実施の形態によれば、検索要求に包含された検索語を受信した場合に、この検索語を含む複数のコンテンツをコンテンツ格納部301から読み出して、この検索語が複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出するコンテンツ検索部32と、この複数のコンテンツにそれぞれ対応するコンテンツ識別子を受信して、このコンテンツ識別子に一致する閲覧履歴格納部302に格納されたコンテンツ識別子の数をそれぞれ求めて閲覧要求回数とし、このコンテンツ識別子に一致する閲覧履歴格納部302に格納されたコンテンツ識別子に対応する表示順位の平均値をそれぞれ算出し、この平均値よりも高い表示順位を有する閲覧履歴格納部302に格納されたコンテンツ識別子の数に対して、この平均値と同等な表示順位を有する閲覧履歴格納部302に格納されたコンテンツ識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、閲覧要求回数を補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する閲覧履歴検索部33と、この閲覧履歴検索部33でコンテンツ格納部301から読み出された複数のコンテンツ識別子に対し、文章適合度と閲覧重要度とを合成した得点をそれぞれ算出する適合度合成部34と、この複数のコンテンツ識別子を、この得点に基づいて出力する検索結果出力部35とを有するので、検索結果が固定的に表示されることを防止し、ユーザの趣向を反映した順番でコンテンツのコンテンツ識別子を出力することができる。
According to the present embodiment, when a search word included in a search request is received, a plurality of contents including the search word are read from the
本実施の形態によれば、閲覧履歴検索部33が、検索要求に包含された検索語に一致する閲覧履歴格納部302に格納された検索語の数を求めて検索語利用回数とし、閲覧重要度は、閲覧要求回数を補正用閲覧要求回数で除した値を、更に検索語利用回数で除した値なので、検索語の違いによる閲覧要求回数の大きさの偏りを正規化することができる。即ち、どのような検索語が与えられた場合であっても、閲覧要求回数を補正用閲覧要求回数で除した値を一定の領域に納めることができる。
According to the present embodiment, the browsing
本実施の形態によれば、平均値よりも高い表示順位が1位なので、検索結果が固定的に表示されることをより確実に防止し、ユーザの趣向をより反映した順番でコンテンツのコンテンツ識別子を出力することができる。 According to the present embodiment, since the display order higher than the average value is first, it is possible to more reliably prevent the search result from being displayed in a fixed manner, and the content identifiers of the contents in an order more reflecting the user's preference Can be output.
〔第2の実施の形態〕
図10は、第2の実施の形態における情報検索システム1の構成を示す構成図である。本実施の形態における情報検索システム1は、第1の実施の形態と基本的には同様であり、情報検索装置3の備える構成が一部異なる構成である。
[Second Embodiment]
FIG. 10 is a configuration diagram showing a configuration of the
情報検索装置3は、閲覧履歴一括更新部39と、閲覧履歴検索部33に接続された閲覧要求回数格納部303と、閲覧履歴更新部37及び閲覧履歴一括更新部39に接続された閲覧履歴一時格納部304とを更に備えた構成である。その他の構成については、第1の実施の形態で説明したものと同様なので、ここでは重複説明を省略する。
The
閲覧要求回数格納部303は、閲覧履歴検索部33により参照され、図11に示すように、表示順位と補正用閲覧要求回数(R)とを関連付ける第1テーブルと、検索語と検索語利用回数(N)とを関連付ける第2テーブルとが格納されている。
The browsing request
閲覧履歴一時格納部304には、閲覧履歴更新部37からの更新要求により、ユーザによる一定期間の閲覧要求の閲覧履歴を格納し、格納された閲覧要求は、閲覧履歴一括更新部39により、閲覧履歴格納部302の閲覧履歴に反映される。
The browsing history
閲覧履歴一括更新部39は、閲覧履歴一時格納部304に格納された閲覧履歴を、閲覧履歴格納部302に反映する。
The browsing history
次に、本実施の形態における情報検索装置3の処理の流れについて説明する。第1の実施の形態と同様に、検索要求段階と閲覧要求段階との2段階で構成されており、最初に検索要求段階の処理の流れについて説明する。
Next, the flow of processing of the
検索要求段階の処理の流れは、第1の実施の形態で説明した(S101)〜(S106)と基本的には同様であるが、(S103)における閲覧重要度の算出方法が異なるので、その算出方法について、図12を用いて説明する。 The flow of processing at the search request stage is basically the same as (S101) to (S106) described in the first embodiment, but the browsing importance calculation method in (S103) is different. The calculation method will be described with reference to FIG.
最初に、閲覧履歴検索部33は、閲覧履歴格納部302からコンテンツ識別子を読み出して、コンテンツ検索部32から送信されたコンテンツ識別子に一致するコンテンツ識別子の数を算出し、そのコンテンツ識別子の数を閲覧要求回数(C)とする(S401)。
First, the browsing
次に、閲覧履歴検索部33は、閲覧履歴格納部302を参照して、そのコンテンツ識別子に対応する表示順位の平均値を算出し、閲覧要求回数格納部303に格納された第1テーブルを参照して、その平均値に同等な表示順位に対応する補正用閲覧要求回数(R)を読み出す(S402)。
Next, the browsing
続いて、閲覧履歴検索部33は、閲覧要求回数格納部303に格納された第2テーブルを参照して、検索語受信部31から送信された検索語に一致する検索語の検索語利用回数(N)を読み出す(S403)。
Subsequently, the browsing
最後に、閲覧履歴検索部33は、(S401)で算出された閲覧要求回数(C)と、(S402)で読み出した補正用閲覧要求回数(R)と、(S403)で読み出した検索語利用回数(N)とを用いて、第1の実施の形態に記載した式(1)に基づいて閲覧重要度(S)を算出する(S404)。
Finally, the browsing
次に、閲覧要求段階の処理の流れについて、図13を用いて説明する。 Next, the flow of processing at the browsing request stage will be described with reference to FIG.
まず、閲覧要求受信部36が、ネットワーク4を介してユーザ端末2から送信された閲覧要求をコンテンツ検索部32及び閲覧履歴更新部37に送信し、閲覧履歴更新部37は、その閲覧要求を閲覧履歴一時格納部304に追加する(S501)。
First, the browsing
次に、閲覧履歴一括更新部39は、所定の時期が経過した時に、閲覧履歴一時格納部304に格納された閲覧履歴を、閲覧履歴格納部302に追加し、閲覧履歴一時格納部304を空の状態にする(S502)。
Next, the browsing history
ここで、閲覧履歴一時格納部304に格納された閲覧履歴の全てを閲覧履歴格納部302に追加しても良いし、一部であっても良い。
Here, all of the browsing histories stored in the browsing history
続いて、コンテンツ検索部32は、閲覧要求に包含されたコンテンツ識別子に対応するコンテンツ所在場所をコンテンツ格納部301から検索し、検索された所在場所に格納されたコンテンツを取得する(S503)。
Subsequently, the
コンテンツ出力部38は、コンテンツ検索部32で取得されたコンテンツを受信して、ネットワーク4を介してユーザ端末2に出力する(S504)。
The
本実施の形態によれば、事前に提供された補正用閲覧要求回数(R)及び検索語利用回数(N)を閲覧要求回数格納部303を用いるので、閲覧重要度をより高速に算出することができ、検索結果をより速くユーザに提供することができる。
According to the present embodiment, since the browsing request
本実施の形態によれば、閲覧履歴一時格納部304及び閲覧履歴一括更新部39を更に用いるので、閲覧履歴一時格納部304に格納された一定期間の閲覧履歴の一部を閲覧履歴格納部302に反映することができる。
According to the present embodiment, since the browsing history
〔第3の実施の形態〕
図14は、第3の実施の形態における情報検索システム1の構成を示す構成図である。本実施の形態における情報検索システム1は、第1の実施の形態と基本的には同様であり、情報検索装置3の備える構成が一部異なる構成である。
[Third Embodiment]
FIG. 14 is a configuration diagram illustrating a configuration of the
情報検索装置3は、閲覧履歴検索部33に代えて、コンテンツ格納部301及び閲覧履歴格納部302を参照可能な閲覧重要度更新部40を更に備えた構成である。また、その他の構成については、第1の実施の形態で説明したものと同様なので、ここでは重複説明を省略する。
The
閲覧重要度更新部40は、閲覧履歴格納部302を参照し、各コンテンツに対する閲覧重要度を算出し、コンテンツ格納部301に格納する。
The browsing importance
コンテンツ格納部301には、図15に示すように、コンテンツ自身を示すコンテンツ文章情報と、このコンテンツを識別可能なコンテンツ識別子と、このコンテンツが格納されているコンテンツ所在場所と、閲覧重要度更新部40により更新された各検索語に対する閲覧重要度とが関連付けて格納されている。
As shown in FIG. 15, the
次に、本実施の形態における情報検索装置3の処理の流れについて説明する。第1の実施の形態と同様に、検索要求段階と閲覧要求段階との2段階で構成されており、最初に検索要求段階の処理の流れについて説明する。
Next, the flow of processing of the
まず、検索語受信部31は、ネットワーク4を介してユーザ端末2から送信された検索要求に包含された検索語を受信し、その検索語をコンテンツ検索部32に送信する(S601)。
First, the search
次に、コンテンツ検索部32は、検索語受信部31から送信された検索語を受信し、その検索語を含む複数のコンテンツ及びコンテンツ識別子をコンテンツ格納部301から読み出して、検索語が各コンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、コンテンツ識別子と文章適合度とを含む検索結果を適合度合成部34に送信する(S602)。
Next, the
続いて、コンテンツ検索部32は、各コンテンツ識別子に対し、送信された検索語に対応する閲覧重要度をコンテンツ格納部301から読み出して、その閲覧重要度を適合度合成部34に送信する(S603)。
Subsequently, the
適合度合成部34は、コンテンツ検索部32から送信された検索結果及び閲覧重要度を受信し、文章重要度と閲覧重要度とを合成した得点を算出する(S604)。
The matching
(S603)及び(S604)の処理を、(S602)で検索された全てのコンテンツ識別子に対して繰り返し行う(S605)。 The processes of (S603) and (S604) are repeated for all content identifiers searched in (S602) (S605).
最後に、検索結果出力部35は、適合度合成部34から送信された各コンテンツ識別子に対する得点を受信し、そのコンテンツ識別子を得点が高い順番に並び替えて、ネットワーク4を介してユーザ端末2に出力する(S606)。
Finally, the search
なお、閲覧重要度更新部40は、所定の時期が経過した時点で、閲覧履歴格納部302を参照し、コンテンツ格納部301の閲覧重要度を更新する。閲覧重要度の計算方法については、第1の実施の形態で説明した計算方法と同様である。
The browsing importance
また、閲覧要求段階の処理の流れについては、第1の実施の形態と同様なので、ここでは重複説明は省略する。 Further, since the flow of processing at the browsing request stage is the same as that in the first embodiment, a duplicate description is omitted here.
本実施の形態によれば、事前に計算された閲覧重要度を用いるので、検索結果をより速くユーザに提供することができる。 According to this embodiment, since the browsing importance calculated in advance is used, the search result can be provided to the user more quickly.
1…情報検索システム
2…ユーザ端末
3…情報検索装置
4…ネットワーク
31…検索語受信部
32…コンテンツ検索部
33…閲覧履歴検索部
34…適合度合成部
35…検索結果出力部
36…閲覧要求受信部
37…閲覧履歴更新部
38…コンテンツ出力部
39…閲覧履歴一括更新部
40…閲覧重要度更新部
301…コンテンツ格納部
302…閲覧履歴格納部
303…閲覧要求回数格納部
304…閲覧履歴一時格納部
DESCRIPTION OF
Claims (12)
コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて格納しておく閲覧履歴格納手段と、
検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、
該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、
該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、
前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する検索手段と、
前記検索手段で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する適合度合成手段と、
該複数の識別子を、前記得点に基づいて出力する検索結果出力手段と、
を有することを特徴とする情報検索装置。 Content storage means for storing the content and an identifier of the content in association with each other;
The search term used for the content search request, the identifier of the content browsed based on the search result based on the search term, and the display order indicating the order in which the identifier is displayed as the search result are stored in association with each other. Browsing history storage means;
When a search term included in the search request is received, a plurality of contents including the search term are read from the content storage unit, and sentence matching degrees indicating how often the search term appears in the plurality of contents are respectively set. Calculate
The identifier corresponding to each of the plurality of contents is further read from the content storage unit, and the number of identifiers stored in the browsing history storage unit that matches the identifier is determined as the number of browsing requests,
The average number of display ranks corresponding to the identifiers stored in the browsing history storage means matching the identifiers is calculated, and the number of identifiers stored in the browsing history storage means having a display rank higher than the average value In contrast, the number of identifiers stored in the browsing history storage means having a display order equivalent to the average value is determined as the number of browsing requests for correction,
Retrieval means for calculating each browsing importance obtained by dividing the number of browsing requests by the number of browsing requests for correction;
Relevance combining means for calculating scores obtained by combining the sentence relevance and the browsing importance for a plurality of identifiers read from the content storage means by the search means;
Search result output means for outputting the plurality of identifiers based on the score;
An information retrieval apparatus comprising:
コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2のステップと、
検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、
該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、
該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、
前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3のステップと、
前記第3のステップで前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4のステップと、
該複数の識別子を、前記得点に基づいて出力する第5のステップと、
を有することを特徴とする情報検索方法。 A first step of associating a content with an identifier of the content and storing the content in the content storage means;
A browsing history storage unit that associates a search term used for a content search request, an identifier of a content browsed based on a search result based on the search term, and a display rank indicating a rank in which the identifier is displayed as a search result. A second step of storing in
When a search term included in the search request is received, a plurality of contents including the search term are read from the content storage unit, and sentence matching degrees indicating how often the search term appears in the plurality of contents are respectively set. Calculate
The identifier corresponding to each of the plurality of contents is further read from the content storage unit, and the number of identifiers stored in the browsing history storage unit that matches the identifier is determined as the number of browsing requests,
The average number of display ranks corresponding to the identifiers stored in the browsing history storage means matching the identifiers is calculated, and the number of identifiers stored in the browsing history storage means having a display rank higher than the average value In contrast, the number of identifiers stored in the browsing history storage means having a display order equivalent to the average value is determined as the number of browsing requests for correction,
A third step of calculating each browsing importance obtained by dividing the number of browsing requests by the number of browsing requests for correction;
A fourth step of calculating a score obtained by combining the sentence suitability and the browsing importance for each of the plurality of identifiers read from the content storage unit in the third step;
A fifth step of outputting the plurality of identifiers based on the score;
A method for retrieving information, comprising:
コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2の処理と、
検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、
該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、
該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、
前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3の処理と、
前記第3の処理で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4の処理と、
該複数の識別子を、前記得点に基づいて出力する第5の処理と、
をコンピュータに実行させることを特徴とする情報検索プログラム。 A first process of associating the content with the content identifier and storing the content in the content storage means;
A browsing history storage unit that associates a search term used for a content search request, an identifier of a content browsed based on a search result based on the search term, and a display rank indicating a rank in which the identifier is displayed as a search result. A second process stored in
When a search term included in the search request is received, a plurality of contents including the search term are read from the content storage unit, and sentence matching degrees indicating how often the search term appears in the plurality of contents are respectively set. Calculate
The identifier corresponding to each of the plurality of contents is further read from the content storage unit, and the number of identifiers stored in the browsing history storage unit that matches the identifier is determined as the number of browsing requests,
The average number of display ranks corresponding to the identifiers stored in the browsing history storage means matching the identifiers is calculated, and the number of identifiers stored in the browsing history storage means having a display rank higher than the average value In contrast, the number of identifiers stored in the browsing history storage means having a display order equivalent to the average value is determined as the number of browsing requests for correction,
A third process for calculating each browsing importance obtained by dividing the number of browsing requests by the number of browsing requests for correction;
A fourth process for calculating a score obtained by combining the sentence suitability and the browsing importance for each of the plurality of identifiers read from the content storage unit in the third process;
A fifth process for outputting the plurality of identifiers based on the score;
An information search program for causing a computer to execute the above .
コンテンツの検索要求に用いた検索語と、該検索語による検索結果に基づいて閲覧されたコンテンツの識別子と、該識別子が検索結果として表示された順位を示す表示順位とを関連付けて閲覧履歴格納手段に格納しておく第2の処理と、
検索要求に包含された検索語を受信した場合に、該検索語を含む複数のコンテンツを前記コンテンツ格納手段から読み出して、該検索語が該複数のコンテンツに出現する頻度を示す文章適合度をそれぞれ算出し、
該複数のコンテンツにそれぞれ対応する識別子を前記コンテンツ格納手段から更に読み出して、該識別子に一致する前記閲覧履歴格納手段に格納された識別子の数をそれぞれ求めて閲覧要求回数とし、
該識別子に一致する前記閲覧履歴格納手段に格納された識別子に対応する表示順位の平均値をそれぞれ算出し、該平均値よりも高い表示順位を有する前記閲覧履歴格納手段に格納された識別子の数に対して、該平均値と同等な表示順位を有する前記閲覧履歴格納手段に格納された識別子の数の比率をそれぞれ求めて補正用閲覧要求回数とし、
前記閲覧要求回数を前記補正用閲覧要求回数で除した閲覧重要度をそれぞれ算出する第3の処理と、
前記第3の処理で前記コンテンツ格納手段から読み出された複数の識別子に対し、前記文章適合度と前記閲覧重要度とを合成した得点をそれぞれ算出する第4の処理と、
該複数の識別子を、前記得点に基づいて出力する第5の処理と、
をコンピュータに実行させることを特徴とする情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体。 A first process of associating the content with the content identifier and storing the content in the content storage means;
A browsing history storage unit that associates a search term used for a content search request, an identifier of a content browsed based on a search result based on the search term, and a display rank indicating a rank in which the identifier is displayed as a search result. A second process stored in
When a search term included in the search request is received, a plurality of contents including the search term are read from the content storage unit, and sentence matching degrees indicating how often the search term appears in the plurality of contents are respectively set. Calculate
The identifier corresponding to each of the plurality of contents is further read from the content storage unit, and the number of identifiers stored in the browsing history storage unit that matches the identifier is determined as the number of browsing requests,
The average number of display ranks corresponding to the identifiers stored in the browsing history storage means matching the identifiers is calculated, and the number of identifiers stored in the browsing history storage means having a display rank higher than the average value In contrast, the number of identifiers stored in the browsing history storage means having a display order equivalent to the average value is determined as the number of browsing requests for correction,
A third process for calculating each browsing importance obtained by dividing the number of browsing requests by the number of browsing requests for correction;
A fourth process for calculating a score obtained by combining the sentence suitability and the browsing importance for each of the plurality of identifiers read from the content storage unit in the third process;
A fifth process for outputting the plurality of identifiers based on the score;
A computer-readable recording medium on which is recorded an information search program characterized in that the computer is executed .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007067239A JP4818170B2 (en) | 2007-03-15 | 2007-03-15 | Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007067239A JP4818170B2 (en) | 2007-03-15 | 2007-03-15 | Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008226156A JP2008226156A (en) | 2008-09-25 |
JP4818170B2 true JP4818170B2 (en) | 2011-11-16 |
Family
ID=39844647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007067239A Expired - Fee Related JP4818170B2 (en) | 2007-03-15 | 2007-03-15 | Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4818170B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3505100B2 (en) * | 1999-02-08 | 2004-03-08 | 日本電信電話株式会社 | INFORMATION SEARCHING DEVICE, METHOD, AND RECORDING MEDIUM CONTAINING PROGRAM FOR EXECUTING THE METHOD |
JP3922693B2 (en) * | 2002-06-17 | 2007-05-30 | Necシステムテクノロジー株式会社 | Internet information retrieval system |
JP2005043999A (en) * | 2003-07-23 | 2005-02-17 | Canon Inc | Information retrieval device, information retrieval method, program, and storage medium |
JP2005228257A (en) * | 2004-02-16 | 2005-08-25 | Recruit Co Ltd | Information retrieval system, information retrieval method, and program thereof |
JP2006228171A (en) * | 2005-02-15 | 2006-08-31 | MEN Corporation有限会社 | Retrieval keyword evaluation method using access analysis tool |
-
2007
- 2007-03-15 JP JP2007067239A patent/JP4818170B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008226156A (en) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2720899C2 (en) | Method and system for determining user-specific content proportions for recommendation | |
JP5493267B2 (en) | Product search device and product search method | |
JP5328212B2 (en) | RECOMMENDATION INFORMATION EVALUATION DEVICE AND RECOMMENDATION INFORMATION EVALUATION METHOD | |
JP4587236B2 (en) | Information search apparatus, information search method, and program | |
JP2015079395A (en) | Information processing device, method, and program | |
JP5483269B2 (en) | Information search device and information search method | |
JP5194731B2 (en) | Document relevance calculation system, document relevance calculation method, and document relevance calculation program | |
JP2017146926A (en) | Information processing device, information processing method and information processing program | |
JP5378026B2 (en) | Search list providing server, search list providing method and program | |
JP2009251957A (en) | Interest information specification system, interest information specification method, and program for interest information specification | |
US9183299B2 (en) | Search engine for ranking a set of pages returned as search results from a search query | |
JP2007034772A (en) | Optimum display system for web site search result, its method and its program | |
JP5416063B2 (en) | Content recommendation device, content recommendation program and recording medium thereof | |
JP5084796B2 (en) | Relevance determination device, relevance determination method, and program | |
JP2010055155A (en) | Server device, information processing method, and program | |
JP4818170B2 (en) | Information search apparatus, information search method, information search program, and computer-readable recording medium recording the information search program | |
JP5915724B2 (en) | Information processing method, display method, information processing apparatus, display apparatus, information processing program, display program | |
JP2018169900A (en) | Information providing device, information providing method, program, and information providing system | |
JP2003108594A (en) | Information retrieving device and its method | |
JP2010015394A (en) | Link destination presentation device and computer program | |
JP5589009B2 (en) | RECOMMENDED QUERY EXTRACTION DEVICE, METHOD, AND PROGRAM | |
JP5832503B2 (en) | Information processing apparatus, method, and program | |
JP2004272492A (en) | Method for retrieving/displaying web site | |
JP5519406B2 (en) | Server apparatus, genre score calculation method, and program | |
JP2011100407A (en) | Retrieval system, and display method in retrieval system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110816 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4818170 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |