JP5289498B2 - Common additional information adding device by category and common additional information adding method by category - Google Patents
Common additional information adding device by category and common additional information adding method by category Download PDFInfo
- Publication number
- JP5289498B2 JP5289498B2 JP2011079328A JP2011079328A JP5289498B2 JP 5289498 B2 JP5289498 B2 JP 5289498B2 JP 2011079328 A JP2011079328 A JP 2011079328A JP 2011079328 A JP2011079328 A JP 2011079328A JP 5289498 B2 JP5289498 B2 JP 5289498B2
- Authority
- JP
- Japan
- Prior art keywords
- additional information
- common
- web page
- category
- common word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 15
- 238000000605 extraction Methods 0.000 claims description 40
- 239000000284 extract Substances 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010411 cooking Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法に関する。 The present invention relates to a category-specific common additional information adding apparatus and a category-specific common additional information adding method.
インターネット上には、Webページを検索できる検索サイトが存在している。検索サイトでは、検索クエリを受け付けたことに応じて、検索結果ページを出力する。この検索結果ページには、Webページのタイトル、URL及びWebページの一部の情報を示すスニペットが含まれている(例えば、特許文献1参照)。このスニペットは、Webページにおいて検索クエリが含まれている文章や当該文章の前後の文章とされることが多い。 There are search sites on the Internet where web pages can be searched. The search site outputs a search result page in response to receiving the search query. This search result page includes a web page title, URL, and a snippet indicating a part of the web page information (see, for example, Patent Document 1). This snippet is often a sentence including a search query in a Web page or a sentence before and after the sentence.
ところで、Webページには、当該Webページの属するカテゴリごとに共通の付加情報が含まれている場合が多い。具体的には、例えば、レシピのカテゴリに属するWebページには「調理時間」や「カロリー」といった共通の付加情報が含まれている。そして、当該カテゴリごとに共通の付加情報は、当該カテゴリに属するWebページ同士を対比するうえで有効な情報であると考えられる。したがって、検索要求を送信したユーザに対して、所定のカテゴリに属するWebページに含まれている共通の付加情報を、検索結果を示すスニペットにおいて閲覧することができれば好適である。 By the way, a web page often includes additional information common to each category to which the web page belongs. Specifically, for example, common additional information such as “cooking time” and “calorie” is included in the Web page belonging to the category of recipe. The additional information common to each category is considered to be information that is effective in comparing Web pages belonging to the category. Therefore, it is preferable that the user who has transmitted the search request can view the common additional information included in the Web page belonging to the predetermined category in the snippet indicating the search result.
しかしながら、従来の技術において、スニペットは、Webページにおいて検索クエリが含まれている文章及び当該文章の前後の文章に基づいて構成することが多いため、当該付加情報が検索クエリに含まれている場合以外は、当該スニペットに当該Webページの属するカテゴリごとに共通の付加情報が含まれるとは限らない。 However, in the conventional technique, a snippet is often configured based on a sentence including a search query in a Web page and sentences before and after the sentence. Therefore, when the additional information is included in the search query. Except for the above, the snippet does not necessarily include common additional information for each category to which the Web page belongs.
そこで、本発明は、検索結果ページに、Webページのカテゴリごとに共通の付加情報を付加することができるカテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法を提供することを目的とする。 Accordingly, an object of the present invention is to provide a category-specific common additional information adding apparatus and a category-specific common additional information adding method capable of adding common additional information for each category of a Web page to a search result page. .
(1)ユーザ端末に通信可能に接続され、Webページが属するカテゴリごとに共通の付加情報を検索結果ページに追加するカテゴリ別共通付加情報追加装置であって、Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段と、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出手段と、前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出手段によって記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出手段と、前記ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加手段と、前記付加情報追加手段により前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信手段と、を備えるカテゴリ別共通付加情報追加装置。 (1) A category-specific common additional information adding apparatus that is communicably connected to a user terminal and adds common additional information to a search result page for each category to which a Web page belongs, and includes a URL indicating a Web page, the Web Additional information storage means for storing a common word included in common for each category to which the page belongs and additional information related to the common word included in the Web page; and for each category, the Web page storage means A common word extracting unit that extracts the common word that appears at a predetermined frequency in the Web page stored in the Web page, stores the category and the extracted common word in association with each other, and is stored in the Web page storage unit. For each existing Web page, the common page stored in the common word extraction unit corresponds to the category to which the Web page belongs. Additional information related to a word is extracted, additional information extracting means for storing the URL indicating the Web page, the common word, and the additional information in the additional information storage means, and a search request is received from the user terminal If the URL indicating the Web page stored in the additional information storage means is included in the search result page generated accordingly, the common word and the additional information corresponding to the URL indicating the Web page Is extracted from the additional information storage means and added to the search result page, and transmission means for transmitting the search result page to which the additional information is added by the additional information addition means to the user terminal And a category-specific common additional information adding device.
(1)のカテゴリ別共通付加情報追加装置は、共通語抽出手段により、カテゴリごとに、Webページ記憶手段に記憶されているWebページに所定の頻度で出現する共通語を抽出し、当該カテゴリと抽出した共通語とを関連付けて記憶し、付加情報抽出手段により、Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、共通語抽出手段によって記憶された共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる。そして、(1)のカテゴリ別共通付加情報追加装置は、付加情報追加手段により、ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに付加情報記憶手段に記憶されているWebページを示すURLが含まれている場合、当該Webページを示すURLに対応する共通語及び付加情報を、付加情報記憶手段から抽出して当該検索結果ページに追加し、送信手段により、付加情報追加手段により付加情報が付加された検索結果ページを前記ユーザ端末に送信する。 In the category-specific common additional information adding device of (1), the common word extracting unit extracts a common word that appears on the Web page stored in the Web page storage unit at a predetermined frequency for each category, The extracted common word is stored in association with each other, and for each Web page stored in the Web page storage unit, the common information stored in the common word extraction unit corresponds to the category to which the Web page belongs. Additional information relating to the word is extracted, and the URL indicating the Web page, the common word, and the additional information are stored in the additional information storage unit. In the category-specific common additional information adding device (1), the additional information adding unit stores the Web stored in the additional information storage unit in the search result page generated in response to receiving the search request from the user terminal. If a URL indicating a page is included, the common word and additional information corresponding to the URL indicating the Web page are extracted from the additional information storage unit and added to the search result page, and the additional information is added by the transmitting unit. The search result page to which the additional information is added by the means is transmitted to the user terminal.
よって、(1)のカテゴリ別共通付加情報追加装置は、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリに対応する共通語及び当該共通語に係る付加情報を付加して、検索結果ページをリッチ化することができる。また、共通語及び付加情報が検索結果ページのスニペットに含まれていない場合であっても、検索結果ページに共通語及び付加情報を表示させるので、ユーザが当該共通語及び付加情報を必要としている場合において、利便性を高めることができる。 Therefore, the category-specific common additional information adding device of (1) adds the common language corresponding to the category of the Web page and the additional information related to the common language to the search result page composed only of the snippet corresponding to the search query. Thus, the search result page can be enriched. Even if the common word and additional information are not included in the search result page snippet, the common word and additional information are displayed on the search result page, so the user needs the common word and additional information. In some cases, convenience can be improved.
(2)前記共通語抽出手段は、前記カテゴリごとに、当該カテゴリに属するWebページに含まれる語のうち、DF(Document Frequency)が相対的に高い語を前記共通語として抽出する、(1)に記載のカテゴリ別共通付加情報追加装置。カテゴリ別共通付加情報追加装置。 (2) The common word extraction unit extracts, as the common word, a word having a relatively high DF (Document Frequency) among words included in a Web page belonging to the category for each category. Common additional information adding device classified by category as described in 1. Common additional information adding device by category.
このようにすることで、(2)のカテゴリ別共通付加情報追加装置は、DFという尺度を用いてWebページに所定の頻度で出現する共通語を抽出することができる。 In this way, the category-specific common additional information adding device (2) can extract common words that appear at a predetermined frequency on the Web page using a scale called DF.
(3)検索結果ページにWebページが属するカテゴリごとに共通の付加情報を追加するカテゴリ別共通付加情報追加装置が実行するカテゴリ別共通付加情報追加方法であって、前記カテゴリ別共通付加情報追加装置は、前記Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段を備え、前記カテゴリ別共通付加情報追加方法は、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出ステップと、前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出ステップにおいて記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出ステップと、ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加ステップと、前記付加情報追加ステップにおいて前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信ステップと、を含むカテゴリ別共通付加情報追加方法。 (3) A category-specific common additional information adding method executed by a category-specific common additional information adding device for adding common additional information for each category to which a Web page belongs to a search result page, the category-specific common additional information adding device Is an additional information storage unit that associates and stores a URL indicating the Web page, a common word included in common for each category to which the Web page belongs, and additional information related to the common word included in the Web page. The category-specific common additional information adding method extracts, for each category, the common word that appears at a predetermined frequency on a Web page stored in the Web page storage unit, and extracts the category as the category A common word extracting step for storing the common words in association with each other, and a Web page stored in the Web page storage means. For each page, the additional information related to the common word stored in the common word extraction step corresponding to the category to which the Web page belongs is extracted, the URL indicating the Web page, the common word, and the additional information The additional information extracting step for storing the information in the additional information storage means, and the Web page stored in the additional information storage means in the search result page generated in response to receiving the search request from the user terminal. If the URL is included, an additional information adding step of extracting the common word and the additional information corresponding to the URL indicating the Web page from the additional information storage unit and adding the extracted information to the search result page; A transmitting step of transmitting the search result page to which the additional information is added in the information adding step to the user terminal; , Common additional information how to add categories, including.
この方法によれば、(1)に係る発明と同様の効果を奏する。 According to this method, the same effect as the invention according to (1) is obtained.
本発明によれば、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリごとに共通付加情報を付加することができるカテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the common additional information addition apparatus classified by category which can add common additional information for every category of a web page to the search result page comprised only from the snippet corresponding to a search query, and common additional information classified by category Additional methods can be provided.
以下、本発明の実施形態について図を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[機能構成]
図1は、本実施形態に係るカテゴリ別共通付加情報追加装置1の機能概要を示す図である。カテゴリ別共通付加情報追加装置1は、Webページが属するカテゴリごとの共通付加情報を検索結果ページに追加することができるサーバである。
[Function configuration]
FIG. 1 is a diagram showing a functional outline of the category-specific common additional information adding apparatus 1 according to the present embodiment. The category-specific common additional information adding device 1 is a server that can add common additional information for each category to which a Web page belongs to a search result page.
本実施形態は、コンピュータ(カテゴリ別共通付加情報追加装置1)及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びに当該ハードウェアを制御するソフトウェアによって構成される。 The present embodiment is applied to a computer (category-specific common additional information adding device 1) and its peripheral devices. Each unit in the present embodiment is configured by hardware included in a computer and its peripheral devices, and software that controls the hardware.
上記ハードウェアには、制御部としてのCPU(Central Processing Unit)の他、記憶部、通信装置、表示装置及び入力装置が含まれる。記憶部としては、例えば、メモリ(RAM:Random Access Memory、ROM:Read Only Memory等)、ハードディスクドライブ(HDD:Hard Disk Drive)及び光ディスク(CD:Compact Disk、DVD:Digital Versatile Disk等)ドライブが挙げられる。通信装置としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置としては、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。 The hardware includes a storage unit, a communication device, a display device, and an input device in addition to a CPU (Central Processing Unit) as a control unit. Examples of the storage unit include a memory (RAM: Random Access Memory, ROM: Read Only Memory, etc.), a hard disk drive (HDD: Hard Disk Drive), and an optical disk (CD: Compact Disc, DVD: Digital Versatile Drive, etc.). It is done. Examples of the communication device include various wired and wireless interface devices. Examples of the display device include various displays such as a liquid crystal display and a plasma display. Examples of the input device include a keyboard and a pointing device (mouse, tracking ball, etc.).
上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部により記憶され、制御部により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布されることも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布されることも可能である。 The software includes a computer program and data for controlling the hardware. The computer program and data are stored in the storage unit, and are appropriately executed and referenced by the control unit. The computer program and data can be distributed via a communication line, or can be recorded on a computer-readable medium such as a CD-ROM and distributed.
カテゴリ別共通付加情報追加装置1は、操作者から直接的な入力を受け付ける操作部11と、このカテゴリ別共通付加情報追加装置1の機能に関する情報を表示する表示部12と、本実施形態に係る機能を実行するプログラム(図示省略)等を記憶する記憶部13と、カテゴリ別共通付加情報追加装置1に係る各機能を統括的に制御する制御部14と、を備える。
The category-specific common additional information adding device 1 includes an
操作部11は、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)により実装される。
表示部12は、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイにより実装される。
The
The
記憶部13は、上述の各種プログラムの他に、Webページ記憶手段としてのアーカイブDB131と、共通語記憶手段としての共通語DB132と、付加情報記憶手段としての付加情報DB133と、インデックスDB134と、を備える。
In addition to the various programs described above, the
制御部14は、共通語抽出手段としての共通語抽出部141と、付加情報抽出手段としての付加情報抽出部142と、検索要求受付部143と、検索部144と、付加情報追加手段としての付加情報追加部145と、送信手段としての検索結果ページ送信部146と、を備える。
The
共通語抽出部141は、Webページの属するカテゴリごとに、アーカイブDB131に記憶されているWebページに所定の頻度で出現する共通語を抽出する。具体的には、共通語抽出部141は、カテゴリごとに、当該カテゴリに属するWebページの形態素解析を行い、当該Webページに含まれる語を特定する。そして、共通語抽出部141は、当該Webページに含まれる語のうち、DF(Document Frequency)が相対的に高い語を共通語として抽出する。ここで、DFとは、語が含まれている文書(Webページ)の数をいう。例えば、所定の語WのDFとは、所定の語Wが少なくとも1つ含まれているWebページの数をいう。
The common
続いて、共通語抽出部141は、カテゴリと抽出した共通語とを関連付けて共通語DB132に記憶させる。
ここで、共通語抽出部141は、DFが相対的に高い語が複数抽出された場合に、これら複数の語を共通語候補として表示部12に表示させて、操作部11を介して、これら複数の語のうち、共通語とする語の選択を受け付けるようにしてもよい。
Subsequently, the common
Here, when a plurality of words having a relatively high DF are extracted, the common
図2は、本実施形態に係るアーカイブDB131を示す図である。
アーカイブDB131は、カテゴリごとに、Webページと、当該Webページを示すURLとを関連付けて記憶する。このアーカイブDB131には、クローラにより取得されたWebページや、RSSリーダにより取得されたRSSの更新情報や、コンテンツプロバイダ等から受信するデータフィード等が含まれる。
FIG. 2 is a diagram showing the
The
なお、本実施形態では、図2において、アーカイブDB131を1つのみ備えていることとしたが、これに限らず、複数のアーカイブDBを備えるようにしてもよい。この場合、複数のアーカイブDBそれぞれは、異なる種類のクローラ等により取得されたWebページを記憶するようにしてもよい。そして、複数のアーカイブDBにおいて、同一のWebページが複数の異なるURLで示されている場合に、このURLを調整するようにしてもよい。
In the present embodiment, only one
例えば、一方のアーカイブDBにおいて、あるWebページを示すURLが「www.???.com/%E6%A4%9C%E7%B4%A2/1234567」であり、他方のアーカイブDBにおいて、同一のWebページを示すURLが「www.???.com/検索/1234567」である場合に、2つのWebページのいずれか一方のみ共通語抽出部141及び付加情報抽出部142において参照するようにしてもよい。例えば、共通語抽出部141及び付加情報抽出部142は、URLの末尾の所定数の文字列が一致する場合に、同一のWebページであると判定するようにしてもよい。
For example, in one archive DB, a URL indicating a certain Web page is “www.????.com/%E6%A4%9C%E7%B4%A2/123567” and the other archive DB has the same URL. When the URL indicating the Web page is “www.???.com/search/1234567”, the common
図3は、本実施形態に係る共通語DB132を示す図である。
共通語DB132は、カテゴリと、当該カテゴリに属する複数のWebページの共通語とを関連付けて記憶する。
FIG. 3 is a diagram showing the
The
図4は、本実施形態に係る付加情報DB133を示す図である。
付加情報DB133は、Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる共通語に係る付加情報とを関連付けて記憶する。
FIG. 4 is a diagram showing the
The
図1に説明を戻す。付加情報抽出部142は、アーカイブDB131に記憶されているWebページごとに、当該Webページが属するカテゴリに対応する共通語を、共通語DB132を参照することによって特定する。続いて、付加情報抽出部142は、当該Webページから、特定した共通語に係る付加情報を抽出する。
Returning to FIG. For each Web page stored in the
例えば、付加情報抽出部142は、Webページのタグ情報を参照し、共通語の近傍の文字列を抽出する。ここで、付加情報抽出部142は、共通語の近傍の文字列が複数存在する場合、これら複数の文字列を付加情報の候補として表示部12に表示させてもよい。そして、付加情報抽出部142は、操作部11を介して、これら複数の文字列のうち、付加情報とする文字列の選択を受け付けるようにしてもよい。また、複数のWebページが同一のドメインに属している場合において、一のWebページについて、操作部11を介して、付加情報とする文字列の選択を受け付けたとき、付加情報抽出部142は、他のWebページについて、操作部11を介して選択された付加情報と同じ位置の情報を付加情報として抽出するようにしてもよい。
For example, the additional
続いて、付加情報抽出部142は、Webページを示すURLと、当該Webページに含まれる共通語と、当該Webページに含まれる共通語に係る付加情報とを関連付けて付加情報DB133に記憶させる。
Subsequently, the additional
検索要求受付部143は、ユーザ端末2から、検索クエリを受け付けることにより、検索要求を受け付ける。
The search
検索部144は、検索要求受付部143により検索要求を受け付けたことに応じて、インデックスDB134を参照して、検索要求受付部143により受け付けられた検索クエリに対応するURLと、当該URLに対応するスニペットとを含む検索結果ページを生成する。
The
図5は、本実施形態に係るインデックスDB134を示す図である。インデックスDB134は、Webページを示すアドレス(URL)と、当該Webページのインデックスとしてのテキスト情報と、スニペットとを関連付けて記憶する。
FIG. 5 is a diagram showing the
図1に説明を戻す。付加情報追加部145は、ユーザ端末2から検索要求を受け付けたことに応じて検索部144において生成された検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれているか否かを判定する。付加情報追加部145は、検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれている場合、付加情報DB133から、当該Webページに含まれる共通語及び付加情報を抽出する。
Returning to FIG. Whether the additional
続いて、付加情報追加部145は、検索結果ページの所定位置に、抽出した共通語及び付加情報を追加する。ここで、所定位置は、抽出した共通語及び付加情報に対応するWebページのスニペット及びURLの近傍である。
Subsequently, the additional
図6は、本実施形態に係る検索結果ページPに共通語及び付加情報P1が表示された例を示す図である。
検索結果ページPに掲載されているURL「http://www.gourmet.***.jp/123.htm」が、図4に示すように付加情報DB133に含まれているとすると、付加情報追加部145によって、付加情報DB133から、共通語及び付加情報として「カロリー」、「123kcal」、「調理時間」及び「15分」が抽出され、図6に示すように共通語及び付加情報P1として検索結果ページに追加される。
FIG. 6 is a diagram illustrating an example in which the common word and the additional information P1 are displayed on the search result page P according to the present embodiment.
Assuming that the URL “http: //www.gourmet.***.jp/123.html” posted on the search result page P is included in the
検索結果ページ送信部146は、付加情報追加部145により付加情報が付加された検索結果ページをユーザ端末2に送信する。なお、検索結果ページ送信部146は、付加情報追加部145により付加情報が付加されなかった場合、検索部144によって生成された検索結果ページをユーザ端末2に送信する。
The search result
[フローチャート]
続いて、カテゴリ別共通付加情報追加装置1における処理の流れについて説明する。
図7は、本実施形態に係るカテゴリ別共通付加情報追加装置1において、アーカイブDB131から共通語を抽出してから、付加情報DB133に付加情報を記憶させるまでの処理の流れを示すフローチャートである。
[flowchart]
Next, the flow of processing in the category-specific common additional information adding device 1 will be described.
FIG. 7 is a flowchart showing a flow of processing from extracting a common word from the
ステップS1において、制御部14(共通語抽出部141)は、カテゴリごとに、当該カテゴリに属するWebページの形態素解析を行い、当該Webページに含まれる語を特定する。
ステップS2において、制御部14(共通語抽出部141)は、DFが相対的に高い語を共通語として抽出する。
ステップS3において、制御部14(共通語抽出部141)は、カテゴリと、当該カテゴリに対応する共通語を共通語DB132に記憶させる。
In step S1, the control unit 14 (common word extraction unit 141) performs, for each category, a morphological analysis of a Web page belonging to the category, and specifies a word included in the Web page.
In step S2, the control unit 14 (common word extraction unit 141) extracts words having a relatively high DF as common words.
In step S <b> 3, the control unit 14 (common word extraction unit 141) stores the category and the common word corresponding to the category in the
ステップS4において、制御部14(付加情報抽出部142)は、アーカイブDB131に記憶されているWebページごとに、共通語DB132を参照して、当該Webページが属するカテゴリに対応する共通語を特定する。
ステップS5において、制御部14(付加情報抽出部142)は、ステップS4において特定した共通語に係る付加情報をWebページから抽出する。
In step S <b> 4, the control unit 14 (additional information extraction unit 142) refers to the
In step S5, the control unit 14 (additional information extraction unit 142) extracts additional information related to the common language identified in step S4 from the Web page.
ステップS6において、制御部14(付加情報抽出部142)は、Webページを示すURLと、ステップS4において特定した共通語と、ステップS5において抽出された付加情報とを付加情報DB133に記憶させる。
In step S6, the control unit 14 (additional information extraction unit 142) causes the
図8は、本実施形態に係るカテゴリ別共通付加情報追加装置1において、ユーザ端末2から検索要求を受け付けてから検索結果ページをユーザ端末2に送信するまでの処理の流れを示すフローチャートである。なお、本実施形態では、図7に示す処理が行われる前に、付加情報DB133に、Webページを示すURLと、共通語と、付加情報とが関連付けられて記憶されているものとする。
FIG. 8 is a flowchart showing a flow of processing from receiving a search request from the
ステップS11において、制御部14(検索要求受付部143)は、ユーザ端末2から、検索クエリを受け付けることにより、検索要求を受け付ける。
ステップS12において、制御部14(検索部144)は、ステップS11において検索要求を受け付けたことに応じて、インデックスDB134を参照して、ステップS11において受け付けられた検索クエリに対応するURLと、当該URLに対応するスニペットとを含む検索結果ページを生成する。
In step S <b> 11, the control unit 14 (search request receiving unit 143) receives a search request from the
In step S12, the control unit 14 (search unit 144) refers to the
ステップS13において、制御部14(付加情報追加部145)は、ステップS2において生成された検索結果ページに、付加情報DB133に記憶されているWebページを示すURLが含まれているか否かを判定する。制御部14(付加情報追加部145)は、この判定がYESの場合、ステップS14に処理を移し、この判定がNOの場合、ステップS16に処理を移す。
In step S13, the control unit 14 (additional information adding unit 145) determines whether or not the search result page generated in step S2 includes a URL indicating the Web page stored in the
ステップS14において、制御部14(付加情報追加部145)は、付加情報DB133に記憶されているWebページのうち、検索結果ページに掲載されているWebページに含まれる共通語及び付加情報を付加情報DB133から抽出する。
ステップS15において、制御部14(付加情報追加部145)は、ステップS14において抽出された共通語及び付加情報を、検索結果ページに掲載されている、当該共通語及び付加情報に対応するWebページの近傍に追加する。
In step S <b> 14, the control unit 14 (additional information adding unit 145) adds the common language and additional information included in the Web page posted on the search result page among the Web pages stored in the
In step S15, the control unit 14 (additional information adding unit 145) displays the common word and additional information extracted in step S14 on the Web page corresponding to the common word and additional information posted on the search result page. Add to the neighborhood.
ステップS16において、制御部14(検索結果ページ送信部146)は、ステップS15において共通語及び付加情報が付加された検索結果ページ又はステップS12において生成された検索結果ページをユーザ端末2に送信する。
In step S16, the control unit 14 (search result page transmission unit 146) transmits the search result page to which the common word and the additional information are added in step S15 or the search result page generated in step S12 to the
以上、本実施形態によれば、カテゴリ別共通付加情報追加装置1は、共通語抽出部141により、カテゴリごとに、アーカイブDB131に記憶されているWebページに所定の頻度で出現する共通語を抽出し、当該カテゴリと抽出した共通語とを関連付けて共通語DB132に記憶させ、付加情報抽出部142により、アーカイブDB131に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、共通語DB132に記憶されている共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを付加情報DB133に記憶させる。そして、カテゴリ別共通付加情報追加装置1は、付加情報追加部145により、ユーザ端末2から検索要求を受け付けたことに応じて生成された検索結果ページに付加情報DB133に記憶されているWebページを示すURLが含まれている場合、当該Webページを示すURLに対応する共通語及び付加情報を、付加情報DB133から抽出して当該検索結果ページに追加し、検索結果ページ送信部146により、付加情報追加部145により付加情報が付加された検索結果ページをユーザ端末2に送信する。
As described above, according to the present embodiment, the category-specific common additional information adding device 1 uses the common
よって、カテゴリ別共通付加情報追加装置1は、検索クエリに対応するスニペットのみから構成された検索結果ページに、Webページのカテゴリに対応する共通語及び当該共通語に係る付加情報を付加して、検索結果ページをリッチ化することができる。また、カテゴリ別共通付加情報追加装置1は、共通語及び付加情報が検索結果ページのスニペットに含まれていない場合であっても、検索結果ページに共通語及び付加情報を表示させるので、ユーザが当該共通語及び付加情報を必要としている場合において、利便性を高めることができる。 Therefore, the category-specific common additional information adding device 1 adds the common word corresponding to the category of the Web page and the additional information related to the common word to the search result page configured only by the snippet corresponding to the search query, The search result page can be enriched. The category-specific common additional information adding device 1 displays the common word and the additional information on the search result page even when the common word and the additional information are not included in the snippet of the search result page. When the common language and additional information are required, convenience can be improved.
また、カテゴリ別共通付加情報追加装置1は、共通語抽出部141により、カテゴリごとに、当該カテゴリに属するWebページに含まれる語のうち、DFが相対的に高い語を共通語として抽出するので、DFという尺度を用いてWebページに所定の頻度で出現する共通語を抽出することができる。
Further, the common additional information adding device by category 1 uses the common
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
本実施形態では、カテゴリ別共通付加情報追加装置1というコンピュータを例にとって説明したが、本発明はコンピュータに限られるものではなく、コンピュータが各種機能を実行する方法、コンピュータに各種機能を実行させるためのプログラム及びこのプログラムを記憶した記憶媒体にも適用可能である。 In the present embodiment, a computer called the category-specific common additional information adding device 1 has been described as an example. However, the present invention is not limited to a computer, and a method for a computer to execute various functions and a computer to execute various functions. This program can also be applied to a storage medium storing this program.
1 カテゴリ別共通付加情報追加装置
2 ユーザ端末
11 操作部
12 表示部
13 記憶部
14 制御部
131 アーカイブDB
132 共通語DB
133 付加情報DB
134 インデックスDB
141 共通語抽出部
142 付加情報抽出部
143 検索要求受付部
144 検索部
145 付加情報追加部
146 検索結果ページ送信部
DESCRIPTION OF SYMBOLS 1 Common additional information addition apparatus according to
132 Common Language DB
133 Additional information DB
134 Index DB
141 Common
Claims (3)
Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段と、
前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出手段と、
前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出手段によって記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出手段と、
前記ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加手段と、
前記付加情報追加手段により前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信手段と、
を備えるカテゴリ別共通付加情報追加装置。 A category-specific common additional information adding device that is communicably connected to a user terminal and adds common additional information to a search result page for each category to which a Web page belongs,
An additional information storage means for storing a URL indicating a Web page, a common word included in common for each category to which the Web page belongs, and additional information related to the common word included in the Web page in association with each other;
A common word extraction unit that extracts, for each category, the common word that appears at a predetermined frequency in a Web page stored in the Web page storage unit, and stores the category and the extracted common word in association with each other; ,
For each Web page stored in the Web page storage unit, the additional information related to the common language stored in the common language extraction unit corresponding to the category to which the Web page belongs is extracted to indicate the Web page Additional information extraction means for storing the URL, the common language, and the additional information in the additional information storage means;
If the search result page generated in response to receiving a search request from the user terminal includes a URL indicating the Web page stored in the additional information storage unit, the URL indicating the Web page Additional information adding means for extracting the corresponding common word and the additional information from the additional information storage means and adding them to the search result page;
Transmitting means for transmitting the search result page to which the additional information is added by the additional information adding means to the user terminal;
A category-specific common additional information adding device.
請求項1に記載のカテゴリ別共通付加情報追加装置。 The common word extraction unit extracts, as the common word, a word having a relatively high DF (Document Frequency) among words included in a Web page belonging to the category for each category.
The category-specific common additional information adding device according to claim 1.
前記カテゴリ別共通付加情報追加装置は、
前記Webページを示すURLと、当該Webページが属するカテゴリごとに共通して含まれる共通語と、当該Webページに含まれる前記共通語に係る付加情報とを関連付けて記憶する付加情報記憶手段を備え、
前記カテゴリ別共通付加情報追加方法は、前記カテゴリごとに、前記Webページ記憶手段に記憶されているWebページに所定の頻度で出現する前記共通語を抽出し、前記カテゴリと抽出した前記共通語とを関連付けて記憶する共通語抽出ステップと、
前記Webページ記憶手段に記憶されているWebページごとに、当該Webページが属するカテゴリに対応し、前記共通語抽出ステップにおいて記憶された前記共通語に係る付加情報を抽出し、当該Webページを示すURLと、当該共通語と、当該付加情報とを前記付加情報記憶手段に記憶させる付加情報抽出ステップと、
ユーザ端末から検索要求を受け付けたことに応じて生成された検索結果ページに前記付加情報記憶手段に記憶されている前記Webページを示すURLが含まれている場合、当該Webページを示すURLに対応する前記共通語及び前記付加情報を、前記付加情報記憶手段から抽出して当該検索結果ページに追加する付加情報追加ステップと、
前記付加情報追加ステップにおいて前記付加情報が付加された前記検索結果ページを前記ユーザ端末に送信する送信ステップと、を含むカテゴリ別共通付加情報追加方法。 A category-specific common additional information adding method executed by a category-specific common additional information adding apparatus for adding common additional information for each category to which a Web page belongs to a search result page,
The category-specific common additional information adding device is:
Additional information storage means for storing the URL indicating the Web page, the common language included in common for each category to which the Web page belongs, and additional information related to the common language included in the Web page in association with each other. ,
The category-specific common additional information adding method extracts, for each category, the common word that appears at a predetermined frequency on a Web page stored in the Web page storage unit, and the category and the extracted common word A common word extraction step for storing
For each Web page stored in the Web page storage unit, corresponding information corresponding to the category to which the Web page belongs is extracted, and additional information related to the common word stored in the common word extraction step is extracted to indicate the Web page An additional information extraction step of storing the URL, the common word, and the additional information in the additional information storage means;
Corresponding to the URL indicating the Web page when the URL indicating the Web page stored in the additional information storage means is included in the search result page generated in response to receiving the search request from the user terminal An additional information adding step of extracting the common word and the additional information from the additional information storage means and adding them to the search result page;
A method of adding common additional information by category, comprising: transmitting the search result page to which the additional information is added in the additional information adding step to the user terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079328A JP5289498B2 (en) | 2011-03-31 | 2011-03-31 | Common additional information adding device by category and common additional information adding method by category |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079328A JP5289498B2 (en) | 2011-03-31 | 2011-03-31 | Common additional information adding device by category and common additional information adding method by category |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012215966A JP2012215966A (en) | 2012-11-08 |
JP5289498B2 true JP5289498B2 (en) | 2013-09-11 |
Family
ID=47268694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011079328A Active JP5289498B2 (en) | 2011-03-31 | 2011-03-31 | Common additional information adding device by category and common additional information adding method by category |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5289498B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001357029A (en) * | 2000-04-05 | 2001-12-26 | Fujitsu Ltd | Document preparing device |
JP2004030428A (en) * | 2002-06-27 | 2004-01-29 | Toshiba Corp | Device for supporting information service retrieval, and device, method and program for retrieving information service |
JP2005084291A (en) * | 2003-09-08 | 2005-03-31 | Alpine Electronics Inc | Electronic apparatus equipped with map name search function, and map name search method |
JP2006227823A (en) * | 2005-02-16 | 2006-08-31 | Canon Inc | Information processor and its control method |
JP5132511B2 (en) * | 2008-10-08 | 2013-01-30 | ヤフー株式会社 | Search method using knowledge DB |
-
2011
- 2011-03-31 JP JP2011079328A patent/JP5289498B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012215966A (en) | 2012-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5497022B2 (en) | Proposal of resource locator from input string | |
US8898583B2 (en) | Systems and methods for providing information regarding semantic entities included in a page of content | |
US20170024424A1 (en) | Suggestive search engine | |
JP4991948B1 (en) | Information processing apparatus and information processing method | |
JP2010527494A (en) | Multilingual information search | |
JP2015525929A (en) | Weight-based stemming to improve search quality | |
JP5989170B2 (en) | Search result ranking apparatus and method using reliability of representative | |
JP2008186452A (en) | Retrieval system and retrieval method | |
CN102591965A (en) | Method and device for detecting black chain | |
US20150339387A1 (en) | Method of and system for furnishing a user of a client device with a network resource | |
US20130179832A1 (en) | Method and apparatus for displaying suggestions to a user of a software application | |
TW201305835A (en) | Information processing apparatus, information processing method, information processing program product, and storage medium having information processing program stored therein | |
JP5289498B2 (en) | Common additional information adding device by category and common additional information adding method by category | |
JP5870776B2 (en) | Link granting device, link granting method, and program | |
JP5084859B2 (en) | Information processing apparatus, data extraction method, and program | |
JP5386548B2 (en) | Soaring word extraction apparatus and method | |
KR100966211B1 (en) | Method and system for searching using search option layer | |
KR20110123027A (en) | Searching method using smart toolbar system | |
JP2008262442A (en) | Method for displaying retrieval key data, and server | |
JP5108707B2 (en) | Search server device, search method and program | |
JP2013003670A (en) | Retrieval server and method | |
JP5870815B2 (en) | Book information search device, book information search system, book information search method and program | |
JP2008165785A (en) | Retrieval system and method thereof | |
US20150169526A1 (en) | Heuristically determining key ebook terms for presentation of additional information related thereto | |
JP5414829B2 (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5289498 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |