JP2012212333A - Hot-word association apparatus and method - Google Patents

Hot-word association apparatus and method Download PDF

Info

Publication number
JP2012212333A
JP2012212333A JP2011077916A JP2011077916A JP2012212333A JP 2012212333 A JP2012212333 A JP 2012212333A JP 2011077916 A JP2011077916 A JP 2011077916A JP 2011077916 A JP2011077916 A JP 2011077916A JP 2012212333 A JP2012212333 A JP 2012212333A
Authority
JP
Japan
Prior art keywords
word
short
blog
short blog
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011077916A
Other languages
Japanese (ja)
Other versions
JP5269938B2 (en
Inventor
Toru Shimizu
徹 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2011077916A priority Critical patent/JP5269938B2/en
Publication of JP2012212333A publication Critical patent/JP2012212333A/en
Application granted granted Critical
Publication of JP5269938B2 publication Critical patent/JP5269938B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To associate hot-words with one another included in short blogs with limitation on the number of letters.SOLUTION: An hot-word association apparatus (1) includes hot-word extraction means (11) for extracting hot-words in a short blog service based on a change in a frequency of appearance of a word included in short blogs, short blog retrieval means (12) for retrieving short blogs which include a hot-word and a URL based on the extracted hot-word, and hot-word association means (13) for associating hot-words with one another included in multiple short blogs which include the same URL among the retrieved short blogs in order to associated hot-words with one another included in short blogs submitted in the short blog service.

Description

本発明は、ショートブログサービス内で投稿されたショートブログに含まれる急上昇ワード同士を関連付ける急上昇ワード関連付け装置及び方法に関する。   The present invention relates to an apparatus and a method for associating rapidly increasing words that associate rapidly increasing words included in a short blog posted within a short blog service.

近年、ユーザから現在の状況や雑記などを記載した短い文章の投稿を受け付け他のユーザに閲覧・返信させることで、ユーザ間でコミュニケーションを図るTWITTER(登録商標)などを代表とするショートブログサービスが頻繁に利用されている。   In recent years, there has been a short blog service represented by TWITTER (registered trademark) and the like that facilitates communication between users by accepting postings of short sentences describing the current situation and miscellaneous notes from users and allowing other users to browse and reply. It is used frequently.

例えば、TWITTERは、ユーザがつぶやいた独り言の文字列(ショートブログ)を通信ネットワークを介して受信して公衆に閲覧可能にするものであるが、所定のユーザのショートブログを更新のつど閲覧したり(フォロー)、あるユーザのショートブログに対して他のユーザがそれを引用して自らのショートブログとしたり(リツイート)、所定のユーザのショートブログに自らのコメントを追加して投稿したり(クオートツイート)することもできる(非特許文献1)。
このように、TWITTERを代表とするショートブログでは、様々な形態での応答が発展することにより、あたかも大勢で会話しているかのような感覚を与えることができる。
For example, TWITTER receives a tweeted word string (short blog) tweeted by a user via a communication network so that it can be viewed by the public. (Follow), another user quotes a short blog of one user and makes it a short blog of his own (retweet), adds his own comment to a given user's short blog (quotes) (Non-patent document 1).
Thus, in a short blog represented by TWITTER, it is possible to give a feeling as if a large number of conversations are made by developing responses in various forms.

ツイッター完全活用術、日本、アスキー・メディアワークス、2010年2月26日、8〜9頁Twitter full use technique, Japan, ASCII Media Works, February 26, 2010, 8-9 pages

ここで、ショートブログを代表とするネットワーク上のコミュニケーションでは、バズワード(流行語)といわれる一時的に多くのユーザに用いられる急上昇ワードが発生する。このような急上昇ワードは、日常生活で生じた出来事に対して一時的に使用頻度が上昇した結果として発生することがあり、例えば、企業が新製品を発表し、この企業や新製品に対する多数のショートブログが投稿された場合には、企業名や新製品名などが急上昇ワードとなることがある。
ネットワーク上の急上昇ワードを含むショートブログは、多くのユーザが注目し閲覧を望むものであるため、多数のショートブログの中からこのような急上昇ワードを含むショートブログを適切に取り出すことのできる方法が求められる。
Here, in communication on a network represented by a short blog, a soaring word that is temporarily used by many users, called a buzzword (buzzword), is generated. Such spikes may occur as a result of a temporary increase in usage frequency for events that occur in daily life, for example, when a company announces a new product and a large number of such companies or new products When a short blog is posted, the company name, new product name, etc. may become a sudden rise word.
Short blogs containing soaring words on the network are what many users want to see and browse, so there is a need for a method that can appropriately pick out short blogs containing such soaring words from among many short blogs. .

ところで、ショートブログサービス上で投稿されるショートブログには文字数制限があるため、同一の出来事に対して投稿したショートブログであっても、投稿したユーザによって用いる単語が異なる場合がある。例えば、あるユーザは「○○社が新製品を発表しました」といった企業名を明記し新製品名を明記しないショートブログを投稿する一方で、他のユーザは「新製品××が発表されました」といった企業名を明記せず新製品名を明記するショートブログを投稿する場合がある。   By the way, since the short blog posted on the short blog service has a limit on the number of characters, even a short blog posted for the same event may use different words depending on the posted user. For example, while a user posts a short blog that clearly states the company name, such as “XX Company has announced a new product” and does not specify a new product name, another user says “New Product XX has been announced. In some cases, a short blog that specifies the name of the new product without posting the name of the company is posted.

このとき、「○○社」と「新製品××」とは、本来密接に関連する単語同士であるため、多数のショートブログの中から急上昇ワードを含むショートブログを取り出す際には、このような急上昇ワード同士の関連性を考慮した上でショートブログを取り出すことが求められる。   At this time, “XX Company” and “New Product XX” are inherently closely related words, so when taking out a short blog containing a rapidly rising word from many short blogs, It is required to take out short blogs in consideration of the relationship between the soaring words.

本発明はこのような要望に鑑みてなされたものであり、文字数制限のあるショートブログに含まれる急上昇ワード同士の関連性を適切に把握することを目的とする。   The present invention has been made in view of such a demand, and an object of the present invention is to appropriately grasp the relevance between rapidly increasing words included in a short blog with a limited number of characters.

本発明者は、急上昇ワードを含むショートブログが引用するWebページ(URL)に基づいて急上昇ワード同士を結びつけることで、本発明を完成するに至った。   The inventor of the present invention has completed the present invention by connecting the rapidly rising words based on a Web page (URL) quoted by a short blog including the rapidly rising word.

(1) ショートブログサービス内で投稿されたショートブログに含まれる急上昇ワード同士を関連付ける急上昇ワード関連付け装置であって、投稿されたショートブログを記憶したショートブログデータベースを参照して、当該ショートブログに含まれる単語の出現頻度の変化に基づいてショートブログサービス内における急上昇ワードを抽出する急上昇ワード抽出手段と、抽出した前記急上昇ワードに基づいて前記ショートブログデータベースを参照して、前記急上昇ワード及びURLを含む前記ショートブログを検索するショートブログ検索手段と、検索した前記ショートブログのうち、同一の前記URLを含む複数のショートブログに含まれる前記急上昇ワード同士を関連付けて関連付けデータベースに記憶する急上昇ワード関連付け手段と、を備える急上昇ワード関連付け装置。   (1) A rapidly increasing word associating device for associating rapidly increasing words included in a short blog posted within the short blog service, and included in the short blog by referring to a short blog database storing the posted short blogs. A spike word extraction means for extracting a spike word in the short blog service based on a change in the frequency of appearance of the word, and the short blog database based on the extracted spike word and including the spike word and URL Short blog search means for searching for the short blog, and among the searched short blogs, the spike word association associated with the spike words included in a plurality of short blogs including the same URL and stored in the association database Trending associated apparatus comprising a means.

(1)の急上昇ワード関連付け装置によれば、急上昇ワード関連付け手段は、同一のURLを含む複数のショートブログに含まれる急上昇ワード同士を関連付ける。
ここで、同一のURL(Webページ)を含む複数のショートブログは、それぞれ同一の出来事に対して投稿されているものであるため、このような複数のショートブログのそれぞれで使用されている急上昇ワード同士は各々関連するものと捉えることができる。そのため、本発明によれば、ユーザによって用いる急上昇ワードが異なる場合であっても、それぞれの急上昇ワードを適切に関連付けることができる。
According to the rapidly rising word associating device of (1), the rapidly rising word associating means associates the rapidly rising words included in a plurality of short blogs including the same URL.
Here, since a plurality of short blogs including the same URL (Web page) are posted for the same event, the rapidly increasing word used in each of the plurality of short blogs. Each other can be regarded as related. Therefore, according to the present invention, even if the sudden rise words used by the users are different, it is possible to appropriately associate the sudden rise words.

(2) ユーザ端末から前記急上昇ワードを指定したショートブログの検索要求を受け付ける検索要求受付手段と、受け付けた前記急上昇ワードに基づいて前記関連付けデータベースを参照して、受け付けた前記急上昇ワードに関連する他の急上昇ワードを抽出して前記ユーザ端末に提案するために送信するサジェスト手段と、を備える(1)に記載の急上昇ワード関連付け装置。   (2) Search request accepting means for accepting a search request for a short blog designating the sudden rise word from the user terminal, and other related to the accepted sudden rise word by referring to the association database based on the accepted sudden rise word And a suggestion means for extracting the word and sending it for proposal to the user terminal.

(2)の急上昇ワード関連付け装置によれば、ユーザ端末から受け付けた急上昇ワードと関連する急上昇ワード、すなわち、同じ出来事に対して用いる急上昇ワードをユーザ端末に提案する。これにより、ユーザは、多くのユーザにより注目されている出来事に対して投稿されたショートブログを漏れなく取得することができる。   According to the surge word associating device of (2), the surge word related to the spike word received from the user terminal, that is, the spike word used for the same event is proposed to the user terminal. Thereby, the user can acquire the short blog posted with respect to the event attracting attention by many users without omission.

(3) 前記ショートブログ検索手段が検索した前記ショートブログに含まれる前記URLのそれぞれにより特定されるWebページ同士の類似度を判定するページ類似度判定手段、を備え、前記急上昇ワード関連付け手段は、所定の類似度以上の前記Webページを特定する前記URLをそれぞれ含むショートブログに含まれる前記急上昇ワード同士を関連付けて前記関連付けデータベースに記憶する、(1)又は(2)に記載の急上昇ワード関連付け装置。   (3) a page similarity determination unit that determines a similarity between Web pages specified by each of the URLs included in the short blog searched by the short blog search unit, and the rapidly rising word association unit includes: The rapidly increasing word associating device according to (1) or (2), wherein the rapidly increasing words included in a short blog each including the URL specifying the Web page having a predetermined similarity or higher are associated and stored in the association database .

ネットワーク上には無数のWebページが存在するため、同一の出来事を記載する複数のWebページが存在する場合がある。すなわち、ある出来事に対する新聞社Aの記事からなるWebページの他に、同一の出来事に対する新聞社Bの記事からなるWebページが存在する場合がある。このようなWebページは、それぞれURLが異なるものであるが同一の出来事に対するものであるため、急上昇ワードの関連付けの際に考慮することが好ましい。
(3)の急上昇ワード関連付け装置によれば、同一のURLだけでなく、Webページの内容が類似するURLも用いて、急上昇ワード同士を結びつけるため、関連付けの範囲(カバレッジ)を適切に管理することができ、急上昇ワードの関連付けを適切に行うことができる。
Since there are innumerable Web pages on the network, there may be a plurality of Web pages describing the same event. That is, there may be a Web page consisting of an article of newspaper company B for the same event in addition to a Web page consisting of an article of newspaper company A for an event. Such Web pages have different URLs but are related to the same event, so it is preferable to consider them when associating soaring words.
According to the rapidly increasing word associating device of (3), not only the same URL but also URLs with similar Web page contents are used to link the rapidly increasing words, so that the association range (coverage) is appropriately managed. And the association of the soaring word can be performed appropriately.

(4) 前記ショートブログ検索手段は、前記急上昇ワード及び前記URLを含む前記ショートブログの検索時において、前記急上昇ワードに基づく検索スコアを算出し、前記急上昇ワード関連付け手段は、所定の検索スコア以上の前記ショートブログに含まれる前記URLをそれぞれ含むショートブログに含まれる前記急上昇ワード同士を関連付けて前記関連付けデータベースに記憶する、(1)から(3)のいずれかに記載の急上昇ワード関連付け装置。   (4) The short blog search means calculates a search score based on the sudden rise word when searching for the short blog including the sudden rise word and the URL, and the sudden rise word association means has a predetermined search score or more. The rapidly increasing word associating device according to any one of (1) to (3), wherein the rapidly increasing words included in the short blog each including the URL included in the short blog are associated and stored in the association database.

(4)の急上昇ワード関連付け装置によれば、急上昇ワードに基づく検索の検索スコアが高いショートブログが引用する複数のURL(Webページ)同士をそれぞれ関連するものと捉え、当該URLを含むショートブログに含まれる急上昇ワード同士を関連付ける。これにより、関連付けの範囲(カバレッジ)を更に広げることができ、急上昇ワードの関連付けを適切に行うことができる。   According to the rapidly increasing word associating device of (4), a plurality of URLs (Web pages) cited by short blogs having a high search score based on the rapidly increasing word are regarded as being related to each other, and the short blog including the URL is regarded as related. Associate the included spikes. Thereby, the range (coverage) of association can be further expanded, and the association of the rapidly rising words can be performed appropriately.

(5) コンピュータが実行する、ショートブログサービス内で投稿されたショートブログに含まれる急上昇ワード同士を関連付ける方法であって、投稿されたショートブログを記憶したショートブログデータベースを参照して、当該ショートブログに含まれる単語の出現頻度の変化に基づいてショートブログサービス内における急上昇ワードを抽出するステップと、抽出した前記急上昇ワードに基づいて前記ショートブログデータベースを参照して、前記急上昇ワード及びURLを含む前記ショートブログを検索するステップと、検索した前記ショートブログのうち、同一の前記URLを含む複数のショートブログに含まれる前記急上昇ワード同士を関連付けて関連付けデータベースに記憶するステップと、を含む方法。   (5) A method of associating rapidly increasing words included in a short blog posted in a short blog service executed by a computer, referring to the short blog database storing the posted short blogs, and A step of extracting a sudden rise word in a short blog service based on a change in appearance frequency of a word included in the word, and referring to the short blog database based on the extracted sudden rise word, including the sudden rise word and URL A method comprising: searching for a short blog; and associating the rapidly increasing words included in a plurality of short blogs including the same URL among the searched short blogs and storing them in an association database.

(5)の方法によれば、(1)の急上昇ワード関連付け装置と同様の効果を奏する。   According to the method (5), the same effect as that of the surge word association device (1) can be obtained.

本発明によれば、文字数制限のあるショートブログに含まれる急上昇ワード同士を関連付けることができる。   According to the present invention, it is possible to associate rapidly increasing words included in a short blog with a limited number of characters.

第1実施形態の急上昇ワード関連付け装置の機能構成を示す図である。It is a figure which shows the function structure of the sudden rise word correlation apparatus of 1st Embodiment. ショートブログデータベースを示す図である。It is a figure which shows a short blog database. 急上昇ワード抽出手段により抽出された急上昇ワードを示す図である。It is a figure which shows the sudden rise word extracted by the sudden rise word extraction means. 関連付けデータベースを示す図である。It is a figure which shows an association database. 第1実施形態の急上昇ワード関連付け装置の動作を示す図である。It is a figure which shows operation | movement of the soaring word correlation apparatus of 1st Embodiment. 第1実施形態の急上昇ワード関連付け装置の動作を示す図である。It is a figure which shows operation | movement of the soaring word correlation apparatus of 1st Embodiment. 第1実施形態の急上昇ワード関連付け装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the rapid increase word correlation apparatus of 1st Embodiment. 第1実施形態の急上昇ワード関連付け装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the rapid increase word correlation apparatus of 1st Embodiment. 第2実施形態の急上昇ワード関連付け装置の機能構成を示す図である。It is a figure which shows the function structure of the sudden rise word correlation apparatus of 2nd Embodiment. 第2実施形態の急上昇ワード関連付け装置の動作を示す図である。It is a figure which shows operation | movement of the soaring word correlation apparatus of 2nd Embodiment. 第3実施形態の急上昇ワード関連付け装置の動作を示す図である。It is a figure which shows operation | movement of the soaring word correlation apparatus of 3rd Embodiment.

[第1実施形態]
初めに、図1〜図7を参照して、第1実施形態の急上昇ワード関連付け装置1について説明する。
[First Embodiment]
First, with reference to FIG. 1 to FIG. 7, a rapidly increasing word associating apparatus 1 according to the first embodiment will be described.

[急上昇ワード関連付け装置1の構成]
図1を参照して、本発明の急上昇ワード関連付け装置1の構成について説明する。
急上昇ワード関連付け装置1は、ショートブログサービス内における急上昇ワードの関連性を把握し、ユーザに対してショートブログを漏れなく検索させるため、関連付け部10と、サジェスト部20と、を含んで構成される。
[Configuration of the soaring word association device 1]
With reference to FIG. 1, the structure of the rapidly increasing word correlation apparatus 1 of this invention is demonstrated.
The soaring word associating apparatus 1 includes an associating unit 10 and a suggesting unit 20 in order to grasp the relevance of the soaring word in the short blog service and to allow the user to search the short blog without omission. .

[関連付け部10]
関連付け部10は、ショートブログサービス内で使用された急上昇ワード同士を関連付けるために、急上昇ワード抽出手段11と、ショートブログ検索手段12と、急上昇ワード関連付け手段13と、ショートブログデータベース14と、関連付けデータベース15と、を含む。
[Association unit 10]
The associating unit 10 associates the rapidly rising words used in the short blog service with each other, the rapidly rising word extracting means 11, the short blog searching means 12, the rapidly rising word associating means 13, the short blog database 14, and the association database. 15 and so on.

急上昇ワード抽出手段11は、所定のタイミングでショートブログデータベース14にアクセスし、ショートブログサービス内で投稿されたショートブログに含まれる単語の出現頻度(出現回数)の変化に基づいて急上昇ワードを抽出する。ここで、「急上昇ワード」とは、ショートブログサービス内で投稿されたショートブログに含まれる単語のうち、出現頻度が急上昇した単語をいう。なお、急上昇とされる上昇率については、任意に設定することができ、一例としては、前日に対して出現頻度が10倍以上となった場合に急上昇したとすることができる。
また、急上昇ワードの抽出は、これまで知られている周知の方法を用いることができる。一例としては、急上昇ワード抽出手段11は、ショートブログのテキスト情報を形態素解析し、解析した形態素を所定の辞書に基づき連結することでショートブログから単語を抽出する。そして、急上昇ワード抽出手段11は、抽出した単語の出現頻度(出現回数)を計数することで、急上昇ワードを抽出することができる。
The rapidly increasing word extracting means 11 accesses the short blog database 14 at a predetermined timing, and extracts a rapidly increasing word based on the change in the appearance frequency (number of appearances) of words included in the short blog posted in the short blog service. . Here, the “rapidly rising word” refers to a word whose appearance frequency has rapidly increased among words included in a short blog posted within the short blog service. It should be noted that the rate of increase that is assumed to rise rapidly can be set arbitrarily, and as an example, it can be assumed that the rate of increase has increased rapidly when the appearance frequency is 10 times or more that of the previous day.
In addition, a well-known method that has been known so far can be used to extract the rapidly increasing word. As an example, the rapidly rising word extracting unit 11 performs morphological analysis on the text information of the short blog, and extracts words from the short blog by connecting the analyzed morphemes based on a predetermined dictionary. And the sudden rise word extraction means 11 can extract the sudden rise word by counting the appearance frequency (number of appearances) of the extracted word.

ここで、ショートブログデータベース14は、図2に示すように、ショートブログサービス内でユーザにより投稿されたショートブログを記憶する。ショートブログは、文字数制限(例えば、140文字以内)のあるテキスト情報を含み、このテキスト情報には、ユーザが作成したコメントに加え、Webページの所在を示すURLが含まれる場合がある。ショートブログに含まれるURLは、ユーザが作成したコメントに関連する情報であることが一般的である。例えば、ショートブログID「200」のショートブログは、「URL1」のWebページを引用してユーザが「○○花子が、ショック」というコメントを作成したショートブログである。   Here, as shown in FIG. 2, the short blog database 14 stores short blogs posted by users within the short blog service. The short blog includes text information with a character limit (for example, within 140 characters), and this text information may include a URL indicating the location of the Web page in addition to a comment created by the user. The URL included in the short blog is generally information related to a comment created by the user. For example, a short blog with a short blog ID “200” is a short blog in which a user creates a comment “Hanako is a shock” by quoting a Web page of “URL1”.

本実施形態では、急上昇ワード抽出手段11は、図2に示すショートブログデータベース14に記憶されたショートブログから、図3に示す急上昇ワードを抽出している。
なお、急上昇ワード抽出手段11は、出現頻度の変化だけでなく、出現頻度自体も考慮して急上昇ワードを抽出することとしてもよい。すなわち、単語の出現頻度自体が少ない場合には、出現頻度が急上昇していたとしても急上昇ワードとして抽出しないこととしてもよい。
In the present embodiment, the sudden rise word extraction means 11 extracts the sudden rise word shown in FIG. 3 from the short blog stored in the short blog database 14 shown in FIG.
The sudden rise word extracting means 11 may extract the sudden rise word in consideration of not only the change in the appearance frequency but also the appearance frequency itself. That is, when the appearance frequency of the word itself is small, it may not be extracted as a sudden rise word even if the appearance frequency has risen sharply.

図1に戻り、ショートブログ検索手段12は、急上昇ワード抽出手段11により抽出された急上昇ワードに基づいてショートブログデータベース14を検索し、当該急上昇ワードを含み、かつ、URLを含むショートブログを検索する。
図2及び図3を参照して、急上昇ワードID「300」の「○○花子」に基づいてショートブログデータベース14を検索した場合、ショートブログID「200」及び「203」のショートブログは、急上昇ワード「○○花子」を含み、かつ、「URL1」を含むため、当該検索にヒットする。一方、ショートブログID「204」のショートブログについては、急上昇ワード「○○花子」を含むが、URLを含まないため、当該検索にヒットしない。
Returning to FIG. 1, the short blog search means 12 searches the short blog database 14 based on the sudden rise word extracted by the sudden rise word extraction means 11, and searches for a short blog including the sudden rise word and including the URL. .
Referring to FIG. 2 and FIG. 3, when the short blog database 14 is searched based on “XX Hanako” with the rapidly increasing word ID “300”, the short blogs with the short blog ID “200” and “203” are rapidly increasing. Since the word “Hanako” is included and “URL1” is included, the search is hit. On the other hand, the short blog with the short blog ID “204” includes the rapidly rising word “Hanako”, but does not include the URL, and therefore does not hit the search.

急上昇ワード関連付け手段13は、ショートブログ検索手段12により検索されたショートブログのうち、同一のURLを含む複数のショートブログに含まれる急上昇ワード同士を関連付ける。すなわち、急上昇ワード関連付け手段13は、同一のWebページ(URL)を引用する複数のショートブログのそれぞれに含まれる急上昇ワード同士を関連付ける。図2を参照して、ショートブログID「200」のショートブログとショートブログID「201」のショートブログとは、同一のWebページ(URL1)を引用している。そのため、急上昇ワード関連付け手段13は、ショートブログID「200」に含まれる急上昇ワード「○○花子」とショートブログID「201」に含まれる急上昇ワード「××投手」とを関連付ける。なお、所定の急上昇ワードを含む複数のショートブログのうち、同一のWebページ(URL)を引用するショートブログの数が所定数以上となった場合に、当該ショートブログに含まれる当該急上昇ワード同士の関連付けを行うこととしてもよい。   The rapidly increasing word associating means 13 associates rapidly increasing words included in a plurality of short blogs including the same URL among the short blogs searched by the short blog searching means 12. That is, the rapidly increasing word associating unit 13 associates the rapidly increasing words included in each of the plurality of short blogs that cite the same Web page (URL). Referring to FIG. 2, the short blog with short blog ID “200” and the short blog with short blog ID “201” refer to the same Web page (URL1). Therefore, the rapidly rising word associating unit 13 associates the rapidly rising word “XX Hanako” included in the short blog ID “200” with the rapidly rising word “XX pitcher” included in the short blog ID “201”. In addition, when the number of short blogs quoting the same Web page (URL) among a plurality of short blogs including a predetermined rapid increase word exceeds a predetermined number, the rapid increase words included in the short blog The association may be performed.

関連付けデータベース15は、急上昇ワード関連付け手段13が関連付けた急上昇ワードを記憶する。このとき、関連付けデータベース15は、図4に示すように、関連付けに用いたURL(共起URL)に対応付けて、関連付けられた急上昇ワードを記憶する。図4を参照すると、「URL1」に基づいて「○○花子」「ABCグループ」「××投手」の急上昇ワードが関連付けられている。   The association database 15 stores the sudden rise words associated by the sudden rise word association means 13. At this time, as shown in FIG. 4, the association database 15 stores the associated rapidly rising words in association with the URL (co-occurrence URL) used for the association. Referring to FIG. 4, the rapidly rising words “XX Hanako”, “ABC group”, and “XX pitcher” are associated with each other based on “URL1”.

[サジェスト部20]
サジェスト部20は、ユーザ端末100と通信可能に接続され、ユーザ端末100から受け付けた検索クエリに関連する急上昇ワードを提案するため、検索要求受付手段21と、サジェスト手段22と、を含む。
[Suggest 20]
The suggestion unit 20 is communicably connected to the user terminal 100, and includes a search request accepting unit 21 and a suggestion unit 22 in order to propose a rapidly increasing word related to the search query received from the user terminal 100.

検索要求受付手段21は、ユーザ端末100から検索クエリを指定したショートブログの検索要求を受け付ける。
サジェスト手段22は、検索要求受付手段21が受け付けた検索クエリが急上昇ワードであるか否かを判定し、急上昇ワードである場合には、関連付けデータベース15を参照して、当該急上昇ワードに関連する他の急上昇ワードをユーザ端末100に提案するために、当該他の急上昇ワードを送信する。
The search request receiving unit 21 receives a short blog search request specifying a search query from the user terminal 100.
The suggesting unit 22 determines whether or not the search query received by the search request receiving unit 21 is a sudden rise word. If the search query is a sudden rise word, the suggestion unit 22 refers to the association database 15 and relates to the other words related to the sudden rise word. In order to propose the other spike word to the user terminal 100, the other spike word is transmitted.

[急上昇ワード関連付け装置1の動作]
続いて、図5及び図6を参照して、急上昇ワード関連付け装置1の動作について説明する。
[Operation of the soaring word association device 1]
Next, with reference to FIG. 5 and FIG. 6, the operation of the rapidly increasing word association apparatus 1 will be described.

図5(1)を参照して、急上昇ワード抽出手段11は、ショートブログデータベース14に記憶されたショートブログから急上昇ワードを抽出する。図5(1)では、急上昇ワードとして「○○花子」「ABCグループ」「××投手」などの急上昇ワードが抽出されている。   With reference to FIG. 5 (1), the sudden rise word extracting means 11 extracts the sudden rise word from the short blog stored in the short blog database 14. In FIG. 5 (1), ascending words such as “XX Hanako”, “ABC group”, and “XX pitcher” are extracted.

図5(2)を参照して、ショートブログ検索手段12は、抽出した急上昇ワードに基づいてショートブログデータベース14を検索し、当該急上昇ワードを含み、かつ、URLを含むショートブログを検索する。その結果、図5(2)に示すように、検索に用いた急上昇ワード毎に検索にヒットしたURLが取得される。   Referring to FIG. 5 (2), the short blog search means 12 searches the short blog database 14 based on the extracted sudden increase word, and searches for a short blog including the URL and including the URL. As a result, as shown in FIG. 5 (2), the URL hit in the search is acquired for each rapidly increasing word used in the search.

図5(3)を参照して、急上昇ワード関連付け手段13は、ショートブログ検索手段12の検索結果に基づいて、同一のURLを含む複数のショートブログに含まれる急上昇ワード同士を関連付ける。具体的には、急上昇ワード関連付け手段13は、検索結果として取得されたURL毎に検索に用いた急上昇ワードをまとめる(URLでソートする)ことで、急上昇ワード同士を関連付ける。その結果、図5(3)に示すように、「○○花子」「ABCグループ」「××投手」といった急上昇ワードが「URL1」に基づいて関連付けられる。   With reference to FIG. 5 (3), the rapidly increasing word associating means 13 associates rapidly increasing words included in a plurality of short blogs including the same URL based on the search result of the short blog searching means 12. Specifically, the rapidly increasing word associating unit 13 associates the rapidly increasing words by collecting the rapidly increasing words used for the search for each URL acquired as the search result (sorting by URL). As a result, as shown in FIG. 5 (3), the rapidly increasing words such as “Hanako XX”, “ABC group”, and “XX pitcher” are associated based on “URL1”.

このように関連付けられた急上昇ワードは、同一のWebページ(URL)を引用する複数のショートブログに含まれていたものであるため、各々関連する。これにより、同一の出来事(Webページ)に対して投稿されたショートブログにおいて、文字数制限があるためにユーザによって用いる急上昇ワードが異なる場合であっても、それぞれの急上昇ワードを適切に関連付けることができる。   The soaring words associated in this way are included in a plurality of short blogs that cite the same Web page (URL), and thus are associated with each other. As a result, in the short blog posted for the same event (Web page), even if the surge word used by the user is different due to the limitation on the number of characters, each of the surge words can be appropriately associated. .

続いて、図6(4)(5)を参照して、検索要求受付手段21がユーザ端末100から検索クエリを指定した検索要求を受け付けると、サジェスト手段22は、当該検索クエリが急上昇ワードであるか判定する。そして、検索クエリが急上昇ワードである場合には、当該急上昇ワードに関連する他の急上昇ワードをユーザ端末100に対して提案する。図6(4)(5)では、ユーザ端末100から検索クエリ「○○花子」を受け付けており、この「○○花子」が急上昇ワードであるため、「ABCグループ」「××投手」といった「○○花子」に関連する他の急上昇ワードが提案されている。   Subsequently, referring to FIGS. 6 (4) and 6 (5), when the search request receiving unit 21 receives a search request specifying a search query from the user terminal 100, the suggestion unit 22 indicates that the search query is a rapidly increasing word. To determine. If the search query is a sudden rise word, another sudden rise word related to the sudden rise word is proposed to the user terminal 100. 6 (4) and 5 (5), since the search query “XX Hanako” is received from the user terminal 100, and this “XX Hanako” is a rapidly increasing word, “ABC group”, “XX pitcher”, etc. Other soaring words related to “Hanako” have been proposed.

これにより、ユーザ端末100から急上昇ワードを指定する検索要求を受け付けた場合に、同じ出来事(Webページ)に対して他の急上昇ワードを用いて作成されたショートブログを、ユーザに検索させることができる。その結果、検索を行うユーザは、多くのユーザに注目されている出来事に対して投稿された様々なショートブログを漏れなく取得することができる。   Thereby, when a search request for designating a sudden rise word is received from the user terminal 100, the user can search for a short blog created using another sudden rise word for the same event (Web page). . As a result, the user who performs the search can obtain various short blogs posted for events that are attracting attention by many users without omission.

[急上昇ワード関連付け装置1のハードウェア構成]
以上説明した急上昇ワード関連付け装置1のハードウェアは、1又は複数の一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部として、中央処理装置(CPU)を備える他、記憶部として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVDなど)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイなどの各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボールなど)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、急上昇ワード関連付け装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
[Hardware Configuration of Rapidly Increasing Word Association Device 1]
The hardware of the soaring word association apparatus 1 described above can be configured by one or a plurality of general computers. For example, a general computer includes a central processing unit (CPU) as a control unit, and a memory (RAM, ROM), a hard disk (HDD), and an optical disk (CD, DVD, etc.) as a storage unit, and a network communication device. Various wired and wireless LAN devices as display devices, for example, various displays such as liquid crystal displays and plasma displays, and as input devices, for example, keyboards and pointing devices (mouse, tracking ball, etc.) Are connected by a bus line. In such a general computer, the CPU comprehensively controls the soaring word associating device 1 and reads and executes various programs as appropriate, thereby cooperating with the hardware described above and various functions according to the present invention. Is realized.

[急上昇ワード関連付け装置1の処理]
続いて、図7及び図8を参照して、本発明の急上昇ワード関連付け装置1の処理について説明する。
[Processing of the soaring word association device 1]
Next, with reference to FIG. 7 and FIG. 8, processing of the sudden rise word association device 1 of the present invention will be described.

[関連付け処理]
初めに、図7を参照して、急上昇ワード同士を関連付ける関連付け処理について説明する。
[Association]
First, an association process for associating rapidly increasing words will be described with reference to FIG.

S1:急上昇ワード抽出手段11は、所定のタイミングでショートブログデータベース14にアクセスし、ショートブログサービス内で投稿されたショートブログに含まれる単語の出現頻度(出現回数)の変化に基づいて急上昇ワードを抽出する。
S2:続いて、ショートブログ検索手段12は、S1で抽出した急上昇ワードに基づいてショートブログデータベース14を検索し、当該急上昇ワードを含み、かつ、URLを含むショートブログを検索する。
S3:続いて、急上昇ワード関連付け手段13は、同一のWebページ(URL)を引用する複数のショートブログのそれぞれに含まれる急上昇ワード同士を関連付ける。すなわち、急上昇ワード関連付け手段13は、S2の検索結果として取得したURL(共起URL)が共通する急上昇ワード同士を関連付ける。その後、急上昇ワード関連付け手段13は、関連付けた急上昇ワードを関連付けデータベース15に記憶し、関連付け処理を終了する。
S1: The rapidly increasing word extracting means 11 accesses the short blog database 14 at a predetermined timing, and determines a rapidly increasing word based on the change in the appearance frequency (number of appearances) of words included in the short blog posted within the short blog service. Extract.
S2: Subsequently, the short blog search means 12 searches the short blog database 14 based on the rapidly increasing word extracted in S1, and searches for the short blog including the URL and including the URL.
S3: Subsequently, the rapidly increasing word associating unit 13 associates the rapidly increasing words included in each of the plurality of short blogs that cite the same Web page (URL). That is, the rapidly increasing word associating unit 13 associates the rapidly increasing words having the same URL (co-occurrence URL) acquired as the search result of S2. Thereafter, the sudden rise word association means 13 stores the associated sudden rise word in the association database 15 and ends the association process.

[サジェスト処理]
続いて、図8を参照して、ユーザ端末100から受け付けた検索クエリに関連する急上昇ワードを提案するサジェスト処理について説明する。
[Suggest processing]
Next, with reference to FIG. 8, a suggestion process for proposing a rapidly rising word related to a search query received from the user terminal 100 will be described.

S11:検索要求受付手段21は、ユーザ端末100から検索クエリを受け付ける。
S12:続いて、サジェスト手段22は、S11で受け付けた検索クエリが急上昇ワードであるか否かを判定する。このとき、S11で受け付けた検索クエリが急上昇ワードでない場合には、処理を終了する。
S13:他方、S11で受け付けた検索クエリが急上昇ワードである場合には、サジェスト手段22は、関連付けデータベース15を参照して、当該急上昇ワードに関連付けられた他の急上昇ワードをユーザ端末100に対して提案する。
S11: The search request receiving unit 21 receives a search query from the user terminal 100.
S12: Subsequently, the suggestion unit 22 determines whether or not the search query received in S11 is a rapidly increasing word. At this time, if the search query accepted in S11 is not a rapidly increasing word, the process is terminated.
S13: On the other hand, when the search query received in S11 is a sudden rise word, the suggestion unit 22 refers to the association database 15 and sends another sudden rise word associated with the sudden rise word to the user terminal 100. suggest.

[急上昇ワード関連付け装置1の効果]
以上のような急上昇ワード関連付け装置1によれば、ショートブログが引用するWebページ(URL)に基づいて急上昇ワード同士を関連付けるため、同一の出来事に対して用いられる急上昇ワードを適切に関連付けることができる。
そして、ユーザ端末100から急上昇ワードを指定する検索要求を受け付けた場合に、この関連性に基づいて他の急上昇ワードを提案するため、同じ出来事(Webページ)に対して検索要求の急上昇ワードとは異なる急上昇ワードを用いていたショートブログであってもユーザに検索させることができる。その結果、検索を行うユーザは、多くのユーザに注目されている出来事に対して投稿された様々なショートブログを漏れなく取得することができる。
[Effect of soaring word association device 1]
According to the soaring word associating device 1 as described above, since soaring words are associated with each other based on the Web page (URL) quoted by the short blog, it is possible to appropriately associate the soaring words used for the same event. .
When a search request for specifying a sudden rise word is received from the user terminal 100, another sudden rise word is proposed based on this relevance. Therefore, what is a sudden rise word in a search request for the same event (Web page)? Even a short blog that uses different soaring words can be made to search by the user. As a result, the user who performs the search can obtain various short blogs posted for events that are attracting attention by many users without omission.

[変形実施形態]
以上、第1実施形態の急上昇ワード関連付け装置1について説明した。第1実施形態の急上昇ワード関連付け装置1では、同一のURLであるか否かにより急上昇ワード同士を関連付けていたが、急上昇ワード同士を関連付ける範囲については、同一のURLに限らず、以下の第2実施形態及び第3実施形態のような範囲とすることができる。すなわち、以下に示す第2実施形態及び第3実施形態では、急上昇ワード同士を関連付ける範囲が第1実施形態とは異なる。
なお、以下において、第1実施形態と同様の構成については、同一の符号を付し、説明を省略又は簡略化する。
[Modified Embodiment]
In the above, the sudden rise word correlation apparatus 1 of 1st Embodiment was demonstrated. In the rapidly increasing word associating apparatus 1 of the first embodiment, the rapidly increasing words are associated with each other depending on whether or not they are the same URL. However, the range for associating the rapidly increasing words is not limited to the same URL, and the following second The range can be as in the embodiment and the third embodiment. That is, in the second embodiment and the third embodiment described below, the range for associating rapidly rising words is different from that in the first embodiment.
In the following description, the same components as those in the first embodiment are denoted by the same reference numerals, and description thereof is omitted or simplified.

[第2実施形態]
図9及び図10を参照して、第2実施形態の急上昇ワード関連付け装置1Aについて説明する。第2実施形態の急上昇ワード関連付け装置1Aでは、類似するWebページ(URL)にまで急上昇ワード同士を関連付ける範囲を拡大している。
ここで、ネットワーク上には無数のWebページが存在するため、同一の出来事を記載する複数のWebページが存在する場合がある。すなわち、ある出来事に対する新聞社Aの記事からなるWebページの他に、同一の出来事に対する新聞社Bの記事からなるWebページが存在する場合がある。このようなWebページは、それぞれURLが異なるものであるが同一の出来事に対するものであるため、第2実施形態の急上昇ワード関連付け装置1Aでは、Webページの類似度も考慮した上で急上昇ワードを関連付ける。
[Second Embodiment]
With reference to FIG.9 and FIG.10, 1 A of sudden rise word correlation apparatuses of 2nd Embodiment are demonstrated. In the rapidly rising word associating apparatus 1A of the second embodiment, the range for associating rapidly rising words to similar Web pages (URLs) is expanded.
Here, since there are innumerable Web pages on the network, there may be a plurality of Web pages describing the same event. That is, there may be a Web page consisting of an article of newspaper company B for the same event in addition to a Web page consisting of an article of newspaper company A for an event. Since such Web pages have different URLs but are for the same event, the rapidly increasing word associating apparatus 1A of the second embodiment associates the rapidly increasing words in consideration of the similarity of the Web pages. .

[急上昇ワード関連付け装置1Aの構成]
初めに、図9を参照して、第2実施形態の急上昇ワード関連付け装置1Aの構成について説明する。第2実施形態の急上昇ワード関連付け装置1Aは、急上昇ワードを関連付ける範囲を類似するWebページ(URL)にまで拡大するため、第1実施形態の急上昇ワード関連付け装置1の構成に加えて更にページ類似度判定手段16Aを備える。
[Configuration of Rapidly Increasing Word Association Device 1A]
First, with reference to FIG. 9, the configuration of the rapidly increasing word associating apparatus 1A of the second embodiment will be described. In order to expand the range for associating the rapidly rising word to a similar Web page (URL), the rapidly increasing word associating apparatus 1A of the second embodiment further includes the page similarity in addition to the configuration of the rapidly increasing word associating apparatus 1 of the first embodiment. A determination unit 16A is provided.

ページ類似度判定手段16Aは、ショートブログ検索手段12が検索したショートブログに含まれるURLのそれぞれにより特定されるWebページ同士の類似度を判定する。Webページ同士の類似度の判定は、任意の方法で行うことができ、例えば、Webページ間の類似性についてのデータを予め用意しておき、当該データを参照することで類似度を判定することとしてもよく、また、当業者において周知のようにWebページ内で用いられている単語の種類や頻度に基づいて類似度を判定することとしてもよい。   The page similarity determination unit 16A determines the similarity between Web pages specified by each URL included in the short blog searched by the short blog search unit 12. The determination of the similarity between Web pages can be performed by any method. For example, data on similarity between Web pages is prepared in advance, and the similarity is determined by referring to the data. Also, as is well known to those skilled in the art, the similarity may be determined based on the type and frequency of words used in the Web page.

ページ類似度判定手段16AがWebページ同士の類似度を判定すると、急上昇ワード関連付け手段13は、判定した類似度が所定の類似度以上のWebページに対応するURLをそれぞれ含むショートブログに含まれる急上昇ワード同士を関連付ける。すなわち、急上昇ワード関連付け手段13は、所定の類似度以上の関係にある2以上のWebページに対応する2以上のURLをそれぞれ含むショートブログに含まれる急上昇ワード同士を関連付ける。このとき、関連付け手段13は、急上昇ワード同士を関連付けると、関連付けた急上昇ワードを関連付けデータベース15に記憶する。なお、所定の類似度については、任意に設定することができる。   When the page similarity determination unit 16A determines the similarity between Web pages, the sudden increase word association unit 13 causes the rapid increase included in each short blog including URLs corresponding to Web pages whose determined similarity is equal to or higher than the predetermined similarity. Associate words. That is, the rapidly increasing word associating unit 13 associates rapidly increasing words included in a short blog each including two or more URLs corresponding to two or more Web pages having a relationship of a predetermined similarity or higher. At this time, when the associating unit 13 associates the rapidly increasing words with each other, the associating unit 13 stores the associated rapidly increasing words in the association database 15. The predetermined similarity can be arbitrarily set.

[急上昇ワード関連付け装置1Aの動作]
続いて、図10を参照して、急上昇ワード関連付け装置1Aの動作について説明する。なお、図10では、第1実施形態の急上昇ワード関連付け装置1の動作と異なる部分のみを示している。すなわち、急上昇ワード関連付け装置1Aの動作において、急上昇ワード抽出手段11がショートブログデータベース14に記憶されたショートブログから急上昇ワードを抽出する動作(図5(1))、ショートブログ検索手段12が抽出した急上昇ワードに基づいてショートブログデータベース14を検索し、当該急上昇ワードを含み、かつ、URLを含むショートブログを検索する動作(図5(2))については、第1実施形態の急上昇ワード関連付け装置1の動作と同じであるため、図示を省略している。
[Operation of Rapidly Increasing Word Association Device 1A]
Next, with reference to FIG. 10, the operation of the rapidly increasing word association apparatus 1A will be described. In FIG. 10, only the part different from the operation of the sudden rise word association apparatus 1 of the first embodiment is shown. That is, in the operation of the rapidly rising word associating apparatus 1A, the rapidly rising word extracting unit 11 extracts the rapidly rising word from the short blog stored in the short blog database 14 (FIG. 5 (1)), and the short blog searching unit 12 extracts it. The operation of searching the short blog database 14 based on the sudden rise word and searching for the short blog including the sudden rise word and including the URL (FIG. 5 (2)) is the sudden rise word associating device 1 of the first embodiment. Since the operation is the same as that in FIG.

図10(1)を参照して、ページ類似度判定手段16Aは、ショートブログ検索手段12の検索結果として取得された共起URLにより特定されるWebページの類似度を判定する。ここで、「URL1」はスポーツ新聞の記事を示すWebページであり、「URL2」は週刊誌の記事を示すWebページであるが、それぞれのWebページでは「○○花子と××投手との密会デート」といった共通の出来事を扱っている。そのため、図10(1)では、ページ類似度判定手段16Aは、「URL1」により特定されるWebページと、「URL2」により特定されるWebページとは類似する(所定の類似度以上の関係にある)と判定している。   Referring to FIG. 10A, the page similarity determination unit 16A determines the similarity of the Web page specified by the co-occurrence URL acquired as the search result of the short blog search unit 12. Here, “URL1” is a Web page indicating an article of a sports newspaper, and “URL2” is a Web page indicating an article of a weekly magazine. In each Web page, a secret meeting of “XX Hanako and XX pitcher” It deals with common events such as “date”. Therefore, in FIG. 10A, the page similarity determination unit 16A is similar to the Web page specified by “URL1” and the Web page specified by “URL2” (with a relationship of a predetermined similarity or higher). Yes).

続いて、図10(2)を参照して、急上昇ワード関連付け手段13は、ページ類似度判定手段16Aの判定結果に基づいて、所定の類似度以上の関係にある「URL1」と「URL2」とをそれぞれ含むショートブログに含まれる急上昇ワード同士を関連付け、関連付けデータベース15に記憶する。その結果、同一のURLで関連付けた場合には関連することのなかった急上昇ワード「ABCグループ」と「レストランLMN」とが関連付けられている。   Subsequently, referring to FIG. 10 (2), the rapidly increasing word associating unit 13 determines that “URL1” and “URL2” have a relationship of a predetermined similarity or higher based on the determination result of the page similarity determination unit 16A. Are associated with each other and stored in the association database 15. As a result, the rapidly increasing words “ABC group” and “Restaurant LMN”, which were not related when they are associated with the same URL, are associated with each other.

このように、第2実施形態の急上昇ワード関連付け装置1Aによれば、同一のURLだけでなく、Webページの内容が類似するURLも用いて急上昇ワード同士を関連付けるため、関連付けの範囲(カバレッジ)を適切に管理することができ、急上昇ワードの関連付けを適切に行うことができる。   As described above, according to the rapidly increasing word associating apparatus 1A of the second embodiment, not only the same URL but also URLs with similar contents on the Web page are used to associate the rapidly increasing words with each other. It is possible to manage appropriately, and the association of soaring words can be performed appropriately.

[第3実施形態]
続いて、図11を参照して、第3実施形態の急上昇ワード関連付け装置1Bについて説明する。第3実施形態の急上昇ワード関連付け装置1Bでは、ショートブログ検索手段12によるショートブログの検索に用いる急上昇ワードとショートブログのテキスト情報との一致率(検索スコア)に基づいて急上昇ワード同士を関連付ける範囲を決定する。すなわち、第2実施形態の急上昇ワード関連付け装置1Aでは、URLにより特定されるWebページの内容を考慮した上で関連付ける範囲を決定していたのに対し、第3実施形態の急上昇ワード関連付け装置1Bでは、Webページの内容は考慮せずショートブログのテキスト情報の内容を考慮した上で関連付ける範囲を決定する。
なお、第3実施形態の急上昇ワード関連付け装置1Bの構成は、第1実施形態の急上昇ワード関連付け装置1と同様であるため、図示を省略する。
[Third Embodiment]
Next, a rapidly increasing word associating apparatus 1B according to the third embodiment will be described with reference to FIG. In the rapidly increasing word associating apparatus 1B of the third embodiment, a range in which the rapidly increasing words are associated with each other based on the matching rate (search score) between the rapidly increasing word used for the short blog search by the short blog search means 12 and the text information of the short blog. decide. That is, in the rapidly increasing word associating device 1A of the second embodiment, the range of association is determined in consideration of the contents of the Web page specified by the URL, whereas in the rapidly increasing word associating device 1B of the third embodiment, The range to be associated is determined in consideration of the content of the text information of the short blog without considering the content of the Web page.
In addition, since the structure of the rapid increase word correlation apparatus 1B of 3rd Embodiment is the same as that of the rapid increase word correlation apparatus 1 of 1st Embodiment, illustration is abbreviate | omitted.

[急上昇ワード関連付け装置1Bの動作]
図11を参照して、急上昇ワード関連付け装置1Bの動作について説明する。なお、図11では、第1実施形態の急上昇ワード関連付け装置1の動作と異なる部分のみを示している。すなわち、急上昇ワード関連付け装置1Bの動作において、急上昇ワード抽出手段11がショートブログデータベース14に記憶されたショートブログから急上昇ワードを抽出する動作(図5(1))については、第1実施形態の急上昇ワード関連付け装置1の動作と同じであるため、図示を省略している。
[Operation of Rapidly Increasing Word Association Device 1B]
With reference to FIG. 11, the operation of the rapidly increasing word association apparatus 1B will be described. In FIG. 11, only the parts different from the operation of the sudden rise word association apparatus 1 of the first embodiment are shown. That is, in the operation of the rapidly increasing word associating apparatus 1B, the operation of the rapidly increasing word extracting unit 11 extracting the rapidly increasing word from the short blog stored in the short blog database 14 (FIG. 5 (1)) is the rapid increase of the first embodiment. Since the operation is the same as that of the word association apparatus 1, the illustration is omitted.

図11(1)を参照して、ショートブログ検索手段12は、急上昇ワード抽出手段11が抽出した急上昇ワードに基づいてショートブログデータベース14を検索し、当該急上昇ワードを含み、かつ、URLを含むショートブログを検索する。このとき、ショートブログ検索手段12は、検索に用いた急上昇ワードとショートブログのテキスト情報との一致率に基づく検索スコアを算出する。   Referring to FIG. 11 (1), the short blog search means 12 searches the short blog database 14 based on the sudden rise word extracted by the sudden rise word extraction means 11, includes the sudden rise word, and also includes the short URL. Search for blogs. At this time, the short blog search means 12 calculates a search score based on the matching rate between the rapidly increasing word used for the search and the text information of the short blog.

続いて、図11(2)を参照して、急上昇ワード関連付け手段13は、所定の検索スコア以上のショートブログに含まれるURLをそれぞれ含むショートブログに含まれる急上昇ワード同士を関連付ける。すなわち、急上昇ワード関連付け手段13は、検索に用いた急上昇ワードとの一致率(検索スコア)が所定値以上である2以上のショートブログに含まれる2以上のURLに基づいて、急上昇ワード同士を関連付け、関連付けデータベース15に記憶する。なお、所定の検索スコアについては、任意に設定することができる。
図11(1)では、急上昇ワード「××投手」による検索において、ショートブログID「201」は検索スコア「80」であり、ショートブログID「206」は検索スコア「75」である。このとき、所定の検索スコアとして「75」以上と設定していた場合には、急上昇ワード関連付け手段13は、ショートブログID「201」に含まれる「URL1」と、ショートブログID「206」に含まれる「URL3」とに基づいて、急上昇ワード同士を関連付ける。その結果、同一のURLで関連付けた場合には関連することのなかった急上昇ワード「○○花子」「ABCグループ」と「XYZチーム」とが関連付けられている。
Subsequently, referring to FIG. 11 (2), the rapidly increasing word associating means 13 associates the rapidly increasing words included in the short blogs each including the URL included in the short blog having a predetermined search score or higher. That is, the rapidly increasing word associating unit 13 associates the rapidly increasing words with each other based on two or more URLs included in two or more short blogs whose matching rate (search score) with the rapidly increasing word used for the search is a predetermined value or more. And stored in the association database 15. The predetermined search score can be arbitrarily set.
In FIG. 11A, in the search by the rapidly increasing word “XX pitcher”, the short blog ID “201” is the search score “80”, and the short blog ID “206” is the search score “75”. At this time, if the predetermined search score is set to “75” or more, the rapidly increasing word association unit 13 includes “URL1” included in the short blog ID “201” and “short blog ID“ 206 ”. Based on “URL3”, the rapidly increasing words are associated with each other. As a result, the rapidly increasing words “XX Hanako”, “ABC group”, and “XYZ team”, which were not related when they were associated with the same URL, are associated.

このように、第3実施形態の急上昇ワード関連付け装置1Bによれば、同一のURLだけでなく、検索に用いた急上昇ワードによる検索スコアが所定値以上であるショートブログに含まれるURLも用いて急上昇ワード同士を関連付けるため、関連付けの範囲(カバレッジ)を適切に管理することができ、急上昇ワードの関連付けを適切に行うことができる。   Thus, according to the rapidly increasing word associating apparatus 1B of the third embodiment, not only the same URL but also the URL included in the short blog in which the search score by the rapidly increasing word used for the search is equal to or greater than a predetermined value is rapidly increased. Since the words are associated with each other, the association range (coverage) can be appropriately managed, and the association of the rapidly increasing words can be appropriately performed.

以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。   As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.

1,1A,1B 急上昇ワード関連付け装置
10 関連付け部
11 急上昇ワード抽出手段
12 ショートブログ検索手段
13 急上昇ワード関連付け手段
14 ショートブログデータベース
15 関連付けデータベース
16A ページ類似度判定手段
20 サジェスト部
21 検索要求受付手段
22 サジェスト手段
100 ユーザ端末
1, 1A, 1B Rapidly rising word association device 10 Association unit 11 Rapidly rising word extraction means 12 Short blog search means 13 Rapidly rising word association means 14 Short blog database 15 Association database 16A Page similarity determination means 20 Suggestion part 21 Search request acceptance means 22 Suggestion Means 100 User terminal

Claims (5)

ショートブログサービス内で投稿されたショートブログに含まれる急上昇ワード同士を関連付ける急上昇ワード関連付け装置であって、
投稿されたショートブログを記憶したショートブログデータベースを参照して、当該ショートブログに含まれる単語の出現頻度の変化に基づいてショートブログサービス内における急上昇ワードを抽出する急上昇ワード抽出手段と、
抽出した前記急上昇ワードに基づいて前記ショートブログデータベースを参照して、前記急上昇ワード及びURLを含む前記ショートブログを検索するショートブログ検索手段と、
検索した前記ショートブログのうち、同一の前記URLを含む複数のショートブログに含まれる前記急上昇ワード同士を関連付けて関連付けデータベースに記憶する急上昇ワード関連付け手段と、
を備える急上昇ワード関連付け装置。
A soaring word association device that associates soaring words included in a short blog posted within a short blog service,
With reference to a short blog database that stores posted short blogs, a rapidly rising word extracting means for extracting a rapidly rising word in the short blog service based on a change in the appearance frequency of words included in the short blog,
Short blog search means for searching the short blog including the spike word and URL by referring to the short blog database based on the extracted spike word;
Among the searched short blogs, a sudden word association means for associating the sudden words included in a plurality of short blogs including the same URL and storing them in an association database;
A soaring word association device comprising:
ユーザ端末から前記急上昇ワードを指定したショートブログの検索要求を受け付ける検索要求受付手段と、
受け付けた前記急上昇ワードに基づいて前記関連付けデータベースを参照して、受け付けた前記急上昇ワードに関連する他の急上昇ワードを抽出して前記ユーザ端末に提案するために送信するサジェスト手段と、
を備える請求項1に記載の急上昇ワード関連付け装置。
Search request accepting means for accepting a search request for a short blog designating the rapidly increasing word from the user terminal;
A suggestion means for referring to the association database based on the received spike word, extracting other spike words related to the received spike word and transmitting the proposal to the user terminal; and
The soaring word association apparatus according to claim 1.
前記ショートブログ検索手段が検索した前記ショートブログに含まれる前記URLのそれぞれにより特定されるWebページ同士の類似度を判定するページ類似度判定手段、を備え、
前記急上昇ワード関連付け手段は、所定の類似度以上の前記Webページを特定する前記URLをそれぞれ含むショートブログに含まれる前記急上昇ワード同士を関連付けて前記関連付けデータベースに記憶する、
請求項1又は2に記載の急上昇ワード関連付け装置。
Page similarity determination means for determining the similarity between Web pages specified by each of the URLs included in the short blog searched by the short blog search means,
The spike word association means associates the spike words included in the short blog including each of the URLs that specify the Web pages having a predetermined similarity or higher and stores them in the association database.
The sudden rise word association apparatus according to claim 1 or 2.
前記ショートブログ検索手段は、前記急上昇ワード及び前記URLを含む前記ショートブログの検索時において、前記急上昇ワードに基づく検索スコアを算出し、
前記急上昇ワード関連付け手段は、所定の検索スコア以上の前記ショートブログに含まれる前記URLをそれぞれ含むショートブログに含まれる前記急上昇ワード同士を関連付けて前記関連付けデータベースに記憶する、
請求項1から3のいずれかに記載の急上昇ワード関連付け装置。
The short blog search means calculates a search score based on the sudden rise word when searching the short blog including the sudden rise word and the URL,
The spike word association means associates the spike words included in the short blogs each including the URL included in the short blog having a predetermined search score or higher and stores them in the association database.
The rapidly increasing word associating device according to any one of claims 1 to 3.
コンピュータが実行する、ショートブログサービス内で投稿されたショートブログに含まれる急上昇ワード同士を関連付ける方法であって、
投稿されたショートブログを記憶したショートブログデータベースを参照して、当該ショートブログに含まれる単語の出現頻度の変化に基づいてショートブログサービス内における急上昇ワードを抽出するステップと、
抽出した前記急上昇ワードに基づいて前記ショートブログデータベースを参照して、前記急上昇ワード及びURLを含む前記ショートブログを検索するステップと、
検索した前記ショートブログのうち、同一の前記URLを含む複数のショートブログに含まれる前記急上昇ワード同士を関連付けて関連付けデータベースに記憶するステップと、
を含む方法。
A method of associating soaring words included in a short blog posted in a short blog service executed by a computer,
Referring to a short blog database storing posted short blogs, extracting a rapidly rising word in the short blog service based on a change in the appearance frequency of words included in the short blog;
Searching the short blog including the spike word and URL by referring to the short blog database based on the extracted spike word;
A step of associating the rapidly increasing words included in a plurality of short blogs including the same URL among the searched short blogs and storing them in an association database;
Including methods.
JP2011077916A 2011-03-31 2011-03-31 Soaring word association apparatus and method Active JP5269938B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011077916A JP5269938B2 (en) 2011-03-31 2011-03-31 Soaring word association apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011077916A JP5269938B2 (en) 2011-03-31 2011-03-31 Soaring word association apparatus and method

Publications (2)

Publication Number Publication Date
JP2012212333A true JP2012212333A (en) 2012-11-01
JP5269938B2 JP5269938B2 (en) 2013-08-21

Family

ID=47266225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011077916A Active JP5269938B2 (en) 2011-03-31 2011-03-31 Soaring word association apparatus and method

Country Status (1)

Country Link
JP (1) JP5269938B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810214A (en) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 Search webpage frequency information display method and device
JP2016177620A (en) * 2015-03-20 2016-10-06 ヤフー株式会社 Information processing device, information processing method, information processing program
JP2018501584A (en) * 2015-01-09 2018-01-18 フェイスブック,インク. Suggested keywords for searching news-related content on online social networks
JP2018532189A (en) * 2015-09-18 2018-11-01 フェイスブック,インク. Key topic detection on online social networks
JP2019101591A (en) * 2017-11-30 2019-06-24 キヤノンマーケティングジャパン株式会社 Information processing device, control method, and program
JP2022026922A (en) * 2020-07-31 2022-02-10 株式会社ドワンゴ Content distribution server, content search method, content search program, computer readable storage medium, and content distribution system
CN117371436A (en) * 2023-10-09 2024-01-09 北京睿企信息科技有限公司 Hot word acquisition system with incremental heat

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820671A (en) * 2015-03-13 2015-08-05 苏州佳世达电通有限公司 Data flow displaying method and electronic device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (en) * 1994-05-31 1995-12-12 Fujitsu Ltd Retrieval method for utilizing timewise change of word usage pattern and information retrieval device
JP2000331017A (en) * 1999-05-19 2000-11-30 Nippon Telegr & Teleph Corp <Ntt> Calculating device for related degree between documents, its method and its recording medium
JP2005092491A (en) * 2003-09-17 2005-04-07 Fujitsu Ltd Server and related word proposal method
WO2007043322A1 (en) * 2005-09-30 2007-04-19 Nec Corporation Trend evaluation device, its method, and program
JP2010182340A (en) * 2010-05-28 2010-08-19 Fujitsu Ltd Content navigation program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (en) * 1994-05-31 1995-12-12 Fujitsu Ltd Retrieval method for utilizing timewise change of word usage pattern and information retrieval device
JP2000331017A (en) * 1999-05-19 2000-11-30 Nippon Telegr & Teleph Corp <Ntt> Calculating device for related degree between documents, its method and its recording medium
JP2005092491A (en) * 2003-09-17 2005-04-07 Fujitsu Ltd Server and related word proposal method
WO2007043322A1 (en) * 2005-09-30 2007-04-19 Nec Corporation Trend evaluation device, its method, and program
JP2010182340A (en) * 2010-05-28 2010-08-19 Fujitsu Ltd Content navigation program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810214A (en) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 Search webpage frequency information display method and device
CN103810214B (en) * 2012-11-14 2018-03-13 腾讯科技(深圳)有限公司 The frequency information display methods and device of searched page
JP2018501584A (en) * 2015-01-09 2018-01-18 フェイスブック,インク. Suggested keywords for searching news-related content on online social networks
JP2016177620A (en) * 2015-03-20 2016-10-06 ヤフー株式会社 Information processing device, information processing method, information processing program
JP2018532189A (en) * 2015-09-18 2018-11-01 フェイスブック,インク. Key topic detection on online social networks
US10459914B2 (en) 2015-09-18 2019-10-29 Facebook, Inc. Detecting key topics on online social networks
JP2019101591A (en) * 2017-11-30 2019-06-24 キヤノンマーケティングジャパン株式会社 Information processing device, control method, and program
JP7074999B2 (en) 2017-11-30 2022-05-25 キヤノンマーケティングジャパン株式会社 Information processing equipment, control method, program
JP2022026922A (en) * 2020-07-31 2022-02-10 株式会社ドワンゴ Content distribution server, content search method, content search program, computer readable storage medium, and content distribution system
CN117371436A (en) * 2023-10-09 2024-01-09 北京睿企信息科技有限公司 Hot word acquisition system with incremental heat
CN117371436B (en) * 2023-10-09 2024-04-12 北京睿企信息科技有限公司 Hot word acquisition system with incremental heat

Also Published As

Publication number Publication date
JP5269938B2 (en) 2013-08-21

Similar Documents

Publication Publication Date Title
JP5269938B2 (en) Soaring word association apparatus and method
US10423677B2 (en) Time-box constrained searching in a distributed search system
AU2011282258B2 (en) Predictive query suggestion caching
JP5116593B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM USING PUBLIC SEARCH ENGINE
US10296535B2 (en) Method and system to randomize image matching to find best images to be matched with content items
JP5084858B2 (en) Summary creation device, summary creation method and program
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
KR20110050478A (en) Providing posts to discussion threads in response to a search query
US10289642B2 (en) Method and system for matching images with content using whitelists and blacklists in response to a search query
CN103530339A (en) Mobile application information push method and device
US8838580B2 (en) Method and system for providing keyword ranking using common affix
CN109952571B (en) Context-based image search results
JP4962980B2 (en) Search result classification apparatus and method using click log
JP4859893B2 (en) Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program
US20230087460A1 (en) Preventing the distribution of forbidden network content using automatic variant detection
JP2012243033A (en) Information processor, information processing method, and program
US10353976B2 (en) Generating search results using a set of alternate search queries
JP5386548B2 (en) Soaring word extraction apparatus and method
JP2012168844A (en) Retrieval suggestion device and method
JP5416023B2 (en) Reading terminal and method
JP2009070210A (en) Device for creating ranking by category
JP6267252B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP6228425B2 (en) Advertisement generation apparatus and advertisement generation method
JP4859891B2 (en) Server, system and method for providing information related to contents
Al-akashi et al. Query-Structure Based Web Page Indexing.

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130508

R150 Certificate of patent or registration of utility model

Ref document number: 5269938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250