JP2008276640A - Keyword prediction system and keyword prediction method - Google Patents

Keyword prediction system and keyword prediction method Download PDF

Info

Publication number
JP2008276640A
JP2008276640A JP2007121551A JP2007121551A JP2008276640A JP 2008276640 A JP2008276640 A JP 2008276640A JP 2007121551 A JP2007121551 A JP 2007121551A JP 2007121551 A JP2007121551 A JP 2007121551A JP 2008276640 A JP2008276640 A JP 2008276640A
Authority
JP
Japan
Prior art keywords
keyword
information
program
keywords
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007121551A
Other languages
Japanese (ja)
Inventor
Akihiko Suzuki
昭彦 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOUR FUSION Inc
Original Assignee
FOUR FUSION Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOUR FUSION Inc filed Critical FOUR FUSION Inc
Priority to JP2007121551A priority Critical patent/JP2008276640A/en
Publication of JP2008276640A publication Critical patent/JP2008276640A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To predict a keyword related to an event that will become popular in the future, and effectively use it to marketing for accurately catching customer needs, listing advertisement for displaying a text advertisement on a retrieval result of a search engine for a fee, or the like. <P>SOLUTION: The method comprises acquiring television program information; extracting common nouns and proper nouns as keywords from the acquired television program information; inputting the extracted keywords to a predetermined keyword advice tool in order to extract a retrieval frequency of each of the input keywords; extracting a program name from the television program information to form a program name list; extracting an audience rate of the past time zone that becomes a weight of the television program from the television program information; dividing the retrieval frequency of each extracted keyword by the weight of the television program to acquire the rare degree of each keyword; and rearranging the keywords in the ascending order of the rare degree determined for each keyword. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、将来流行するであろう事象に関わるキーワードを予測するキーワード予測システム及びキーワード予測方法に関する。   The present invention relates to a keyword prediction system and a keyword prediction method for predicting a keyword related to an event that will be popular in the future.

キーワードは、問題の解明や内容の理解の上で重要な手掛かりとなったり、情報検索での手掛かりとして用いられたりしている。たとえば、情報検索では、インターネット上のサーチエンジン(Webサイト)の入力欄にキーワードを入力することで、所望の情報が閲覧できるようになっている。   Keywords are important clues for elucidating problems and content, and are used as clues for information retrieval. For example, in information retrieval, desired information can be browsed by inputting a keyword into an input field of a search engine (Web site) on the Internet.

ところで、たとえばサーチエンジンで入力されたキーワードは、サーチエンジンから訪れるユーザがどのような興味を持っているかを知るための指標となっている。このような指標が分かれば、たとえば顧客ニーズを的確に掴むようなマーケティングや、サーチエンジンの検索結果に有料でテキスト広告を表示するリスティング広告等といったようなものへの有効活用が図れるものと考えられる。   By the way, for example, a keyword input by a search engine is an index for knowing what interest a user visiting from the search engine has. If such an index is known, it is considered that it can be used effectively for things such as marketing that accurately grasps customer needs and listing advertisements that display paid text ads in search engine search results. .

このようなサーチエンジンに入力されたキーワードを応用したものとして、特許文献1では、広告コンテンツページに関連付けられている広告主リスティング及び入札額面が設定されているキーワードを持つことができる、広告主キーワードデータベースを備え、クエリ処理サブセクションは、広告主キーワードデータベースに動作するように結合され、検索クエリを広告主キーワードデータベースにサブミットし、クエリを処理する広告キーワードデータベース内のパーティションに関連付けられている広告主リスティングのセットを決定し、検索語をクエリクライアントに返すようにプログラムされているようにしたコンピュータシステムを提案している。
特表2006−516767
As an application of such a keyword input to a search engine, in Patent Document 1, an advertiser keyword that can have an advertiser listing associated with an advertisement content page and a keyword with a bid face value set. The database includes a query processing subsection that is operatively coupled to the advertiser keyword database, submits search queries to the advertiser keyword database, and is associated with a partition in the advertising keyword database that processes the query. It proposes a computer system that is programmed to determine a set of listings and return search terms to a query client.
Special table 2006-516767

上述した特許文献1に示されるコンピュータシステムでは、広告リスティングの複数のセットを採用する、それぞれのセットが入札機構を持っているため、市場や販売チャネルに関連付けられている、ペイフォーパフォーマンス広告のためのシステムを実現することができるようになっている。   In the computer system disclosed in Patent Document 1 described above, a plurality of sets of advertisement listings are adopted, and each set has a bidding mechanism, and therefore, for pay-for-performance advertisements associated with markets and sales channels. System can be realized.

ところが、このようなシステムでは、検索クエリを広告主キーワードデータベースにサブミットし、クエリを処理する広告キーワードデータベース内のパーティションに関連付けられている広告主リスティングのセットを決定するようにしているため、将来流行するであろう事象に関わるキーワードを予測して、たとえば顧客ニーズを的確に掴むようなマーケティングや、サーチエンジンの検索結果に有料でテキスト広告を表示するリスティング広告等といったようなものへの有効活用を図ることができないという問題があった。   However, such systems submit search queries to the advertiser keyword database to determine the set of advertiser listings associated with the partition in the ad keyword database that will process the query. Predicting the keywords related to the event that will be performed, for example, marketing that can accurately grasp customer needs, and effective use for such things as listing ads that display paid text ads in search engine search results There was a problem that could not be planned.

本発明は、このような状況に鑑みてなされたものであり、上記問題点を解決することができるキーワード予測システム及びキーワード予測方法を提供することを目的とする。   This invention is made | formed in view of such a condition, and it aims at providing the keyword prediction system and keyword prediction method which can solve the said problem.

本発明のキーワード予測システムは、通信回線を介して取得した情報に基づいたキーワード予測を行うキーワード予測システムであって、情報管理サーバと、ホームページを提供する複数のwebサーバとを備え、前記情報管理サーバは、いずれかの前記webサーバからのホームページを介してテレビ番組情報を取得する取得手段と、該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出する第1抽出手段と、いずれかの前記webサーバからのwebページを介して得られる所定のキーワードアドバイスツールに前記抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出する第2抽出手段と、前記テレビ番組情報から番組名を抽出して番組名一覧を作成する作成手段と、前記テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出する第3抽出手段と、前記抽出されたキーワード毎の検索回数を、前記テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求めるレア度取得手段と、それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行う並替手段とを備えることを特徴とする。
本発明のキーワード予測方法は、通信回線を介して取得した情報に基づいたキーワード予測を行うキーワード予測方法であって、情報管理サーバと、ホームページを提供する複数のwebサーバとを備え、前記情報管理サーバは、いずれかの前記webサーバからのホームページを介してテレビ番組情報を取得する工程と、該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出する工程と、いずれかの前記webサーバからのwebページを介して得られる所定のキーワードアドバイスツールに前記抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出する工程と、前記テレビ番組情報から番組名を抽出して番組名一覧を作成する工程と、前記テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出する工程と、前記抽出されたキーワード毎の検索回数を、前記テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求める工程と、それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行う工程とを有することを特徴とする。
本発明のキーワード予測システム及びキーワード予測方法では、いずれかのwebサーバからのホームページを介してテレビ番組情報が取得され、該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とが抽出され、いずれかのwebサーバからのwebページを介して得られる所定のキーワードアドバイスツールに抽出したキーワードが順に入力され、それぞれの入力したキーワード毎の検索回数が抽出され、テレビ番組情報から番組名が抽出されて番組名一覧が作成され、テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率が抽出され、抽出されたキーワード毎の検索回数が、テレビ番組の重み付けで除算され、それぞれのキーワード毎のレア度が求められ、それぞれのキーワード毎に求められたレア度の小さいものから順に並べ替えが行われる。
ここで、レア度が小さい程、将来流行するであろう事象に関わるキーワードとなる。これは、キーワードの検索回数が少なくても、テレビ番組の重み付けとして用いられる視聴率が高かければ、そのレア度の小さいキーワードが将来流行することに繋がる確率が高いためである。
The keyword prediction system of the present invention is a keyword prediction system that performs keyword prediction based on information acquired via a communication line, and includes an information management server and a plurality of web servers that provide a homepage, and the information management A server for acquiring television program information via a homepage from any of the web servers; a first extracting unit for extracting common nouns and proper nouns as keywords from the acquired television program information; A second extraction means for sequentially inputting the extracted keywords into a predetermined keyword advice tool obtained via a web page from any of the web servers, and extracting the number of searches for each inputted keyword; Creating means for extracting a program name from program information and creating a program name list; Third extraction means for extracting the audience rating in the past time period, which is the weight of the TV program from the program information, and dividing the number of searches for each of the extracted keywords by the weight of the TV program, Rare degree acquisition means for obtaining a rare degree and rearrangement means for rearranging the rare degree obtained for each keyword in order from the smallest.
The keyword prediction method of the present invention is a keyword prediction method that performs keyword prediction based on information acquired via a communication line, and includes an information management server and a plurality of web servers that provide a homepage, and the information management The server acquires TV program information via a homepage from any of the web servers, extracts a common noun and proper noun that are keywords from the acquired TV program information, A step of inputting the extracted keywords in order into a predetermined keyword advice tool obtained via a web page from a web server, extracting the number of searches for each input keyword, and extracting a program name from the television program information And creating a list of program names and weighting the TV programs from the TV program information. Extracting the audience rating for the past time period, dividing the number of searches for each extracted keyword by the weight of the television program, and determining the rare degree for each keyword, and each keyword And rearranging in descending order of the rareness obtained every time.
In the keyword prediction system and keyword prediction method of the present invention, TV program information is acquired via a homepage from any web server, and common nouns and proper nouns that are keywords are extracted from the acquired TV program information, The extracted keywords are sequentially input to a predetermined keyword advice tool obtained via a web page from any web server, the number of searches for each input keyword is extracted, and the program name is extracted from the TV program information. A list of program names is created, the audience rating for the past time period, which is the weight of the TV program, is extracted from the TV program information, and the number of searches for each extracted keyword is divided by the weight of the TV program. Rareness for each keyword is required, and the rare is calculated for each keyword. Sort order is carried out from one of the small.
Here, as the degree of rarity is smaller, the keyword is related to an event that will be popular in the future. This is because even if the number of keyword searches is small, if the audience rating used as a weight for a TV program is high, the probability that the keyword with a low degree of rarity will become popular in the future is high.

本発明のキーワード予測システム及びキーワード予測方法によれば、抽出されたキーワード毎の検索回数を、テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求めるようにしたので、将来流行するであろう事象に関わるキーワードを予測することができるばかりか、たとえば顧客ニーズを的確に掴むようなマーケティングや、サーチエンジンの検索結果に有料でテキスト広告を表示するリスティング広告等といったようなものへの有効活用を図ることができる。   According to the keyword prediction system and the keyword prediction method of the present invention, the number of searches for each extracted keyword is divided by the weight of the TV program so as to obtain the rare degree for each keyword. In addition to being able to predict keywords related to likely events, it is effective for things such as marketing that accurately grasps customer needs, listing ads that display paid text ads in search engine search results, etc. Can be used.

本実施形態では、情報管理サーバにより、いずれかのwebサーバからのホームページを介してテレビ番組情報を取得し、該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出し、いずれかのwebサーバからのwebページを介して得られる所定のキーワードアドバイスツールに抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出し、テレビ番組情報から番組名を抽出して番組名一覧を作成し、テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出し、抽出したキーワード毎の検索回数を、テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求め、それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行うことで、将来流行するであろう事象に関わるキーワードを予測するとともに、たとえば顧客ニーズを的確に掴むようなマーケティングや、サーチエンジンの検索結果に有料でテキスト広告を表示するリスティング広告等といったようなものへの有効活用を図ることができるようにした。   In the present embodiment, the information management server acquires TV program information via a home page from any web server, extracts common nouns and proper nouns as keywords from the acquired TV program information, The keywords extracted in order to a predetermined keyword advice tool obtained through a web page from the web server of the web server are sequentially input, the number of searches for each input keyword is extracted, the program name is extracted from the TV program information, and the program is extracted. Create a list of names, extract the audience rating of the past time period, which is the weight of the TV program, from the TV program information, divide the number of searches for each extracted keyword by the weight of the TV program, and create a rare list for each keyword. By calculating the degree and rearranging in order from the lowest rarity obtained for each keyword, In addition to predicting keywords related to events that are likely to be prevalent, effectively use them for things such as marketing that accurately grasps customer needs and listing ads that display paid text ads in search engine search results. I was able to plan.

以下、本発明の実施例の詳細について説明する。図1は、本発明のキーワード予測システムの一実施例を説明するための図である。   Details of the embodiments of the present invention will be described below. FIG. 1 is a diagram for explaining an embodiment of the keyword prediction system of the present invention.

同図に示すキーワード予測システムは、キーワード予測装置100と、webサーバ210〜230と、ユーザ端末310〜330とを備え、これらは通信回線であるインターネット400を介して接続されている。なお、通信回線としては、専用回線や広域ネットワーク(WAN:Wide Area Network)等を用いることもできる。   The keyword prediction system shown in the figure includes a keyword prediction device 100, web servers 210 to 230, and user terminals 310 to 330, which are connected via the Internet 400, which is a communication line. In addition, as a communication line, a dedicated line, a wide area network (WAN: Wide Area Network), etc. can also be used.

キーワード予測装置100は、将来流行するであろう事象に関わるキーワードを予測しその予測結果を会員登録を行った広告主等に提供するサービス業者が運営するものであり、情報管理端末110と、情報管理サーバ120と、データベース130とを備えている。なお、将来流行するであろう事象に関わるキーワードを予測することについての詳細は、後述する。   The keyword prediction device 100 is operated by a service provider that predicts a keyword related to an event that will be popular in the future and provides the prediction result to an advertiser who has registered as a member. A management server 120 and a database 130 are provided. Details of predicting a keyword related to an event that will be popular in the future will be described later.

情報管理端末110は、情報管理サーバ120のシステム変更や、情報管理サーバ120の後述の制御部128によるキーワード予測の実行を指示する際等に操作されるものである。情報管理端末110は、ディスクトップパソコン、ノートパソコン等を用いることができる。   The information management terminal 110 is operated when changing the system of the information management server 120 or instructing execution of keyword prediction by the control unit 128 described later of the information management server 120. As the information management terminal 110, a desktop personal computer, a notebook personal computer, or the like can be used.

情報管理サーバ120は、情報管理端末110の操作に応じて、たとえばwebサーバ210〜230が提供している各種ホームページ等からの情報を取得し、データベース130に登録する。また、情報管理サーバ120は、将来流行するであろう事象に関わるキーワードを予測する機能を有しているが、その詳細については後述する。   The information management server 120 acquires information from, for example, various home pages provided by the web servers 210 to 230 in accordance with the operation of the information management terminal 110 and registers the information in the database 130. The information management server 120 has a function of predicting a keyword related to an event that will be popular in the future, and details thereof will be described later.

データベース130には、情報管理サーバ120によって登録される上述した各種ホームページ等からの情報が記憶される。   The database 130 stores information from the various home pages described above registered by the information management server 120.

webサーバ210〜230は、情報管理サーバ120やユーザ端末310〜330に各種ホームページを提供するものである。具体的には、データベース210a〜230aに蓄積しているHTML文書や画像等の情報を、たとえば所定のサーチエンジンを介しての要求に応じて提供する。   The web servers 210 to 230 provide various home pages to the information management server 120 and the user terminals 310 to 330. Specifically, information such as HTML documents and images stored in the databases 210a to 230a is provided in response to a request through a predetermined search engine, for example.

ユーザ端末310〜330は、たとえば所定のサーチエンジンを介してwebサーバ210〜230からのHTML文書や画像等の情報を閲覧するものである。ユーザ端末310〜330としては、携帯電話、PDA、ディスクトップパソコン、ノートパソコン等を用いることができる。   The user terminals 310 to 330 browse information such as HTML documents and images from the web servers 210 to 230 via, for example, a predetermined search engine. As the user terminals 310 to 330, a mobile phone, a PDA, a desktop personal computer, a notebook personal computer, or the like can be used.

図2は、情報管理サーバ120の内部構成を説明するためのブロック図である。同図に示すように、情報管理サーバ120は、インタフェース部121、受信部122、送信部123、データ書込部124、データ読込部125、ROM126、RAM127、制御部128を備えている。   FIG. 2 is a block diagram for explaining the internal configuration of the information management server 120. As shown in the figure, the information management server 120 includes an interface unit 121, a receiving unit 122, a transmitting unit 123, a data writing unit 124, a data reading unit 125, a ROM 126, a RAM 127, and a control unit 128.

インタフェース部121は、インターネット400を介して、webサーバ210〜230との間での情報のやり取りを受け持つ。受信部122は、インタフェース部121を介してwebサーバ210〜230からの情報を受信する。ここで、webサーバ210〜230から受信する情報としては、たとえば(http://tv.so−net.ne.jp/guest/pc/portal.action:ソネットエンタテインメント株式会社提供)から得られる図3に示すようなホームページからのテレビ番組情報等である。   The interface unit 121 is in charge of exchanging information with the web servers 210 to 230 via the Internet 400. The receiving unit 122 receives information from the web servers 210 to 230 via the interface unit 121. Here, the information received from the web servers 210 to 230 is obtained from, for example, (http://tv.so-net.ne.jp/guest/pc/portal.action: provided by Sonnet Entertainment Co., Ltd.). TV program information from a homepage as shown in FIG.

送信部123は、将来流行するであろう事象に関わるキーワードの予測結果を会員登録を行った広告主等に送信するものである。なお、ここでは、広告主等が使用する端末を図示していないが、場合によってはwebサーバ210〜230のいずれかが広告主側の端末となり得ることがある。この場合には、そのいずれかのwebサーバ210〜230に将来流行するであろう事象に関わるキーワードの予測結果が送信されることになる。   The transmission unit 123 transmits a keyword prediction result related to an event that will be popular in the future to an advertiser who has registered as a member. In addition, although the terminal which an advertiser etc. uses here is not shown in figure here, either of the web servers 210-230 may become an advertiser side terminal depending on the case. In this case, a keyword prediction result related to an event that will be popular in the future is transmitted to any of the web servers 210 to 230.

データ書込部124は、受信部122によって受信された上述の各種情報等をデータベース130に書き込む。データ読込部125は、将来流行するであろう事象に関わるキーワードを予測するために必要な情報をデータベース130から読み込む。すなわち、この場合、画像等のイメージ情報は不要となるため、画像情報を除いたテキスト情報が読み込まれることになる。   The data writing unit 124 writes the above-described various information received by the receiving unit 122 into the database 130. The data reading unit 125 reads information necessary for predicting a keyword related to an event that will be popular in the future from the database 130. That is, in this case, image information such as an image becomes unnecessary, and text information excluding image information is read.

ROM126には、制御部128による制御に必要な制御プログラム等が記憶されている。ここで、制御部128による制御に必要な制御プログラムには、たとえば将来流行するであろう事象に関わるキーワードを予測しその予測結果を得る手順を示すプログラムが含まれている。RAM127には、データ読込部125によって読み込まれた情報等が記憶される。   The ROM 126 stores a control program necessary for control by the control unit 128. Here, the control program necessary for the control by the control unit 128 includes, for example, a program indicating a procedure for predicting a keyword related to an event that will be popular in the future and obtaining the prediction result. The RAM 127 stores information read by the data reading unit 125.

制御部128は、ROM126に記憶されている制御プログラムに従い、各部の動作を制御する。すなわち、その制御プログラムには、制御部128によって実行される手順が示されている。また、制御部128による下記のような主な制御は、上述の情報管理端末110からの指示に応じて実行される。すなわち、制御部128は、データ読込部125によって読み込まれた情報のうちのテレビ番組情報から普通名詞や固有名詞を抽出する。この場合の普通名詞や固有名詞の抽出は、一般的なキーワード抽出手法によって行うことができる。ただし、普通名詞や固有名詞を抽出する際、番組等の一般名称は抽出されないようにしておくことも可能である。   The control unit 128 controls the operation of each unit according to a control program stored in the ROM 126. That is, the procedure executed by the control unit 128 is shown in the control program. Further, the following main control by the control unit 128 is executed in response to an instruction from the information management terminal 110 described above. That is, the control unit 128 extracts common nouns and proper nouns from the TV program information among the information read by the data reading unit 125. In this case, extraction of common nouns and proper nouns can be performed by a general keyword extraction method. However, when extracting common nouns and proper nouns, it is possible not to extract general names such as programs.

また、制御部128は、普通名詞や固有名詞を抽出すると、たとえば(http://inventory.jp.overture.com/d/searchinventory/suggestion/:オーバーチュア株式会社提供)から得られる図4に示すようなwebページに示されるキーワードアドバイスツールでのキーワードに応じた検索回数を抽出する。この場合、テレビ番組情報から抽出した普通名詞や固有名詞のキーワードアドバイスツールへの入力順にあっては、たとえばテレビ番組情報からの抽出順となっている。ここで、テレビ番組情報からの抽出順とは、たとえば放送の早い順でチャンネルの小さい順となる。   Further, when the control unit 128 extracts common nouns or proper nouns, for example, as shown in FIG. 4 obtained from (http://inventory.jp.overture.com/d/searchinventory/suggestion/: provided by Overture Inc.). The number of searches corresponding to the keyword in the keyword advice tool shown on the web page is extracted. In this case, the order of input to the keyword advice tool for common nouns and proper nouns extracted from the TV program information is, for example, the order of extraction from the TV program information. Here, the order of extraction from the TV program information is, for example, the order from the smallest channel in the order of early broadcasting.

また、制御部128は、上述のテレビ番組情報から番組名を抽出して番組名一覧を作成する。また、制御部128は、そのテレビ番組情報から過去の視聴率(ここでいう視聴率は個々の番組の視聴率ではなく時間帯の視聴率である)を抽出する。この視聴率は、テレビ番組の重み付けとして用いられる。この場合、番組検索頻度(検索されやすいテレビ番組の頻度)も加味することが可能である。   In addition, the control unit 128 extracts a program name from the above TV program information and creates a program name list. In addition, the control unit 128 extracts a past audience rating (the audience rating here is an audience rating in a time period, not an audience rating of each program) from the TV program information. This audience rating is used as a weight for a television program. In this case, program search frequency (frequency of TV programs that are easily searched) can be taken into consideration.

また、制御部128は、上述のキーワードアドバイスツールでのキーワード毎の検索回数を、上述のテレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求める。また、制御部128は、それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行う。このようにしてレア度の小さいものから順に並べられたキーワードは、将来流行するであろう事象に関わるキーワードの予測結果とされ、上述の情報管理端末110の画面に表示される。ここで、レア度が小さい程、将来流行するであろう事象に関わるキーワードとなる。これは、上述したキーワードの検索回数が少なくても、テレビ番組の重み付けとして用いられる視聴率が高かければ、そのレア度の小さいキーワードが将来流行することに繋がる確率が高いためである。   In addition, the control unit 128 divides the number of searches for each keyword in the above keyword advice tool by the weight of the above TV program, and obtains the rarity for each keyword. In addition, the control unit 128 performs rearrangement in order from the lowest rarity obtained for each keyword. Thus, the keywords arranged in order from the one with the lowest degree of rareness are the prediction results of the keywords related to the event that will be popular in the future, and are displayed on the screen of the information management terminal 110 described above. Here, as the degree of rarity is smaller, the keyword is related to an event that will be popular in the future. This is because even if the number of keyword searches described above is small, if the audience rating used as a weight for a television program is high, the probability that a keyword with a low degree of rarity will become popular in the future is high.

次に、上述したキーワード予測システムにおけるキーワード予測方法について説明する。まず、図5に示すように、情報管理端末110から情報管理サーバ120へキーワード予測の実行の指示があると(ステップS1)、まず、受信部122により、インターネット400を介して、webサーバ210〜230のいずれから上述の図3に示したテレビ番組情報等が受信される(ステップS2)。   Next, a keyword prediction method in the keyword prediction system described above will be described. First, as shown in FIG. 5, when there is an instruction to execute keyword prediction from the information management terminal 110 to the information management server 120 (step S <b> 1), first, the web server 210 through the Internet 400 is received by the receiving unit 122. The TV program information and the like shown in FIG. 3 are received from any of 230 (step S2).

次いで、受信されたテレビ番組情報等は、データ書込部124によりデータベース130に書き込まれると(ステップS3)、データ読込部125により、将来流行するであろう事象に関わるキーワードを予測するために必要な情報がデータベース130から読み込まれる(ステップS4)。   Next, when the received TV program information or the like is written into the database 130 by the data writing unit 124 (step S3), it is necessary for the data reading unit 125 to predict a keyword related to an event that will be popular in the future. Information is read from the database 130 (step S4).

このとき、制御部128により、データ読込部125によって読み込まれた情報のうちのテレビ番組情報から普通名詞や固有名詞が抽出される(ステップS5)。この場合、番組等の一般名称が抽出されないように設定されている場合、その一般名称の抽出は除外されることになる。   At this time, the control unit 128 extracts common nouns and proper nouns from the TV program information among the information read by the data reading unit 125 (step S5). In this case, when the general name of the program or the like is set not to be extracted, the extraction of the general name is excluded.

次いで、普通名詞や固有名詞が抽出されると、上述の図4に示したキーワードアドバイスツールにその抽出された普通名詞や固有名詞が入力され、それぞれのキーワード毎の検索回数が抽出される(ステップS6)。このとき、上述のテレビ番組情報から番組名が抽出されて番組名一覧が作成される(ステップS7)。またこのとき、テレビ番組情報から過去の視聴率(ここでいう視聴率は個々の番組の視聴率ではなく時間帯の視聴率である)が抽出され、テレビ番組の重み付けとして用いられる。この場合、上述したように、番組検索頻度(検索されやすいテレビ番組の頻度)も加味することが可能である。   Next, when common nouns and proper nouns are extracted, the extracted common nouns and proper nouns are input to the keyword advice tool shown in FIG. 4 described above, and the number of searches for each keyword is extracted (step). S6). At this time, a program name is extracted from the above TV program information and a program name list is created (step S7). At this time, the past audience rating (the audience rating here is not the audience rating of each program but the audience rating in the time zone) is extracted from the television program information and used as a weight for the television program. In this case, as described above, the program search frequency (the frequency of TV programs that are easily searched) can be taken into consideration.

次いで、上述のキーワードアドバイスツールでのキーワードの検索回数が、上述のテレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度が求められる(ステップS8)。このとき、それぞれのキーワード毎に求められたレア度の小さいものから順に並べ替えが行われる(ステップS9)。このようにしてレア度の小さいものから順に並べられたキーワードは、将来流行するであろう事象に関わるキーワードの予測結果とされ、上述の情報管理端末110の画面に表示される。ここで、上述したように、レア度が小さい程、将来流行するであろう事象に関わるキーワードとなる。これは、上述したように、キーワードの検索回数が少なくても、テレビ番組の重み付けとして用いられる視聴率が高かければ、そのレア度の小さいキーワードが将来流行することに繋がる確率が高いためである。   Next, the number of keyword searches by the keyword advice tool is divided by the weight of the television program described above, and the rare degree for each keyword is obtained (step S8). At this time, rearrangement is performed in order from the lowest rarity obtained for each keyword (step S9). Thus, the keywords arranged in order from the one with the lowest degree of rareness are the prediction results of the keywords related to the event that will be popular in the future, and are displayed on the screen of the information management terminal 110 described above. Here, as described above, the smaller the rarity, the more relevant the event that will be popular in the future. This is because, as described above, even if the number of keyword searches is small, if the audience rating used as a weighting for a TV program is high, the probability that a keyword with a low degree of rarity will become popular in the future is high. .

なお、このようにして得られた将来流行するであろう事象に関わるキーワードの予測結果は、送信部123から会員登録を行った広告主等に送信される。   The keyword prediction result related to the event that will be popular in the future obtained in this way is transmitted from the transmission unit 123 to the advertiser who has registered as a member.

このように、本実施例では、情報管理サーバ120により、いずれかのwebサーバ210〜230からのホームページを介してテレビ番組情報を取得し、該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出し、いずれかのwebサーバ210〜230からのwebページを介して得られる所定のキーワードアドバイスツールに抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出し、テレビ番組情報から番組名を抽出して番組名一覧を作成し、テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出し、抽出したキーワード毎の検索回数を、テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求め、それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行うようにしたので、将来流行するであろう事象に関わるキーワードを予測することができるとともに、たとえば顧客ニーズを的確に掴むようなマーケティングや、サーチエンジンの検索結果に有料でテキスト広告を表示するリスティング広告等といったようなものへの有効活用を図ることができる。   As described above, in this embodiment, the information management server 120 acquires television program information via the home page from any of the web servers 210 to 230, and the common nouns and keywords that are keywords from the acquired television program information. Extract nouns, sequentially input the extracted keywords into a predetermined keyword advice tool obtained via a web page from any of the web servers 210-230, extract the number of searches for each input keyword, The program name is extracted from the TV program information to create a list of program names, the audience rating in the past time period that is the weight of the TV program is extracted from the TV program information, and the number of searches for each extracted keyword is Divide by weighting to find the rarity for each keyword, and the rarity obtained for each keyword Sorting in ascending order, so it is possible to predict keywords related to events that will be popular in the future. For example, marketing that accurately grasps customer needs and paid search engine search results. Can be effectively used for such things as listing advertisements that display text advertisements.

なお、本実施例では、キーワード予測のための情報元をテレビ番組情報として説明したが、この例に限らず、その情報元をインターネット400を介して配信されるニュース情報やマーケット情報等のような他のあらゆる情報としてもよい。   In the present embodiment, the information source for keyword prediction has been described as television program information. However, the present invention is not limited to this example, and the information source may be news information, market information, or the like distributed via the Internet 400. Any other information may be used.

また、その情報元は、インターネット400を介して配信されるものに限らず、CDやDVD等の記録媒体に記録されて配布される情報としてもよく、さらには各種情報が記載された月刊誌や週刊誌等であってもよい。これら月刊誌や週刊誌等の場合は、それに記載されている文字をスキャナーで取り込んでテキストデータに変換すれば、それに記載されている文字をキーボードで入力する手間が省ける。   The information source is not limited to the information distributed via the Internet 400, but may be information recorded and distributed on a recording medium such as a CD or a DVD. It may be a weekly magazine. In the case of these monthly and weekly magazines, if the characters described therein are captured by a scanner and converted into text data, it is possible to save the trouble of inputting the characters described in the keyboard.

本発明のキーワード予測システムの一実施例を説明するための図である。It is a figure for demonstrating one Example of the keyword prediction system of this invention. 図1の情報管理サーバの内部構成を説明するためのブロック図である。It is a block diagram for demonstrating the internal structure of the information management server of FIG. テレビ番組情報を提供するホームページの一例を示す図である。It is a figure which shows an example of the homepage which provides television program information. キーワードアドバイスツールのwebページの一例を示す図である。It is a figure which shows an example of the web page of a keyword advice tool. 図1のキーワード予測システムにおけるキーワード予測方法について説明するためのフローチャートである。It is a flowchart for demonstrating the keyword prediction method in the keyword prediction system of FIG.

符号の説明Explanation of symbols

100 キーワード予測装置
110 情報管理端末
120 情報管理サーバ
121 インタフェース部
122 受信部
123 送信部
124 データ書込部
125 データ読込部
128 制御部
130 データベース
210a〜230a データベース
210〜230 webサーバ
310〜330 ユーザ端末
400 インターネット
100 keyword prediction device 110 information management terminal 120 information management server 121 interface unit 122 reception unit 123 transmission unit 124 data writing unit 125 data reading unit 128 control unit 130 database 210a to 230a database 210 to 230 web server 310 to 330 user terminal 400 the Internet

Claims (2)

通信回線を介して取得した情報に基づいたキーワード予測を行うキーワード予測システムであって、
情報管理サーバと、
ホームページを提供する複数のwebサーバとを備え、
前記情報管理サーバは、
いずれかの前記webサーバからのホームページを介してテレビ番組情報を取得する取得手段と、
該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出する第1抽出手段と、
いずれかの前記webサーバからのwebページを介して得られる所定のキーワードアドバイスツールに前記抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出する第2抽出手段と、
前記テレビ番組情報から番組名を抽出して番組名一覧を作成する作成手段と、
前記テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出する第3抽出手段と、
前記抽出されたキーワード毎の検索回数を、前記テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求めるレア度取得手段と、
それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行う並替手段とを備える
ことを特徴とするキーワード予測システム。
A keyword prediction system that performs keyword prediction based on information acquired via a communication line,
An information management server;
With multiple web servers that provide homepages,
The information management server
Obtaining means for obtaining television program information via a homepage from any of the web servers;
First extraction means for extracting common nouns and proper nouns as keywords from the acquired television program information;
Second extraction means for sequentially inputting the extracted keywords into a predetermined keyword advice tool obtained via a web page from any of the web servers, and extracting the number of searches for each input keyword;
Creating means for extracting a program name from the TV program information and creating a program name list;
A third extraction means for extracting a viewing rate in the past time period which is a weighting of the television program from the television program information;
Rare degree acquisition means for dividing the number of searches for each extracted keyword by the weight of the television program, and obtaining a rare degree for each keyword;
A keyword prediction system, comprising: a sorting unit that sorts the keywords in order from the lowest rarity obtained for each keyword.
通信回線を介して取得した情報に基づいたキーワード予測を行うキーワード予測方法であって、
情報管理サーバと、
ホームページを提供する複数のwebサーバとを備え、
前記情報管理サーバは、
いずれかの前記webサーバからのホームページを介してテレビ番組情報を取得する工程と、
該取得したテレビ番組情報からキーワードとなる普通名詞と固有名詞とを抽出する工程と、
いずれかの前記webサーバからのwebページを介して得られる所定のキーワードアドバイスツールに前記抽出したキーワードを順に入力し、それぞれの入力したキーワード毎の検索回数を抽出する工程と、
前記テレビ番組情報から番組名を抽出して番組名一覧を作成する工程と、
前記テレビ番組情報からテレビ番組の重み付けとなる過去の時間帯の視聴率を抽出する工程と、
前記抽出されたキーワード毎の検索回数を、前記テレビ番組の重み付けで除算し、それぞれのキーワード毎のレア度を求める工程と、
それぞれのキーワード毎に求めたレア度の小さいものから順に並べ替えを行う工程とを有する
ことを特徴とするキーワード予測方法。
A keyword prediction method for performing keyword prediction based on information acquired via a communication line,
An information management server;
With multiple web servers that provide homepages,
The information management server
Obtaining television program information via a home page from any of the web servers;
Extracting common nouns and proper nouns as keywords from the acquired TV program information;
Inputting the extracted keywords in order into a predetermined keyword advice tool obtained via a web page from any of the web servers, and extracting the number of searches for each entered keyword;
Extracting a program name from the TV program information and creating a program name list;
Extracting the audience rating of the past time zone which is the weight of the TV program from the TV program information;
Dividing the number of searches for each of the extracted keywords by the weight of the television program, and obtaining a rare degree for each keyword;
And a step of rearranging the keywords in the order of decreasing rarity obtained for each keyword.
JP2007121551A 2007-05-02 2007-05-02 Keyword prediction system and keyword prediction method Pending JP2008276640A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007121551A JP2008276640A (en) 2007-05-02 2007-05-02 Keyword prediction system and keyword prediction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007121551A JP2008276640A (en) 2007-05-02 2007-05-02 Keyword prediction system and keyword prediction method

Publications (1)

Publication Number Publication Date
JP2008276640A true JP2008276640A (en) 2008-11-13

Family

ID=40054495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007121551A Pending JP2008276640A (en) 2007-05-02 2007-05-02 Keyword prediction system and keyword prediction method

Country Status (1)

Country Link
JP (1) JP2008276640A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222458A (en) * 2014-05-01 2015-12-10 株式会社Mobile360 Advertisement purchase device and advertisement purchase method
CN106341708A (en) * 2016-10-19 2017-01-18 天脉聚源(北京)科技有限公司 Statistical method and device for evaluating audience ratings
CN112052303A (en) * 2019-06-06 2020-12-08 阿里巴巴集团控股有限公司 Keyword weight determination method and device and computing equipment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222458A (en) * 2014-05-01 2015-12-10 株式会社Mobile360 Advertisement purchase device and advertisement purchase method
CN106341708A (en) * 2016-10-19 2017-01-18 天脉聚源(北京)科技有限公司 Statistical method and device for evaluating audience ratings
CN106341708B (en) * 2016-10-19 2019-07-26 天脉聚源(北京)科技有限公司 A kind of method for statisticsing audience rating and device
CN112052303A (en) * 2019-06-06 2020-12-08 阿里巴巴集团控股有限公司 Keyword weight determination method and device and computing equipment

Similar Documents

Publication Publication Date Title
US8463779B2 (en) Representative keyword selection
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US8015065B2 (en) Systems and methods for assigning monetary values to search terms
TWI461939B (en) Method, apparatus, computer-readable media, computer program product and computer system for supplementing an article of content
US7996400B2 (en) Identification and use of web searcher expertise
US8209277B2 (en) Predicting the outcome of events based on related internet activity
US7831474B2 (en) System and method for associating an unvalued search term with a valued search term
US7987261B2 (en) Traffic predictor for network-accessible information modules
US8656264B2 (en) Dynamic aggregation and display of contextually relevant content
US7747612B2 (en) Indication of exclusive items in a result set
JP5507469B2 (en) Providing content using stored query information
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20090077065A1 (en) Method and system for information searching based on user interest awareness
JP5634401B2 (en) Promotions on video sharing sites
KR100970335B1 (en) Method for updating interest keyword of user and system for executing the method
CN102037464A (en) Search results with most clicked next objects
US20100138419A1 (en) Method of Providing Moving Picture Search Service and Apparatus Thereof
JP2010113542A (en) Information provision system, information processing apparatus and program for the information processing apparatus
KR100987058B1 (en) Method and system for providing advertising service using the keywords of internet contents and program recording medium
JP5115059B2 (en) Keyword classifier
US20130211912A1 (en) System, apparatus and method for providing advertisement based on user interest information
US20090292998A1 (en) Aggregating and sharing keys of web pages over page viewers
KR20090099439A (en) Keyword advertising method and system based on meta information of multimedia contents information
KR20110043568A (en) Keyword Advertising Method and System Based on Meta Information of Multimedia Contents Information like Ccommercial Tags etc.
JP2008276640A (en) Keyword prediction system and keyword prediction method