JP2007183903A - Trend information analyzer - Google Patents

Trend information analyzer Download PDF

Info

Publication number
JP2007183903A
JP2007183903A JP2006090223A JP2006090223A JP2007183903A JP 2007183903 A JP2007183903 A JP 2007183903A JP 2006090223 A JP2006090223 A JP 2006090223A JP 2006090223 A JP2006090223 A JP 2006090223A JP 2007183903 A JP2007183903 A JP 2007183903A
Authority
JP
Japan
Prior art keywords
trend
keyword
value
articles
trend value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006090223A
Other languages
Japanese (ja)
Inventor
Masao Yamamoto
正男 山本
Hiroyuki Kawakita
裕之 川喜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2006090223A priority Critical patent/JP2007183903A/en
Publication of JP2007183903A publication Critical patent/JP2007183903A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a trend information analyzer which supplying trend information being useful for planning a forward-looking business strategy and management strategy. <P>SOLUTION: This trend information analyzer comprises: a keyword extraction means 20 for accessing a first web site group through a network and extracting keywords; a means 30 for accessing a second web site group through the network and extracting article information containing the extracted keywords; counting means 41, 42 for counting the number of extracted articles for each predetermined date for each keyword and accumulating the counted number of articles; a trend value calculating means 43 for calculating a trend value indicative of an attention level to each keyword based on the counted number of articles; and a means 60 for ranking the extracted keywords using the calculated trend values and listing up the keywords in the descending order of larger trend values. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、放送や報道の分野において広く流通するキーワードのトレンド情報を分析するトレンド情報分析装置及び記録媒体に関するものである。   The present invention relates to a trend information analyzing apparatus and a recording medium for analyzing trend information of keywords widely distributed in the fields of broadcasting and news reporting.

放送や通信といった所謂ICT(Information and Communication Technology )分野においては、技術革新や事業開発のスピードが急速であり、これらのトレンドを把握しておくことは、事業者が経営戦略や事業戦略を立案する上で重要である。経営戦略や事業戦略のトレンド把握のための情報収集手段として、インターネットが大いに活用されており、所望の情報をパソコンのブラウザソフトで世界中のホームページから検索し、閲覧することができる。   In the so-called ICT (Information and Communication Technology) field such as broadcasting and communication, the speed of technological innovation and business development is rapid, and it is important for operators to formulate management strategies and business strategies. Is important above. The Internet is widely used as a means of collecting information for trending management strategies and business strategies, and desired information can be searched and browsed from homepages around the world using browser software on personal computers.

インターネットを利用したトレンド解析システムとして、インターネット上のホームページで話題となっているニュースを複数のニュースサイトから収集し、収集したデータから単語を抽出し、抽出された単語の使用頻度を調べ、使用頻度の高い順に選択してトレンド解析を行うシステムが提案されている(例えば、特許文献1参照)。   As a trend analysis system using the Internet, news that is the topic of Internet homepages is collected from multiple news sites, words are extracted from the collected data, the frequency of use of the extracted words is examined, and the frequency of use A system that performs trend analysis by selecting in descending order has been proposed (see, for example, Patent Document 1).

特開2002−108937号公報JP 2002-108937 A

インターネットのホームページから情報収集する場合、検索エンジン(サーチエンジン)によって所望の情報に関連する記事をキーワード検索できるが、検索結果として提供されるホームページの数は必ずしも少なくない。各ホームページを一つ一つ閲覧して情報収集する作業は甚だ煩雑であるばかりでなく、収集した情報からICTのトレンドを正確に解析できない場合もある。   When collecting information from homepages on the Internet, a search engine (search engine) can perform a keyword search for articles related to desired information, but the number of homepages provided as search results is not necessarily small. The operation of browsing each homepage one by one and collecting information is not only complicated, but there are cases where the trend of ICT cannot be accurately analyzed from the collected information.

上記特許文献に記載のトレンド解析システムでは、インターネットで配信されるニュース中で話題性の高いニュースを短時間で検索できる利点があるが、新製品の開発や事業戦略上重要な話題や事象の将来的なトレンドや動向を解析する上で限界がある。すなわち、検索を行う時点における話題やニュースを把握できるが、時系列的な要素から判断して将来的なトレンド傾向を予測するには満足できる効果を得るに至っていないものである。特に、トレンド値を将来的に予測することは、事業戦略や経営戦略上極めて有益である。   The trend analysis system described in the above-mentioned patent document has the advantage of being able to quickly search for highly topical news in the news distributed on the Internet, but the future of topics and events that are important in the development of new products and business strategies. There is a limit in analyzing general trends and trends. That is, although the topic and news at the time of the search can be grasped, a satisfactory effect has not yet been obtained for predicting a future trend tendency based on time-series factors. In particular, predicting the trend value in the future is extremely useful in terms of business strategy and management strategy.

本発明の目的は、将来的な事業戦略や経営戦略を立案する上で有益なトレンド情報を提供できるトレンド情報分析装置を提供することにある。
本発明の別の目的は、過去のトレンド値の時系列から将来的な予測トレンド値を算出して画面表示できるトレンド値情報分析装置を提供することにある。
さらに、本発明の別の目的は、事業戦略や新製品の開発等に有益なトレンド情報分析プログラムが記録された記録媒体を提供することにある。
An object of the present invention is to provide a trend information analysis apparatus capable of providing trend information useful for planning future business strategies and management strategies.
Another object of the present invention is to provide a trend value information analysis apparatus capable of calculating a future predicted trend value from a time series of past trend values and displaying it on the screen.
Furthermore, another object of the present invention is to provide a recording medium on which a trend information analysis program useful for business strategy, new product development, and the like is recorded.

本発明によるトレンド情報分析装置は、ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出手段と、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを含む記事情報を抽出する手段と、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数手段と、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出手段と、
前記抽出されたキーワードについて、算出されたトレンド値を用いて順位付けし、トレンド値の高い順に一覧表示する手段とを具えることを特徴とする。
A trend information analysis apparatus according to the present invention includes a keyword extraction unit that accesses a first WEB site group via a network and extracts a keyword;
Means for accessing the second website group via the network and extracting article information including the extracted keyword;
Counting means for counting the number of articles extracted for each keyword in units of a predetermined date, and accumulating the counted number of articles;
A trend value calculating means for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
The extracted keywords are ranked using the calculated trend values, and are displayed in a list in descending order of the trend values.

本発明では、各種キーワードについて、種々のWEBサイトにおける使用頻度の変化に基づいてトレンド値を算出し、一覧表示しているから、各種キーワードの注目度の変化を確実に把握することが可能である。特に、経時的な変化量に基づいてトレンド値が決定されるので、将来的な予測を加味したトレンド情報を提供することができる。   In the present invention, trend values are calculated for various keywords based on changes in usage frequency on various websites and displayed in a list, so it is possible to reliably grasp changes in the attention level of various keywords. . In particular, since the trend value is determined based on the amount of change over time, it is possible to provide trend information that takes into account future predictions.

本発明による情報分析装置の好適実施例は、トレンド値算出手段は、抽出されたキーワードについて、日単位、週単位又は月単位を含む所定の期日単位の記事の個数の増減量を計数し、計数された増減量をトレンド値とすることを特徴とする。キーワードに関連する記事の個数の増減量は、当該キーワードの注目度の経過日数に対する1階微分値に相当するものであるから、各キーワードの注目度の変化を明瞭に把握することができる。   In a preferred embodiment of the information analysis apparatus according to the present invention, the trend value calculation means counts the increase / decrease amount of the number of articles in a predetermined date unit including the daily unit, the week unit or the monthly unit for the extracted keyword. The increased or decreased amount is used as a trend value. The amount of increase / decrease in the number of articles related to the keyword corresponds to the first-order differential value with respect to the number of days of attention degree of the keyword, so that the change in the degree of attention of each keyword can be clearly grasped.

本発明によるトレンド情報分析装置の別の好適実施例は、トレンド値算出手段は、日単位、週単位又は月単位を含む所定の期日単位の記事数の増減量を計数し、計数された増減量の差分値を計数し、計数された差分値をトレンド値とすることを特徴とする。増減量の差分値は、注目度の加速度的な変化を示す値であるから、キーワードの注目度を将来的観点から予測する上で極めて有益なトレンド情報を得ることができる。   In another preferred embodiment of the trend information analyzing apparatus according to the present invention, the trend value calculating means counts the amount of increase / decrease in the number of articles in a predetermined date unit including daily unit, week unit or monthly unit, and the calculated increase / decrease amount The difference value is counted, and the counted difference value is used as a trend value. Since the difference value of the increase / decrease amount is a value indicating an acceleration change in the degree of attention, trend information that is extremely useful in predicting the degree of attention of the keyword from a future viewpoint can be obtained.

本発明によるトレンド情報分析装置の別の好適実施例は、キーワードの一覧表示は、付加情報として、トレンド値及び関連する記事の出所源情報を含むことを特徴とする。最新記事の出所源情報として、記事が掲載されているURLを用いることができる。   Another preferred embodiment of the trend information analysis apparatus according to the present invention is characterized in that the keyword list display includes, as additional information, trend values and source information of related articles. As the source information of the latest article, the URL where the article is posted can be used.

本発明によるプログラムは、ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出ステップと、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを用いて検索し、これらのキーワードを含む記事情報を抽出するステップと、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数ステップと、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出ステップと、
前記抽出されたキーワードについて、算出されたトレンド値を用いて順位付けし、トレンド値の高い順に一覧表示するステップとを実行する。
A program according to the present invention includes a keyword extraction step of accessing a first WEB site group via a network and extracting a keyword;
Accessing the second website group via the network, searching using the extracted keywords, and extracting article information including these keywords;
For each of the keywords, a counting step of counting the number of extracted articles in a predetermined date unit and accumulating the counted number of articles;
A trend value calculating step for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
The extracted keywords are ranked using the calculated trend values, and a list is displayed in descending order of the trend values.

本発明によるトレンド情報分析装置は、ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出手段と、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを含む記事情報を抽出する手段と、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数手段と、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出手段と、
算出されたトレンド値をキーワード毎に時系列で保持する手段と、
トレンド値の時系列からトレンド値の予測関数を算出する手段と、
得られた予測関数に基づいて予測トレンド値を求める手段とを具えることを特徴とする。
A trend information analysis apparatus according to the present invention includes a keyword extraction unit that accesses a first WEB site group via a network and extracts a keyword;
Means for accessing the second website group via the network and extracting article information including the extracted keyword;
Counting means for counting the number of articles extracted for each keyword in units of a predetermined date, and accumulating the counted number of articles;
A trend value calculating means for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
Means for holding the calculated trend value in time series for each keyword;
A means for calculating a trend value prediction function from a trend value time series;
Means for obtaining a predicted trend value based on the obtained prediction function.

トレンド値の予測関数を算出する手段は、時系列を変数xとした一次又は多次の関数y(x)を用い、当該関数y(x)について、当該関数値と前記トレンド値の時系列との最小二乗誤差を最小化する関数y(x)の係数を算出し、算出された係数を前記関数y(x)に代入して予測関数とすることを特徴とする。   The means for calculating the prediction function of the trend value uses a primary or multi-order function y (x) with the time series as a variable x, and for the function y (x), the function value and the time series of the trend value The coefficient of the function y (x) that minimizes the least square error is calculated, and the calculated coefficient is substituted into the function y (x) to obtain a prediction function.

好適実施例においては、関数y(x)として、式y(x)=ax+bで表される一次関数を用い、当該一次関数の係数a及びb求め、得られた係数aに基づいて予測トレンド動向を決定することを特徴とする。この場合、予測トレンド動向として、上昇、下降、横ばいを表すイラスト図形を用いて画面表示することができる。   In the preferred embodiment, a linear function represented by the equation y (x) = ax + b is used as the function y (x), and the coefficients a and b of the linear function are obtained, and the predicted trend trend is based on the obtained coefficient a. It is characterized by determining. In this case, the predicted trend trend can be displayed on the screen using illustration figures representing ascending, descending, and leveling.

本発明では、放送や報道の分野において注目されている各種キーワードについて、各種WEBサイトにおける使用頻度の変化に基づいてトレンド値を算出して一覧表示しているから、各種キーワードの注目度の変化を容易に把握することが可能である。従って、事業戦略の立案、新サービスの開発やネーミングに対して有益なトレンド情報を提供することが可能である。
さらに、本発明では、トレンド値の時系列からトレンド値予測関数を算出しているので、過去のトレンド値の変化と共に将来的なトレンド値の予測動向を画面表示することが可能である。
In the present invention, trend values are calculated and displayed based on changes in the frequency of use on various websites for various keywords that are attracting attention in the field of broadcasting and news reports. It is possible to grasp easily. Therefore, it is possible to provide trend information useful for business strategy planning, new service development and naming.
Furthermore, in the present invention, since the trend value prediction function is calculated from the time series of the trend values, it is possible to display on the screen the predicted trend values of the future trend values along with changes in the past trend values.

図1は本発明によるトレンド情報分析システムの全体構成を示す線図である。本発明によるトレンド情報分析装置1はインターネット網2に接続する。インターネット網2には、第1のWEBサイト群3a〜3nが接続されている。これらのサイトは、例えば注目されている各種キーワードを一覧表示しているホームページを有するサイトとし、トレンド情報分析装置1はサイト3a〜3nのホームページにアクセスすることにより注目されている各種キーワードを抽出する。さらに、インターネット網2には、第2のWEBサイト群4a〜4mが接続されている。これらのサイトは、例えば報道機関、放送機関、出版社等の各種ニュースサイトとする。尚、第1のサイト群のサイトと第2のサイト群のサイトは、一部オーバラップしても良い。トレンド情報分析装置は、インターネット網2を介して第2のサイト4a〜4mにアクセスして、第1のサイト群から抽出したキーワードが含まれる記事、ニュース、イベント情報等を抽出する。さらに、インターネット網2には、端末装置5a〜5lが接続され、これら端末装置からインターネット網2を介してトレンド情報分析装置にアクセスして、トレンド情報分析装置1に掲載されているトレンド情報を閲覧することができる。   FIG. 1 is a diagram showing the overall configuration of a trend information analysis system according to the present invention. The trend information analysis apparatus 1 according to the present invention is connected to the Internet network 2. The Internet network 2 is connected to first web site groups 3a to 3n. These sites are, for example, sites having a home page displaying a list of various keywords of interest, and the trend information analysis apparatus 1 extracts various keywords of interest by accessing the home pages of the sites 3a to 3n. . Furthermore, the second web site group 4 a to 4 m is connected to the Internet network 2. These sites are, for example, various news sites such as news media, broadcasting organizations, and publishers. The first site group site and the second site group site may partially overlap. The trend information analysis apparatus accesses the second sites 4a to 4m via the Internet network 2 and extracts articles, news, event information, and the like including the keywords extracted from the first site group. Further, terminal devices 5 a to 5 l are connected to the Internet network 2, and the trend information analysis device 1 is accessed from these terminal devices via the Internet network 2 to view the trend information posted on the trend information analysis device 1. can do.

トレンド情報の作成に際し、本発明によるトレンド情報分析装置は、初めに、第1のサイト群にアクセスし、インターネット上で話題性が高く使用頻度の高い各種キーワードを抽出する。話題性が高いか否かの客観性を担保するため、第1のサイト群は、複数のサイトを含むことが望ましいが、1つのサイトの場合であっても良い。次に、トレンド情報分析装置は、第2のサイト群にアクセスし、第1のサイト群から抽出したキーワードを用いて、抽出したキーワードを含む報道記事、放送記事、出版物、各種評論等を検索し、キーワードを含む記事情報を抽出する。さらに、抽出された記事の個数に基づいて各種キーワードの注目度を表すトレンド値を算出する。   When creating trend information, the trend information analysis apparatus according to the present invention first accesses the first site group and extracts various keywords that are highly topical and frequently used on the Internet. The first site group preferably includes a plurality of sites in order to ensure the objectivity of whether the topicality is high or not, but it may be a single site. Next, the trend information analyzer accesses the second site group, and uses the keywords extracted from the first site group to search for news articles, broadcast articles, publications, various reviews, etc. including the extracted keywords. Then, the article information including the keyword is extracted. Furthermore, a trend value representing the degree of attention of various keywords is calculated based on the number of extracted articles.

図2は、トレンド情報分析装置の一例を示す線図である。トレンド情報分析装置は、通信部10、キーワード取得ブロック20、記事情報取得ブロック30、トレンド値算出ブロック40、記事情報検索ブロック50、表示画面情報生成ブロック60、及びメモリ部70を有する。インターネット網を介して各種のWEBサイトとの間の通信及び端末装置との間での通信は通信部10を介して行う。   FIG. 2 is a diagram illustrating an example of a trend information analysis apparatus. The trend information analysis apparatus includes a communication unit 10, a keyword acquisition block 20, an article information acquisition block 30, a trend value calculation block 40, an article information search block 50, a display screen information generation block 60, and a memory unit 70. Communication with various WEB sites and communication with terminal devices via the Internet network are performed via the communication unit 10.

キーワード取得ブロック20はキーワード取得部21を有し、インターネット網を介して予め指定した第1のWEBサイト群にアクセスして注目されているキーワードを取得する。第1のサイト群のURLは第1のURL登録部22に予め登録しておき、登録されたURLを用いてサイト群にアクセスする。尚、キーワード入力部23により、手動で必要なキーワードを入力することも可能である。   The keyword acquisition block 20 includes a keyword acquisition unit 21 and accesses a first web site group designated in advance via the Internet network to acquire a keyword attracting attention. The URL of the first site group is registered in advance in the first URL registration unit 22, and the site group is accessed using the registered URL. In addition, it is also possible to input a required keyword manually by the keyword input part 23. FIG.

取得されたキーワード情報は、記事情報取得ブロック30に送出する。記事情報取得ブロック30は記事情報取得部31を有し、インターネット網を介して第2のWEBサイト群にアクセスし、取得されたキーワードを含む記事情報を抽出する。記事情報の取得に際し、第2のサイト群の各サイトは予め指定したサイトとし、これらサイトのURLを第2のURL登録部32に登録しておく。   The acquired keyword information is sent to the article information acquisition block 30. The article information acquisition block 30 includes an article information acquisition unit 31, accesses the second WEB site group via the Internet network, and extracts article information including the acquired keyword. When acquiring article information, each site in the second site group is designated as a pre-designated site, and the URLs of these sites are registered in the second URL registration unit 32.

取得された記事情報は、トレンド値算出ブロック40に送出する。トレンド値算出ブロック40は、キーワード取得ブロック20から供給されるキーワード情報及び記事情報取得ブロック30から供給される記事情報を受け取り、各キーワードのトレンド値を算出する。トレンド値算出ブロックは、記事数計数部41を有し、各キーワードについて取得された記事の個数を日単位で計数する。計数された記事の個数のデータは記事数蓄積部42に送出し、各キーワード毎に例えば日単位、週単位又は月単位のように所定の期日単位で関連する記事数を蓄積し、記事数蓄積データを作成する。算出された記事の個数及び記事数蓄積データは、トレンド値算出部43にも供給する。トレンド値算出部は、これらのデータに基づいてトレンド値を算出する。トレンド値の算出方法として、各キーワード毎に、例えば日単位、週単位又は月単位で記事数の増減量を算出する。この記事数の増減量は、各キーワードが掲載された記事の個数の変化分すなわち1階微分値に相当する。このように、各キーワードの関連する記事の個数をそのまま表すのではなく、微分値記事の個数の変化分である微分値を用いて表すことによりキーワードの注目度がどのように変化しているか把握でき、事業計画等に関して時系列的な要素を含めて判断することができる。   The acquired article information is sent to the trend value calculation block 40. The trend value calculation block 40 receives the keyword information supplied from the keyword acquisition block 20 and the article information supplied from the article information acquisition block 30, and calculates the trend value of each keyword. The trend value calculation block has an article count section 41 and counts the number of articles acquired for each keyword on a daily basis. Data of the counted number of articles is sent to the article number storage unit 42, and for each keyword, for example, the number of related articles is accumulated on a predetermined date basis such as daily, weekly, or monthly, and the number of articles is accumulated. Create data. The calculated number of articles and the accumulated article number data are also supplied to the trend value calculation unit 43. The trend value calculation unit calculates a trend value based on these data. As a trend value calculation method, the amount of increase or decrease in the number of articles is calculated for each keyword, for example, on a daily, weekly, or monthly basis. The increase / decrease amount of the number of articles corresponds to a change in the number of articles in which each keyword is posted, that is, a first-order differential value. In this way, instead of directly representing the number of articles related to each keyword, it is possible to grasp how the attention level of the keyword is changing by using the differential value that is the change in the number of differential value articles. It is possible to make judgments including time-series factors regarding business plans.

別のトレンド値として、日単位、週単位又は月単位の増減量の差分値を計数し、計数された差分値をトレンド値とすることも可能である。増減量の差分値は、各キーワードと関連する記事の個数の変化量についての2階微分値に相当するから、関連する記事数の伸び率の加速度的な変化として把握することができる。   As another trend value, it is also possible to count the difference value of the increase / decrease amount in units of days, weeks, or months, and use the counted difference value as the trend value. Since the difference value of the increase / decrease amount corresponds to the second-order differential value for the change amount of the number of articles related to each keyword, it can be grasped as an acceleration change in the growth rate of the number of related articles.

算出されたトレンド値は、順位付け部44に供給し、各キーワードをトレンド値の高い順に順位付けを行う。順位付けされた各キーワード及び各トレンド値は表示画面作成ブロック60に供給する。   The calculated trend value is supplied to the ranking unit 44, and the keywords are ranked in descending order of the trend value. Each ranked keyword and each trend value are supplied to the display screen creation block 60.

記事情報取得ブロック30において取得された各キーワードを含む記事情報は、記事情報検索ブロック50に送出する。この記事情報検索ブロックは記事情報検索部51を有し、各キーワードを含む関連する記事やニュースを検索する。そして、URL取得部52において記事情報の出所源である当該記事のURLを取得する。例えば、最新の日付の5件の記事についてそれらのURLを抽出する。尚、検索エンジンとしては、WEBサイト上に検索エンジンが備えられている場合、その検索エンジンを利用することができる。   Article information including each keyword acquired in the article information acquisition block 30 is sent to the article information search block 50. This article information search block has an article information search unit 51 and searches for related articles and news including each keyword. Then, the URL acquisition unit 52 acquires the URL of the article that is the source of the article information. For example, the URLs of five articles with the latest date are extracted. In addition, as a search engine, when a search engine is provided on a WEB site, the search engine can be used.

記事情報検索ブロックで取得された各キーワードの関連記事のURLは、表示画面作成ブロック60に送出する。表示画面作成ブロックは、キーワード情報、各キーワードのトレンド値、及び関連する記事情報を受け取り、表示画面を作成する。図3は、順位付けされたキーワードの一覧表示の一例を示す。図3において、左側より順に、トレンド値の高い順に、キーワード、トレンド値、及び最新記事のURLを表示する。このように、トレンド値の高い順に一覧表示することにより、注目されているキーワードの変化を明瞭に把握することができ、サービス開発、新サービスのネーミング等の判断に有益な情報を提供することができる。尚、図3に示す例は一例であり、種々の変形が可能である。例えば、順位として前回の順位を併せて表示することも可能である。また、トレンド値として1階微分値を用いた場合、注目度の伸び率の加速度的な変化を示す2階微分値を付加情報として併記することも可能である。さらに、日単位の増減量、週単位の増減量、及び月単位の増減量をトレンド値として用いた3種類の一覧表示を個別に作成することも可能である。   The URL of the related article of each keyword acquired in the article information search block is sent to the display screen creation block 60. The display screen creation block receives the keyword information, the trend value of each keyword, and related article information, and creates a display screen. FIG. 3 shows an example of a list display of ranked keywords. In FIG. 3, the keywords, trend values, and URLs of the latest articles are displayed in descending order of the trend value from the left side. In this way, by displaying the list in descending order of trend values, it is possible to clearly grasp the changes in the keywords that are attracting attention, and to provide useful information for determining service development, naming of new services, etc. it can. Note that the example shown in FIG. 3 is an example, and various modifications are possible. For example, it is also possible to display the previous ranking as the ranking. Further, when the first-order differential value is used as the trend value, it is also possible to write the second-order differential value indicating the acceleration change in the interest rate growth rate as additional information. Furthermore, it is also possible to individually create three types of list displays using the daily increase / decrease amount, the weekly increase / decrease amount, and the monthly increase / decrease amount as trend values.

図4は本発明によるトレンド情報分析プログラムの一例を示すフローチャートである。
第1のステップS1において、登録されているURLアドレス情報を用いて第1のWEBサイト群にアクセスしてキーワード情報を抽出する。
次に、第2のWEBサイト群にアクセスし、抽出したキーワードを含む報道記事、放送記事、出版物、評論等を抽出する(ステップ2:S2)。
次に、キーワード毎に、抽出された記事数を所定の期日単位で計数すると共に所定の期日単位で蓄積する(ステップ3:S3)。
次に、計数された記事数に基づいてキーワードの注目度を表すトレンド値を算出する(ステップ4:S4)。
最後に、抽出されたキーワードについて、算出されたトレンド値の高い順に一覧表示する(ステップ5:S5)。
FIG. 4 is a flowchart showing an example of the trend information analysis program according to the present invention.
In the first step S1, keyword information is extracted by accessing the first web site group using the registered URL address information.
Next, the second web site group is accessed to extract news articles, broadcast articles, publications, reviews, etc. including the extracted keywords (step 2: S2).
Next, for each keyword, the number of articles extracted is counted in a predetermined date unit and stored in a predetermined date unit (step 3: S3).
Next, a trend value representing the degree of attention of the keyword is calculated based on the counted number of articles (step 4: S4).
Finally, the extracted keywords are listed in descending order of the calculated trend value (step 5: S5).

本発明によるトレンド情報分析装置は、ソフトウェアとして構成することが可能である。従って、上述した工程をプログラムとして記録媒体に記録し、当該プログラムをコンピュータにより実施させることが可能である。   The trend information analysis apparatus according to the present invention can be configured as software. Therefore, it is possible to record the above-described steps as a program on a recording medium and to execute the program by a computer.

図5は本発明によるトレンド情報分析装置の変形例を示す線図である。尚、図2で用いた構成要素と同一の構成要素には同一符号を付して説明する。本例では、トレンド値の時系列から将来的なトレンド値の動向を予測するトレンド予測部80を設ける。トレンド予測部80は、算出されたトレンド値を受け取り、トレンド値の変化をトレンド時系列としてトレンド値時系列保持部81に保持する。トレンド時系列は、例えば日単位又は週単位で算出されたトレンド値を日単位又は週単位の情報として保持する。   FIG. 5 is a diagram showing a modification of the trend information analysis apparatus according to the present invention. It should be noted that the same components as those used in FIG. In this example, a trend prediction unit 80 that predicts future trend value trends from the trend value time series is provided. The trend prediction unit 80 receives the calculated trend value, and holds the trend value change in the trend value time series holding unit 81 as a trend time series. The trend time series holds, for example, a trend value calculated on a daily or weekly basis as information on a daily or weekly basis.

トレンド時系列は、予測関数算出部82に供給され、トレンド値の時系列から予測関数を算出する。予測関数の算出に際し、一例として、時系列を変数xとした一次又は多次の予備関数y(x)を用いる。予備関数の一例を以下に示す。
y(x)=ax+b
y(x)=cx+dx+ex+fx+g
尚、a〜gは係数である。
予測関数の算出に当たり、トレンド値時系列f(x)(1≦i≦n)と予備関数y(x)の関数値との間の最小二乗誤差を最小化する係数a〜gを同定する。そして、求められた係数を予備関数に代入して予測関数とする。
The trend time series is supplied to the prediction function calculation unit 82, and the prediction function is calculated from the time series of trend values. When calculating the prediction function, as an example, a primary or multi-order preliminary function y (x) with a time series as a variable x is used. An example of the preliminary function is shown below.
y (x) = ax + b
y (x) = cx 4 + dx 3 + ex 2 + fx + g
Here, a to g are coefficients.
In calculating the prediction function, the coefficients a to g that minimize the least square error between the trend value time series f (x i ) (1 ≦ i ≦ n) and the function value of the preliminary function y (x i ) are identified. To do. Then, the obtained coefficient is substituted into the preliminary function to obtain a prediction function.

高精度なトレンドの予測値ではなく、全体的なトレンドの概略動向を把握する場合、一次の予測関数を用い、係数aの値から上昇、横ばい、下降の判断をすることが可能である。すなわち、係数aが正の場合、トレンド値は上昇傾向にあり、係数aが零付近の場合横ばいと判断し、係数aが負の場合下降傾向にあると判断することができる。
上述した予測関数は一例であり、トレンドの時系列から他の予測関数を算出することも可能である。
When grasping the general trend of the overall trend rather than the predicted value of the high-precision trend, it is possible to determine whether the value is a rise, a level, or a fall from the value of the coefficient a using a primary prediction function. That is, when the coefficient a is positive, the trend value tends to increase, and when the coefficient a is near zero, it can be determined to be flat, and when the coefficient a is negative, it can be determined to be decreasing.
The above-described prediction function is an example, and other prediction functions can be calculated from the trend time series.

算出された予測関数はトレンド値算出部83に送出する。トレンド値算出部83では、算出された予測関数に将来的な期間、例えば1週間先又は1カ月先等の期間を入力し、予測トレンド値を算出する。予測トレンド値は、横軸に時系列をプロットし、縦軸にトレンド値をプロットした座標系を用いて表示することができる。この場合、過去のトレンドの時系列に予測されたトレンドを連続して表示する。また、上述したように、一次の予測関数を用い、予測関数の係数aの値を算出し、算出された係数値からトレンドの動向を判断することも可能である。   The calculated prediction function is sent to the trend value calculation unit 83. The trend value calculation unit 83 inputs a future period, for example, a period such as one week ahead or one month ahead, to the calculated prediction function, and calculates a predicted trend value. The predicted trend value can be displayed using a coordinate system in which a time series is plotted on the horizontal axis and the trend value is plotted on the vertical axis. In this case, the trend predicted in the time series of past trends is continuously displayed. As described above, it is also possible to calculate the value of the coefficient a of the prediction function using a primary prediction function, and determine the trend of the trend from the calculated coefficient value.

算出されたトレンド予測値又はトレンド動向を表すデータは表示画面生成ブロック60に送出し、表示画面データに変換する。表示画面例として、図6にグラフ表示の一例を示す。図6において、横軸は時系列を示し、縦軸はトレンド値を示す座標系としてトレンド値の時系列を示す。本例では、過去のトレンド値を示すトレンド時系列と共に予測されたトレンド時系列を連続した曲線として示す。尚、図6において、2006/2/14(2006年2月14日)以降の破線は予測されたトレンド値の時系列を示す。
また、図7にトレンド予測関数として一次関数を用いてトレンド動向を算出した場合の画面表示例を示す。
The calculated trend prediction value or data representing the trend trend is sent to the display screen generation block 60 and converted into display screen data. As an example of the display screen, FIG. 6 shows an example of a graph display. In FIG. 6, the horizontal axis indicates a time series, and the vertical axis indicates a time series of trend values as a coordinate system indicating the trend values. In this example, the trend time series predicted together with the trend time series indicating past trend values are shown as continuous curves. In FIG. 6, the broken lines after 2006/2/14 (February 14, 2006) indicate the time series of predicted trend values.
FIG. 7 shows a screen display example when the trend trend is calculated using a linear function as the trend prediction function.

本発明によるトレンド情報分析システムの全体構成を示す線図である。It is a diagram which shows the whole structure of the trend information analysis system by this invention. 本発明によるトレンド情報分析装置の一例を示す線図である。It is a diagram which shows an example of the trend information analyzer by this invention. トレンド情報の表示例を示す線図である。It is a diagram which shows the example of a display of trend information. 本発明によるトレンド情報分析プログラムの一例を示すフローチャートである。It is a flowchart which shows an example of the trend information analysis program by this invention. トレンド情報分析装置の変形例を示す線図である。It is a diagram which shows the modification of a trend information analyzer. トレンド値の時系列及び予測されたトレンド値の画面表示例を示す線図である。It is a diagram which shows the example of a screen display of the time series of a trend value, and the predicted trend value. トレンドの予測動向の画面表示例を示す線図である。It is a diagram which shows the example of a screen display of a trend prediction trend.

符号の説明Explanation of symbols

1 トレンド情報分析装置
2 インターネット網
3a〜3n 第1のサイト群
4a〜4m 第2のサイト群
5a〜5l 端末装置
10 通信部
20 キーワード取得ブロック
21 キーワード取得部
22 第1のURL登録部
23 入力部
30 記事情報取得ブロック
31 記事情報取得部
32 第2のURL登録部
40 トレンド値算出ブロック
41 記事数計数部
42 記事数蓄積部
43 トレンド値算出部
44 順位付け部
50 記事情報検索ブロック
51 記事情報検索部
52 URL取得部
60 表示画面生成ブロック
70 メモリ部
80 トレンド予測部
DESCRIPTION OF SYMBOLS 1 Trend information analyzer 2 Internet network 3a-3n 1st site group 4a-4m 2nd site group 5a-5l Terminal device 10 Communication part 20 Keyword acquisition block 21 Keyword acquisition part 22 First URL registration part 23 Input part 30 Article information acquisition block 31 Article information acquisition unit 32 Second URL registration unit 40 Trend value calculation block 41 Article number counting unit 42 Article number accumulation unit 43 Trend value calculation unit 44 Ranking unit 50 Article information search block 51 Article information search Unit 52 URL acquisition unit 60 display screen generation block 70 memory unit 80 trend prediction unit

Claims (10)

ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出手段と、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを含む記事情報を抽出する手段と、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数手段と、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出手段と、
前記抽出されたキーワードについて、算出されたトレンド値を用いて順位付けし、トレンド値の高い順に一覧表示する手段とを具えることを特徴とするトレンド情報分析装置。
Keyword extracting means for accessing the first WEB site group via the network and extracting keywords;
Means for accessing the second website group via the network and extracting article information including the extracted keyword;
Counting means for counting the number of articles extracted for each keyword in units of a predetermined date, and accumulating the counted number of articles;
A trend value calculating means for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
A trend information analysis apparatus comprising: means for ranking the extracted keywords using the calculated trend value, and displaying a list in descending order of the trend value.
請求項1に記載のトレンド情報分析装置において、前記トレンド値算出手段は、抽出されたキーワードについて、日単位、週単位又は月単位を含む所定の期日単位の記事数の増減量を計数し、計数された増減量をトレンド値とすることを特徴とするトレンド情報分析装置。   The trend information analysis device according to claim 1, wherein the trend value calculation unit counts an increase / decrease amount of articles in a predetermined date unit including a daily unit, a week unit, or a monthly unit for the extracted keyword. A trend information analyzing apparatus characterized in that the increased or decreased amount is used as a trend value. 請求項1に記載のトレンド情報分析装置において、前記トレンド値算出手段は、抽出されたキーワードについて、日単位、週単位又は月単位を含む所定の期日単位の記事数の増減量を計数し、計数された増減量の差分値を計数し、計数された差分値をトレンド値とすることを特徴とするトレンド情報分析装置。   The trend information analysis device according to claim 1, wherein the trend value calculation unit counts an increase / decrease amount of articles in a predetermined date unit including a daily unit, a week unit, or a monthly unit for the extracted keyword. A trend information analysis device that counts the difference value of the increased / decreased amount and sets the counted difference value as a trend value. 請求項1から3までのいずれか1項に記載のトレンド情報分析装置において、前記キーワードの一覧表示は、付加情報として、トレンド値及び関連する記事の出所源情報を含むことを特徴とするトレンド情報分析装置。   The trend information analysis apparatus according to any one of claims 1 to 3, wherein the keyword list display includes, as additional information, a trend value and source information of related articles. Analysis equipment. ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出ステップと、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを含む記事情報を抽出するステップと、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数ステップと、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出ステップと、
前記抽出されたキーワードについて、算出されたトレンド値を用いて順位付けし、トレンド値の高い順に一覧表示するステップとを実行するためのプログラム。
A keyword extraction step of accessing the first website group via the network and extracting keywords;
Accessing a second group of websites via a network and extracting article information including the extracted keywords;
For each of the keywords, a counting step of counting the number of extracted articles in a predetermined date unit and accumulating the counted number of articles;
A trend value calculating step for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
A program for ranking the extracted keywords using a calculated trend value and displaying a list in descending order of the trend value.
ネットワークを介して第1のWEBサイト群にアクセスしてキーワードを抽出するキーワード抽出手段と、
ネットワークを介して第2のWEBサイト群にアクセスし、抽出されたキーワードを含む記事情報を抽出する手段と、
前記キーワード毎に、抽出された記事の個数を所定の期日単位で計数し、計数された記事の個数を蓄積する計数手段と、
前記計数された記事の個数に基づいて各キーワードの注目度を表すトレンド値を算出するトレンド値算出手段と、
算出されたトレンド値をキーワード毎に時系列で保持する手段と、
トレンド値の時系列からトレンド値の予測関数を算出する手段と、
得られた予測関数に基づいて予測されたトレンド値又は予測されたトレンド動向を求める手段とを具えることを特徴とするトレンド情報分析装置。
Keyword extracting means for accessing the first WEB site group via the network and extracting keywords;
Means for accessing the second website group via the network and extracting article information including the extracted keyword;
Counting means for counting the number of articles extracted for each keyword in units of a predetermined date, and accumulating the counted number of articles;
A trend value calculating means for calculating a trend value representing the degree of attention of each keyword based on the counted number of articles;
Means for holding the calculated trend value in time series for each keyword;
A means for calculating a trend value prediction function from a trend value time series;
A trend information analysis apparatus comprising: a trend value predicted based on the obtained prediction function or a means for obtaining a predicted trend trend.
請求項6に記載のトレンド情報分析装置において、前記トレンド値の予測関数を算出する手段は、時系列を変数xとした一次又は多次の関数y(x)を用い、当該関数y(x)について、当該関数値と前記トレンド値の時系列との最小二乗誤差を最小化する係数を算出し、算出された係数を前記関数y(x)に代入して予測関数とすることを特徴とするトレンド情報分析装置。   7. The trend information analysis apparatus according to claim 6, wherein the means for calculating the prediction function of the trend value uses a first-order or multi-order function y (x) with a time series as a variable x, and the function y (x) A coefficient that minimizes the least square error between the function value and the time series of the trend value is calculated, and the calculated coefficient is substituted into the function y (x) to obtain a prediction function. Trend information analyzer. 請求項7に記載のトレンド情報分析装置において、前記関数y(x)として、式y(x)=ax+bで表される一次関数を用い、当該一次関数の係数aを求め、得られた係数aに基づいてトレンド値動向を決定することを特徴とするトレンド情報分析装置。   8. The trend information analysis apparatus according to claim 7, wherein a linear function represented by an expression y (x) = ax + b is used as the function y (x) to obtain a coefficient a of the linear function, and the obtained coefficient a A trend information analysis apparatus characterized in that a trend value trend is determined on the basis of the above. 請求項8に記載のトレンド情報分析装置において、前記トレンド動向として、上昇、下降、横ばいを表すイラスト図形を用いて画面表示することを特徴とするトレンド情報分析装置。   9. The trend information analyzing apparatus according to claim 8, wherein the trend information is displayed on the screen using illustration figures representing ascending, descending, and leveling as the trend trend. 請求項6から9までのいずれか1項に記載のトレンド情報分析装置において、
横軸に時系列を表示し、縦軸にトレンド値を表示した座標系を用い、過去のトレンド値の時系列及び予測されたトレンド値をグラフとして画面表示することを特徴とするトレンド情報分析装置。
In the trend information analysis device according to any one of claims 6 to 9,
A trend information analysis apparatus characterized in that a time series of a past trend value and a predicted trend value are displayed on a screen as a graph using a coordinate system in which a time series is displayed on a horizontal axis and a trend value is displayed on a vertical axis. .
JP2006090223A 2005-12-06 2006-03-29 Trend information analyzer Pending JP2007183903A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006090223A JP2007183903A (en) 2005-12-06 2006-03-29 Trend information analyzer

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005351915 2005-12-06
JP2006090223A JP2007183903A (en) 2005-12-06 2006-03-29 Trend information analyzer

Publications (1)

Publication Number Publication Date
JP2007183903A true JP2007183903A (en) 2007-07-19

Family

ID=38339919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006090223A Pending JP2007183903A (en) 2005-12-06 2006-03-29 Trend information analyzer

Country Status (1)

Country Link
JP (1) JP2007183903A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129121A (en) * 2007-11-21 2009-06-11 Chugoku Electric Power Co Inc:The Information presentation device and information presentation program
JP2011008335A (en) * 2009-06-23 2011-01-13 Fuji Xerox Co Ltd Information processor and program
JP2015162200A (en) * 2014-02-28 2015-09-07 株式会社日立ソリューションズ File management device
WO2021060967A1 (en) * 2019-09-27 2021-04-01 Mimos Berhad A system and method for predictive analytics of articles

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063189A (en) * 2000-08-22 2002-02-28 Hitachi Ltd Device for distributing information and, method for generating trend information
JP2002108937A (en) * 2000-09-27 2002-04-12 Tsukuba Multimedia:Kk System for analyzing and displaying latest trend of internet

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063189A (en) * 2000-08-22 2002-02-28 Hitachi Ltd Device for distributing information and, method for generating trend information
JP2002108937A (en) * 2000-09-27 2002-04-12 Tsukuba Multimedia:Kk System for analyzing and displaying latest trend of internet

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CSNG199800835004, 大久保 雅且, "WWW検索ログに基づくトレンド情報の抽出について", 情報処理学会研究報告, 19970523, Vol.97 No.49, 第23頁乃至第30頁, JP, 社団法人情報処理学会 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129121A (en) * 2007-11-21 2009-06-11 Chugoku Electric Power Co Inc:The Information presentation device and information presentation program
JP2011008335A (en) * 2009-06-23 2011-01-13 Fuji Xerox Co Ltd Information processor and program
JP2015162200A (en) * 2014-02-28 2015-09-07 株式会社日立ソリューションズ File management device
WO2021060967A1 (en) * 2019-09-27 2021-04-01 Mimos Berhad A system and method for predictive analytics of articles

Similar Documents

Publication Publication Date Title
KR101063364B1 (en) System and method for prioritizing websites during the web crawling process
Brügger When the present web is later the past: Web historiography, digital history, and internet studies
US10269024B2 (en) Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US8898150B1 (en) Collecting image search event information
JP4637969B1 (en) Properly understand the intent of web pages and user preferences, and recommend the best information in real time
CN108549569B (en) Method and equipment for searching information in application program
US7925991B2 (en) Systems, methods, and articles of manufacture for displaying user-selection controls associated with clusters on a GUI
US20080282186A1 (en) Keyword generation system and method for online activity
US20070271255A1 (en) Reverse search-engine
US7539674B2 (en) Systems and methods for adaptive scheduling of references to documents
US20070255754A1 (en) Recording, generation, storage and visual presentation of user activity metadata for web page documents
CN102855309B (en) A kind of information recommendation method based on user behavior association analysis and device
WO2008039542A2 (en) System and method of ad-hoc analysis of data
WO2011008848A2 (en) Activity based users&#39; interests modeling for determining content relevance
KR100859918B1 (en) Method and apparatus for evaluating searched contents by using user feedback and providing search result by utilizing evaluation result
CN103823907B (en) A kind of method, apparatus and engine for integrating online video resource address
US20100036733A1 (en) Method and system for dynamically updating online advertisements
US10102669B2 (en) Density sampling map labels
JP2007286833A (en) Advertisement distribution system and advertisement distribution program
EP1732013A1 (en) Method and device for searching a data unit in a database
JP2012009014A (en) Method, device and product for ranking influence of web site
US20140250118A1 (en) Information retrieval system, method, and program
JP4820147B2 (en) Attribute evaluation program, attribute evaluation system, and attribute evaluation method
KR20160104067A (en) Generating a news timeline and recommended news editions
JP2007183903A (en) Trend information analyzer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426