JP5526257B1 - Post data processing apparatus and post data processing method - Google Patents
Post data processing apparatus and post data processing method Download PDFInfo
- Publication number
- JP5526257B1 JP5526257B1 JP2013089296A JP2013089296A JP5526257B1 JP 5526257 B1 JP5526257 B1 JP 5526257B1 JP 2013089296 A JP2013089296 A JP 2013089296A JP 2013089296 A JP2013089296 A JP 2013089296A JP 5526257 B1 JP5526257 B1 JP 5526257B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- program
- tweet
- post
- posted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 203
- 238000003672 processing method Methods 0.000 title claims description 20
- 238000013523 data management Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 44
- 230000007717 exclusion Effects 0.000 claims description 27
- 238000011835 investigation Methods 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 7
- 238000011160 research Methods 0.000 description 13
- 238000013500 data storage Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000002354 daily effect Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
Abstract
【課題】テレビ番組へのツイート件数を調査するにあたり、取得した全ツイートデータの中から、上記テレビ番組に対するツイートデータを適切に特定する。
【解決手段】コンピュータ1が、ツイートデータ管理サーバ2側から取得したツイートデータに基づいて所定のテレビ番組へのツイート件数を調査する際に、下記(1)を満たすツイートデータ中、上記テレビ番組の放送時間を含む所定の時間帯に投稿されたデータ、及び、下記(2)を満たすツイートデータ中、上記テレビ番組の放送時間内に投稿されたツイートデータを用いて、上記テレビ番組へのツイート件数を調査する。
(1)上記テレビ番組を識別するためのハッシュタグを含むツイートを示すデータであること。
(2)上記テレビ番組の放送局を識別するためのハッシュタグを含むツイートを示すデータであること。
【選択図】図7In investigating the number of tweets for a television program, the tweet data for the television program is appropriately identified from all the acquired tweet data.
When a computer 1 investigates the number of tweets for a predetermined TV program based on the tweet data acquired from the tweet data management server 2, the tweet data satisfying the following (1) is included in the TV program. The number of tweets sent to the TV program using the tweets posted within the broadcast time of the TV program among the data posted in a predetermined time zone including the broadcast time and Tweet data satisfying the following (2) To investigate the.
(1) Data indicating a tweet including a hash tag for identifying the television program.
(2) Data indicating a tweet including a hash tag for identifying a broadcast station of the television program.
[Selection] Figure 7
Description
本発明は、投稿データ処理装置及び投稿データ処理方法に係り、特に、投稿データを保存する投稿データ管理サーバから取得した投稿データを処理する投稿データ処理装置及び投稿データ処理方法に関する。 The present invention relates to a posted data processing apparatus and a posted data processing method, and more particularly to a posted data processing apparatus and a posted data processing method for processing posted data acquired from a posted data management server that stores posted data.
近年、ソーシャルネットワークサービスやツイッター(登録商標。以下、同じ)を通じてテレビ番組やラジオ番組に対するコメントを投稿する人が増えてきている。ここで、各番組に関して、その投稿回数を調査することにより、当該番組に対する世間の関心や興味を知ることが可能となる。一方、投稿コメントを示すデータ(以下、投稿データ)の中から所定の番組に関する投稿データを抽出するうえで、当該番組に関連するキーワードをコメント中に含む投稿データを検索することになる。しかし、コメントの中で用いられる言葉は多様であるため、適当なキーワードを選定することができず、結果として、番組に対する投稿データを十分に収集し得ないという問題があった。 In recent years, an increasing number of people have posted comments on TV programs and radio programs through social network services and Twitter (registered trademark, hereinafter the same). Here, by investigating the number of postings for each program, it becomes possible to know public interest and interest in the program. On the other hand, when extracting post data relating to a predetermined program from data indicating a post comment (hereinafter referred to as post data), post data including a keyword related to the program in the comment is searched. However, since the words used in the comments are various, it is not possible to select an appropriate keyword, and as a result, there is a problem that post data for the program cannot be collected sufficiently.
以上の問題に対して、近年、番組に対する投稿データを収集するにあたり、適切なキーワードを用いて投稿データの検索を行う技術が開発されている(例えば、特許文献1参照)。特許文献1では、テレビ番組に対する投稿データを抽出するためにハッシュタグをキーワードとして用いて投稿データの検索を行う技術が開示されている。ここで、ハッシュタグとは、ツイッターの機能の一つであり、コメントに対して付与されるタグであり、符号#(ハッシュマーク)の後に予め決められた文字列を付けることにより構成される。そして、共通のハッシュタグによりタグ付けされた投稿コメントは、まとめて閲覧することが可能となる。
In response to the above problems, in recent years, a technique for searching for posted data using an appropriate keyword has been developed in collecting posted data for a program (see, for example, Patent Document 1).
より具体的に説明すると、例えば、テレビ番組の番組名や出演者名を組み込んだハッシュタグをキー情報として検索することにより、ネット上に存在する投稿データのうち、上記テレビ番組に対する投稿データを容易に抽出し収集することが可能となる。このような特徴を利用することで、特許文献1では、テレビ番組に対する投稿データを適切に収集し、以て、同テレビ番組に対する世間の関心を調査することが可能となる。
More specifically, for example, by searching a hashtag incorporating a program name or performer name of a TV program as key information, posted data for the TV program among the posted data existing on the network can be easily obtained. Can be extracted and collected. By utilizing such a feature, in
しかしながら、ハッシュタグは、投稿者であるツイッターユーザが任意に設定したものであるため、ハッシュタグをキー情報として投稿データを検索しようとしても、どの番組に対するツイートであるのかをハッシュタグから特定することが困難となってしまう可能性がある。このため、例えば、所定の番組への投稿回数を調査しようとした際に、取得した全投稿データの中から上記番組に対する投稿データが適切に特定されず、投稿回数を正しく調査することができなくなる虞がある。 However, since the hashtag is set arbitrarily by the Twitter user who is the contributor, even if you try to search for posted data using the hashtag as key information, you can identify which program is a tweet from the hashtag May become difficult. For this reason, for example, when trying to investigate the number of postings to a predetermined program, the posting data for the program is not properly specified from all the obtained posting data, and the number of postings cannot be correctly investigated. There is a fear.
そこで、本発明は、上記の問題に鑑みてなされたものであり、その目的は、取得した投稿データに基づいて所定の番組への投稿回数を調査するうえで、当該所定の番組に対する投稿データを適切に特定することが可能な投稿データ処理装置及び投稿データ処理方法を提供することにある。 Therefore, the present invention has been made in view of the above-described problems, and the purpose of the present invention is to investigate post data for a predetermined program when investigating the number of postings to the predetermined program based on the acquired post data. It is an object of the present invention to provide a post data processing apparatus and a post data processing method that can be appropriately specified.
前記課題は、本発明の投稿データ処理装置によれば、投稿データを保存する投稿データ管理サーバから取得した前記投稿データを処理する投稿データ処理装置であって、前記投稿データ管理サーバから取得した前記投稿データを記憶する処理を実行する記憶処理部と、該記憶処理部によって記憶された前記投稿データに基づいて、所定の番組への投稿回数を調査する処理を実行する調査処理部と、を備え、前記調査処理部は、少なくとも下記(1)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組の放送時間を含む所定の時間帯にある前記投稿データ、及び、下記(2)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組に対して予め設定された時間帯にある前記投稿データに基づいて、前記投稿回数を調査することで解決される。
(1)前記所定の番組を識別するための番組識別情報を含む投稿コメントを示す前記投稿データであること。
(2)前記所定の番組を放送する放送局を識別するための局識別情報を含む投稿コメントを示す前記投稿データであること。
According to the posted data processing apparatus of the present invention, the subject is a posted data processing apparatus that processes the posted data acquired from the posted data management server that stores the posted data, and that is acquired from the posted data management server. A storage processing unit that executes processing for storing post data; and a survey processing unit that executes processing for investigating the number of postings to a predetermined program based on the post data stored by the storage processing unit. The survey processing unit includes, in the posted data satisfying at least the following condition (1), the posted data in a predetermined time zone including a broadcast time of the predetermined program, and the following (2) Investigating the number of postings based on the posting data in the posting data satisfying the conditions, the posting time being in a preset time zone for the predetermined program It is solved.
(1) The post data indicating a post comment including program identification information for identifying the predetermined program.
(2) The posting data indicating a posting comment including station identification information for identifying a broadcasting station that broadcasts the predetermined program.
上記の構成では、所定の番組を識別するための番組識別情報と、所定の番組を放送する放送局を識別するための局識別情報とをキー情報として用いて、所定の番組に対する投稿データを抽出する。この際、上記の番組識別情報を含む投稿コメントを示す投稿データについては、当該番組の放送時間を含む所定の時間帯に投稿された分を、上記の局識別情報を含む投稿コメントを示す投稿データについては、所定の番組に対して予め設定された時間帯に投稿された分を、当該所定の番組に対する投稿データとして抽出する。このような手順により抽出された投稿データに基づいて、上記所定の番組への投稿回数を調査すれば、妥当な調査結果が得られるようになる。すなわち、本発明の装置により、投稿データに基づいて所定の番組への投稿回数を調査するうえで、取得した投稿データの中から上記所定の番組に対する投稿データを適切に特定することが可能となる。 In the above configuration, post data for a predetermined program is extracted using program identification information for identifying a predetermined program and station identification information for identifying a broadcasting station that broadcasts the predetermined program as key information. To do. At this time, for the posting data indicating the posting comment including the program identification information, the posting data indicating the posting comment including the station identification information is the portion posted in a predetermined time zone including the broadcast time of the program. For the predetermined program, a portion posted in a preset time zone is extracted as post data for the predetermined program. If the number of postings to the predetermined program is investigated based on the posting data extracted by such a procedure, a reasonable investigation result can be obtained. In other words, the device of the present invention can appropriately specify the posting data for the predetermined program from the acquired posting data when investigating the number of postings to the predetermined program based on the posting data. .
また、上記の投稿データ処理装置において、前記記憶処理部によって記憶された前記所定の番組に対する前記投稿データのうち、下記(3)乃至(7)の除外条件の中の少なくとも一つを満たす前記投稿データを前記調査処理部による処理において利用される前記投稿データから外す処理を実行するデータ除外処理部と、を更に有することとしてもよい。
(3)アカウントを特定する文字情報中に所定の文字列を含むアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。
(4)一定期間中における投稿回数が所定回数以上となっているアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。
(5)前記番組識別情報及び前記局識別情報のうちの少なくとも一方を複数含む前記投稿コメントを示す前記投稿データであること。
(6)前記番組識別情報と、該番組識別情報によって識別される番組を放送する放送局とは異なる放送局を示す前記局識別情報とを含む前記投稿コメントを示す前記投稿データであること。
(7)前記投稿コメントに対して所定期間内にフォローした他の投稿者の数が所定人数以上となったアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。
上記の構成であれば、番組に対する投稿回数を調査するうえで当該調査に不向きな投稿データ、例えば、特定の時間に自動的に投稿するアカウント(いわゆるボット)からの投稿データ、明らかに個人ではないアカウントからの投稿データ、また、番組に対するコメントではない投稿データを除外することが可能となる。この結果、番組に対する投稿回数の調査結果の信憑性が向上し、番組に対する世間の関心や興味等を適切に捉えることが可能となる。
なお、本発明では、番組への投稿回数を調査するにあたり、当該番組を識別するための番組識別情報を含む投稿コメントのデータに加えて、当該所定の番組を放送する放送局を識別するための局識別情報を含む投稿コメントのデータをも抽出するため、投稿データの抽出数が多くなる。この結果、抽出した投稿データの中に、上述した除外すべきデータが含まれてくる蓋然性が高くなるので、条件を設定して当該条件に該当する投稿データを除外するという構成がより有意義なものとなる。
In the posted data processing apparatus, the posted data that satisfies at least one of the following exclusion conditions (3) to (7) among the posted data for the predetermined program stored by the storage processing unit: The data processing unit may further include a data exclusion processing unit that executes processing for removing data from the posted data used in processing by the survey processing unit.
(3) The post data indicating the post comment posted under an account that includes a predetermined character string in the character information specifying the account.
(4) The posting data indicating the posting comment posted under an account in which the number of postings during a certain period is equal to or more than a predetermined number.
(5) The post data indicating the post comment including a plurality of at least one of the program identification information and the station identification information.
(6) The post data indicating the post comment including the program identification information and the station identification information indicating a broadcast station different from a broadcast station that broadcasts the program identified by the program identification information.
(7) The post data indicating the post comment posted under an account in which the number of other contributors who have followed the post comment within a predetermined period exceeds a predetermined number.
With the above configuration, posting data that is unsuitable for investigating the number of postings to a program, for example, posting data from an account (so-called bot) that automatically posts at a specific time, clearly not an individual It is possible to exclude post data from an account and post data that is not a comment on a program. As a result, the credibility of the survey result of the number of postings to the program is improved, and it is possible to appropriately capture the interests and interests of the public in the program.
In the present invention, when investigating the number of postings to a program, in addition to post comment data including program identification information for identifying the program, a broadcast station that broadcasts the predetermined program is identified. Since post comment data including station identification information is also extracted, the number of post data extraction is increased. As a result, there is a high probability that the extracted post data contains the data to be excluded, so it is more meaningful to set a condition and exclude post data corresponding to the condition It becomes.
また、上記の投稿データ処理装置において、前記投稿データ管理サーバにおいて前記投稿データは、投稿者の属性と関連付けられて保存されており、
前記調査処理部は、特定の前記属性に関連付けられた前記投稿データのみに基づき、前記投稿回数を調査する処理を実行することとしてもよい。特に、前記投稿データ管理サーバにおいて前記投稿データは、投稿者が居る地域と関連付けられて保存されており、前記調査処理部は、特定の前記地域に関連付けられた前記投稿データのみに基づき、前記投稿回数を調査する処理を実行すると、好適である。
以上の構成であれば、投稿者の属性、例えば、投稿者が居る地域別に投稿データを集計することが可能となる。これにより、例えば、地域によって放送される番組が異なるケースにも対応することが可能となる。
In the posted data processing apparatus, the posted data is stored in the posted data management server in association with the attribute of the poster.
The investigation processing unit may perform a process of examining the number of postings based only on the posting data associated with the specific attribute. In particular, in the post data management server, the post data is stored in association with an area where the poster is located, and the survey processing unit is based only on the post data associated with the specific area. It is preferable to execute processing for checking the number of times.
If it is the above structure, it will become possible to total | post contribution data according to the attribute of a contributor, for example, the area where a contributor exists. As a result, for example, it is possible to deal with a case where programs broadcast by regions differ.
また、上記の投稿データ処理装置において、前記番組識別情報及び前記局識別情報は、ハッシュタグであることとしてもよい。このとき、前記番組識別情報に相当する前記ハッシュタグは、前記所定の番組を識別するための前記ハッシュタグとして前記所定の番組の関係者若しくは前記投稿データ処理装置の利用者により指定された前記ハッシュタグであると好適である。さらに、前記所定の番組を識別するために前記利用者により指定された前記ハッシュタグは、前記利用者から前記所定の番組の関係者に通知されて承認された承認済みハッシュタグを含むと、より一層好適である。
以上の構成では、所定の番組に対する投稿データを抽出する際にハッシュタグをキー情報として用いるので、番組に対する投稿データを容易に抽出することが可能となる。また、番組を識別するためのハッシュタグとして当該番組の関係者や投稿データ処理装置の利用者により指定されたものを用いれば、より容易に当該番組に対する投稿データを抽出することが可能となる。さらに、投稿データ処理装置の利用者が指定する番組識別用のハッシュタグとして、投稿データ処理装置の利用者から番組の関係者に通知されて承認されたものを用いれば、例えば、上記のハッシュタグを番組のホームページ等から見つけてくる手間を要さず、キー情報として用いるハッシュタグを容易に決定することが可能となる。
In the posted data processing apparatus, the program identification information and the station identification information may be hash tags. At this time, the hash tag corresponding to the program identification information is the hash designated by the party of the predetermined program or the user of the posted data processing apparatus as the hash tag for identifying the predetermined program A tag is preferred. Further, the hashtag designated by the user for identifying the predetermined program includes an approved hashtag notified from the user to an authorized person of the predetermined program and approved. More preferred.
In the above configuration, since the hash tag is used as key information when extracting post data for a predetermined program, post data for the program can be easily extracted. If a hash tag for identifying a program is specified by a related party of the program or a user of the posted data processing device, it is possible to more easily extract posted data for the program. Further, as a hash tag for program identification designated by the user of the posted data processing device, if a tag notified to the program concerned by the user of the posted data processing device and approved is used, for example, the above hash tag Thus, it is possible to easily determine a hash tag used as key information without having to find the program from the homepage of the program.
また、前述した課題は、本発明の投稿データ処理方法によれば、コンピュータが投稿データを保存する投稿データ管理サーバから取得した前記投稿データを処理する投稿データ処理方法であって、前記コンピュータが、前記投稿データ管理サーバから取得した前記投稿データを記憶する処理と、記憶した前記投稿データに基づいて、所定の番組への投稿回数を調査する処理と、を実行し、前記投稿回数を調査する処理において、前記コンピュータは、少なくとも下記(1)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組の放送時間を含む所定の時間帯にある前記投稿データ、及び、下記(2)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組に対して予め設定された時間帯にある前記投稿データを前記所定の番組に対する前記投稿データに基づいて、前記投稿回数を調査する処理を実行することにより解決される。
(1)前記所定の番組を識別するための番組識別情報を含む投稿コメントを示す前記投稿データであること。
(2)前記所定の番組を放送する放送局を識別するための局識別情報を含む投稿コメントを示す前記投稿データであること。
以上の処理方法であれば、投稿データに基づいて所定の番組への投稿回数を調査するうえで、取得した投稿データの中から上記所定の番組に対する投稿データを適切に特定することが可能となる。
Further, the above-described problem is a post data processing method for processing the post data acquired from a post data management server in which a computer stores post data, according to the post data processing method of the present invention, wherein the computer includes: Processing for storing the posting data acquired from the posting data management server and processing for investigating the number of postings to a predetermined program based on the stored posting data, and processing for investigating the number of postings In the above, the computer includes, in the post data satisfying at least the following condition (1), the post data in a predetermined time zone including a broadcast time of the predetermined program, and a condition of the following (2) In the posted data satisfying the above, the posted data having a posted time in a time zone set in advance for the predetermined program is converted into the predetermined program. Based on the posted data against, it is solved by executing the processing to investigate the post number.
(1) The post data indicating a post comment including program identification information for identifying the predetermined program.
(2) The posting data indicating a posting comment including station identification information for identifying a broadcasting station that broadcasts the predetermined program.
With the above processing method, it is possible to appropriately specify post data for the predetermined program from the acquired post data when investigating the number of postings to the predetermined program based on the post data. .
本発明の投稿データ処理装置及び投稿データ処理方法では、所定の番組を識別するための番組識別情報と、所定の番組を放送する放送局を識別するための局識別情報とをキー情報として用いて、所定の番組に対する投稿データを抽出する。この際、上記の番組識別情報を含む投稿コメントを示す投稿データについては、当該番組の放送時間を含む所定の時間帯に投稿された分を、上記の局識別情報を含む投稿コメントを示す投稿データについては、所定の番組に対して予め設定された時間帯に投稿された分を、当該所定の番組に対する投稿データとして抽出する。このような手順により抽出された投稿データに基づいて、上記所定の番組への投稿回数を調査すれば、妥当な調査結果が得られるようになる。
以上の結果、投稿データ処理装置及び投稿データ処理方法により、投稿データに基づいて所定の番組への投稿回数を調査するうえで、当該所定の番組に対する投稿データを適切に特定することが可能となる。
In the posted data processing apparatus and posted data processing method of the present invention, program identification information for identifying a predetermined program and station identification information for identifying a broadcasting station that broadcasts the predetermined program are used as key information. Then, post data for a predetermined program is extracted. At this time, for the posting data indicating the posting comment including the program identification information, the posting data indicating the posting comment including the station identification information is the portion posted in a predetermined time zone including the broadcast time of the program. For the predetermined program, a portion posted in a preset time zone is extracted as post data for the predetermined program. If the number of postings to the predetermined program is investigated based on the posting data extracted by such a procedure, a reasonable investigation result can be obtained.
As a result, the posting data processing apparatus and the posting data processing method can appropriately specify posting data for the predetermined program when investigating the number of postings to the predetermined program based on the posting data. .
<<本発明の投稿データ処理装置の概要>>
本発明の投稿データ処理装置の概要について、図1乃至6を参照しながら説明する。
本発明の投稿データ処理装置は、番組、特にテレビ番組に対するツイートの件数を調査するシステム(以下、調査システム)Sを構成する機器の一つに相当する。ここで、番組とは、予め設定されたタイムスケジュールに従って所定の放送局から放送される音声情報や映像情報のことであり、ある放送時間帯で放送される番組には、当該番組の本編のみならず、同放送時間帯中に放送される広告(コマーシャル)も含まれる。
<< Outline of Posted Data Processing Apparatus of the Present Invention >>
An outline of the posted data processing apparatus of the present invention will be described with reference to FIGS.
The posted data processing apparatus of the present invention corresponds to one of the devices constituting a system (hereinafter referred to as a survey system) S for surveying the number of tweets for a program, particularly a television program. Here, the program refers to audio information and video information broadcast from a predetermined broadcasting station according to a preset time schedule, and a program broadcast in a certain broadcast time zone includes only the main part of the program. In addition, advertisements (commercials) broadcast during the same broadcast time period are also included.
具体的に説明すると、図1に示すように、上記の調査システムSには、テレビ番組を放送する放送局(テレビ局)と、テレビ番組に対してツイートする視聴者と、視聴者が所有する情報端末からツイートデータを受信するデータ管理会社と、テレビ番組に対するツイート件数を調査するデータ調査会社とが関与している。これらのうち、データ調査会社は、本発明の投稿データ処理装置の一例であるツイートデータ処理装置1を保有している。つまり、データ調査会社は、投稿データ処理装置の利用者であり、ツイートデータ処理装置1は、データ調査会社の本社に設置されたコンピュータにより構成される。ここで、投稿データ処理装置の利用者とは、ツイートデータ処理装置1を用いてツイート件数の調査を実行する会社のみならず、例えば、当該会社の調査作業を支援する関連会社、当該会社にツイート件数の調査を委託する会社、当該会社の事業方針を決定する親会社を含む概念である。
Specifically, as shown in FIG. 1, the survey system S includes a broadcasting station (television station) that broadcasts a TV program, a viewer that tweetes about the TV program, and information that the viewer owns. A data management company that receives tweet data from a terminal and a data research company that investigates the number of tweets for a TV program are involved. Among these, the data research company has a tweet
そして、データ調査会社は、ツイートデータ処理装置1を用いて、各テレビ番組に関するツイートデータをデータ管理会社から取得し、取得したツイートデータに基づいて各テレビ番組に対するツイートの件数を調査し、その調査結果を放送局に報告する。ここで、テレビ番組に対するツイート件数の調査結果の報告先については、当該テレビ番組の放送局に限定されず、調査結果の提供を希望する他の企業、例えば、テレビ番組のスポンサー会社や広告代理店、番組出演者やその所属事務所、テレビ番組の原作を出版する出版社、テレビ番組として放送された劇場映画の配給会社、番組中で流れた音楽のレコード制作会社などであってもよい。
Then, the data survey company uses the tweet
以下、テレビ番組に対するツイート件数の調査に関する内容及び流れについて説明する。なお、テレビ番組に対するツイート件数の調査に係る一連の処理は、毎日繰り返し実行されるが、説明を簡単にするために、以下では、ある日(以下、放送当日)に放送されるテレビ番組に対するツイート件数を調査するケースを具体例に挙げて説明する。 In the following, the contents and flow regarding the investigation of the number of tweets for a television program will be described. Note that a series of processes related to the investigation of the number of tweets for a television program is repeatedly executed every day, but in order to simplify the explanation, in the following, tweets for a television program broadcast on a certain day (hereinafter referred to as broadcast day) A case of investigating the number of cases will be described as a specific example.
ツイートとは、情報サービスである「ツイッター」を利用して投稿することができる140文字以内の短文のことであり、投稿コメントの一例に相当する。また、ツイートデータとは、上記ツイートを示すデータであり、投稿データの一例に相当する。ツイートデータについて図2を参照しながら説明すると、ツイートデータは、ツイート本文の他に、ツイートがなされた日時(ツイート日時)、ツイートを投稿するために投稿者が取得したアカウントを示すID(ツイートID)、投稿者に関する情報(投稿者情報)、投稿者の現在位置の緯度及び経度、ツイートを投稿するために起動しているアプリケーションソフトを示す情報(アプリケーション)を含む。 A tweet is a short sentence of 140 characters or less that can be posted using “Twitter”, an information service, and corresponds to an example of a posted comment. The tweet data is data indicating the tweet and corresponds to an example of post data. The tweet data will be described with reference to FIG. 2. The tweet data includes, in addition to the tweet text, the date and time (tweet date and time) when the tweet was made, and an ID (tweet ID) indicating the account acquired by the contributor to post the tweet. ), Information on the poster (poster information), latitude and longitude of the current location of the poster, and information (application) indicating application software activated to post a tweet.
そして、テレビ番組の視聴者は、スマートフォンやタブレット等の情報端末を通じてツイートを投稿することが可能である。具体的に説明すると、視聴者は、視聴中のテレビ番組に対してツイートを投稿するにあたり、上記の情報端末においてツイート投稿用のアプリケーションを起動させる。このアプリケーションを起動させる方法の一つとしては、例えば、放送局からテレビ番組の映像信号と重畳して配信される番組情報信号を展開して番組情報を表示させ、当該番組情報を利用して上記のアプリケーションを起動させる方法が考えられる。 And the viewer of a television program can post a tweet through information terminals, such as a smart phone and a tablet. More specifically, the viewer activates an application for posting a tweet on the information terminal when posting a tweet to the television program being viewed. As one of the methods for starting this application, for example, a program information signal distributed from a broadcast station and superimposed on a video signal of a TV program is developed to display program information, and the program information is used to display the program information. The method of starting the application of can be considered.
より詳しく説明すると、表示した番組情報中には、図3に示すように2次元バーコード情報が含まれており、当該バーコード情報を上記の情報端末で読み取ることによりツイート投稿用のアプリケーションが起動するようになる。かかるアプリケーションが起動すると、図4に図示するようなツイート入力欄が上記の情報端末のディスプレイに表示される。視聴者は、当該入力欄にコメント(テキスト)を入力してから投稿ボタン(図4中、「ツイート」と表示されたボタン)を押すことにより、ツイートを投稿するようになる。
なお、ツイート投稿用のアプリケーションを起動させる方法としては、上述した2次元バーコード情報を読み取る方法の他にも考えられる。例えば、テレビ番組の映像信号に電子透かし情報が埋め込まれており、投稿者が当該テレビ番組を視聴している間に情報端末にて上記の電子透かし情報を展開する処理を実行することでツイート投稿用のアプリケーションを起動させることとしてもよい。
More specifically, the displayed program information includes two-dimensional barcode information as shown in FIG. 3, and an application for posting a tweet is activated by reading the barcode information with the information terminal. Will come to do. When such an application is activated, a tweet input field as shown in FIG. 4 is displayed on the display of the information terminal. The viewer enters a tweet by inputting a comment (text) in the input field and then pressing a posting button (a button displayed as “tweet” in FIG. 4).
In addition, as a method of starting the application for posting a tweet, other than the method of reading the above-described two-dimensional barcode information, it can be considered. For example, digital watermark information is embedded in the video signal of a television program, and a tweet is posted by executing the above-described processing of expanding the digital watermark information on the information terminal while the poster is watching the television program It is also possible to start an application for use.
そして、投稿者による投稿作業がなされた結果、ツイートを示すデータが、視聴者の情報端末から送信されデータ管理会社側で受信される。受信されたデータは、ツイートデータとしてデータ管理会社側で保存され管理されるようになる。なお、視聴者の情報端末から送信されるデータは、ツイートデータの原データとなっており、当該原データに対してデータ管理会社側で所定の付加情報(例えば、フォロー数や被フォロー数等)が付加されることでツイートデータを構成するようになる。 As a result of the posting work by the contributor, data indicating a tweet is transmitted from the viewer's information terminal and received by the data management company. The received data is stored and managed as tweet data on the data management company side. The data transmitted from the viewer's information terminal is the original data of the tweet data, and predetermined additional information (for example, the number of followers and the number of followers) on the original data on the data management company side. The tweet data is configured by adding.
一方、データ調査会社は、図5に示すように、ツイートデータ処理装置1を用いて放送当日に放送されるすべてのテレビ番組について、各テレビ番組に対するツイートデータをデータ管理会社側から取得する。なお、放送当日に放送されるテレビ番組とは、放送当日のAM5時から翌日のAM5時までの間に放送されるテレビ番組のことである。
On the other hand, as shown in FIG. 5, the data research company acquires tweet data for each television program from the data management company side for all television programs broadcast on the broadcast day using the tweet
ここで、データ管理会社は、ツイートの内容を問わず、すべてのツイートデータを管理している。そして、本実施形態に係るツイートデータ処理装置1は、データ管理会社が管理している全ツイートデータの中から放送当日に投稿された分のデータを取得する。
Here, the data management company manages all the tweet data regardless of the content of the tweet. And the tweet
また、ツイートデータ処理装置1は、放送当日に取得したツイートデータに基づいて、放送当日に放送されたテレビ番組へのツイート件数を調査する。ここで、ツイートデータ処理装置1が放送当日に取得したツイートデータは、同日にデータ管理会社側で保管されたデータであり、そのツイート内容は玉石混合となっている。このため、ツイートデータ処理装置1は、放送当日に放送されたテレビ番組へのツイート件数を調査するにあたり、同日に取得したツイートデータの中から上記テレビ番組に対するツイートデータを抽出する。この際、ツイートデータ抽出用のキー情報としてハッシュタグが利用される。
Moreover, the tweet
ハッシュタグについて説明すると、符号#(ハッシュマーク)の後に予め決められた文字列を付けることにより構成されるものであり、例えば、図4中の「#オレ達おもろ〜族」がハッシュタグに相当する。また、ハッシュタグが付されたツイートは、当該ハッシュタグ中、#以降の文字列が示す内容(図4の例では、テレビ番組「オレ達おもろ〜族」に関するものであると判別できる。 The hash tag will be described. The hash tag is configured by adding a predetermined character string after the code # (hash mark). For example, “#Otaru Omoro ~ Family” in FIG. 4 corresponds to the hash tag. To do. In addition, it is possible to determine that the tweet to which the hash tag is attached relates to the content indicated by the character string after # in the hash tag (in the example of FIG. 4, the television program “Otata Omoro ~ Family”).
したがって、テレビ番組に関連する言葉を組み込んだハッシュタグをキー情報としてツイートデータを検索すれば、上記テレビ番組に対するツイートデータを抽出することが可能となる。一方、テレビ番組に対するツイートデータを抽出するために設定されるハッシュタグとしては、例えば、テレビ番組自体を識別するためのもの(以下、番組用タグ)と、テレビ番組を放送する放送局を識別するためのもの(以下、局用タグ)とが挙げられる。ここで、番組用タグは、テレビ番組を識別するための番組識別情報に相当し、局用タグは、当該テレビ番組を放送する放送局を識別するための局識別情報に相当する。
なお、上記2つのハッシュタグのうち、番組用タグは、図5に示すように放送当日の1日前(放送前日)までに決定され、決定された番組用タグは、ユーザ(テレビ番組の視聴者)に対して公開される。
Therefore, if tweet data is searched using a hash tag incorporating a word related to a television program as key information, the tweet data for the television program can be extracted. On the other hand, as a hash tag set for extracting tweet data for a television program, for example, a tag for identifying the television program itself (hereinafter referred to as a program tag) and a broadcasting station that broadcasts the television program are identified. (Hereinafter referred to as a station tag). Here, the program tag corresponds to program identification information for identifying a television program, and the station tag corresponds to station identification information for identifying a broadcasting station that broadcasts the television program.
Of the two hash tags, the program tag is determined one day before the broadcast day (the day before the broadcast) as shown in FIG. 5, and the determined program tag is the user (the viewer of the TV program). ).
そして、放送当日、視聴者は、視聴中のテレビ番組に対してツイートを投稿する際、同番組について公開された番組用タグを使用してツイートを投稿する。一方、ツイートデータ処理装置1は、放送当日に投稿されたツイートデータをデータ管理会社から取得し、取得した全ツイートデータの中から上記番組用タグをキー情報として抽出することで、当該番組用タグが示すテレビ番組に対するツイートデータを特定するようになる。
Then, on the day of the broadcast, when the viewer posts a tweet with respect to the TV program being viewed, the viewer posts a tweet using the program tag that has been released for the program. On the other hand, the tweet
一方、視聴者は、視聴中のテレビ番組に対してツイートを投稿する際、番組用タグとともにあるいは番組用タグの代わりに、同番組を放送する放送局(厳密には、局名又はそれに相当する名称)を示す文字列を含むハッシュタグ、すなわち、局用タグを使用してツイートを投稿する場合がある。この局用タグは、番組用タグと同様、ツイートデータ処理装置1が放送当日に取得したツイートデータの中からテレビ番組(厳密には、局用タグが示す放送局で放送されるテレビ番組)に対するツイートデータを抽出する際のキー情報として利用される。
On the other hand, when a tweet is posted on a TV program that is being viewed, the viewer broadcasts the program together with the program tag or instead of the program tag (strictly speaking, the station name or the equivalent) There is a case where a tweet is posted using a hash tag including a character string indicating (name), that is, a station tag. As with the program tag, this station tag is for a TV program (strictly, a TV program broadcast on the broadcast station indicated by the station tag) from the tweet data acquired by the tweet
なお、本実施形態において、放送当日に放送された各テレビ番組に対するツイート件数の調査は、放送翌日(放送当日の次の日)の所定の時間、例えば、昼間帯にツイートデータ処理装置1を用いて行われる。
In the present embodiment, the number of tweets for each TV program broadcast on the broadcast day is checked by using the tweet
そして、調査結果は、図6に示す調査日報という形式で放送局に提出される。調査日報には、放送当日に放送されたテレビ番組について、番組ジャンル、1分あたりのツイート件数、前四週平均ツイート件数、終了時ツイート件数、ジャンル平均ツイート件数が掲載されるとともに、番組平均世帯視聴率や前四週平均世帯視聴率が掲載される。 Then, the survey results are submitted to the broadcasting station in the form of a survey daily report shown in FIG. The survey daily report shows the program genre, the number of tweets per minute, the average number of tweets in the previous four weeks, the number of tweets at the end, the average number of tweets in the genre, and the average household viewing of the program. Rate and average household audience rating for the previous four weeks.
1分あたりのツイート件数は、テレビ番組に対するツイート件数の集計値を当該テレビ番組の放送分数で除したものである。ここで、テレビ番組に対するツイート件数の集計値とは、当該テレビ番組を識別するためのハッシュタグ(番組用タグ)を含むツイートのうち、放送時間内及び放送時間前後の一定時間中に投稿されたツイートの件数と、上記テレビ番組を放送する放送局を識別するためのハッシュタグ(局用タグ)を含むツイートのうち、放送時間内に投稿されたツイートの件数とを合算した値である。
前四週平均ツイート件数は、1分あたりのツイート件数の、先週以前の過去四週分の算出結果を合算して4で除したものである。なお、1分あたりのツイート件数の過去分の算出結果とは、今週分を算出したときに適用したテレビ番組の放送時間帯と同一の時間帯で過去に算出した1分あたりのツイート件数のことである。
終了時ツイート件数とは、テレビ番組の放送終了時点(厳密には、放送終了時刻を含む1分間)のツイート件数である。
ジャンル平均ツイート件数とは、同一ジャンルのテレビ番組について上述したツイート件数の集計値を合計し、当該合計値を同一ジャンルのテレビ番組の数で除したものである。
The number of tweets per minute is the total number of tweets for a television program divided by the number of minutes broadcast for that television program. Here, the total value of the number of tweets for a TV program is posted within a broadcast time and within a certain time before and after the broadcast time among tweets including a hash tag (program tag) for identifying the TV program. It is a value obtained by adding together the number of tweets and the number of tweets posted within the broadcast time among tweets including a hash tag (station tag) for identifying a broadcasting station that broadcasts the television program.
The average number of tweets for the previous four weeks is the sum of the calculation results for the past four weeks before the previous week of the number of tweets per minute, divided by 4. The calculation result of the number of tweets per minute in the past is the number of tweets per minute calculated in the past in the same time zone as the broadcast time of the TV program applied when this week's amount was calculated. It is.
The number of tweets at the end is the number of tweets at the end of broadcasting the television program (strictly speaking, one minute including the broadcast end time).
The genre average tweet count is obtained by adding up the total values of the tweet counts described above for TV programs of the same genre and dividing the total value by the number of TV programs of the same genre.
番組平均世帯視聴率及び前四週平均世帯視聴率に関する情報は、視聴率調査会社から入手可能であり、データ調査会社は、放送当日に放送されたテレビ番組のツイート件数を調査するにあたり、視聴率調査会社から上記視聴率の情報を入手する。なお、データ調査会社と視聴率調査会社とは、互いに異なる会社であってもよく、同一の会社であってもよい。 Information on the average household audience rating of the program and the average household audience rating for the previous four weeks is available from the audience rating survey company, and the data survey company conducts an audience rating survey to investigate the number of tweets of TV programs broadcast on the broadcast day. Obtain the rating information from the company. Note that the data research company and the audience rating research company may be different companies or the same company.
ツイートデータ処理装置1は、以上の調査項目、特にツイート件数に関する項目を、放送当日に放送されたテレビ番組に対するものとして取得したツイートデータを集計することによって調査し、その結果を図6に図示した日報の形式で放送局に報告する。
The tweet
<<調査システムの基本構成>>
次に、ツイートデータ処理装置1を含む調査システムSの基本構成について、図7を参照しながら説明する。
調査システムSは、データ調査会社が管理するツイートデータ処理装置1、データ管理会社が保有するツイートデータ管理サーバ2、視聴者がツイートを投稿するために用いる情報端末(以下、ユーザ端末)3、放送局が保有する端末(以下、放送局端末4)、及び、データ調査会社若しくはその関連会社が保有するパラメータ通知装置5を主な構成要素として有する。
<< Basic structure of survey system >>
Next, the basic configuration of the survey system S including the tweet
The survey system S includes a tweet
ツイートデータ処理装置1は、インターネット等の通信ネットワークに接続された機器と通信可能であり、例えば、放送局端末4と通信して、テレビ番組に対するツイート件数の調査結果を示すデータ(調査結果データ)を放送局端末4に送信する。
The tweet
ツイートデータ管理サーバ2は、投稿データ管理サーバに相当し、インターネット等の通信ネットワークを通じてユーザ端末3から送信されてくるツイートのデータを受信し、当該データに所定の情報を付加してツイートデータとして保存する。そして、ツイートデータ処理装置1は、インターネット等の通信ネットワークを通じてツイートデータ管理サーバ2と通信することで同サーバ2に保管されたツイートデータを取得する。
The tweet
具体的に説明すると、ツイートデータ処理装置1は、テレビ番組に関するツイートデータを取得するにあたり、ツイートデータ管理サーバ2が提供するAPI(Application Programming Interface)を利用する。このAPIは、ストリーミングAPIであり、ツイートデータ管理サーバ2と一度接続するとHTTP接続を維持したまま自動的にツイートデータを配信し続けるためのAPIである。かかるストリーミングAPIを利用することにより、ツイートデータをリアルタイム(ツイートの投稿時と略同じ時間)で取得することが可能となる。
More specifically, the tweet
そして、ツイートデータ処理装置1は、放送当日の所定時刻(例えば、AM5時)にツイートデータ管理サーバ2に向けてリクエストデータを送信することにより、ストリーミングAPIによるツイートデータの取得を開始する。なお、本実施形態では、図7に示すように、ツイートデータ処理装置1とツイートデータ管理サーバ2との間に、PCからなる中継機器6が介在している。この中継機器6は、ストリーミングAPIにてツイートデータを取得し、同データを一時的に内部メモリに記憶した後にツイートデータ処理装置1に引き渡す。つまり、本実施形態において、ツイートデータ処理装置1は、中継機器6を経由してツイートデータ管理サーバ2からツイートデータを取得する。ただし、これに限定されるものではなく、ツイートデータ処理装置1がツイートデータ管理サーバ2から直接ツイートデータを取得することとしてもよい。
Then, the tweet
また、本実施形態において、中継機器6がストリーミングAPIによりツイートデータ管理サーバ2から取得したツイートデータのうち、ツイートデータ処理装置1に引き渡すデータについては所定のパラメータによって選別されたものに限定される。ここで、ツイートデータ選別用のパラメータとしては、放送当日に放送されたテレビ番組を識別するためのハッシュタグ(番組用タグ)や同テレビ番組を放送する放送局を識別するためのハッシュタグ(局用タグ)が含まれる。なお、本実施形態において、上記パラメータはパラメータ通知装置5から中継機器6に対して通知されることとなっている。すなわち、パラメータ通知装置5は、インターネット等の通信ネットワークを通じて中継機器6と通信し、パラメータを示すデータ(パラメータ通知データ)を送信する。パラメータ通知データを受信した中継機器6は、同データを解析してパラメータを特定し、放送当日にツイートデータ管理サーバ2から受信したツイートデータのうち、上記パラメータに合致するデータをツイートデータ処理装置1に引き渡す。
なお、パラメータ通知装置5によるパラメータ通知データの配信は、毎日所定時刻に行われ、中継機器6は、パラメータ通知データを受信する都度、上記のパラメータを特定し、当該パラメータを満たすツイートデータ、すなわち、ツイートデータ処理装置1に引き渡すツイートデータを選別する。
Further, in the present embodiment, among the tweet data acquired from the tweet
The parameter notification data is distributed by the
また、本実施形態では、中継機器6のバックアップとして、もう1台のツイートデータ取得用のコンピュータ(以下、予備装置)7が設けられている。この予備装置7は、ツイートデータ処理装置1や中継機器6とは異なる場所(例えば、データ調査会社の支社)に設置される一方で、中継機器6と同様、ストリーミングAPIによってツイートデータ管理サーバ2からツイートデータをリアルタイムに取得する。
In the present embodiment, another tweet data acquisition computer (hereinafter referred to as a spare device) 7 is provided as a backup for the
また、予備装置7も、中継機器6と同様、放送当日にツイートデータ管理サーバ2から取得したツイートデータのうち、所定のパラメータを満たしたデータをツイートデータ処理装置1に引き渡す。ここで、予備装置7が用いるパラメータと、中継機器6が用いるパラメータとは、当然ながら同一となっている必要がある。このため、中継機器6は、自己が用いるパラメータを示すデータ、すなわち、パラメータ通知データを予備装置7に向けて送信する。
Similarly to the
なお、本実施形態では、図7に示すように、中継機器6と予備装置7との間にFTPサーバ8が介在しており、予備装置7は、中継機器6から送信されたパラメータ通知データを、FTPサーバ8を介して受信する。また、予備装置7が上記パラメータを満たすツイートデータをツイートデータ処理装置1に引き渡す際、当該ツイートデータは、FTPサーバ8に一時的に記憶された後にツイートデータ処理装置1に引き渡される。
In this embodiment, as shown in FIG. 7, an
また、本実施形態では、中継機器6及び予備装置7の双方がツイートデータを取得できなくなる等の異常事態が発生した場合に備えて、過去1週間分のツイートデータをツイートデータ管理サーバ2から取得することとしている。かかるデータ取得は、ツイートデータ管理サーバ2が提供するAPIの一つであるサーチAPIを利用することで実行される。サーチAPIとは、ツイートデータ管理サーバ2内に保存された過去のツイートデータの中から、指定された条件に合致するツイートデータを検索して当該ツイートデータを取得するためのAPIである。
なお、サーチAPIによって取得したツイートデータについても中継機器6に一時的に記憶され、そのうち、所定のパラメータを満たすデータのみがツイートデータ処理装置1に引き渡されることとなっている。
このように、本実施形態では、放送当日に投稿されるツイートデータを取得するにあたり、異常時や緊急時に対して万全の措置が講じられており、上記のデータを取得し忘れてしまうのを防止することが可能である。
In the present embodiment, the tweet data for the past week is acquired from the tweet
The tweet data acquired by the search API is also temporarily stored in the
In this way, in this embodiment, when acquiring tweet data posted on the day of broadcasting, all measures are taken against abnormalities and emergencies to prevent forgetting to acquire the above data Is possible.
以上のように構成された調査システムSにおいて、ツイートデータの取得、ツイート件数の調査が行われる。その基本的な流れについて概説すると、放送当日分のツイートデータを取得するにあたり、先ず、各テレビ番組を識別するためのハッシュタグ(番組用タグ)、及び、各放送局を識別するためのハッシュタグ(局用タグ)をツイートデータ抽出用のキー情報として設定する。なお、本実施形態の場合、上記ハッシュタグのうち、テレビ番組を識別するための番組用タグについては、当該テレビ番組の公式ハッシュタグとして放送局(厳密には、上記テレビ番組を放送する放送局)が承認したものを用いることとしている。 In the survey system S configured as described above, acquisition of tweet data and survey of the number of tweets are performed. The basic flow will be briefly described. In obtaining tweet data for the day of broadcasting, first, a hash tag (program tag) for identifying each television program and a hash tag for identifying each broadcast station (Station tag) is set as key information for extracting tweet data. In the case of the present embodiment, among the hash tags, a program tag for identifying a television program is a broadcasting station (strictly speaking, a broadcasting station that broadcasts the television program) as an official hash tag of the television program. ) Is approved.
放送当日になると、同日に投稿されるツイートデータがツイートデータ管理サーバ2に保管される一方で、中継機器6や予備装置7がストリーミングAPIによって同データを取得する。そして、中継機器6や予備装置7は、放送当日に取得したツイートデータのうち、所定のパラメータを満たすデータをツイートデータ処理装置1に引き渡す。ここで、ツイートデータを選別するパラメータは、番組用タグ及び局用タグが含まれており、そのうちの少なくとも一方を含むツイートのデータがツイートデータ処理装置1に引き渡されることとなる。このようにツイートデータ処理装置1は、放送当日に投稿されたツイートデータの中から番組用タグ及び局用タグをキー情報として抽出されたデータを取得する。これにより、ツイートデータ処理装置1は、放送当日に投稿されたツイートデータの中から、同日に放送されたテレビ番組に対するツイートデータを取得するようになる。
On the day of broadcasting, while the tweet data posted on the same day is stored in the tweet
そして、放送当日に放送されるすべてのテレビ番組についてツイートデータの取得が完了した後、具体的には、放送翌日には、各テレビ番組へのツイート件数が調査される。このツイート件数の調査は、テレビ番組に対する世間の関心や興味を捉える目的で行われるものであり、具体的に説明すると、上記の調査では、各テレビ番組別にツイートデータの数を集計し、その集計結果から図6に図示した指標値を演算する処理を実行する。 Then, after the acquisition of tweet data is completed for all TV programs broadcast on the broadcast day, specifically, the number of tweets for each TV program is investigated on the next day of the broadcast. This survey of the number of tweets is conducted for the purpose of capturing public interest and interest in TV programs. Specifically, in the above survey, the number of tweets is counted for each TV program, and the total is calculated. From the result, a process of calculating the index value shown in FIG. 6 is executed.
ここで、各テレビ番組へのツイート件数を調査するにあたり、各テレビ番組に対するツイートデータを特定することになるが、本実施形態では、ツイート中に含まれるハッシュタグの種類と当該ツイートの投稿時間から、どのテレビ番組に対するツイートデータであるのかを特定している。具体的に説明すると、番組用タグ、あるいは、番組用タグ及び局用タグの双方を含むツイートデータについては、その投稿時間が当該テレビ番組の放送時間を含む所定の時間帯にあるものを上記テレビ番組に対するツイートデータとして特定する。これに対して、局用タグのみを含むツイートデータについては、その投稿時間が当該テレビ番組に対して予め設定された時間帯にあるものを上記テレビ番組に対するツイートデータとして特定する。 Here, when investigating the number of tweets for each TV program, the tweet data for each TV program is specified, but in this embodiment, the type of hash tag included in the tweet and the posting time of the tweet. , Which TV program the tweet data is for is specified. More specifically, with respect to tweet data including a program tag or both a program tag and a station tag, the tweet data whose posting time is in a predetermined time zone including the broadcast time of the TV program is described above. It is specified as tweet data for the program. On the other hand, for the tweet data including only the station tag, the tweet data for the television program is specified as the posting time in the time zone set in advance for the television program.
一方で、取得したツイートデータの中には、例えば、特定の時間に自動的に投稿するアカウント(いわゆるボット)からのもの、明らかに個人ではないアカウントからのもの、テレビ番組に対するツイートではないもののように、上記調査に不向きなツイートデータが含まれる。そこで、本実施形態では、上記のように調査に不向きなデータをツイートデータ処理装置1によって調査の事前に除外することとしている。当該データの除外の詳細については後述する。
On the other hand, the acquired tweet data includes, for example, those from accounts (so-called bots) that automatically post at a specific time, accounts from accounts that are clearly not individuals, and those that are not tweets about TV programs. Includes tweet data unsuitable for the above investigation. Therefore, in this embodiment, the data unsuitable for investigation as described above is excluded by the tweet
以上のように調査に不向きなデータを除外した後、放送当日に放送された各テレビ番組についてツイート件数の調査が行われ、最終的にその調査結果が放送局に報告される。 After removing data unsuitable for investigation as described above, the number of tweets is investigated for each TV program broadcast on the broadcast day, and the result of the investigation is finally reported to the broadcasting station.
<<本発明の投稿データ処理装置の特徴及びその有効性>>
次に、本発明の投稿データ処理装置であるツイートデータ処理装置1の特徴的構成とその有意性について説明する。
<< Characteristics and Effectiveness of Post Data Processing Apparatus of Present Invention >>
Next, the characteristic configuration and significance of the tweet
本実施形態に係るツイートデータ処理装置1における第1の特徴は、ある日に投稿されたツイートのデータの中から同日に放送されたテレビ番組に対するツイートのデータを抽出する際に、そのテレビ番組を識別するためのハッシュタグ(番組用タグ)のみならず、当該テレビ番組を放送する放送局を識別するためのハッシュタグ(局用タグ)をもキー情報として利用する点である。すなわち、あるテレビ番組に対するツイートの件数を調査する際には、当該テレビ番組の番組用タグを含むツイートに加えて、当該テレビ番組を放送する放送局の局用タグを含むツイートも集計するので、その分、当該テレビ番組に対するツイートの件数が多くなる。このように集計対象とするツイートを多くすることで、テレビ番組に対する番組に対する世間の反応をより的確に捉える事が可能となる。
The first feature of the tweet
ツイートデータ処理装置1における第2の特徴は、ツイートデータ抽出用のキー情報として利用するハッシュタグのうち、テレビ番組を識別するための番組用タグについては、放送局が承認したものとなっている点である。かかる構成により、ツイートデータ管理サーバ2に保存されたツイートデータの中から、テレビ番組に対する投稿データを容易に抽出することが可能となる。
The second feature of the tweet
より詳しく説明すると、ハッシュタグ(厳密には、番組用タグ)については、通常、投稿者が任意に設定するため、あるテレビ番組に対して複数のハッシュタグが設定される可能性がある。このため、あるテレビ番組に対するツイートデータを抽出するにあたり、キー情報としてのハッシュタグが適切に設定されてないと、同テレビ番組に対する世間の関心や興味を把握するうえで適当なツイートデータを収集し得なくなる虞がある。 More specifically, the hash tag (strictly speaking, a tag for a program) is usually set arbitrarily by a contributor, and therefore a plurality of hash tags may be set for a certain TV program. Therefore, when extracting the tweet data for a certain TV program, if the hash tag as key information is not set properly, the appropriate tweet data is collected in order to grasp the public interest and interest in the TV program. There is a risk that it will not be obtained.
これに対して、本実施形態では、テレビ番組に対するツイートデータを特定する際に用いるハッシュタグとしての番組用タグが、放送局に承認された承認済み番組用タグとなっている。そして、放送当日に投稿されたツイートデータのうち、承認済み番組用タグをキー情報として抽出されたデータをツイートデータ処理装置1に引き渡すこととしている。このように承認済み番組用タグをツイートデータ抽出用のキー情報として利用することにより、テレビ番組に対する世間の関心や興味を把握するうえで十分なツイートデータを収集することが可能となる。具体的に説明すると、承認済み番組用タグは、そのテレビ番組の公式のハッシュタグとして認識されるので同テレビ番組の視聴者間で統一の番組用タグとして利用されるようになる。この結果、承認済み番組用タグをツイートデータ抽出用のキー情報として利用すれば、当該テレビ番組に対するものとして相当数のツイートデータを抽出してくることが可能となる。
On the other hand, in this embodiment, the program tag as a hash tag used when specifying tweet data for a television program is an approved program tag approved by the broadcasting station. Then, among the tweet data posted on the broadcast day, data extracted using the approved program tag as key information is delivered to the tweet
ここで、番組用タグを決定するまでの一連の流れについて説明すると、先ず、データ調査会社若しくはその関連会社が放送前日までに番組用タグの候補を決定する。かかる作業は、例えば、データ調査会社若しくはその関連会社の従業員がテレビ番組表やテレビ番組のホームページを参照することによって行われる。番組用タグの候補が決定した後には、図5に示すように、当該候補がデータ調査会社(若しくは関連会社)から放送局に通知される。より具体的に説明すると、決定した番組用タグの候補を示す通知メールがパラメータ通知装置5から放送局端末4に向けて送信される。放送局端末4が通知メールを受信すると、放送局において、通知メールから番組用タグの候補を確認し、当該候補の採否を検討する。
Here, a series of flows until the program tag is determined will be described. First, a data survey company or its affiliated company determines a program tag candidate by the day before the broadcast. Such work is performed, for example, by referring to a TV program guide or a TV program homepage by an employee of a data research company or an affiliated company. After the program tag candidate is determined, the candidate is notified from the data survey company (or affiliated company) to the broadcasting station as shown in FIG. More specifically, a notification mail indicating the determined program tag candidate is transmitted from the
そして、上記の候補を番組用タグとして承認する場合、その旨を示す返信メールが放送局端末4からパラメータ通知装置5に向けて送信される。パラメータ通知装置5が上記の返信メールを受信すると、データ調査会社(若しくは関連会社)において、自社が提案した番組用タグの候補が放送局により承認されたことを確認する。かかる時点をもって、公式の番組用タグ、すなわち、承認済み番組用タグが決定され、データ調査会社は当該承認済み番組用タグをパラメータ通知装置5に登録(記憶)させる。
なお、以上までに説明した番組用タグの候補を決定してから承認済み番組用タグを登録するまでの流れは、あくまでも一例に過ぎず、例えば、番組用タグの候補を示すデータを所定のサイト(ホームページ)にアップし同サイトを通じて番組情報を放送局に通知することとしてもよい。その上で、放送局がアップされた番組用タグの候補を上記のサイトで確認し、各候補に対する採用の可否を同サイド上で指定することとしてもよい。
When the above candidate is approved as a program tag, a reply mail indicating that fact is transmitted from the
The flow from the determination of the program tag candidate described above to the registration of the approved program tag is merely an example. For example, data indicating the program tag candidate is stored in a predetermined site. The program information may be notified to the broadcasting station through the website. After that, the program tag candidates for which the broadcast station has been uploaded may be confirmed on the above-mentioned site, and whether or not each candidate can be adopted may be designated on the same side.
また、本実施形態では、承認済み番組用タグが当該テレビ番組の視聴者に向けて公開され、同番組に対するツイートを投稿する際には、承認済み番組用タグがツイート中に自動的に組み込まれるようになっている。既出の図3及び4を参照しながら説明すると、テレビ番組(例えば、「オレ達おもろ〜族」という番組名のテレビ番組)を視聴中のユーザ(視聴者)は、当該テレビ番組の番組情報を表示し、その情報中に含まれる図3に図示の2次元バーコードをユーザ端末3によって読み取ることで、ツイート投稿用のアプリケーションを起動させる。アプリケーションが起動すると、ユーザ端末3のディスプレイに、図4に図示するようなツイート入力欄がディスプレイに表示されるようになる。この時点で、上記の入力欄には、視聴中のテレビ番組についての承認済み番組用タグ(図4中、「#オレ達おもろ〜族」)が自動的に入力されている。この結果、視聴者は、視聴中のテレビ番組に対するツイートを投稿する際、当該テレビ番組の番組用タグを自ら入力する手間が省け、容易に投稿することが可能となる。
In this embodiment, the approved program tag is released to the viewer of the TV program, and when posting a tweet for the program, the approved program tag is automatically incorporated in the tweet. It is like that. 3 and 4, the user (viewer) who is viewing a television program (for example, a television program with the program name “Otata Omoro ~ Family”) will receive the program information of the television program. The
なお、承認済み番組用タグの自動入力については、例えば、番組情報中に含まれる2次元バーコードを読み取ることでアプリケーションが起動する際、パラメータ通知装置5と通信して承認済み番組用タグを取得するようにユーザ端末3を制御するプログラムがアプリケーション中に組み込まれることで実現される。あるいは、上記2次元バーコード中に承認済み番組用タグの情報も含まれており、当該2次元バーコードを読み取ってアプリケーションが起動する際に併せて承認済み番組用タグの情報を取得し、上記アプリケーションに当該情報が引き渡されることで実現されることとしてもよい。
As for the automatic input of the approved program tag, for example, when the application is started by reading the two-dimensional barcode included in the program information, the approved program tag is acquired by communicating with the
ツイートデータ処理装置1における第3の特徴は、放送当日に投稿されたツイートデータをハッシュタグ及び投稿時間によってテレビ番組別に仕分ける点である。
具体的に説明すると、本実施形態では、上述の承認済み番組用タグの他、放送局を識別するためのハッシュタグ(局用タグ)の双方をツイートデータ抽出用のキー情報として用いる。すなわち、ツイートデータ処理装置1は、下記(1)及び(2)の条件のうち、少なくとも一方を満たすツイートデータをツイートデータ管理サーバ2から(厳密には、中継機器6や予備装置7を経由して)受信する。
(1)承認済み番組用タグを含むツイートを示すツイートデータであること。
(2)局用タグを含むツイートを示すツイートデータであること。
The third feature of the tweet
More specifically, in this embodiment, in addition to the approved program tag described above, both hash tags (station tags) for identifying broadcast stations are used as key information for extracting tweet data. That is, the tweet
(1) Tweet data indicating a tweet including an approved program tag.
(2) Tweet data indicating a tweet including a station tag.
ここで、承認済み番組用タグを含むツイートを示すツイートデータについては、その投稿時間に拘わらず、当該承認済み番組用タグによって識別されるテレビ番組、に対するツイートデータであると特定することができる。一方、テレビ番組の放送中並びに放送直前直後における世間の反応を捉える上で、上記テレビ番組に対するツイートデータ中、当該テレビ番組の放送時間を含む所定の時間帯にツイートデータ管理サーバ2に向けて送信されたツイートデータを取得するのが好適である。このため、ツイートデータ処理装置1は、承認済み番組用タグを含むツイートを示すツイートデータ中、その投稿時間が当該テレビ番組の放送時間並びに放送時間前後の一定時間(例えば、30分間)にあるツイートデータを、上記テレビ番組に対するツイートデータとして特定する。
Here, the tweet data indicating the tweet including the approved program tag can be specified as the tweet data for the television program identified by the approved program tag regardless of the posting time. On the other hand, when capturing the reaction of the world during the broadcast of the TV program and immediately before the broadcast, the tweet data for the TV program is transmitted to the tweet
局用タグを含むツイート(厳密には、局用タグを含み承認済み番組用タグを含まないツイート)を示すツイートデータについては、その投稿時間によって、どのテレビ番組に対するツイートデータであるのかを特定することができる。分かり易く説明すると、局用タグを含むツイートを示すツイートデータのうち、あるテレビ番組の放送時間内にツイートデータ管理サーバ2に向けて送信されたツイートデータが、上記あるテレビ番組に対するツイートデータということになる。このため、ツイートデータ処理装置1は、局用タグを含むツイートを示すツイートデータ中、その投稿時間がテレビ番組に対して設定された時間帯にあるツイートデータ、より厳密にはその放送時間内にあるデータを当該テレビ番組に対するツイートデータとして特定することとしている。ここで、局用タグを含むツイートを示すツイートデータの中からあるテレビ番組に対するツイートデータを抽出するために設定される時間帯については、あるテレビ番組の放送時間と一致していることが好ましいが、厳格に一致している必要はなく、例えば、あるテレビ番組の放送時間とは数分程度ずれている場合も含まれる。
For tweet data indicating a tweet including a station tag (strictly, a tweet including a station tag but not an approved program tag), the tweet data for which TV program is specified by the posting time be able to. If it explains clearly, the tweet data transmitted toward the tweet
以上のようにハッシュタグと投稿時間に応じてツイートデータを対応するテレビ番組に対するデータとして仕分けることにより、どのテレビ番組に対するツイートデータであるのかを適切に特定することが可能となる。また、本実施形態では、テレビ番組に対するツイートデータとして、当該テレビ番組の番組用タグを含むツイートを示すデータのみならず、当該テレビ番組を放送する放送局の局用タグを含むツイートを示すデータを含めているので、上記テレビ番組に対するツイートデータをより多く取得することが可能となる。 As described above, by sorting the tweet data as the data for the corresponding television program according to the hash tag and the posting time, it becomes possible to appropriately identify the tweet data for which television program. In the present embodiment, as tweet data for a TV program, not only data indicating a tweet including a program tag for the TV program but also data indicating a tweet including a station tag for a broadcasting station that broadcasts the TV program. Since it is included, it becomes possible to acquire more tweet data for the television program.
ツイートデータ処理装置1における第4の特徴は、ツイート件数の調査を行うにあたり、当該調査に不向きなツイートデータを除外する点である。
具体的に説明すると、上記の調査は、前述したように、テレビ番組に対する世間の関心や興味を捉える目的で行われるものであることから、実際の視聴者から投稿されたツイートの件数を調査する必要がある。一方、ツイートデータの中には、例えば、特定の時間に自動的に投稿するアカウント(いわゆるボット)からのもの、明らかに個人ではないアカウントからのもの、テレビ番組に対するツイートではないもの(例えば、番組出演者に向けたツイート)、特定アカウントへの誘導を目的としたもの等が含まれる。
A fourth feature of the tweet
Specifically, as mentioned above, the above survey is conducted for the purpose of capturing public interest and interest in TV programs, so the number of tweets posted by actual viewers is investigated. There is a need. On the other hand, some of the tweet data are, for example, from accounts (so-called bots) that automatically post at a specific time, from accounts that are clearly not individuals, or from tweets that are not TV programs (for example, programs) Tweets for performers), and those intended for directing to specific accounts.
以上のような類のツイートデータは、テレビ番組に対する世間の関心や興味を捉えるためにツイート件数を調査する上では除外されるべきであるため、ツイートデータ処理装置1は、下記(3)乃至(7)の除外条件の中の少なくとも一つを満たすツイートデータを、ツイート件数の調査に利用されるツイートデータから外すこととしている。
(3)アカウントを特定する文字情報(具体的には、図2中の表示名)中に所定の文字列を含むアカウントの下で投稿されたツイートを示すツイートデータであること。
(4)一定期間中における投稿回数が所定回数以上となっているアカウントの下で投稿されたツイートを示すツイートデータであること。
(5)承認済み番組用タグ及び局用タグのうちの少なくとも一方を複数含むツイートを示すツイートデータであること。
(6)承認済み番組用タグと、該承認済み番組用タグによって識別されるテレビ番組を放送する放送局とは異なる放送局を示す局用タグとを含むツイートを示すツイートデータであること。
(7)ツイートに対して所定期間内にフォローした他の投稿者の数、所謂フォロワー数が所定人数以上となったアカウントの下で投稿されたツイートを示すデータであること。
The tweet data of the above kind should be excluded when investigating the number of tweets in order to capture the public interest and interest in the TV program. Therefore, the tweet
(3) It is tweet data indicating a tweet posted under an account that includes a predetermined character string in character information (specifically, a display name in FIG. 2) specifying the account.
(4) Tweet data indicating tweets posted under an account in which the number of postings during a certain period is greater than or equal to a predetermined number.
(5) Tweet data indicating a tweet including a plurality of at least one of an approved program tag and a station tag.
(6) Tweet data indicating a tweet including an approved program tag and a station tag indicating a broadcast station different from the broadcast station that broadcasts the television program identified by the approved program tag.
(7) Data indicating a tweet posted under an account in which the number of other contributors who have followed a tweet within a predetermined period, that is, the so-called follower number exceeds a predetermined number.
より具体的に説明すると、ツイートデータ処理装置1は、先ず、取得したツイートデータの中から、下記(A)〜(C)のいずれかの条件に該当するデータを検索し、当該データを除外する。
(A)局用タグが複数あるツイートデータであること。
(B)承認済み番組用タグが複数あるツイートデータであること。
(C)局用タグと承認済み番組用タグをそれぞれ1つずつ含み、局用タグが示す放送局と承認済み番組用タグが示すテレビ番組を放送する放送局とが一致しないツイートデータであること。
More specifically, the tweet
(A) Tweet data having a plurality of station tags.
(B) Tweet data having a plurality of approved program tags.
(C) The tweet data includes one station tag and one approved program tag, and the broadcast station indicated by the station tag does not match the broadcast station broadcasting the TV program indicated by the approved program tag. .
さらに、ツイートデータ処理装置1は、上記(A)〜(C)の条件に該当するデータの検索後に、下記(D)〜(I)のいずれかの条件に該当するデータを検索し、当該データを除外する。
(D)ツイートデータ中の「表示名」中に「bot」を含むアカウントの下で投稿されたツイートを示すデータであること。
(E)1日にL件以上のツイートを投稿しているアカウントの下で投稿されたツイートを示すデータであること(Lは自然数)。
(F)1日所定時間以上出現し、1日M件以上のツイートを投稿しているアカウントの下で投稿されたツイートを示すデータであること(Mは自然数)。
(G)1時間以内でN件以上のツイートを投稿しているアカウントの下で投稿されたツイートを示すデータであること(Nは自然数)。
(H)1分以内でP件以上のツイートを投稿しているアカウントの下で投稿されたツイートを示すデータであること(Pは自然数)。
(I)1分以内に放送局が異なる複数のテレビ番組へのツイートをQ件以上投稿しているアカウントの下で投稿されたツイートを示すデータであること(Qは自然数)。
Furthermore, the tweet
(D) Data indicating a tweet posted under an account including “bot” in “display name” in the tweet data.
(E) Data indicating tweets posted under an account posting L or more tweets per day (L is a natural number).
(F) Data indicating tweets posted under an account that appears more than a predetermined time per day and posts M tweets or more per day (M is a natural number).
(G) Data indicating tweets posted under an account posting N or more tweets within one hour (N is a natural number).
(H) Data indicating tweets posted under an account posting P tweets or more within 1 minute (P is a natural number).
(I) Data indicating a tweet posted under an account that posted Q or more tweets to a plurality of TV programs with different broadcasting stations within one minute (Q is a natural number).
なお、上記(A)〜(I)の条件以外にも、ツイート件数の調査に利用するのに不向きなデータを除外するための条件が設定されていることとしてもよい。例えば、各放送局が広報用に取得したアカウントの下で投稿されたツイートを示すツイートデータを除外対象とすることとしてもよい。かようなツイートデータを除外する具体的な方法としては、所定期間内におけるフォロワー数が所定人数以上となったアカウントの下で投稿されたツイートを示すデータを除外することが考えられる。なお、所定数以上のフォロワー数を有するアカウントの特定作業は、各月の所定日に行われるのがよい。 In addition to the above conditions (A) to (I), conditions for excluding data unsuitable for use in investigating the number of tweets may be set. For example, tweet data indicating tweets posted under an account acquired by each broadcasting station for publicity may be excluded. As a specific method of excluding such tweet data, it is conceivable to exclude data indicating tweets posted under an account in which the number of followers within a predetermined period exceeds a predetermined number. It should be noted that the work for identifying accounts having a predetermined number of followers or more is preferably performed on a predetermined day of each month.
以上のように、本実施形態では、ツイート件数の調査に利用するツイートデータから当該調査に不向きなデータを除外することにより、各テレビ番組に対するツイート件数の調査結果の信憑性が向上し、各テレビ番組に対する世間の関心や興味等を適切に捉えることが可能となる。
なお、本実施形態では、テレビ番組へのツイート件数を調査するにあたり、当該テレビ番組を識別するための番組用タグを含むツイートのデータに加えて、当該テレビ番組を放送する放送局を識別するための局用タグを含むツイートのデータをも抽出するため、ツイートデータの抽出数が比較多くなる。この結果、抽出したツイートデータの中に、上述した除外すべきデータが含まれてくる蓋然性が高くなるので、条件を設定して当該条件に該当するツイートデータを除外することがより有意義となる。
As described above, in this embodiment, by removing data unsuitable for the survey from the tweet data used for the survey of the number of tweets, the credibility of the survey result of the number of tweets for each TV program is improved. It is possible to appropriately capture public interest and interest in the program.
In the present embodiment, when investigating the number of tweets for a TV program, in addition to tweet data including a program tag for identifying the TV program, a broadcast station that broadcasts the TV program is identified. Since the tweet data including the station tag is also extracted, the number of extracted tweet data is relatively large. As a result, the probability that the above-described data to be excluded will be included in the extracted tweet data is high, so it becomes more meaningful to set conditions and exclude tweet data corresponding to the conditions.
ツイートデータ処理装置1における第5の特徴は、テレビ番組へのツイート件数を調査する際に利用するツイートデータを、投稿者の属性を基に指定することができる点である。このような構成により、本実施形態では、例えば地域によって放送されるテレビ番組が異なるケースにも対応することが可能となる。
A fifth feature of the tweet
以下、投稿者が居る地域を指定してツイートデータを取得するための構成について概説する。投稿者がユーザ端末3を用いてツイートを投稿すると、そのデータがツイートデータ管理サーバ2に向けて送信される。ツイートデータ管理サーバ2は、受信したツイートデータを解析し、当該ツイートデータの投稿者が居る地域(厳密には、投稿時点での地域)を特定する。より具体的に説明すると、ツイートデータ管理サーバ2は、ツイートデータに含まれる経度・緯度の情報を読み取り、かかる情報から投稿者が居る地域を特定する。そして、ツイートデータ管理サーバ2は、ツイートデータを地域別に保存する。つまり、本実施形態において、ツイートデータが、投稿者が居る地域と関連付けられてツイートデータ管理サーバ2に保存されることとなる。
Hereinafter, an outline of a configuration for acquiring tweet data by designating a region where a contributor is present will be described. When a contributor posts a tweet using the
一方、前述したように、ツイートデータ処理装置1は、中継機器6や予備装置7からツイートデータを引き渡してもらう際、所定のパラメータを満たすデータのみを引き渡してもらうこととなっている。このパラメータには、ハッシュタグ(具体的には、承認済み番組用タグ及び局用タグ)の他、データ調査会社側で指定した地域(以下、指定地域)が含まれている。ここで、指定地域は、特定の地域(特定の属性)に相当する。
On the other hand, as described above, when the tweet
つまり、本実施形態に係るツイートデータ処理装置1は、上記指定地域に関連付けられたツイートデータ、分かり易く言うと、ツイートデータ中の緯度・経度が指定地域の緯度・経度と一致するツイートデータを中継機器6や予備装置7から引き渡される。そして、ツイートデータ処理装置1は、引き渡されたツイートデータ、すなわち、指定地域に関連付けられたツイートデータに基づいて、各テレビ番組へのツイート件数を調査する。
That is, the tweet
<<本発明の投稿データ処理装置の詳細構成>>
次に、本発明の投稿データ処理装置であるツイートデータ処理装置1の詳細構成について図8乃至11を参照しながら説明する。
ツイートデータ処理装置1は、前述したように、データ調査会社保有のコンピュータであり、図8に示す通り、CPU1a、ROMやRAMからなるメモリ1b、通信用インタフェース1c(図8中の通信用I/F)、ハードディスク1d、マウスやキーボード等の入力機器1e及びディスプレイやプリンタ等の出力機器1fを備えている。また、ハードディスク1dには、ツイートデータ処理装置1が後述する諸々の処理を実行するためのプログラムが保存されている。
<< Detailed Configuration of Post Data Processing Apparatus of the Present Invention >>
Next, a detailed configuration of the tweet
As described above, the tweet
ここで、ツイートデータ処理装置1の構成を機能面から改めて説明すると、ツイートデータ処理装置1は、図9に示すように、ツイートデータ取得処理部11、ツイートデータ記憶処理部12、データ除外処理部13及び調査処理部14を有する。
Here, the configuration of the tweet
ツイートデータ取得処理部11は、放送当日に投稿されたツイートデータを、中継機器6や予備装置7を介してツイートデータ管理サーバ2から取得する処理を実行するものである。このツイートデータ取得処理部11は、ツイートデータ処理装置1のCPU1a、メモリ1b、通信用インタフェース1c、ハードディスク1d、及び、ツイートデータ受信処理用のプログラムにより構成される。
The tweet data
なお、本実施形態において、ツイートデータ取得処理部11が取得するツイートデータは、放送当日に投稿されたツイートデータのうち、パラメータ通知装置5が通知したパラメータを満たすデータである。
In the present embodiment, the tweet data acquired by the tweet data
より具体的に説明すると、中継機器6は、放送前日までに、パラメータ通知装置5から送信されるパラメータ通知データを受信し、同データを解析して上記パラメータを特定する。同様に、予備装置7は、中継機器6からFTPサーバ8を介して送信されるパラメータ通知データを受信し、同データを解析して上記パラメータを特定する。ここで、パラメータ通知データが示すパラメータは、放送当日に放送されるテレビ番組についての承認済み番組用タグ、当該テレビ番組を放送する放送局の局用タグ、及び、前述の指定地域を含んでいる。詳しく説明すると、放送当日のAM5時から翌日のAM5時までの間に各放送局で放送されるテレビ番組とハッシュタグの対応関係を示す図10に図示のテーブルデータがパラメータ通知装置5から送信されてくる。中継機器6や予備装置7は、上記のテーブルデータを受信し、各テレビ番組の承認済み番組用タグ(図10中の「#早朝ニュース」、「#おはようテレビ」、「#オレ達おもろ〜族」)を特定するとともに、各放送局の局用タグを特定する。
More specifically, the
そして、中継機器6及び予備装置7は、取得した放送当日分のツイートデータの中から、特定した承認済み番組用タグや局用タグを含むツイートのデータを抽出し、当該データをツイートデータ処理装置1に引き渡す。つまり、ツイートデータ取得処理部11は、放送当日分のツイートデータ中、承認済み番組用タグ及び局用タグのうちの少なくとも一方を含むツイートのデータを取得することになる。
Then, the
さらに、パラメータ通知データには「関東」、「関西」、「九州」等の指定地域を示すデータが組み込まれており、中継機器6や予備装置7は、当該データを解析して指定地域を特定する。そして、中継機器6及び予備装置7は、取得した放送当日分のツイートデータの中から、特定した指定地域に居る投稿者から投稿されたツイートのデータを抽出し、当該データをツイートデータ処理装置1に引き渡す。つまり、ツイートデータ取得処理部11は、特定した指定地域に該当する地域で放送当日に放送されるテレビ番組に対するツイートデータ(換言すると、指定地域に関連付けられたツイートデータ)を取得することになる。
Further, the parameter notification data includes data indicating the designated area such as “Kanto”, “Kansai”, “Kyushu”, etc., and the
ツイートデータ記憶処理部12は、ツイートデータ取得処理部11が取得したツイートデータを所定の記憶領域に記憶させる処理を実行するものである。このツイートデータ記憶処理部12は、ツイートデータ処理装置1のCPU1a、メモリ1b、ハードディスク1d及びデータ記憶処理用のプログラムにより構成される。
The tweet data
ここで、本実施形態では、ツイートデータ記憶処理部12によって記憶されたツイートデータのうち、放送当日に放送されたテレビ番組の承認済み番組用タグを含むツイートを示すデータについては、その投稿時間が上記テレビ番組の放送時間内及び放送時間前後の一定時間内にあるデータを、上記テレビ番組に対するツイートデータとして取り扱われる。また、上記テレビ番組を放送する放送局の局用タグを示すツイートデータについては、その投稿時間が上記テレビ番組の放送時間内にあるデータを、上記テレビ番組に対するツイートデータとして取り扱われる。このように本実施形態ではツイートデータ記憶処理部12によって記憶されたツイートデータが、ハッシュタグや投稿時間によって仕分けられる。この結果、図11に示すように、ツイートデータ記憶処理部12によって記憶されたツイートデータが、各放送局が放送当日に放送する各テレビ番組別に仕分けられるようになる。
Here, in this embodiment, among the tweet data stored by the tweet data
データ除外処理部13は、ツイートデータ記憶処理部12によって記憶されたツイートデータのうち、調査処理部14によるツイート件数の調査処理に不向きなデータを除外する処理を実行するものである。このデータ除外処理部13は、ツイートデータ処理装置1のCPU1a、メモリ1b、通信用インタフェース1c、ハードディスク1d及びデータ除外処理用のプログラムにより構成される。
The data
データ除外処理部13によるデータ除外処理について説明すると、ツイートデータ記憶処理部12によって記憶されたツイートデータを読み出し、各データが上述した除外条件(3)〜(6)の中の少なくとも一つを満たすか否か(具体的には、上述した(A)〜(I)のうちのいずれかを満たすか否か)を判定する。そして、当該除外条件を満たしたツイートデータに対して、データ除外処理部13は、所定の除外処理を行う。ここで、除外処理については、除外条件を満たすツイートデータを削除する処理、除外条件を満たすツイートデータに対してその事実を示す情報を付与する処理(例えば、フラグ値を切り替える処理)など、調査処理部14による処理において利用される対象から除外するうえで好適な内容となっていればよい。
The data exclusion processing by the data
調査処理部14は、ツイートデータ記憶処理部12によって記憶されたツイートデータをテレビ番組毎に集計して、各テレビ番組別のツイート件数を調査し、その調査結果を放送局に報告するものである。この調査処理部14は、ツイートデータ処理装置1のCPU1a、メモリ1b、通信用インタフェース1c、ハードディスク1d及び調査処理用のプログラムにより構成される。
The
より具体的に説明すると、調査処理部14は、放送当日に放送されたすべてのテレビ番組の各々についてツイート件数を調査する処理を放送翌日の昼頃に実行する。かかる処理において、調査処理部14は、ツイートデータ記憶処理部12によって記憶されたツイートデータを読み出し、各テレビ番組別にツイートデータの数を集計する。
More specifically, the
ここで、あるテレビ番組へのツイート件数を調査する際に利用されるツイートデータは、上記あるテレビ番組が放送された日に投稿されたツイートデータのうち、上記あるテレビ番組の承認済み番組用タグを含むツイートを示すデータ、及び、上記あるテレビ番組を放送する放送局の局用タグを含むツイートを示すデータである。そして、本実施形態では、上記あるテレビ番組の承認済み番組用タグを含むツイートを示すデータについては、投稿時間が上記あるテレビ番組の放送時間内及び放送時間前後の一定時間内にあるデータを調査用のデータとして利用することとしている。また、上記あるテレビ番組を放送する放送局の局用タグを含むツイートを示すデータについては、投稿時間が上記あるテレビ番組の放送時間内にあるデータを調査用のデータとして利用することとしている。
さらに、上記の条件で絞り込まれたツイートデータのうち、データ除外処理部13による除外処理後に残ったデータが、最終的にツイート件数の調査に供され、かかるデータの数がテレビ番組別に集計されることとなる。
Here, the tweet data used when investigating the number of tweets for a certain TV program is the tag for the approved program of the certain TV program among the tweet data posted on the day when the certain TV program is broadcast. And data indicating a tweet including a station tag of a broadcasting station that broadcasts the TV program. In this embodiment, for data indicating a tweet including an approved program tag for a certain TV program, the data in which the posting time is within a certain time before and after the broadcasting time of the certain TV program is investigated. It is supposed to be used as data for use. In addition, as for data indicating a tweet including a station tag of a broadcasting station that broadcasts a certain TV program, data having a posting time within the broadcasting time of the certain TV program is used as survey data.
Furthermore, among the tweet data narrowed down under the above conditions, the data remaining after the exclusion process by the data
そして、調査処理部14は、各テレビ番組別の集計結果から各テレビ番組へのツイート件数を特定する。さらに、調査処理部14は、特定したツイート件数等に基づいて、1分あたりのツイート件数や前四週平均ツイート件数などの指標値をテレビ番組毎に算出する。最終的に、調査処理部14は、放送当日に放送された各テレビ番組について上記の指標値を所定の形式で掲載した図6に図示の日報を作成し、当該日報を示すデータ(調査結果データ)を放送局端末4に向けて送信する。
And the
<<本発明の投稿データ処理方法について>>
次に、本発明の投稿データ処理方法としてのツイートデータ処理方法について図12乃至14を参照しながら説明する。
本実施形態に係るツイートデータ処理方法(以下、本処理方法)は、上述した調査システムSにおける調査プロセスの中で適用される。より具体的に説明すると、本処理方法は、調査プロセス中のツイートデータ取得フロー及び調査フローに従って進行する。換言すると、ツイートデータ取得フロー及び調査フローの各フローの中で実行される処理が、本処理方法の構成要素に相当する。そして、本処理方法では、上記の処理がコンピュータ、より具体的には上述したツイートデータ処理装置1を構成するコンピュータによって実行される。以下、調査プロセスの流れについて説明することとする。
<< Regarding Posting Data Processing Method of the Present Invention >>
Next, a tweet data processing method as a post data processing method of the present invention will be described with reference to FIGS.
The tweet data processing method according to the present embodiment (hereinafter, this processing method) is applied in the survey process in the survey system S described above. More specifically, this processing method proceeds according to a tweet data acquisition flow and a survey flow during the survey process. In other words, the processing executed in each flow of the tweet data acquisition flow and the survey flow corresponds to a component of this processing method. In this processing method, the above processing is executed by a computer, more specifically, by a computer constituting the tweet
調査プロセスは、ツイートデータ抽出用のキー情報としてのハッシュタグ、特にテレビ番組を特定する番組用タグを決定する工程から始まる。かかる工程のフロー(ハッシュタグ決定フロー)について図12を参照しながら説明すると、先ず、データ調査会社若しくはその関連会社が放送前日までに番組用タグの候補を決定し、その後、当該候補を示す通知メールをパラメータ通知装置5が放送局に向けて送信する(S001)。放送局側では通知メールを受信し(S002)、通知メールから番組用タグの候補を確認し、当該候補の採否を検討する。
The survey process starts with a step of determining a hash tag as key information for extracting tweet data, particularly a program tag for specifying a television program. The flow of this process (hash tag determination flow) will be described with reference to FIG. 12. First, the data research company or its affiliated company determines a program tag candidate by the day before the broadcast, and then a notification indicating the candidate. The
そして、上記の候補を公式の番組用タグとして承認する場合、その旨を示す返信メールが放送局からパラメータ通知装置5に向けて送信される(S003)。パラメータ通知装置5は、上記の返信メールを受信し(S004)、同メールから、通知した番組用タグの候補が放送局により承認されたことを確認する。かかる時点をもって、公式の番組用タグ、すなわち、承認済み番組用タグが決定され、データ調査会社は当該承認済み番組用タグをパラメータ通知装置5に登録させる(S005)。
When the candidate is approved as an official program tag, a reply mail indicating that is sent from the broadcast station to the parameter notification device 5 (S003). The
以上のような手順によりハッシュタグ(厳密には、承認済み番組用タグ)が決定した後、コンピュータとしてのツイートデータ処理装置1によりテレビ番組に対するツイートデータを取得する工程が行われる。かかる工程のフロー(ツイートデータ取得フロー)について図13を参照しながら説明すると、本フローは、先ず、上述したハッシュタグ決定フローにて決定された承認済み番組用タグを含むパラメータが通知され、同パラメータを中継機器6や予備装置7が受け取るところから始まる(S011)。この処理は、例えば放送当日の所定時刻(例えば、AM5時)に行われる。
After the hash tag (strictly, the approved program tag) is determined by the above procedure, the tweet
一方、ツイートデータ処理装置1は、同時刻(すなわち、AM5時)に、中継機器6や予備装置7に対してツイートデータの取得開始を要求する(S012、S013)。この要求を受け付けた中継機器6及び予備装置7は、放送当日に投稿されるツイートデータをストリーミングAPIによりツイートデータ管理サーバ2から取得するために、同サーバ2に向けてリクエストデータを送信する(S014)。ツイートデータ管理サーバ2側では、リクエストデータを受信すると(S015)、放送当日分のツイートデータを略リアルタイムで順次送信し(S016)、中継機器6や予備装置7は、ストリーミングAPIにより、送信されてくるツイートデータを順次受信する(S017)。
On the other hand, the tweet
その後、中継機器6及び予備装置7は、受信したツイートデータをツイートデータ処理装置1に引き渡すが、データ引き渡しにあたり、前工程S011にて受け取ったパラメータを用いてデータ抽出を行い、抽出されたツイートデータを上記ツイートデータ処理装置1に引き渡すこととしている(S018)。ここで、上記のパラメータは、放送当日に放送される各テレビ番組の承認済み番組用タグ及び当該各番組を放送する放送局の局用タグを含み、さらに、指定地域を含んでいる。
Thereafter, the
そして、中継機器6及び予備装置7は、上記のパラメータに合致するツイートデータをツイートデータ処理装置1に引き渡す。パラメータに合致するツイートデータとは、放送当日に放送される各テレビ番組の承認済み番組用タグ及び当該各番組を放送する放送局の局用タグのうちの少なくとも一方を含むツイートのデータであり、さらに、指定地域に関連付けられたデータのことである。
Then, the
ツイートデータ処理装置1は、中継機器6や予備装置7から引き渡されたツイートデータを取得すると(S019)、同データを装置内に記憶する処理を実行する(S020)。そして、ツイートデータ管理サーバ2がツイートデータを送信してからツイートデータ処理装置1がツイートデータを取得するまでの一連の処理S016〜S020が、翌日のAM5時まで繰り返し実行され、翌日のAM5時になった時点で(S021)、放送当日分のツイートデータの取得が完了する。
When the tweet
放送当日分のツイートデータの取得が完了した後には、コンピュータとしてのツイートデータ処理装置1により、上記テレビ番組へのツイート件数を調査する工程が行われる。かかる工程は、通常、放送翌日の昼頃に行われる。
ツイート件数を調査する工程のフロー(調査フロー)について図14を参照しながら説明すると、本フローは、ツイートデータ処理装置1が装置内に記憶されたツイートデータのうち、放送当日分のツイートデータを読み出すところから始まる(S031)。ここで、読み出すツイートデータは、放送当日に放送されたテレビ番組の承認済み番組用タグを含むツイートを示すデータ、及び、上記テレビ番組を放送する放送局の局用タグを含むツイートを示すデータである。
After the acquisition of the tweet data for the day of the broadcast is completed, the tweet
The flow of the process of investigating the number of tweets (survey flow) will be described with reference to FIG. 14. This flow shows that the tweet data for the broadcast day is included in the tweet data stored in the tweet
そして、ツイートデータ処理装置1は、読み出したツイートデータに基づいて、放送当日に放送された各テレビ番組のツイート件数を調査する。一方、ツイートデータ処理装置1が読み出したツイートデータについては、ツイート中に含まれるハッシュタグと投稿時間によって番組別に仕分けられている。具体的に説明すると、テレビ番組の承認済み番組用タグを含むツイートを示すデータについては、投稿時間が当該テレビ番組の放送時間内及び放送時間前後の一定時間内にあるデータが、当該テレビ番組へのツイート件数を調査する際に用いられるデータとして仕分けられている。また、テレビ番組を放送する放送局の局用タグを含むツイートを示すデータについては、投稿時間が当該テレビ番組の放送時間内にあるデータが当該テレビ番組へのツイート件数を調査する際に用いられるデータとして仕分けられている。
And the tweet
さらに、ツイートデータ処理装置1は、上記のように仕分けられた各テレビ番組別のツイートデータの中から、ツイート件数の調査処理に不向きなデータを除外する処理を実行する。具体的に説明すると、ツイートデータ処理装置1は、読み出したデータが上述した除外条件(3)〜(6)の中の少なくとも一つを満たすか否かを判定する処理を実行する。具体的に説明すると、ツイートデータ処理装置1は、読み出したツイートデータの中から、上述した(A)〜(C)のいずれかを満たすデータを検索して除外し、さらに、残ったツイートデータの中から、上述した(D)〜(I)のいずれかを満たすデータを検索して除外する。このようにツイートデータ処理装置1は、読み出したツイートデータの中から除外条件に該当するデータを検索する(S032)。そのうえで、ツイートデータ処理装置1は、除外条件に該当するツイートデータを除外する処理を実行する(S033)。
Further, the tweet
除外処理の終了後、ツイートデータ処理装置1は、読み出したツイートデータのうち、上記の除外処理後に残ったデータをテレビ番組別に集計し、その集計結果から各テレビ番組へのツイート件数を特定する。さらに、ツイートデータ処理装置1は、特定したツイート件数等に基づいて、1分あたりのツイート件数や前四週平均ツイート件数などの指標値をテレビ番組毎に算出する(S034)。最終的に、ツイートデータ処理装置1は、放送当日に放送されたテレビ番組の各々について上記の指標値をまとめた日報を作成し、当該日報を示すデータ(調査結果データ)を放送局に向けて送信する(S035)。そして、放送局側で調査結果データが受信された時点で(S036)、調査プロセスが完了する。
After completion of the exclusion process, the tweet
<<その他の実施形態>>
上記の実施形態には、主として本発明の投稿データ処理装置、並びに、コンピュータにより実現される投稿データ処理方法について説明した。しかし、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることはもちろんである。
<< Other Embodiments >>
In the above embodiment, the post data processing apparatus of the present invention and the post data processing method realized by a computer have been mainly described. However, the above embodiment is for facilitating the understanding of the present invention, and does not limit the present invention. The present invention can be changed and improved without departing from the gist thereof, and the present invention includes the equivalents thereof.
また、上記の実施形態では、テレビ番組を識別するためのハッシュタグとして放送局に承認された承認済み番組用タグについて、上記テレビ番組の番組情報に含まれる二次元バーコードをユーザ端末3で読み取ることでツイートの入力欄に自動的に入力されることとした。ただし、これに限定されるものではなく、上記の承認済み番組用タグについては投稿者が手入力することとしてもよい。
In the above embodiment, the
また、上記の実施形態では、テレビ番組を識別するためのハッシュタグ(番組用タグ)について、データ調査会社若しくはその関連会社が候補を提案し、当該テレビ番組を放送する放送局が当該候補の採否を検討することとした。そして、放送局が上記の番組用タグの候補を採用する場合、当該候補を上記テレビ番組の公式の番組用タグとして承認することとした。ただし、番組用タグについては、データ調査会社若しくはその関連会社ではなく、そのテレビ番組を放送する放送局が決めることとしてもよい。このように放送局が番組用タグを決定する場合には、データ調査会社は、例えば、放送局のホームページやテレビ番組専用のホームページから上記の番組用タグを見つけてくることとなる。これに対して、上記の実施形態では、このような手間を要しない分、番組用タグを容易に決定することができるので、より望ましい。
なお、放送局が番組用タグを決定する場合、同番組用タグは、当然ながら、対応するテレビ番組の公式のハッシュタグとして承認された承認済み番組用タグに相当する。
In the above embodiment, a data survey company or an affiliated company proposes candidates for hash tags (program tags) for identifying television programs, and a broadcasting station that broadcasts the television programs accepts the candidates. It was decided to consider. When the broadcast station adopts the program tag candidate, the candidate is approved as the official program tag of the television program. However, the program tag may be decided not by the data research company or its affiliated company but by the broadcasting station that broadcasts the television program. When the broadcasting station determines the program tag in this way, the data investigation company finds the program tag from, for example, the homepage of the broadcasting station or the homepage dedicated to the television program. On the other hand, in the above-described embodiment, the program tag can be easily determined as much as it does not require such labor, so that it is more desirable.
When a broadcast station determines a program tag, the program tag naturally corresponds to an approved program tag approved as an official hash tag of the corresponding television program.
また、上記の実施形態では、すべてのテレビ番組に対して番組用タグ(より具体的には、承認済み番組用タグ)が設定されることとしたが、必ずしもすべてのテレビ番組に対して番組用タグが設定される必要はなく、一部のテレビ番組について番組用タグが設定されなくともよい。例えば、放送局が番組用タグを決定するケースにおいて、新番組が放送されるとき、番組用タグが未定のまま当該新番組が放送されることが考えられる。かかる場合、上記新番組に対するツイートデータとしては、当該新番組を放送する放送局の局用タグをキー情報として抽出したツイートデータのうち、投稿時間が当該新番組の放送時間内にあるデータを採用すればよい。また、放送局が番組用タグを決定するケースでは、上述のように放送当日までに番組用タグが設定されていない場合があることを考慮して、各月の所定日(例えば、第3週目の金曜日)に、その月に放送された(または放送予定の)全テレビ番組について番組用タグを調査する月次処理を実施することが望ましい。 In the above embodiment, program tags (more specifically, approved program tags) are set for all TV programs. However, program tags are not necessarily used for all TV programs. A tag does not need to be set, and a program tag may not be set for some television programs. For example, in a case where a broadcast station determines a program tag, when a new program is broadcast, it is conceivable that the new program is broadcast with the program tag being undetermined. In such a case, as the tweet data for the new program, data having a posting time within the broadcast time of the new program is selected from the tweet data extracted using the station tag of the broadcasting station that broadcasts the new program as key information. do it. In addition, in the case where the broadcast station determines a program tag, the program tag may not be set by the broadcast day as described above, so that a predetermined day of each month (for example, the third week) On the first Friday, it is desirable to perform a monthly process for examining program tags for all TV programs broadcast (or scheduled to be broadcast) in the month.
また、上記の実施形態では、データ集計時にキー情報として用いるハッシュタグのうち、番組用タグについては承認済み番組用タグであることとしたが、これに限定されるものではない。データ集計用の番組用タグは、当該テレビ番組の関係者若しくはデータ調査会社(その関連会社、親会社若しくは調査委託会社を含む)により指定された番組用タグであればよく、必ずしもすべての番組用タグが承認済み番組用タグとなっていなくてもよい。すなわち、データ集計用の番組用タグとしては、テレビ番組の関係者が公式タグとして指定したハッシュタグ、データ調査会社が指定してテレビ番組の関係者に通知したハッシュタグであって承認されたもの、及び、通知したもののテレビ番組の関係者に未だ承認されていないものを利用することが可能である。なお、テレビ番組の関係者とは、テレビ番組の放送に関係する者であり、例えば、テレビ番組の放送局、テレビ番組の制作会社、テレビ番組のスポンサー企業、若しくはこれらの企業の要請を受けて公式の番組用タグを設定する企業を含む概念である。 Further, in the above embodiment, among the hash tags used as key information at the time of data aggregation, the program tag is an approved program tag, but the present invention is not limited to this. The program tag for data aggregation may be a program tag specified by a person concerned with the TV program or a data research company (including its affiliated company, parent company, or commissioned research company), and not all program tags. May not be an approved program tag. That is, as the program tag for data aggregation, a hash tag designated as an official tag by a person concerned with a TV program, a hash tag designated by a data research company and notified to a person concerned with a TV program, and approved It is also possible to use what has been notified but has not yet been approved by the person concerned with the television program. A TV program related person is a person related to TV program broadcasting. For example, a TV program broadcasting station, a TV program production company, a TV program sponsoring company, or in response to a request from these companies. It is a concept that includes companies that set official program tags.
また、上記の実施形態では、各テレビ番組へのツイート件数の調査結果の一例として、図6に示す調査日報について説明した。また、図6に示すように、調査日報には、各テレビ番組について、番組ジャンル、1分あたりのツイート件数、前四週平均ツイート件数、終了時ツイート件数、ジャンル平均ツイート件数が掲載されていることとした。ただし、調査結果については、その掲載事項や表示形式を任意に設定可能することが可能であり、例えば、図15に示すような各テレビ番組の個別の調査結果を示すものであってもよい。また、図15に示すように、各テレビ番組の放送時間及び放送時間前後の一定時間(例えば、30分間)におけるツイート件数の推移(図中の「毎分ツイート件数」)を掲載することとしてもよい。その他、各テレビ番組へのツイート件数の合計値、1人当たりのツイート件数、投稿者の人数(ユニークユーザ数)、フォロワー数、投稿者の性別構成や年齢構成、リツイート数等の情報を併せて形成することとしてもよい。 In the above embodiment, the daily survey shown in FIG. 6 has been described as an example of the result of the survey of the number of tweets for each television program. In addition, as shown in FIG. 6, the survey daily report should include the program genre, the number of tweets per minute, the average number of tweets for the previous four weeks, the number of tweets at the end, and the average number of tweets for each TV program. It was. However, regarding the survey results, the posted items and display formats can be arbitrarily set. For example, individual survey results of each television program as shown in FIG. 15 may be displayed. Also, as shown in FIG. 15, the broadcast time of each TV program and the transition of the number of tweets (“number of tweets per minute” in the figure) in a certain time (for example, 30 minutes) before and after the broadcast time may be posted. Good. In addition, the total number of tweets for each TV program, the number of tweets per person, the number of contributors (number of unique users), the number of followers, the gender composition and age composition of the poster, the number of retweets, etc. are also formed It is good to do.
また、上記の実施形態では、テレビ番組へのツイート件数の調査を当該テレビ番組の放送翌日に行うこととしたが、調査の実施時期については特に制限がなく、例えば、上記テレビ放送の放送終了後から所定時間が経過した時点に行われることとしてもよい。 In the above embodiment, the number of tweets for a TV program is checked on the day after the broadcast of the TV program. However, there is no particular restriction on the time of the survey, for example, after the end of the broadcast of the TV broadcast. It may be performed at a time when a predetermined time has passed.
また、上記の実施形態では、番組の一例としてテレビ番組を挙げ、テレビ番組に対するツイートデータを集計する構成について説明した。一方、前述したように、番組とは、予め設定されたタイムスケジュールに従って所定の放送局から放送される音声情報や映像情報のことであり、かかる定義に該当するテレビ番組以外の番組、例えばラジオ番組に対するツイートデータを集計する場合にも本発明は適用可能である。あるいは、予め設定された放送時間帯にインターネットを経由してストリーミング配信される映像や音声について、それに対するツイートデータを集計する場合にも本発明は適用可能である。 In the above-described embodiment, a TV program is cited as an example of a program, and the configuration of counting tweet data for the TV program has been described. On the other hand, as described above, a program is audio information or video information broadcast from a predetermined broadcasting station according to a preset time schedule, and a program other than a television program corresponding to such a definition, for example, a radio program The present invention can also be applied to the case of collecting the tweet data for. Alternatively, the present invention can also be applied to the case of collecting tweet data for video and audio streamed and distributed via the Internet during a preset broadcast time zone.
1 ツイートデータ処理装置
1a CPU、1b メモリ、1c 通信用インタフェース
1d ハードディスク、1e 入力機器、1f 出力機器
2 ツイートデータ管理サーバ
3 ユーザ端末、4 放送局端末
5 パラメータ通知装置
6 中継機器、7 予備装置
8 FTPサーバ
11 ツイートデータ取得処理部
12 ツイートデータ記憶処理部
13 データ除外処理部
14 調査処理部
S 調査システム
DESCRIPTION OF
Claims (8)
前記投稿データ管理サーバから取得した前記投稿データを記憶する処理を実行する記憶処理部と、
該記憶処理部によって記憶された前記投稿データに基づいて、所定の番組への投稿回数を調査する処理を実行する調査処理部と、を備え、
前記調査処理部は、
少なくとも下記(1)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組の放送時間を含む所定の時間帯にある前記投稿データと、
下記(2)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組に対して予め設定された時間帯にある前記投稿データと、に基づいて前記投稿回数を調査することを特徴とする投稿データ処理装置。
(1)前記所定の番組を識別するための番組識別情報を含む投稿コメントを示す前記投稿データであること。
(2)前記所定の番組を放送する放送局を識別するための局識別情報を含む投稿コメントを示す前記投稿データであること。 A post data processing apparatus for processing the post data acquired from a post data management server for storing post data,
A storage processing unit for executing processing for storing the posted data acquired from the posted data management server;
A survey processing unit that executes a process of investigating the number of postings to a predetermined program based on the posted data stored by the storage processing unit;
The investigation processing unit
In the post data that satisfies at least the following condition (1), the post data is in a predetermined time zone including a broadcast time of the predetermined program;
The posting count is investigated based on the posting data in the posting time set in advance for the predetermined program in the posting data satisfying the following condition (2): Post data processing device.
(1) The post data indicating a post comment including program identification information for identifying the predetermined program.
(2) The posting data indicating a posting comment including station identification information for identifying a broadcasting station that broadcasts the predetermined program.
(3)アカウントを特定する文字情報中に所定の文字列を含むアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。
(4)一定期間中における投稿回数が所定回数以上となっているアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。
(5)前記番組識別情報及び前記局識別情報のうちの少なくとも一方を複数含む前記投稿コメントを示す前記投稿データであること。
(6)前記番組識別情報と、該番組識別情報によって識別される番組を放送する放送局とは異なる放送局を示す前記局識別情報とを含む前記投稿コメントを示す前記投稿データであること。
(7)前記投稿コメントに対して所定期間内にフォローした他の投稿者の数が所定人数以上となったアカウントの下で投稿された前記投稿コメントを示す前記投稿データであること。 Of the posted data for the predetermined program stored by the storage processing unit, the posted data satisfying at least one of the following exclusion conditions (3) to (7) is used in the processing by the survey processing unit. The posted data processing apparatus according to claim 1, further comprising: a data exclusion processing unit that executes a process of removing the posted data from the posted data.
(3) The post data indicating the post comment posted under an account that includes a predetermined character string in the character information specifying the account.
(4) The posting data indicating the posting comment posted under an account in which the number of postings during a certain period is equal to or more than a predetermined number.
(5) The post data indicating the post comment including a plurality of at least one of the program identification information and the station identification information.
(6) The post data indicating the post comment including the program identification information and the station identification information indicating a broadcast station different from a broadcast station that broadcasts the program identified by the program identification information.
(7) The post data indicating the post comment posted under an account in which the number of other contributors who have followed the post comment within a predetermined period exceeds a predetermined number.
前記調査処理部は、特定の前記属性に関連付けられた前記投稿データのみに基づき、前記投稿回数を調査する処理を実行することを特徴とする請求項2に記載の投稿データ処理装置。 In the post data management server, the post data is stored in association with the attribute of the poster,
The posted data processing apparatus according to claim 2, wherein the survey processing unit executes a process of surveying the number of postings based only on the posted data associated with the specific attribute.
前記調査処理部は、特定の前記地域に関連付けられた前記投稿データのみに基づき、前記投稿回数を調査する処理を実行することを特徴とする請求項3に記載の投稿データ処理装置。 In the post data management server, the post data is stored in association with the region where the poster is located,
The posted data processing apparatus according to claim 3, wherein the survey processing unit executes a process of surveying the number of postings based only on the posted data associated with the specific region.
前記コンピュータが、
前記投稿データ管理サーバから取得した前記投稿データを記憶する処理と、
記憶した前記投稿データに基づいて、所定の番組への投稿回数を調査する処理と、を実行し、
前記投稿回数を調査する処理において、前記コンピュータは、
少なくとも下記(1)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組の放送時間を含む所定の時間帯にある前記投稿データと、
下記(2)の条件を満たす前記投稿データ中、投稿時間が前記所定の番組に対して予め設定された時間帯にある前記投稿データと、に基づいて前記投稿回数を調査する処理を実行することを特徴とする投稿データ処理方法。
(1)前記所定の番組を識別するための番組識別情報を含む投稿コメントを示す前記投稿データであること。
(2)前記所定の番組を放送する放送局を識別するための局識別情報を含む投稿コメントを示す前記投稿データであること。
A post data processing method for processing the post data acquired from a post data management server in which a computer stores post data,
The computer is
A process for storing the post data acquired from the post data management server;
A process of investigating the number of postings to a predetermined program based on the stored posting data;
In the process of investigating the number of postings, the computer
In the post data that satisfies at least the following condition (1), the post data is in a predetermined time zone including a broadcast time of the predetermined program;
Executing a process of investigating the number of postings based on the posting data in which the posting time is set in advance for the predetermined program in the posting data satisfying the following condition (2) A post data processing method characterized by the above.
(1) The post data indicating a post comment including program identification information for identifying the predetermined program.
(2) The posting data indicating a posting comment including station identification information for identifying a broadcasting station that broadcasts the predetermined program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013089296A JP5526257B1 (en) | 2013-04-22 | 2013-04-22 | Post data processing apparatus and post data processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013089296A JP5526257B1 (en) | 2013-04-22 | 2013-04-22 | Post data processing apparatus and post data processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5526257B1 true JP5526257B1 (en) | 2014-06-18 |
JP2014212501A JP2014212501A (en) | 2014-11-13 |
Family
ID=51175736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013089296A Active JP5526257B1 (en) | 2013-04-22 | 2013-04-22 | Post data processing apparatus and post data processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5526257B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016024485A (en) * | 2014-07-16 | 2016-02-08 | 株式会社ビデオリサーチ | Contributed document acquiring device, and contributed document acquiring method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6284286B1 (en) * | 2017-06-15 | 2018-02-28 | 株式会社エム・データ | Broadcast data processing apparatus and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011234198A (en) * | 2010-04-28 | 2011-11-17 | Sony Corp | Information providing method, content display terminal, mobile terminal, server device, information providing system, and program |
JP2012150662A (en) * | 2011-01-19 | 2012-08-09 | Toshiba Corp | Program information collection device, video display device and program information collection method |
JP2012227760A (en) * | 2011-04-20 | 2012-11-15 | Funai Electric Co Ltd | Video recorder, reproducer and server device |
JP5144838B1 (en) * | 2011-11-29 | 2013-02-13 | パナソニック株式会社 | Information processing apparatus, information processing method, and program |
-
2013
- 2013-04-22 JP JP2013089296A patent/JP5526257B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011234198A (en) * | 2010-04-28 | 2011-11-17 | Sony Corp | Information providing method, content display terminal, mobile terminal, server device, information providing system, and program |
JP2012150662A (en) * | 2011-01-19 | 2012-08-09 | Toshiba Corp | Program information collection device, video display device and program information collection method |
JP2012227760A (en) * | 2011-04-20 | 2012-11-15 | Funai Electric Co Ltd | Video recorder, reproducer and server device |
JP5144838B1 (en) * | 2011-11-29 | 2013-02-13 | パナソニック株式会社 | Information processing apparatus, information processing method, and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016024485A (en) * | 2014-07-16 | 2016-02-08 | 株式会社ビデオリサーチ | Contributed document acquiring device, and contributed document acquiring method |
Also Published As
Publication number | Publication date |
---|---|
JP2014212501A (en) | 2014-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10075742B2 (en) | System for social media tag extraction | |
US9282350B2 (en) | Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements | |
CN104798346B (en) | For supplementing the method and computing system of electronic information relevant to broadcast medium | |
US10455269B2 (en) | Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements | |
US20240298056A1 (en) | Systems and Methods for Automated Extraction of Closed Captions in Real Time or Near Real-Time and Tagging of Streaming Data for Advertisements | |
JP2011234198A (en) | Information providing method, content display terminal, mobile terminal, server device, information providing system, and program | |
KR101774397B1 (en) | Method and apparatus for providing preferred information about broadcasting | |
US20100138655A1 (en) | Terminal apparatus and operation information collecting system | |
US8780269B2 (en) | Contents playback device, television receiver, information provision system, information provision method, information provision program, and recording medium | |
CN103475910A (en) | Set-top box (STB) program recommending method and system for smart television (TV) terminal | |
CN102098549A (en) | Electronic program guide (EPG) system for providing social network service | |
CN104412605B (en) | Sending device, information processing method, program, reception device and application link system | |
CN102572500A (en) | Network TV program rating collecting system and method | |
US8983942B2 (en) | Method and apparatus for providing time machine service based on social network service | |
US20170339078A1 (en) | Method and system to share content from a main device to a secondary device | |
CN106791961B (en) | Video preference information processing method, device and system | |
JP5526257B1 (en) | Post data processing apparatus and post data processing method | |
CN105611331B (en) | A kind of video pushing method and system based on smart television | |
EP2858310A1 (en) | Association of a social network message with a related multimedia flow | |
KR101155465B1 (en) | System for monitoring advertisements from broadcasting data and method thereof | |
KR20120072103A (en) | Apparatus and method for personal electronic program guide providing in personal mobile terminal | |
JP2014132385A (en) | Server, content providing system, control method and program | |
JP5637954B2 (en) | RECOMMENDED PROGRAM PRESENTATION DEVICE AND ITS PROGRAM | |
KR102029969B1 (en) | Apparatus and method for contents provision and contents preference analysis | |
CN106358056A (en) | Method and device for pushing information of scheduled program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140414 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5526257 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |