以下、添付図面を参照しながら、本技術を実施するための形態(以下、実施の形態という)について説明する。説明は以下の順序で行う。
1.サイト記事情報の説明
2.情報処理システムの構成例
3.転載情報生成装置の構成例
4.転載情報生成装置の詳細処理
5.収集記事情報生成処理のフローチャート
6.掲載情報推定装置の構成例
7.掲載情報推定装置のUI画面例
8.元サイト選定機能
9.子サイト指定・元サイト選定処理
10.分類指定・元サイト選定処理
11.掲載サイト推定処理
12.分類指定・元サイト推定処理
13.情報処理装置のハードウエア構成例
<1.サイト記事情報の説明>
企業は、新しい技術や新製品など、新聞、テレビ、ラジオ、WEBサイト等の各種のメディアにニュースや記事で取り上げてもらうことで広く宣伝し、一般ユーザへの認知度を高めている。
図1は、ある企業の新製品の広報の例である。
自動車を製造、販売している企業が、新製品(新型車)の発表会やプレスリリースを行う。新聞、TV、ラジオ、WEBサイト等を運営するメディア(運営元)が、自社の媒体で新製品をニュースや記事として紹介する。一般ユーザは、ニュースや記事に接することで、新製品の情報を得る。
近年、インターネット、ソーシャルメディア、スマートフォン等の発達にともない、WEBサイトに掲載される記事(以下、サイト記事とも称する。)によってユーザが各種の情報を知ることが多くなってきており、サイト記事の重要性が高まってきている。WEBサイトの記事には、1つの同じ内容が、異なる複数のWEBサイトに掲載されるものがある。これは、あるメディアがサイト記事を作成し、自身のWEBサイトに掲載するとともに、契約を結んでいる他のメディアへ配信し、他のメディアも自身のWEBサイトに掲載するためである。したがって、同一内容の複数のサイト記事には、自ら作成したメディアによるサイト記事と、作成したメディアから配信を受けて転載したサイト記事とがあり、いわば親子関係がある。なお、自身のWEBサイトには掲載せず、配信のみを行うメディアもある。以下では、サイト記事を自ら作成したメディアを、元メディア、親メディアなどと称し、元メディアからサイト記事の配信を受け、転載するメディアを、転載メディア、子メディアなどと称する。また、元メディアのWEBサイトを、元サイト、親サイトなどと称し、転載メディアのWEBサイトを、転載サイト、子サイトなどと称する。なお、各メディアのWEBサイトには、自身で作成したサイト記事と、元メディアから配信を受けて転載したサイト記事とが混在してもよい。所定の1つのサイト記事に注目して、そのサイト記事に対して、各メディアが元メディアであるかまたは転載メディアであるかが決定される。換言すれば、所定のWEBサイトを運営するメディアは、WEBサイトに掲載しているサイト記事のうち、自身で作成したサイト記事に対しては元メディアに相当し、配信を受けて転載したサイト記事に対しては転載メディアに相当する。
親メディアが作成したサイト記事が、どの転載メディアの転載サイトに掲載されるかは、親メディアと転載メディアとの契約関係に基づくものであるため、広報を行う企業が知ることは困難である。そのため、企業は、どの親メディアにサイト記事を作成してもらえば、多数の転載メディアに配信され、多くのサイト記事となって、多数のユーザに見てもらうことができるか把握したいという要望がある。あるいはまた、閲覧ユーザ数が多い特定のWEBサイトが転載メディアのWEBサイトである場合に、その転載メディアのWEBサイトにサイト記事として掲載されるためには、どの親メディアに記事を作成してもらうのがよいか把握したいという要望がある。
以下で説明する本開示の情報処理システムは、サイト記事の親子関係を把握することで、上記のような要望を実現できるようにしたシステムである。
<2.情報処理システムの構成例>
図2は、本開示の実施の形態である情報処理システムの構成例を示すブロック図である。
図2に示される情報処理システム1は、転載情報生成装置11、記事情報DB12、及び、掲載情報推定装置13を有する。
転載情報生成装置11は、各種のWEBサイトに掲載されたサイト記事に関する情報(以下、サイト記事情報とも称する。)を収集する。サイト記事情報には、同一内容のものが含まれる。つまり、サイト記事情報には、元メディアによるサイト記事情報と、転載メディアによるサイト記事情報とがある。転載情報生成装置11は、同一内容の複数のサイト記事情報について、親子関係を示す転載情報を生成し、サイト記事情報に転載情報を付加して、記事情報DB12に登録する(記憶させる)。
記事情報DB12は、転載情報生成装置11から供給される、サイト記事情報に転載情報が付加された転載記事情報を記憶する記憶部(データベース)である。記事情報DB12は、記憶している転載記事情報を必要に応じて掲載情報推定装置13に供給する。
掲載情報推定装置13は、記事情報DB12に記憶されている転載記事情報を用いて、サイト記事の掲載に関する情報(掲載情報)を推定する。例えば、掲載情報推定装置13は、どの元メディアにサイト記事を作成してもらえば、より多くの転載メディアのサイトに掲載されるか、元メディアのサイトを選定(推定)する。また例えば、掲載情報推定装置13は、特定の転載メディアのサイトに掲載したい場合に、どの元メディアにサイト記事を作成してもらうことが望ましいか、元メディアのサイトを選定(推定)する。また例えば、掲載情報推定装置13は、過去に特定の元メディアのサイトに掲載された事実を把握している場合に、どれだけの転載メディアのサイトに掲載されていたと予想されるかを、実際のサイト記事を調査することなく推定する。
情報処理システム1は、以上のように構成することができるが、この構成に限られない。例えば、記事情報DB12は、転載情報生成装置11の一部として含まれて構成されてもよいし、掲載情報推定装置13の一部として含まれて構成されてもよい。また、転載情報生成装置11、記事情報DB12、及び、掲載情報推定装置13が一つの装置で一体に構成されてもよい。転載情報生成装置11、記事情報DB12、及び、掲載情報推定装置13それぞれは、1台または複数台の情報処理装置で構成することができ、情報処理装置としては、例えば、サーバ装置、パーソナルコンピュータ、タブレット装置、スマートフォン等を用いることができる。情報処理システム1は、1以上のサーバ装置と複数のクライアント装置とからなるサーバクライアントシステムで構成されてもよい。サーバ装置は、クラウドサーバで構成されてもよいし、ローカルサーバで構成されてもよい。
<3.転載情報生成装置の構成例>
図3は、転載情報生成装置11の構成例を示すブロック図である。
図3に示される転載情報生成装置11は、記事情報DB12が転載情報生成装置11の一部として組み込まれた例を示している。
転載情報生成装置11は、収集記事情報登録部31、サイト基礎情報設定部32、サイト基礎情報DB33、転載情報設定部34、収集記事DB35、再構成部36、記事属性情報DB37、属性情報登録部38、及び、記事情報DB12を有する。
本実施の形態では、転載情報生成装置11は、サーバ装置で構成されることとするが、例えば、転載情報生成装置11は、1台以上のサーバ装置と、複数のコンピュータとをネットワークを介して接続したコンピュータシステムで構成してもよい。
収集記事情報登録部31は、収集対象とされた所定の一つの内容に関するサイト記事を収集記事として、収集記事について各種のWEBサイトに掲載されたサイト記事情報を登録する。収集記事情報登録部31は、多数の収集記事について、日単位、週単位、月単位など定期的に、または、所定のタイミングで不定期にサイト記事情報を収集し、登録する。収集記事情報登録部31は、登録した多数の収集記事それぞれについてのサイト記事情報を、サイト基礎情報設定部32に供給する。以下では、WEB(World Wide Web)サイトを、単にサイトとも称する。
サイト基礎情報設定部32は、サイト記事情報について、サイト記事が掲載されたWEBサイトに関するサイト基礎情報をサイト基礎情報DB33から取得し、収集記事情報登録部31から供給されるサイト記事情報に付加する。サイト基礎情報設定部32は、サイト基礎情報を付加したサイト記事情報である、基礎付きサイト記事情報を、転載情報設定部34に供給する。
サイト基礎情報DB33は、サイト記事が掲載される各WEBサイトについてのサイト基礎情報を記憶する記憶部(データベース)である。サイト基礎情報は、詳細は図7を参照して後述するが、例えば、WEBサイトの正式名称、当該WEBサイトにおいて想定されるユーザ数(読者数)などの情報である。サイト基礎情報は、任意の手法で取得され、サイト基礎情報DB33に記憶される。
転載情報設定部34は、サイト基礎情報設定部32から供給される、基礎付きサイト記事情報に対して、そのサイト記事が元メディアによるサイト記事であるか、または、転載メディアによるサイト記事であるかを示す転載情報を設定する。すなわち、サイト基礎情報設定部32から供給されるサイト記事(基礎付きサイト記事情報)には、同一内容の記事で、元メディアによるサイト記事と、転載メディアによるサイト記事とが混在している。転載情報設定部34は、同一内容の複数の基礎付きサイト記事情報それぞれについて、元メディアか、または、転載メディアを示す情報を転載情報として設定する。転載情報は、同一内容の複数の基礎付きサイト記事情報について親子関係を示す情報であるとも言える。転載情報設定部34は、基礎付きサイト記事情報に転載情報が設定された、親子・基礎付きサイト記事情報を、収集記事DB35に登録する(記憶させる)。
収集記事DB35は、転載情報設定部34から供給される、親子・基礎付きサイト記事情報を記憶する記憶部(データベース)である。収集記事DB35は、記憶している親子・基礎付きサイト記事情報を必要に応じて再構成部36に供給する。
再構成部36は、収集記事DB35に記憶されている親子・基礎付きサイト記事情報を、所定のタイミングで再構成(整理)して、少なくとも異なる日付を横断する横断記事データとして、記事情報DB12へ登録する(記憶させる)。すなわち、収集記事DB35には、1つの収集記事について、所定のタイミングで収集された親子・基礎付きサイト記事情報が順次蓄積される。例えば、1日単位等で収集記事が蓄積された場合、同一内容の収集記事であっても、日毎に離散して収集記事DB35に蓄積される。また例えば、1つの収集記事について、複数の担当者がサイト記事を収集し、登録した場合、同一内容の収集記事について担当者ごとに離散して収集記事DB35に蓄積される。再構成部36は、そのように離散された1つの収集記事に関する親子・基礎付きサイト記事情報を、所定の期間でまとめて所定の並び順にソートして、記事情報DB12に登録する(記憶させる)。以下では、収集された親子・基礎付きサイト記事情報を収集記事情報と称する場合がある。
記事属性情報DB37は、各収集記事について、収集記事の属性を示す記事属性情報を記憶する記憶部(データベース)である。詳細は図9を参照して後述するが、記事属性情報DB37には、例えば、記事が関係する業界の分類を示す情報や、記事の内容を分類した情報などが、収集記事の記事属性情報として記憶されている。
属性情報登録部38は、記事属性情報DB37から各収集記事の記事属性情報を取得し、記事情報DB12に記憶されている収集記事情報に記事属性情報を付加する。
記事情報DB12には、再構成部36によって再構成された収集記事情報(親子・基礎付きサイト記事情報)が、複数の収集記事について記憶される。その後、記事情報DB12の各収集記事情報に対して、属性情報登録部38によって記事属性情報が付加される。最終的に、記事情報DB12は、記事属性情報が付加された収集記事情報を記憶する。つまり、記事情報DB12は、複数の収集記事について収集記事情報を記憶する記憶部(データベース)である。記事情報DB12は、転載情報生成装置11によって生成された長期間(例えば、複数年ないし数十年)の収集記事情報を記憶することができる。図2において記事情報DB12が記憶していると説明した転載記事情報は、多数の収集記事について長期間蓄積した収集記事情報を表す。なお、記事属性情報の付加は任意であり、省略してもよい。また、記事属性情報を付加する場合において、最終的に記事情報DB12に記事属性情報が付加された収集記事情報が記憶された状態となればよく、記事属性情報を付加するタイミングは任意である。すなわち、記事属性情報は、収集記事情報登録部31が所定のサイト記事に関する情報を収集記事として登録してから、記事情報DB12に記憶されるまでのどのタイミングで付加してもよい。
収集記事DB35と記事情報DB12は、一つの記憶部で構成されてもよい。収集記事DB35が記憶するソート前の収集記事情報と、記事情報DB12が記憶するソート後の収集記事情報は、異なる記憶領域に別々に記憶してもよいし、ソート後の収集記事情報を、ソート前の収集記事情報の領域に上書きして記憶してもよい。また、サイト基礎情報DB33や、記事属性情報DB37も、収集記事DB35もしくは記事情報DB12のいずれか一方またはその両方と同一の記憶部で構成されてもよい。
転載情報生成装置11は、以上のように構成され、多数の収集記事について長期間蓄積した収集記事情報(記事属性情報を含む)を、記事情報DB12に記憶させることができる。記事情報DB12に記憶された収集記事情報を用いることにより、ある特定の内容の記事がどれだけのWEBサイトに掲載されるかを推定することができる。
なお、図3の構成では、収集記事情報登録部31が登録したサイト記事情報を、サイト基礎情報設定部32に供給し、サイト基礎情報を付加したあとで、転載情報設定部34で転載情報を設定し付加するようにしたが、サイト基礎情報と転載情報を付加する順番は逆でも良い。すなわち、転載情報設定部34が、収集記事情報登録部31が登録したサイト記事情報に対して転載情報を付加することにより転載情報付きサイト記事情報を生成してサイト基礎情報設定部32に供給し、サイト基礎情報設定部32が、転載情報付きサイト記事情報にサイト基礎情報を付加し、親子・基礎付きサイト記事情報を生成してもよい。サイト基礎情報の付加は、最終的にサイト記事情報が記事情報DB12に記憶されるまでに行えばよい。
<4.転載情報生成装置の詳細処理>
図4ないし図12を参照して、転載情報生成装置11が行う処理の詳細について説明する。
図4は、一つの収集記事に関する複数のサイト記事の例を示している。
図4には、5つのサイト記事51Aないし51Eが示されている。なお、図4に示されるサイト記事51Aないし51Eはサイト記事のイメージを示したものであり、本明細書ではサイト記事51Aないし51Eに記載されている記事の内容自体は問題としない。図26及び図27のサイト記事についても同様である。
サイト記事51Aは、毎日日新聞のWEBサイトに掲載されたサイト記事である。サイト記事51Bは、ヤホーnewsのWEBサイトに掲載されたサイト記事である。サイト記事51Cは、スポーツJPのWEBサイトに掲載されたサイト記事である。サイト記事51Dは、BメニューのWEBサイトに掲載されたサイト記事である。サイト記事51Eは、live window ニュースのWEBサイトに掲載されたサイト記事である。サイト記事51Aないし51Eの内容は同一であり、いずれか一つは元メディアによるサイト記事であり、他の四つは、転載メディアによるサイト記事である。本実施の形態では、例えば、スポーツJPのサイト記事51Cが元メディアによるサイト記事であるとする。
図5は、転載情報生成装置11の操作端末のディスプレイ(画面)に表示された収集記事情報登録画面の例を示している。
収集記事情報登録画面60は、サイト記事情報入力部61、登録サイト記事リスト表示部62、及び、終了ボタン63を有する。
サイト記事情報入力部61は、入力担当者であるユーザの操作を受け付け、一つの収集記事について、1以上のサイト記事情報を入力する。サイト記事情報入力部61は、収集記事情報登録部31として機能する。
サイト記事情報入力部61には、サイト管理番号入力部71、サイト名入力部72、URL入力部73、第1見出し入力部74A、第2見出し入力部74B、日付入力部75、登録ボタン76、及び、消去ボタン77を有する。
サイト管理番号入力部71には、WEBサイトに対して一意に識別可能に設定された管理番号であるサイト管理番号が入力される。サイト管理番号は予め決定されている。サイト名入力部72には、WEBサイトのサイト名が入力される。URL入力部73には、WEBサイトのURL(Uniform Resource Locator)が入力される。第1見出し入力部74Aには、WEBサイトで掲載されていた見出し(タイトル)が入力される。第2見出し入力部74Bには、第1見出し入力部74Aに入力した見出しを短縮した見出し(サブタイトル)が入力される。第1見出し入力部74Aへの入力は必須であるが、第2見出し入力部74Bへの入力は任意である。日付入力部75には、WEBサイトが掲載された日付が入力される。登録ボタン76は、1つのサイト記事について、サイト管理番号入力部71ないし日付入力部75の入力が終了し、サイト記事情報として登録する場合に押下される。消去ボタン77は、サイト管理番号入力部71ないし日付入力部75の入力を消去する場合に押下される。
ユーザは、入力対象のWEBサイトのサイト記事について、サイト管理番号入力部71ないし日付入力部75に情報を入力し、登録ボタン76を押下する。登録ボタン76が押下されると、サイト基礎情報設定部32は、“サイト管理番号”、“サイト名”、または“URL”のいずれかに基づいて、入力されたWEBサイトのサイト基礎情報をサイト基礎情報DB33から取得し、入力されたサイト記事情報に付加する。そして、入力されたサイト記事情報に、サイト基礎情報を付加した基礎付きサイト記事情報を、1行で、登録サイト記事リスト表示部62に表示させる。
ユーザは、複数のサイト記事について順次入力し、登録ボタン76を押下することで、複数のサイト記事情報を連続して登録することができる。図5の登録サイト記事リスト表示部62は、サイト基礎情報が付加された7件の基礎付きサイト記事情報が入力された収集記事情報リスト81の例を示している。登録サイト記事リスト表示部62には、サイト基礎情報は表示されなくてもよいし、表示されてもよい。
登録サイト記事リスト表示部62では、1件のサイト記事情報について、サイト記事情報入力部61で入力された、“サイト管理番号”、“サイト名”、“URL”、“日付”、“見出し(第1見出し)”、“見出し2(第2見出し)”、のほかに、“優先”、“元無”を少なくとも含む。“優先”は、並替優先を表し、並び替えにおいて優先したいサイト記事をチェック(指定)することができる。元メディアによるサイト記事情報に対して“優先”の項目がチェックされる。1つのサイト記事情報の“優先”の項目がチェックされた場合、“優先”の項目がチェックされていない他のサイト記事情報は、転載メディアによるサイト記事情報であることを表す。つまり、“優先”が元メディアによるサイト記事情報であることを示す情報である。このように、登録サイト記事リスト表示部62は、そのサイト記事が元メディアによるサイト記事であるか、または、転載メディアによるサイト記事であるかを示す転載情報を設定することができ、転載情報設定部34として機能する。“元無”は、元メディアによるサイト記事情報がない場合を特に明示したい場合にチェックされる。
図5の例のように、登録サイト記事リスト表示部62に、7件の基礎付きサイト記事情報が登録された状態において、図4で示したスポーツJPのサイト記事51Cが元メディアによるサイト記事であるため、例えば、ユーザが、リストの上から2行目のスポーツJPの“優先”の項目をチェックする。すると、転載情報設定部34は、図6に示されるように、リストの上から2行目のスポーツJPのサイト記事情報が、一番上の行(最上位)に表示されるように収集記事情報リスト81をソートする。登録サイト記事リスト表示部62に表示された複数の基礎付きサイト記事情報のうち、1つは元メディアによるサイト記事情報を表し、残りは、転載メディアによるサイト記事情報を表す。この親子関係が付加された基礎付きサイト記事情報は、親子・基礎付きサイト記事情報に相当する。終了ボタン63が押下されると、転載情報設定部34は、登録サイト記事リスト表示部62に表示された1以上の親子・基礎付きサイト記事情報を、収集記事DB35に記憶させる。
図7は、サイト基礎情報DB33に記憶されている、サイト基礎情報の例を示している。
サイト基礎情報DB33は、収集対象の各WEBサイトについてのサイト基礎情報を記憶する。サイト基礎情報は、WEBサイトのプロフィールを示す情報であり、“管理番号”、“サイト名”、“URL”、“Site Name”、“運営元”、“運営元英字”、“分類1(対象)”、“分類2(運営元)”、“分類3(内容)”、“広告換算値”、“想定UU/日”、“想定UU/月”、“想定PV/日”、“想定PV/月”、“モバイル率(スコア1)”、“滞在スコア(スコア2)”、“回遊スコア(スコア3)”、“流入スコア(スコア4)”、“サイトスコア(スコア5)”、及び、“サイトランク(スコア6)”の各項目を有する。
項目“管理番号”は、サイト管理番号を表す。項目“サイト名”は、WEBサイトの正式名称を表す、項目“URL”は、WEBサイトのURLを表す。項目“Site Name”は、WEBサイトの英語表記を表す。“運営元”は、WEBサイトを運営している運営元(メディア)の名称を表す。“運営元英字”は、WEBサイトを運営している運営元の英語表記を表す。
項目“分類1(対象)”は、サイトがターゲットにしている層を分類した値であり「一般」または「専門」の2値で表現される。項目“分類2(運営元)”は、新聞社、TV局、ポータル等、サイト運営元の種類を表す。項目“分類3(内容)”は、ニュース、ビジネス、スポーツ、ファッション等、WEBサイトが扱うニュースのジャンルを分類した情報を表す。
項目“広告換算値”は、広告に換算した値を表す。項目“想定UU/日”は、想定される1日当たりのWEBサイトのユーザ数を表す。項目“想定UU/月”は、想定される1カ月当たりのWEBサイトのユーザ数を表す。項目“想定PV/日”は、想定される1日当たりのサイトのページ表示回数(閲覧数)を表す。項目“想定PV/月”は、想定される1カ月当たりのサイトのページ表示回数(閲覧数)を表す。項目“モバイル率(スコア1)”は、モバイル端末を利用してアクセスしたユーザの割合を表す。項目“滞在スコア(スコア2)”は、ユーザがWEBサイトに滞在する時間を指数化したスコアを表す。項目“回遊スコア(スコア3)”は、ユーザがWEBサイト内で何記事くらい閲覧するのかを指数化したスコアを表す。項目“流入スコア(スコア4)”は、UU数やPV数を元にWEBサイトの利用数の多さを指数化したスコアを表す。項目“サイトスコア(スコア5)”は、滞在スコア、回遊スコア、流入スコアの合計値を表す。項目“サイトランク(スコア6)”は、サイト基礎情報DB33に収録されているWEBサイトの中で「サイトランク」が高い順にランク付けした値を表す。
図8は、再構成部36の処理を説明する図である。
収集記事DB35には、上述したように、サイト基礎情報及び親子関係を示す情報が付加されたサイト記事情報である親子・基礎付きサイト記事情報、すなわち収集記事情報が、ユーザ(入力担当者)の情報入力に応じて記憶される。
例えば、図8に示されるように、2023/06/15に担当Aによって登録された記事Xについての収集記事情報が収集記事DB35に記憶されている。また、2023/06/16に担当Aによって登録された記事Xについての収集記事情報と、担当Bによって登録された記事Xについての収集記事情報が収集記事DB35に記憶されている。また、2023/06/16に担当Bによって登録された記事Yについての収集記事情報と、2023/06/23に担当Bによって登録された記事Yについての収集記事情報が収集記事DB35に記憶されている。
このように、例えば、1日単位等で収集記事が蓄積された場合、同一内容の収集記事であっても、収集記事DB35に日毎に離散して収集記事DB35に蓄積される。また例えば、1つの収集記事について、複数の担当者がサイト記事を収集し、登録した場合、同一内容の収集記事について担当者ごとに離散して収集記事DB35に蓄積される。
再構成部36は、そのように離散された1つの収集記事に関する親子・基礎付きサイト記事情報(収集記事情報)を、一定期間でまとめて所定の並び順にソートして、横断記事データとして、記事情報DB12に記憶させる。
再構成部36は、例えば、図8に示されるように、5個の項目に優先順位を付けて、昇順または降順で、収集記事DB35に蓄積されている全ての収集記事情報をソートして、横断記事データとして、記事情報DB12に記憶させる。
図9は、記事属性情報DB37に記憶されている記事属性情報の例を示している。
記事属性情報DB37には、記事情報DB12に記憶される各収集記事に対して、“分類4(業界)”、“分類5(内容)”、及び、“分類6(方法)”の各項目が、収集記事の属性として記憶されている。項目“分類4(業界)”は、食品、建設、金融、美容、アパレル、航空、スポーツなど、記事の業界を分類した情報を表す。項目“分類5(内容)”は、イベント、コーポレート、新商品、キャンペーン、CM、決算・人事、不祥事など、記事の内容を分類した情報を表す。項目“分類6(方法)”は、発表会、タレント起用、コラボ企画、プレスリリースなど、記事の方法を分類した情報を表す。タスク登録番号及びタスク管理番号は、収集記事に付与された番号を表す。
例えば、記事属性情報DB37には、タスク登録番号「24829」、タスク管理番号「D1 2305_100スマート・Bプロジェクト」の収集記事に対して、項目“分類4(業界)”として「美容」が、項目“分類5(内容)”として「イベント」が、項目“分類6(方法)”として「タレント起用」が記憶されている。したがって、タスク登録番号「24829」及びタスク管理番号「D1 2305_100スマート・Bプロジェクト」の収集記事は、“分類4(業界)”が「美容」に該当し、“分類5(内容)”が「イベント」に該当し、“分類6(方法)”が「タレント起用」に該当する記事であることが記憶(登録)されている。なお、記事属性情報DB37に各収集記事の記事属性情報を登録する方法は任意である。入力担当者であるユーザが、各収集記事の記事属性情報を記事属性情報DB37に登録してもよいし、別のシステムによって記事情報DB12に記憶されている収集記事情報の記事属性情報を自動で分類して登録してもよい。
図10及び図11は、記事情報DB12に記憶された複数の収集記事に関する収集記事情報の例を示している。図10及び図11の収集記事情報は、収集記事DB35に蓄積されていた各収集記事情報が再構成部36によってソートされて記事情報DB12に記憶された後、属性情報登録部38によって記事属性情報が付加された後の収集記事情報を示している。
図10と図11においては、1行に並ぶ1つの親子・基礎付きサイト記事情報の各項目を、2図に分けて示している。本来は、図10の最右列の項目“運営元”の次に、図11の最左列の項目“分類1”が続くように配列されている。記事情報DB12に記憶された収集記事情報は、再構成部36によりソートされているため、各収集記事について、1か月以上の長期間の収集記事情報を、元サイトの情報を最上位に配置して整列したデータとなっている。図10と図11において、記事属性情報に相当する、“分類4”、“分類5”、及び、“分類6”の各項目は、図9で示した記事属性情報DB37に記憶されている情報と対応している。
<5.収集記事情報生成処理のフローチャート>
次に、図12のフローチャートを参照して、転載情報生成装置11が実行する処理である、サイト記事情報の登録から、収集記事情報として記事情報DB12に記憶するまでの処理(収集記事情報生成処理)について説明する。
初めに、ステップS1において、収集記事情報登録部31は、図5の収集記事情報登録画面60をディスプレイに表示し、ユーザの操作を受け付ける。そして、収集記事情報登録部31は、ユーザによって入力された、一つの収集記事に関する1つ以上のサイト記事情報を登録する。
ステップS2において、サイト基礎情報設定部32は、登録された各サイト記事情報について、サイト基礎情報をサイト基礎情報DB33から取得し、サイト記事情報に付加して、基礎付きサイト記事情報を生成し、転載情報設定部34に供給する。
ステップS3において、転載情報設定部34は、サイト基礎情報設定部32から供給された基礎付きサイト記事情報に対して、そのサイト記事が元メディアによるサイト記事であるか、または、転載メディアによるサイト記事であるかを示す転載情報を設定する。具体的には、図5の収集記事情報登録画面60の登録サイト記事リスト表示部62において、ユーザが、所定の基礎付きサイト記事情報の“優先”の項目をチェックすることにより、転載情報が設定される。
ステップS4において、転載情報設定部34は、基礎付きサイト記事情報に転載情報が設定された、親子・基礎付きサイト記事情報を、収集記事DB35に記憶させる。
ステップS5において、再構成部36は、親子・基礎付きサイト記事情報の再構成を行う所定のタイミングが到来したかを判定する。例えば、予め設定した一定期間が経過した場合や、ユーザにより再構成実行の操作が行われた場合、所定のタイミングが到来したと判定される。再構成部36は、所定のタイミングが到来したと判定されるまで、ステップS5の処理を繰り返し、所定のタイミングが到来したと判定された場合、処理をステップS6に進める。
ステップS6において、再構成部36は、指定された所定の優先順位に従い、収集記事DB35に蓄積されている複数の親子・基礎付きサイト記事情報をソートし、横断記事データとして、記事情報DB12に記憶させる。記事情報DB12は、収集記事情報単位にソートされた複数の親子・基礎付きサイト記事情報を記憶する。
ステップS7において、属性情報登録部38は、記事情報DB12に新たに記憶された収集記事の記事属性情報が記事属性情報DB37に記憶されているかを判定する。ステップS7で、新たに記憶された収集記事の記事属性情報が記事属性情報DB37に記憶されていないと判定された場合、次のステップS8の処理はスキップされ、収集記事情報生成処理が終了される。
一方、ステップS7で、記事情報DB12に新たに記憶された収集記事の記事属性情報が記事属性情報DB37に記憶されていると判定された場合、ステップS8に進み、属性情報登録部38は、記事属性情報DB37から収集記事の記事属性情報を取得し、記事情報DB12に記憶されている収集記事情報の各々に記事属性情報を付加し、収集記事情報生成処理を終了する。
図12の収集記事情報生成処理は、任意のタイミングで繰り返し実行される。ステップS1ないしS8の処理は、一連の処理として連続して実行される必要はなく、個別に実行することができ、複数のステップの処理を並列して実行してもよい。収集記事情報生成処理により、収集記事情報が記事情報DB12に蓄積される。これを用いて、ある特定の内容の記事がどれだけのWEBサイトに掲載されるかを推定することができる。
<6.掲載情報推定装置の構成例>
図13は、掲載情報推定装置13の構成例を示すブロック図である。
図13に示される掲載情報推定装置13は、記事情報DB12が掲載情報推定装置13の一部として組み込まれた例を示している。
掲載情報推定装置13は、記事情報DB12のほか、選定部101、推定部102、及び、提示部103を有する。選定部101は、元メディアのWEBサイト(元サイト、親サイト)を選定する。推定部102は、転載メディアのWEBサイト(転載サイト、子サイト)を推定する。掲載情報推定装置13は、WEBサイトを選定または推定するが、WEBサイトの選定及び推定は、WEBサイトを運営する元メディアまたは転載メディアを選定及び推定することと同義である。つまり、掲載情報推定装置13は、WEBサイトを運営する元メディアまたは転載メディアを選定または推定するとも言える。提示部103は、選定部101の選定結果、及び、推定部102の推定結果をユーザに提示する。選定部101は元サイトを選定するが、元サイトに応じて転載すると推定される転載サイトも選定結果として提示される。推定部102が転載サイトを推定するためには元サイトが特定される必要があるため、推定部102は、元サイトと、元サイトに応じて転載すると推定した転載サイトが推定結果として提示される。つまり、元サイトを選定したり、転載サイトを推定するが、選定部101と推定部102のいずれにおいても、結果としては、元サイトと転載サイトの両方が提示される。
選定部101は、記事情報DB12に記憶されている過去の収集記事情報の実績に基づいて、所定の条件に合致する元メディアのサイトを選定(推定)する。換言すれば、選定部101は、所定の条件を設定した場合、どの元メディアにサイト記事を作成してもらうことが望ましいかを選定する。所定の条件は、元メディアのサイトを抽出するための条件であることから、抽出条件とも称する。
選定部101は、元サイト選定部111、子サイト指定・元サイト選定部112、及び、分類指定・元サイト選定部113を有する。
元サイト選定部111は、記事情報DB12に記憶されている多数の元サイトのなかから、所定の抽出条件に基づく元サイトを選定する。子サイト指定・元サイト選定部112は、子サイトを指定して、元サイトを選定する。子サイト指定・元サイト選定部112は、掲載させたい子サイト(転載サイト)が決まっている場合、換言すれば、特定の子サイトに掲載されたい場合に、どの元メディアにサイト記事を作成してもらうことが望ましいかを選定する。分類指定・元サイト選定部113は、抽出条件として分類1ないし6を指定して、元サイトを選定する。
推定部102は、記事情報DB12に記憶されている過去の収集記事情報の実績に基づいて、所定の条件に合致する転載サイトを推定する。換言すれば、推定部102は、所定の条件を設定した場合、どの転載サイトに掲載されるか、または、掲載されていたと予想されるかを推定する。
推定部102は、掲載サイト推定部121、日付指定・掲載サイト推定部122、分類指定・掲載サイト推定部123を有する。
掲載サイト推定部121は、元サイトが決まっている場合に、その元サイトの影響度、つまり、転載サイトにどれだけ展開されるかを推定する。日付指定・掲載サイト推定部122は、実際に掲載された元サイトがわかっている場合に、元サイトの日付を指定して、転載サイトにどれだけ展開されるかを推定する。例えば、入力される日付が掲載期間が終了した過去の日付(例えば5年前)である場合には、その当時の実績に基づいて、掲載されていたであろう転載サイトを推定する。分類指定・掲載サイト推定部123は、抽出条件として分類1ないし6を指定して、掲載サイトを推定する。
提示部103は、例えば、LCD(Liquid Crystal Display)、有機EL(electro-luminescence)パネルなどディスプレイで構成され、画面上に選定結果または推定結果を表示することにより、ユーザ(操作者)に提示する。提示部103は、例えば、LAN等の通信インタフェースで構成され、ネットワークを介して接続された他の装置(例えばコンピュータ)へ選定結果または推定結果を送信することで、ユーザに提示する構成でもよい。
<7.掲載情報推定装置のUI画面例>
図14は、提示部103としてのディスプレイに表示される、掲載情報推定装置13のUI画面であり、実行選択画面の例を示している。
図14の実行選択画面150は、選定部101に対応する元サイト選定エリア152と、推定部102に対応する掲載サイト推定エリア153と、実行ボタン154、及び、キャンセルボタン155を有している。
元サイト選定エリア152は、元サイト選定ボタン171、子サイト指定・元サイト選定ボタン172、及び、分類指定・元サイト選定ボタン173を有する。掲載サイト推定エリア153は、元サイト指定・掲載サイト推定ボタン181、日付指定・掲載サイト推定ボタン182、及び、分類指定・掲載サイト推定ボタン183を有する。
元サイト選定ボタン171は、元サイト選定部111が実行する元サイト選定処理に対応する。子サイト指定・元サイト選定ボタン172は、子サイト指定・元サイト選定部112が実行する子サイト指定・元サイト選定処理に対応する。分類指定・元サイト選定ボタン173は、分類指定・元サイト選定部113が実行する分類指定・元サイト選定処理に対応する。
元サイト指定・掲載サイト推定ボタン181は、掲載サイト推定部121が実行する掲載サイト推定処理に対応する。日付指定・掲載サイト推定ボタン182は、日付指定・掲載サイト推定部122が実行する日付指定掲載サイト推定処理に対応する。分類指定・掲載サイト推定ボタン183は、分類指定・掲載サイト推定部123が実行する分類指定掲載サイト推定処理に対応する。
ユーザは、6個のボタンのいずれか、即ち、元サイト選定ボタン171、子サイト指定・元サイト選定ボタン172、分類指定・元サイト選定ボタン173、元サイト指定・掲載サイト推定ボタン181、日付指定・掲載サイト推定ボタン182、または、分類指定・掲載サイト推定ボタン183を選択して、実行ボタン154を操作(押下)する。掲載情報推定装置13は、ユーザによって指定された処理を実行する。
<8.元サイト選定処理>
初めに、元サイト選定部111が実行する元サイト選定処理について説明する。
図14の実行選択画面150において、ユーザが元サイト選定エリア152の元サイト選定ボタン171を選択して実行すると、元サイト選定部111による元サイト選定処理が開始され、図15に示される抽出条件設定画面200が、所定のディスプレイに表示される。
図15の抽出条件設定画面200では、チェックボックス211、項目212、ドロップダウンリスト213のセットが複数並んで表示されている。項目212は、抽出条件として設定可能な項目であり、ドロップダウンリスト213には項目212の内容(詳細)が表示され、指定することができる。チェックボックス211は、対応する項目212を抽出条件として設定する場合にチェック(指定)される。項目212は、図10,図11で説明した収集記事情報の各項目に対応している。
例えば、抽出条件を、「出版社」が運営する、「ユーザ数20万人以上」の、「ビジネス系」のサイトとしたい場合、図15に示されるように、「出版社」に関して、“分類2”の項目212のチェックボックス211がオンされ、ドロップダウンリスト213では、「新聞社・出版社」が指定される。また、「ユーザ数20万人以上」に関して、“UU/日”の項目212のチェックボックス211がオンされ、ドロップダウンリスト213では、「200,000以上」が指定される。また、「ビジネス系」に関して、“分類3”の項目212のチェックボックス211がオンされ、ドロップダウンリスト213では、「ビジネス」が指定される。
そして、ユーザにより実行ボタン215が押下されると、元サイト選定部111は、抽出条件に合致する元サイトを選定する。キャンセルボタン216が押下されると、抽出条件設定画面200が消去され、図14の実行選択画面150に戻る。
図16は、実行ボタン215押下により、元サイト選定部111が元サイト選定処理を実行し、その結果を表示する元サイト選定結果画面230の例である。
元サイト選定結果画面230において、元サイト選定部111は、記事情報DB12に記憶されている多数の元サイトのなかから、図15の抽出条件設定画面200で指定された抽出条件に合致する元サイトを選定し、表示する。また、元サイト選定部111は、過去の収集記事情報の実績に基づいて、選定された元サイトと親子関係を有する転載サイトも合わせて表示する。元サイトと親子関係を有する転載サイトは、過去に1度でも元サイトから転載された実績があるサイトを表示しても良いし、一定期間以上に所定回数、元サイトから転載された実績があるサイトを表示しても良い。あるいはまた、図15の抽出条件設定画面200において、期間を指定できるように構成し、指定された期間において元サイトから転載された実績があるサイトを表示するようにしてもよい。元サイト選定結果画面230において、グルーピングされたサイトのリスト(一覧)が、1つの元サイトと、それに紐づく転載サイトを表し、最上段が元サイト、2段目以降が転載サイトを表す。サイトのリストでは、例えば、記事の実績件数、分類(3)、想定UU/日、広告換算値の項目が各サイトについて表示され、グルーピングされたサイトリストの合計も表示されている。元サイト選定結果画面230において各サイトについて表示する項目は、設定画面等において、図15の抽出条件設定画面200の項目212と同じ項目のなかから、任意の項目を指定することができる。
図16の元サイト選定結果画面230では、図15の抽出条件設定画面200で指定された抽出条件に合致する元サイトとして、「PORESIDENT on-line」、「アジア経済オンライン」、「近代ビジネス」の3サイトが抽出され、表示されている。図16の元サイト選定結果画面230では、元サイト「PORESIDENT on-line」の転載サイトとして14サイト、「アジア経済オンライン」の転載サイトとして8サイト、「近代ビジネス」の転載サイトとして5サイトが表示されている。
図16の元サイト選定結果画面230から、元サイト単独のユーザ数(想定UU)で比較すると、「PORESIDENT on-line」が724,000人、「アジア経済オンライン」が923,942人、「近代ビジネス」が51,101人であり、「アジア経済オンライン」が最大のユーザ数を擁している。また、転載サイトの数で比較すると、「PORESIDENT on-line」が14サイト、「アジア経済オンライン」が8サイト、「近代ビジネス」が5サイトであり、「PORESIDENT on-line」が最多の14サイトを擁している。さらに、元サイトと転載サイトを併せた掲載サイト全体のユーザ数で比較すると、「PORESIDENT on-line」が100,806,375人、「アジア経済オンライン」が79,988,311人、「近代ビジネス」が,51,519,584人であり、「PORESIDENT on-line」が最大のユーザ数を擁している。したがって、例えば、元サイト単独のユーザ数で考えれば、「アジア経済オンライン」にサイト記事を作成してもらうことが好ましいが、掲載サイト全体のユーザ数では、「PORESIDENT on-line」にサイト記事を作成してもらうことが好ましい、などと判断することができる。
出力ボタン255は、CSV出力や印刷出力を行う場合に押下される。戻るボタン256は、元サイト選定結果画面230を消去し、図14の実行選択画面150に戻る場合に押下される。
以上のように、元サイト選定部111による元サイト選定処理によれば、多数の元サイトのなかから、所定の抽出条件に合致する元サイトはどこか、換言すれば、どの元サイトに記事を作成してもらうのが好ましいかを判断することができる。例えば、多くのユーザに見てもらうためにどのメディアにサイト記事を作成してもらうのが良いかを選定することができる。
図17のフローチャートを参照して、元サイト選定部111による元サイト選定処理の一例について説明する。この処理は、例えば、元サイト選定ボタン171を選択して実行ボタン154を押下した場合に開始される。
初めに、ステップS11において、元サイト選定部111は、抽出条件を設定する図15の抽出条件設定画面200をディスプレイに表示させる。ユーザは、元サイトを選定するための条件(抽出条件)を指定し、実行ボタン215を押下する。
ステップS12において、元サイト選定部111は、抽出条件が指定されたか、即ち、抽出条件設定画面200において所定の項目がチェックされ、実行ボタン215が押下されたかを判定する。ステップS12において、抽出条件が指定されたと判定するまで処理が繰り返され、抽出条件が指定されたと判定された場合、処理はステップS13へ進む。
ステップS13において、元サイト選定部111は、抽出条件に合致する元サイトを選定し、元サイトから転載された実績のある転載サイトを選定する。
ステップS14において、元サイト選定部111は、選定した元サイトと、それに紐づく転載サイトを表示する。選定した元サイトと転載サイトからなるリストは、複数、表示され得る。リストの表示後、戻るボタン256押下等により、元サイト選定処理は終了する。
元サイト選定処理は、以上のように実行される。元サイト選定処理によれば、多数の元サイトのなかから、所定の抽出条件に合致する元サイトを選定することができる。また、元サイトから、どの転載サイトに掲載されるかを予測することができる。
<9.子サイト指定・元サイト選定処理>
次に、子サイト指定・元サイト選定部112が実行する子サイト指定・元サイト選定処理について説明する。
図14の実行選択画面150において、ユーザが元サイト選定エリア152の子サイト指定・元サイト選定ボタン172を選択して実行すると、子サイト指定・元サイト選定部112による子サイト指定・元サイト選定処理が開始され、図18に示される転載サイト指定画面270が、所定のディスプレイに表示される。
子サイト指定・元サイト選定部112は、掲載させたい子サイト(転載サイト)が決まっている場合、その子サイトを条件として指定して元サイトを選定(推定)する。そのため、ユーザは、図18の転載サイト指定画面270において、掲載させたい転載サイトを指定する。転載サイト指定画面270には、記事情報DB12に記憶されている多数の転載サイトのリストが表示されている。ユーザは、チェックボックス281と転載サイト名282が表示された転載サイトのうち、掲載させたいサイトのチェックボックス281をオン(指定)する。図18の例では、「live window」のサイトがチェックされている。条件指定ボタン283は、元サイトの条件を指定する場合に押下(選択)される。条件指定ボタン283が押下されると、図15と同様の抽出条件設定画面200が表示され、元サイトの条件を指定することができる。例えば、指定した転載サイトに転載される元サイトのうち、ユーザ数が所定数以上の元サイトに限定する、のように、元サイトの条件を指定することができる。
実行ボタン285が押下されると、子サイト指定・元サイト選定部112は、抽出条件に合致する元サイトを選定する。キャンセルボタン286が押下されると、転載サイト指定画面270が消去され、図14の実行選択画面150に戻る。
図19は、子サイト指定・元サイト選定部112が、図18の例に即して子サイト指定・元サイト選定処理を実行し、その結果を表示する元サイト選定結果画面300の例である。
図18に示した転載サイト指定画面270において「live window」のサイトがチェックされていたため、図19の元サイト選定結果画面300においては、「live window」のサイトに転載される元サイトのリスト(一覧)が表示されている。元サイト選定結果画面300の左側のサイトのリストが、指定された1つの転載サイトと、そのサイトに転載される元サイトを表し、最上段が転載サイト、2段目以降が元サイトを表す。サイトのリストでは、例えば、記事の実績件数、分類(3)、想定UU/日、広告換算値の項目が各サイトについて表示され、リストの合計も表示されている。元サイト選定結果画面230において各サイトについて表示する項目は、設定画面等において、図15の抽出条件設定画面200の項目212と同じ項目のなかから、任意の項目を指定することができる。
元サイト選定結果画面300の右側のサイトのリストは、条件指定ボタン283で元サイトの条件を指定した場合のリストを示している。例えば、元サイトの条件として、WEBサイトが扱うニュースのジャンルを分類した分類(3)の項目で、「ファッション」が指定された場合の結果、すなわち、「live window」のサイトに転載される元サイトで、分類(3)の項目が「ファッション」に該当する元サイトのリスト(一覧)が表示されている。
一方、図20に示す元サイト選定結果画面300は、「live window」のサイトに転載される元サイトで、かつ、元サイトの条件として、想定UU/日(ユーザ数)の項目で「100万人以上」が指定された場合の結果を示している。
図20の元サイト選定結果画面300の左側のサイトのリストは、図19と同様である。元サイト選定結果画面300の右側のサイトのリストが、元サイトの条件、すなわち「ユーザ数100万人以上」に応じたものに変更されている。
出力ボタン315は、CSV出力や印刷出力を行う場合に押下される。戻るボタン316は、元サイト選定結果画面300を消去し、図14の実行選択画面150に戻る場合に押下される。
元サイト選定結果画面300の元サイト表示ボタン312は、表示された元サイトを指定して、元サイトの影響力を確認したい場合に押下(選択)される。例えば、図20の元サイト選定結果画面300の右側のユーザ数100万人以上の元サイトのなかから、「スポーツJP」を指定して元サイト表示ボタン312が押下されると、図21に示す元サイト選定結果画面300が表示される。
図21の元サイト選定結果画面300は、「スポーツJP」の元サイトに記事が掲載された場合、どのような転載サイトに転載されるかを示している。リストの構成は、図16の元サイト選定結果画面230のリストと同様に、1つの元サイトと、それに紐づく転載サイトとなっている。ただし、最上段の元サイトは、図20の元サイト選定結果画面300で指定された「スポーツJP」である。また、2段目以降の転載サイトには、図18の抽出条件設定画面で指定した転載サイトである「live window」のサイト(破線で囲まれている)が必ず含まれている。
以上のように、子サイト指定・元サイト選定部112による子サイト指定・元サイト選定処理によれば、転載される子サイトを指定して、転載実績のある元サイトを選定することができる。転載実績のある複数の元サイトを、ユーザ数、分類等の項目で比較することができる。また、転載される子サイトを指定して、元サイトの影響力を確認することができる。
図22のフローチャートを参照して、子サイト指定・元サイト選定部112による子サイト指定・元サイト選定処理の一例について説明する。この処理は、例えば、子サイト指定・元サイト選定ボタン172を選択して実行ボタン154を押下した場合に開始される。
初めに、ステップS31において、子サイト指定・元サイト選定部112は、転載サイトを指定する図18の転載サイト指定画面270をディスプレイに表示させる。ユーザは、掲載されたい転載サイトを指定し、実行ボタン285を押下する。必要に応じて条件指定ボタン283を押下し、元サイトの条件を指定してもよい。
ステップS32において、子サイト指定・元サイト選定部112は、転載サイトが指定されたか、即ち、転載サイト指定画面270において所定の転載サイトがチェックされ、実行ボタン285が押下されたかを判定する。ステップS32において、転載サイトが指定されたと判定するまで処理が繰り返され、転載サイトが指定されたと判定された場合、処理はステップS33へ進む。
ステップS33において、子サイト指定・元サイト選定部112は、指定された転載サイトに転載される元サイトを選定する。条件指定ボタン283が押下され、元サイトの条件が指定された場合には、指定された条件に合致する元サイトも選定される。
ステップS34において、子サイト指定・元サイト選定部112は、選定した元サイトのリストを表示する。条件指定ボタン283が押下され、元サイトの条件が指定された場合には、図19及び図20の例のように、選定した元サイトのリストに加えて、指定された条件に合致する元サイトのリストも合わせて表示される。
ステップS35において、子サイト指定・元サイト選定部112は、元サイト表示が選択されたか、すなわち元サイト選定結果画面300の元サイト表示ボタン312が押下されたかを判定する。例えば図20の元サイト選定結果画面300において戻るボタン316が押下された場合、ステップS35は元サイト表示が選択されていないと判定され、子サイト指定・元サイト選定処理は終了する。
一方、元サイト選定結果画面300の元サイト表示ボタン312が押下され、ステップS35で元サイト表示が選択されたと判定された場合、処理はステップS36へ進み、子サイト指定・元サイト選定部112は、例えば図21の元サイト選定結果画面300のような、指定された元サイトと、それに紐づく転載サイトのリストを表示する。リストの表示後、戻るボタン316押下等により、子サイト指定・元サイト選定処理は終了する。
子サイト指定・元サイト選定処理は、以上のように実行される。子サイト指定・元サイト選定処理によれば、転載される子サイトを指定して、転載実績のある元サイトを選定することができる。また、元サイトから、どの転載サイトに掲載されるかも予測することができる。
<10.分類指定・元サイト選定処理>
次に、分類指定・元サイト選定部113が実行する分類指定・元サイト選定処理について説明する。
図14の実行選択画面150において、ユーザが元サイト選定エリア152の分類指定・元サイト選定ボタン173を選択して実行した場合、ディスプレイには、図15の抽出条件設定画面200と同じ画面、すなわち抽出条件として図15の各項目212を選択可能な画面が表示される。
分類指定・元サイト選定部113は、抽出条件設定画面200で指定された項目の条件を満たすサイトを抽出し、選定結果として表示する。サイトの抽出は、元サイトおよび転載サイトの区別なく抽出される点で、元サイト選定部111が実行する元サイト選定処理と異なるが、選定結果は、元サイトを最上段に表示し、その元サイトに紐づく転載サイトを2段目以降に表示する、グルーピングされたサイトリストで表示されるため、図16と同様の画面となる。
例えば、抽出条件として、「美容」業界の「キャンペーン」を「タレント起用」で実施した場合に掲載されるサイトを検索したい場合、ユーザは、“分類4(業界)”「美容」、“分類5(内容)”「キャンペーン」、“分類6(方法)”「タレント起用」を選択し、元サイトの選定を行う。これにより、予定の実施内容に対して、掲載されやすいサイトを選定することができる。
分類指定・元サイト選定処理では、元サイトおよび転載サイトの区別なくサイトを抽出するため、例えば、ユーザ数(例えば“想定UU/日”)や、閲覧数(例えば“想定PV/日”)がいくつ以上となるようにするためには、どの元サイト及び転載サイトが選定されるか、所定のサイトスコアがいくつ以上となるようにするためには、どの元サイト及び転載サイトが選定されるか等を調べることができる。また、図15の抽出条件設定画面200の抽出条件として「合計サイト数」の項目を追加し、合計サイト数がいくつ以上となるようにするためには、どの元サイト及び転載サイトが選定されるかを調べることができるようにしてもよい。
<11.掲載サイト推定処理>
次に、掲載サイト推定部121が実行する掲載サイト推定処理について説明する。
掲載サイト推定部121は、元サイトを条件として、転載サイトを推定する。つまり、掲載サイト推定部121は、元サイトが決まっている場合に、その元サイトの影響度、換言すれば、転載サイトにどれだけ展開されるかを推定する。
図23は、図14の実行選択画面150において、ユーザが掲載サイト推定エリア153の元サイト指定・掲載サイト推定ボタン181を選択して実行した場合にディスプレイに表示される元サイト指定画面の例である。
図23の元サイト指定画面330では、チェックボックス341、項目342のセットが複数並んで表示されている。項目342には、元サイトが表示されており、ユーザは、決定している元サイトのチェックボックス341をチェック(指定)する。元サイト指定画面330に表示されるサイトは、元サイトのみである。
実行ボタン345が押下されると、掲載サイト推定部121は、指定された元サイトに記事が作成された場合に転載されるであろう転載サイトを推定し、画面に表示させる。キャンセルボタン346が押下されると、元サイト指定画面330が消去され、図14の実行選択画面150に戻る。
掲載サイト推定部121による転載サイトの推定結果は、図16の元サイト選定結果画面230と同様となるので、図示は省略する。図16の元サイト選定結果画面230は、元サイトとして「PORESIDENT on-line」、「アジア経済オンライン」、「近代ビジネス」の3サイトが指定された場合の推定結果に相当する。
例えば、ユーザが、元サイト選定エリア152(選定部101)の元サイト選定機能を使って、いくつかの元サイトを、掲載を狙うサイトとして決定する。そして、掲載サイト推定処理により、決定した元サイトに掲載された場合に、これまでの実績に基づいてどれだけの転載サイトに転載されると推定されるか、元サイトの影響力を可視化することができる。仮に、図16の元サイト選定結果画面230のように、「PORESIDENT on-line」、「アジア経済オンライン」、「近代ビジネス」の3つの元サイトに掲載された場合、元サイトを含め、30サイト(=15サイト+9サイト+6サイト)に掲載され、約23,000万ユーザ(延べ人数)に閲覧してもらえることを予測することができる。
図24のフローチャートを参照して、掲載サイト推定部121による掲載サイト推定処理の一例について説明する。この処理は、例えば、元サイト指定・掲載サイト推定ボタン181を選択して実行ボタン154を押下した場合に開始される。
初めに、ステップS51において、掲載サイト推定部121は、元サイトを指定する図23の元サイト指定画面330をディスプレイに表示させる。ユーザは、所望の元サイトを指定し、実行ボタン345を押下する。
ステップS52において、掲載サイト推定部121は、元サイトが指定されたか、即ち、元サイト指定画面330において所定の元サイトがチェックされ、実行ボタン345が押下されたかを判定する。ステップS52において、実行ボタン345が押下されたと判定するまで処理が繰り返され、実行ボタン345が押下されたと判定された場合、処理はステップS53へ進む。
ステップS53において、掲載サイト推定部121は、過去の収集記事情報の実績に基づいて、指定された元サイトと親子関係を有する転載サイトを推定する。元サイトと親子関係を有する転載サイトは、過去に1度でも元サイトから転載された実績があるサイトとしても良いし、一定期間以上に所定回数、元サイトから転載された実績があるサイトとしても良い。あるいはまた、図23の元サイト指定画面330において、期間を指定できるように構成し、指定された期間において元サイトから転載された実績があるサイトを推定結果としてもよい。
ステップS54において、掲載サイト推定部121は、指定された元サイトと、それに対して推定された転載サイトを表示する。指定された元サイトと、推定された転載サイトからなるリストは、複数、表示され得る。リストの表示後、キャンセルボタン346押下等により、掲載サイト推定処理は終了する。
掲載サイト推定処理は、以上のように実行される。掲載サイト推定処理によれば、元サイトが決まっている場合に、どの転載サイトに掲載されるかを推定することができる。
<11.日付指定掲載サイト推定処理>
次に、日付指定・掲載サイト推定部122が実行する日付指定掲載サイト推定処理について説明する。
日付指定・掲載サイト推定部122は、実際に掲載された元サイトのサイト記事を条件として、転載サイトを推定する。つまり、実際に掲載された元サイトがわかっている場合に、日付指定・掲載サイト推定部122は、元サイトの日付を指定して、転載サイトにどれだけ展開されるかを推定する。
図25は、図14の実行選択画面150において、ユーザが掲載サイト推定エリア153の日付指定・掲載サイト推定ボタン182を選択して実行した場合にディスプレイに表示される実掲載元サイト入力画面の例である。
図25の実掲載元サイト入力画面350は、サイト名入力部361、URL入力部362、日付入力部363、見出し入力部364、実行ボタン365、及び、キャンセルボタン366を有する。
サイト名入力部361には、過去に実際に掲載された元サイトのサイト名が入力される。URL入力部362には、過去に実際に掲載された元サイトのURL(Uniform Resource Locator)が入力される。サイト名入力部361またはURL入力部362は、少なくともどちらか一方が入力されればよい。ただし、図26ないし図28で後述するように、URLを入力した方が、より詳細な出力を得ることができる。
日付入力部363には、元サイトが過去に実際に掲載された日付が入力される。見出し入力部364には、元サイトで掲載されていた見出し(タイトル)が入力される。実行ボタン365が押下されると、日付指定・掲載サイト推定部122は、過去に実際に掲載された元サイトに基づく転載サイトを推定し、画面に表示させる。キャンセルボタン366が押下されると、実掲載元サイト入力画面350が消去され、図14の実行選択画面150に戻る。
ユーザは、過去に実際に掲載されたWEBサイトのサイト記事について、サイト名入力部361またはURL入力部362のいずれか少なくとも一方と、日付入力部363と見出し入力部364を入力し、実行ボタン365を押下する。
図26は、URL入力部362のURLを入力せずに、サイト名入力部361にサイト名を入力した場合の、日付指定・掲載サイト推定部122による推定結果例を示している。
例えば、図25の実掲載元サイト入力画面350において、元サイト「スポーツJP」で過去に掲載されたサイト記事の情報が入力された。推定結果を表示する画面では、12の転載サイトに転載されていたとの推定結果が表示され、各転載サイトのサイト名と実績件数が表示されている。
図27は、URL入力部362のURLを入力せずに、サイト名入力部361にサイト名を入力した場合の、日付指定・掲載サイト推定部122による推定結果例を示している。
例えば、図25の実掲載元サイト入力画面350において、元サイト「Dayスポーツ」で過去に掲載されたサイト記事の情報が入力された。推定結果を表示する画面では、14の転載サイトに転載されていたとの推定結果が表示され、各転載サイトのサイト名と実績件数が表示されている。各転載サイトの詳細情報として示す項目は、実績件数だけに限れられない。例えば、図21に示した元サイト選定結果画面300の例のように、分類(3)、想定UU/日(ユーザ数)、広告換算値などを表示してもよい。
図28は、URL入力部362にURLを入力した場合の、日付指定・掲載サイト推定部122による推定結果例を示している。
紙面の都合で重ねて示しているが、推定レポート381Aが、図26に示したサイト記事について元サイト「スポーツJP」のURLと、日付、見出しを入力した場合の推定結果に対応している。一方、推定レポート381Bが、図27に示したサイト記事について元サイト「Dayスポーツ」のURLと、日付、見出しを入力した場合の推定結果に対応している。
図25の実掲載元サイト入力画面350においてURLを入力した場合、図28に示されるように、元サイトと、推定された転載サイトそれぞれについて、サイト名、URLまたは転載元を示す情報、日付、見出しが、推定レポート381として表示される。推定レポート381のうち、最上段の元サイトについての情報は、実際の情報であるが、2段目以降の転載サイトの情報は、日付指定・掲載サイト推定部122が推定した情報である。この推定レポート381のフォーマットは、例えば図6に示した収集記事情報リスト81、つまり、実際にサイト記事を収集したときのリストと同じ形式で表示される。これにより、推定ではあるが、実際にサイト記事を調査したときと同じ結果を得ることができる。
WEBサイトに掲載されるサイト記事は、メディアによって掲載期間が決まっており、一定期間を過ぎると、実際にどの転載サイトに掲載されたかを調査することはできない。記事情報DB12には、調査したいサイト記事については情報を保持していないとしても、同一期間、どの元サイトのサイト記事が、どの転載サイトに掲載されていたか、というメディア間の契約関係を推測するには十分な情報が蓄積されている。その蓄積情報を活用して、掲載期間が終了した過去の日付(例えば5年前)の実際の元サイトのサイト記事の情報を入力した場合に、その当時の実績に基づいて、掲載されていたであろう転載サイトを推定して表示することができる。
図29のフローチャートを参照して、日付指定・掲載サイト推定部122による日付指定掲載サイト推定処理の一例について説明する。この処理は、例えば、日付指定・掲載サイト推定ボタン182を選択して実行ボタン154を押下した場合に開始される。
初めに、ステップS71において、日付指定・掲載サイト推定部122は、実際に掲載された元サイトを指定する図25の実掲載元サイト入力画面350をディスプレイに表示させる。ユーザは、所望の元サイトの情報を入力し、実行ボタン365を押下する。
ステップS72において、日付指定・掲載サイト推定部122は、元サイトが指定されたか、即ち、実掲載元サイト入力画面350において所定の元サイトのサイト名またはURL、日付、見出しが入力され、実行ボタン365が押下されたかを判定する。ステップS72において実行ボタン365が押下されたと判定するまで処理が繰り返され、実行ボタン365が押下されたと判定された場合、処理はステップS73へ進む。
ステップS73において、日付指定・掲載サイト推定部122は、過去の収集記事情報の実績に基づいて、指定された元サイトと親子関係を有する転載サイトを推定する。元サイトと親子関係を有する転載サイトは、過去に1度でも元サイトから転載された実績があるサイトとしても良いし、一定期間以上に所定回数、元サイトから転載された実績があるサイトとしても良い。
ステップS74において、日付指定・掲載サイト推定部122は、指定された元サイトと、それに対して推定された転載サイトを表示する。リストの表示後、キャンセルボタン押下等により、日付指定掲載サイト推定処理は終了する。
日付指定掲載サイト推定処理は、以上のように実行される。日付指定掲載サイト推定処理によれば、過去に実際に掲載された元サイトがわかっている場合に、どの転載サイトに掲載されていたかを推定することができる。
<12.分類指定・元サイト推定処理>
次に、分類指定・掲載サイト推定部123が実行する分類指定掲載サイト推定処理について説明する。
図14の実行選択画面150において、ユーザが掲載サイト推定エリア153の分類指定・掲載サイト推定ボタン183を選択して実行した場合、ディスプレイには、図15の抽出条件設定画面200と同じ画面、すなわち抽出条件として図15の各項目212を選択可能な画面が表示される。
分類指定・掲載サイト推定部123は、抽出条件設定画面200で指定された項目の条件を満たすサイトを抽出し、推定結果として表示する。サイトの抽出は、元サイトおよび転載サイトの区別なく抽出される点で、掲載サイト推定部121が実行する掲載サイト推定処理と異なるが、選定結果は、元サイトを最上段に表示し、その元サイトに紐づく転載サイトを2段目以降に表示する、グルーピングされたサイトリストで表示されるため、図16と同様の画面となる。
例えば、抽出条件として、「美容」業界の「キャンペーン」を「タレント起用」で実施した場合に掲載されるサイトを検索したい場合、ユーザは、“分類4(業界)”「美容」、“分類5(内容)”「キャンペーン」、“分類6(方法)”「タレント起用」を選択し、掲載サイトの推定を行う。例えば、“分類4(業界)”が、項目「食品」、「建設」、「金融」、「美容」、「スポーツ」などに分類されている場合、元サイトと転載サイトの契約関係において、「美容」の業界の記事については転載しない、というような取り決めもあり得ることから、より精度を高めた転載サイトの推定結果を出力することができる。
<13.情報処理装置のハードウエア構成例>
上述した転載情報生成装置11、記事情報DB12、及び、掲載情報推定装置13のそれぞれは、例えば、サーバ装置、パーソナルコンピュータ等の情報処理装置で構成することができる。
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図30は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータ1000において、CPU(Central Processing Unit)1001,ROM(Read Only Memory)1002,RAM(Random Access Memory)1003は、バス1004により相互に接続されている。
バス1004には、さらに、入出力インタフェース1005が接続されている。入出力インタフェース1005には、入力部1006、出力部1007、記憶部1008、通信部1009、及びドライブ1010が接続されている。
入力部1006は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部1007は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部1008は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部1009は、ネットワークインタフェースなどよりなる。ドライブ1010は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体1011を駆動する。
以上のように構成されるコンピュータ1000では、CPU1001が、例えば、記憶部1008に記憶されているプログラムを、入出力インタフェース1005及びバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ1000の(CPU1001)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体1011に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータ1000では、プログラムは、リムーバブル記録媒体1011をドライブ1010に装着することにより、入出力インタフェース1005を介して、記憶部1008にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部1009で受信し、記憶部1008にインストールすることができる。その他、プログラムは、ROM1002や記憶部1008に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。例えば、上述した複数の実施の形態の全てまたは一部を組み合わせた形態を採用することができる。
例えば、本開示の技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。
なお、本開示の技術は、以下の構成を採用することができる。
(1)
WEBサイトに掲載された特定の内容のサイト記事に関する情報であるサイト記事情報を複数の前記WEBサイトについて登録する登録部と、
複数の前記WEBサイトの各サイト記事情報に、前記サイト記事が元メディアによるサイト記事であるか、または、前記元メディアのサイト記事を転載する転載メディアによるサイト記事であるかを示す転載情報を設定する転載情報設定部と、
前記転載情報が付加された前記サイト記事情報を記憶する記憶部と
を備える情報処理装置。
(2)
前記サイト記事情報は、前記WEBサイトのサイト名またはURLと、見出し及び日付の情報を含む
前記(1)に記載の情報処理装置。
(3)
前記サイト記事情報に、前記WEBサイトに関するサイト基礎情報を付加するサイト基礎情報設定部をさらに備え、
前記記憶部は、前記転載情報と前記サイト基礎情報が付加された前記サイト記事情報を記憶する
前記(1)または(2)に記載の情報処理装置。
(4)
前記サイト基礎情報を記憶するサイト基礎情報記憶部をさらに備え、
前記サイト基礎情報設定部は、サイト記事が掲載された前記WEBサイトの前記サイト基礎情報を前記サイト基礎情報記憶部から取得し、前記サイト記事情報に付加する
前記(3)に記載の情報処理装置。
(5)
前記サイト基礎情報は、前記WEBサイトの分類、ユーザ数、閲覧数、または、サイトスコアの少なくとも一つを含む
前記(3)または(4)に記載の情報処理装置。
(6)
前記記憶部に記憶されている、前記転載情報が付加された前記サイト記事情報を、同一の内容について所定の期間で再構成する再構成部をさらに備える
前記(1)ないし(5)のいずれかに記載の情報処理装置。
(7)
前記再構成部により再構成された同一内容の前記転載情報が付加された前記サイト記事情報は、前記記憶部とは異なる記憶部に記憶される
前記(6)に記載の情報処理装置。
(8)
前記転載情報設定部は、同一の内容の複数の前記サイト記事情報のリストを表示し、複数の前記サイト記事情報の所定の一つに、前記サイト記事が元メディアによるサイト記事であることを示す情報を設定することにより、前記転載情報を設定する
前記(1)ないし(7)のいずれかに記載の情報処理装置。
(9)
前記転載情報設定部は、前記サイト記事が元メディアによるサイト記事であることを示す情報が設定された場合、同一の内容の複数の前記サイト記事情報のリストを、前記情報が設定された前記サイト記事が最上位に配置されるようにソートする
前記(8)に記載の情報処理装置。
(10)
記事属性情報記憶部に記憶されている記事属性情報に基づいて、前記転載情報が付加された前記サイト記事情報に前記記事属性情報を付加する属性情報登録部をさらに備える
前記(1)ないし(9)のいずれかに記載の情報処理装置。
(11)
情報処理装置が、
WEBサイトに掲載された特定の内容のサイト記事に関する情報であるサイト記事情報を複数の前記WEBサイトについて登録し、
複数の前記WEBサイトの各サイト記事情報に、前記サイト記事が元メディアによるサイト記事であるか、または、転載メディアによるサイト記事であるかを示す転載情報を設定し、
前記転載情報が付加された前記サイト記事情報を記憶部に記憶させる
情報処理方法。
(12)
コンピュータに、
WEBサイトに掲載された特定の内容のサイト記事に関する情報であるサイト記事情報を複数の前記WEBサイトについて登録し、
複数の前記WEBサイトの各サイト記事情報に、前記サイト記事が元メディアによるサイト記事であるか、または、転載メディアによるサイト記事であるかを示す転載情報を設定し、
前記転載情報が付加された前記サイト記事情報を記憶部に記憶させる
処理を実行させるためのプログラム。