JP7098122B1 - 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム - Google Patents

記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム Download PDF

Info

Publication number
JP7098122B1
JP7098122B1 JP2021201103A JP2021201103A JP7098122B1 JP 7098122 B1 JP7098122 B1 JP 7098122B1 JP 2021201103 A JP2021201103 A JP 2021201103A JP 2021201103 A JP2021201103 A JP 2021201103A JP 7098122 B1 JP7098122 B1 JP 7098122B1
Authority
JP
Japan
Prior art keywords
article
page
target article
views
page view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021201103A
Other languages
English (en)
Other versions
JP2023086526A (ja
Inventor
泰行 松本
Original Assignee
株式会社トドオナダ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社トドオナダ filed Critical 株式会社トドオナダ
Priority to JP2021201103A priority Critical patent/JP7098122B1/ja
Application granted granted Critical
Publication of JP7098122B1 publication Critical patent/JP7098122B1/ja
Publication of JP2023086526A publication Critical patent/JP2023086526A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 記事単位のページビューを生成する技術を提供する。【解決手段】対象記事が掲載されているWebサイト100における総閲覧数とWebサイトのサイト構造とに基づいて1日における1つの記事の想定閲覧数である第1ページビューをBPV生成部151で生成し、対象記事のリンク位置に基づいて1秒間における対象記事へ到達する想定閲覧数である第2ページビューをFPV生成部152で生成し、第1ページビューと第2ページビューとを合算した対象記事の想定閲覧数である第3ページビューをDPV生成部153で生成し、この第3ページビューを時系列に表示する。【選択図】図1

Description

本発明は、注目情報が記述された記事の様々なメディアにおける掲載状況及び閲覧状況を監視する記事監視システムに関する。
Web(World Wide Web)メディアやソーシャルメディアが急速に普及している。Webメディアに表示されるページはWebページと呼ばれ、Webページの集合単位はWebサイトなどと呼ばれる。ソーシャルメディアは、個人による情報発信(投稿)や個人間の繋がりなどの社会的要素を含むメディアであり、投稿が掲載されているページは投稿ページと呼ばれ、その集合単位は投稿サイトなどと呼ばれる。投稿サイトは、例えばブログ、SNS(Social Networking Service)、動画共有サイト、メッセージ投稿サイトのように分類される。ソーシャルメディアとWebメディアとは相互にリンクされる場合もある。そのため、例えば話題性の高い情報が一旦どこかで公開されると、当該情報の内容やそのURL(Uniform Resource Locator)が様々なメディアを通じて飛躍的に拡散される現象が生じることは周知である。
このようなメディアの性質に着目したメディア活用例の一つがいわゆるネット広告であり、特許文献1にはWebページに掲載される広告への想定到達人数(リーチ数)を測定する技術が開示されている。また、特許文献2には、広告以外の情報、例えばキーワードで指定した商品等情報の複数のメディアでの意図しない露出状況を捕捉する技術が開示されている。特許文献2によれば、意図しない露出状況は、記事が存在するページの月間総ページビュー(閲覧数)を月間記事数で除算したリーチ数で定量化できるとされている。
特開2011-216120号公報 特開2020-24599号公報
特許文献1,2に記載されているリーチ数は、Webページのページビューに基づいて算出される。しかし、ここで使用されているページビューには、Webページが掲載されているWebサイトのサイト構造や個々の記事に到達するためのリンク経路などが考慮されていない。
近年のWebサイトのトップページには、様々な記事や広告の被リンクが貼られていたり、関連記事がカテゴリー毎に分類されて下位層ページに導く構造になっていたりする。そのため、個々の記事に到達するためのリンク経路は無数ともいえるが、従前のページビューはWebページ単位の閲覧数であって、1つのWebページ内の総リンク数や注目情報が記述された記事のリンク位置に着目した閲覧数の指標ではない。このような問題を改善するWeb解析の一手法として、近年、仮想ページビューが提案されているが、この仮想ページビューもまた、Webページ単位のものとなっている。
本発明は、上記背景に鑑み、注目情報が記述された記事の様々なメディアにおける掲載状況及び閲覧状況を監視する情報処理の仕組み、特に、個々の記事のリンク状態に応じて掲載状況や閲覧状況が記事毎に定量化される新たな概念のページビューを生成する技術の提供を主たる課題とする。本発明の他の課題は、本明細書及び図面の開示から明らかになるであろう。
本発明の一つの態様は、記事監視システムである。この記事監視システムは、注目情報が記述された対象記事を掲載したメディアサイトを探索し、これにより特定されたメディアサイトのサイト構造、記事カテゴリー毎の記事閲覧率、総閲覧数及び総記事数を取得する取得手段と、前記総閲覧数と前記サイト構造により特定される前記対象記事への遷移経路と、前記遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、前記総記事数と、に基づいて第1期間における1つの記事の想定閲覧数である第1ページビューを生成する第1手段と、前記対象記事のページ内リンク位置を特定し、該ページ内リンク位置と該ページ内リンク位置への遷移経路と、該遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、に基づいて前記第1期間よりも短い第2期間における前記対象記事へ到達する想定閲覧数である第2ページビューを生成する第2手段と、前記第1ページビューと前記第2ページビューとを含む前記対象記事の想定閲覧数である第3ページビューを生成する第3手段と、を備えてなる。
本発明の他の態様は、注目情報が記述された対象記事を掲載したメディアサイトを探索し、これにより特定されたメディアサイトのサイト構造、記事カテゴリー毎の記事閲覧率、総閲覧数及び総記事数を取得して保存する記事監視システムが実行する方法であって、
前記記事監視システムが、前記総閲覧数と前記サイト構造により特定される前記対象記事への遷移経路と、前記遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、前記総記事数と、に基づいて第1期間における1つの記事の想定閲覧数である第1ページビューを生成する第1処理ステップと、前記対象記事のページ内リンク位置を特定し、該ページ内リンク位置と該ページ内リンク位置への遷移経路と、該遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、に基づいて前記第1期間よりも短い第2期間における前記対象記事へ到達する想定閲覧数である第2ページビューを生成する第2処理ステップと、前記第1ページビューと前記第2ページビューとを含む前記対象記事の想定閲覧数である第3ページビューを生成する第3処理ステップと、前記対象記事の複製物を当該対象記事を発見した日時と共に保存する保存処理ステップと、を実行することを特徴とする、注目情報が記述された記事の監視方法である。
本発明の他の態様は、コンピュータないしコンピュータシステムを、請求項1から4のいずれか一項に記載された記事監視システムとして機能させるコンピュータプログラムである。
本発明によれば、注目情報が記述された記事の様々なメディアにおける掲載状況及び閲覧状況が第1ページビュー、第2ページビュー及び第3ページビューによって対象記事毎に定量化されるため、複雑なメディアサイトに掲載されたごく一部の記事であってもその掲載状況(どこに掲載されているか)及び閲覧状況(どの程度閲覧されたか)の把握が容易になるという格別の効果を奏することができる。
本実施形態の記事監視システムの全体構成例を示す機能ブロック図。 Webサイトのサイト構造の例示図。 記事の分類例となる趣向性の説明図。 対象記事のページ内リンク位置及び総リンク数の説明図。 サイト登録処理の手順説明図。 メディアサイト解析処理の手順説明図。 ページビュー生成処理の手順説明図。 基礎ページビュー生成処理の手順説明図。 流入ページビュー生成処理の手順説明図。 投稿ページビュー生成処理の手順説明図。 ドキュメントページビュー生成処理の手順説明図。 ユーザ端末のクライアントブラウザに表示される監視結果の例示図。
以下、本発明を、監視ないし捕捉の対象となる注目情報が記述された記事の掲載状況及び閲覧状況を定量化する記事監視システムに適用した場合の実施の形態例を説明する。
なお、監視ないし捕捉の対象となる注目情報が記述された記事を他の記事と区別する必要がある場合は、便宜上「対象記事」と称する。
<構成例>
図1は、本実施形態の記事監視システム1の全体構成例を示す機能ブロック図である。記事監視システム1は、インターネットNWに接続されたサーバ機能を有するコンピュータシステムであり、1つ以上のCPU(Central Processing Unit),RAM(Random Access Memory)、ROM(Read Only Memory)、大容量ストレージ及び各種I/0(Input/Output)インタフェースを備えている。インターネットNWには、さまざまなWebサイト100や投稿サイト200のほか、記事監視システム1の登録ユーザが操作するユーザ端末300が接続される。ユーザ端末300は、クライアントブラウザを通じて記事監視システム1あるいはWebサイト100及び投稿サイト200との間で双方向の情報受け渡しを行うことができる。
記事監視システム1は、本発明のコンピュータプログラムを実行することにより、コンピュータシステムを、入出力制御部11、ユーザ管理部12、Web管理部13、ソーシャルメディア管理部14、ページビュー生成部15、出力部16、及び、これらの機能ブロックを統括的に制御する主制御部18として動作させる。各機能ブロックの動作については、後で詳しく説明する。
記事監視システム1は、また、ユーザ(DBはデータベースの略、以下同じ)DB31、サイトプロフィールDB32、サイト構造DB33、記事DB34、ソーシャルメディアDB35へのデータの保存と、保存されたデータの読み出しができるように構成される。
ユーザDB31には、記事監視システム1へのアクセスを許容するユーザ端末300の権限情報と登録ユーザが指定した探索条件とがユーザID(IDは識別情報、以下同じ)と関連付けて、登録ユーザ毎に登録される。探索条件は、例えば、対象記事を掲載したWebページないしWebサイト、対象記事を探索するための特徴情報(特徴語句及びその類義語等)、監視ないし捕捉の期間と1回の集計サイクル等である。
サイトプロフィールDB32には、探索により特定された対象記事が掲載されているWebページのサイトプロフィールが保存される。サイトプロフィールの一つは、後述する対象記事のページビューを含む月間総ページビューA1、月間記事数A3である。サイト構造DB33は、対象記事が掲載されているWebページのサイト構造と、当該サイト構造に起因するカテゴリ毎の相対的な記事閲覧率である趣向性A2とが対象記事と関連付けて保存される。記事DB34は、探索により特定されたWebサイトに掲載されている対象記事や投稿サイトに掲載されていた対象記事が関わる投稿の複製物が保存される。なお、月間記事数A3は、サイトプロフィールDB32ではなく、記事DB34に保存してもよい。ソーシャルメディアDB35は、ブログやSNS等のソーシャルメディアのサイトプロフィールと、対象記事が関わる投稿のURLと、当該投稿の複写物と、当該投稿に対する評価情報とが、当該投稿の発見日時(年月日時分秒)と共に保存される。
次に、記事監視システム1の各機能ブロック11~18について説明する。入出力制御部11は、インターネットNWに接続されている各Webサイト100,投稿サイト200、ユーザ端末300との間で行われる情報の受け渡しを制御する。ユーザ管理部12は、この記事監視システム1にアクセスするユーザ端末300の権限情報とそれを操作するユーザをユーザDB31に登録する。登録されたユーザを以下「登録ユーザ」と呼ぶ。ユーザ管理部12は、また、登録ユーザが指定した探索条件とをユーザIDと関連付けて、ユーザ毎にユーザDB31に保存する。ユーザ管理部12は、ユーザ端末300からのアクセスがあったときに権限情報を用いて認証する認証処理をも行う。
Web管理部13は、探索条件の決定処理と、決定された探索条件に基づいて周期的にインターネットNWをクローリングして対象記事が掲載されているWebサイトを探索する探索処理と、Webサイトの解析処理と、対象記事の解析処理とを行う。ソーシャルメディア管理部14は、対象記事に関する投稿を探索するとともに、探索により特定された投稿やその投稿に付随して掲載されている情報(投稿等)を解析するメディアサイト解析処理を行う。付随して掲載されている情報は、例えば投稿に対して同調したり返信したりする情報を含む評価情報を含む。
ページビュー生成部15は、第1手段の一例となる基礎ページビュー(BPV)生成部151と、第2手段の一例となる流入ページビュー(FPV)152生成部と、第3手段の一例となるドキュメントページビュー(DPV)生成部153とを詳細ブロックとして含み、これらの詳細ブロックの機能により、対象記事のページビューであるドキュメントページビューを生成する。出力部16は、登録ユーザが入力した上記期間における対象記事のドキュメントページビュー、対象記事や投稿の複製物の一部又は全部、評価情報その他の情報をユーザ端末300に向けて出力する処理を行う。
<動作例>
次に、上記のように構成される記事監視システム1の動作例について説明する。ここでは、対象記事が掲載されているWebサイトの一つが図2のようなサイト構造であり、図2のサイト構造のWebサイトを含む複数のWebサイトのTOP(図2の第2階層相当)が図3のように様々であり、掲載記事が掲載されている対象記事が図4に例示されるページのほぼ中間の位置に掲載されているものとする。
図5~図12は、主制御部18が他の機能ブロックと協働で実行する処理ステップの説明図である。図5は、サイト登録処理の手順説明図である。図5を参照すると、主制御部18は、注目情報の特徴を表す特徴語句を決定する(S101)。すなわち、ユーザ端末300から登録ユーザが気になる語句が入力されると、主制御部18は、当該語句の意味解析により当該語句の類義語などを図示しない用語辞書から抽出し、例えばその筆頭語句あるいは登録ユーザが指定した語句を特徴語句として決定する。
特徴語句が決定されると、主制御部18は、特徴語句を探索条件として含む探索を実行し、探索条件に適合する対象記事が掲載されているインターネットNW上のWebページを探索する(S102)。Webページが見つからなかった場合は、S101に戻り、特徴語句を再決定して以後の処理を繰り返す(S103:N)。Webページが見つかった場合(S103:Y)、主制御部18は、Webページが存在するメディアサイト(Webサイトと投稿サイトの少なくとも一方)のメディアサイト解析に必要となる情報を取得する(S104)。その後、主制御部18は、メディアサイト解析処理をWeb管理部13とソーシャルメディア管理部14に実行させ(S105)、解析結果をサイトプロフィールDB32、サイト構造DB33、記事DB34、ソーシャルメディアDB35に保存(登録)させる(S106)。
S105のメディア解析処理は、図6の処理手順説明図の流れで実行される。すなわち、主制御部18は、対象記事を掲載しているメディアがWebサイトかどうかを判別する(S201)。Webサイトであった場合(S201:Y)、主制御部18は、処理の主体的な実行をWeb管理部13に委ねる。
Web管理部13は、対象記事の発見日時(年月日時分秒)、Webサイトのサイトプロフィール、対象記事のURL、対象記事の複製物、サイト構造(例えばURL群のリンク構造)を特定し、これらを保存する(S202)。複製物は、ページ単位であってもよく、例えば見出し等のように一部だけであってもよい。複製物はまた、対象記事の部分だけであってもよい。保存先は、サイトプロフィールはサイトプロフィールDB32、サイト構造はサイト構造DB33、対象記事のURL、複製物、発見時は記事DB34である。
サイトプロフィールの一つは対象記事のページビューを包含する月間総ページビューA1であり、他の一つは対象記事を包含する月間記事数A3である。これらのデータは、当該Webサイトの運営者ないしGoogle(登録商標)のような主たるサイト運営サイトで公表されているデータあるいはメディアリサーチセンサー株式会社製の月刊メディアデータに収録されているデータから特定することができる。
サイト構造は、例えば、対象記事のURLを基に当該Webサイトをクローリングしてサイト内リンク元をサイト内でリンク先がなくなるまで辿ることにより特定することができる。つまり、よく行われている膨大なWebサイトのリンクの統計値とパラメータに基づく複雑な演算を行う必要がないので、コスト的に有利となる。
Web管理部13は、また、対象記事が掲載されている複数のWebサイトでそれぞれ独自に分類されたカテゴリー毎の閲覧数を共通表現の所定項目数のカテゴリーに再配分して集計する。そしてカテゴリー毎の相対閲覧率である訪問者の趣向性A2を生成し、これを対象記事と関連付けて保存する(S203)。
例えば、対象記事が、図3に示されたサイトX、サイトY、・・・サイトZに掲載されており、サイトX、サイトY、・・・サイトZでは、それぞれ異なる項目数及び表現でカテゴライズされていたり、対象記事の被リンクがトップページに直接貼り付けられていたりする。本実施形態では、このように他のサイトが異なる表現のカテゴリーに分類されていることに対応して、図3に例示される共通表現の13のカテゴリーを定めておく。図3の例では、社会、政治、経済、国際、芸能・文化、スポーツ、ライフ、科学・IT、医療・健康、地域、速報・新着、ランキング、プレリリースの13の項目が例示されているが、この項目例に限定されない。Web管理部13は、各サイトX,Y,Zで掲載されているカテゴリー毎の閲覧数をそれぞれ共通表現の項目に再配分する。
例えば、図2のサイト構造の場合、第2階層には「芸能」の項目があるが、図3の共通項目は「芸能・文化」であるため、図2のサイト構造に「文化」がなければ、「芸能」の項目に閲覧数を再配分することになる。そして、全体の合算値Σを1.0としたときの相対閲覧割合を図3のように集計し、各々の相対閲覧割合の数値を趣向性A2としてサイト構造DB33へ保存する。趣向性A2は、対象記事を掲載したWebサイトが追加される度に動的に更新される。
Web管理部13は、さらに、対象記事の記事解析及び対象記事の死活監視を行い、解析結果と監視結果を記事DB34へ保存する。記事解析の一つは、例えば図4に示される対象記事のページ内リンク位置Fと当該ページの総リンク数Gを特定する処理である。
ページ内リンク位置Fは、例えばHTMLのアンカー(anchor)リンクなどで設定される、当該ページの先頭アドレスからのアドレス値である。先頭アドレスが0から始まる場合、他のパラメータとの演算に用いる際には、後述する通り、ページリンク位置Fから1を減算することになる。総リンク数Gは、当該Webサイトには、各記事へのリンク一覧が存在するので、そのリンク数を取得するのが簡易であるが、独自に計測してもよい。訪問者が上位階層のページから対象記事へ遷移する確率は、対象記事のリンク位置が上方であればあるほど高くなるため、リンク位置Fと総リンク数は、対象記事への訪問者の遷移確率(遷移しやすさを表す指標)を定量化する上で有用な情報となる。
死活監視は、対象記事を最初に発見(確認)した後の処理であり、チェック時点で当該Webサイトに対象記事が存在し続けているかどうかを監視する処理である。具体的には最初に発見した発見日時を最終確認日時(年月日時分秒)として記事DB34に対象記事と関連付けて保存し、チェックを繰り返す度に最終確認日時を更新する。対象記事を確認できなくなったときは閉鎖日時(年月日時分秒)を最終確認日時とともに保存する。最終確認日時(年月日時分秒)と閉鎖日時(年月日時分秒)との差分値は、当該対象記事の存在期間Eとして利用される。
S201において、メディアサイトがWebサイト以外であった場合(S201:N)、主制御部18は、処理の主体的な実行をソーシャルメディア管理部14に委ねる。ソーシャルメディア管理部14は、ブログやSNS等の投稿サイトのサイトプロフィールと、投稿の中で対象記事と記述の一部又は全部が合致する投稿又は当該投稿に対する評価情報などを取得する(S204)。サイトプロフィールは、例えば当該サイトのサイト名や当該サイトの参加者数であり、評価情報は、あるサイトの例でいえば、対象記事が関わる投稿に対するツィート数、リツィート数、いいね数、フォロワー数である。投稿に対するページビューが公表されている場合は、それらのページビューも評価情報の一つとして取得するとよい。
ソーシャルメディア管理部14は、また、対象記事が関わる投稿を複写し、複写物をその投稿の発見日時(年月日時分秒)と共に対象記事と関連付けて記事DB34へ保存する(S207)。複写物は、投稿全体のものであってもよく、投稿の一部、例えば見出しや対象記事が記載されている部分の前後文脈だけであってもよい。
図5のサイト登録処理が済むと、主制御部18は、ページビュー生成部15にページビュー生成処理を実行させる。図7は、ページビュー生成処理の全体処理手順図である。図7を参照すると、ページビュー生成部15は、登録ユーザが入力した期間の始期と終期とを特定する(S301)。その後、ページビュー生成部15は、BPV生成部151に1記事あたりの自然流入ページビューである基礎ページビュー生成処理を実行させ(S302)、FPV生成部152に流入ページビュー生成処理を実行させる(S303)。ソーシャルメディアでの対象記事に関する投稿が確認された場合、ページビュー生成部15は、ソーシャルメディア管理部14に投稿ページビュー生成処理を実行させ(S304)、実行結果を受け取る。
その後、ページビュー生成部15は、DPV生成部153にドキュメントページ生成処理を実行させ(S305)、これにより生成されたドキュメントページビューを時系列に記事DB34へ保存する(S306)。そして、このドキュメントページビューのユーザ端末300への出力を可能にする(S307)。
図7の基礎ページビュー生成処理S302は、図8の処理手順で実行される。すなわち、BPV生成部151は、当該サイトの月間総ページビューA1、趣向性A2、月間記事数A3を取得し、保存する(S3021)。保存先はRAMのキャッシュ領域であってよい。以後の処理において同様である。
BPV生成部151はまた、最上層ページの月間総ページビューBをA1×k1の演算により求め、第2階層ページの月間総ページビューCをB×k2×趣向性A2の演算により求める。その後、BPV生成部151は、1記事1日あたりページビューDをA1×(B又はC)×k3×A3÷30(日)の演算により求め、保存する(S3022)。B又はCのうち、記事の被リンクが最上層に存在する場合はB、第2階層を経由する場合はCとなる。k1,k2,k3は訪問者が当該ページから他のページに遷移する(その他は離脱する)割合を表す係数値であり、公表されている統計値を用いることができる。
BPV生成部151は、また、対象記事の存在期間Eを算出する(S3023)。存在期間Eは、最終確認日時-発見日時(あるいは後述する期間の始期)の演算により求めることができる。そして、BPV生成部151は、存在期間中における1記事1日あたりの基礎ページビュー(BPV)を以下の式により求め、これを保存する(S3024)。
BPV=Σ(D-D/30i) ただしi=1~E
図7の流入ページビュー生成処理S303は、図9の処理手順で実行される。すなわち、FPV生成部152は、S302の基礎ページビュー生成処理で求め、保存した最上層ページの月間総ページビューBと第2階層ページの月間総ページビューCを読み出す(S3031)。そして、各月間総ページビューB、Cから対象記事のリンク位置へ流入する1秒あたりの総ページビューB’,C’を以下の式より求め、保存する(S3032)。k4は訪問者が当該ページから他のページに遷移する(その他は離脱する)割合を表す係数値、k5は訪問者がある同じ階層のページ内の他の記事に流入する割合を表す係数値であり、それぞれ公表されている統計値を用いることができる。
B’=B×k4×k5×60(秒)×60(分)
÷24(時間)÷30(日)
C’=C×k4×k5×60(秒)×60(分)
÷24(時間)÷30(日)
なお、B’、C’の演算において、基礎ページビュー(BPV)のように1日(第1期間)ではなく1秒(第1期間よりも短い第2期間)毎にしているのは、B,Cがサイト構造に起因するパラメータなので比較的遅く変化するのに対して、訪問者のページの遷移は頻繁に生じるため、そのような訪問者のWeb上の挙動態様を考慮したためである。
FPV生成部152は、対象記事のページ内リンク位置Fと総リンク数Gとを保存元から読み出して(S3033)、以下の式より対象記事の1秒あたりの流入ページビュー(FPV)を求め、保存する(S3034)。B’又はC’のうち、記事の被リンクが最上層に存在する場合はB’、第2階層を経由する場合はC’となる。G-Fは総リンク数Gに対する対象記事のアドレス値、つまりページ内対象記事の掲載位置であり、-1にするのは、上述した通り、アドレス値がコンピュータ内では1からではなく0から始まることから、それに合わせて1を差し引く必要があるためである。FPVは、変更が確認される度に更新される。
FPV=B’又はC’
×(現在時刻-前回チェック日時)
×(G-F-1)
図7の投稿ページビュー生成処理S304は、図10の処理手順で実行される。すなわち、ソーシャルメディア管理部14は、ツィート数、リツィート数、いいね数、ツィートしたユーザのフォロワー数を取得し(S3041)、例えば以下の式より、投稿ページビュー(SPV)を求め、保存する(S3042)。ただし、k6はソーシャルメディアの種別に応じて定められる基礎係数である。k7,k8は派生の程度に応じてその大きさが定められる係数値であり、公表されている統計値を用いることができる。
SPV=k6+ツィート数×k7+リツィート数
+いいね数+当該投稿のフォロワー×k8
図7のドキュメントページビュー生成処理S305は、図11の処理手順で実行される。すなわち、DPV生成部153は、BPV、FPV、SPVを保存元から読み出し(S3051)、以下の式より対象記事のドキュメントページビュー(DPV)を求め、保存する(S3052)。
DPV=BPV+FPV+SPV
以上は、処理の説明の便宜上、特徴語句が1つの場合の例であるが、特徴語句は、複数であってもよい。特徴語句が複数となる場合は、図7~図11の処理を、入力された特徴語句の数だけ繰り返すことになる。また、特徴語句が複数となる場合において、それらが共通の注目情報の特徴を表すものである場合、あるいは、意味解析処理によって互いに同義語又は類義語と判別される場合、それぞれのDPVのセットを1つのDPVに統合するしてもよい。
図12は、出力部16の動作によりユーザ端末300のクライアントブラウザに表示される記事監視結果の画面例を示す図である。画面に表示される項目や内容は、当該クライアントブラウザの設定により、より簡略化したり、詳細にしたり、あるいは階層的にすることができる。また、当該グラフは、システム運用者以外は、登録ユーザが操作するユーザ端末300にのみ表示される。
図12の表示例では、1つのページに、対象記事のドキュメントページビュー(DPV)を時系列にグラフ化するグラフ領域1201と、監視・捕捉の開始日領域1202と、グラフ領域に表示させる、対象記事のドキュメントページビュー(DPV)の期間領域1203が形成されている。グラフ領域1201の縦軸はDPV(自然数)、横軸は期間領域1203を等間隔で区切った日時である。図示の例では、3種類の対象記事のドキュメントページビュー(DPV1,DPV2,DPV3)が時系列で示されている。
この画面には、また、期間領域1203に示された期間で発見された対象記事数領域1204と、発見された対象記事の紹介領域1205,1206とが表示されている。紹介領域1205,1206は、発見された日時が新しいほど上位に形成されるが、この順序は、設定で変更することができる。
各紹介領域1205,1206のうち、記事名は複製物から切り出した語句、例えば見出し文であるが、適宜編集して表示することもできる。記事名の下方のURLには複写物のリンクが貼られており、当該URLをクリックすることで、保存されている複写物を読み出して表示することができる。DPVと表記されている部分は、期間領域1203に表示されている期間中のDPVの総数である。サイト名は、Webサイト名であるが、ソーシャルメディアサイトの場合は、上記期間中の評価情報であるツィート数なども併記される。記事発見日時は、当該記事を最初に確認した日時が表示される。
このように、本実施形態の記事監視システム1によれば、様々なメディアサイトで様々な態様で掲載されている対象記事の掲載状況及び閲覧状況を対象記事のドキュメントページビュー(DPV)という新たな概念の指標で定量化できるようになる。また、その複製物が保存され、適宜読み出して表示することができるので、ユーザが直接当該対象記事の記述内容を目視で確認することができる。また、そのような複製物のうち特に注目したい部分をクリッピングして保存することも本実施形態の記事監視システム1によれば容易になる。
なお、本実施形態では、ドキュメントページビュー(DPV)を投稿ページビュー(SPV)が加算されるものとして説明したが、投稿ページビュー(SPV)は適宜除外することもできる。あるいは、ドキュメントページビュー(DPV)に代えて投稿ページビュー(SPV)だけを表示するようにすることも設定により可能である。
本実施形態では、また、基礎ページビューを生成するための第1期間を1日とし、流入ページビューを生成するための第2期間を1秒とする例を説明したが、第1期間は半日あるいは1時間としてもよい。また、第2期間は第1期間よりも短ければ2秒以上、あるいは1秒以下であってもよい。
本発明は、上述の実施形態の1以上の機能ブロックを実現するコンピュータプログラムを、ネットワーク又は記憶媒体を介してコンピュータ又はコンピュータシステムに供給し、そのコンピュータ又はコンピュータシステムの1つ以上のプロセッサがコンピュータプログラムを読出し実行する処理であっても実施が可能である。また、例えば、ASIC(Application Specific Integrated Circuit)によっても実施が可能である。また、複数のコンピュータによるAPI(Application Programming Interface)連携によっても実施が可能である。

Claims (6)

  1. 注目情報が記述された対象記事を掲載したメディアサイトを探索し、これにより特定されたメディアサイトのサイト構造、記事カテゴリー毎の記事閲覧率、総閲覧数及び総記事数を取得する取得手段と、
    前記総閲覧数と前記サイト構造により特定される前記対象記事への遷移経路と、前記遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、前記総記事数と、に基づいて第1期間における1つの記事の想定閲覧数である第1ページビューを生成する第1手段と、
    前記対象記事のページ内リンク位置を特定し、該ページ内リンク位置と該ページ内リンク位置への遷移経路と、該遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、に基づいて前記第1期間よりも短い第2期間における前記対象記事へ到達する想定閲覧数である第2ページビューを生成する第2手段と、
    前記第1ページビューと前記第2ページビューとを含む前記対象記事の想定閲覧数である第3ページビューを生成する第3手段と、
    を備えてなる記事監視システム。
  2. 前記対象記事に関する記述を含む投稿を掲載したソーシャルメディアを探索し、これにより特定された前記投稿のURLと、当該投稿に対して前記ソーシャルメディアが公表している評価情報とを取得するソーシャルメディア管理手段をさらに備えており、
    前記第3手段は、前記評価情報を定量化した投稿ページプレビューを前記第3ページビューに加算する、
    請求項1に記載の記事監視システム。
  3. 前記対象記事又は前記投稿を取得して複写するとともに、前記対象記事のURL又は前記投稿のURL、当該対象記事又は当該投稿の複写物、及び当該対象記事又は当該投稿が確認された日時とを前記対象記事又は前記投稿の複写物と関連付けて保存するメディア管理手段をさらに備えてなる、
    請求項2に記載の記事監視システム。
  4. 前記第3ページビューを所定期間毎に集計し、集計結果を時系列データとしてグラフ表示可能に出力する出力手段をさらに備える、
    請求項1から3のいずれか一項に記載の記事監視システム。
  5. 注目情報が記述された対象記事を掲載したメディアサイトを探索し、これにより特定されたメディアサイトのサイト構造、記事カテゴリー毎の記事閲覧率、総閲覧数及び総記事数を取得して保存する記事監視システムが実行する方法であって、
    前記記事監視システムが、
    前記総閲覧数と前記サイト構造により特定される前記対象記事への遷移経路と、前記遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、前記総記事数と、に基づいて第1期間における1つの記事の想定閲覧数である第1ページビューを生成する第1処理ステップと、
    前記対象記事のページ内リンク位置を特定し、該ページ内リンク位置と該ページ内リンク位置への遷移経路と、該遷移経路が前記記事カテゴリーのページを経由する場合の前記記事カテゴリー毎の記事閲覧率と、に基づいて前記第1期間よりも短い第2期間における前記対象記事へ到達する想定閲覧数である第2ページビューを生成する第2処理ステップと、
    前記第1ページビューと前記第2ページビューとを含む前記対象記事の想定閲覧数である第3ページビューを生成する第3処理ステップと、
    前記対象記事の複製物を当該対象記事を発見した日時と共に保存する保存処理ステップと、を実行することを特徴とする、注目情報が記述された記事の監視方法。
  6. コンピュータないしコンピュータシステムを、請求項1から4のいずれか一項に記載された記事監視システムとして機能させるコンピュータプログラム。
JP2021201103A 2021-12-10 2021-12-10 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム Active JP7098122B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021201103A JP7098122B1 (ja) 2021-12-10 2021-12-10 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021201103A JP7098122B1 (ja) 2021-12-10 2021-12-10 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP7098122B1 true JP7098122B1 (ja) 2022-07-11
JP2023086526A JP2023086526A (ja) 2023-06-22

Family

ID=82361492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021201103A Active JP7098122B1 (ja) 2021-12-10 2021-12-10 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP7098122B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009503689A (ja) * 2005-07-29 2009-01-29 ヤフー! インコーポレイテッド 広告キャンペーン情報の広告主が定めたグループを表示するためのシステム及び方法
JP2009163452A (ja) * 2007-12-28 2009-07-23 Canon It Solutions Inc 情報処理装置、情報処理方法、およびプログラム
JP2010218475A (ja) * 2009-03-19 2010-09-30 Nifty Corp ブログ分析方法及び装置
JP2016014982A (ja) * 2014-07-01 2016-01-28 株式会社リクルートテクノロジーズ ウェブ評価装置、ウェブ評価方法およびウェブ評価プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009503689A (ja) * 2005-07-29 2009-01-29 ヤフー! インコーポレイテッド 広告キャンペーン情報の広告主が定めたグループを表示するためのシステム及び方法
JP2009163452A (ja) * 2007-12-28 2009-07-23 Canon It Solutions Inc 情報処理装置、情報処理方法、およびプログラム
JP2010218475A (ja) * 2009-03-19 2010-09-30 Nifty Corp ブログ分析方法及び装置
JP2016014982A (ja) * 2014-07-01 2016-01-28 株式会社リクルートテクノロジーズ ウェブ評価装置、ウェブ評価方法およびウェブ評価プログラム

Also Published As

Publication number Publication date
JP2023086526A (ja) 2023-06-22

Similar Documents

Publication Publication Date Title
US9990422B2 (en) Contextual analysis engine
US10180986B2 (en) Extracting structured data from weblogs
US9002894B2 (en) Objective and subjective ranking of comments
US7596571B2 (en) Ecosystem method of aggregation and search and related techniques
Akritidis et al. Identifying the productive and influential bloggers in a community
US20080228574A1 (en) System And Method For Conveying Content Changes Over A Network
US20080147487A1 (en) Methods and apparatus for conversational advertising
Liang et al. Big data, collection of (social media, harvesting)
US20150081431A1 (en) Posterior probability calculating apparatus, posterior probability calculating method, and non-transitory computer-readable recording medium
US20080104034A1 (en) Method For Scoring Changes to a Webpage
JP2006227965A (ja) トレンド予測装置およびトレンド予測方法
JP2016536722A (ja) ニュースフィード内でソーシャル・ネットワーキング・システム・ユーザに提示するためにコンテンツ・アイテムを選択すること
JP2009025871A (ja) アクセス制限装置およびその方法。
US20140149583A1 (en) Social network forensic apparatus and method for analyzing sns data using the apparatus
JP2009265833A (ja) 広告システム及び広告方法
JP2011022705A (ja) 証跡管理方法、システム、及びプログラム
JP5895052B2 (ja) 情報分析システム及び情報分析方法
JP5848199B2 (ja) 影響力予測装置、影響力予測方法、及びプログラム
Ha et al. An analysis on information diffusion through BlogCast in a blogosphere
JP2006338086A (ja) 話題規模管理装置
Bykau et al. Fine-grained controversy detection in Wikipedia
Neumann et al. Justice in misinformation detection systems: An analysis of algorithms, stakeholders, and potential harms
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
JP2012216168A (ja) アクティブユーザ抽出装置、アクティブユーザ抽出方法、およびプログラム
JP7098122B1 (ja) 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220114

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220621

R150 Certificate of patent or registration of utility model

Ref document number: 7098122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150