JP2013025779A - 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 - Google Patents
情報処理システム、情報処理方法、プログラム及び情報記憶媒体 Download PDFInfo
- Publication number
- JP2013025779A JP2013025779A JP2011163371A JP2011163371A JP2013025779A JP 2013025779 A JP2013025779 A JP 2013025779A JP 2011163371 A JP2011163371 A JP 2011163371A JP 2011163371 A JP2011163371 A JP 2011163371A JP 2013025779 A JP2013025779 A JP 2013025779A
- Authority
- JP
- Japan
- Prior art keywords
- page
- data
- search
- thread
- posting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2393—Updating materialised views
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】ページの特徴の変化の検出を可能にする。
【解決手段】解析部62が、時間経過とともに内容が変化するページの内容を解析してページを特定する。特徴変化判定部64が、異なるタイミングで特定されたページの内容に基づいて、ユーザによるコメントの投稿等が行なわれることにより、特定されたページの特徴が変化したか否かを判定し、ページにおいて盛り上がっている話題の変化などといった、ページの特徴の変化をユーザに提供する。
【選択図】図6
【解決手段】解析部62が、時間経過とともに内容が変化するページの内容を解析してページを特定する。特徴変化判定部64が、異なるタイミングで特定されたページの内容に基づいて、ユーザによるコメントの投稿等が行なわれることにより、特定されたページの特徴が変化したか否かを判定し、ページにおいて盛り上がっている話題の変化などといった、ページの特徴の変化をユーザに提供する。
【選択図】図6
Description
本発明は、情報処理システム、情報処理方法、プログラム及び情報記憶媒体に関する。
ユーザにより投稿されるコメントが順次書き込まれる投稿スレッドのページを提供する電子掲示板システム等の情報処理システムが存在する。このような情報処理システムが提供するページの内容は、ユーザによるコメントの投稿等が行われることによって時間経過とともに時々刻々と変化する。また、時間経過と共に投稿スレッドで盛り上がっている話題が変化することがある。
また、電子掲示板システム等の情報処理システムに対してキーワードに関する条件に合致する投稿スレッドを検索することができる検索サイトも存在する。
しかし、従来技術では、時間経過とともにページの内容が変化しても、ページにおいて盛り上がっている話題の変化などといった、ページの特徴の変化をユーザに提供することができなかった。
本発明は上記課題に鑑みてなされたものであって、その目的の1つは、ページの特徴の変化の検出を可能にすることにある。
上記課題を解決するために、本発明に係る情報処理システムは、時間経過とともに内容が変化するページの内容を特定する特定手段と、異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段と、を含むことを特徴とする。
また、本発明に係る情報処理方法は、時間経過とともに内容が変化するページの内容を繰り返し特定する特定ステップと、異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定ステップと、を含むことを特徴とする。
また、本発明に係るプログラムは、時間経過とともに内容が変化するページの内容を繰り返し特定する特定手段、異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段、としてコンピュータを機能させることを特徴とする。
また、本発明に係る情報記憶媒体は、時間経過とともに内容が変化するページの内容を繰り返し特定する特定手段、異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段、としてコンピュータを機能させることを特徴とするプログラムを記憶したコンピュータ読み取り可能な情報記憶媒体である。
本発明によれば、異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かが判定されるので、ページの特徴の変化の検出が可能となる。
本発明の一態様では、キーワードに関する条件の指定を受け付ける受付手段と、それぞれ時間経過とともに内容が変化する少なくとも1つの検索対象ページを検索対象とした前記条件に合致するページの検索を繰り返し実行する検索手段と、をさらに含み、前記特定手段は、前記検索手段により検索されたページの内容を特定し、前記判定手段は、異なるタイミングで検索されたページの内容に基づいて、検索されたページの特徴が変化したか否かを判定することを特徴とする。
また、本発明の一態様では、検索されたページに含まれる重要語を抽出する重要語抽出手段、をさらに含み、前記検索手段は、前記重要語抽出手段により重要語が抽出された後に、当該重要語を前記条件の一部に追加した上で、ページの検索を実行することを特徴とする。
また、本発明の一態様では、前記検索対象ページは、登録された時間に関連付けられるコメントを複数含み、前記判定手段は、1つの前記検索対象ページに含まれるコメントの特徴が変化したか否かを判定することを特徴とする。
また、本発明の一態様では、前記検索対象ページは、投稿スレッドであり、前記判定手段は、1つの投稿スレッドに含まれるコメントの特徴が変化したか否かを判定することを特徴とする。
また、本発明の一態様では、前記判定手段は、複数のユーザによりコメントが交互に登録された回数の比較に基づいて、ページの特徴が変化したか否かを判定することを特徴とする。
また、本発明に係る別の情報処理システムは、時間経過とともに内容が変化するページを代表する情報が配置されたページを生成するページ生成手段と、前記ページ生成手段により生成されるページを出力するページ出力手段と、を含み、前記ページ生成手段は、前記代表する情報が、ページの特徴が変化したか否かを識別可能に配置されたページを生成することを特徴とする。
以下、本発明の一実施形態について図面に基づき詳細に説明する。
図1は、本発明の一実施形態に係るコンピュータネットワークの全体構成図である。図1に示すように、インターネットなどのコンピュータネットワーク16には、いずれもコンピュータを中心に構成された検索システム10、電子掲示板システム12、クライアント14(14−1〜14−n)が接続されている。そして、検索システム10、電子掲示板システム12、クライアント14は互いに通信可能になっている。
検索システム10は、本実施形態に係る情報処理システムとして機能するサーバであり、電子掲示板システム12に登録されているデータの検索を実行する。
電子掲示板システム12は、例えば、電子掲示板のサービスを提供するウェブサーバである。そして、電子掲示板システム12では、それぞれが互いに異なるURLに対応付けられる複数の投稿スレッドページを提供する。本実施形態では、投稿スレッドページの生成の基礎となるデータは、電子掲示板システム12が備える記憶部に記憶されている。
本実施形態では、1つの投稿スレッドページは、原則として、電子掲示板における1つの話題に対応付けられる。そして、電子掲示板システム12のユーザは、新規の投稿スレッドページの作成や、既に作成されている投稿スレッドページへのコメントの投稿(新規のコメントの書き込み)を行うことができるようになっている。そのため、投稿スレッドページの内容は時間経過とともに変化する。また、本実施形態に係る電子掲示板システム12のユーザは、投稿されたコメントに対する返信を行いたい場合に、返信の対象となるコメントの識別子に関連付けられたコメントを電子掲示板システム12に投稿することができるようになっている。このような投稿を返信投稿と呼ぶこととする。
本実施形態では、検索システム10が電子掲示板システム12に登録された投稿スレッドページを対象とした検索(投稿スレッドページの基礎となるデータの検索)を実行することによって、電子掲示板システム12から、投稿スレッドページに対応付けられるデータを取得する。そして、本実施形態に係る検索システム10は、上述のようにして電子掲示板システム12から取得する上述のデータを、投稿スレッドデータとして管理する。投稿スレッドデータは、投稿スレッドページに対応付けられるデータであり、本実施形態では、例えば、投稿スレッドのIDであるスレッドID、スレッドのタイトルを示すタイトルデータ、対応付けられる投稿スレッドページのURL等が含まれる。また、投稿スレッドデータは、少なくとも1つの個別投稿データを含んでいる。個別投稿データは、ユーザによる投稿され、電子掲示板システム12に登録されたコメントに対応付けられるデータである。個別投稿データには、投稿の対象となる投稿スレッドにおいて昇順に一意に割り当てられる個別投稿ID、投稿を行ったユーザの識別子であるユーザID、投稿によりコメントが登録された日時を示す登録日時データ、投稿の内容を表すコメントデータ、返信の対象となるコメントに関連付けられる個別投稿IDである親個別投稿ID、等が含まれている。なお、本実施形態では、返信投稿ではない投稿についての個別投稿データについては、親個別投稿IDとして設定される値は空となる。
検索システム10、電子掲示板システム12は、それぞれ、例えば、自装置にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである制御部、ROMやRAM等の記憶素子やハードディスクドライブなどである記憶部、ネットワークボードなどの通信インタフェースである通信部、を含んで構成されている。これらの要素は、バスを介して接続される。検索システム10、及び、電子掲示板システム12の記憶部には、自装置の制御部によって実行されるプログラムが記憶される。また、検索システム10、及び、電子掲示板システム12の記憶部は、自装置のワークメモリとしても動作する。
クライアント14は、検索システム10や電子掲示板システム12のユーザが利用するコンピュータであり、例えば、パーソナルコンピュータ、ゲームコンソール、テレビ受像器、携帯型ゲーム装置、携帯情報端末、などである。そして、クライアント14は、例えば、CPU等の制御装置、ROMやRAM等の記憶素子やハードディスクドライブ等の記憶装置、ディスプレイ、スピーカ等の出力装置、ゲームコントローラ、タッチパッド、マウス、キーボード、マイク等の入力装置、ネットワークボード等の通信装置、DVD−ROMやBlu−ray(登録商標)ディスクなどの光ディスク(コンピュータ読み取り可能な情報記憶媒体)を読み取る光ディスクドライブ、等を備えている。
また、本実施形態に係るクライアント14には、ウェブブラウザが予めインストールされている。そして、本実施形態では、クライアント14が、ウェブブラウザを通じて検索システム10にアクセスし、ユーザID及びパスワードを入力してログインしてから、その後に所定のURLにアクセスすると、クライアント14のディスプレイに所定のURLに対応する画面が表示される。なお、ユーザID及びパスワードを入力した後は、検索システム10は、例えば、クッキーを参照することによりクライアント14を利用するユーザのユーザIDを特定することができるようになっている。
図2は、本実施形態に係る検索システム10が提供するメインページ20の一例を示す図である。図3は、本実施形態に係る検索システム10が提供する検索履歴一覧ページ22の一例を示す図である。図4は、本実施形態に係る検索システム10が提供するスナップショットページ24の一例を示す図である。図5は、本実施形態に係る検索システム10が提供するコメント一覧ページ26の一例を示す図である。
メインページ20には、定期検索ボタン30、検索ボタン32、電子掲示板システム12に登録されているデータの検索に用いられたキーワード条件式が配置されるキーワード条件式配置領域34、後述の解析の対象となるコメントデータから抽出される重要語が配置される重要語配置領域36、後述の解析の対象となるコメントデータが示すコメントの特徴量が所定の条件を満足する投稿スレッド(合格スレッド)を代表する情報(本実施形態では、タイトル)が一覧として配置される合格スレッドタイトル配置領域38、他のページへのリンク、ユーザがクリックすることでログアウト処理が実行されるログアウトリンク、等が含まれている。本実施形態では、特徴量に基づいて算出される値(本実施形態では、「尤度」の値と表現する。)が所定値(合格点)以上である投稿スレッド(合格スレッド)のタイトル及び尤度の値が一覧として合格スレッドタイトル配置領域38に配置される。また、本実施形態では、重要語配置領域36に配置される重要語や、合格スレッドタイトル配置領域38に配置されるタイトルは、リンクとして設定される。また、本実施形態では、最新の検索において、それまでに行われた検索と比較して、投稿スレッドデータの特徴が変化したと判定された投稿スレッドデータのタイトルの左側には、特徴が変化した旨を表す印(図2の例では、チェックマーク)が配置される。このように、本実施形態に係るメインページ20には、投稿スレッドデータのタイトルが、投稿スレッドデータの特徴が変化したか否かを識別可能に配置される。
検索履歴一覧ページ22には、今までに行った、電子掲示板システム12に登録されているデータの検索における、検索開始日時及びキーワード条件式の組合せが、検索開始日時が新しいものから所定数(図3の例では3つ)配置されている。また、本実施形態では、検索履歴一覧ページ22に含まれる検索開始日時はリンクとして設定されている。また、検索履歴一覧ページ22には、メインページ20へのリンクも含まれている。
スナップショットページ24は、今までに行った、電子掲示板システム12に登録されているデータの検索に関する情報のうちから、ユーザにより選択された検索に関する情報を提供するページである。そして、スナップショットページ24には、ユーザにより選択された検索についての検索開始日時、その検索に用いられたキーワード条件式が配置されるキーワード条件式配置領域34、後述の解析の対象となるコメントデータから抽出される重要語が配置される重要語配置領域36、後述の解析の対象となるコメントデータが示すコメントの特徴量が所定の条件を満足する投稿スレッド(合格スレッド)を代表する情報(本実施形態では、タイトル)が一覧として配置される合格スレッドタイトル配置領域38が含まれている。また、スナップショットページ24には、メインページ20及び検索履歴一覧ページ22へのリンクも含まれている。また、本実施形態では、ユーザにより選択された検索において、それまでに行われた検索と比較して、投稿スレッドデータの特徴が変化したと判定された投稿スレッドデータのタイトルの左側には、特徴が変化した旨を表す印が配置される。このように、本実施形態に係るスナップショットページ24には、投稿スレッドデータのタイトルが、投稿スレッドデータの特徴が変化したか否かを識別可能に配置される。
本実施形態では、メインページ20の重要語配置領域36には、最新の検索において抽出された重要語が配置される。これは、最新の検索に関する情報を提供するスナップショットページ24の重要語配置領域36に配置される情報と同一である。また、本実施形態では、メインページ20の合格スレッドタイトル配置領域38には、最新の検索における合格スレッドのタイトルが配置される。これは、最新の検索に関する情報を提供するスナップショットページ24の合格スレッドタイトル配置領域38に配置される情報と同一である。
コメント一覧ページ26は、ユーザにより指定された投稿スレッド(本実施形態では、ユーザによりクリックされた合格スレッドのタイトルに対応する投稿スレッド)における所定数のコメントが一覧として配置されたページである。コメント一覧ページ26には、コメントデータから抽出された重要語及びその重要度の出現回数が配置されている。図5の例では、解析の対象となったコメントデータから、重要語「レアアイテム」が35個抽出され、重要語「ドラゴン」が27個抽出され、重要語「剣」が15個抽出されたことが示されている。また、コメント一覧ページ26には、コメントデータが示すコメントが、そのコメントデータに対応付けられている個別投稿ID、そのコメントデータに対応付けられている登録日時データが示す登録日時、そのコメントデータに対応付けられているユーザIDとともに配置されている。また、本実施形態では、投稿スレッドデータの特徴が変化したと判定された投稿スレッドデータに対応するコメント一覧ページ26については、タイトルの左側に、特徴が変化した旨を表す印(図6の例では、チェックマーク)が配置される。
検索システム10は、これらの他、キーワード条件式の設定をユーザが行うためのキーワード条件式設定ページ、ユーザにより指定された重要語が抽出された投稿スレッドデータのタイトルの一覧が配置された重要タイトル一覧ページ、ユーザにより指定された投稿スレッドに対する単位時間あたりの投稿数の経緯を表すグラフが配置された投稿時間分布グラフページ、等もユーザに提供する。
本実施形態では、例えば、ユーザがリンクをクリックすると、クライアント14が、そのリンクにリンク先として設定されているページの出力要求を送信する。そして、検索システム10が、この出力要求を受け付ける。そして、検索システム10は、要求されたページを生成して、クライアント14に送信する。そして、クライアント14は、ディスプレイにそのページを、Webブラウザを介して表示出力する。このようにして、本実施形態では、各種ページがクライアント14のディスプレイに表示されることとなる。そのため、本実施形態では、メインページ20やスナップショットページ24がクライアント14のディスプレイに表示される際に、特徴が変化した投稿スレッドデータのタイトルが識別表示されることとなる。
本実施形態では、ユーザが、検索システム10にログインすると、クライアント14には、メインページ20が表示される。また、ユーザが、メインページ20に含まれる、キーワード条件式設定ページへのリンク(図2では「キーワード設定へ」と表記されている。)をクリックすると、クライアント14に、キーワード条件式設定ページが表示される。そして、ユーザは、キーワード条件式設定ページで、キーワード条件式の指定を行うことができる。本実施形態におけるキーワード条件式は、論理演算子(本実施形態では、AND又はOR)により接続される少なくとも1つの条件から構成される条件式である。そして、各条件は、検索タイプ(本実施形態では、投稿スレッドのタイトルを検索するタイトル検索、又は、登録されたコメントの全文を検索する全文検索)とキーワードとの組合せから構成される。本実施形態では、条件を接続する論理演算子を処理モードと呼ぶこととする。キーワード条件式の設定が終了した後は、メインページ20のキーワード条件式配置領域34に、設定されたキーワード条件式が配置されることとなる。図3には、(1)タイトルに「ゲーム」を含む、(2)コメントに「ステージ」を含む、(3)コメントに「クリア」を含む、のいずれか1つの条件を満足する投稿スレッドを検索するキーワード条件式が設定されたことが示されている。
ユーザが、メインページ20に含まれる、検索履歴一覧ページ22へのリンク(図2では「検索履歴へ」と表記されている。)をクリックすると、クライアント14に、検索履歴一覧ページ22が表示される。また、ユーザが、メインページ20の重要語配置領域36に配置されている重要語をクリックすると、クライアント14には、その重要語が抽出された投稿スレッドデータのタイトルの一覧が含まれる重要タイトル一覧ページが表示される。また、ユーザが、メインページ20の合格スレッドタイトル配置領域38に配置されているタイトルをクリックすると、クライアント14には、そのタイトルに対応する投稿スレッドにおける一覧の投稿のコメントが新しいものから所定数配置されたコメント一覧ページ26が表示される。
また、ユーザが、検索履歴一覧ページ22に含まれる検索開始日時をクリックすると、クライアント14には、その検索開始日時に開始された検索の結果についてのスナップショットページ24が表示される。
また、ユーザが、スナップショットページ24の重要語配置領域36に配置されている重要語をクリックすると、クライアント14には、その重要語が抽出された投稿スレッドデータのタイトルの一覧が含まれる重要タイトル一覧ページが表示される。また、ユーザが、メインページ20の合格スレッドタイトル配置領域38に配置されているタイトルをクリックすると、クライアント14には、そのタイトルに対応する投稿スレッドについてのコメント一覧ページ26が表示される。
また、本実施形態では、コメント一覧ページ26に、投稿時間分布グラフページへのリンク(図5には、「投稿時間分布へ」と表記されている。)が含まれている。そして、ユーザがこのリンクをクリックすると、クライアント14には、そのコメント一覧ページ26に対応付けられる投稿スレッドについての単位時間あたりの投稿数の経緯を表すグラフが配置された投稿時間分布グラフページが表示される。
図6は、本実施形態に係る検索システム10で実現される機能の一例を示す機能ブロック図である。なお、本実施形態に係る検索システム10では、図6に示す機能以外も機能も実現されている。図6に示すように、検索システム10は、機能的には、受付部50、ページ生成部52、ページ出力部54、データ記憶部56、全文検索管理部58、検索管理部60、解析部62、特徴変化判定部64、を含んでいる。データ記憶部56は、検索システム10が備える記憶部を主として実現されている。その他の要素は、検索システム10が備える制御部を主として実現されている。
これらの機能は、コンピュータである検索システム10で、本実施形態に係るプログラムが実行されることにより実現される。このプログラムは、コンピュータ通信ネットワーク経由で通信インタフェースを介して他のコンピュータからダウンロードされてもよいし、光ディスク(例えば、CD−ROMやDVD−ROMなど)、USBメモリ等のコンピュータ読み取り可能な情報記憶媒体に格納され、そこから光ディスクドライブやUSB(Universal Serial Bus)ポートなどを介して検索システム10にインストールされてもよい。
受付部50は、クライアント14から各種要求(例えば、ページの出力要求や、後述の検索の実行要求など)を受け付ける。また、受付部50は、上述のように、キーワード条件式の指定もクライアント14から受け付ける。ページ生成部52は、クライアント14からの要求に応じてページを生成する。ページ出力部54は、ページ生成部52が生成したページをクライアント14に出力する。データ記憶部56は、本実施形態に係る検索システム10が用いる各種データを記憶する。
全文検索管理部58は、本実施形態では、電子掲示板システム12に登録されている、投稿スレッドページに対応するデータの取得(クロール)及び全文検索用インデックスの更新や作成を行い、その全文検索結果をデータ記憶部56に出力する。
検索管理部60は、受付部50が受け付けたキーワード条件式の指定に応じて、指定されたキーワード条件式を示すキーワード条件式データをデータ記憶部56に出力する。ページ生成部52は、メインページ20を生成する際には、データ記憶部56に記憶されたキーワード条件式データが示すキーワード条件式をキーワード条件式配置領域34に配置する。
また、本実施形態に係る検索システム10では、予め、アラートモード又はレピュートモードのいずれか一方の検索モードが設定されており、設定されている検索モードを示すデータがデータ記憶部56に記憶されている。
ユーザが、メインページ20に配置されている定期検索ボタン30をユーザがクリックすると、クライアント14は、定期検索実行要求を検索システム10に送信する。そして、検索システム10の受付部50が、定期検索実行要求を受け付けると、データ記憶部56に記憶されているキーワード条件式データが示すキーワード条件式で表現された条件に合致する投稿スレッドページに対応するデータの定期的な検索の実行を開始する。ここで、検索システム10においてアラートモードが設定されている場合には、検索管理部60は、1時間に1回投稿スレッドデータの検索を行い、検索システム10においてアラートモードが設定されている場合には、検索管理部60は、6時間に1回投稿スレッドデータの検索を行う。
また、メインページ20に配置されている検索ボタン32をユーザがクリックすると、クライアント14は検索実行要求を検索システム10に送信する。そして、検索システム10の受付部50が、検索実行要求を受け付けると、データ記憶部56に記憶されているキーワード条件式データが示すキーワード条件式で表現された条件に合致する投稿スレッドデータの検索の実行を開始する。この場合は、検索は1回だけ行われることとなる。
本実施形態では、検索管理部60は、タイトル検索を実行するにあたっては、電子掲示板システム12に対して、投稿スレッドのタイトルが、キーワード条件式において設定されているタイトル検索についての個別の条件に合致する投稿スレッドページに対応するデータの出力要求を電子掲示板システム12に出力する。そして、電子掲示板システム12は、この出力要求に応じて、条件に合致する投稿スレッドページに対応するデータを検索システム10に出力する。このデータは、検索管理部60により、検索スレッドデータとして管理される。そして、検索管理部60は、この投稿スレッドデータを電子掲示板システム12から取得する。
一方、検索管理部60は、全文検索を実行するにあたっては、全文検索管理部58によりデータ記憶部56に全文検索結果として記憶されているデータのうちから、コメントデータが示すコメントが、キーワード条件式において設定されている全文検索についての個別の条件に合致するデータを取得する。このデータは、検索管理部60により、検索スレッドデータとして管理される。このように、本実施形態では、全文検索管理部58による投稿スレッドデータの取得やインデックスの更新や作成等は、検索管理部60による検索の実行とは非同期に独立して行われる。
そして、検索管理部60は、上述のタイトル検索又は全文検索により、個別の条件について取得した投稿スレッドデータに対して、キーワード条件式に含まれる処理モードが表す論理演算子に基づく論理演算を行うことにより、キーワード条件式が示す条件に合致する投稿スレッドデータを最終的な検索結果として特定する。このようにして、例えば、図3に例示されたキーワード条件式により表される条件を満足する投稿スレッドに対応する投稿スレッドデータが最終的な検索結果として特定される。そして、本実施形態では、検索管理部60が、1回の検索で検索管理部60が最終的な検索結果として特定した少なくとも1つの投稿スレッドデータ、識別子(スナップショットID)、その検索が開始された日時を示す検索開始日時データ、検索に用いられたキーワード条件式を示すキーワード条件式データなどが含まれる、スナップショットデータ70を生成する。そして、検索管理部60は、生成されたスナップショットデータ70をデータ記憶部56に出力する(図7参照)。図7は、スナップショットデータ70の一例を模式的に示した図である。なお、図7に示すスナップショットデータ70には、上述のデータの他に、詳細については後述する、特徴量、尤度の値、合格フラグ、変化フラグ、重要語データ、出現回数データ、が含まれている。
解析部62は、検索管理部60による検索が終了すると、スナップショットデータ70としてデータ記憶部56に記憶された投稿スレッドデータの解析を実行する。なお、本実施形態では、本文解析の対象となる投稿スレッドデータは、アラートモードの場合は、検索開始時点の直前3時間以内の投稿数が所定数(例えば3)以上であるスレッドについての投稿スレッドデータに限定され、レピュートモードの場合は、検索開始時点の直前24時間以内の投稿数が所定数(例えば3)以上であるスレッドについての投稿スレッドデータに限定される。
解析部62は、上述のようにして限定された投稿スレッドデータの内容を特定して、以下の(1)〜(13)のそれぞれの特徴量の算出を行う。このように、本実施形態に係る解析部62は、時間経過とともに内容が変化するページの内容を特定する特定部の役割も担う。そして、解析部62は、算出された特徴量が所定の条件を満足するか否かを確認し、条件を満足する場合には尤度の値を1増加させる。ここで、尤度の初期値は0であることとする。なお、以下の(1)〜(9)はコメントの構造に関する特徴量であり、(10)〜(13)はコメントに含まれる語に関する特徴量である。なお、本実施形態では、解析部62は、アラートモードの場合は、検索開始時点の直前3時間以内に投稿されたコメントを解析対象の投稿として取り扱い、レピュートモードの場合は、検索開始時点の直前24時間以内に投稿されたコメントを解析対象の投稿として取り扱う。
(1)常連密度:複数の人が所定の投稿件数内に登場しており、それぞれの人が複数回登場している程度を表す。例えば、解析部62は、「所定の投稿数A1だけ連続する投稿についての、質問型の投稿(例えば、文末が「?」である投稿)を所定数A2以上含む、所定数A3以上の投稿を行ったユーザ数V_A1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数A1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら繰り返し、それぞれの範囲におけるV_A1を計算する。そして、解析部62は、それぞれの範囲について計算されたV_A1の最大値V_A2を常連密度として特定する。そして、解析部62は、V_A2が所定の閾値th_A2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(2)同時多発度:短期間内に、短い投稿の連鎖が入り乱れた多数発生する程度を表す。例えば、解析部62は、「所定期間B1内に投稿された投稿についての、投稿と、その投稿から所定時間B2内に行われた返信投稿の組合せの数V_B1を計算する。」という処理を、解析対象の投稿の範囲内で、所定期間B1内に投稿された投稿の範囲を所定時間ずつ(例えば、1分ずつ)ずらしながら繰り返し、それぞれの範囲におけるV_B1を計算する。そして、解析部62は、V_B1が所定数B3以上である上述の範囲の数V_B2を同時多発度として特定する。そして、解析部62は、V_B2が所定の閾値th_B2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(3)キャッチボール度:複数のユーザによりコメントが交互に投稿される程度を表す。例えば、解析部62は、「所定の投稿数C1だけ連続する投稿についての、質問型の投稿(例えば、文末が「?」である投稿)を所定数C2以上含む、所定数C3以上の投稿を行ったユーザを特定する。そして、そのユーザの投稿を投稿時刻に古い順に並べ、同一のユーザによる投稿が連続する投稿群を1グループとした際の、グループの個数V_C1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数C1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲におけるV_C1を計算する。そして、解析部62は、計算されたV_C1の最大値V_C2をキャッチボール度として特定する。そして、解析部62は、V_C2が所定の閾値th_C2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(4)同意度:他人の投稿に対して同意する趣旨のコメントが投稿される程度を表す。例えば、解析部62は、「所定の投稿数D1だけ連続する投稿のうち、所定のマジックワード(例えば、「俺も」)を含む投稿数V_D1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数D1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲におけるV_D1を計算する。そして、解析部62は、計算されたV_D1の最大値V_D2を同意度として特定する。そして、解析部62は、V_D2が所定の閾値th_D2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(5)正常度:コメントの内容が意味をなしており、文章構造や論理構造がある程度存在する程度を表す。例えば、解析部62は、「所定の投稿数E1だけ連続する投稿のうち、アスキーアート(同一の記号のE2個以上の連続)や半角のカタカナが含まれないコメントであって、バイト数が所定数E3以上であるコメントの数V_E1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数E1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲におけるV_E1を計算する。そして、解析部62は、計算されたV_E1の最大値V_E2を正常度として特定する。そして、解析部62は、V_E2が所定の閾値th_E2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(6)長文反応連続度:長文のコメントへの返信として、短文での返信投稿が複数連続して行われる程度を表す。例えば、解析部62は、投稿の返信の連続をチェーンと呼ぶこととした際に、解析対象の投稿の範囲内におけるすべてのチェーンについて、最初の投稿がバイト数が所定数F1以上であるコメントであって、それに対するバイト数が所定数F2以下である返信投稿(返信投稿に対する返信投稿も含む)の数V_F1を計算する。そして、解析部62は、計算されたV_F1の最大値V_F2を長文反応連続度として特定する。そして、解析部62は、V_F2が所定の閾値th_F2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(7)感謝度:一定の区間内の投稿において、感謝の趣旨のコメントが含まれる程度を表す。例えば、解析部62は、「所定の投稿数G1だけ連続する投稿のうち、感謝の種別に属する所定のマジックワード(例えば、「ありがとう」。ただし、所定のNGワード(例えば、「本当にありがとうございました。」)は除く。)を含むコメントの数V_G1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数G1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲におけるV_G1を計算する。そして、解析部62は、計算されたV_G1の最大値V_G2を感謝度として特定する。そして、解析部62は、V_G2が所定の閾値th_G2以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(8)短文連続度:短文でのコメントが連続しない程度を表す。例えば、解析部62は、「所定の投稿数H1だけ連続する投稿のうち、バイト数が所定数H2以下のコメントが連続して出現する数V_H1を計算する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数H1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲におけるV_H1を計算する。そして、解析部62は、計算されたV_H1の最大値V_H2を短文連続度として特定する。そして、解析部62は、V_H2が所定の閾値th_H2以下であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(9)瞬間風速:単位時間あたりの投稿数が多い状況が発生する程度を表す。例えば、解析部62は、「所定の投稿数I1だけ連続する投稿のうち、投稿回数が所定数H2以上であるか否かを確認する。」という処理を、解析対象の投稿の範囲内で、所定の投稿数E1だけ連続する投稿の範囲を所定の投稿数ずつ(例えば、1投稿ずつ)ずらしながら、それぞれの範囲について、投稿回数が所定のH2以上であるか否かを確認する。そして、解析部62は、投稿回数が所定のH2以上であることが確認された回数V_I1を瞬間風速として特定する。そして、解析部62は、V_I1が所定の閾値th_V1以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(10)マジックワード出現頻度:所定のマジックワードの出現頻度。例えば、アラートモードである場合のマジックワードとしては、「ダウンロード」、「アップデート」、「始まった」、「仕様」、「対応」などが挙げられ、レピュートモードである場合のマジックワードとしては、「リリース」、「ありがとう」、「同様」などが挙げられる。なお、アラートモードのマジックワードとレピュートモードのマジックワードの少なくとも一部が共通していても構わない。なお、本実施形態では、マジックワードは、予めデータ記憶部56に記憶されている。解析部62は、例えば、投稿スレッドデータのコメントデータに含まれるマジックワードの数mwaをマジックワード出現頻度として特定する。そして、解析部62は、mwaが所定数th_mwa以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(11)マジックワード直近出現頻度:所定のマジックワードの直近での出現頻度。解析部62は、例えば、投稿スレッドデータのコメントデータのうち、直近投稿されたコメント(例えば、検索開始時点の直前1時間以内に投稿されたコメント)を示すコメントデータに含まれるマジックワードの数mwrをマジックワード直近出現頻度として特定する。そして、解析部62は、mwrが所定数th_mwr以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(12)ユーザ指定キーワード出現頻度:キーワード条件式に設定されているキーワードの出現頻度。なお、本実施形態では、一般的であると考えられる所定の語については出現頻度をカウントする対象とはならない。解析部62は、例えば、投稿スレッドデータのコメントデータに含まれるカウントの対象となるキーワードの数kwaをユーザ指定キーワード出現頻度として特定する。そして、解析部62は、kwaが所定数th_kwa以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
(13)ユーザ指定キーワード直近出現頻度:キーワード条件式に設定されているキーワードの直近での出現頻度。解析部62は、例えば、投稿スレッドデータのコメントデータのうち、直近投稿されたコメント(例えば、検索開始時点の直前1時間以内に投稿されたコメント)を示すコメントデータに含まれるマジックワードの数kwrをユーザ指定キーワード直近出現頻度として特定する。そして、解析部62は、kwrが所定数th_kwr以上であれば、解析の対象となる投稿スレッドデータの尤度の値を1増加させる。
以上のようにして、解析部62は、0〜13までのいずれかの整数を、投稿スレッドデータの尤度の値として算出する。そして、解析部62は、算出された尤度の値、及び、解析の基礎となったそれぞれ特徴量(上述の例では、V_A2、V_B2、V_C2、V_D2、V_E2、V_F2、V_G2、V_H2、V_I1、mwa、mwr、kwa、kwr)を、当該検索についてのスナップショットデータ70に含まれる投稿スレッドデータであって、特徴量が抽出された投稿スレッドデータに追加する。なお、このとき、解析部62は、尤度の値が所定値(合格点)以上である投稿スレッド(合格スレッド)については、上述の投稿スレッドデータに含まれる合格フラグの値に「Y」を設定する。なお、本実施形態では、解析部62は、尤度の値が所定値(合格点)未満である投稿スレッド(不合格スレッド)については、上述の投稿スレッドデータに含まれる合格フラグの値に「N」を設定する。
そして、解析部62は、合格スレッドの投稿スレッドデータについては、形態素解析技術及び専門用語抽出技術を用いて、解析対象の投稿の範囲内であるコメントデータに含まれる重要語(例えば、コメントデータに所定数以上含まれている語)の抽出を行う。このように、本実施形態に係る解析部62は、重要語の抽出を行う重要語抽出部の役割も担う。そして、解析部62は、解析対象の投稿の範囲内であるコメントデータから抽出された少なくとも1つの重要語を示す重要語データ、及び、その出現回数を示す出現回数データを、当該検索についてのスナップショットデータ70に含まれる、重要語が抽出された投稿スレッドデータに追加する。
なお、解析部62は、合格スレッドであり、かつ、所定のスレッド選別基準を満たす投稿スレッドデータについて、重要語の抽出を行うようにしてもよい。
ここで、アラートモードでは、例えば、(1)実体験型のコメント(例:XしたらYになった。)が1つ以上含まれること(2)実体験型のコメントの後に発生する同意表現(例:俺も俺も。)のコメントが2つ以上含まれること(ただし、揚げ足取りのコメントや茶化すようなコメントと判定されるものはカウントの対象から除外する。)、の2つの条件をともに満たす投稿スレッドデータについては、重要語の抽出が行われる。
一方、レピュートモードでは、例えば、(1)実体験型のコメント、提言型のコメント(例:Xすべき。Yしてほしい。)、発見型のコメント(例:Xしたら、Yできてしまった。)のいずれかであるコメントが1つ以上含まれること(2)上記のコメントに対する反応(肯定、否定、質問、別案など)のコメントが5件以上含まれている、あるいは、有意義な追加情報が含まれるコメントが1件以上含まれること、の2つの条件をともに満たす投稿スレッドデータについては、重要語の抽出が行われる。
また、検索管理部60は、重要語の抽出が行われた後の定期的な検索において、上述のようにして抽出された重要語のうちの少なくとも1つが条件に含まれるよう、データ記憶部56に記憶されているキーワード条件式データを更新するようにしてもよい。検索管理部60は、例えば、抽出された重要語を、他のキーワードに対してAND条件又はOR条件で接続するようにしてもよい。そして、検索管理部60が、以後の検索については更新されたキーワード条件式に基づいて実行するようにしてもよい。
特徴変化判定部64は、本実施形態では、異なるタイミングでの検索それぞれについてのスナップショットデータ70に含まれる投稿スレッドデータの内容に基づいて、投稿スレッドデータの特徴が変化したか否か(すなわち、投稿スレッドページの特徴が変化したか否か)を判定する。本実施形態では、特徴変化判定部64は、検索後に行われた上述の重要語の抽出の後に、その検索におけるスナップショットデータ70に含まれる各投稿スレッドデータについて上述の判定を行う。
本実施形態では、特徴変化判定部64は、例えば、判定の対象となる投稿スレッドデータ(以下、「今回スレッドデータ」と呼ぶ。)に含まれる重要語データを特定する。そして、特徴変化判定部64は、当該投稿スレッドデータに対応する投稿スレッドが合格スレッドとして前回特定された際のスナップショットデータ70を特定する。そして、特徴変化判定部64は、特定されたスナップショットデータ70における投稿スレッドデータ(以下、「前回スレッドデータ」と呼ぶ。)に含まれる重要語データを特定する。そして、特徴変化判定部64は、前回スレッドデータに含まれる重要語データが示す重要語と、今回スレッドデータに含まれる重要語データが示す重要語と、を比較して、共通する語の数が所定数以下(例えば、2個以下)である場合は、投稿スレッドデータの特徴が変化したと判定する。上述のように、投稿スレッドとしては同じであっても、重要語の抽出の対象となるコメントは、検索開始時点の直前数時間以内に投稿されたコメントに限定されるので、本実施形態に係る検索システム10によれば、1つの投稿スレッドデータに含まれるコメントの特徴が変化したか否かを判定することができることとなる。
そして、特徴変化判定部64は、投稿スレッドデータの特徴が変化したと判定された投稿スレッドデータについては、投稿スレッドデータに含まれる変化フラグの値に「Y」を設定する。なお、本実施形態では、特徴変化判定部64は、投稿スレッドデータの特徴が変化したと判定されなかった投稿スレッドデータについては、投稿スレッドデータに含まれる変化フラグの値に「N」を設定する。
本実施形態では、ページ生成部52は、データ記憶部56に記憶された最新の検索におけるスナップショットデータ70に基づいて、メインページ20を生成する。ページ生成部52は、例えば、最新の検索におけるスナップショットデータ70に含まれる投稿スレッドデータを特定する。そして、ページ生成部52は、いずれかの投稿スレッドデータにおいて重要語データとして示されている重要語を重要語配置領域36に配置する。また、ページ生成部52は、例えば、最新の検索におけるスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている合格フラグの値が「Y」である投稿スレッドデータに含まれるタイトルデータが示すタイトル、及び、当該投稿スレッドデータに含まれる尤度の値を合格スレッドタイトル配置領域38に配置する。このとき、ページ生成部52は、例えば、合格スレッドタイトル配置領域38に、最新の検索におけるスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている変化フラグの値が「Y」である投稿スレッドデータに含まれるタイトルデータが示すタイトルを、特徴が変化したことを識別可能に配置する(例えば、上述の条件を満足するタイトルの左側に、特徴が変化した旨を表す印を配置する)。このように、本実施形態に係るページ生成部52は、投稿スレッドページを代表する情報が、投稿スレッドページの特徴が変化したか否かを識別可能に配置されたメインページ20を生成する。なお、ページ生成部52は、最新の検索におけるスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている合格フラグの値が「N」である投稿スレッドデータについても、その投稿スレッドデータに設定されている変化フラグの値が「Y」である場合は、その投稿スレッドデータに含まれるタイトルデータが示すタイトルを合格スレッドタイトル配置領域38に配置するようにしてもよい。
また、ページ生成部52は、検索開始日時データが示す日時が新しい順で所定数(例えば、3個)以内であるスナップショットデータ70に基づいて、検索履歴一覧ページ22を生成する。ページ生成部52は、検索開始日時データが示す日時が新しいものから所定数(図3の例では3個)の検索結果についてのスナップショットデータ70を特定する。そして、検索開始日時データが示す日時が新しいものが上に配置されるよう、各スナップショットデータ70に含まれる検索開始日時データが示す日時及びキーワード条件式を検索履歴一覧ページ22に配置する。
また、本実施形態では、検索履歴一覧ページ22に含まれる検索開始日時をユーザがクリックすると、クライアント14は、その検索開始日時に開始された検索についてのスナップショットページ24の出力要求を検索システム10に送信する。そして、検索システム10の受付部50は、その出力要求を受け付ける。そして、ページ生成部52は、ユーザにより指定された検索についてのスナップショットデータ70を特定する。そして、ページ生成部52は、そのスナップショットデータ70に含まれる検索開始日時データが示す日時、及び、キーワード条件式データが示すキーワード条件式をスナップショットページ24に配置する。また、ページ生成部52は、例えば、特定されたスナップショットデータ70に含まれる投稿スレッドデータを特定する。そして、ページ生成部52は、いずれかの投稿スレッドデータにおいて重要語データとして示されている重要語を重要語配置領域36に配置する。また、ページ生成部52は、例えば、特定されたスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている合格フラグの値が「Y」である投稿スレッドデータに含まれるタイトルデータが示すタイトルを合格スレッドタイトル配置領域38に配置する。このとき、ページ生成部52は、例えば、合格スレッドタイトル配置領域38に、特定されたスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている変化フラグの値が「Y」である投稿スレッドデータに含まれるタイトルデータが示すタイトルを、特徴が変化したことを識別可能に配置する(例えば、上述の条件を満足するタイトルの左側に、特徴が変化した旨を表す印を配置する)。このように、本実施形態に係るページ生成部52は、投稿スレッドページを代表する情報が、投稿スレッドページの特徴が変化したか否かを識別可能に配置されたスナップショットページ24を生成する。なお、ページ生成部52は、特定されたスナップショットデータ70に含まれる投稿スレッドデータであって、設定されている合格フラグの値が「N」である投稿スレッドデータについても、その投稿スレッドデータに設定されている変化フラグの値が「Y」である場合は、その投稿スレッドデータに含まれるタイトルデータが示すタイトルを合格スレッドタイトル配置領域38に配置するようにしてもよい。
また、本実施形態では、ページ生成部52は、データ記憶部56に記憶されているスナップショットデータ70に基づいて、コメント一覧ページ26を生成する。本実施形態では、メインページ20に含まれる合格スレッドのタイトルがユーザによりクリックされた場合には、ページ生成部52は、最新の検索におけるスナップショットデータ70に含まれる投稿スレッドデータであって、クリックされたタイトルをタイトルデータとして含む投稿スレッドデータを特定する。一方、スナップショットページ24に含まれる合格スレッドのタイトルがユーザによりクリックされた場合には、ページ生成部52は、そのスナップショットページ24の生成の基礎となったスナップショットデータ70に含まれる投稿スレッドデータであって、クリックされたタイトルをタイトルデータとして含む投稿スレッドデータを特定する。
そして、ページ生成部52は、特定された投稿スレッドデータに含まれるタイトルデータが示すタイトル、特定された投稿スレッドデータに含まれる重要語データが示す重要語、特定された投稿スレッドデータに含まれる出現回数データが示す出現回数、投稿時間分布グラフページへのリンクをコメント一覧ページ26に配置する。ここで、ページ生成部52は、その投稿スレッドデータに設定されている変化フラグの値が「Y」である場合は、タイトルの左側に、特徴が変化した旨を表す印を配置する。
そして、ページ生成部52は、特定された投稿スレッドデータに含まれる個別投稿データのうちから、登録日時データが示す日時が新しいものから所定数以内である個別投稿データを特定する。そして、登録日時データが示す日時が古いものが上に配置されるよう、各個別投稿データに含まれる情報(図5の例では、個別投稿ID、登録日時、ユーザID、及び、コメント)をコメント一覧ページ26に配置する。ここで、ページ生成部52は、個別投稿データの親個別投稿IDが含まれている場合には、コメント欄の先頭に引用符号とともに親個別投稿IDを配置する。
また、本実施形態では、クライアント14が定期検索の終了指示を検索システム10に送信すると、検索システム10がこの終了指示を受け付ける。そして、検索システム10は、指示された定期検索を終了させる。
図2に例示するメインページ20では、「cdゲーム裏技スレッド」については、チェックマークがタイトルの左側に配置されている。このようにして、ユーザは、最新の検索における重要語や合格スレッド、及び特徴が変化したと判定された投稿スレッドを一目で確認することができることとなる。
また、図4には、2010年2月22日9時30分27秒に検索が開始された検索についてのスナップショットページ24が示されている。図4の例では、チェックマークがタイトルの左側に配置されている投稿スレッドは存在しない。このことから、「cdゲーム裏技スレッド」が、2010年2月22日9時30分27秒に開始された検索では特徴が変化したと判定されず、最新の検索(例えば、2010年2月22日10時30分27秒に開始された検索)では、特徴が変化したと判定されたということをユーザは知ることができることとなる。
以上のように、本実施形態に係る検索システム10によれば、検索されたページの特徴の変化の検出が可能になり、ユーザは、重要語や、合格スレッド、及び、投稿スレッドの特徴が変化した否かを知ることができることとなる。
なお、本発明は上述の実施形態に限定されるものではない。
例えば、特徴変化判定部64は、今回スレッドデータに含まれるキャッチボール度の値が、前回スレッドデータに含まれるキャッチボール度の値よりも所定値(例えば、2)以上大きく(あるいは、所定値(例えば、2)以上小さく)なった場合は、当該投稿スレッドデータの特徴が変化したと判定するようにしてもよい。
また、特徴変化判定部64は、今回スレッドデータに含まれる重要語データが示す重要語と、前回スレッドデータに含まれる重要語データが示す重要語と、で共通する語が少なくとも1つある場合に、共通する語のうちに、検索結果として今回特定された際における出現回数が、検索結果として前回特定された際における出現回数の2倍以上(あるいは、半分以下)である語が存在すれば、当該投稿スレッドデータの特徴が変化したと判定するようにしてもよい。
また、特徴変化判定部64は、投稿スレッドデータが合格スレッドとして判定されたタイミングに基づいて、投稿スレッドデータの特徴が変化したか否かを判定するようにしてもよい。例えば、特徴変化判定部64は、過去1週間における検索では夜(例えば、休日の夜)に合格スレッドとして判定されていた投稿スレッドデータが、最新の検索においては昼(例えば、平日の昼)に合格スレッドとして判定された場合に、最新の検索において当該投稿スレッドデータの特徴が変化したと判定するようにしてもよい。
また、例えば、解析部62が、合格スレッドの投稿スレッドデータについては、形態素解析技術を用いて、コメントデータが示すコメントに含まれる語句の特徴ベクトルを算出するようにしてもよい。そして、解析部62が、算出された特徴ベクトルを、スナップショットデータ70に含まれる、上述の合格スレッドの投稿スレッドデータに追加するようにしてもよい。そして、特徴変化判定部64が、特徴ベクトルの差が所定の条件を満足するか否かに基づいて、投稿スレッドデータの特徴が変化したか否かを判定するようにしてもよい。
また、特徴変化判定部64は、検索開始日時が互いにことなる3つ以上のスナップショットデータ70に含まれる投稿スレッドデータの特徴量の比較結果に基づいて、投稿スレッドデータの特徴が変化したか否かを判定するようにしてもよい。例えば、特徴変化判定部64は、検索結果として今回特定された際におけるキャッチボール度の値と検索結果として前回の検索におけるキャッチボール度の値の差が、検索結果として前回特定された際におけるキャッチボール度の値と検索結果として前々回の検索におけるキャッチボール度の値の差よりも大きい場合は、今回の検索において投稿スレッドデータの特徴が変化したと判定するようにしてもよい。
また、解析部62は、合格スレッドについてのみ重要語の抽出を行うのではなく、スナップショットデータ70に含まれるすべての投稿スレッドデータから重要語の抽出を行って、抽出された重要語を示す重要語データを投稿スレッドデータに追加するようにしてもよい。また、特徴変化判定部64は、今回スレッドデータに重要語データとして示されている重要語と、今回スレッドデータに対応する投稿スレッドが検索結果として前回特定された際の投稿スレッドデータに重要語データとして示されている重要語と、を比較して、投稿スレッドデータの特徴が変化したか否かを判定するようにしてもよい。
また、特徴変化判定部64は、スナップショットデータ70に含まれる投稿スレッドデータ全体の特徴を比較する(例えば、いずれかの投稿スレッドデータにおいて重要語データとして示されている重要語同士を上述のようにして比較する)ことで、検索されたページの特徴が全体として変化したか否かを判定するようにしてもよい。そして、検索されたページの特徴が全体として変化したと判定された場合は、ページ生成部52は、メインページ20にその旨を表す印を配置するようにしてもよい。
また、ページ生成部52は、ユーザからの要求に応じて、不合格スレッドのタイトル等が含まれるようメインページ20を更新するようにしてもよい。この場合は、ページ生成部52は、例えば、合格スレッド以外の投稿スレッドデータ(不合格スレッドの投稿スレッドデータ)に基づいて、更新後のメインページ20を生成する。また、検索システム10は、ユーザからの要求に応じて、上述の合格点の値を更新するようにしてもよい。そして、検索システム10は、スナップショットデータ70の投稿スレッドデータに含まれる尤度の値が、更新後の合格点の値以上であれば、そのスナップショットデータ70の投稿スレッドデータの合格フラグの値に「Y」を設定し、スナップショットデータ70の投稿スレッドデータに含まれる尤度の値が、更新後の合格点の値未満であれば、そのスナップショットデータ70の投稿スレッドデータの合格フラグの値に「N」を設定するようにしてもよい。
また、例えば、特徴変化判定部64が、投稿スレッドデータの特徴が変化したと判定した際に、その旨を電子メールによりクライアント14に通知するようにしてもよい。
また、検索システム10が、複数の電子掲示板システム12(例えば、それぞれが異なるサービス提供者により提供されている複数の電子掲示板システム12)のそれぞれに登録されている投稿スレッドに対して横断的に検索を行うようにしても構わない。また、本実施形態に係る検索システム10、電子掲示板システム12、及びクライアント14の役割分担は上述のものには限定されない。また、上記の具体的な文字列や図面中の具体的な文字列は例示であり、これらの文字列には限定されない。
10 検索システム、12 電子掲示板システム、14 クライアント、16 コンピュータネットワーク、20 メインページ、22 検索履歴一覧ページ、24 スナップショットページ、26 コメント一覧ページ、30 定期検索ボタン、32 検索ボタン、34 キーワード条件式配置領域、36 重要語配置領域、38 合格スレッドタイトル配置領域、50 受付部、52 ページ生成部、54 ページ出力部、56 データ記憶部、58 全文検索管理部、60 検索管理部、62 解析部、64 特徴変化判定部、70 スナップショットデータ。
Claims (10)
- 時間経過とともに内容が変化するページの内容を特定する特定手段と、
異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段と、
を含むことを特徴とする情報処理システム。 - キーワードに関する条件の指定を受け付ける受付手段と、
それぞれ時間経過とともに内容が変化する少なくとも1つの検索対象ページを検索対象とした前記条件に合致するページの検索を繰り返し実行する検索手段と、をさらに含み、
前記特定手段は、前記検索手段により検索されたページの内容を特定し、
前記判定手段は、異なるタイミングで検索されたページの内容に基づいて、検索されたページの特徴が変化したか否かを判定する、
ことを特徴とする請求項1に記載の情報処理システム。 - 検索されたページに含まれる重要語を抽出する重要語抽出手段、をさらに含み、
前記検索手段は、前記重要語抽出手段により重要語が抽出された後に、当該重要語を前記条件の一部に追加した上で、ページの検索を実行する、
ことを特徴とする請求項2に記載の情報処理システム。 - 前記検索対象ページは、登録された時間に関連付けられるコメントを複数含み、
前記判定手段は、1つの前記検索対象ページに含まれるコメントの特徴が変化したか否かを判定する、
ことを特徴とする請求項2又は3に記載の情報処理システム。 - 前記検索対象ページは、投稿スレッドであり、
前記判定手段は、1つの投稿スレッドに含まれるコメントの特徴が変化したか否かを判定する、
ことを特徴とする請求項4に記載の情報処理システム。 - 前記判定手段は、複数のユーザによりコメントが交互に登録された回数の比較に基づいて、ページの特徴が変化したか否かを判定する、
ことを特徴とする請求項4又は5に記載の情報処理システム。 - 時間経過とともに内容が変化するページを代表する情報が配置されたページを生成するページ生成手段と、
前記ページ生成手段により生成されるページを出力するページ出力手段と、を含み、
前記ページ生成手段は、前記代表する情報が、ページの特徴が変化したか否かを識別可能に配置されたページを生成する、
ことを特徴とする情報処理システム。 - 時間経過とともに内容が変化するページの内容を繰り返し特定する特定ステップと、
異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定ステップと、
を含むことを特徴とする情報処理方法。 - 時間経過とともに内容が変化するページの内容を繰り返し特定する特定手段、
異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段、
としてコンピュータを機能させることを特徴とするプログラム。 - 時間経過とともに内容が変化するページの内容を繰り返し特定する特定手段、
異なるタイミングで特定されたページの内容に基づいて、特定されたページの特徴が変化したか否かを判定する判定手段、
としてコンピュータを機能させることを特徴とするプログラムを記憶したコンピュータ読み取り可能な情報記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011163371A JP2013025779A (ja) | 2011-07-26 | 2011-07-26 | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 |
US13/554,135 US20130031118A1 (en) | 2011-07-26 | 2012-07-20 | Information processing system, information processing method, program, and non-transitory information storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011163371A JP2013025779A (ja) | 2011-07-26 | 2011-07-26 | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013025779A true JP2013025779A (ja) | 2013-02-04 |
Family
ID=47598143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011163371A Withdrawn JP2013025779A (ja) | 2011-07-26 | 2011-07-26 | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20130031118A1 (ja) |
JP (1) | JP2013025779A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015102959A (ja) * | 2013-11-22 | 2015-06-04 | 株式会社ユニバーサルエンターテインメント | 情報更新装置、情報更新方法、プログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160063070A1 (en) * | 2014-08-26 | 2016-03-03 | Schlumberger Technology Corporation | Project time comparison via search indexes |
US9420094B1 (en) * | 2015-10-01 | 2016-08-16 | Securus Technologies, Inc. | Inbound calls to intelligent controlled-environment facility resident media and/or communications devices |
WO2017070092A1 (en) | 2015-10-19 | 2017-04-27 | University Of Massachusetts | Anti-cancer and anti-inflammatory therapeutics and methods thereof |
US10990253B1 (en) * | 2020-05-26 | 2021-04-27 | Bank Of America Corporation | Predictive navigation and fields platform to reduce processor and network resources usage |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6983320B1 (en) * | 2000-05-23 | 2006-01-03 | Cyveillance, Inc. | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages |
US7917483B2 (en) * | 2003-04-24 | 2011-03-29 | Affini, Inc. | Search engine and method with improved relevancy, scope, and timeliness |
US20080005659A1 (en) * | 2004-11-12 | 2008-01-03 | Yusuke Fujimaki | Data Processing Device, Document Processing Device, and Document Processing Method |
US8161083B1 (en) * | 2007-09-28 | 2012-04-17 | Emc Corporation | Creating user communities with active element manager |
US7860898B1 (en) * | 2007-12-19 | 2010-12-28 | Emc Corporation | Techniques for notification in a data storage system |
US9002820B2 (en) * | 2008-06-05 | 2015-04-07 | Gary Stephen Shuster | Forum search with time-dependent activity weighting |
US20100205168A1 (en) * | 2009-02-10 | 2010-08-12 | Microsoft Corporation | Thread-Based Incremental Web Forum Crawling |
US8335989B2 (en) * | 2009-10-26 | 2012-12-18 | Nokia Corporation | Method and apparatus for presenting polymorphic notes in a graphical user interface |
WO2012012453A2 (en) * | 2010-07-19 | 2012-01-26 | Echidna, Inc. | Use of social ranks to find providers of relevant user-generated content |
US8676937B2 (en) * | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
US20140095484A1 (en) * | 2012-10-02 | 2014-04-03 | Toyota Motor Sales, U.S.A., Inc. | Tagging social media postings that reference a subject based on their content |
-
2011
- 2011-07-26 JP JP2011163371A patent/JP2013025779A/ja not_active Withdrawn
-
2012
- 2012-07-20 US US13/554,135 patent/US20130031118A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015102959A (ja) * | 2013-11-22 | 2015-06-04 | 株式会社ユニバーサルエンターテインメント | 情報更新装置、情報更新方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130031118A1 (en) | 2013-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390144B2 (en) | Objective and subjective ranking of comments | |
Abel et al. | Leveraging the semantics of tweets for adaptive faceted search on twitter | |
US9639622B2 (en) | Image processing system, image processing method, program, and non-transitory information storage medium | |
US9934315B2 (en) | Method and system for web searching | |
JP5092252B2 (ja) | トレンド解析サーバおよびトレンド解析方法 | |
US8244773B2 (en) | Keyword output apparatus and method | |
US20160357872A1 (en) | Event networks and event view construction and display | |
WO2009055712A1 (en) | Apparatuses, methods and systems for a forum ferreting system | |
JP2011134334A (ja) | ショートテキスト通信のトピックを識別するためのシステムおよび方法 | |
US8825620B1 (en) | Behavioral word segmentation for use in processing search queries | |
JP2013061756A (ja) | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 | |
US9407589B2 (en) | System and method for following topics in an electronic textual conversation | |
JP6776310B2 (ja) | ユーザ−入力コンテンツと連関するリアルタイムフィードバック情報提供方法およびシステム | |
JP2013025779A (ja) | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 | |
CN113934941A (zh) | 一种基于多维度信息的用户推荐系统及方法 | |
JP5068728B2 (ja) | 関連ブログ提示装置、方法及びプログラム | |
JP5048852B2 (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
Xue et al. | Phishing sites detection based on Url Correlation | |
JP2013058076A (ja) | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
CN103123641A (zh) | 一种社交搜索的方法和装置 | |
KR20130091391A (ko) | 콘텐츠 추천 서버 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체 | |
JP5368900B2 (ja) | 情報提示装置、情報提示方法およびプログラム | |
JP2009271798A (ja) | 業界マップ生成システム | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141007 |