JP5816296B2 - 世論トピックの処理方法、装置及びシステム - Google Patents

世論トピックの処理方法、装置及びシステム Download PDF

Info

Publication number
JP5816296B2
JP5816296B2 JP2013545028A JP2013545028A JP5816296B2 JP 5816296 B2 JP5816296 B2 JP 5816296B2 JP 2013545028 A JP2013545028 A JP 2013545028A JP 2013545028 A JP2013545028 A JP 2013545028A JP 5816296 B2 JP5816296 B2 JP 5816296B2
Authority
JP
Japan
Prior art keywords
topic
information
feature information
public opinion
public
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013545028A
Other languages
English (en)
Other versions
JP2014511513A (ja
Inventor
ダン ジャーン
ダン ジャーン
ジエンウー ヤーン
ジエンウー ヤーン
ルゥフオン リャーン
ルゥフオン リャーン
シンリー ウー
シンリー ウー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Peking University Founder Research and Development Center
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Peking University Founder Research and Development Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd, Peking University Founder Research and Development Center filed Critical Peking University
Publication of JP2014511513A publication Critical patent/JP2014511513A/ja
Application granted granted Critical
Publication of JP5816296B2 publication Critical patent/JP5816296B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

発明は、通信分野に関し、さらに詳しくは、トピック(以下、「世論トピック」ともいう)の処理方法、装置及びシステムに関する。
インタネット技術の急速な発展に従って、それを加速的に膨張している思想陣地として、世論事件の重要な発生、拡張しているところとなった。新聞ネットサイトは様々なメディアー事件を持続的に転載する。更にネットワークの仮定性、隠蔽性、発散性、潜入性等の特徴をもって、人々は様々なインタラクティブコミュニティを通して世論事件に対する見解を伝える。インターネットワークの情報伝播の速度は非常に速い、ネットワーク世論の急速な成長は「内容脅し」の形で次第に社会公共安全を脅し、世論トピックの伝播、拡張、評論の状況の全貌を把握することが困難であり、世論事件の発展の傾向はコントロールできなくなる恐れがある。
本発明は、世論トピックの特徴情報を取得し検出することによって世論トピックに対して警報することができる世論トピックの処理方法、装置とシステムを提供することを目的とする。
上記した目的を達成するために、本発明は世論トピックの処理方法であって、ネットワークの中で世論情報を含む世論トピックを検索するステップと、前記世論トピックの特徴情報を取得し、前記世論トピックの特徴情報が警報条件に該当するかどうかを検出するステップと、警報条件に該当した場合、前記世論トピック及びその特徴情報を記憶するステップと、を含むことを特徴する。
また、上記した目的を達成するために、本発明は世論トピックの処理装置であって、ネットワークの中で世論情報を含む世論トピックを検索するための検索モジュールと、前記世論トピックの特徴情報を取得するための取得モジュールと、前記世論トピックの特徴情報が警報条件に該当するかどうかを検出するための検出モジュールと、警報条件に該当した場合、前記世論トピック及びその特徴情報を記憶するための記憶モジュールと、を備えることを特徴する。
また、上記した目的を達成するために、本発明は世論トピックの処理システムであって、世論情報を含む世論トピックを提供するネットワーク側サーバーと、ネットワークの中で世論情報を含む世論トピックを検索し、前記世論トピックの特徴情報を取得し、前記世論トピックの特徴情報が警報条件に該当するかどうかを検出し、警報条件に該当した場合は、前記世論トピック及びその特徴情報を記憶するように構成される世論トピック処理装置と、を備えることを特徴とする。
上記したように、本発明が提供する世論トピックの処理方法、装置及びシステムは、ネットワークの中で世論情報を含む世論トピックを検索し、前記世論トピックの特徴情報を取得し、前記世論トピックの特徴情報が警報条件に該当するかどうかを検出し、警報条件に該当した場合、前記世論トピック及びその特徴情報を記憶する。本発明の世論トピックの処理方法、装置及びシステムによれば、世論トピックの特徴情報を取得し検出することにより、世論トピックに対して警報することができる。そして、記憶した世論トピックに対して管理し、持続的に追跡し、その伝播、閲覧、評論等の変化傾向を把握し、世論トピックを全体的に把握できる。そして、世論トピックに対して解析整理し、世論短信を生成することもできる。
図1は本発明の実施例に係る世論トピックの処理方法のプロセスを示す模式図である。 図2は本発明の他の実施例に係る世論トピックの処理方法のプロセスを示す模式図である。 図3は本発明の実施例に係る世論トピックの処理装置の構成を示す模式図である。 図4は本発明の実施例に係る世論トピックの処理システムを示す模式図である。
次に、図面を参照しながら、本発明の主な原理、具体的な実施の形態、効果について詳しく説明する。
図1に示すように、従来技術に存在している問題を解決するために、本発明の実施例は世論トピックの処理方法を提供する。詳しくは、下記の各ステップを備える。
ステップ101:インタネットネットワーク(以下、単に「ネット」または「ネットワーク」をもいう)の中で世論情報を含む世論トピックを検索する。
具体的には、ユーザーは世論情報を入力することにより、当該世論情報を含む世論トピックを検索することができる。また、データベースに記憶されている世論情報を選択して検索することもできる。当該世論情報はデータベースに事前に記憶され、定期的に更新される。当該データベースに事前に記憶している世論トピックの世論情報は、発表者、発表場所、発表時間、タイトル、分類等を含む。ユーザーが世論トピックを検索する場合、当該ユーザーに上記世論情報を自動的に提供してもよい。
ステップ102:世論トピックの特徴情報を取得し、世論トピックの特徴情報が警報条件に該当するかどうかを検出する。
具体的には、指定されたウェブサイトあるいは全てのネットワーク中で世論トピックの伝播状況を取得し、例えば、指定されたウェブサイトの中で、所定のキーワードルール及び/又はサンプルドキュメントに基づき、当該世論トピックに関連するトピック及び類似度を取得し、具体的に実現する場合、ネットワークレプタイル(Network Reptile)技術で採集してもよい。全てのネットワークの中で、世論トピックの全てのネットワークのキーワードに基づき、世論トピックの関連トピック及び類似度を取得し、具体的に実現する場合は、メタ検索技術を使用することができる。当該ステップは主に元の統計データを提供し、即ち指定されたウェブサイトあるいは全てのネットにおいて、当該世論トピックの関連トピック及び類似度がいくらあり、勿論、当該関連トピックは世論トピック自身を含む。全てのネットを検索する場合、主に各タイプのサイトを検索し、例えば、ウェブページの種類、ニュースの種類、電子掲示板の種類及びバグの種類等である。
前記のキーワードルールとサンプルドキュメントとの間の論理関係は「AND」でもいいし、「OR」でもいい。その内、キーワード検索はブール論理演算の複雑な条件を使用し、テンプルファイルは単一テキストセグメントあるいはマルチテキストセグメントを採用することができる。そして、前記マルチサンプルドキュメントの方式を採用する場合は、異なるセグメントを通じて関連情報を発見し、世論トピックの状況を総合的に取得し、同一の事件であるが記述が異なるという問題を効果的に解決できる。
更に当該世論トピックのネットワークの中で敏感情報、転載回数、閲覧回数、評論回数、持続時間長さと関連トピック数等の特徴情報の量及び/又は変化量を取得し、そして所定の警報閾値と比較する。警報閾値より大きい場合、検出結果が警報条件に該当するとなる。もし警報閾値以下あれば、検出結果が警報条件に該当しない。前記の警報閾値は一つか複数であってもよい。具体的に使用する場合は取得した世論トピックの特徴情報と対応させ、例えば世論トピックの閲覧回数、返事回数を取得したら、検出の場合は閲覧回数と返事回数の警報閾値を使用する。その上、検出する時に同時に1つ又は複数の特徴情報の回数の増加量、増加率を使用でき、更に1つ又は複数の特徴情報の数を使用し、また1つ又は複数特徴情報の数の増加量等を使用する。
その中、敏感情報を取得する場合は、世論トピックが含まれているウェブページのテキストデータに対する単語セグメント化処理が必要である。その後、所定の敏感語によって、ウェブページのテキストデータにおける敏感情報を取得する。具体的には、中国語単語セグメント化技術でウェブページのテキストデータに対して単語セグメント化処理し、正順番あるいは逆順番的にウェブページのテキスにおける全ての単語を解析し、その後、所定の敏感語によって、このウェブページにおける全ての敏感語を取得する。当該所定の敏感語はデータベースに記憶し、国家法律の規定した敏感語によって設置し、あるいはユーザーは自分で設置する。
ステップ103:警報条件に該当した場合、世論トピック及びその特徴を記憶する。
具体的には、当該世論トピックの1つ又は複数の特徴情報がいずれも警報条件に該当した場合は、データ発見技術で定期的に解析し追跡するために、当該世論トピックと特徴情報を記憶し、この世論トピックの推進状況を把握できる。例えば世論トピックの転載状況及び閲覧回数、評論回数の変化過程を周期的に解析し、この世論トピックに対して継続追跡することとなる。ユーザは定期的に解析される具体的な時間を、タイマーで設定したり変更したりすることができる。
その後、解析結果を記憶して表示し、それによってユーザーは調べる。解析結果を記憶する場合は、ある期間の世論トピックの関連情報を調べられるように、異なる解析時間によって分別に記憶する。当該関連情報は世論トピックの配布情報、閲覧回数及び評論回数等を含んでよい。記憶した複数世論トピックを管理する場合は、類似度によって分類し、調べる時に、ある種類トピックの下で関連の世論トピックの解析結果を調査し、例えば関連情報、変化傾向、警報するかどうか等。
この他、世論トピックの特徴情報に基づき、世論短信を作成する。例えば、世論トピックの所属ウェブサイト、発行時間、伝播ルート等に対して統計解析し、世論短信を作成して解析結果の中で記憶し、それによってユーザが更に世論伝播ルールを把握し、世論処理と世論導入のためにデータ根拠を提供し、導入の効果を調べることができる。
上記の説明によれば、本発明の実施例により提供される世論トピックの処理方法を使用する場合、世論トピックの特徴情報を検出し取得することにより、世論トピックに対して警報することが分かった。そして、世論トピックに対して管理でき、持続的に追跡させ、世論トピックの伝播、閲覧、評論の変化傾向を解析し、警報必要があるトピックに対して警報する。ネット上の世論情報に対して総合的な解析整理を自動的に行い、世論短信を作成するためにデータ材料を提供する。更に世論事件を全体的に把握することにサポートし、世論処理と導入対策のために重要なサポートを提供し、世論導入の効果を持続的に解析し追跡する。
世論トピックを検索する場合は、同トピックを異なる見方から説明して、トピックの伝播変化傾向を全体的に解析するように、ユーザは需要に応じてトピックを追加してよく、複数のサンプルテキストとキーワードを同時に設置してもよい。メタ検索技術を選択してインタネット情報に対して統計することにより、インタネットワークの中で世論トピックに関する報道状況を把握する。世論トピックはネットワークの中で伝播過程を自動に解析することにより、その関連情報の転載、閲覧、評論等の情報は異なる時間帯における変化ルールを含み、図表の方式でユーザに表示し、したがって、ユーザが更に世論伝播ルールを把握することを支援し、インタネット世論トピックの追跡システムの各機能を効果的に完成された。
以下、具体的な実施例によって、本発明の実施例により提供される世論トピックの処理方法に対して、詳細に説明する。図2に示すように、世論トピックの処理方法は、以下のステップを含む。
ステップ201:ユーザが選択した世論情報を取得する。
具体的には、ユーザは世論情報を入力することができるし、提供された世論情報の中で選択してもよい。当該世論情報は公布者、公布場所、公布時間、タイトル、分類を含むが、これらに限らない。
ステップ202:ネットワークの中で当該世論情報を含む世論トピックを検索する。
具体的には、指定したウェブサイトあるいは全てのネットワークの中で検索することにより、世論トピックの伝播状況を取得し、例えば、指定したウェブサイトの中で、所定のキーワードルールあるいはサンプルドキュメントに基づき、この世論トピックと関連するトピック及び類似度を取得し、具体的に実現する場合はネットワークレプタイル技術で採集する。全てのネットワークの中で、世論トピックの全てのネットキーワードに基づき、この世論トピックの関連するトピック及び類似度を取得し、具体的に実現する時にメタ検索技術を使用することができる。こうすると、指定したウェブサイトあるいは全てのネットにおいて、当該世論トピックの関連トピック及び類似度がいくらあることが分かり、このトピックの伝播ルートを分かり、もちろん、当該関連トピックは世論トピックを含でもよい。全てのネットワークの検索する場合は、各タイプのウェブサイトを主に検索し、例えば、ウェブページの種類、ニュースの種類、電子掲示板の種類及びバグの種類等である。
前記のキーワードルールとサンプルドキュメントとの間の論理関係は「AND」でもいいし、「OR」でもいい。その内、キーワード検索はブール論理演算の複雑な条件を使用し、テンプルファイルは単一テキストセグメントあるいはマルチテキストセグメントを採用することができる。そして、前記マルチサンプルドキュメントの方式を採用する場合は、異なるセグメントを通じて関連情報を発見し、世論トピックの状況を総合的に取得し、同一の事件であるが記述が異なるという問題を効果的に解決できる。
ステップ203:当該世論トピックの特徴情報を取得する。
更に当該世論トピックのネットワークの中で敏感情報、転載回数、閲覧回数、評論回数、持続時間長さと関連トピック数等の特徴情報の量及び/又は量の変化量を取得し、そして所定の警報閾値と比較する。警報閾値より大きい場合、検出結果が警報条件に該当するとなる。もし警報閾値以下であれば、検出結果が警報条件に該当しない。前記の警報閾値は一つか複数であってもよい。具体的に使用する場合は取得した世論トピックの特徴情報と対応させ、例えば世論トピックの閲覧回数、返事回数を取得したら、検出の場合は閲覧回数と返事回数の警報閾値を使用する。その上、検出する時に、同時に1つ又は複数の特徴情報の回数の増加量、増加率を使用でき、更に1つ又は複数の特徴情報の回数を使用し、また1つ又は複数の特徴情報の回数増加量等を使用する。
その中、中国語単語セグメント化技術によってウェブページのテキストデータに対して単語セグメント化処理し、正順番あるいは逆順番的にウェブページのテキストにおける全ての単語を解析し、その後、所定の敏感語によって、このウェブページにおける全ての敏感語を取得する。当該所定の敏感語はデータベースに記憶し、国家法律の規定した敏感語によって設置させ、あるいはユーザーは自分で設置する。
ステップ204:世論トピックの特徴情報が警報条件に該当するかどうかを検出する。
当該世論トピックの1つ又は複数特徴情報が警報条件に該当した場合は、当該世論トピックと特徴情報を記憶し、データ発見技術で定期的に解析し追跡し、それによってこの世論トピックの推進状況を把握できる。例えば世論トピックの転載状況及び閲覧回数、評論回数の変化過程を周期的に解析し、この世論トピックに対して継続追跡させる。ユーザは定期的に解析される具体的な時間を、タイマーで設定したり変更したりすることができる。
ステップ205:警報条件に該当した場合は、当該世論トピックとその特徴情報を記憶する。
ステップ206:当該世論トピックを定期的に解析し、解析結果を記憶する。当該世論トピックの1つ又は複数特徴情報が警報条件に該当した場合は、データ発見技術によって定期的に解析し追跡するために、当該世論トピックと特徴情報を記憶し、この世論トピックの推進状況を把握できる。例えば世論トピックの転載状況及び閲覧回数、評論回数の変化過程を周期的に解析し、この世論トピックに対して継続追跡することとなる。ユーザは定期的に解析される具体的な時間を、タイマーで設定したり変更したりすることができる。
ステップ207:世論トピックの関連特徴情報に基づき、世論短信を作成する。世論トピックの所属ウェブサイト、発行時間、伝播ルート等に対して統計解析し、世論短信を作成して、それによってユーザが世論伝播ルールを更に把握し、世論処理と世論導入のためにデータ根拠を提供し、導入の効果を調べることができる。
ステップ208は、解析結果を調べる。記憶した多くの世論トピックを管理する場合は、類似度によって分類し、調べる時にある種類トピックの下で関連した世論トピックの解析結果を調べられ、例えば関連情報、変化傾向、警報するかどうか等。
上記説明によれば、本発明の実施例により提供される世論トピックの処理方法を使用したら、世論トピックの特徴情報を検出し取得することによって、世論トピックに対して警報する。そして、世論トピックに対して管理し、持続的に追跡し、世論トピックの伝播、閲覧、評論の変化傾向を解析し、警報する必要があるトピックに対して警報する。更にインタネット上の世論情報に対して総合的に解析整理することを自動的に行い、世論短信を作成するためにデータ材料を提供する。更に世論事件を全体的に把握するためにサポートし、世論処理と導入対策のために重要なサポートを提供し、世論導入の効果を持続的に解析し追跡する。
世論トピックを検索する場合は、当該トピックを異なる見方から説明して、トピックの伝播変化傾向を全体的に解析するように、ユーザは需要に応じてトピックを追加してよく、複数のサンプルテキストとキーワードを同時に設置してもよい。メタ検索技術を選択してインタネット情報に対して統計することにより、インタネットワークの中で世論トピックに関する報道状況を把握する。世論トピックはネットワークの中で伝播過程を自動に解析することにより、その関連情報の転載、閲覧、評論等の情報は異なる時間帯における変化ルールを含み、図表の方式でユーザに表示し、したがって、ユーザが更に世論伝播ルールを把握することを支援し、インタネット世論トピックの追跡システムの各機能を効果的に完成された。
それに応じて、本発明の実施例は世論トピックの処理装置を提供し、図3に示すように、この装置は以下のモジュールを備えている。
ネットワークの中で世論情報を含む世論トピックを検索するための検索モジュール301と、
前記世論トピックの特徴情報を取得するための取得モジュール302と、
前記世論トピックの特徴情報が警報条件に該当するかどうかを検出するための検出モジュール303と、
警報条件に該当する時に、前記世論トピック及びその特徴情報を記憶するための記憶モジュール304とを備えている。
好ましくは、当該取得モジュール302は、指定したウェブサイトにおいて、所定のキーワードルール及び/又はサンプルドキュメントに基づき、前記世論トピックの関連トピック及び類似度を取得し、及び/又は、全てのネットにおいて、前記世論トピックの全てのネットキーワードに基づき、前記世論トピックの関連トピック及び類似度を取得する。
好ましくは、当該取得モジュール302は、前記世論トピックを含むウェブサイトテキストデータに対して単語セグメント化処理し、所定の敏感語に基づき、前記ウェブサイトテキストデータの中で敏感な情報を取得する。
好ましくは、当該検出モジュール303は、前記特徴情報の量あるいは変化回数を取得し、所定の警報閾値と比較し、前記警報閾値より大きい場合、検出結果は警報条件に該当し、前記警報閾値以下であれば、検出結果が警報条件に該当しない。
好ましくは、当該装置は、更に、データ発見技術を採用して、前記世論トピック及び特徴情報を定期的に解析し、解析結果を記憶して表示する解析モジュール305を備える。
好ましくは、当該装置は、更に、前記世論トピックの特徴情報に基づき、世論短信を作成する生成モジュール306を備える。
上記の説明によれば、本発明の実施例により提供される世論トピックの処理装置を使用する場合、世論トピックの特徴情報を検出し取得ことにより、世論トピックに対して警報することができる。そして、世論トピックに対して管理でき、持続的に追跡させ、世論トピックの伝播、閲覧、評論の変化傾向を解析し、警報必要があるトピックに対して警報する。ネット上の世論情報に対して総合的な解析整理を自動的に行い、世論短信を作成するためにデータ材料を提供する。更に世論事件を全体的に把握することにサポートし、世論処理と導入対策のために重要なサポートを提供し、世論導入の効果を持続的に解析し追跡する。
世論トピックを検索する場合は、トピックの伝播変化傾向を全体的に解析するように、ユーザは需要に応じてトピックを追加してよく、複数のサンプルテキストとキーワードを同時に設置してもよい。メタ検索技術を選択してインタネット情報に対して統計することにより、インタネットワークの中で世論トピックに関する報道状況を把握する。世論トピックはネットワークの中で伝播過程を自動に解析することにより、その関連情報の転載、閲覧、評論等の情報は異なる時間帯における変化ルールを含み、図表の方式でユーザに表示し、したがって、ユーザが更に世論伝播ルールを把握することを支援し、インタネット世論トピックの追跡システムの各機能を効果的に完成された。
また、本発明の実施例は世論トピックの処理システムを提供し、図4に示すように、このシステムは、ネットワーク側サーバー401と世論トピック処理装置402を含む。
前記ネットワーク側サーバー401は、世論情報を含む世論トピックを提供する。
前記世論トピックの処理装置402は、ネットワークの中で世論情報の世論トピックを検索し、前記世論トピックの特徴情報を取得し、前記世論トピックの特徴情報が警報条件に該当するかどうかを検出する。警報条件に該当した場合、前記世論トピック及びその特徴情報を記憶する。
以上で説明したように、本発明の実施例により提供される世論トピックの処理方法、装置及びシステムは、世論トピックの特徴情報を検出し取得ことにより、世論トピックに対して警報する。そして、世論トピックに対して管理でき、持続的に追跡させ、世論トピックの伝播、閲覧、評論の変化傾向を解析し、警報必要があるトピックに対して警報する。ネット上の世論情報に対して総合的な解析整理を自動的に行い、世論短信を作成するためにデータ材料を提供する。更に世論事件を全体的に把握するためにサポートし、世論処理と導入対策のために重要なサポートを提供し、世論導入の効果を持続的に解析し追跡する。
世論トピックを検索する場合は、同トピックを異なる見方から説明し、トピックの伝播変化傾向を全体的に解析するように、ユーザは需要に応じてトピックを追加してよく、複数のサンプルテキストとキーワードを同時に設置してもよい。メタ検索技術を選択してインタネット情報に対して統計することにより、インタネットワークの中で世論トピックに関する報道状況を把握する。世論トピックはネットワークの中で伝播過程を自動に解析することにより、その関連情報の転載、閲覧、評論等の情報は異なる時間帯における変化ルールを含み、図表の方式でユーザに表示し、したがって、ユーザが更に世論伝播ルールを把握することを支援し、インタネット世論トピックの追跡システムの各機能を効果的に完成された。
本発明の精神及び範囲から逸脱しないかぎり、当業者は本発明に対して様々な変更や変形を行うことができるのが明らかである。これらの変更や変形は本発明の特許請求の範囲及び均等的な範囲に該当すれば、本発明の範囲内に含まれる。

Claims (13)

  1. インタネットネットワークの中で世論情報を含むトピックを検索するステップと、
    前記トピックの特徴情報を取得し、前記トピックの特徴情報が警報条件に該当するかどうかを検出するステップと、
    警報条件に該当した場合、前記トピック及びその特徴情報を記憶するステップと、
    を含み、
    前記トピックの特徴情報を取得するステップは、
    前記インタネットネットワークの指定したウェブサイトで、所定のキーワードルール及び/又はサンプルドキュメントに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得するステップ、及び/又は、
    前記インタネットネットワークにおいて、前記トピックのインタネットネットワーク全体のキーワードに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得するステップを含むことを特徴する世論情報を含むトピックの処理方法。
  2. 前記世論情報には、データベースに選択的に記憶して定期的に更新される世論情報、及び/又は、入力される世論情報が含まれることを特徴とする請求項1に記載の方法。
  3. 前記トピックの特徴情報は、敏感情報と、転載回数と、閲覧回数と、評論回数と、関連トピックとを含むが、これらの情報のみに限らないことを特徴とする請求項1に記載の方法。
  4. 前記トピックが含まれているウェブページのテキストデータに対して単語セグメント化処理を行い、所定の敏感語に基づいて前記ウェブページのテキストデータにおける敏感情報を取得することを特徴とする請求項3に記載の方法。
  5. 前記トピックの特徴情報が警報条件に該当するかどうかを検出するステップは、
    前記特徴情報の量及び/又は変化量を取得し、所定の警報閾値と比較するステップと、
    前記警報閾値より大きい場合、検出結果が警報条件に該当するステップと、
    前記警報閾値以下である場合、検出結果が警報条件に該当しないステップと、
    を含むことを特徴とする請求項3に記載の方法。
  6. 前記トピック及びその特徴情報を記憶するステップの後に、更に、前記トピックの推進状況を把握するために、データ発見技術を用い、前記トピックの転載状況及び閲覧回数、評論階数の変化過程並びにその特徴情報を定期的に解析するステップと、
    解析結果を記憶し表示するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  7. 前記トピック及びその特徴情報を記憶するステップの後に、更に、
    前記トピックの特徴情報に基づき、世論短信を生成するステップを含むことを特徴とする請求項1に記載の方法。
  8. インタネットネットワークの中で世論情報を含むトピックを検索するための検索モジュールと、
    前記トピックの特徴情報を取得するための取得モジュールと、
    前記トピックの特徴情報が警報条件に該当するかどうかを検出するための検出モジュールと、
    警報条件に該当した場合、前記トピック及びその特徴情報を記憶するための記憶モジュールと、を備え、
    前記取得モジュールは、
    前記インタネットネットワークの指定したウェブサイトで、所定のキーワードルール及び/又はサンプルドキュメントに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得し、及び/又は、
    前記インタネットネットワークにおいて、前記トピックのインタネットネットワーク全体のネットキーワードに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得することを特徴する世論情報を含むトピックの処理装置。
  9. 前記取得モジュールは、
    前記トピックが含まれているウェブページのテキストデータに対して単語セグメント化処理を行い、所定の敏感語に基づき、前記ウェブページのテキストデータにおける敏感情報を取得することを特徴とする請求項8に記載の装置。
  10. 検出モジュールは、
    前記特徴情報の量及び/又は変化量を取得し、所定の警報閾値と比較し、前記警報閾値より大きい場合、検出結果が警報条件に該当し、前記警報閾値以下である場合、検出結果が警報条件に該当しないことを特徴とする請求項8に記載の装置。
  11. データ発見技術を用い、前記トピックの推進状況を把握するべく前記トピックの転載状況及び閲覧回数、評論階数の変化過程並びにその特徴情報を定期的に解析し、解析結果を記憶し表示するために構成された解析モジュールを更に備えることを特徴とする請求項8に記載の装置。
  12. 前記トピックの特徴情報に基づき、世論短信を生成するための生成モジュールを更に備えることを特徴とする請求項8に記載の装置。
  13. 世論情報を含むトピックを提供するネットワーク側サーバーと、
    インタネットネットワークの中で世論情報を含むトピックを検索し、前記トピックの特徴情報を取得し、前記トピックの特徴情報が警報条件に該当するかどうかを検出し、警報条件に該当した場合は、前記トピック及びその特徴情報を記憶するように構成されるトピック処理装置と、を備え、
    前記検索したトピックの特徴情報を得る際に、前記トピック処理装置が、前記インタネットネットワークの指定したウェブサイトで、所定のキーワードルール及び/又はサンプルドキュメントに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得し、及び/又は、
    前記インタネットネットワークにおいて、前記トピックのインタネットネットワーク全体のネットキーワードに基づき、前記トピックの関連トピック及び該関連トピックと前記トピックとの類似度を取得することを特徴する世論情報を含むトピックの処理システム。
JP2013545028A 2010-12-21 2011-12-21 世論トピックの処理方法、装置及びシステム Expired - Fee Related JP5816296B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201010614703.5 2010-12-21
CN2010106147035A CN102567393A (zh) 2010-12-21 2010-12-21 一种处理舆情话题的方法、装置和系统
PCT/CN2011/084381 WO2012083856A1 (zh) 2010-12-21 2011-12-21 一种处理舆情话题的方法、装置和系统

Publications (2)

Publication Number Publication Date
JP2014511513A JP2014511513A (ja) 2014-05-15
JP5816296B2 true JP5816296B2 (ja) 2015-11-18

Family

ID=46313176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013545028A Expired - Fee Related JP5816296B2 (ja) 2010-12-21 2011-12-21 世論トピックの処理方法、装置及びシステム

Country Status (5)

Country Link
US (1) US20140052753A1 (ja)
EP (1) EP2657855A4 (ja)
JP (1) JP5816296B2 (ja)
CN (1) CN102567393A (ja)
WO (1) WO2012083856A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968452A (zh) * 2012-10-25 2013-03-13 北京腾逸科技发展有限公司 网络舆情信息统计方法及系统
CN103854063B (zh) * 2012-11-29 2017-04-05 中国科学院计算机网络信息中心 一种基于互联网开放信息的事件发生风险预测并预警方法
CN103092950B (zh) * 2013-01-15 2016-01-06 重庆邮电大学 一种网络舆情地理位置实时监控系统和方法
CN104462096B (zh) * 2013-09-13 2017-11-14 北大方正集团有限公司 舆情监测分析方法和装置
CN104462118A (zh) * 2013-09-21 2015-03-25 郑建锋 控制信息传播风险的方法及系统
CN104657393A (zh) * 2013-11-25 2015-05-27 深圳市至高通信技术发展有限公司 一种舆情分析方法及相应的装置
CN105302844B (zh) * 2014-08-01 2019-07-16 腾讯科技(深圳)有限公司 互联网监测方法、装置及系统
CN105335422B (zh) * 2014-08-06 2019-02-22 阿里巴巴集团控股有限公司 舆情信息的告警方法及装置
CN105468990A (zh) * 2014-09-04 2016-04-06 中国移动通信集团安徽有限公司 一种敏感信息的管理控制方法和装置
CN104268194A (zh) * 2014-09-19 2015-01-07 国家电网公司 一种动态生成舆情简报的方法
CN104346735A (zh) * 2014-10-25 2015-02-11 廖学文 一种app食品安全鉴别系统
CN105653527A (zh) * 2014-11-11 2016-06-08 江苏威盾网络科技有限公司 一种基于网络爬虫技术的舆情处置及信息投放方法
CN104484359B (zh) * 2014-12-02 2018-03-23 北京锐安科技有限公司 一种基于社交图谱的舆情分析方法及装置
CN104834737A (zh) * 2015-05-19 2015-08-12 无锡天脉聚源传媒科技有限公司 一种基于电视报道的舆情处理方法和装置
US10430442B2 (en) 2016-03-09 2019-10-01 Symantec Corporation Systems and methods for automated classification of application network activity
CN107229609B (zh) 2016-03-25 2021-08-13 佳能株式会社 用于分割文本的方法和设备
CN106126558B (zh) * 2016-06-16 2019-09-20 东软集团股份有限公司 一种舆情监控方法及装置
CN107544988B (zh) * 2016-06-27 2021-03-19 百度在线网络技术(北京)有限公司 一种获取舆情数据的方法和装置
CN106302455A (zh) * 2016-08-16 2017-01-04 成都鼎昊科技有限公司 一种网络安全防护方法
US10666675B1 (en) 2016-09-27 2020-05-26 Ca, Inc. Systems and methods for creating automatic computer-generated classifications
CN106503209A (zh) * 2016-10-26 2017-03-15 Tcl集团股份有限公司 一种话题热度预测方法及系统
CN108053230A (zh) * 2017-11-29 2018-05-18 无锡雅座在线科技股份有限公司 舆情管理方法及装置
WO2019132648A1 (en) 2017-12-26 2019-07-04 Mimos Berhad System and method for identifying concern evolution within temporal and geospatial windows
CN108667842A (zh) * 2018-05-12 2018-10-16 苏州华必讯信息科技有限公司 一种处理舆情话题的方法、装置和系统
CN109033072A (zh) * 2018-06-27 2018-12-18 广东省新闻出版广电局 一种基于互联网的视听节目监管系统
CN110750636A (zh) * 2018-07-04 2020-02-04 百度在线网络技术(北京)有限公司 网络舆情信息处理方法及其装置
CN109446394A (zh) * 2018-09-27 2019-03-08 武汉大学 针对网络舆情事件的基于模块化的舆情监测方法及系统
CN108900219B (zh) * 2018-09-30 2023-06-23 郑州航空工业管理学院 一种网络舆情信息预警系统
CN109903176B (zh) * 2019-02-03 2020-04-10 内蒙古工业大学 一种基于流式云平台的实时舆情分析方法
CN110263233B (zh) * 2019-05-06 2023-04-07 平安科技(深圳)有限公司 企业舆情库构建方法、装置、计算机设备及存储介质
CN110389945A (zh) * 2019-06-05 2019-10-29 上海黑桃互动网络科技股份有限公司 一种游戏监控系统及监控方法
CN110705288A (zh) * 2019-09-29 2020-01-17 武汉海昌信息技术有限公司 一种基于大数据的舆情分析系统
CN111611464A (zh) * 2020-05-22 2020-09-01 河南智慧云大数据有限公司 一种基于大数据的舆情监测平台
US20210406484A1 (en) * 2020-06-25 2021-12-30 Seam Social Labs System and Method for a Natural Language Processing Tool
CN114386394A (zh) * 2020-10-16 2022-04-22 电科云(北京)科技有限公司 平台舆论数据主题的预测模型训练方法、预测方法及装置
CN112711651A (zh) * 2020-12-30 2021-04-27 上海金仕达软件科技有限公司 一种舆情监测方法及系统
CN112650947A (zh) * 2020-12-31 2021-04-13 安徽不如信息科技有限公司 一种便于携带的舆情收集处理系统
CN112711691B (zh) * 2021-01-08 2024-04-30 深圳市网联安瑞网络科技有限公司 网络舆情引导效果数据信息处理方法、系统、终端及介质
CN112818234B (zh) * 2021-02-02 2022-09-02 霍尔果斯大颜色信息科技有限公司 一种网络舆情信息分析处理方法及系统
CN112929235B (zh) * 2021-02-06 2022-02-11 珠海市鸿瑞信息技术股份有限公司 一种基于互联网的网络监测系统
CN113076737B (zh) * 2021-03-26 2023-01-31 三亚中科遥感研究所 一种融合公众情感的生态环境感知网络构建方法
CN113220533B (zh) * 2021-05-21 2024-05-31 南京诺迈特网络科技有限公司 一种网络舆情监控方法及系统
CN113282841B (zh) * 2021-07-19 2022-03-22 中国传媒大学 基于建模的公众话题传播评估方法及系统
CN113626717B (zh) * 2021-09-16 2024-07-05 深圳平安智慧医健科技有限公司 一种舆情监测的方法、装置、电子设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060253421A1 (en) * 2005-05-06 2006-11-09 Fang Chen Method and product for searching title metadata based on user preferences
KR20090048997A (ko) * 2007-11-12 2009-05-15 주식회사 비즈모델라인 키워드를 통한 여론 자료 수집 방법 및 시스템과 이를 위한기록매체
CN101408883B (zh) * 2008-11-24 2010-09-01 电子科技大学 一种网络舆情观点收集方法
CN101819573B (zh) * 2009-09-15 2012-07-25 电子科技大学 一种自适应的网络舆情识别方法
CN101661513B (zh) * 2009-10-21 2011-04-06 上海交通大学 网络热点和舆情的检测方法
CN101853261A (zh) * 2009-11-23 2010-10-06 电子科技大学 一种基于社会网络的网络舆情行为分析方法
CN101763401B (zh) * 2009-12-30 2012-05-30 暨南大学 一种网络舆情的热点预测和分析方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法

Also Published As

Publication number Publication date
WO2012083856A1 (zh) 2012-06-28
EP2657855A4 (en) 2014-08-13
JP2014511513A (ja) 2014-05-15
CN102567393A (zh) 2012-07-11
EP2657855A1 (en) 2013-10-30
US20140052753A1 (en) 2014-02-20

Similar Documents

Publication Publication Date Title
JP5816296B2 (ja) 世論トピックの処理方法、装置及びシステム
US10552468B2 (en) Topic predictions based on natural language processing of large corpora
Cheong et al. A microblogging-based approach to terrorism informatics: Exploration and chronicling civilian sentiment and response to terrorism events via Twitter
CA2832909C (en) System and method for matching comment data to text data
US8635281B2 (en) System and method for attentive clustering and analytics
US9256667B2 (en) Method and system for information discovery and text analysis
Tsirakis et al. Large scale opinion mining for social, news and blog data
Hasan et al. TwitterNews+: a framework for real time event detection from the Twitter data stream
US11257115B2 (en) Providing additional digital content or advertising based on analysis of specific interest in the digital content being viewed
Shen et al. Folksonomy as a complex network
JP2011048821A (ja) 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置
US9116979B2 (en) Systems and methods for creating an interest profile for a user
Weiler et al. Event identification and tracking in social media streaming data
Bansal et al. Blogscope: spatio-temporal analysis of the blogosphere
US20150206101A1 (en) System for determining infringement of copyright based on the text reference point and method thereof
US20160189171A1 (en) Analysing topics in social networks
Chen et al. Novelty paper recommendation using citation authority diffusion
Mehmood et al. A study of sentiment and trend analysis techniques for social media content
Pandya et al. Mated: metadata-assisted twitter event detection system
US20150269241A1 (en) Time series clustering
Katsurai Bursty research topic detection from scholarly data using dynamic co-word networks: A preliminary investigation
CN116226494A (zh) 一种用于信息搜索的爬虫系统及方法
Anagnostopoulos et al. Semantic query suggestion using Twitter Entities
Messina et al. Hyper Media News: a fully automated platform for large scale analysis, production and distribution of multimodal news content
Xue et al. Cross-media topic detection associated with hot search queries

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150925

R150 Certificate of patent or registration of utility model

Ref document number: 5816296

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees