JP5218401B2 - 情報分析システム、情報分析方法及び情報分析用プログラム - Google Patents

情報分析システム、情報分析方法及び情報分析用プログラム Download PDF

Info

Publication number
JP5218401B2
JP5218401B2 JP2009512986A JP2009512986A JP5218401B2 JP 5218401 B2 JP5218401 B2 JP 5218401B2 JP 2009512986 A JP2009512986 A JP 2009512986A JP 2009512986 A JP2009512986 A JP 2009512986A JP 5218401 B2 JP5218401 B2 JP 5218401B2
Authority
JP
Japan
Prior art keywords
time
series data
time series
effective period
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009512986A
Other languages
English (en)
Other versions
JPWO2008136421A1 (ja
Inventor
享 赤峯
聡 中澤
開 石川
俊夫 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009512986A priority Critical patent/JP5218401B2/ja
Publication of JPWO2008136421A1 publication Critical patent/JPWO2008136421A1/ja
Application granted granted Critical
Publication of JP5218401B2 publication Critical patent/JP5218401B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Description

[関連出願の記載]
本発明は、日本国特許出願:特願2007−119039号(2007年4月27日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、情報分析システム、情報分析方法及び情報分析用プログラムに関し、特に、時系列に発信された肯定意見及び否定意見に基づいて、情報の信頼性を分析する情報分析システム、情報分析方法及び情報分析用プログラムに関する。
近年、インターネット上のWebページや電子掲示板等を介して、大量の玉石混交の情報が流れる状態が生じている。そのため、一般ユーザが、インターネット上のどの情報を信頼することができ、どの情報を信頼することができないかを判別することが困難になってきている。
例えば、インターネットを介して「納豆はダイエットに効果がある」や、「緑茶は癌の予防になる」、「冥王星は惑星である」、「タミフルは副作用がある」等の命題に対する発信情報を得ることができる。また、そのような命題に対する発信情報に関して、インターネット上のWebページや電子掲示板に、多くの肯定意見や否定意見が記述されており、一部の意見を参照するだけでは、それらの命題に対する発信情報が正しいか否か等、発信情報の信頼性を判定することが難しい。
上記の問題を解決するために、評判情報(命題に対する発信情報が正しいか否かを示す情報)等の意見情報をWeb上から収集して、肯定意見及び否定意見に分類し、肯定又は否定別の件数や情報発信者の属性等に基づいて、発信情報の信頼性を評価するシステムが提案されている。
例えば、従来の情報分析システムの一例が特許文献1に記載されている。特許文献1に記載された情報分析システムでは、インターネット上のWebページや掲示板等から個人の意見を抽出する。そして、被参照度ランキングや意見の根拠、発言者の身元を表わす情報に基づいて、抽出した意見の信頼度を決定している。
また、従来の情報分析システムの他の例が非特許文献1に記載されている。非特許文献1に記載された情報分析システムでは、評価者のブログ(blog)中のキーワードの出現頻度等に基づいて、情報発信者の熟知度(専門度)を推定する。そして、情報発信者の熟知度と肯定又は否定の度合いとを用いて、情報の信頼度を計算している。
国際公開第WO2003/046764号パンフレット 中島伸介他、「blog解析に基づくWeb情報検索の信頼性向上技術」、人工知能学会、第6回セマンティックウェブとオントロジー研究会、SIG-SWO-A401-05、2004年7月
以上の特許文献1及び非特許文献1の開示事項は、本書に引用をもって繰り込み記載されているものとする。以下に本発明による関連技術の分析を与える。
しかし、特許文献1や非特許文献1に記載された従来の情報分析システムでは、情報の信頼性を判定する際に、情報に対して時系列的な評価の変動があることを考慮することなく、発信者属性により重み付けされた肯定意見と否定意見との数の総和に基づいて信頼度を判定しているにすぎない。そのため、特許文献1や非特許文献1に記載された従来の情報分析システムでは、ある期間で肯定意見と否定意見との数に大きな変動があった場合であっても、信頼度の評価を変えることができない。
例えば、「冥王星は惑星である」という意見に対して、2006年より前の肯定意見の数が200件であり、否定意見の数が10件であったとする。また、2006年以降の肯定意見の数が10件であり、否定意見の数が100件であったとする。この場合、時系列の変動を全く考慮しない場合、「冥王星は惑星である」という意見に対するトータルの肯定意見は210件となり、否定意見は110件となる。そのため、従来の情報分析システムでは、肯定意見が多いと判定され、「冥王星は惑星である」という意見は、信頼性がある程度高いと判定されてしまう。
なお、上記に示す例では、肯定意見の数及び否定意見の数のみを用いて信頼性を判定する場合を示したが、発信者属性により重み付けを行って信頼性を判定するようにしても、同様の結果が得られる。
そこで、本発明は、時系列的な評価の変動を考慮して情報の信頼性を高めることができる情報分析システム、情報分析方法及び情報分析用プログラムを提供することを目的とする。
本発明による情報分析システムは、ある命題に対する肯定度と前記肯定度に対応するタイプスタンプとを少なくとも含む組の時系列データから、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて、前記時系列データに関する時系列パタンを特定する時系列パタン特定手段(例えば、時系列データパタン照合手段11によって実現される)と、前記特定された時系列パタンに基づいて前記時系列データ内の前記命題に対する有効期間を特定する有効期間特定手段(例えば、有効期間判定手段13によって実現される)と、を含む有効期間抽出手段(例えば、有効期間抽出手段100によって実現される)を備えたことを特徴とする。
また、本発明による情報分析システムにおいて、前記時系列パタン特定手段は、前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析システムにおいて、前記時系列パタン特定手段は、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析システムにおいて、前記時系列パタン特定手段は、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析システムにおいて、前記有効期間特定手段が特定する前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算する有効期間信頼度算出手段を、さらに備えた構成としてもよい。
また、情報分析システムにおいて、有効期間抽出手段は、前記肯定度の時間変化に関する時系列パタンを複数含む時系列パタンテーブル(例えば、時系列パタン対応表)を記憶する時系列パタンテーブル記憶手段(例えば、時系列パタン記憶手段12によって実現される)を含み、時系列パタン特定手段は、時系列パタンテーブル記憶手段が記憶する時系列パタンテーブルに基づいて、時系列データに対する時系列パタンを特定するものであってもよい。
また、情報分析システムにおいて、有効期間抽出手段は、時系列パタンと有効期間とを対応付けた有効期間対応テーブル(例えば、時系列パタン・有効期間対応表)を記憶する有効期間対応テーブル記憶手段(例えば、時系列パタン・有効期間対応表記憶手段14によって実現される)を含み、有効期間特定手段は、時系列パタン特定手段が特定した時系列パタンに対応する有効期間を、有効期間対応テーブル記憶手段が記憶する有効期間対応テーブルから抽出するものであってもよい。
また、情報分析システムにおいて、有効期間特定手段は、時系列データ中の有効期間内のデータである有効期間時系列データを抽出するものであってもよい。
また、情報分析システムは、有効期間特定手段が抽出した有効期間時系列データに対する信頼度である有効期間信頼度を求める有効期間信頼度算出手段(例えば、信頼度計算手段15によって実現される)を備えたものであってもよい。
また、情報分析システムにおいて、有効期間抽出手段は、時系列パタン特定手段が特定した時系列パタンに基づいて、時系列データの変化の型を示す変化タイプを特定する変化タイプ特定手段(例えば、変化タイプ判定手段16によって実現される)を含むものであってもよい。
また、情報分析システムにおいて、有効期間抽出手段は、時系列パタンと変化タイプとを対応付けた変化タイプ対応テーブル(例えば、時系列パタン・変化タイプ対応表)を記憶する変化タイプ対応テーブル記憶手段(例えば、時系列パタン・変化タイプ対応表記憶手段17によって実現される)を含み、変化タイプ特定手段は、時系列パタン特定手段が特定した時系列パタンに対応する変化タイプを、変化タイプ対応テーブル記憶手段が記憶する変化タイプ対応テーブルから抽出するものであってもよい。
また、情報分析システムは、有効期間特定手段が抽出した有効期間時系列データ及び変化タイプ特定手段が特定した変化タイプに基づいて、変化タイプを考慮した有効期間時系列データに対する信頼度である有効期間変化タイプ信頼度を求める有効期間変化タイプ信頼度算出手段(例えば、信頼度計算手段15Aによって実現される)を備えたものであってもよい。
また、情報分析システムは、変化タイプと重み係数とを対応付けた重み係数対応テーブル(例えば、変化タイプ・信頼度重み対応表)を記憶する重み係数対応テーブル記憶手段(例えば、変化タイプ・信頼度重み対応表記憶手段18によって実現される)を備え、有効期間変化タイプ信頼度算出手段は、変化タイプ特定手段が特定した変化タイプに対応する重み係数を、重み係数対応テーブル記憶手段が記憶する重み係数対応テーブルから抽出し、抽出した重み係数を用いて、有効期間変化タイプ信頼度を求めるものであってもよい。
本発明による情報分析方法は、ある命題に対する肯定度と前記肯定度に対応するタイプスタンプとを少なくとも含む組の時系列データから、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて、前記時系列データに関する時系列パタンを特定する時系列パタン特定ステップと、前記特定された時系列パタンに基づいて前記時系列データ内の前記命題に対する有効期間を特定する有効期間特定ステップとを含むことを特徴とする。
また、本発明による情報分析方法は、前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析方法において、前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析方法において、前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定するようにしてもよい。
本発明による情報分析方法において、前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算するようにしてもよい。
また、情報分析方法は、時系列パタン特定ステップで、記憶装置に記憶される、前記肯定度の時間変化に関する時系列パタンを複数含む時系列パタンテーブルに基づいて、時系列データに対する時系列パタンを特定するものであってもよい。
また、情報分析方法は、有効期間特定ステップで、特定した時系列パタンに対応する有効期間を、記憶装置に記憶される時系列パタンと有効期間とを対応付けた有効期間対応テーブルから抽出するものであってもよい。
また、情報分析方法は、有効期間特定ステップで、時系列データ中の有効期間内のデータである有効期間時系列データを抽出するものであってもよい。
また、情報分析方法は、抽出した有効期間時系列データに対する信頼度である有効期間信頼度を求める有効期間信頼度算出ステップを含むものであってもよい。
また、情報分析方法は、特定した時系列パタンに基づいて、時系列データの変化の型を示す変化タイプを特定する変化タイプ特定ステップを含むものであってもよい。
また、情報分析方法は、変化タイプ特定ステップで、特定した時系列パタンに対応する変化タイプを、記憶装置に記憶される時系列パタンと変化タイプとを対応付けた変化タイプ対応テーブルから抽出するものであってもよい。
また、情報分析方法は、抽出した有効期間時系列データ及び特定した変化タイプに基づいて、変化タイプを考慮した有効期間時系列データに対する信頼度である有効期間変化タイプ信頼度を求める有効期間変化タイプ信頼度算出ステップを含むものであってもよい。
また、情報分析方法は、有効期間変化タイプ信頼度算出ステップで、特定した変化タイプに対応する重み係数を、記憶装置に記憶される変化タイプと重み係数とを対応付けた重み係数対応テーブルから抽出し、抽出した重み係数を用いて、有効期間変化タイプ信頼度を求めるものであってもよい。
本発明による情報分析用プログラムは、コンピュータに、ある命題に対する肯定度と前記肯定度に対応するタイプスタンプとを少なくとも含む組の時系列データから、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて、前記時系列データに関する時系列パタンを特定する時系列パタン特定処理と、前記特定された時系列パタンに基づいて前記時系列データ内の前記命題に対する有効期間を特定する有効期間特定処理とを実行させるためのものである。
また、本発明による情報分析用プログラムは、コンピュータに、前記時系列パタン特定処理において、前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させるようにしてもよい。
本発明による情報分析用プログラムにおいては、コンピュータに、前記時系列パタン特定処理において、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させるようにしてもよい。
本発明による情報分析用プログラムにおいては、コンピュータに、前記時系列パタン特定処理において、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させるようにしてもよい。
本発明による情報分析用プログラムにおいては、コンピュータに、前記有効期間特定処理が特定する前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算する有効期間信頼度算出処理を実行させるようにしてもよい。
また、情報分析用プログラムは、コンピュータに、時系列パタン特定処理で、記憶装置に記憶される、肯定度の時間変化に関する時系列パタンを複数含む時系列パタンテーブルに基づいて、時系列データに対する時系列パタンを特定する処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、有効期間特定処理で、特定した時系列パタンに対応する有効期間を、記憶装置に記憶される時系列パタンと有効期間とを対応付けた有効期間対応テーブルから抽出する処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、有効期間特定処理で、時系列データ中の有効期間内のデータである有効期間時系列データを抽出する処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、抽出した有効期間時系列データに対する信頼度である有効期間信頼度を求める有効期間信頼度算出処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、特定した時系列パタンに基づいて、時系列データの変化の型を示す変化タイプを特定する変化タイプ特定処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、変化タイプ特定処理で、特定した時系列パタンに対応する変化タイプを、記憶装置に記憶される時系列パタンと変化タイプとを対応付けた変化タイプ対応テーブルから抽出する処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、抽出した有効期間時系列データ及び特定した変化タイプに基づいて、変化タイプを考慮した有効期間時系列データに対する信頼度である有効期間変化タイプ信頼度を求める有効期間変化タイプ信頼度算出処理を実行させるものであってもよい。
また、情報分析用プログラムは、コンピュータに、有効期間変化タイプ信頼度算出処理で、特定した変化タイプに対応する重み係数を、記憶装置に記憶される変化タイプと重み係数とを対応付けた重み係数対応テーブルから抽出する処理と、抽出した重み係数を用いて、有効期間変化タイプ信頼度を求める処理とを実行させるものであってもよい。
本発明によれば、時系列データの時系列パタンを特定し、特定された時系列パタンに基づいて時系列データ内の有効期間を特定する。そのため、時系列データ中の信頼性の高いデータが含まれている期間を把握することができ、時系列データ中の信頼性の高いデータを得ることができる。従って、時系列的な評価の変動を考慮して、情報の信頼性を高めることができる。また、ユーザに対して情報の信頼性を分析するための情報として有効期間を提示することができる。
本発明による情報分析システムの構成の一例を示すブロック図である。 情報分析システムが時系列に発信された情報を分析する処理の一例を示すフローチャートである。 第2の実施の形態における情報分析システムの構成例を示すブロック図である。 第2の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。 第3の実施の形態における情報分析システムの構成例を示すブロック図である。 第3の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。 第4の実施の形態における情報分析システムの構成例を示すブロック図である。 第4の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。 時系列データの一例を示す説明図である。 時系列データの集計結果の表を示す説明図である。 時系列データの集計結果の表を示す説明図である。 時系列データの集計結果の表を示す説明図である。 時系列データの集計結果の表を示す説明図である。 時系列パタン対応表の具体例を示す説明図である。 時系列パタン・有効期間対応表の具体例を示す説明図である。 時系列パタン・変化タイプ対応表の具体例を示す説明図である。 変化タイプ・信頼度重み対応表の具体例を示す説明図である。 時系列パタン対応表の他の具体例を示す説明図である。
符号の説明
10 入力装置
11 時系列データパタン照合手段
12 時系列パタン記憶手段
13,13A 有効期間判定手段
14 時系列パタン・有効期間対応表記憶手段
15,15A 信頼度計算手段
16 変化タイプ判定手段
17 時系列パタン・変化タイプ対応表記憶手段
18 変化タイプ・信頼度重み対応表記憶手段
20 出力装置
100,100A 有効期間抽出手段
実施の形態1.
以下、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明による情報分析システムの構成の一例を示すブロック図である。図1に示すように、情報分析システムは、入力装置10、有効期間抽出手段100、及び出力装置20を含む。また、有効期間抽出手段100は、時系列データパタン照合手段11、時系列パタン記憶手段12、有効期間判定手段13、及び時系列パタン・有効期間対応表記憶手段14を含む。
本実施の形態において、情報分析システムは、具体的には、プログラムに従って動作するパーソナルコンピュータ等のデータ処理装置によって実現される。また、情報分析システムは、例えば、インターネットを介して収集した情報の信頼性を評価する用途に適用される。
入力装置10は、例えば、プログラムに従って動作するデータ処理装置のCPU及びネットワークインタフェース部によって実現される。入力装置10は、例えば、データベース装置が予め蓄積する複数のファイル(ある命題に対する各種発信情報)を読み込み、ある命題に対する肯定意見又は否定意見の度合いを示す情報を抽出し、時系列データを出力する機能を備える。例えば、入力装置10は、「納豆にはダイエット効果があるか?」という命題に対して、「納豆はダイエットに効果がある」という肯定意見を示す情報や、「納豆はダイエットに効果がない」という否定意見を示す情報を抽出する。
なお、本実施の形態において、「命題」とは、真偽を問いうる事柄のことである。利用者は、この命題について、例えば、インターネット上における様々な発信情報から、同命題に関する肯定意見・否定意見を述べたものを収集し、これを参考に真偽の検討を行う。
また、「時系列データ」は、発信時間を含む発信情報の集合で、命題に対する肯定意見・否定意見の肯定・否定の度合いが、予め−3,−2,−1,0,+1,+2,+3等の度数で与えられているものとする。すなわち、時系列データの最小構成要素は、タイムスタンプ(発信時間)と肯定度(肯定・否定の度合い)の組の集合である。また、時系列データは、この他、付加情報として、発信情報の発信目的、引用参照関係、トピック等の発信情報に関する属性や、発信者の立場、知識・経験等の発信者に関する属性情報を含んでもよい。
また、入力装置10は、具体的には、Web上から対象物に関する肯定的・否定的な表現を評判情報として抽出する評判情報抽出技術やテキストマイニング技術を用いて、ある命題に対する肯定意見又は否定意見の度合いを示す情報を抽出し、時系列データとして出力する。なお、上記に示した評判情報抽出技術は、例えば、文献「立石 健二、石黒 義英、福島 俊一、”インターネットからの評判情報検索”、人工知能学会誌、Vol.19、No.3、2004年5月」に記載されている。
また、本実施の形態では、データベース装置は、発信日時付きの発信情報を予め蓄積(例えば、発信日時に対応付けて発信情報を蓄積)している。そして、入力装置10は、データベース装置が記憶する各ファイルから発信日時付きの肯定意見又は否定意見の度合いを示す情報を抽出し時系列データを出力する。なお、本実施の形態では、入力装置10は、発信時刻や、肯定意見又は否定意見の度合い、発信情報、発信者の属性を含む時系列データを出力する。
また、入力装置10は、例えば、インターネット等のネットワークを介して各種発信情報を収集し、収集した各発信情報から、ある命題に対する肯定意見又は否定意見の度合いを示す情報を抽出し時系列データを出力してもよい。この場合も、入力装置10は、ネットワークを介して発信日時付きの発信情報(例えば、発信日時を含むメタ情報が付加された発信情報)を収集し、収集した各発信情報から発信情報付きの肯定意見又は否定意見の度合いを示す情報を抽出する。
時系列パタン記憶手段12は、具体的には、ハードディスク装置等の記憶装置によって実現される。時系列パタン記憶手段12は、時系列データのパタンを示す時系列パタンを複数含む時系列パタン対応表を記憶する。本実施の形態では、時系列パタン記憶手段12は、各時系列パタンを特定可能な時系列パタンIDを含む時系列パタン対応表を記憶している。
なお、本実施の形態では、時系列データにおける命題に対する肯定度を一定時間毎に集計して得られる肯定度の頻度分布が時間によって変化する典型的なパタンを「時系列パタン」と呼ぶ。具体的には、時系列データは、後述する図14に示すような時系列パタン対応表によって、各時系列パタンに分類される。例えば、これによって時系列パタンID=01をもつ時系列データは、時系列の全期間において、肯定度の分布に大きな時間変化が見られないパタンに対応する。また、時系列パタンID=02をもつ時系列データは、時系列の全期間において、ある一定期間の間にデータ数に爆発的増加が生じる現象であるバーストが、1回存在し、かつ、このバーストが現時点で生じているようなパタンに対応する。
時系列データパタン照合手段11は、具体的には、プログラムに従って動作するデータ処理装置のCPUによって実現される。時系列データパタン照合手段11は、入力装置10から時系列データを入力し、入力した時系列データの変化のパタンを示す時系列パタンを特定する機能を備える。具体的には、時系列データパタン照合手段11は、入力装置10から入力した時系列データと、時系列パタン記憶手段12が記憶する時系列パタン対応表に示される各時系列パタンとを照合し、入力した時系列データに合致する時系列パタンを特定する。そして、時系列データパタン照合手段11は、特定した時系列パタンに対応する時系列パタンIDを時系列パタン対応表から抽出し、有効期間判定手段13に出力する。
なお、入力した時系列データの全体が時系列パタン対応表に示される時系列パタンに合致するとは限らない。時系列データパタン照合手段11は、入力した時系列データの一部の区間が時系列パタン対応表に示される時系列パタンと合致する場合には、時系列データ中の時系列パタンと合致した区間を示すパタン照合区間を、有効期間判定手段13に出力する。なお、時系列データパタン照合手段11は、時系列データの全体が時系列パタンに合致する場合には、パタン照合区間として時系列データの全期間を示す情報を出力してもよい。
時系列パタン・有効期間対応表記憶手段14は、具体的には、ハードディスク装置等の記憶装置によって実現される。時系列パタン・有効期間対応表記憶手段14は、時系列パタン毎に時系列データ中の有効期間を含む時系列パタン・有効期間対応表を記憶する。本実施の形態では、時系列パタン・有効期間対応表記憶手段14は、時系列データ中の有効期間を時系列パタンIDに対応付けて含む時系列パタン・有効期間対応表を記憶する。
なお、本実施の形態では、時系列データに基づいて、ある時間における命題の真偽を判断する際に、その判断を行うのに有効な時系列データ中の期間を「有効期間」と呼ぶ。具体的には、時系列データは、後述する図15に示すような時系列パタン・有効期間対応表によって、時系列パタンから有効期間が導かれる。例えば、これによって時系列パタンID=01をもつ時系列データは、時系列の全期間において、肯定度の分布に大きな時間変化が見られないため、命題の真偽を判断する際に有効な時系列データ中の期間(すなわち、有効期間)は全期間ということになる。また、時系列パタンID=02をもつ時系列データは、現時点である一定期間の間にデータ数に爆発的増加が生じていることから、この命題に関する情報発信は現時点でも非常に活発な状況にあるため、この時系列データには、命題の真偽を判断する際に有効な時系列データ中の期間(有効期間)は存在しないということになる。
有効期間判定手段13は、具体的には、プログラムに従って動作するデータ処理装置のCPUによって実現される。有効期間判定手段13は、入力装置10から入力した時系列データと、時系列データパタン照合手段11が特定した時系列パタンとに基づいて、時系列データ中の有効なデータが含まれる期間である有効期間を求める機能を備える。また、有効期間判定手段13は、求めた有効期間に従って、入力装置10から入力した時系列データ中の有効期間内のデータ(有効期間時系列データともいう)を求める機能を備える。
例えば、ある命題に対する発信情報を複数収集したとしても、ある時点で有力な学説が変わった等の理由により、その時点より以前に発信された情報は、その命題に対する真偽を評価する上で参考にできないことがある。このような場合に、有効期間判定手段13は、有力な学説が変わった後の命題に対する真偽を評価する上で参考にできうる発信情報のみが含まれる期間を有効期間として求める。
具体的には、有効期間判定手段13は、時系列データパタン照合手段11から入力した時系列パタンIDに対応する有効期間を時系列パタン・有効期間対応表から特定する。また、有効期間判定手段13は、特定した有効期間に従って、時系列データ中から有効期間時系列データを抽出する。なお、有効期間判定手段13は、時系列データパタン照合手段11からパタン照合区間を入力している場合には、入力装置10から入力した時系列データ中のパタン照合区間及び有効期間の両方に合致する期間のデータを有効期間時系列データとして抽出する。
また、有効期間判定手段13は、求めた有効期間や有効期間時系列データを出力装置20に出力させる機能を備える。
なお、有効期間判定手段13は、時系列データの有効期間のみを求めて出力装置20に出力させてもよいし、有効期間時系列データのみを求めて出力装置20に出力させてもよい。また、有効期間判定手段13は、有効期間及び有効期間時系列データの両方を求めて出力装置20に出力させてもよい。
出力装置20は、具体的には、ディスプレイ装置等の表示装置によって実現される。出力装置20は、有効期間判定手段13の指示に従って、有効期間や有効期間時系列データを表示する機能を備える。
なお、有効期間や有効期間時系列データを表示するのではなく、例えば、有効期間判定手段13は、求めた有効期間や有効期間時系列データを含むファイルを出力するようにしてもよいし、プリンタ等の印刷装置に出力させるようにしてもよい。
また、本実施の形態において、情報分析システムを実現するデータ処理装置の記憶装置は、時系列に発信された情報を分析するための各種プログラムを記憶している。例えば、データ処理装置の記憶装置(図示せず)は、コンピュータに、ある命題に対する肯定度とタイプスタンプを少なくとも含む時系列データの、肯定度の時間変化の時系列パタンを特定する時系列パタン特定処理と、この特定された時系列パタンに基づいて時系列データ内の有効期間を特定する有効期間特定処理とを実行させるための情報分析用プログラムを記憶している。
次に、動作について説明する。図2は、情報分析システムが時系列に発信された情報を分析する処理の一例を示すフローチャートである。まず、情報分析システムの入力装置10は、ユーザによる情報収集や情報検索の操作に従って、データベース装置から各ファイルを読み込み、又はネットワークを介して各種発信情報を収集し、時系列データを抽出する。
次いで、情報分析システムの時系列データパタン照合手段11は、入力装置10から入力した時系列データ及び時系列パタン記憶手段12が記憶する時系列パタン対応表に基づいて、時系列パタンを特定し時系列パタンIDを抽出する。この場合、時系列データパタン照合手段11は、入力装置10から出力される時系列データを入力として、時系列パタン対応表に含まれる時系列パタンを順次照合する。そして、時系列データパタン照合手段11は、照合結果に基づいて、時系列パタンIDと時系列データ中におけるパタン照合区間との組を出力する(ステップS11)。
次いで、情報分析システムの有効期間判定手段13は、入力装置10から入力した時系列データと、時系列データパタン照合手段11からの時系列パタンID及びパタン照合区間と、時系列パタン・有効期間対応表記憶手段14が記憶する時系列パタン・有効期間対応表とに基づいて、有効期間や有効期間時系列データを求める。
この場合、有効期間判定手段13は、入力装置10から出力される時系列データ、及び時系列データパタン照合手段11から出力される時系列パタンIDと時系列データ中におけるパタン照合区間との組を入力として、時系列パタン・有効期間対応表に基づいて、時系列パタンID毎に定義された有効期間を時系列データと照合する。そして、有効期間判定手段13は、照合結果に基づいて、絶対時間(例えば、年、月、日、時)として有効期間を求める。また、有効期間判定手段13は、求めた有効期間に従って有効期間時系列データを求める(ステップS12)。
次いで、有効期間判定手段13は、求めた有効期間や有効期間時系列データを出力装置20に出力させる。すると、出力装置20は、有効期間判定手段13の指示に従って、有効期間や有効期間時系列データを出力(例えば、表示)する(ステップS13)。
ユーザは、出力された有効期間や有効期間時系列データを確認することによって、時系列データ中の有効な信頼性の高いデータが含まれる期間や、それら信頼性の高いデータを認識することができる。また、ユーザは、出力された有効期間や有効期間時系列データに基づいて、時系列データ中の信頼性の高いデータのみを用いてデータマイニング等の各種統計処理を行うことができる。そのようにすることによって、信頼性の高い統計処理結果を得ることができる。
以上のように、本実施の形態によれば、入力装置10が入力した時系列データについて、有効期間や有効期間時系列データを求める。そのため、時系列データ中の信頼性の高いデータが含まれている期間を把握することができ、時系列データ中の信頼性の高いデータを得ることができる。従って、時系列的な評価の変動を考慮して、情報の信頼性を高めることができる。
実施の形態2.
次に、本発明の第2の実施の形態について図面を参照して説明する。図3は、第2の実施の形態における情報分析システムの構成例を示すブロック図である。本実施の形態では、図3に示すように、情報分析システムが、図1で示した構成要素に加えて、信頼度計算手段15を含む点で、第1の実施の形態と異なる。また、本実施の形態では、有効期間判定手段13Aの機能が、第1の実施の形態で示した有効期間判定手段13の機能と異なる。
有効期間判定手段13Aは、第1の実施の形態で示した有効期間判定手段13と同様の処理に従って、入力装置10から入力した時系列データと、時系列データパタン照合手段11が特定した時系列パタンとに基づいて、有効期間時系列データを求める機能を備える。また、有効期間判定手段13Aは、求めた有効期間時系列データを信頼度計算手段15に出力する機能を備える。
信頼度計算手段15は、具体的には、プログラムに従って動作するデータ処理装置のCPUによって実現される。信頼度計算手段15は、入力装置10から入力した時系列データに基づいて、時系列データ全体に対する信頼度や、時系列データに含まれる個々の発信情報に対する信頼度を求める機能を備える。また、信頼度計算手段15は、有効期間判定手段13Aからの有効期間時系列データに基づいて、有効期間時系列データに対する信頼度(以下、有効期間信頼度ともいう)を求める機能を備える。
なお、本実施の形態において、ある時系列データに対する「信頼度」とは、与えられた命題の真偽を、その時系列データに基づいて判断するという場合に、どれだけ信頼できる判断が得られるかという尺度である。また、「有効期間信頼度」とは、時系列データの中の有効期間の部分系列を取り出した場合に、その部分系列に基づいて命題の真偽を判断する場合に、どれだけ信頼できる判断が得られるかという尺度である。
なお、有効期間判定手段13A及び信頼度計算手段15以外の情報分析システムの各構成要素の機能は、第1の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。図4は、第2の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。図4において、ステップS11の処理は、第1の実施の形態で示したステップS11の処理と同様である。
次いで、情報分析システムの有効期間判定手段13Aは、入力装置10から入力した時系列データと、時系列データパタン照合手段11からの時系列パタンID及びパタン照合区間と、時系列パタン・有効期間対応表記憶手段14が記憶する時系列パタン・有効期間対応表とに基づいて、有効期間時系列データを求める。
この場合、有効期間判定手段13Aは、入力装置10から出力される時系列データ、及び時系列データパタン照合手段11から出力される時系列パタンIDと時系列データ中におけるパタン照合区間との組を入力として、時系列パタン・有効期間対応表に基づいて、時系列パタンID毎に定義された有効期間を時系列データと照合する。そして、有効期間判定手段13Aは、照合結果に基づいて、有効期間時系列データを求める(ステップS12A)。
次いで、信頼度計算手段15は、入力装置10から入力した時系列データに基づいて、時系列データ全体に対する信頼度や、時系列データに含まれる個々の発信情報に対する信頼度を求める。また、信頼度計算手段15は、有効期間判定手段13Aからの有効期間時系列データに基づいて、有効期間信頼度を求める。
この場合、信頼度計算手段15は、有効期間判定手段13Aから出力される有効期間時系列データを入力として、時系列データ中の肯定又は否定の度合いや、発信情報の属性、発信者の属性等に基づいて、時系列データ全体に対する信頼度や、時系列データ中の個々の発信情報に対する信頼度、有効期間信頼度を求める(ステップS23)。
次いで、信頼度計算手段15は、求めた有効期間信頼度を出力装置20に出力させる。すると、出力装置20は、信頼度計算手段15の指示に従って、有効期間信頼度を出力(例えば、表示)する(ステップS24)。なお、この場合、信頼度計算手段15は、時系列データ全体に対する信頼度や、時系列データ中の個々の発信情報に対する信頼度も、出力装置20に出力させてもよい。
以上のように、本実施の形態によれば、入力装置10が入力した時系列データについて有効期間時系列データを求める。そして、求めた有効期間時系列データを用いて情報の信頼性を判定し、抽出した有効期間時系列データに対する有効期間信頼度を求める。そのため、時系列データ中の信頼性の高いデータのみを用いて有効期間信頼度を求めることができる。従って、時系列的な評価の変動を考慮して、情報の信頼性を高精度に判定することができる。
実施の形態3.
次に、本発明の第3の実施の形態について図面を参照して説明する。図5は、第3の実施の形態における情報分析システムの構成例を示すブロック図である。本実施の形態では、図5に示すように、情報分析システムが、図1で示した構成要素に加えて、変化タイプ判定手段16、及び時系列パタン・変化タイプ対応表記憶手段17を含む点で、第1の実施の形態と異なる。
時系列パタン・変化タイプ対応表記憶手段17は、具体的には、ハードディスク装置等の記憶装置によって実現される。時系列パタン・変化タイプ対応表記憶手段17は、時系列パタン毎に定義された時系列データの変化タイプを含む時系列パタン・変化タイプ対応表を記憶する。なお、「変化タイプ」とは、時系列データにおける時間変化の傾向を所定の典型的なタイプ別に分類したものである。本実施の形態では、時系列パタン・変化タイプ対応表記憶手段17は、時系列データの変化タイプを時系列パタンIDに対応付けて含む時系列パタン・変化タイプ対応表を記憶する。
なお、本実施の形態では、ある時系列データに対する時系列パタンは、その時系列データにおける有効期間を判断する基になるとともに、信頼度(及び有効期間信頼度)をより精度良く推定するための基にもなる。このような信頼度をより精度良く推定する観点で、時系列パタンを類型化したものを「変化タイプ」と呼ぶ。
変化タイプ判定手段16は、具体的には、プログラムに従って動作するデータ処理装置のCPUによって実現される。変化タイプ判定手段16は、時系列データパタン照合手段11が特定した時系列パタンに基づいて、時系列データの変化の型を示す変化タイプを求める機能を備える。具体的には、変化タイプ判定手段16は、時系列データパタン照合手段11から入力した時系列パタンIDに対応する変化タイプを時系列パタン・変化タイプ対応表から特定する。
また、変化タイプ判定手段16は、求めた変化タイプを出力装置20に出力させる機能を備える。また、変化タイプ判定手段16は、有効期間判定手段13が求めた有効期間や有効期間時系列データを入力し、出力装置20に出力させる機能を備える。
なお、変化タイプ判定手段16は、時系列データの有効期間、有効期間時系列データ、又は変化タイプのいずれか1つを出力装置20に出力させてもよいし、それらのうちのいずれか2つの組み合わせを出力装置20に出力させてもよい。また、変化タイプ判定手段16は、有効期間、有効期間時系列データ、及び変化タイプの全てを出力装置20に出力させてもよい。
本実施の形態では、有効期間抽出手段100Bは、有効期間判定手段13によって有効期間や有効期間時系列データを求めるとともに、さらに変化タイプ判定手段16を用いて時系列データの変化タイプを求める。そのため、時系列データ中の有効期間や有効期間時系列データを認識できるとともに、その補足情報として変化タイプを確認可能とすることによって、時系列データの時間変化の傾向も認識することができる。従って、本実施の形態では、変化タイプ判定手段16が求める変化タイプは、有効期間や有効期間時系列データの補足情報としての役割を果たす。
なお、変化タイプ判定手段16及び時系列パタン・変化タイプ対応表記憶手段17以外の情報分析システムの各構成要素の機能は、第1の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。図6は、第3の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。図6において、ステップS11,S12の処理は、第1の実施の形態で示したそれらの処理と同様である。
次いで、情報分析システムの変化タイプ判定手段16は、時系列データパタン照合手段11が求めた時系列パタンID及びパタン照合区間と、時系列パタン・変化タイプ対応表記憶手段17が記憶する時系列パタン・変化タイプ対応表とに基づいて、時系列データの変化タイプを求める。
この場合、変化タイプ判定手段16は、時系列パタンIDと時系列データ中におけるパタン照合区間との組を入力として、時系列パタン・変化タイプ対応表に基づいて、時系列パタンID毎に定義された変化タイプを求める(ステップS33)。
次いで、変化タイプ判定手段16は、求めた変化タイプや、有効期間判定手段13が求めた有効期間や有効期間時系列データを出力装置20に出力させる。すると、出力装置20は、変化タイプ判定手段16の指示に従って、有効期間や有効期間時系列データ、変化タイプを出力(例えば、表示)する(ステップS34)。
ユーザは、出力された有効期間や有効期間時系列データを確認することによって、時系列データ中の有効な信頼性の高いデータが含まれる期間や、それら信頼性の高いデータを認識することができる。また、補足情報として出力された変化タイプを確認することによって、時系列データの時間変化の傾向を認識することができる。また、ユーザは、変化タイプを参考にしつつ、出力された有効期間や有効期間時系列データに基づいて、時系列データ中の信頼性の高いデータのみを用いてデータマイニング等の各種統計処理を行うことができる。そのようにすることによって、信頼性の高い統計処理結果を得ることができる。
以上のように、本実施の形態によれば、入力装置10が入力した時系列データについて、有効期間や有効期間時系列データを求める。また、特定した時系列パタンに基づいて変化タイプを特定する。そのため、変化タイプを参考にしつつ、時系列データ中の信頼性の高いデータが含まれている期間を把握することができ、時系列データ中の信頼性の高いデータを得ることができる。従って、時系列的な評価の変動を考慮するとともに、変化タイプを考慮して、情報の信頼性を高めることができる。また、ユーザに対して情報の信頼性を分析するための情報として有効期間や有効期間時系列データとともに変化タイプを提示することができる。
例えば、特許文献1や非特許文献1に記載された従来の情報分析システムでは、情報の信頼性を判定する際に、時系列的な意見の変化タイプを考慮せずに、発信者属性のみに基づいて重み付けされた肯定意見と否定意見との数の総和を求めることによって、信頼度を判定しているにすぎない。そのため、特許文献1や非特許文献1に記載された従来の情報分析システムでは、肯定意見と否定意見との数や発信者属性が同じである場合には、否定意見と肯定意見との比率が一定期間変化しない評価の定まった枯れた情報と、否定意見が急速に増えて信頼度が大きく変動している情報とを区別することができない。これに対して、本実施の形態では、時系列的な評価の変動を用いて変化タイプを求めるので、より情報の信頼性を高めることができる。
実施の形態4.
次に、本発明の第4の実施の形態について図面を参照して説明する。図7は、第4の実施の形態における情報分析システムの構成例を示すブロック図である。本実施の形態では、図7に示すように、情報分析システムが、図1で示した構成要素に加えて、変化タイプ判定手段16、時系列パタン・変化タイプ対応表記憶手段17、信頼度計算手段15A、及び変化タイプ・信頼度重み対応表記憶手段18を含む点で、第1の実施の形態と異なる。また、本実施の形態では、有効期間判定手段13Aの機能が、第1の実施の形態で示した有効期間判定手段13の機能と異なる。
有効期間判定手段13Aは、第1の実施の形態で示した有効期間判定手段13と同様の処理に従って、入力装置10から入力した時系列データと、時系列データパタン照合手段11が特定した時系列パタンとに基づいて、有効期間時系列データを求める機能を備える。また、有効期間判定手段13Aは、求めた有効期間時系列データを変化タイプ判定手段16に出力する機能を備える。
時系列パタン・変化タイプ対応表記憶手段17は、具体的には、ハードディスク装置等の記憶装置によって実現される。時系列パタン・変化タイプ対応表記憶手段17は、時系列パタン毎に定義された時系列データの変化タイプを含む時系列パタン・変化タイプ対応表を記憶する。本実施の形態では、時系列パタン・変化タイプ対応表記憶手段17は、時系列データの変化タイプを時系列パタンIDに対応付けて含む時系列パタン・変化タイプ対応表を記憶する。
変化タイプ判定手段16は、具体的には、プログラムに従って動作するデータ処理装置のCPUによって実現される。変化タイプ判定手段16は、時系列データパタン照合手段11が特定した時系列パタンに基づいて、時系列データの変化タイプを求める機能を備える。具体的には、変化タイプ判定手段16は、時系列データパタン照合手段11から入力した時系列パタンIDに対応する変化タイプを時系列パタン・変化タイプ対応表から特定する。また、変化タイプ判定手段16は、求めた変化タイプとともに、有効期間判定手段13Aが求めた有効期間時系列データを信頼度計算手段15Aに出力する機能を備える。
変化タイプ・信頼度重み対応表記憶手段18は、具体的には、ハードディスク装置等の記憶装置によって実現される。変化タイプ・信頼度重み対応表記憶手段18は、変化タイプ毎に勘案される信頼度の重みを示す信頼度重み係数を含む変化タイプ・信頼度重み対応表を記憶する。本実施の形態では、変化タイプ・信頼度重み対応表記憶手段18は、信頼度重み係数を変化タイプに対応付けて含む変化タイプ・信頼度重み対応表を記憶する。
信頼度計算手段15Aは、入力装置10から入力した時系列データに基づいて、時系列データ全体に対する信頼度や、時系列データに含まれる個々の発信情報に対する信頼度を求める機能を備える。また、信頼度計算手段15Aは、変化タイプ判定手段16からの有効期間時系列データ及び変化タイプに基づいて、変化タイプを考慮した有効期間時系列データに対する信頼度(以下、有効期間変化タイプ信頼度ともいう)を求める機能を備える。
具体的には、信頼度計算手段15Aは、変化タイプ判定手段16から入力した変化タイプに対応する信頼度重み係数を変化タイプ・信頼度重み対応表から特定する。そして、信頼度計算手段15Aは、有効期間時系列データに基づいて、特定した信頼度重み係数を有効期間信頼度に重み付けする(例えば、信頼度重み係数と有効期間信頼度との積を求める)ことによって、有効期間変化タイプ信頼度を求める。
なお、本実施の形態では、第3の実施の形態と同様に、ある時系列データに対する時系列パタンは、その時系列データにおける有効期間を判断する基になるとともに、信頼度(及び有効期間信頼度)をより精度良く推定するための基にもなる。このような信頼度をより精度良く推定する観点で、時系列パタンを類型化したものを「変化タイプ」と呼ぶ。さらに、この変化タイプ毎によって、信頼度の値をより精度良く補正するために導入する重みを「信頼度重み」と呼ぶ。
また、本実施の形態では、この信頼度重みと従来の信頼度の値との積を「有効期間変化タイプ信頼度」と呼ぶ。有効期間変化タイプ信頼度は、命題に対する時系列データの変化タイプを考慮することにより、より精度良い信頼度を推定するものである。具体的には、変化タイプは、後述する図16に示すような時系列パタン・変化タイプ対応表によって、時系列パタンから導かれる。例えば、時系列パタンID=01をもつ時系列データは、時系列の全期間において、肯定度の分布に大きな時間変化が見られないため、その変化タイプは「一定型」となる。さらに、変化タイプ「一定型」は、肯定度の分布に大きな時間変化が見られないことから、この時系列から導かれる信頼度は信頼できる(信頼度の信頼度)ため、信頼度の重みとして1.0が与えられる。同様に、時系列パタンID=02をもつ時系列データは、現時点である一定期間の間にデータ数に爆発的増加が生じているため、その変化タイプは「炎上型」となる。さらに、変化タイプ「炎上型」は、この命題に関する情報発信が非常に活発な状況にあるため、この時系列データから判断される命題の真偽の信頼性は信頼できず、信頼度の重みとして0.1が与えられる。
なお、有効期間判定手段13A、変化タイプ判定手段16、時系列パタン・変化タイプ対応表記憶手段17、信頼度計算手段15A、及び変化タイプ・信頼度重み対応表記憶手段18以外の情報分析システムの各構成要素の機能は、第1の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。図8は、第4の実施の形態における情報分析システムが時系列に発信された情報を分析する処理例を示すフローチャートである。図8において、ステップS11の処理は、第1の実施の形態で示したステップS11の処理と同様である。
次いで、情報分析システムの有効期間判定手段13Aは、入力装置10から入力した時系列データと、時系列データパタン照合手段11からの時系列パタンID及びパタン照合区間と、時系列パタン・有効期間対応表記憶手段14が記憶する時系列パタン・有効期間対応表とに基づいて、有効期間時系列データを求める。
この場合、有効期間判定手段13Aは、入力装置10から出力される時系列データ、及び時系列データパタン照合手段11から出力される時系列パタンIDと時系列データ中におけるパタン照合区間との組を入力として、時系列パタン・有効期間対応表に基づいて、時系列パタンID毎に定義された有効期間を時系列データと照合する。そして、有効期間判定手段13Aは、照合結果に基づいて、有効期間時系列データを求める(ステップS12A)。
次いで、情報分析システムの変化タイプ判定手段16は、時系列データパタン照合手段11が求めた時系列パタンID及びパタン照合区間と、時系列パタン・変化タイプ対応表記憶手段17が記憶する時系列パタン・変化タイプ対応表とに基づいて、時系列データの変化タイプを求める。
この場合、変化タイプ判定手段16は、時系列パタンIDと時系列データ中におけるパタン照合区間との組を入力として、時系列パタン・変化タイプ対応表に基づいて、時系列パタンID毎に定義された変化タイプを求める(ステップS33)。
次いで、信頼度計算手段15Aは、入力装置10から入力した時系列データに基づいて、時系列データ全体に対する信頼度や、時系列データに含まれる個々の発信情報に対する信頼度を求める。また、信頼度計算手段15Aは、変化タイプ判定手段16からの有効期間時系列データ及び変化タイプと、変化タイプ・信頼度重み対応表記憶手段18が記憶する変化タイプ・信頼度重み対応表とに基づいて、有効期間変化タイプ信頼度を求める。
この場合、信頼度計算手段15Aは、有効期間判定手段13Aが求めた有効期間時系列データ、及び変化タイプ判定手段16から出力される変化タイプを入力として、変化タイプ・信頼度重み対応表に基づいて、変化タイプに対応する信頼度重み係数を求める。そして、信頼度計算手段15Aは、信頼度重み係数と有効期間信頼度との積を求めることによって、有効期間変化タイプ信頼度を求める(ステップS44)。
次いで、信頼度計算手段15Aは、求めた有効期間変化タイプ信頼度を出力装置20に出力させる。すると、出力装置20は、信頼度計算手段15Aの指示に従って、有効期間変化タイプ信頼度を出力(例えば、表示)する(ステップS45)。なお、この場合、信頼度計算手段15Aは、時系列データ全体に対する信頼度や、時系列データ中の個々の発信情報に対する信頼度も、出力装置20に出力させてもよい。
以上のように、本実施の形態によれば、入力装置10が入力した時系列データについて有効期間時系列データ及び変化タイプを求める。そして、求めた有効期間時系列データ及び変化タイプを用いて情報の信頼性を判定し、有効期間変化タイプ信頼度を求める。すなわち、本実施の形態では、抽出した有効期間時系列データ及び特定した変化タイプに基づいて有効期間変化タイプ信頼度を求める。そのため、時系列データの変化タイプを考慮して、時系列データ中の信頼性の高いデータのみを用いて有効期間変化タイプ信頼度を求めることができる。従って、時系列的な評価の変動を考慮するとともに、時系列データの変化タイプを考慮して、情報の信頼性を高精度に判定ことができる。
例えば、特許文献1や非特許文献1に記載された従来の情報分析システムでは、情報の信頼性を判定する際に、時系列的な意見の変化タイプを考慮せずに、発信者属性のみに基づいて重み付けされた肯定意見と否定意見との数の総和を求めることによって、信頼度を判定しているにすぎない。そのため、特許文献1や非特許文献1に記載された従来の情報分析システムでは、肯定意見と否定意見との数や発信者属性が同じである場合には、否定意見と肯定意見との比率が一定期間変化しない評価の定まった枯れた情報と、否定意見が急速に増えて信頼度が大きく変動している情報とを区別することができない。これに対して、本実施の形態では、時系列的な評価の変動を用いて変化タイプを求めるので、より情報の信頼性を高精度に判定することができる。
次に、本発明の具体的な実施例について図面を参照して説明する。本実施例では、データ処理装置としてパーソナルコンピュータを用いて情報分析システムを実現する場合を説明する。また、本実施の形態では、情報分析システムは、出力装置20としてディスプレイ装置を備える。
図9は、入力装置10によって読み取られる入力データ(時系列データ)の一例を示す説明図である。入力装置10は、例えば、データベース装置が格納する各ファイルから、「緑茶は癌に効果がある」というような特定の情報に対する意見を示す情報を抽出する。本例では、入力装置10は、図9に示すように、発信日時と、発信者属性と、肯定又は否定意見の度合いを示す情報とを含む時系列データを抽出する。
なお、図9に示す肯定又は否定意見の度合いを示す情報では、値が「+」であるものが肯定意見であることを示し、その数字が大きい程、肯定の度合いが高いことを表している。また、値が「−」であるものが否定意見であることを示し、その数字が大きい程、否定の度合いが高いことを表している。
時系列データパタン照合手段11は、まず、図9に示すような時系列データから肯定意見及び否定意見の数を所定期間集計し、肯定意見及び否定意見の数の集計結果を示す表を作成する。例えば、時系列データパタン照合手段11は、図10〜図13に示すような集計結果の表を作成する。図10〜図13に示す例では、時系列データパタン照合手段11は、意見の総数、肯定意見の数、否定意見の数、及び肯定意見と否定意見との数の差を1年毎に集計して集計結果の表を作成している。
なお、図10〜図13に示す例では、1年毎に肯定意見及び否定意見を集計する場合を示しているが、時系列データパタン照合手段11は、例えば、月毎に集計する等、他の期間毎に肯定意見及び否定意見を集計してもよい。
次いで、時系列データパタン照合手段11は、入力装置10から出力される時系列データを入力として、時系列データ中の各時間区間T〜T+ΔTにおける肯定意見又は否定意見の度合いの分布の時系列変化に基づいて、時系列データの特定の変化を抽出する。本実施例では、時系列データパタン照合手段11は、時刻t=Tからt=T+ΔTまでの間の時系列データの総数N(T)の時間変化、肯定意見/否定意見の度合いの平均E(T)の時間変化、又は肯定意見/否定意見の度合いの分布の分散σ(T)の時間変化のいずれかの指標を用いて、時系列データの特定の変化を抽出する。そして、時系列データパタン照合手段11は、その抽出結果に基づいて、時系列データの時系列パタンを特定する。
なお、時系列データパタン照合手段11は、総数N(T)の時間変化、平均E(T)の時間変化、又は分散σ(T)の時間変化のうちのいずれか1つの指標に基づいて、時系列パタンを特定してもよいし、それらの指標のうちのいずれか2つの組み合わせに基づいて、時系列パタンを特定してもよい。また、時系列データパタン照合手段11は、総数N(T)の時間変化、平均E(T)の時間変化、又は分散σ(T)の時間変化の全てに基づいて、時系列パタンを特定してもよい。
具体的には、時系列データパタン照合手段11は、時系列データの総数N(T)の時間変化に基づいて、例えば、時系列データの変化状態がバースト状態、沈静状態、活発状態、活発化状態、沈静化状態、又は発信量維持状態のいずれであるかを特定する。
バースト状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数が爆発的に増加しており、情報発信が短期間に集中して活発に行われている状態である。時系列データパタン照合手段11は、例えば、式(1)に示す条件式に合致するか否かを判断することによって、バースト状態であるか否かを判定する。
{N(T+ΔT)−N(T)}/N(T)>γ 式(1)
なお、式(1)において、γは、正の値をもつ所定の閾値である。
また、沈静状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数が所定数を下回り、情報発信があまり行われていない状態である。時系列データパタン照合手段11は、例えば、式(2)に示す条件式に合致するか否かを判断することによって、沈静状態であるか否かを判定する。
N(T)<θN_low 式(2)
なお、式(2)において、θN_lowは、正の整数である所定の閾値である。
また、活発状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数が所定数を上回り、情報発信が活発に行われている状態である。時系列データパタン照合手段11は、例えば、式(3)に示す条件式に合致するか否かを判断することによって、活発状態であるか否かを判定する。
N(T)>θN_high 式(3)
なお、式(3)において、θN_highは、正の整数である所定の閾値である。
また、活発化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数の増加量が所定基準を上回り、情報発信がより活発化の方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(4)に示す条件式に合致するか否かを判断することによって、活発化状態であるか否かを判定する。
{N(T+ΔT)−N(T)}/ΔT>θΔN/ΔT 式(4)
なお、式(4)において、θΔN/ΔTは、正の値をもつ所定の閾値である。
また、沈静化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数の減少量が所定基準を上回り、情報発信がより沈静化の方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(5)に示す条件式に合致するか否かを判断することによって、沈静化状態であるか否かを判定する。
{N(T+ΔT)−N(T)}/ΔT<−θΔN/ΔT 式(5)
また、発信量維持状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの総数の増減量が所定基準を下回り、情報発信の量が維持されている状態である。時系列データパタン照合手段11は、例えば、式(6)に示す条件式に合致するか否かを判断することによって、発信量維持状態であるか否かを判定する。
−θΔN/ΔT<{N(T+ΔT)−N(T)}/ΔT<θΔN/ΔT 式(6)
また、時系列データパタン照合手段11は、肯定意見/否定意見の度合いの平均E(T)の時間変化に基づいて、例えば、時系列データの変化状態が肯定優勢状態、否定優勢状態、肯否均衡状態、肯定化状態、否定化状態、反転状態、又は肯否平衡状態のいずれであるかを特定する。
肯定優勢状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値が所定基準を超えて肯定側の値となり、肯定意見の方が否定意見よりも優勢である状態である。時系列データパタン照合手段11は、例えば、式(7)に示す条件式に合致するか否かを判断することによって、肯定優勢状態であるか否かを判定する。
E(T)>θE 式(7)
なお、式(7)において、θEは、正の値をもつ所定の閾値である。
否定優勢状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値が所定基準を超えて否定側の値となり、否定意見の方が肯定意見よりも優勢である状態である。時系列データパタン照合手段11は、例えば、式(8)に示す条件式に合致するか否かを判断することによって、否定優勢状態であるか否かを判定する。
E(T)<−θE 式(8)
肯否均衡状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値が所定基準の範囲で中間的な値となり、肯定意見と否定意見との両者が均衡している状態である。時系列データパタン照合手段11は、例えば、式(9)に示す条件式に合致するか否かを判断することによって、肯否均衡状態であるか否かを判定する。
−θE<E(T)<θE 式(9)
肯定化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値の増加量が所定基準を上回り、より肯定意見が優勢である方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(10)に示す条件式に合致するか否かを判断することによって、肯定化状態であるか否かを判定する。
{E(T+ΔT)−E(T)}/ΔT>θΔE/ΔT 式(10)
なお、式(10)において、θΔE/ΔTは、正の値をもつ所定の閾値である。
否定化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値の減少量が所定基準を上回り、より否定意見が優勢である方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(11)に示す条件式に合致するか否かを判断することによって、否定化状態であるか否かを判定する。
{E(T+ΔT)−E(T)}/ΔT<−θΔE/ΔT 式(11)
反転状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値が否定側の値から肯定側の値に変化し、否定意見が優勢である状態から肯定意見が優勢である状態への反転現象が生じている状態、又は肯定側の値から否定側の値に変化し、肯定意見が優勢である状態から否定意見が優勢である状態への反転現象が生じている状態である。時系列データパタン照合手段11は、例えば、式(12)に示す条件式に合致するか否かを判断することによって、反転状態であるか否かを判定する。
E(T)>θE かつ E(T+ΔT)<−θE、
又は、
E(T)<−θE かつ E(T+ΔT))>θE 式(12)
なお、反転状態のうち、否定意見が優勢である状態から肯定意見が優勢である状態への反転現象が生じている状態と、肯定意見が優勢である状態から否定意見が優勢である状態への反転現象が生じている状態とを別の状態として定義して、時系列パタンの特定に用いてもよい。
肯否平衡状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの平均値の増減量が所定基準を下回り、肯定優勢状態、否定優勢状態、又は肯否均衡状態のいずれかの状態が維持されている状態である。時系列データパタン照合手段11は、例えば、式(13)に示す条件式に合致するか否かを判断することによって、肯否平衡状態であるか否かを判定する。
−θΔE/ΔT<{E(T+ΔT)−E(T)}/ΔT<θΔE/ΔT 式(13)
また、時系列データパタン照合手段11は、肯定意見/否定意見の度合いの分布の分散σ(T)の時間変化に基づいて、例えば、時系列データの変化状態が発散状態、収束状態、発散化状態、収束化状態、又は分散安定状態のいずれであるかを特定する。
発散状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの分散値が所定量を上回り、各データの肯定意見/否定意見の度合いの値に大きなばらつきが見られる状態である。時系列データパタン照合手段11は、例えば、式(14)に示す条件式に合致するか否かを判断することによって、発散状態であるか否かを判定する。
σ(T)>θσ_high 式(14)
なお、式(14)において、θσ_highは、正の値をもつ所定の閾値である。
収束状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの分散値が所定量を下回り、各データの肯定意見/否定意見の度合いの値に大きなばらつきが見られない状態である。時系列データパタン照合手段11は、例えば、式(15)に示す条件式に合致するか否かを判断することによって、収束状態であるか否かを判定する。
σ(T)<θσ_low 式(15)
なお、式(15)において、θσ_lowは、正の値をもつ所定の閾値である。
発散化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの分散値の増加量が所定基準を上回り、各データの肯定意見/否定意見の度合いの値のばらつきがより大きくなる方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(16)に示す条件式に合致するか否かを判断することによって、発散化状態であるか否かを判定する。
{σ(T+ΔT)−σ(T)}/ΔT>θΔσ/ΔT 式(16)
なお、式(16)において、θΔσ/ΔTは、正の値をもつ所定の閾値である。
収束化状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの分散値の減少量が所定基準を上回り、各データの肯定意見/否定意見の度合いの値のばらつきがより小さくなる方向に向かっている状態である。時系列データパタン照合手段11は、例えば、式(17)に示す条件式に合致するか否かを判断することによって、収束化状態であるか否かを判定する。
{σ(T+ΔT)−σ(T)}/ΔT<−θΔσ/ΔT 式(17)
分散安定状態とは、t=Tからt=T+ΔTまでの時間区間において、時系列データの肯定意見/否定意見の度合いの分散値の増減量が所定基準を下回り、発散状態又は収束状態が維持されている状態である。時系列データパタン照合手段11は、例えば、式(18)に示す条件式に合致するか否かを判断することによって、分散安定状態であるか否かを判定する。
−θΔσ/ΔT<{σ(T+ΔT)−σ(T)}/ΔT<θΔσ/ΔT 式(18)
例えば、上記に示した各状態判定のうち、バースト状態であるか否かを判定するバースト状態判定と反転状態であるか否かを判定する反転状態判定とを用いて、時系列パタンを特定する場合を説明する。図14は、時系列パタン記憶手段12が記憶するバースト状態判定及び反転状態判定を用いた時系列パタン対応表の具体例を示す説明図である。
図14に示す時系列パタン対応表を用いる場合、時系列データパタン照合手段11は、式(1)の条件式を用いて、時系列データ中にバースト状態である期間(バースト期間)が存在するか否か及びバースト期間が何回存在するか(第1条件)、現在もバースト期間であるか否か(第2条件)を判断する。また、時系列データパタン照合手段11は、式(12)の条件式を用いて、時系列データ中に反転状態が存在するか否か(第3条件)を判断する。
例えば、時系列データパタン照合手段11は、図10に示す例では、2003年に1度バースト期間があるが、現在はバースト期間ではなく、バースト期間の前後で肯定意見と否定意見との意見数が反転しており反転状態であると判定する。そのため、時系列データパタン照合手段11は、図10に示す例では、図14に示す時系列パタン対応表から時系列パタンID「03」を抽出する。
また、時系列データパタン照合手段11は、図11に示す例では、バースト期間がないと判定する。そのため、時系列データパタン照合手段11は、図11に示す例では、図14に示す時系列パタン対応表から時系列パタンID「01」を抽出する。
また、時系列データパタン照合手段11は、図12に示す例では、2006年から2007年までの期間に1度バースト期間があるとともに、現在もバースト期間であると判定する。そのため、時系列データパタン照合手段11は、図12に示す例では、図14に示す時系列パタン対応表から時系列パタンID「02」を抽出する。
また、時系列データパタン照合手段11は、図13に示す例では、1999年、2002年及び2006年に合計3度のバースト区間があるが、現在はバースト期間ではないとともに、反転状態が存在しないと判定する。そのため、時系列データパタン照合手段11は、図13に示す例では、図14に示す時系列パタン対応表から時系列パタンID「07」を抽出する。
図15は、時系列パタン・有効期間対応表記憶手段14が記憶する時系列パタン・有効期間対応表の具体例を示す説明図である。有効期間判定手段13(有効期間判定手段13Aである場合もある)は、図15に示す時系列パタン・有効期間対応表を用いて、時系列データの有効期間を求める。
例えば、有効期間判定手段13は、図10に示す例では、図15に示す時系列パタン・有効期間対応表から、時系列ID「03」に対応する有効期間「反転後の期間」を抽出する。また、有効期間判定手段13は、有効期間「反転後の期間」に従って、図10に示す2003年以降のデータを有効期間時系列データとして抽出する。
また、例えば、有効期間判定手段13は、図11に示す例では、図15に示す時系列パタン・有効期間対応表から、時系列ID「01」に対応する有効期間「全期間」を抽出する。また、有効期間判定手段13は、有効期間「全期間」に従って、図11に示す全データを有効期間時系列データとする。
また、例えば、有効期間判定手段13は、図12に示す例では、図15に示す時系列パタン・有効期間対応表から、時系列ID「02」に対応する有効期間「なし」を抽出する。なお、この場合、時系列データ中に有効期間がない場合であるので、有効期間時系列データはない。また、有効期間「なし」である場合であっても、有効期間の補足情報として変化タイプを求めるようにすれば、「炎上型」等の時系列データの変化の傾向をユーザが認識できるようにすることができる。
また、例えば、有効期間判定手段13は、図13に示す例では、図15に示す時系列パタン・有効期間対応表から、時系列ID「07」に対応する有効期間「全期間」を抽出する。また、有効期間判定手段13は、有効期間「全期間」に従って、図13に示す全データを有効期間時系列データとする。
また、第3の実施の形態又は第4の実施の形態の場合、情報分析システムは、変化タイプ判定手段16及び時系列パタン・変化タイプ対応表記憶手段17を備える。図16は、時系列パタン・変化タイプ対応表記憶手段17が記憶する時系列パタン・変化タイプ対応表の具体例を示す説明図である。変化タイプ判定手段16は、図16に示す時系列パタン・変化タイプ対応表を用いて、時系列データの変化タイプを求める。
例えば、変化タイプ判定手段16は、図10に示す例では、図16に示す時系列パタン・変化タイプ対応表から、時系列ID「03」に対応する変化タイプ「反転型」を抽出する。また、例えば、変化タイプ判定手段16は、図11に示す例では、図16に示す時系列パタン・変化タイプ対応表から、時系列ID「01」に対応する変化タイプ「一定型」を抽出する。また、例えば、変化タイプ判定手段16は、図12に示す例では、図16に示す時系列パタン・変化タイプ対応表から、時系列ID「02」に対応する変化タイプ「炎上型」を抽出する。また、例えば、変化タイプ判定手段16は、図13に示す例では、図16に示す時系列パタン・変化タイプ対応表から、時系列ID「07」に対応する変化タイプ「周期イベント型」を抽出する。
なお、第1の実施の形態の場合、求めた「反転後の期間」、「全期間」又は「なし」等の有効期間や、有効期間時系列データがディスプレイ装置に表示される。また、第3の実施の形態の場合、さらに「反転型」や「一定型」、「炎上型」、「周期イベント型」等の変化タイプがディスプレイ装置に表示される。
また、第2の実施の形態の場合、信頼度計算手段15は、有効期間時系列データに基づいて有効期間信頼度を求める。この場合、信頼度計算手段15は、例えば、時系列データ{Xi|i=1,2,...,N}に対して、情報発信者の熟知度や、肯定意見/否定意見の度合いを用いて信頼度F({Xi})を計算する(非特許文献1参照)。
さらに、第4の実施の形態の場合、信頼度計算手段15Aは、有効期間時系列データに基づいて、変化タイプ・信頼度重み対応表記憶手段18が記憶する変化タイプ・信頼度重み対応表を用いて、有効期間変化タイプ信頼度を求める。図17は、変化タイプ・信頼度重み対応表記憶手段18が記憶する変化タイプ・信頼度重み対応表の具体例を示す説明図である。信頼度計算手段15Aは、有効期間変化タイプ信頼度を求める際に、図17に示す変化タイプ・信頼度重み対応表を用いて、信頼度重み係数wを求める。そして、信頼度計算手段15Aは、有効期間信頼度と信頼度重み係数との積(w×F({Xi}))を計算することによって、有効期間変化タイプ信頼度を求める。
例えば、信頼度計算手段15Aは、図10に示す例では、図17に示す時系列パタン・変化タイプ対応表から、変化タイプ「反転型」に対応する信頼度重み係数「0.5」を抽出する。変化タイプを考慮しないで求めた有効期間信頼度F({Xi})が70であったとすると、信頼度計算手段15Aは、抽出した信頼度重み係数「0.5」と有効期間信頼度「70」との積を求めることによって、有効期間変化タイプ信頼度「35」を求める。
また、同様に、例えば、信頼度計算手段15Aは、図11に示す例では、図17に示す時系列パタン・変化タイプ対応表から、変化タイプ「一定型」に対応する信頼度重み係数「1.0」を抽出する。そして、信頼度計算手段15Aは、抽出した信頼度重み係数「1.0」と有効期間信頼度との積を求めることによって、有効期間変化タイプ信頼度を求める。
また、同様に、例えば、信頼度計算手段15Aは、図13に示す例では、図17に示す時系列パタン・変化タイプ対応表から、変化タイプ「周期イベント型」に対応する信頼度重み係数「0.8」を抽出する。そして、信頼度計算手段15Aは、抽出した信頼度重み係数「0.8」と有効期間信頼度との積を求めることによって、有効期間変化タイプ信頼度を求める。
なお、図12に示す例では、有効期間「なし」である場合であるので、有効期間時系列データが抽出されない。そのため、信頼度計算手段15Aは、有効期間変化タイプ信頼度は算出することができず、信頼度を判定不能と判断する。
また、本実施例では、図14に示す時系列パタン対応表を用いて、バースト状態判定と反転状態判定とを行うことによって時系列パタンを特定する場合を示したが、時系列パタンの特定の仕方は、本実施例で示したものに限られない。例えば、本実施例で示した各状態判定のうち、バースト状態判定及び反転状態判定に加えて、発散状態であるか否かを判定する発散状態判定、発信量維持状態であるか否かを判定する発信量維持状態判定、肯否平衡状態であるか否かを判定する肯否平衡状態判定、肯定優勢状態であるか否かを判定する肯定優勢状態判定、肯定化状態であるか否かを判定する肯定化状態判定、否定優勢状態であるか否かを判定する否定優勢状態判定、及び否定化状態であるか否かを判定する否定化状態判定を用いて、時系列パタンを特定してもよい。
図18は、バースト状態判定及び反転状態判定に加えて、発散状態判定、発信量維持状態判定、肯否平衡状態判定、肯定優勢状態判定、肯定化状態判定、否定優勢状態判定、及び否定化状態判定を用いた時系列パタン対応表の具体例を示す説明図である。なお、図18には、時系列パタンIDの各欄にそれぞれ時系列パタンに対応する変化タイプ(時系列パタンIDの各欄の括弧書き参照)も示されている。
図18に示す時系列パタン対応表を用いる場合、時系列データパタン照合手段11は、式(1)の条件式を用いて、時系列データ中にバースト状態である期間(バースト期間)が存在するか否か及びバースト期間が何回存在するか(第1条件)、現在もバースト期間であるか否か(第2条件)を判断する。また、時系列データパタン照合手段11は、式(14)の条件式を用いて、時系列データ中に発散状態が存在するか否か(第2条件)を判断する。
また、図18に示す時系列パタン対応表を用いる場合、時系列データパタン照合手段11は、式(12)の条件式を用いて、時系列データ中に反転状態が存在するか否か(第3条件)を判断する。また、時系列データパタン照合手段11は、式(6)の条件式を用いて、時系列データ全体又は一部が発信量維持状態に該当するか否か(第3条件)を判断する。
また、図18に示す時系列パタン対応表を用いる場合、時系列データパタン照合手段11は、式(13)の条件式を用いて、時系列データが肯否平衡状態に該当するか否か(第4条件)を判定する。また、時系列データパタン照合手段11は、式(7)の条件式を用いて、肯定優勢状態であるか否か(第4条件)を判定する。また、時系列データパタン照合手段11は、式(10)の条件式を用いて、肯定化状態であるか否か(第4条件)を判定する。また、時系列データパタン照合手段11は、式(8)の条件式を用いて、否定優勢状態であるか否か(第4条件)を判定する。また、時系列データパタン照合手段11は、式(11)の条件式を用いて、否定化状態であるか否か(第4条件)を判定する。
また、情報分析システムは、上記の各処理で求めた信頼度や、有効期間、有効期間時系列データ、変化タイプを提示(表示)する。この場合、情報分析システムは、変化タイプについて、「一定型」や「反転型」のような分類名で表示してもよいし、図10〜図13に示す時系列データの集計結果に基づいて、肯定意見と否定意見との数を時系列にグラフ表示してもよい。
本発明は、インターネットを介して収集した情報の信頼性を評価する情報分析システムや情報分析装置の用途に適用できる。また、本発明は、情報分析装置をコンピュータを用いて実現するためのプログラムの用途に適用できる。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。

Claims (15)

  1. 記憶装置又はネットワークから、ある命題に対する発信情報を読み出し、前記ある命題に対する肯定度と前記肯定度に対応するタイムスタンプとを少なくとも含む組の時系列データを出力する入力装置と
    出力装置と、
    前記入力装置から出力される前記時系列データを入力し、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて、前記時系列データに関する時系列パタンを特定する時系列パタン特定手段と、
    前記時系列パタン特定手段で特定された前記時系列パタンに基づいて、前記入力装置から入力した前記時系列データ内の前記命題に対する有効期間を特定し前記出力装置に出力させる有効期間特定手段と、
    を備えたことを特徴とする情報分析システム。
  2. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析システム。
  3. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析システム。
  4. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析システム。
  5. 前記有効期間特定手段が特定する前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算する有効期間信頼度算出手段を、さらに備えたことを特徴とする請求項ないし請求項のいずれか1項に記載の情報分析システム。
  6. 入力装置が、記憶装置又はネットワークから、ある命題に対する発信情報を読み出し、前記ある命題に対する肯定度と前記肯定度に対応するタイムスタンプとを少なくとも含む組の時系列データを出力し
    時系列パタン特定手段が、前記入力装置から前記時系列データを入力し、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて前記時系列データに関する時系列パタンを特定し、
    有効期間特定手段が、前記時系列パタン特定手段で特定された前記時系列パタンに基づいて、前記入力装置から入力した前記時系列データ内の前記命題に対する有効期間を特定し出力装置に出力させる、ことを特徴とする情報分析方法。
  7. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析方法。
  8. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析方法。
  9. 前記時系列パタン特定手段は、前記入力装置から入力した前記時系列データに関する時系列パタンを特定するにあたり、前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する、ことを特徴とする請求項記載の情報分析方法。
  10. 有効期間信頼度算出手段が、前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算する、ことを特徴とする請求項ないし請求項のいずれか1項に記載の情報分析方法。
  11. コンピュータに、
    記憶装置又はネットワークから、ある命題に対する発信情報を読み出し、前記ある命題に対する肯定度と前記肯定度に対応するタイムスタンプとを少なくとも含む組の時系列データを出力する入力装置から、前記時系列データを入力し、前記時系列データにおける、時間区間毎のデータ総数の時間変化、時間区間毎の肯定度の平均の時間変化、時間区間毎の肯定度の分散の時間変化のうちのいずれか1つ以上の指標に基づいて、前記時系列データに関する時系列パタンを特定する時系列パタン特定処理と、
    前記時系列パタン特定処理で特定された時系列パタンに基づいて、前記入力装置から入力した前記時系列データ内の前記命題に対する有効期間を特定し出力装置に出力させる有効期間特定処理と、
    を実行させる情報分析用プログラム。
  12. 前記コンピュータに、
    前記時系列パタン特定処理において、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎のデータ総数が短期間に増加するバースト状態となっているかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させる請求項11記載の情報分析用プログラム。
  13. 前記コンピュータに、
    前記時系列パタン特定処理において、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎の肯定度の平均値が、否定側の値から肯定側の値に変化する、または、肯定側の値から否定側の値に変化する反転状態を、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させる請求項11記載の情報分析用プログラム。
  14. 前記コンピュータに、
    前記時系列パタン特定処理において、前記入力装置から入力した前記時系列データ内において、前記時系列データの時間区間毎の肯定度の分散値が、事前に規定された第1の閾値を上回る発散状態、または、事前に規定された第2の閾値を下回る収束状態にあるかどうかを、さらに調べることにより、前記時系列データに関する時系列パタンを特定する処理を実行させる請求項11記載の情報分析用プログラム。
  15. 前記コンピュータに、
    前記有効期間特定処理が特定する前記有効期間に含まれている前記時系列データを抽出し、前記抽出した有効期間に含まれている時系列データに対して、信頼度を計算する有効期間信頼度算出処理を実行させる請求項11ないし請求項14のいずれか1項に記載の情報分析用プログラム。
JP2009512986A 2007-04-27 2008-04-25 情報分析システム、情報分析方法及び情報分析用プログラム Active JP5218401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009512986A JP5218401B2 (ja) 2007-04-27 2008-04-25 情報分析システム、情報分析方法及び情報分析用プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007119039 2007-04-27
JP2007119039 2007-04-27
JP2009512986A JP5218401B2 (ja) 2007-04-27 2008-04-25 情報分析システム、情報分析方法及び情報分析用プログラム
PCT/JP2008/058093 WO2008136421A1 (ja) 2007-04-27 2008-04-25 情報分析システム、情報分析方法及び情報分析用プログラム

Publications (2)

Publication Number Publication Date
JPWO2008136421A1 JPWO2008136421A1 (ja) 2010-07-29
JP5218401B2 true JP5218401B2 (ja) 2013-06-26

Family

ID=39943528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009512986A Active JP5218401B2 (ja) 2007-04-27 2008-04-25 情報分析システム、情報分析方法及び情報分析用プログラム

Country Status (3)

Country Link
US (1) US8521674B2 (ja)
JP (1) JP5218401B2 (ja)
WO (1) WO2008136421A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5387577B2 (ja) * 2008-09-25 2014-01-15 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
JP2010191750A (ja) * 2009-02-19 2010-09-02 Nec Corp 意見表示装置、意見表示方法およびプログラム
US9104761B2 (en) * 2009-11-25 2015-08-11 Nec Corporation Document analysis device, document analysis method, and computer readable recording medium
JP6032467B2 (ja) * 2012-06-18 2016-11-30 株式会社日立製作所 時空間データ管理システム、時空間データ管理方法、及びそのプログラム
US20160162582A1 (en) * 2014-12-09 2016-06-09 Moodwire, Inc. Method and system for conducting an opinion search engine and a display thereof
KR102298985B1 (ko) * 2014-12-18 2021-09-09 재단법인 포항산업과학연구원 데이터의 정보량 패턴 추출 장치 및 방법
US20180081966A1 (en) * 2015-03-18 2018-03-22 Nec Corporation Text visualization system, text visualization method, and recording medium
JP6687664B2 (ja) * 2018-04-16 2020-04-28 ファナック株式会社 波形表示装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5638487A (en) * 1994-12-30 1997-06-10 Purespeech, Inc. Automatic speech recognition
US5857173A (en) * 1997-01-30 1999-01-05 Motorola, Inc. Pronunciation measurement device and method
US20030101166A1 (en) 2001-11-26 2003-05-29 Fujitsu Limited Information analyzing method and system
CN1453767A (zh) * 2002-04-26 2003-11-05 日本先锋公司 语音识别装置以及语音识别方法
US7082394B2 (en) * 2002-06-25 2006-07-25 Microsoft Corporation Noise-robust feature extraction using multi-layer principal component analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200600726006; 霜田 雄一: 'Blogを用いた世論調査に関する研究' 情報処理学会研究報告 Vol.2006 No.59 第2006巻 第59号, 20060531, p.61-68, 社団法人情報処理学会 *
CSNG200700484002; 伊藤 聖修: 'ファインダビリティに基づく意見形成ダイナミクス' 第77回 知識ベースシステム研究会資料 (SIG-KBS-A604) , 20070329, p.7-11, 社団法人人工知能学会 *
JPN6012032608; 霜田 雄一: 'Blogを用いた世論調査に関する研究' 情報処理学会研究報告 Vol.2006 No.59 第2006巻 第59号, 20060531, p.61-68, 社団法人情報処理学会 *
JPN6012032609; 伊藤 聖修: 'ファインダビリティに基づく意見形成ダイナミクス' 第77回 知識ベースシステム研究会資料 (SIG-KBS-A604) , 20070329, p.7-11, 社団法人人工知能学会 *

Also Published As

Publication number Publication date
US20100076990A1 (en) 2010-03-25
US8521674B2 (en) 2013-08-27
WO2008136421A1 (ja) 2008-11-13
JPWO2008136421A1 (ja) 2010-07-29

Similar Documents

Publication Publication Date Title
JP5218401B2 (ja) 情報分析システム、情報分析方法及び情報分析用プログラム
Huq Constitutional rights in the machine-learning state
US20160364392A1 (en) Method and system for scoring credibility of information sources
WO2010035455A1 (ja) 情報分析装置、情報分析方法、及びプログラム
CN116342259A (zh) 一种用户信用自动评级方法、装置、电子设备及介质
Turri et al. Actionability judgments cause knowledge judgments
Alahmadi et al. Using internet activity profiling for insider-threat detection
KR20130092310A (ko) 상품 추천 시스템
US11268883B2 (en) Data processing device and data processing method
Andrews et al. The spatial structure of party competition: Party dispersion within a finite policy space
AlMansour et al. A model for recalibrating credibility in different contexts and languages-a twitter case study
JPWO2011065295A1 (ja) 評判分析装置、評判分析方法、および評判分析用プログラム
JP5622969B1 (ja) 文書分析システム、文書分析方法、および、文書分析プログラム
Lindenfors et al. Investigating sequences in ordinal data: A new approach with adapted evolutionary models
Walther et al. Government termination in Europe: a sensitivity analysis
US20180276685A1 (en) Remote Supervision of Client Device Activity
Pedersen People analytics and individual autonomy: employing predictive algorithms as omniscient gatekeepers in the digital age workplace
JPWO2009051261A1 (ja) 情報影響力評価方法、情報影響力評価システム及び情報影響力評価用プログラム
Cushing Detecting netflix service outages through analysis of twitter posts
JP5609292B2 (ja) 意見分析装置、意見分析方法、および意見分析用プログラム
Li et al. Certainty-based preference completion
KR20190104745A (ko) 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체
US10846295B1 (en) Semantic analysis system for ranking search results
US20240143608A1 (en) Semantic analysis system for ranking search results
Ramonaitė Analyzing Electoral Behavior Using PTV’s: Benefits and Methodological Issues

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5218401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150