JP5136910B2 - 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム - Google Patents

情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム Download PDF

Info

Publication number
JP5136910B2
JP5136910B2 JP2009551591A JP2009551591A JP5136910B2 JP 5136910 B2 JP5136910 B2 JP 5136910B2 JP 2009551591 A JP2009551591 A JP 2009551591A JP 2009551591 A JP2009551591 A JP 2009551591A JP 5136910 B2 JP5136910 B2 JP 5136910B2
Authority
JP
Japan
Prior art keywords
expression
evaluation target
reliability
information analysis
target expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009551591A
Other languages
English (en)
Other versions
JPWO2009096506A1 (ja
Inventor
真一 安藤
聡 中澤
俊夫 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009551591A priority Critical patent/JP5136910B2/ja
Publication of JPWO2009096506A1 publication Critical patent/JPWO2009096506A1/ja
Application granted granted Critical
Publication of JP5136910B2 publication Critical patent/JP5136910B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報の信頼性を評価する情報分析装置、情報分析方法及び情報分析用プログラム、及び検索システムに関する。
近年、インターネット上のWebページや電子掲示板等を介して、大量の情報が世の中に流通している。そのため、一般のユーザにとっては、インターネット上のどの情報を信頼することができ、どの情報を信頼することができないかを判別することが困難になってきている。
例えば、「緑茶は癌に効く」や「冥王星は惑星である」といった命題を1つ取り上げた場合、インターネット上にはその命題に関する多種多様な記事や解説、意見といった賛否両論の情報が大量に流通している。そのため、ユーザは、そのような情報を広く参照することで、当該命題の信頼性を判断することができる。しかし、それらの情報の一部を参照するだけでは判断に偏りが生じる可能性を排除できず、かといってユーザが全ての情報に目を通すことも現実的には非常に困難である。特に、時間経過によってその情報の信頼性が変動する場合には、この傾向はいっそう強くなる。
例えば「冥王星は惑星である」という命題は、2006年に惑星の定義が変更されたことによって、その真偽が変化している。そのため、いつの時点の情報を参照するかによって、ユーザの判断が異なってしまう危険性がある。
ここで、インターネット上の情報の信頼性を評価する関連技術が、例えば、非特許文献1に記載されている。非特許文献1に記載された関連技術によれば、特定の命題を含む大量のWeb文書を、その文書の発信者や、その文書に対する賛否に関する意見、その根拠といった意味内容に基づいて分類整理し提示することによって、その命題に対するユーザの信頼性判断を支援する技術が開示されている。
また、インターネット上の記事やブログ、電子メール等には多くの場合、作成日時や発信日時等の時間情報が付与されている。そこで、そうしたインターネット上の情報から着目する命題が記述された文書を抽出し、抽出した文書を各文書毎に付与されている時間情報に基づいて整理することによって、着目する命題の出現時期や出現回数を提示する技術が存在する。例えば、非特許文献2には、収集したブログ全体において特定の話題語が出現した回数の時系列変化を抽出し表示する方法が記載されている。
H. Miyamori, et. al., "Evaluation Data and Prototype System WISDOM for Information Credibility Analysis", In Proc. of First International Symposium on Universal Communication, pp.234-237 (2007) 南野朋之,鈴木泰裕,藤木稔明,奥村学,「blogの自動収集と監視」,人工知能学会論文誌,Vol.19,No.6,pp.511-520,2004年
しかし、非特許文献1や非特許文献2に記載された関連技術を用いたとしても、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができないという問題点がある。その理由は、非特許文献1に記載された関連技術では、基本的に、時間経過による信頼性の変動を考慮していないためである。また、非特許文献2に記載された時間経過による変動を扱う関連技術を用いたとしても、単に分析対象となる言語表現の出現回数に関する時系列変化を提示できるにすぎず、その出現回数の増加/減少といった時系列変化が必ずしも信頼性を反映していないためである。
例えば、ある命題に対応する言語表現の出現回数について減少傾向が観測できた場合を考える。この場合、非特許文献1や非特許文献2に記載された関連技術を用いたとしても、その命題が否定されたことによって出現回数が減少しているのか、それともその命題が一般的な事実として世の中に受け入れられたために取り上げられなくなっただけなのかを区別することができない。
また、ある種の命題については特定の条件下でのみ真となるような命題が存在するが、このような命題についても単に分析対象となる言語表現の出現回数を観測するだけでは、この特定の条件下でのみ真となる現象を捉えることができない。
本発明の典型的(exemplary)な目的は、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができる情報分析装置、情報分析方法及び情報分析用プログラムを提供することにある。
本発明による典型的(exemplary)な情報分析装置は、評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成する関連表現生成部と、
複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する信頼度算出部とを
備えたことを特徴とする。
本発明による典型的(exemplary)な情報分析方法は、評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成し、
複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する
ことを特徴とする。
本発明による典型的(exemplary)な情報分析用プログラムは、コンピュータに、
評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成する関連表現生成処理と、
複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する信頼度算出処理とを
実行させるためのものである。
本発明によれば、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができる。
本発明による情報分析装置の構成の一例を示すブロック図である。 情報分析装置が情報を分析する処理の一例を示すフローチャートである。 第2の実施形態における情報分析装置の構成の一例を示すブロック図である。 文書記憶部が格納する文書の例を示す説明図である。 文書記憶部を検索した結果を時系列的にプロットした結果の例を示す説明図である。 文書記憶部を検索した結果を時系列的にプロットした結果の他の例を示す説明図である。 情報分析装置の最小の構成例を示すブロック図である。 本発明による検索システムの構成を示すブロック図である。
符号の説明
10 入力装置
20,50 データ処理装置
30 記憶装置
40 出力装置
60 情報分析用プログラム
21 関連表現生成部
22 信頼度算出部
31,32 文書記憶部
実施形態1.
以下、本発明の典型的(exemplary)な第1の実施形態について図面を参照して説明する。本発明は、分析対象となる言語表現の特定の時点における信頼性を評価する情報分析方式を用いた情報分析装置に関する。
本実施形態において、情報分析装置は、評価対象の言語表現である評価対象表現を入力として受け付け、評価対象表現に関連する言語表現を関連表現として生成する関連表現生成部を備える。また、情報分析装置は、複数の文書(電子文書)から評価対象表現と関連表現との各々を時間情報付きで取得し、両者の同時期の出現回数を比較することによって、特定の時点における評価対象表現の意味内容に関する信頼度を算出する信頼度算出部を備える。
上記のような構成を採用し、情報分析装置は、単に分析対象となる評価対象表現の各時点における出現回数だけでなく、当該評価対象表現と相関して出現する関連表現の各時点における出現回数を考慮して信頼度を算出する。そのようにすることによって、当該言語表現の特定の時点における信頼性を適切に評価することができる。
図1は、本発明による情報分析装置の第1の実施形態の構成の一例を示すブロック図である。図1に示すように、情報分析装置は、入力装置10、データ処理装置20、記憶装置30及び出力装置40を含む。本実施形態の情報分析装置は、専用IC等のハードウェアで構成しているが、後述する第2の実施形態で述べるように、プログラムに従って動作するコンピュータ等の情報処理装置によってソフトウェアでその機能を実現することもできる。
図1に示す情報分析装置において、入力装置10は、ユーザの入力を受け付ける装置であり、具体的には、キーボードやマウス等の入力デバイスによって実現される。記憶装置30は、各種情報を記憶する装置であり、具体的には、磁気ディスク装置や光ディスク装置等の記憶媒体によって実現される。出力装置40は、処理結果をユーザに出力する装置であり、具体的には、ディスプレイ装置や印刷装置等の出力デバイスによって実現される。
記憶装置30は、文書記憶部31を含む。
文書記憶部31は、例えばインターネット上の記事やブログといった文書データを時間情報とともに格納する。典型的には、文書データに対して、その文書が発信された日時や作成された日時が時間情報として文書単位に付与されているものとする。また、時間情報は、文書データ内の特定の部分に対して付与されていてもよい。例えば、ある文書データ内の「2008年1月10日に○○社は〜と発表した」という言語表現部分に対して、「2008年1月10日」という時間情報が付与されていてもよい。記憶装置の文書記憶部は、必ずしも情報分析装置内部で文書を保持する必要はない。文書に対するアクセス手段さえ提供されれば、実際の文書は、情報分析装置の内部に保持されず、外部に保持されるものでもよい。例えば、記憶装置の替わりに、インターネット上のブログをキーワードや日時を指定して検索するブログ検索エンジンを用いてもよい。
データ処理装置20は、関連表現生成部21と、信頼度算出部22とを含む。
関連表現生成部21は、命題としてその信頼性を評価したい言語表現である評価対象表現を、入力として入力装置10から受け付ける機能を備える。また、関連表現生成部21は、入力された評価対象表現に関連する言語表現を関連表現として生成する機能を備える。
ここで、関連表現として、例えば、入力された評価対象表現に対立する言語表現や、文書記憶部31に記憶された文書の中で評価対象表現と共起する言語表現を用いることができる。
このような機能を備えることにより、関連表現生成部21は、例えば、評価対象表現に対して意味が対立する表現を関連表現として生成する。また、関連表現生成部21は、例えば、複数の電子文書を参照して評価対象表現と共起する表現を関連表現として生成する。
信頼度算出部22は、入力された評価対象表現と関連表現生成部21が生成した関連表現との各々に対応する検索結果を、時間情報付きで文書記憶部31から取得(抽出)する機能を備える。また、信頼度算出部22は、当該時間情報に基づいて、評価対象表現と関連表現との両者の同時期の出現回数を比較することによって、特定の時点における評価対象表現の意味内容の真偽に関する信頼度を算出する機能を備える。
このような機能を備えることにより、信頼度算出部22は、複数の電子文書から評価対象表現と関連表現とをそれぞれ時刻情報付きで取得し、取得した評価対象表現と関連表現との同時期の出現回数を比較することによって、特定の時点における評価対象表現の意味内容に関する信頼度を算出する。
ここで、信頼度を算出する対象となる特定の時点は、典型的には、現時点もしくは過去の時点である。しかし、予測等によって評価対象表現と関連表現との出現回数が得られる場合には、特定の時点は未来の時点であってもよい。また、信頼度算出部22は、信頼度を、例えば、評価対象表現と関連表現との各時点における出現回数の差分に基づいて計算したり、評価対象表現と関連表現との各時点における出現回数の変化分の差分に基づいて計算したりする。
また、信頼度算出部22は、複数の電子文書から評価対象表現と関連表現とをそれぞれ時刻情報付きで取得し、取得した評価対象表現と関連表現との同時期の出現回数の変化傾向を比較することによって、特定の時点における評価対象表現の信頼度を調整する機能を備える。
例えば、信頼度算出部22は、評価対象表現の増加傾向と関連表現の減少傾向とが同時期に観測される場合に、当該評価対象表現の増加傾向と当該関連表現の減少傾向とが同時期に観測される時点又は当該時点以降における評価対象表現の信頼度を増加させることによって、信頼度を調整する。また、例えば、信頼度算出部22は、評価対象表現の減少傾向と関連表現の増加傾向とが同時期に観測される場合に、当該評価対象表現の減少傾向と当該関連表現の増加傾向とが同時期に観測される時点又は当該時点以降における評価対象表現の信頼度を減少させることによって、信頼度を調整する。
信頼度算出部22は、各時点における評価対象表現と関連表現との出現回数の比に従って、それぞれ各時点における評価対象表現の信頼度を調整する機能を備えてもよい。また、信頼度算出部22は、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との著者が一致する割合を算出し、算出した著者が一致する割合に応じて、評価対象表現の信頼度を調整する機能を備えてもよい。さらに、信頼度算出部22は、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との出典が一致する割合を算出し、算出した出典が一致する割合に応じて、評価対象表現の信頼度を調整する機能を備えてもよい。
次に、動作について説明する。図2は、情報分析装置が情報を分析する処理の一例を示すフローチャートである。関連表現生成部21は、まず、入力装置10から評価対象表現の入力を受け付ける(図2に示すステップA1)。ここで、例えば、関連表現生成部21は、ユーザの操作に従って、評価対象表現の入力を受け付ける。関連表現生成部21は、他の装置が出力する評価対象表現を入力として受け付けてもよい。次いで、関連表現生成部21は、入力された評価対象表現に関連する言語表現を関連表現として生成する(図2に示すステップA2)。ここで、関連表現生成部21は、複数の関連表現が生成できる場合には、それら全ての関連表現を生成するものとする。
なお、関連表現生成部21が生成する関連表現としては、1つに入力された評価対象表現に対立する言語表現がある。この対立する言語表現は、典型的には入力された評価対象表現に否定表現を加えることで生成することができる。
例えば、「緑茶は癌に効く」という評価対象表現が入力された場合、関連表現生成部21は、この評価対象表現に否定表現「ない」を加え、さらに自然言語生成技術等で一般的に行なわれている活用形の調整を行なうことで、この評価対象表現に対立する言語表現「緑茶は癌に効かない」を生成することができる。また、例えば、関連表現生成部21は、「”A”は必要である」という言語表現に対して否定表現「不」を加えることで「”A”は不必要である」という対立表現を生成することもできるし、さらに言語表現「必要」と言語表現「不要」は対立する表現であるという言語表現間の知識を利用して「”A”は不要である」という対立表現を生成してもよい。
また、関連表現生成部21は、関連表現として、評価対象表現と共起しやすい表現を生成してもよい。この共起しやすい言語表現を生成する場合、関連表現生成部21は、典型的には、入力された評価対象表現に基づいて文書記憶部31が記憶する文書を検索し、得られた検索結果の中で評価対象表現の近くに現れる命題部分を抽出する。そして、関連表現生成部21は、この抽出した命題部分に基づいて、共起しやすい言語表現を生成することができる。
例えば、「耐震ジェルは効果がある」という評価対象表現が入力され、関連表現生成部21は、この入力された評価対象表現に基づいて文書記憶部31から、「突っ張り棒と併用すると耐震ジェルは地震対策として効果がある」という言語表現を含む文書を検索したとする。この場合、関連表現生成部21は、この検索結果中で評価対象表現の近傍に現れる命題部分「突っ張り棒と併用する」を抽出する。そして、関連表現生成部21は、言語生成技術等で一般的に行なわれている活用形の調整を行なうことで、この評価対象表現に共起する言語表現「突っ張り棒と併用する」を生成することができる。
次に、信頼度算出部22は、入力された評価対象表現に基づいて文書記憶部31を検索し、評価対象表現を含む検索結果を時間情報付きで取得(抽出)する(図2に示すステップA3)。次いで、信頼度算出部22は、図2に示すステップA2で生成した関連表現の中から未処理の関連表現を1つ選び出す(図2に示すステップA4)。
そして、信頼度算出部22は、未処理の関連表現が得られたか否か(すなわち、未処理の関連表現が存在するか否か)を調べる(図2に示すステップA5)。未処理の関連表現が得られたと判断した場合には、信頼度算出部22は、その関連表現に基づいて文書記憶部31を検索して、当該関連表現を含む検索結果を時間情報付きで取得(抽出)する(図2に示すステップA6)。
さらに、信頼度算出部22は、評価対象表現と関連表現との出現回数やその時間変化傾向を比較する(図2に示すステップA7)。そして、信頼度算出部22は、その比較結果に従って、各時点における信頼度を算出し、信頼度の値を調整する(図2に示すステップA8)。
ここで、信頼度算出部22は、ある時点における信頼度を、例えば、その時点における評価対象表現の出現回数と関連表現の出現回数との差を計算し、得られた値を正規化することによって算出することができる。
上記のようにして得られた信頼度は、その値が大きいほど評価対象表現に示された内容が信頼できることを意味する。また、この信頼度の値がマイナスになる場合には、その評価対象表現に記された内容が信頼できないことを意味する。さらに、この信頼度の値が0である場合には、その評価対象表現に記された内容が信頼できるか否かは不明であり、すなわち、文書記憶部31に格納された文書を判断材料とするだけでは判定できないことを意味する。
また、信頼度算出部22は、ある時点における信頼度を、さらに、例えば、その時点における評価対象表現の出現回数の変化分と関連表現の出現回数の変化分との差を計算し、その差の値を正規化した値を加える等することで調整してもよい。これは、出現回数の差から算出された信頼度が同じ値であっても、評価対象表現が増加傾向にある場合には信頼度が大きくなり、評価対象表現が減少傾向にある場合には信頼度が小さくなることを意味する。ここでは、特に、関連表現の増加/減少傾向と比較して評価対象表現の増加/減少傾向を測ることで、関連する話題全体の増加/減少傾向の影響によって評価対象表現が増加/減少する現象を取り除く効果を期待することもできる。
さらに、信頼度算出部22は、評価対象表現の増加傾向と関連表現の減少傾向とが同時期に観測された場合に、その時点以降の評価対象表現の信頼度がより大きくなるように信頼度を調整してもよい。又は、信頼度算出部22は、評価対象表現の減少傾向と関連表現の増加傾向とが同時期に観測された場合に、その時点以降の評価対象表現の信頼度がより小さくなるように信頼度を調整してもよい。
また、信頼度算出部22は、入力された評価対象表現に共起する言語表現が関連表現生成部21によって関連表現として生成された場合には、ある時点における信頼度を、その時点における評価対象表現と関連表現との出現回数の比に応じて調整してもよい。例えば、信頼度算出部22は、この比の値が大きい場合には信頼度を小さくし、この比の値が小さい場合には信頼度を大きくするように調整すればよい。
さらに、信頼度算出部22は、評価対象表現と関連表現との著者や出典が一致する場合には、その関連表現が評価対象表現との相関性が非常に強いと見なして、当該関連表現による信頼度の調整幅を大きくするように構成してもよい。
次いで、信頼度算出部22は、各時点毎の信頼度を調整した後、図2に示すステップA5に戻って処理を継続する。この場合、信頼度算出部22は、全ての関連表現について処理を終了するまで、ステップA6〜A8の処理を繰り返し実行する。
図2に示すステップA5において未処理の関連表現がない場合には(すなわち、全ての関連表現について処理を終了した場合には)、信頼度算出部22は、算出した信頼度を出力装置4に出力させて(図2に示すステップA9)、処理を終了する。
ここで、信頼度の出力方法については、信頼度算出部22は、ユーザが指定した時点の信頼度を出力装置4に出力させるように構成してもよいし、ある期間の信頼度の時系列変化をグラフの形で出力装置4に出力させるように構成してもよい。また、信頼度算出部22は、信頼度を直接ユーザに提示するのではなく、信頼度が大きく変化する要因になった関連情報を提示(例えば、表示)させるように構成してもよい。
以上のように、本実施形態によれば、単に分析対象となる評価対象表現の各時点における出現回数だけでなく、当該評価対象表現と相関して出現する関連表現の各時点における出現回数を考慮して信頼度を算出する。そのため、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができる。
また、本実施形態において、単に特定の時点における信頼度をユーザに提示するのではなく、予め定められた閾値によって各時点において当該評価対象表現が信頼できるか否かを判定し、当該評価対象表現の有効期間を出力するように構成してもよい。
さらに、本実施形態では、各時点で当該評価対象表現と強く相関する関連表現を見つけ出し、その関連表現の存在もしくは時系列的な変化を根拠に信頼度を調整するように構成されている。そのため、信頼度が大きく変化した場合にはその要因となった関連情報をユーザに提示する構成とすることができる。よって、このように構成することによって、的確な情報を与えつつユーザの信頼性判定を支援することもできる。
実施形態2.
次に、本発明の典型的(exemplary)な第2の実施形態について図面を参照して説明する。図3は、第2の実施形態における情報分析装置の構成の一例を示すブロック図である。図3に示すように、本実施形態において、情報分析装置は、第1の実施形態と同様に、入力装置10、データ処理装置50、記憶装置30及び出力装置40を含む。データ処理装置50は、プログラム制御により動作して各種処理を実行する装置であり、具体的には、プログラムを記憶するメモリと、プログラムを実行するCPUとを含む。
ここで、情報分析用プログラム60は、データ処理装置50に読み込まれてデータ処理装置50の動作を制御し、記憶装置30に文書記憶部32を生成する機能を備える。また、データ処理装置50は、情報分析用プログラム60に従った制御により、第1の実施形態で示したデータ処理装置20が実行する処理と同様の処理を実行する機能を備える。
このような機能を備えることによって、本実施形態は、データ処理装置50は、FD(フロッピィディスク)等のフレキシブルディスク、CD−ROM、DVD、フラッシュメモリ等のコンピュータ読み取り可能な情報記録媒体に記憶された情報分析用プログラム60を読み込み、読み込んだ情報分析用プログラム60に従って処理を実行する。例えば、データ処理装置50は、評価対象の言語表現である評価対象表現を入力として受け付け、評価対象表現に関連する言語表現を関連表現として生成する関連表現生成処理と、複数の電子文書から評価対象表現と関連表現とをそれぞれ時刻情報付きで取得し、取得した評価対象表現と関連表現との同時期の出現回数を比較することによって、特定の時点における評価対象表現の意味内容に関する信頼度を算出する信頼度算出処理とを実行させるための情報分析用プログラム60を読み込み、処理を実行する。
次に、本発明の実施例を図面を参照して説明する。なお、本実施例に示す情報分析装置は、第1の実施形態で示した情報分析装置に対応するものである。本実施例において、情報分析装置は、入力装置10としてキーボードを備え、データ処理装置20として中央演算装置(central processing unit)を備える。また、情報分析装置は、記憶装置30として磁気ディスク記録装置、出力装置40として液晶ディスプレイ等のディスプレイを備える。情報分析装置は、情報分析用プログラムに従って動作するコンピュータで構成される。情報分析用プログラムは記憶装置30の一部に記憶されていてもよいし、データ処理装置20が有するメモリに記憶されてもよい。情報分析装置が、ネットワークを介して端末と接続されるサーバーである場合は、入力装置10と出力装置40は端末と通信を行う通信部となり、キーボード、ディスプレイは無くともよい。
データ処理装置20が備える中央演算装置は、関連表現生成部21及び信頼度算出部22として機能する。また、磁気ディスク記憶装置には、文書記憶部31として機能する記憶領域が確保されている。
図4は、文書記憶部31が格納する文書の例を示す説明図である。なお、図4は、文書記憶部31として機能している記憶領域を模式的に表形式で表したものであり、各行が文書記憶部31に格納された1つ1つの文書を表している。図4に示すように、文書記憶部31は、各々の文書と時間情報との組で対応付けて記憶する。図4において、文書記憶部31には、時間情報「2004/10/13」と「冥王星は太陽系の9番目の惑星であるが、」を含む文書との組、時間情報「2005/06/09」と「太陽系の惑星である冥王星は」を含む文書との組、時間情報「2006/09/12」と「冥王星は惑星でないとの結論に達した。」を含む文書との組、時間情報「2006/11/21」と「冥王星は惑星であるという意見も依然根強い。」を含む文書との組、時間情報「2007/04/05」と「冥王星が惑星ではなくなったため、」を含む文書との組等が記憶されている。
例えば、図4に示す例において、1行目は、文書記憶部31に、2004年10月13日に発信された「冥王星は太陽系の第9番目の惑星であるが、」という表現を含む文書が格納されていることを表している。
以下、まず「冥王星は惑星である」という言語表現を評価対象表現として入力した場合を考える。
中央演算装置は、まず、ユーザの操作に従って、「冥王星は惑星である」という言語表現を評価対象表現として受け付ける(キーボードから入力する)。すると、中央演算装置は、この入力された評価対象表現に基づいて、評価対象表現に関連する関連表現を生成する。ここでは、例えば、関連表現として評価対象表現に対立する言語表現を生成する場合を考える。この場合、中央演算装置は、「冥王星は惑星である」という言語表現に否定表現「ない」を付加した後に活用形を調整することで、「冥王星は惑星でない」という関連表現を生成する。
次に、中央演算装置は、評価対象表現「冥王星は惑星である」に基づいて(「冥王星は惑星である」をキーとして)、文書記憶部31を検索する。次に、中央演算装置は、関連表現「冥王星は惑星でない」を未処理の関連表現として取り出し、この関連表現に基づいて(「冥王星は惑星でない」をキーとして)、文書記憶部31を検索する。
ここで、中央演算装置は、検索方法として、単に文字列として評価対象表現や関連表現と完全一致する表現だけを抽出するのではなく、意味的に同じ内容を表している同義表現等が広く取得できる方式を採用して、文書記憶部31を検索してもよい。例えば、中央演算装置は、構文構造として評価対象表現や関連表現と一致する表現や、評価対象表現や関連表現の一部を同義語で言いかえた表現のように、意味的に同じ内容を表している同義表現等が広く取得できる方式を採用してもよい。
図5は、評価対象表現「冥王星は惑星である」と関連表現「冥王星は惑星でない」とに基づいて、文書記憶部31を検索した結果を時系列的にプロットした結果の例を示す説明図である。図5に示す例では、縦軸が言語表現の出現回数を表し、横軸が時間を表している。そして、実線のグラフが評価対象表現「冥王星は惑星である」の検索結果を表し、点線のグラフが関連表現「冥王星は惑星でない」の検索結果を表している。
さらに、中央演算装置は、評価対象表現と関連表現との検索結果に対して、出現回数やその時間変化傾向を比較し、信頼度を計算する。例えば、中央演算装置は、評価対象表現の信頼度を、数式「f(t)=α(t)×((評価対象表現の出現回数)−(関連表現の出現回数))」を用いて計算することができる。ここで、α(t)は、各時点tにおける正規化のための係数を出力する関数である。
また、中央演算装置は、評価対象表現の信頼度を、数式「g(t)=β(t)×((評価対象表現の出現回数の変化分)−(関連表現の出現回数の変化分))」を用いて調整することができる。ここで、β(t)は、各時点tにおける正規化のための係数を出力する関数である。また、この場合、中央演算装置は、調整後の信頼度を、例えば、f(t)とg(t)との重み付き和等を求めることによって計算することができる。
さらに、中央演算装置は、評価対象表現と関連表現との検索結果を比較して、著者もしくは出典が同じものがある場合、その検索結果中の割合に応じて信頼度を調整してもよい。例えば、中央演算装置は、検索結果中の著者や出典が一致するものの割合に応じて、関連表現の出現回数に1以上の値を乗じた値を関連表現の出現回数として、上記に示した各数式に適用してもよい。これは、関連表現がより多く出現したものとみなして信頼度を計算することを意味する。
また、次に、「耐震ジェルは有効である」という言語表現を評価対象表現として入力した場合を考える。
中央演算装置は、まず、ユーザの操作に従って、「耐震ジェルは有効である」という言語表現を評価対象表現として受け付ける(キーボードから入力する)。すると、中央演算装置は、この入力された評価対象表現に基づいて、評価対象表現に関連する関連表現を生成する。ここでは、例えば、関連表現として評価対象表現と共起しやすい表現を生成する場合を考える。
中央演算装置は、まず、評価対象表現「耐震ジェルは有効である」に基づいて(「耐震ジェルは有効である」をキーとして)、文書記憶部31を検索する。ここで、「突っ張り棒と併用すると耐震ジェルは地震対策として効果がある」という言語表現を含む文書が検索されたとすると、中央演算装置は、この検索結果中で評価対象表現の近傍に現れる命題部分「突っ張り棒と併用する」を抽出する。そして、中央演算装置は、抽出した命題部分に対して言語生成技術等で一般的に行なわれている活用形の調整を行なうことで、この評価対象表現に共起する言語表現「突っ張り棒と併用する」を生成する。
次に、中央演算装置は、上記と同様に、評価対象表現「耐震ジェルは有効である」に基づいて、文書記憶部31を検索する。次に、中央演算装置は、図5に示した例と同様の処理を行なって、関連表現「突っ張り棒と併用する」を未処理の関連表現として取り出し、この関連表現に基づいて(「突っ張り棒と併用する」をキーとして)、文書記憶部31を検索する。
図6は、評価対象表現「耐震ジェルは有効である」と関連表現「突っ張り棒と併用する」とに基づいて、文書記憶部31を検索した結果を時系列的にプロットした結果の例を示す説明図である。図6に示す例では、縦軸が言語表現の出現回数を表し、横軸が時間を表している。そして、実線のグラフが評価対象表現「耐震ジェルは有効である」の検索結果を表し、点線のグラフが関連表現「突っ張り棒と併用する」の検索結果を表している。
さらに、中央演算装置は、図5に示した例と同様にして、評価対象表現と関連表現との検索結果に対して、出現回数やその時間変化傾向を比較し、信頼度を計算する。
なお、中央演算装置は、共起しやすい表現を関連表現として利用する際には、特に評価対象表現と関連表現との出現回数の比を計算し、その比の値に応じて信頼度を調整してもよい。例えば、中央演算装置は、評価対象表現と関連表現との出現回数の比の値が予め定められた閾値以上であれば、関連表現の出現回数をより大きな値に置き換えて信頼度を計算してもよい。また、中央演算装置は、その比の値が予め定められた閾値以下であれば、関連表現の出現回数をより小さな値に置き換えて信頼度を計算してもよい。
以上のように、本実施例によれば、中央演算装置は、単に分析対象となる評価対象表現の各時点における出現回数だけでなく、当該評価対象表現と相関して出現する関連表現の各時点における出現回数を考慮して信頼度を算出する。そのため、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができる。
次に、本発明による情報分析装置の最小構成について説明する。図7は、情報分析装置の最小の構成例を示すブロック図である。図7に示すように、情報分析装置は、最小の構成要素として、関連表現生成部21と、信頼度算出部22とを含む。
図7に示す最小構成の情報分析装置において、関連表現生成部21は、評価対象の言語表現である評価対象表現を入力として受け付け、評価対象表現に関連する言語表現を関連表現として生成する機能を備える。また、信頼度算出部22は、複数の電子文書から評価対象表現と関連表現とをそれぞれ時刻情報付きで取得し、取得した評価対象表現と関連表現との同時期の出現回数を比較することによって、特定の時点における評価対象表現の意味内容に関する信頼度を算出する機能を備える。
図7に示す最小構成の情報分析装置によれば、単に分析対象となる評価対象表現の各時点における出現回数だけでなく、当該評価対象表現と相関して出現する関連表現の各時点における出現回数を考慮して信頼度を算出する。そのため、分析対象となる言語表現の特定の時点における信頼性を適切に評価することができる。
以上説明した各実施形態の情報分析装置は情報分析装置を用いて入力した表現で信頼性が高いとされた表現を検索条件として提示する検索システムの用途に適用できる。
図8は、本発明による検索システムの構成を示すブロック図である。図8に示す検索システムは、情報分析装置100と、文書検索部70と、文書出力装置80と、検索対象文書データベース90とを含んでいる。情報分析装置100は図1に示した第1の実施形態の情報分析装置である。図1に示す情報分析装置の替わりに図3に示す情報分析装置を用いてもよい。
文書検索部70は、情報分析装置100から出力する信頼性の高い表現を、検索条件として受け取り、検索対象文書データベース90でアクセス可能な複数の文書の中から、受け取った表現を含んでいる文書を検索する。文書出力装置80は、文書検索部70で検索された文書を出力する。検索対象文書データベース90は、検索対象とする文書集合へのアクセスを可能にするデータベースである。検索対象文書データベース90の構成は、インターネットテキストのような文書集合に対するアクセスを提供するデータベースであってよい。検索対象とする文書集合は検索対象文書データベース90の中に蓄積されていてもよいし、URLのような各文書へのアクセス手段のみが提供され、文書の実体は外部に蓄積されていてもよい。
以上、本発明の代表的な実施形態について説明したが、本発明は、本願の請求の範囲によって規定される、その精神または主要な特徴から逸脱することなく、他の種々の形で実施することができる。そのため、前述した各実施形態は単なる例示にすぎず、限定的に解釈されるべきではない。本発明の範囲は特許請求の範囲によって示すものであって、明細書や要約書の記載には拘束されない。さらに、特許請求の範囲の均等範囲に属する変形や変更はすべて本発明の範囲内のものである。
本願は、2008年1月30日に出願された特願2008−019015号に基づき、優先権の利益を主張するものである。そして、特願2008−019015号の内容は本願の明細書の内容に含まれる。
本発明は、入力された命題の信頼性をインターネット上の情報を用いて評価する情報分析装置の用途に適用できる。また、本発明は、情報分析装置をコンピュータを用いて実現するためのプログラムの用途に適用できる。

Claims (25)

  1. 評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成する関連表現生成部と、
    複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する信頼度算出部とを
    備えたことを特徴とする情報分析装置。
  2. 前記信頼度算出部は、複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数の変化傾向を比較することによって、特定の時点における前記評価対象表現の信頼度を調整する請求項1記載の情報分析装置。
  3. 前記信頼度算出部は、
    前記評価対象表現の増加傾向と前記関連表現の減少傾向とが同時期に観測される場合に、当該評価対象表現の増加傾向と当該関連表現の減少傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を増加させ、
    前記評価対象表現の減少傾向と前記関連表現の増加傾向とが同時期に観測される場合に、当該評価対象表現の減少傾向と当該関連表現の増加傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を減少させる
    請求項2記載の情報分析装置。
  4. 前記関連表現生成部は、評価対象表現に対して意味が対立する表現を関連表現として生成する請求項1から請求項3のうちのいずれか1項に記載の情報分析装置。
  5. 前記関連表現生成部は、複数の電子文書を参照して評価対象表現と共起する表現を関連表現として生成する請求項1から請求項4のうちのいずれか1項に記載の情報分析装置。
  6. 前記信頼度算出部は、各時点における前記評価対象表現と前記関連表現との出現回数の比に従って、それぞれ各時点における前記評価対象表現の信頼度を調整する請求項5記載の情報分析装置。
  7. 前記信頼度算出部は、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との著者が一致する割合を算出し、算出した著者が一致する割合に応じて、前記評価対象表現の信頼度を調整する請求項1から請求項6のうちのいずれか1項に記載の情報分析装置。
  8. 前記信頼度算出部は、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との出典が一致する割合を算出し、算出した出典が一致する割合に応じて、前記評価対象表現の信頼度を調整する請求項1から請求項7のうちのいずれか1項に記載の情報分析装置。
  9. 請求項1から請求項8のいずれか1項に記載の情報分析装置と、該情報分析装置から出力される、信頼度の高い表現を検索条件として、複数の検索対象文書から該表現を含む文書を検索する文書検索部と、
    前記文書検索部で検索された文書を出力する文書出力部とを備えた検索システム。
  10. 評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成し、
    複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する
    ことを特徴とする情報分析方法。
  11. 前記信頼度の算出は、複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数の変化傾向を比較することによって、特定の時点における前記評価対象表現の信頼度を調整することで行う請求項10記載の情報分析方法。
  12. 前記信頼度の算出は、
    前記評価対象表現の増加傾向と前記関連表現の減少傾向とが同時期に観測される場合に、当該評価対象表現の増加傾向と当該関連表現の減少傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を増加させ、
    前記評価対象表現の減少傾向と前記関連表現の増加傾向とが同時期に観測される場合に、当該評価対象表現の減少傾向と当該関連表現の増加傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を減少させることで行う
    請求項11記載の情報分析方法。
  13. 前記関連表現の生成は、評価対象表現に対して意味が対立する表現を関連表現として生成することで行う請求項10から請求項12のうちのいずれか1項に記載の情報分析方法。
  14. 前記関連表現の生成は、複数の電子文書を参照して評価対象表現と共起する表現を関連表現として生成することで行う請求項10から請求項13のうちのいずれか1項に記載の情報分析方法。
  15. 前記信頼度の算出は、各時点における前記評価対象表現と前記関連表現との出現回数の比に従って、それぞれ各時点における前記評価対象表現の信頼度を調整することで行う請求項14記載の情報分析方法。
  16. 前記信頼度の算出は、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との著者が一致する割合を算出し、算出した著者が一致する割合に応じて、前記評価対象表現の信頼度を調整することで行う請求項10から請求項15のうちのいずれか1項に記載の情報分析方法。
  17. 前記信頼度の算出はで、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との出典が一致する割合を算出し、算出した出典が一致する割合に応じて、前記評価対象表現の信頼度を調整することで行う請求項10から請求項16のうちのいずれか1項に記載の情報分析方法。
  18. コンピュータに、
    評価対象の言語表現である評価対象表現を入力として受け付け、前記評価対象表現に関連する言語表現を関連表現として生成する関連表現生成処理と、
    複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数を比較することによって、特定の時点における前記評価対象表現の意味内容に関する信頼度を算出する信頼度算出処理とを
    実行させるための情報分析用プログラム。
  19. コンピュータに、
    前記信頼度算出処理で、複数の電子文書から前記評価対象表現と前記関連表現とをそれぞれ時刻情報付きで取得し、取得した前記評価対象表現と前記関連表現との同時期の出現回数の変化傾向を比較することによって、特定の時点における前記評価対象表現の信頼度を調整する処理を実行させる
    請求項18記載の情報分析用プログラム。
  20. コンピュータに、
    前記信頼度算出処理で、
    前記評価対象表現の増加傾向と前記関連表現の減少傾向とが同時期に観測される場合に、当該評価対象表現の増加傾向と当該関連表現の減少傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を増加させる処理と、
    前記評価対象表現の減少傾向と前記関連表現の増加傾向とが同時期に観測される場合に、当該評価対象表現の減少傾向と当該関連表現の増加傾向とが同時期に観測される時点又は当該時点以降における前記評価対象表現の信頼度を減少させる処理とを実行させる
    請求項19記載の情報分析用プログラム。
  21. コンピュータに、
    前記関連表現生成処理で、評価対象表現に対して意味が対立する表現を関連表現として生成する処理を実行させる
    請求項18から請求項20のうちのいずれか1項に記載の情報分析用プログラム。
  22. コンピュータに、
    前記関連表現生成処理で、複数の電子文書を参照して評価対象表現と共起する表現を関連表現として生成する処理を実行させる
    請求項18から請求項21のうちのいずれか1項に記載の情報分析用プログラム。
  23. コンピュータに、
    前記信頼度算出処理で、各時点における前記評価対象表現と前記関連表現との出現回数の比に従って、それぞれ各時点における前記評価対象表現の信頼度を調整する処理を実行させる
    請求項22記載の情報分析用プログラム。
  24. コンピュータに、
    前記信頼度算出処理で、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との著者が一致する割合を算出し、算出した著者が一致する割合に応じて、前記評価対象表現の信頼度を調整する処理を実行させる
    請求項18から請求項23のうちのいずれか1項に記載の情報分析用プログラム。
  25. コンピュータに、
    前記信頼度算出処理で、複数の電子文書から取得した評価対象表現と関連表現とについて、当該評価対象表現と当該関連表現との出典が一致する割合を算出し、算出した出典が一致する割合に応じて、前記評価対象表現の信頼度を調整する処理を実行させる
    請求項18から請求項24のうちのいずれか1項に記載の情報分析用プログラム。
JP2009551591A 2008-01-30 2009-01-30 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム Expired - Fee Related JP5136910B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009551591A JP5136910B2 (ja) 2008-01-30 2009-01-30 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008019015 2008-01-30
JP2008019015 2008-01-30
JP2009551591A JP5136910B2 (ja) 2008-01-30 2009-01-30 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム
PCT/JP2009/051538 WO2009096506A1 (ja) 2008-01-30 2009-01-30 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム

Publications (2)

Publication Number Publication Date
JPWO2009096506A1 JPWO2009096506A1 (ja) 2011-05-26
JP5136910B2 true JP5136910B2 (ja) 2013-02-06

Family

ID=40912849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009551591A Expired - Fee Related JP5136910B2 (ja) 2008-01-30 2009-01-30 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム

Country Status (3)

Country Link
US (1) US8606810B2 (ja)
JP (1) JP5136910B2 (ja)
WO (1) WO2009096506A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8612202B2 (en) * 2008-09-25 2013-12-17 Nec Corporation Correlation of linguistic expressions in electronic documents with time information
JP5884740B2 (ja) * 2011-02-15 2016-03-15 日本電気株式会社 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム
JP5461475B2 (ja) * 2011-05-26 2014-04-02 日本電信電話株式会社 情報検索方法、情報検索装置及び情報検索プログラム
US8650143B2 (en) 2011-08-30 2014-02-11 Accenture Global Services Limited Determination of document credibility
US10043187B2 (en) * 2016-06-23 2018-08-07 Nice Ltd. System and method for automated root cause investigation
US11809958B2 (en) 2020-06-10 2023-11-07 Capital One Services, Llc Systems and methods for automatic decision-making with user-configured criteria using multi-channel data inputs
CN114154212A (zh) * 2021-11-15 2022-03-08 暨南大学 一种结构可靠性分析方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198866A1 (en) * 2001-03-13 2002-12-26 Reiner Kraft Credibility rating platform
US20040064438A1 (en) * 2002-09-30 2004-04-01 Kostoff Ronald N. Method for data and text mining and literature-based discovery
JP2006048319A (ja) * 2004-08-04 2006-02-16 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
US20070219781A1 (en) * 2006-03-15 2007-09-20 Global Information Research And Technologies Llc Method and system for responding to user-input based on semantic evaluations of user-provided resources
US20090089078A1 (en) * 2007-09-28 2009-04-02 Great-Circle Technologies, Inc. Bundling of automated work flow

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163429A (ja) 1998-11-26 2000-06-16 Hitachi Ltd 情報管理システム
JP2003157271A (ja) 2001-11-20 2003-05-30 Mitsubishi Electric Corp テキストマイニング装置および方法
JP3779935B2 (ja) 2002-04-23 2006-05-31 株式会社ジャストシステム 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP2006092134A (ja) 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 文書情報解析用コンピュータプログラムならびに文書情報解析装置および方法
JP4185059B2 (ja) 2005-02-18 2008-11-19 大日本印刷株式会社 トレンド予測装置およびトレンド予測方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198866A1 (en) * 2001-03-13 2002-12-26 Reiner Kraft Credibility rating platform
US20040064438A1 (en) * 2002-09-30 2004-04-01 Kostoff Ronald N. Method for data and text mining and literature-based discovery
JP2006048319A (ja) * 2004-08-04 2006-02-16 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
US20070219781A1 (en) * 2006-03-15 2007-09-20 Global Information Research And Technologies Llc Method and system for responding to user-input based on semantic evaluations of user-provided resources
US20090089078A1 (en) * 2007-09-28 2009-04-02 Great-Circle Technologies, Inc. Bundling of automated work flow

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
CSNG200300172010; 立石 健二: 'インターネットからの評判情報検索' 情報処理学会研究報告 Vol.2001 No.69 第2001巻, 20010717, 第75-82頁, 社団法人情報処理学会 *
CSNG200501374003; 徳久 良子: '雑談における発話のやりとりと盛り上がりとの関連' 第44回 言語・音声理解と対話処理研究会資料 (SIG-SLUD-A501) 第13-20頁, 20050603, 社団法人人工知能学会 *
CSNG200600726006; 霜田 雄一: 'Blogを用いた世論調査に関する研究' 情報処理学会研究報告 Vol.2006 No.59 第2006巻, 20060531, 第61-68頁, 社団法人情報処理学会 *
CSNG200600940011; 松井 くにお: 'ナレッジマネジメント' 情報処理 第47巻 第8号 第47巻, 20060815, 第893-899頁, 社団法人情報処理学会 *
CSNJ200610068092; 霜田 雄一: 第68回(平成18年)全国大会講演論文集(3) データベースとメディア ネットワーク 第3-191〜3-192頁, 20060307 *
JPN6009011856; 立石 健二: 'インターネットからの評判情報検索' 情報処理学会研究報告 Vol.2001 No.69 第2001巻, 20010717, 第75-82頁, 社団法人情報処理学会 *
JPN6009011858; 徳久 良子: '雑談における発話のやりとりと盛り上がりとの関連' 第44回 言語・音声理解と対話処理研究会資料 (SIG-SLUD-A501) 第13-20頁, 20050603, 社団法人人工知能学会 *
JPN6009011859; 霜田 雄一: 第68回(平成18年)全国大会講演論文集(3) データベースとメディア ネットワーク 第3-191〜3-192頁, 20060307 *
JPN6009011861; 霜田 雄一: 'Blogを用いた世論調査に関する研究' 情報処理学会研究報告 Vol.2006 No.59 第2006巻, 20060531, 第61-68頁, 社団法人情報処理学会 *
JPN6009011863; 松井 くにお: 'ナレッジマネジメント' 情報処理 第47巻 第8号 第47巻, 20060815, 第893-899頁, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
WO2009096506A1 (ja) 2009-08-06
JPWO2009096506A1 (ja) 2011-05-26
US8606810B2 (en) 2013-12-10
US20100312792A1 (en) 2010-12-09

Similar Documents

Publication Publication Date Title
US10102254B2 (en) Confidence ranking of answers based on temporal semantics
WO2009096523A1 (ja) 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
US9558263B2 (en) Identifying and displaying relationships between candidate answers
US9715531B2 (en) Weighting search criteria based on similarities to an ingested corpus in a question and answer (QA) system
JP5136910B2 (ja) 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム
US9430533B2 (en) Machine-assisted search preference evaluation
Zhang et al. Adapted textrank for term extraction: A generic method of improving automatic term extraction algorithms
KR101103766B1 (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
JP6605022B2 (ja) 経験属性による体系化されていないデータのソースの分析、選定、及び取り込みのためのシステム及びプロセス
US9646247B2 (en) Utilizing temporal indicators to weight semantic values
US10282678B2 (en) Automated similarity comparison of model answers versus question answering system output
US11669556B1 (en) Method and system for document retrieval and exploration augmented by knowledge graphs
JP4859779B2 (ja) 有害コンテンツの評価付与装置、プログラム及び方法
JP2023510791A (ja) 意味空間内のベクトル表示にタームをマッピングするためのシステム及び方法
JP5387577B2 (ja) 情報分析装置、情報分析方法、及びプログラム
Wohlgenannt Leveraging and balancing heterogeneous sources of evidence in ontology learning
KR102519955B1 (ko) 토픽 키워드의 추출 장치 및 방법
CN113569044A (zh) 一种基于自然语言处理技术的网页文本内容的分类方法
van Hoof et al. Googling Politics? The Computational Identification of Political and News-related Searches from Web Browser Histories
CN112711695A (zh) 基于内容的搜索建议生成方法及装置
JP2008040985A (ja) 文書情報抽出装置
KR102625347B1 (ko) 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
US20240020476A1 (en) Determining linked spam content
Konstantinovna et al. Text Mining for Conformity Assessment of the Strategy for the State National Policy and Government Websites
Gaba et al. Topic Popularity Prediction Using Similarity Graph on Twitter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121019

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121101

R150 Certificate of patent or registration of utility model

Ref document number: 5136910

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees