JP2001216311A - イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置 - Google Patents

イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Info

Publication number
JP2001216311A
JP2001216311A JP2000023539A JP2000023539A JP2001216311A JP 2001216311 A JP2001216311 A JP 2001216311A JP 2000023539 A JP2000023539 A JP 2000023539A JP 2000023539 A JP2000023539 A JP 2000023539A JP 2001216311 A JP2001216311 A JP 2001216311A
Authority
JP
Japan
Prior art keywords
event
document
trend
word
specific word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000023539A
Other languages
English (en)
Inventor
Atsushi Takato
高藤淳
Katsuhiko Mitobe
水戸部勝彦
Katsuyuki Doi
土居功志
Hiroyuki Mitsuya
三ツ矢浩之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2000023539A priority Critical patent/JP2001216311A/ja
Publication of JP2001216311A publication Critical patent/JP2001216311A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 イベントのデータ分析を容易にし、かつ促進
すること。 【解決手段】 分析すべきイベントとその発生時期をユ
ーザ入力又は文書データからの自動抽出により取得し
(S17)、注目すべき語(句)の文書中での出現回数
の経時的変化を取得し(S21)、イベントと前記経時
的変化とを対応するように表示する(S23)。ユーザ
はイベントとトレンドとを対比して検討することにより
イベントとトレンドの関連を容易に把握することができ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、過去に発生したイ
ベントどうしの関連を分析するための情報を表示するイ
ベント分析装置、及びイベントを分析するための情報を
表示するイベント分析プログラムが格納されたプログラ
ム製品に関する。
【0002】
【従来の技術】社会においては、政治や経済等に関して
日々出来事(イベント)が発生し、そのイベントがその
後の社会情勢の変化に影響を与えたり、後に引き続くイ
ベント出来事の原因になったりしている。そして、様々
なイベントの発生や社会情勢の変化は、例えば新聞や雑
誌等の記事(テキスト情報)に詳細に掲載され出版され
ている。また、企業内においても、人事異動、製品発
売、決算発表等の、事業に関するイベントが日々発生
し、そのイベントはその後のイベントや事業業績の推移
等の企業活動に影響を与えている。これらのイベントや
事業業績の推移についても、企業内で分析・報告された
ものが文書の形で蓄積されている。
【0003】上述のような、あるイベントに対して、影
響され発生したイベントや社会現象(一般社会における
イベントや現象、及び企業等の限定された社会集団のイ
ベントや現象を含む)を見出したり、あるイベントや社
会現象に対して、そのイベントや社会現象に影響を与え
たイベントを発見する等の、イベント分析は、従来で
は、経験や知識に基づいて、蓄積された多くの文献の内
容をつぶさに調査・分析することによって行われてい
る。
【0004】
【発明が解決しようとする課題】しかし、このようなイ
ベント分析は、多くの経験や知識を要する上、実際の分
析作業も多くの文献を調査・分析する必要があり、困難
を極めている。そこで、本発明は、イベント分析を容易
に行うことができるイベント分析装置、及びイベント分
析プログラムが格納されたプログラム製品を提供するこ
とを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、過去に発生したイベントを
そのイベントの発生時期とともに取得するイベント取得
手段と、過去の文書をその文書の発生時期とともに取得
する文書取得手段と、前記文書取得手段で取得した前記
文書における特定の語の経時的変化を取得するトレンド
取得手段と、前記イベント取得手段で取得した前記イベ
ントと前記トレンド取得手段で取得した前記特定の語の
経時的変化とを対応させて表示する表示手段とを備える
イベント分析装置を提供する。
【0006】イベントとは、企業等の様々な集団や一般
社会において発生する出来事のことであり、イベントの
発生時期は、この出来事の起きた年、月、日、時間、ま
たは所定の規則(年度、数週間毎等)に従って区分けさ
れた期間である。イベント取得手段は、イベント及びそ
の発生時期を、操作者からのキーボードや音声による入
力によって取得しても、文書データを取得し自然言語処
理等の解析によって文書データ中から抽出して取得して
もよい。文書とは、前記集団や一般社会のイベントや情
勢をテキスト形式のデータ(テキストデータ)であらわ
したものである。この文書のテキストデータは、最初か
らテキスト形式に作成されたものの他、音声データや画
像データ及びバイナリデータとして作成されたものをテ
キスト変換したテキストデータを含む。また文書の発生
時期は、これらの文書のデータ(テキストデータ、音声
データ、画像データ、バイナリデータ)の作成時期や、
更新時期である。作成時期や更新時期は、文書のデータ
を作成したり更新した年、月、時間または所定の法則に
従って区分けされた期間である。文書取得手段は、文書
及び文書の発生時期を含むテキストデータを、フロッピ
ーディスクやMO等から読み出すもの、LAN等の有線、
無線を介して外部から受信し取得するもの、及びそれら
両方を含む。特定の語は、文書取得手段により取得され
る文書に含まれ、その経時的変化がイベントに影響を及
ぼしたりイベントにより影響される語である。この特定
の語は、文書中の出現頻度や形態素分析による重み付け
等の分析結果から、イベント分析装置により選択される
ものであっても、ユーザの入力によって選択されるもの
であってもよい。表示手段は、イベントと特定の語の経
時的変化(トレンド)とを、対応させて表示する手段で
ある。イベントとトレンドとを対応させて表示すると
は、1または複数のイベントそれぞれの発生時期と1ま
たは複数のトレンドの変化とを、それらの発生や変化の
前後関係を認識可能に表示することである。イベントや
トレンドを対応させて表示する手法としては、同一の時
間軸に対応させてイベント及びトレンド(イベント及び
トレンドの名称や略称、イベント及びトレンドを表すマ
ーク等)を表示する手法等、各イベントやトレンドの発
生の前後関係が一見して認識可能に表示する手法が好ま
しい。表示手段は、表示するためのデータを出力する表
示データ出力手段を含むことが必要である。表示手段
は、表示データ出力手段とこの表示データ出力手段によ
り出力されるデータによる表示をする表示装置を含んで
いるものとすることができる。また、表示手段は、表示
装置は含まず、表示データ出力手段が、本発明のイベン
ト分析装置の外部の表示装置にデータを出力するもので
あってもよい。
【0007】また、請求項2記載の発明は、前記トレン
ド取得手段は、前記文書取得手段で取得した前記文書中
における前記特定の語についての所定の統計量に基づい
て前記特定の語の経時的変化を取得する請求項1に記載
のイベント分析装置を提供する。上記所定の統計量とし
ては、前記文書中における前記特定の語の出現頻度、及
び前記特定の語を含む文書数、のうちのいずれかとする
ことができる。出現頻度としては、前記文書中において
前記特定の語が出現した回数、前記特定の語が出現して
いる文書数、前記特定の語が出現した回数/文書数等が
含まれる。請求項3記載の発明は、前記トレンド取得手
段は、前記文書取得手段で取得された前記文書に含まれ
る前記特定の語を開始語として、該開始語から共起しな
がら遷移していく遷移語を、前記特定の語の経時的変化
として取得する請求項1に記載のイベント分析装置を提
供する。
【0008】また、上記目的を達成するために、請求項
4記載の発明は、過去に発生したイベントをそのイベン
トの発生時期とともに取得するイベント取得機能と、過
去の複数の文書をその文書の発生時期とともに取得する
文書取得機能と、前記文書取得機能で取得した前記文書
における特定の語の経時的変化を取得するトレンド取得
機能と、前記イベント取得機能で取得した前記イベント
と前記トレンド取得機能で取得した前記特定の語の経時
的変化とを対応させて表示する表示機能とを実現するた
めのイベント分析プログラムが格納されたプログラム製
品により、前記目的を達成する。また、前記イベント取
得機能と、前記文書取得機能と、前記トレンド取得機能
と、前記表示機能とを実現するためのイベント分析プロ
グラムを含む記憶媒体、イベント分析プログラム伝送媒
体、イベント分析プログラム搬送波、イベント分析プロ
グラム信号としてもよい。前記プログラム製品とは、プ
ログラムを備えた又はプログラムが物理的に存在する各
種製品をいい、該当する製品としては、電子メールプロ
グラムによる前記各機能を実現する記憶媒体、サーバシ
ステムコンピュータ、ネットワークコンピュータ、コン
ピュータシステム、コンピュータ、ワープロ、その他の
製品が挙げられる。本発明のプログラム製品、記憶媒
体、イベント分析プログラム伝送媒体、イベント分析プ
ログラム搬送波、イベント分析プログラム信号におい
て、イベント、イベントの発生時期、文書、及び文書の
発生時期は、上述したイベント分析装置と同様のもので
ある。イベント取得機能は、イベント及びその発生時期
を、操作者からのキーボードや音声による入力によって
取得しても、文書データを取得し自然言語処理等の解析
によって文書データ中から抽出して取得してもよい。文
書取得機能は、文書及び文書の発生時期を含むテキスト
データを、フロッピーディスクやMO等から読み出すも
の、LAN等の有線、無線を介して外部から受信し取得
するもの、及びそれら両方を含む。また、表示機能は、
イベントとトレンドとを、それらの時期を対応させて表
示する機能である。イベントとトレンドとを対応させて
表示するとは、1または複数のイベントそれぞれの発生
時期と1または複数のトレンドの変化とを、それらの発
生や変化の前後関係が認識可能に表示することである。
イベントやトレンドを対応させて表示する手法として
は、同一の時間軸に対応させてイベント及びトレンド
(イベント及びトレンドの名称や略称、イベント及びト
レンドを表すマーク等)を表示する手法等、各イベント
やトレンドの発生の前後関係が一見して認識可能に表示
する手法が好ましい。表示機能は、表示するためのデー
タを出力する表示データ出力機能を含むことが必要であ
る。表示機能は、表示データ出力機能とこの表示データ
出力機能により出力されるデータに基づいて表示装置に
表示を行う表示装置制御機能を含んでいるものとするこ
とができる。また、表示機能は、表示装置制御機能は含
まず、表示データ出力機能は、外部の表示装置にイベン
ト及びトレンドを表示のためのデータを出力するもので
あってもよい。
【0009】前記プログラム製品、前記記憶媒体、前記
イベント分析プログラム伝送媒体、前記イベント分析プ
ログラム搬送波、前記イベント分析プログラム信号に含
まれるイベント処理プログラムに実現される前記トレン
ド取得機能は、前記文書取得機能で取得した前記文書中
における前記特定の語の出現頻度、及び前記特定の語を
含む文書数、のうちのいずれかを前記特定の語の経時的
変化として取得するものとすることができる。また、前
記プログラム製品、前記記憶媒体、前記イベント分析プ
ログラム伝送媒体、前記イベント分析プログラム搬送
波、前記イベント分析プログラム信号に含まれるイベン
ト処理プログラムに実現される前記トレンド取得機能
は、前記文書取得機能で取得された前記文書に含まれる
前記特定の語を開始語として、該開始語から共起しなが
ら遷移していく遷移語を、前記特定の語の経時的変化と
して取得するものとすることができる。
【0010】
【発明の実施の形態】以下、本発明のイベント分析装
置、及びイベント分析のためのプログラムが格納された
プログラム製品の好適な実施の形態について、図1から
図8を参照して詳細に説明する。
【0011】図1は、本発明のイベント分析装置の一実
施形態及び本発明のプログラム製品の一実施形態として
のコンピュータであり、本発明のプログラム製品の一実
施形態としての記憶媒体の該プログラムが読み取られた
コンピュータの構成を表したブロック図である。この図
1に示すように、イベント分析装置(コンピュータ)
は、装置全体を制御するための制御部11を備えてい
る。この制御部11には、データバス等のバスライン2
1を介して、入力装置としてのキーボード12やマウス
13、表示装置14、音声認識装置の一部としてのマイ
ク15、記憶装置16、記憶媒体駆動装置17、通信制
御装置18、入出力I/F19、及び文字認識装置20
が接続されている。
【0012】制御部11は、CPU111、ROM11
2、及びRAM113を備えている。CPU111は、
ROM112に格納される各種プログラムに従って記憶
装置16や記憶媒体駆動装置17からプログラムやデー
タを読み込み、RAM113を作業エリアとして、コン
ピュータ内の各種装置を制御し演算を行う中央処理装置
であり、過去に発生したイベントをそのイベントの発生
時期とともに取得するイベント取得処理、過去の文書を
その文書の発生時期とともに取得する文書取得処理と、
前記文書取得処理で取得した前記文書における特定の語
の経時的変化を取得するトレンド取得処理と、前記イベ
ント取得処理で取得した前記イベントと前記トレンド取
得処理で取得した前記トレンドとを、それらの時期を対
応させて表示する表示処理、その他の処理を行う。
【0013】ROM112は、CPU111が各種制御
や演算を行うためのプログラムやデータが予め格納され
たリードオンリーメモリである。RAM113は、CP
U111にワーキングメモリとして使用されるランダム
アクセスメモリである。このRAM113には、本実施
形態によるイベント取得処理を行うためのエリアとし
て、イベントやイベント発生時期を取得する対象となる
文書(イベント文書)を格納するイベント文書格納エリ
ア1131が確保され、トレンドを表すための特定の語
の経時的変化を調べるための文書(トレンド文書)及び
その文書の発生時期を格納するトレンド文書格納エリア
1133が確保され、表示処理を行うためのエリアとし
て、表示処理においてイベント及びトレンドを表示する
期間(イベントの分析期間)と、その期間内のイベント
及びトレンドを経時順に格納するイベント・トレンド格
納エリア11137、その他の各種エリアが確保される
ようになっている。
【0014】キーボード12は、かな文字を入力するた
めのかなキーやテンキー、各種機能を実行するための機
能キー、カーソルキー、等の各種キーが配置されてい
る。マウス13は、ポインティングデバイスであり、表
示装置14に表示されたキーやアイコン等を左クリック
することで対応する機能の指定を行う入力装置である。
表示装置14は、例えばCRTや液晶ディスプレイ等が
使用される。この表示装置14は、CPU111ととも
に表示手段として機能し、イベント取得処理で取得した
イベントとトレンド取得処理で取得したトレンドとが、
それらの時期を対応させて表示されるようになってい
る。印刷装置15は、表示装置14に表示されたイベン
ト及びトレンドや、記憶装置16の文書データベース1
64に格納された文書等の印刷を行うためのものであ
る。この印刷装置としては、レーザプリンタ、ドットプ
リンタ、インクジェットプリンタ、ページプリンタ、感
熱式プリンタ、熱転写式プリンタ、等の各種印刷装置が
使用される。
【0015】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に使用される記憶媒体としては、主と
してハードディスクが使用されるが、後述の記憶媒体駆
動装置17で使用される各種記憶媒体のうちの読み書き
可能な記憶媒体を使用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、プログラム格納部1
62、文書データベース164、イベントデータベース
165、関連語データベース166、図示しないその他
の格納部(例えば、この記憶装置16内に格納されてい
るプログラムやデータ等をバックアップするための格納
部)等を有している。プログラム格納部162には、過
去に発生したイベントをそのイベントの発生時期ととも
に取得するイベント取得機能、過去の文書をその文書の
発生時期とともに取得する文書取得機能、文書取得機能
で取得した前記文書における特定の語の経時的変化を取
得するトレンド取得機能、及び、イベント取得機能で取
得したイベントとトレンド取得機能で取得した特定の語
の経時的変化とを対応させて表示する表示機能を実現す
るためのイベント分析プログラムが格納されている。本
実施形態において、記憶装置16は本発明のプログラム
製品の一実施形態として機能する。また、プログラム格
納部162には、仮名漢字変換辞書161を使用して入
力された仮名文字列を漢字混り文に変換する仮名漢字変
換プログラム、その他の各種プログラムも格納されてい
る。
【0016】文書データベース164には、仮名漢字変
換プログラムにより作成された文書や、他の装置で作成
されて記憶媒体駆動装置17や通信制御装置18から読
み込まれた文書が、その文書の作成者や作成日時、更新
日時等ともに格納される。この文書データベース164
に格納される各文書の形式は特に限定されるものではな
く、JIS形式やHTML(Hyper Text M
arkup Language)形式等の各種形式の文
書の格納が可能である。文書データベース164に格納
される文書は、新聞記事、百科事典、学会誌、社内報、
社内資料等であり、イベントを取得するためのイベント
文書、及び、トレンドを取得するためのトレンド文書と
して使用される。イベントデータベース165は、イベ
ント記憶手段として機能し、イベントとその発生時期
(年月日)が対応して、イベントデータとして格納され
る。これらのイベントデータは、ユーザにより入力され
たものや、文書データベース164に格納された文書や
記憶媒体に格納され記憶媒体駆動装置17から読み込ん
だ文書等の文書から後述するイベント抽出処理(図6)
により取得されたもの、他の記憶媒体に格納されている
もの等であり、ユーザによるイベントの指定と書き込み
の命令に従って格納される。
【0017】図2は、関連語データベース166に格納
される関連語についてのデータを概念的に表す図であ
る。この図2に示すように、関連語データベース166
には、トレンド分析に用いられる語(句)について、互
いの関連性のある語(句)どうしに同一の区分番号が付
され、格納されている。そして、1つの語(句)が入力
されると、この語(句)に付される区分番号と同一の区
分番号の語(句)を抽出することにより、入力された1
つの語(句)の関連語が調べ出されるようになってい
る。関連語データベース166に格納される語(句)及
び区分番号は、ユーザによる入力や、外部の関連語辞書
を読み込むことによって格納される。
【0018】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書デー
タその他のデータ等を読み込むための駆動装置である。
記憶媒体に記憶されているコンピュータプログラムに
は、本実施形態のイベント分析装置により実行される各
種処理のためのプログラム、および、そこで使用される
辞書、データ等も含まれる。ここで、記憶媒体とは、コ
ンピュータプログラムやデータ等が記憶される記憶媒体
をいい、具体的には、フロッピーディスク、ハードディ
スク、磁気テープ等の磁気記憶媒体、メモリチップやI
Cカード等の半導体記憶媒体、CD−ROMやMO、P
D(相変化書き換え型光ディスク)等の光学的に情報が
読み取られる記憶媒体、紙カードや紙テープ等の用紙
(および、用紙に相当する機能を持った媒体)を用いた
記憶媒体、その他各種方法でコンピュータプログラム等
が記憶される記憶媒体が含まれる。本実施形態のイベン
ト分析装置において使用される記憶媒体としては、主と
して、CD−ROMやフロッピーディスクが使用され
る。記憶媒体駆動装置17は、これらの各種記憶媒体か
らコンピュータプログラムを読み込む他に、フロッピー
ディスクのような書き込み可能な記憶媒体に対してRA
M113や記憶装置16に格納されているデータ等を書
き込むことが可能である。
【0019】本実施形態の文書処理装置では、制御部1
1のCPU111が、記憶媒体駆動装置17にセットさ
れた外部の記憶媒体(プログラム製品)からコンピュー
タプログラムを読み込んで、記憶装置16の各部に格納
(インストール)する。そして、本実施形態によるイベ
ント取得処理等の各種処理を実行する場合、記憶装置1
6から該当プログラムをRAM113に読み込み、実行
するようになっている。但し、記憶装置16からではな
く、記憶媒体駆動装置17により外部の記憶媒体から直
接RAM113に読み込んで実行することも可能であ
る。また、イベント分析装置によっては、本実施形態の
イベント取得処理のプログラム等を予めROM112に
記憶しておき、これをCPU111が実行するようにし
てもよい。
【0020】通信制御装置18は、他のコンピュータや
ワードプロセッサ等との間でテキスト形式の文書デー
タ、ビットマップ形式等の画像データ、音声データ等の
各種データの送受信をバイナリデータにエンコード及び
バイナリデータからデコードすることによって行うこと
ができるようになっている。入出力I/F19は、音声
や音楽等の出力を行うスピーカ等の各種機器を接続する
ためのインターフェースである。文字認識装置20は、
用紙等に記載された文字をテキスト形式で認識する装置
であり、イメージスキャナや文字認識プログラム等で構
成されている。
【0021】本実施形態では、キーボード12の入力操
作により作成した文書(RAM113の所定格納エリア
に格納)の他、外部で作成され所定の記憶媒体に格納さ
れたものを記憶媒体駆動装置17により読み込んだ文
書、予め文書データベース164に格納されている文
書、通信制御装置18からダウンロードした文書、及び
文字認識装置20で文字認識した文書、等の各種文書を
イベント文書及びトレンド文書として取得することが可
能である。
【0022】以上のように構成されたイベント分析装置
による、イベント分析のための動作について、説明す
る。図3は、イベント分析処理のメインの動作を説明す
るためのフローチャートである。この図3に示すよう
に、本実施形態によるイベント分析処理においては、C
PU111は、まず、期間設定画面を表示し、ユーザが
希望するイベントの分析期間をユーザのキーボード等か
らの入力により取得し、RAM113の所定の作業領域
に格納する(ステップ11)。また本実施形態では、イ
ベントの分析期間とともに、トレンドの集計期間をユー
ザからの入力により取得するようになっている。
【0023】図4は、ステップ91において、表示装置
14に表示される期間設定画面を表す図である。この図
4に示すように、期間設定画面は、イベントの分析期間
としてのイベント分析の開始日及び終了日と、トレンド
の集計期間とが入力され表示されるようになっている。
そして、ユーザは、キーボードやマウスによって直接数
字を入力したりプルダウンメニューから数字を選択する
ことによって、イベント分析の開始日と終了日、集計期
間を入力し、表示されたイベント分析期間を確認し、そ
の期間でよければ、「OK」のアイコンをマウスクリッ
クし、一方、この期間が満足のいかないものであれば、
「キャンセル」のアイコンをクリックし再入力するよう
になっている。尚、集計期間とは、後述するトレンド取
得処理(ステップ21)において、特定の語の経時的変
化を取得する場合の時間のまとまりの単位である。特定
の語の経時的変化は、この集計期間単位での変化として
取得される。本実施形態においては、集計期間は、トレ
ンド分析の対象となる文書中における特定の語の出現回
数を総計する単位であり、各集計期間毎の文書中の出現
回数の変化が経時的変化として取得される。
【0024】期間設定画面によりイベント分析の開始日
と終了日、及び集計期間を取得すると、次に、CPU1
11は、分析すべきイベントとイベントの発生時期を入
力する入力方法の選択を取得する(ステップ13)。こ
の入力方法の選択の取得においては、CPU111は、
表示装置14の画面上に「イベントを直接入力」と、
「イベントを自動抽出」、「既存データを読み込み」の
3つの選択を表示させる。そして、いずれかの選択の冒
頭にあるチェックボックスをクリックする等のユーザか
らの入力操作を認識することによって、入力方法の選択
を取得する。
【0025】入力方法として、直接入力が選択された場
合(ステップ15;Y)には、イベント入力画面を表示
装置14に表示させ、イベント名とそのイベントの発生
時期(年月日)を取得する(ステップ16)。図5は、
イベント入力画面を表す図である。この図5に示すよう
に、イベント入力画面には、イベントの発生時期とし
て、イベント発生の年、月、日を入力し、イベントの名
称を入力するようになっている。この際、ステップ1で
取得したイベント分析期間に、入力されたイベント発生
時期が属していない場合には、CPU111は、表示装
置14の図示しないスピーカからビープ音を発し、再入
力を促すようになっている。
【0026】また、入力方法として、「イベントを自動
抽出」が選択された場合(ステップ15;N、ステップ
17;Y)には、CPU111は、イベント抽出処理を
行う(ステップ19)。
【0027】ここで、このイベント抽出処理について説
明する。尚、イベント抽出処理においては、各動作の説
明に続いて例として、「1997年9月にジャストシス
テムが一太郎8を発売した。」というテキストデータが
指定された場合の処理を括弧内に記載している。図6
は、本実施形態によるイベント抽出処理の流れを示すフ
ローチャートである。まず、CPU111は、ユーザか
らのキーボード操作等によってテキストデータの指定を
取得し、指定されたテキストデータをイベント文書格納
エリア1131に読み込む(ステップ191)。そし
て、格納された文書について、形態素解析を行って名詞
(句)を取得し(ステップ192)、取得した名詞
(句)を表示装置14に表示する。このとき、「イベン
トとして注目すべき名詞(句)を指定して下さい。」等
の選択を促すことばを表示する。そして、ユーザによっ
て注目すべき名詞句が選択され、CPU111はユーザ
によるこの注目すべき名詞句の選択を把握する(ステッ
プ193)。図6では、注目すべき名詞句としてユーザ
により「発売」が選択されたとする。次に、CPU11
1は、テキストデータのうち選択された名詞句を含む文
章(段落)から、格助詞句(「ジャストシステムが」と
「一太郎8を」)を抽出し、助詞から主語(「ジャスシ
ステム」)と目的語(「一太郎8」)を特定する(ステ
ップ194)。すなわち、助詞の「が」を含む格助詞句
中の名詞(「ジャスシステム」)を主語とし、助詞
「を」を含む格助詞中の名詞(「一太郎8」)を目的語
とする(ステップ195)。
【0028】次に、副詞句(「1997年9月に」)を
抽出し、その中から時を表す名詞(「1999年9
月」)を抽出する(ステップ195)。なお、時以外の
「春」や「昨日」等の名詞句のときには、文書の日付か
ら相対的に計算し適切な日時を決定する。そして、CP
U111は、このように抽出された主語や目的語を組み
合わせてイベントを決定取得し、時を表す語句からイベ
ントの発生時期を決定し(ステップ196)、RAMの
所定エリアに格納する。そして、「他のイベントを入力
しますか?」等の他のイベントを入力するかどうかを尋
ねるコメントを表示(ステップ197)し、他のイベン
トを入力との応答がある場合(ステップ197;Y)に
は、ステップ191にリターンし、テキストデータの指
定取得からの動作を繰り返す。他のイベントを入力しな
いとの応答があった場合(ステップ197;N)には、
イベント抽出処理を終了してメインルーチンにリターン
する。
【0029】また、入力方法として、「既存データを読
み込み」が選択された場合(ステップ15;N、ステッ
プ17;N)には、CPU111は、ユーザのキーボー
ド操作等によって、イベントデータベース165や記憶
媒体に格納されるイベントデータの指定を取得し、指定
されたイベントデータを読み込んでRAMの所定エリア
に格納する(ステップ18)。
【0030】以下、図3に戻りメインルーチンの説明を
続ける。イベントを取得すると(ステップ16後、ステ
ップ18後、及びステップ19後)、次に、CPU11
1は、トレンド取得処理を行う(ステップ21)。図7
は、トレンド取得処理の動作の流れを表すフローチャー
トである。トレンド取得処理においては、CPU111
は、まず、図7に示すように、トレンド分析を行う対象
となる1又は複数の文書(トレンド文書)について、ユ
ーザの指定を取得し、指定された文書のテキストデータ
をRAM113のトレンド文書格納エリア1133に格
納する(ステップ211)。そして、トレンド文書中か
ら、出現頻度等に基づいて特定の語となり得る語(句)
(特定語候補)を抽出し、表示装置14に表示数の多い
順にリスト表示し、リスト表示の中から1つの語(句)
についてユーザによる指定を取得する(ステップ21
3)。
【0031】リスト表示の中から語(句)の指定を取得
すると、CPU111は、指定された語(句)を特定の
語として、トレンド文書格納エリア1133に格納され
るトレンド文書中で検索し、各トレンド文書中の出現回
数をRAMの所定エリアにトレンド文書と対応させて格
納する(ステップ215)。そして、各トレンド文書の
作成または更新時期をトレンド文書格納エリア1133
から取得し、ステップ11で取得した集計期間毎に分け
て出現回数を合計して(ステップ217)、トレンド取
得処理を終了し、メインのルーチンにリターンする。
【0032】トレンド取得処理が終了すると、CPU1
11は、ステップ17、ステップ18、またはステップ
19において取得したイベントのデータとステップ21
で取得したトレンドのデータとを表示装置14に表示す
る(ステップ23)。図8は、本実施形態においてイベ
ント及びトレンドを表示装置14に表示したイベント・
トレンド表示画面を表した図である。この図8に示すよ
うに、イベント・トレンド表示画面においては、時間軸
を横軸として、その時間軸に対応して、イベントが時間
軸の情報に表示されている。また、指定された特定の語
(句)と、この指定された語(句)についての経時的変
化(トレンド)として、指定された特定の語(句)の指
定文書中の出現回数が、時間軸に対応した棒グラフで、
表示されている。この棒グラフは、ステップ11で指定
された集計期間毎の出現回数である。また、棒グラフの
横には、分析開始時期から分析終了時期までの出現回数
の総計がターム頻度として表示されている。またこのイ
ベント・トレンド表示画面には、イベントのデータの格
納を命令するためのアイコンEが表示されており、この
アイコンEがクリックされた場合(ステップ25;Y)
には、ステップ17、ステップ18、ステップ19で取
得されRAMに格納されているイベントデータをイベン
トデータベース165に格納する(ステップ27)。こ
のとき、RAMに格納されているイベントデータのイベ
ントと同一のイベントであって発生年月日が一致するイ
ベントデータが既にイベントデータベース165に格納
されている場合には、そのイベントデータは、新たに格
納せず、イベントデータベース165に格納されていな
いイベントのイベントデータ、同一のイベントであるが
発生年月日の異なるイベントデータについてのみ、イベ
ントデータベース165に格納する。イベント格納命令
が無かった場合(ステップ25;N)及びイベント格納
命令に従ってイベントデータを格納した(ステップ2
7)後は、CPU111は、ユーザ入力によるイベント
分析処理の終了命令に従って、イベント分析処理を終了
する。
【0033】このように、本実施形態によると、トレン
ド文書中の指定された語(句)の出現頻度の変化(トレ
ンド)と、イベントとが同じ時間軸で表示され、イベン
トと、トレンドとの関連の有無が一見して把握でき、容
易にイベント分析を行うことが可能である。
【0034】以上、好適実施形態に係る構成及びイベン
ト分析処理について説明したが、本発明では、これらの
各形態に限定されるものではなく、各請求項に記載され
た発明の範囲内で種々の変形をすることが可能である。
【0035】例えば、上述の実施形態では、ユーザによ
り1つの特定の語を指定され、この1つの特定の語につ
いて経時的変化を取得したが、複数の特定の語や複数の
特定の語を含む語群ををユーザからの指定により取得
し、指定された複数の特定の語や、指定された語群に含
まれる特定の語について、一度にまたは順番に経時的変
化を棒グラフや折れ線グラフその他のグラフ等として、
イベントとともに表示装置14に表示するようにしても
よい。上述の実施形態及び変形例においては特定の語は
ユーザにより選択されているが、例えば、最初の集計期
間内の文書中で最も頻出頻度の高い名詞等、トレンド文
書における出現頻度や文中の用法等に基づいて特定の語
を自動的に抽出したり、味に関係する語等、ユーザから
所定の条件を取得しその条件に基づいて自動的に抽出し
てもよい。イベント・トレンド表示画面に、トレンド取
得処理において抽出された特定語候補を複数表示し、表
示された特定語候補からユーザによる新たな特定の語の
選択を取得し、この特定の語について出現頻度の経時的
変化を取得し新たなトレンドとして、イベントとの対応
を表示し直すようにしてもよい。これにより、複数のト
レンドについて、イベントとの対応関係の大小が効率的
に比較可能になる。
【0036】上述の実施形態及び各変形例においては、
1または複数の特定の語それぞれの出現回数の経時的変
化を表示しているが、複数の特定の語全体の出現回数等
の出現頻度についての各集計期間毎の経時的変化をイベ
ントとともに表示装置14に表示してもよい。この複数
の特定の語は、それぞれをユーザが指定してもよいが、
予め決められた条件(政治関係や経済関係等所定の範疇
で使用される語(句)どうしや、所定の語(句)と意味
が類似する語(句)どうし、若しくは所定の語と共起す
る関係の語(句)どうし等)に従って、またはユーザが
指定した条件に従って、その条件に従う特定の語の群
(クラスタ)を自動抽出する特定語抽出手段を設け、こ
の特定語抽出手段により特定の語を決定してもよい。ク
ラスタは、予め各クラスタを表すクラスタ名やクラスタ
番号とそのクラスタに含まれる語を決定しておき、ユー
ザがクラスタ名やクラスタ番号を指定することによっ
て、このクラスタに含まれる語を特定の語とするように
してもよい。上述の実施形態においては、関連語データ
ベース166に互いの関連性のある語(句)どうしが同
一の区分番号で区分され格納されているので、この関連
語データベース166を特定語抽出手段の一部として利
用し、ユーザが区分番号を指定することによって、クラ
スタの区分を指定できるようになっている。
【0037】尚、語(句)の意味の類似は、例えば、予
め仮名漢字変換辞書に含まれる語(句)のうち特定の語
となりうる語(句)について、政治、経済、文化、犯
罪、化学という複数の代表的概念を用意して、例えば、
語(句)a( 政治, 経済,文化, 犯罪, 科学)
=(0.23,0.45,0.01,0.63,0.5
6)、語(句)b( 政治, 経済, 文化, 犯罪,
科学)=(0.21,0.10,0.87,0.0
8,0.37)、・・・というように、それぞれの概念
への類似度が各要素となるベクトルデータA、B、・・
・を取得し格納しておき、語(句)a及び語(句)bの
類似度をその語(句)のベクトルA,B間の角度θまた
はCOSθとし、この類似度が所定値以上である場合に
語(句)aと語(句)bとが類似するとすることができ
る。共起する関係については、各語(句)間について共
起頻度を数値として取得し、この数値に基づいて共起す
る関係の有無を決定することができる。また、ベクトル
データに対して既知のクラスタリングアルゴリズムを適
用して分類することもできる。この場合のクラスタリン
グは多変量解析の分野で一般に知られている階層クラス
タリングの方法が一般に適用される。
【0038】上述の実施形態及び各変形例においては、
経時的変化として、特定の語の文書中の出現回数でな
く、特定の語が含まれている文書の数とすることもでき
る。また、tf−idf値とすることもできる。このt
f−idf値は、以下の式で表され、特定の語の出現特
性をより誇張する指標である。
【0039】 tf−idf値=tf(d,t)*idf(t) tf(d,f)=(文書dにおける特定の語tの頻度) idf(t)=log(DBsize(db)/fre
q(t,db))+1 (DBsize(db)とは、対象とするトレンド文書
の文書総数を表し、freq(t,db)とは、トレン
ド文書の文書総数のうち特定の語tが現れる文書の数を
表す。)
【0040】上述の実施形態及び各変形例において、集
計期間は、1日、1週間、半月、1ヶ月等の等間隔の期
間の他、例えば、トレンド文書が新聞だけの場合には、
新聞発刊日が5日含まれる期間毎等、トレンド文書に合
わせた期間も指定できるようにしてもよい。上述の実施
形態及び各変形例においては、特定の語の出現回数等の
経時的変化は棒グラフによって表示装置に表示されてい
るが、これに限られるものではなく、折れ線グラフや、
数値、色の濃淡、共起する語(句)自体等、経時的変化
が数値であるか語(句)であるか等を考慮しながら適宜
種々の手法で表して表示することができる。
【0041】上述の実施形態及び各変形例においては、
特定の語の経時的変化として、特定の語の出現回数等の
出現頻度の増減を取得し表示しているが、経時的変化は
これに限られるものではなく、例えば、特定の語を開始
語として、この開始語から共起しながら遷移していく遷
移語(共起ターム)の移り変わりを、前記特定の語の経
時的変化として取得し、表示してもよい。日々生成させ
る情報や文書の内容は、完全に別の内容に遷移するので
はなく、ある時点とそれに続く時点との情報内容はその
一部が重なりながら徐々に変化する。(このことに関連
して「自然言語処理」(119−4、1997年5月2
6日発刊)の「トレンド・トラッキング型テキスト自動
分類の試み」の中で、語彙の観点から見ると新出語彙と
既出語彙が共起しつつ遷移することが指摘されてい
る。)従って、文書内において集計期間内または連続す
る集計期間どうし間にまたがって共起する語(句)を芋
蔓式に追跡することによりトレンドを取得することがで
きる。この場合は、集計期間は前後する集計期間と重な
るようにしてもよい。追跡していく方向は、最古から最
新、又は最新から最古へと両方向可能であり、特定の語
とともにユーザから指定されるようにしてもよい。共起
する語(句)は、もとになる開始語や遷移語との共起頻
度を数値化することにより、得ることができる。
【0042】図9は、特定の語の経時的変化として、特
定の語を開始語として、この開始語から共起しながら遷
移していく遷移語(共起ターム)の移り変わりを、前記
特定の語の経時的変化として取得し、表示する場合につ
いて説明する図である。この図9に示す例では、図9
(a)に示すように、1999年1月を分析の開始時、
1999年6月を分析の終了時期としており、その間の
区分A〜Eについて半分ずつ重ねて集計期間の区分とし
て、区間D〜Eを集計期間(1)、区間C〜Dを集計期
間(2)、区間B〜Cを集計期間(3)、区間A〜Bを
集計期間(4)としている。そして、特定の語(Ter
m11)を開始語として、最新の期間(1)から最古の
期間(4)へ、時間をさかのぼる方向で共起する語
(句)を追跡している。そして、上述した実施形態のス
テップ21に替えたトレンド処理として、集計期間
(1)においてTerm11に共起する語(句)(遷移
語)としてTerm21及びTerm22を検出し、集
計期間(2)においてTerm21に所定以上の共起頻
度で共起する語(句)(遷移語)はなく、Term22
に共起する語(句)(遷移語)としてTerm31、T
erm32、Term33を検出している。集計期間
(3)ではTerm31、Term33に所定以上の共
起頻度で共起する語(句)(遷移語)はなく、Term
32について共起する語(句)(遷移語)Term4
1、Term42を検出し、集計期間(4)においてT
erm41、Term42に共起する語(句)(遷移
語)としてTerm51、Term52を検出してい
る。そして、この共起ターム検出処理(トレンド取得処
理)の結果とステップ16、ステップ18、またはステ
ップ19による処理で取得されたイベント及びその発生
時期に基づいて、表示装置14には、例えば図9(b)
に示すように、イベントとトレンドとを表示する。図9
(b)に示す画面では、特定の語(開始語)から共起し
ながら遷移していく遷移語(共起ターム)の移り変わり
を、共起する語(句)どうしを矢印で結ぶようにして表
示装置14の画面上に表示している。なお、共起頻度を
矢印線の太さや濃淡、矢印に対応する数値で表してもよ
い。
【0043】上述の実施形態及び各変形例においては、
特定の語の経時的変化(特徴量)として、文書中の出現
回数等の出現頻度の経時的変化、特定の語を含む文書数
の経時的変化、及び遷移語のうつりかわりのうちのいず
れかが取得されイベントとともに表示されるが、ユーザ
からの指定によりこれらのうちの1または複数をイベン
トとともに表示できるようにしても良い。これによっ
て、各特徴量に基づいてイベントを多角的に分析するこ
とが可能となる。上述の実施形態及び各変形例において
は、ステップ27において、イベントデータベース16
5に格納されたイベントと同一のイベントについては発
生年月日が一致する場合にはそのデータについては更新
しないようになっているが、イベント格納命令を取得し
た場合(ステップ25;Y)には、直接入力やイベント
抽出処理により、イベントデータベース165に格納さ
れているイベントデータとはイベントやその発生年月日
が異なるイベントが取得されている可能性も多いので、
全てのイベントデータを格納するようにしてもよい。上
述の実施形態及び各変形例においては、イベント記憶手
段としてのイベントデータベース165には、イベント
とその発生時期(年月日)とが対応して格納されている
が、これらに加えて、このイベントを取得した文書名や
本の名前等のイベント取得源や、書籍と新聞、雑誌等の
別類を格納してもよい。そして、後のステップ19にお
いてイベント及び発生時期とともに文書名等を表示した
り、ユーザから文書名や類別の指定を取得し対応するイ
ベントとその発生時期のみを表示することによって、ユ
ーザがイベントデータの指定を容易に行うことができる
ようにすることが可能である。
【0044】上述の実施形態及び各変形例においては、
特定の語の各文書における出現回数(出現頻度)等の経
時的な変化はRAMに格納されるが、記憶装置16や記
憶媒体駆動装置の記憶媒体に格納し、再利用できるよう
にしてもよい。上述の実施形態及び各変形例において
は、イベント分析処理において使用されたイベントデー
タは格納命令があると、自動的にイベントデータベース
165に格納される(ステップ27)が、ユーザがイベ
ントデータの格納場所を指定できるようにしてもよい。
説明した実施形態は日本語で作成された文書に限られる
ものではなく、あらゆる言語で作成された文書を対象と
することが可能である。その場合、対象となる文書が作
成された言語用の形態素解析アルゴリズム等を使用する
といった、本発明の構成には影響のない部分を変更する
だけでよい。表示手段に代えて、イベント取得手段で取
得したイベントとトレンド取得手段で取得した特定の語
の経時的変化とを対応させて表示する表示手段に代え
て、イベント取得手段で取得したイベントとトレンド取
得手段で取得した特定の語の経時的変化とを対応させて
印刷する印刷手段や、印刷するためのデータを出力する
印刷データ出力手段等によっても、同様の作用・効果を
得る事ができる。従って、上記表示データ出力手段を含
む前記表示手段や、印刷データ出力手段を含む印刷手段
を含む、イベント取得手段で取得したイベントとトレン
ド取得手段で取得した特定の語の経時的変化とを対応さ
せて出力する出力手段によって、本発明及び本実施形態
と同様の効果を得ることができる。
【0045】なお、以上の実施形態において説明した、
各装置、各部、各動作、各処理等に対しては、それらを
含む上位概念としての各手段(〜手段)により、実施形
態を構成することが可能である。例えば、「ステップ1
7またはステップ19において取得したイベントのデー
タとステップ21で取得したトレンドのデータとを表示
装置14に表示する(ステップ23)。」との記載に対
して、ステップ17またはステップ19において取得し
たイベントのデータとステップ21で取得したトレンド
のデータとを表示装置14に表示する表示制御手段を、
制御部11とは別に構成するようにしてもよい。同様
に、その他各種動作に対して「〜(動作)手段」等の上
位概念で実施形態を構成するようにしてもよい。
【0046】
【発明の効果】以上説明したように、本発明によると、
過去に発生したイベントどうしの関連を分析するための
情報として、イベントと特定の語の時間的変化とが対応
して表示されるので、イベントに関連する変化や現象の
分析や発見、認識されている変化や現象の原因や要因と
なっているイベントの分析や発見を容易化する事ができ
る。
【図面の簡単な説明】
【図1】本発明のイベント分析装置の一実施形態として
のコンピュータであり、本発明のイベント分析プログラ
ムが格納されたプログラム製品の一実施形態としての記
憶媒体の該プログラムが読み取られた、コンピュータの
構成を表したブロック図である。
【図2】図1の実施形態の関連語データベースに格納さ
れる関連語についてのデータを概念的に表す図である。
【図3】図1の実施形態によるイベント分析処理のメイ
ンの動作を説明するためのフローチャートである。
【図4】図1の実施形態によるイベント分析処理におい
て、表示装置に表示される期間設定画面を表す図であ
る。
【図5】イベント入力画面を表す図である。
【図6】図1の本実施形態によるイベント抽出処理の流
れを示すフローチャートである。
【図7】トレンド取得処理の動作の流れを表すフローチ
ャートである。
【図8】図1の本実施形態によるイベント・トレンド表
示画面を表した図である。
【図9】特定の語の経時的変化として、特定の語を開始
語として、この開始語から共起しながら遷移していく遷
移語(共起ターム)の移り変わりを、前記特定の語の経
時的変化として取得し、表示する場合を説明する図であ
る。
【符号の説明】
11 制御部 111 CPU 112 ROM 113 RAM 1131 イベント文書格納エリア 1133 トレンド文書格納エリア 1137 イベント・トレンド格納エリア 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 161 仮名漢字変換辞書 162 プログラム格納部 164 文書データベース 165 イベントデータベース 166 関連語データベース 17 記憶媒体駆動装置 18 通信制御装置 19 入出力I/F 20 文字認識装置 21 データバス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 土居功志 徳島県徳島市沖浜東3丁目46番地 株式会 社ジャストシステム内 (72)発明者 三ツ矢浩之 徳島県徳島市沖浜東3丁目46番地 株式会 社ジャストシステム内 Fターム(参考) 5B075 ND03 PP02 PP03 PP13 PQ02 PQ22 PQ27 PQ72 PR04 5B091 AA11 AB13

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 過去に発生したイベントをそのイベント
    の発生時期とともに取得するイベント取得手段と、 過去の複数の文書をその文書の発生時期とともに取得す
    る文書取得手段と、 前記文書取得手段で取得した前記文書における特定の語
    の経時的変化を取得するトレンド取得手段と、 前記イベント取得手段で取得した前記イベントと前記ト
    レンド取得手段で取得した前記特定の語の経時的変化と
    を対応させて表示する表示手段とを備えることを特徴と
    するイベント分析装置。
  2. 【請求項2】 前記トレンド取得手段は、前記文書取得
    手段で取得した前記文書中における前記特定の語につい
    ての所定の統計量に基づいて前記特定の語の経時的変化
    を取得することを特徴とする請求項1に記載のイベント
    分析装置。
  3. 【請求項3】 前記トレンド取得手段は、前記文書取得
    手段で取得された前記文書に含まれる前記特定の語を開
    始語として、該開始語から共起しながら遷移していく遷
    移語を、前記特定の語の経時的変化として取得すること
    を特徴とする請求項1に記載のイベント分析装置。
  4. 【請求項4】 過去に発生したイベントをそのイベント
    の発生時期とともに取得するイベント取得機能と、 過去の複数の文書をその文書の発生時期とともに取得す
    る文書取得機能と、 前記文書取得機能で取得した前記文書における特定の語
    の経時的変化を取得するトレンド取得機能と、 前記イベント取得機能で取得した前記イベントと前記ト
    レンド取得機能で取得した前記特定の語の経時的変化と
    を対応させて表示する表示機能とを実現するためのイベ
    ント分析プログラムが格納されたプログラム製品。
JP2000023539A 2000-02-01 2000-02-01 イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置 Pending JP2001216311A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000023539A JP2001216311A (ja) 2000-02-01 2000-02-01 イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000023539A JP2001216311A (ja) 2000-02-01 2000-02-01 イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Publications (1)

Publication Number Publication Date
JP2001216311A true JP2001216311A (ja) 2001-08-10

Family

ID=18549682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000023539A Pending JP2001216311A (ja) 2000-02-01 2000-02-01 イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Country Status (1)

Country Link
JP (1) JP2001216311A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079412A (ja) * 2004-09-10 2006-03-23 Nippon Telegr & Teleph Corp <Ntt> イベント情報抽出方法及び装置及びプログラム
WO2007043322A1 (ja) * 2005-09-30 2007-04-19 Nec Corporation トレンド評価装置と、その方法及びプログラム
WO2009075061A1 (ja) * 2007-12-12 2009-06-18 Kenji Yoshida 情報入力装置、情報処理装置、情報入力システム、情報処理システム、2次元書式情報サーバ、情報入力方法、制御プログラム、および記録媒体
JP2009199356A (ja) * 2008-02-21 2009-09-03 Osaka Univ ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム
WO2010128574A1 (ja) * 2009-05-07 2010-11-11 日本電気株式会社 判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体
JPWO2009096523A1 (ja) * 2008-01-30 2011-05-26 日本電気株式会社 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
US8073851B2 (en) 2008-03-10 2011-12-06 Panasonic Corporation Content searching device and content searching method
WO2012115254A1 (ja) * 2011-02-25 2012-08-30 楽天株式会社 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
WO2012169432A1 (ja) 2011-06-07 2012-12-13 株式会社 東芝 注目評価対象抽出装置及びプログラム
JP2013257765A (ja) * 2012-06-13 2013-12-26 Ntt Data Corp 用語抽出装置、用語抽出方法およびプログラム
JP2017146992A (ja) * 2010-07-09 2017-08-24 ネイバー コーポレーションNAVER Corporation 検索サービスシステムおよび検索サービス提供方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4496900B2 (ja) * 2004-09-10 2010-07-07 日本電信電話株式会社 イベント情報抽出装置及びプログラム
JP2006079412A (ja) * 2004-09-10 2006-03-23 Nippon Telegr & Teleph Corp <Ntt> イベント情報抽出方法及び装置及びプログラム
JP5067556B2 (ja) * 2005-09-30 2012-11-07 日本電気株式会社 トレンド評価装置と、その方法及びプログラム
WO2007043322A1 (ja) * 2005-09-30 2007-04-19 Nec Corporation トレンド評価装置と、その方法及びプログラム
WO2009075061A1 (ja) * 2007-12-12 2009-06-18 Kenji Yoshida 情報入力装置、情報処理装置、情報入力システム、情報処理システム、2次元書式情報サーバ、情報入力方法、制御プログラム、および記録媒体
JP5582563B2 (ja) * 2007-12-12 2014-09-03 健治 吉田 情報入力装置、情報処理装置、情報入力システム、情報処理システム、2次元書式情報サーバ、情報入力方法、制御プログラム、および記録媒体
JPWO2009096523A1 (ja) * 2008-01-30 2011-05-26 日本電気株式会社 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
JP2009199356A (ja) * 2008-02-21 2009-09-03 Osaka Univ ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム
US8073851B2 (en) 2008-03-10 2011-12-06 Panasonic Corporation Content searching device and content searching method
WO2010128574A1 (ja) * 2009-05-07 2010-11-11 日本電気株式会社 判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体
JP5440814B2 (ja) * 2009-05-07 2014-03-12 日本電気株式会社 判定装置、判定方法、及びプログラム
JP2017146992A (ja) * 2010-07-09 2017-08-24 ネイバー コーポレーションNAVER Corporation 検索サービスシステムおよび検索サービス提供方法
JP2012178026A (ja) * 2011-02-25 2012-09-13 Rakuten Inc 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN103262079A (zh) * 2011-02-25 2013-08-21 乐天株式会社 检索装置、检索方法、检索程序、及存储该程序的计算机可读取记录介质
KR101346927B1 (ko) * 2011-02-25 2014-01-03 라쿠텐 인코포레이티드 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
WO2012115254A1 (ja) * 2011-02-25 2012-08-30 楽天株式会社 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN103262079B (zh) * 2011-02-25 2015-04-01 乐天株式会社 检索装置及检索方法
WO2012169432A1 (ja) 2011-06-07 2012-12-13 株式会社 東芝 注目評価対象抽出装置及びプログラム
CN103460206A (zh) * 2011-06-07 2013-12-18 株式会社东芝 注目评价对象提取装置及程序
CN103460206B (zh) * 2011-06-07 2016-10-12 株式会社东芝 注目评价对象提取装置及方法
US10769534B2 (en) 2011-06-07 2020-09-08 Kabushiki Kaisha Toshiba Evaluation target of interest extraction apparatus and program
JP2013257765A (ja) * 2012-06-13 2013-12-26 Ntt Data Corp 用語抽出装置、用語抽出方法およびプログラム

Similar Documents

Publication Publication Date Title
Edhlund et al. NVivo 12 essentials
US9864741B2 (en) Automated collective term and phrase index
US20030115192A1 (en) One-step data mining with natural language specification and results
Edhlund et al. Nvivo 11 essentials
WO2009154153A1 (ja) 文書検索システム
US9922383B2 (en) Patent claims analysis system and method
CN108885611B (zh) 文档自动化
US10620822B2 (en) Method and system for selecting and providing content of interest
EP2727009A2 (en) Automatic classification of electronic content into projects
US20130007747A1 (en) Method and apparatus for managing a working task based on a communication message
WO2002073531A1 (en) One-step data mining with natural language specification and results
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
JP2001216311A (ja) イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
Zhu et al. Extracting relevant named entities for automated expense reimbursement
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JPH1145289A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP5470308B2 (ja) 法令分析支援装置、法令分析支援方法、及び法令分析支援プログラム
JP4252786B2 (ja) 質問応答装置、質問応答方法、及び質問応答プログラム
JP5550959B2 (ja) 文書処理システム、及びプログラム
Grady Mining legal data: Collecting and analyzing 21st Century gold
JP2000353163A (ja) データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体
JP2001101162A (ja) 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
JP4877930B2 (ja) 文書処理装置及び文書処理方法
JP2000194725A (ja) 類似グル―プ抽出装置、及び類似グル―プ抽出プログラムが記憶された記憶媒体
JPH1145281A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090924