JP2012014643A - 期間別主題語句抽出装置及び方法及びプログラム - Google Patents

期間別主題語句抽出装置及び方法及びプログラム Download PDF

Info

Publication number
JP2012014643A
JP2012014643A JP2010153246A JP2010153246A JP2012014643A JP 2012014643 A JP2012014643 A JP 2012014643A JP 2010153246 A JP2010153246 A JP 2010153246A JP 2010153246 A JP2010153246 A JP 2010153246A JP 2012014643 A JP2012014643 A JP 2012014643A
Authority
JP
Japan
Prior art keywords
period
phrase
subject
document
statistical information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010153246A
Other languages
English (en)
Other versions
JP5436356B2 (ja
Inventor
Kyosuke Nishida
京介 西田
Takashi Fujimura
考 藤村
Takahide Hoshiide
高秀 星出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010153246A priority Critical patent/JP5436356B2/ja
Publication of JP2012014643A publication Critical patent/JP2012014643A/ja
Application granted granted Critical
Publication of JP5436356B2 publication Critical patent/JP5436356B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】期間毎の主題語句と主題語句間の関連度を同時に算出することで、話題の関連と推移の確認を可能にする。
【解決手段】方法は、文書集合を期間別に分割し、文書を語句の集合に分解し、各期間の文書のタイトル中に出現する語句の統計情報を集計し、各期間の文書の全文中に出現する語句の統計情報を集計し、タイトル中語句統計情報の集計結果と全文中語句統計情報の集計結果を基に、期間毎に主題を表す語句を複数抽出する。また、各主題語句が含まれる文書を収集し、収集結果を基に、2つの主題語句間の関連度を計算する。
【選択図】図1

Description

本発明は、期間別主題語句抽出装置及び方法及びプログラムに係り、特に、文書集合を期間別に集計し、各期間における文書のタイトル中に出現する語句の統計情報と各期間における文書の全文中に出現する語句の統計情報を基に、期間別の主題を表す語句と、抽出した全主題語句間の関連度を算出する期間別主題語句抽出装置及び方法及びプログラムに関する。
近年では情報科学の発展により、我々が扱う文書数は爆発的に増加している。これらの文書集合から、期間毎の主要な題目(主題)と、主題語句間の関連度を算出する手法の需要が高まっている。期間毎の主題語句と主題語句間の関連度が同時に算出できれば、話題の関連と推移を確認することが容易となる。
所望の時刻における話題性の強度を判定する話題度算出装置が公知である(例えば、特許文献1参照)。この話題度算出装置では、ある時刻における語句の話題度を数値として取得できるが、ある期間における話題度は算出できない。また、ある語句が話題であるかどうかの判断を行うには閾値の設定を行われねばならず、他の期間と比べ当該期間で話題になっている語句を統計的に判断して収集することができない。また、従来技術における、閾値を代表としたパラメータのチューニングは非常に難しい。
また、文書が属するカテゴリ別に主題語を抽出する主題語抽出技術がある(例えば、特許文献2参照)。しかし、この主題語抽出技術では期間別の主題語を抽出することはできない。また、抽出した主題語句間の関連度も算出できない。
各期間の主題語句と、主題語句間の関連度が算出できれば、例えば特許文献2にて公知の可視化技術などを用いて、期間別の主題語とその関連を一目で確認できる。
特開2007−323434号公報 特開2009−86859号公報
上記のように、現在は期間毎に主題語句を抽出し、抽出した主題語句間の関連度と併せて出力する技術は存在しない。また、従来技術では、入力する文書集合に合わせてパラメータチューニングを実施する必要がある。
本発明は、上記従来技術の問題点に鑑みて、文書を期間別に集計し、各期間における文書のタイトル中における語句の出現に関する統計情報と、各期間における文書の全文中における語句の出現に関する統計情報を基に、期間毎に主題を表す語句を統計的に抽出し、全主題語句間の関連度を計算する期間別主題語句抽出装置及び方法及びプログラムを提供すること、を目的とするものである。
上記の課題を解決するため、本発明(請求項1)は、文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出装置であって、
文書集合を期間別に分割する期間別文書分割手段と、
文書を語句の集合に分解する形態素解析手段と、
各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計手段と、
各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計手段と、
前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計手段の集計結果と前記第2の記憶手段に格納されている全文中語句統計情報手段の集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出手段と、を有する。
また、本発明(請求項2)は、各主題語句が含まれる文書を収集する主題語句文書収集手段と、
前記主題語句文書収集手段の収集結果を基に、2つの主題語句間の関連度を計算する主題語句関連度算出手段を更に有する。
また、本発明(請求項3)は、期間別文書分割手段、形態素解析手段、タイトル中統計情報集計手段、全文中語句統計情報集計手段、主題語句抽出手段、記憶手段を有する装置において、文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出方法であって、
前記期間別文書分割手段が、前記文書集合を期間別に分割する期間別文書分割ステップと、
前記形態素解析手段が、文書を語句の集合に分解する形態素解析ステップと、
前記タイトル中語句統計情報集計手段が、各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計ステップと、
全文中語句統計情報集計手段が、各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計ステップと、
前記主題語句抽出手段が、前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計ステップでの集計結果と前記第2の記憶手段に格納されている全文中語句統計情報ステップでの集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出ステップと、を行う。
また、本発明(請求項4)は、主題語句文書収集手段と主題語句関連度算出手段を更に有する装置において、
前記主題語句文書収集手段が、各主題語句が含まれる文書を収集する主題語句文書収集ステップと、
前記主題語句関連度算出手段が、前記主題語句文書収集ステップにおける収集結果を基に、2つの主題語句間の関連度を計算する主題語句関連度算出ステップと、を更に行う。
また、本発明(請求項5)は、請求項1または2に記載の期間別主題語句抽出装置を構成する各手段としてコンピュータを機能させるための期間別主題語句抽出プログラムである。
上記のように構成された期間別主題語句抽出装置によれば、期間別に集計した文書集合から、文書のタイトル中に出現する語句の統計情報と文書の全文中に出現する語句の統計情報とを区別して利用し、さらに、統計的検定を用いるので、期間別の主題を表す語句を、難解なパラメータチューニングを実施することなく抽出できる。
本発明の第1の実施の形態における主題語句抽出装置の構成図である。 本発明の第1の実施の形態における主題語句抽出装置の動作のフローチャートである。 本発明の第1の実施の形態における2008年8月における「北京五輪」に関するフィッシャーの正確確率検定を用いた主題語句判定の例である。 本発明の第1の実施の形態における2008年8月における語句が主題語句かどうかの判定の例である。 本発明の第2の実施の形態における主題語句抽出装置の構成図である。 本発明の第2の実施の形態における主題語句抽出装置の動作のフローチャートである。 本発明の第2の実施の形態における主題語句間の関連度の例である。
以下図面と共に、本発明の実施の形態を説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態における期間別主題語句抽出装置の構成を示す。
同図に示す期間別主題語句抽出装置10は、期間別文書分割部11と形態素解析部12とタイトル中語句統計情報集計部13と全文中語句統計情報集計部14と主題語句抽出部15から構成され、文書集合を入力として受け取り、期間別の主題語句を出力する。
図2は、本発明の第1の実施の形態における期間別主題語句抽出装置の動作のフローチャートである。
ステップ101)期間別文書分割部11は、入力文書を期間別にそれぞれ集計する。ここで、期間とは、一定の時期から他の一定の時期までの間で、「2010年1月1日〜2010年1月31日」「2010年2月1日〜2010年2月28日」などを指す。月単位・日単位・時間単位のいずれも指定可能で、各期間の長さは不均一でも良い。
ステップ102)形態素解析部12は、文書を受け取って語句に分割する。ここで、語句とは、1つ以上の形態素(名詞、形容詞、動詞)から構成される文字列を指す。
ステップ103)タイトル中語句統計情報集計部13は、期間cに属する文書のタイトル中に語句wが出現する文書数の合計Tc(w)をタイトル中の語句統計情報として、全期間・全語句について集計し、メモリ(図示せず)に格納する。
ステップ104)全文中語句統計情報集計部14は、期間cに属する文書の全文中に語句wが出現する文書数の合計Dc(w)を全文中の語句統計情報として、全期間・全語句について集計し、メモリ(図示せず)に格納する。
ここで、前記語句統計情報とは、語句の出現に関する情報の統計量(合計、比率、平均、尤度、中央値、最頻値、分散、標準偏差など)を意味するものであって、必ずしも語句の出現する文書数の合計に限られるものではなく、例えば、語句の出現する頻度、語句の出現する段落数、語句の出現する日数などで構成される統計量としても良い。
ステップ105)主題語句抽出部15は、メモリ(図示せず)に格納されている前記タイトル中の語句統計情報と前記全文中の語句統計情報を基に、「期間cに属する文書のタイトル中に語句wが出現する比率と、前記期間cを除く期間に属する文書の全文中に語句wが出現する比率が等しい」という帰無仮説の下でフィッシャーの正確確率検定の片側検定を行う。具体的には、前記期間cに属する文書(Nc個)のうち、タイトル中に前記語句wが出現する文書(Tc(w)個)の比率Tc(w)/Ncが、前記期間cを除く期間に属する文書のうち、全文中に語句wが出現する文書の比率
Figure 2012014643
よりも有意水準αで有意に高いとき(文献「金明哲、"テキストデータの統計科学入門",岩波書店、2009」参照)、語句wを期間cの主題語句として出力する。フィッシャーの正確確率検定は、カイ二乗検定に比べ、文書数が少ない場合でも正確に検定を行える利点がある。
図3は、フィッシャーの正確確率検定において、2008年8月において語句「北京五輪」が主題かどうかを判断するために用いる2×2の分割表である。この例では、2008年8月におけるタイトル中に「北京五輪」が出現する文書の比率44/4444が、他の期間における全文中に「北京五輪」出現する比率279/772822よりも有意に高いため(有意確率0.0001938が、有意水準α=0.01よりも低い)、「北京五輪」は主題語として抽出される。
図4は、有意水準α=0.01として抽出された2008年8月の主題を表す語句の例である。2008年8月と強く関連するオリンピックに関する語句が主題語句と判断される一方で、「プロ野球」という他の期間でも出現する語句については主題語句とは判断されていないことがわかる。
ここで、前記主題語句抽出部15とは、要するに、前記タイトル中の語句統計情報と前記全文中の語句統計情報を比較できる機能を有していればよく、具体的には、前記タイトル中の語句統計情報と前記全文中の語句統計情報の差分により順位付けした上位からN個の語句を抽出する機能などがある。また、前記期間cのタイトル中と前記期間cを除く期間の全文中という比較は、前記期間cのタイトル中と全期間の全文中という比較にしてもよい。
また、本発明で使用するパラメータは前記有意水準αのみであるが、統計的検定ではαとして0.05や0.01を用いることが一般的であり、入力する文書集合に合わせて変更する必要は無い。
[第2の実施の形態]
図5は、本発明の第2の実施の形態における主題語句抽出装置の構成を示す。
同図に示す期間別主題語句抽出装置20は、期間別文書分割部21と形態素解析部22とタイトル中語句統計情報集計部23と全文中語句統計情報集計部24と主題語句抽出部25と主題語句文書収集部26と主題語句関連度算出部27から構成される。図5に示す構成は、図1に示す主題語句抽出装置10主題語句文書収集部26と主題語句関連度算出部27が付加された構成であり、文書集合を入力として受け取り、期間別の主題語句と、主題語句間の関連度を出力する。
図6は、本発明の第2の実施の形態における主題語句抽出装置の動作のフローチャートである。
ステップ201〜205) 当該ステップは図4に示すステップ101〜105と同様の動作であるので、その説明を省略する。
ステップ206)主題語句別文書集計部は、各主題語句tが含まれる文書を、主題語句文書集合Stとして、全主題語句について収集する。
ステップ207)主題語句関連度算出部は、2つの主題語句tとtの主題語句文書集合StとStに含まれる語句wの情報を用いて、関連度R(t,t)を計算し、出力する。
Figure 2012014643
ここで、Nは前記Stに含まれる語句の種類数、Nは前記Stに含まれる語句の種類数、Nは前記Stと前記Stの両方に含まれる語句の種類数を表す。
なお、関連度Rは2つの主題語句文書集合の関連が分かるものであればいかなるものでもよく、Jaccard係数や、各語句の出現頻度をベクトル化してcosine similarityやユークリッド距離などを用いて計算してもよい。
図7は、主題語句間の関連度の例である。オリンピックに関する語句の関連度が他の語句に比べ高いことが分かる。
また、本発明は、Q&Aコミュニティ上の質問回答文書、ブログエントリ、ニュース記事など様々な文書集合に対して適用可能である。
上記の図1に示す第1の実施の形態における主題語句抽出装置の構成要素及び、図5に示す第2の実施の形態における主題語句抽出装置の構成要素の動作をプログラムとして構築し、主題語句抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスク、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されること無く、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、文書集合から期間別に主題語句を抽出し、主題語句間の関連度を計算可能な期間別主題語句抽出手法であり、情報整理の支援に利用可能である。
10,20 主題語句抽出装置
11,21 期間別文書分割部
12,22 形態素解析部
13,23 タイトル中語句統計情報集計部
14,24 全文中語句統計情報集計部
15,25 主題語句抽出部
20 主題語句抽出装置
26 主題語句文書収集部
27 主題語句関連度算出部

Claims (5)

  1. 文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出装置であって、
    文書集合を期間別に分割する期間別文書分割手段と、
    文書を語句の集合に分解する形態素解析手段と、
    各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計手段と、
    各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計手段と、
    前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計手段の集計結果と前記第2の記憶手段に格納されている全文中語句統計情報手段の集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出手段と、
    を有することを特徴とする期間別主題語句抽出装置。
  2. 各主題語句が含まれる文書を収集する主題語句文書収集手段と、
    前記主題語句文書収集手段の収集結果を基に、2つの主題語句間の関連度を計算する主題語句関連度算出手段を
    更に有する請求項1記載の期間別主題語句抽出装置。
  3. 期間別文書分割手段、形態素解析手段、タイトル中統計情報集計手段、全文中語句統計情報集計手段、主題語句抽出手段、記憶手段を有する装置において、文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出方法であって、
    前記期間別文書分割手段が、前記文書集合を期間別に分割する期間別文書分割ステップと、
    前記形態素解析手段が、文書を語句の集合に分解する形態素解析ステップと、
    前記タイトル中語句統計情報集計手段が、各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計ステップと、
    全文中語句統計情報集計手段が、各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計ステップと、
    前記主題語句抽出手段が、前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計ステップでの集計結果と前記第2の記憶手段に格納されている全文中語句統計情報ステップでの集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出ステップと、
    を行うことを特徴とする期間別主題語句抽出方法。
  4. 主題語句文書収集手段と主題語句関連度算出手段を更に有する装置において、
    前記主題語句文書収集手段が、各主題語句が含まれる文書を収集する主題語句文書収集ステップと、
    前記主題語句関連度算出手段が、前記主題語句文書収集ステップにおける収集結果を基に、2つの主題語句間の関連度を計算する主題語句関連度算出ステップと、
    を更に行う請求項3記載の期間別主題語句抽出方法。
  5. 請求項1または2に記載の期間別主題語句抽出装置を構成する各手段としてコンピュータを機能させるための期間別主題語句抽出プログラム。
JP2010153246A 2010-07-05 2010-07-05 期間別主題語句抽出装置及び方法及びプログラム Expired - Fee Related JP5436356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010153246A JP5436356B2 (ja) 2010-07-05 2010-07-05 期間別主題語句抽出装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010153246A JP5436356B2 (ja) 2010-07-05 2010-07-05 期間別主題語句抽出装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012014643A true JP2012014643A (ja) 2012-01-19
JP5436356B2 JP5436356B2 (ja) 2014-03-05

Family

ID=45600953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010153246A Expired - Fee Related JP5436356B2 (ja) 2010-07-05 2010-07-05 期間別主題語句抽出装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5436356B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101758555B1 (ko) * 2016-03-08 2017-07-17 아주대학교산학협력단 토픽 표현 추출 방법 및 그 시스템
KR101782465B1 (ko) 2016-06-03 2017-09-29 조선대학교산학협력단 설화 데이터 내 서사정보 추출 시스템 및 방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 単語使用パターンの時間的変化を利用した検索方法および情報検索装置
JP2002521767A (ja) * 1998-07-31 2002-07-16 ジーティーイー サービス コーポレイション 確率を利用した情報検索装置
JP2004145753A (ja) * 2002-10-25 2004-05-20 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法及び装置及び文書検索プログラム
JP2006139716A (ja) * 2004-11-15 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2007011662A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 話題規模管理装置
JP2007011651A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 文書処理装置
JP2008117351A (ja) * 2006-11-08 2008-05-22 Nomura Research Institute Ltd 検索システム
JP2009134378A (ja) * 2007-11-29 2009-06-18 Hitachi Systems & Services Ltd 文書群提示装置および文書群提示プログラム
JP2011070291A (ja) * 2009-09-24 2011-04-07 Nec Biglobe Ltd トピックワード抽出装置、トピックワード抽出システム、トピックワード抽出方法、及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 単語使用パターンの時間的変化を利用した検索方法および情報検索装置
JP2002521767A (ja) * 1998-07-31 2002-07-16 ジーティーイー サービス コーポレイション 確率を利用した情報検索装置
JP2004145753A (ja) * 2002-10-25 2004-05-20 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法及び装置及び文書検索プログラム
JP2006139716A (ja) * 2004-11-15 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2007011662A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 話題規模管理装置
JP2007011651A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 文書処理装置
JP2008117351A (ja) * 2006-11-08 2008-05-22 Nomura Research Institute Ltd 検索システム
JP2009134378A (ja) * 2007-11-29 2009-06-18 Hitachi Systems & Services Ltd 文書群提示装置および文書群提示プログラム
JP2011070291A (ja) * 2009-09-24 2011-04-07 Nec Biglobe Ltd トピックワード抽出装置、トピックワード抽出システム、トピックワード抽出方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101758555B1 (ko) * 2016-03-08 2017-07-17 아주대학교산학협력단 토픽 표현 추출 방법 및 그 시스템
KR101782465B1 (ko) 2016-06-03 2017-09-29 조선대학교산학협력단 설화 데이터 내 서사정보 추출 시스템 및 방법

Also Published As

Publication number Publication date
JP5436356B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
TWI653542B (zh) 一種基於網路媒體資料流程發現並跟蹤熱點話題的方法、系統和裝置
Stamatatos et al. Clustering by authorship within and across documents
US9558263B2 (en) Identifying and displaying relationships between candidate answers
US9336485B2 (en) Determining answers in a question/answer system when answer is not contained in corpus
US7461056B2 (en) Text mining apparatus and associated methods
US7783476B2 (en) Word extraction method and system for use in word-breaking using statistical information
US7895205B2 (en) Using core words to extract key phrases from documents
Gambette et al. Visualising a text with a tree cloud
Olariu Efficient online summarization of microblogging streams
US9251248B2 (en) Using context to extract entities from a document collection
Stede et al. The climate change debate and natural language processing
CN106202034B (zh) 一种基于依存约束和知识的形容词词义消歧方法和装置
He et al. Twitter summarization with social-temporal context
Hofmann et al. Predicting the growth of morphological families from social and linguistic factors
JP5436356B2 (ja) 期間別主題語句抽出装置及び方法及びプログラム
Angrosh et al. Context identification of sentences in research articles: Towards developing intelligent tools for the research community
CN106126501B (zh) 一种基于依存约束和知识的名词词义消歧方法和装置
CN106202033B (zh) 一种基于依存约束和知识的副词词义消歧方法和装置
EP3040932A1 (en) A method for tracking discussion in social media
Graf-Vlachy et al. Text and team: what article metadata characteristics drive citations in software engineering?
Ghorai An Information Retrieval System for FIRE 2016 Microblog Track.
Kubek et al. Automatic taxonomy extraction through mining social networks
Nguyen et al. Event detection from social data stream based on time-frequency analysis
CN112700830B (zh) 从电子病历中提取结构化信息的方法、装置及存储介质
Hennig et al. Efficient event detection for the blogosphere

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131210

R150 Certificate of patent or registration of utility model

Ref document number: 5436356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees