JP5389764B2 - マイクロブログテキスト分類装置及び方法及びプログラム - Google Patents

マイクロブログテキスト分類装置及び方法及びプログラム Download PDF

Info

Publication number
JP5389764B2
JP5389764B2 JP2010224166A JP2010224166A JP5389764B2 JP 5389764 B2 JP5389764 B2 JP 5389764B2 JP 2010224166 A JP2010224166 A JP 2010224166A JP 2010224166 A JP2010224166 A JP 2010224166A JP 5389764 B2 JP5389764 B2 JP 5389764B2
Authority
JP
Japan
Prior art keywords
text
designated
character string
microblog
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010224166A
Other languages
English (en)
Other versions
JP2012079121A (ja
Inventor
京介 西田
考 藤村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010224166A priority Critical patent/JP5389764B2/ja
Publication of JP2012079121A publication Critical patent/JP2012079121A/ja
Application granted granted Critical
Publication of JP5389764B2 publication Critical patent/JP5389764B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、マイクロブログテキスト分類装置及び方法及びプログラムに係り、特に、利用者が与える任意の指定文字列に関連するか否かを、データ圧縮の特性を利用して分類するためのマイクロブログテキスト分類装置及び方法及びプログラムに関する。
近年ではマイクロブログ(ミニブログとも呼ばれる)という、主に利用者自身の現在の状況や雑感などを短いテキストで記すウェブサイトが普及している。マイクロブログは、更新が容易で、リアルタイム性に優れているため、インターネット上での第一次情報源としての役割を担い得る、重要なメディアである。
大勢のユーザによって大量に投稿されるマイクロブログのテキスト集合から、ユーザが望む情報に関連したテキストのみを抽出することは大きな技術課題である。従来技術として、指定した文字列(キーワード)が含まれるテキストを抽出するキーワード検索が利用可能である。例えば、「口蹄疫」という家畜の感染病に関する情報を調べたい際は、キーワード検索で「口蹄疫」を入力すれば、「口蹄疫」という文字列が含まれるテキストを抽出することができる。しかし、キーワード検索では、ユーザが望む情報に関連したテキストでも、指定した文字列が含まれていないテキストを抽出することはできず、マイクロブログという短いテキストを扱うメディアでは、網羅性の高い検索を行うことができない。
次に、指定したタグが含まれるテキストを抽出するタグ検索が利用可能である。利用者がタグと呼ばれる短い文字列を付与してテキストを投稿することで、同じ話題に関するテキストを(他者のテキストも含めて)グループ化し、検索・閲覧に役立てている。例えば、口蹄疫に関するタグの一例として「#kouteieki」があり、このタグを用いると、
・「昨日の参議院農林水産委員会の動画を書き起こしました。→ http://sample.url/blGD2H #kouteieki」
・「県知事が記者会見。種牛殺処分へ。 #kouteiki」
という、「口蹄疫」が含まれていないテキストも抽出することができる。しかし、全ての利用者がタグを使用しているわけではないため、タグ検索の網羅性も十分ではない。
ここで、指定した文字列(タグを含む任意の文字列)が含まれるテキスト集合を基に、入力されたテキストが指定した文字列に関連するかどうかを分類することで、検索の網羅性を高めることが可能である。
通常のブログのテキスト分類(例えば、特許文献1、非特許文献1参照)では、テキストを形態素解析によって素性(形態素)に分割した後に各素性と分類対象の関連性を、テキスト分類アルゴリズムによって学習する(例えば、非特許文献2参照)。しかし、マイクロブログでは他メディアに比べて、くだけた日本語表現が多く、辞書に登録されていない新奇語も日々出現するため、形態素解析の精度が低く、結果として分類精度も低くなってしまう。さらに、形態素解析を用いる場合は、日本語以外の言語で記述されたテキストの分類精度が大きく落ちる。また、連続するn文字を素性とするn-gram(通常、nには1〜3程度が選ばれる)では、くだけた表現にも新奇語にも対応し易いが、形態素解析を用いて得た素性より精度が低くなることが知られている。
また、マイクロブログは非常にリアルタイム性が高いため、ユーザは現在に関連するテキストを投稿する傾向が強い。このため、同じタグが含まれるテキストでも、テキストの内容は時間と共に大きく変化していく。例えば、「記者会見」という文字列は、ある時刻においては「#kouteieki(口蹄疫)」タグに強く関連するが、その1時間前には「#kouteieki」が含まれるテキスト集合に全く登場していない文字列であり、他の異なるタグに強く関連する文字列であった。テキスト分類器は、このような変化に対して素早く適応しなければならない。さらに、マイクロブログでは短時間の間に、非常に多くのテキストが投稿されるため、分類や学習処理が高速に行える手法でなければならない。
特開2008−310626号公報
T. Ohkura, Y. Kiyota, and H. Nakagawa. Browsing system for weblog articles based on automated folksonomy. In Proc. WWW 2006 Workshop on Weblogging Ecosystem: Aggregation, Analysis, and Dynamics, 2006. M. Dredze, K. Crammer, F. Pereira. "Confidence-Weighted Linear Classification", Proceedings of the 25th international conference on Machine learning, Pages: 264-271, 2008.
上記のように、現在はマイクロブログという、短く、くだけた文体で、高いリアルタイム性を持ったテキストが投稿されるメディアに対して、利用者が望む情報に関連するテキストのみを、高速に、高い精度を実現して分類できる技術は存在しない。
本発明は、上記従来技術の問題点に鑑みて、形態素解析やn-gram分割の必要が無く、どんな言語で記述されたテキストに対しても、指定テキスト集合の傾向変化に高速に適応しながら、高い分離精度を実現するマイクロブログテキスト分類装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するために、本発明(請求項1)は、マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類装置であって、
前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
連結されたテキストを格納する連結テキスト記憶手段と、
前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析手段と、
前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結手段と、
前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮手段と、
前記データ圧縮手段で求められた前記圧縮後のデータサイズを基に、前記入力テキストの、指定文字列への関連スコアを求めるスコア出力手段と、
前記スコア出力手段の関連スコアに基づいて、前記入力テキストを前記指定文字列に関連するか否かを分類するテキスト分類手段と、を有する。
また、本発明(請求項2)は、前記スコア出力手段に、
データ圧縮後のデータサイズの差分と、短いテキストのスコアが小さくなり過ぎないようにするためのスムージングパラメータを用いて前記関連スコアを求める手段を含む。
また、本発明(請求項3)は、マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類方法であって、
前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
連結されたテキストを格納する連結テキスト記憶手段と、を有する装置において、
テキスト解析手段が、前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析ステップと、
テキスト連結手段が、前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結ステップと、
テキスト圧縮手段が、前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮ステップと、
スコア出力手段が、前記データ圧縮ステップで求められた前記圧縮後のデータサイズを基に、前記入力テキストの、前記指定文字列への関連スコアを求めるスコア出力手段と、
テキスト分類手段が、前記スコア出力手段の関連スコアに基づいて、前記入力テキストを指定文字列に関連するか否かを分類するテキスト分類ステップと、を行う。
また、本発明(請求項4)は、前記スコア出力ステップにおいて、
データ圧縮後のデータサイズの差分と、短いテキストのスコアが小さくなり過ぎないようにするためのスムージングパラメータを用いて前記関連スコアを求める。
また、本発明(請求項5)は、請求項1または2記載のマイクロブログテキスト分類装置を構成する各手段としてコンピュータを機能させるためのマイクロブログテキスト分類プログラムである。
上記のように構成された請求項1記載のマイクロブログテキスト分類装置によれば、入力テキストが、利用者が指定した文字列が含まれる指定テキストの集合と、指定テキストを除く比較テキストの集合の、どちらと強い関連を示すかについて、データ圧縮を利用して分類するので、形態素解析やn-gram分割の必要が無く、どんな言語で記述されたテキストに対しても、指定テキスト集合の傾向変化に高速に適応しながら、高い分離精度を実現するテキスト分類が実現できる。
本発明の一実施の形態におけるマイクロブログテキスト分類装置の構成図である。 本発明の一実施の形態におけるマイクロブログテキスト分類装置の動作のフローチャートである。 本発明の一実施の形態におけるデータ構造とスコア出力例である。 本発明の一実施の形態におけるマイクロブログテキスト分類の例である。
以下、図面と共に本発明の実施の形態を説明する。
図1は、本発明の一実施の形態におけるマイクロブログテキスト分類装置の構成を示す。
同図に示すマイクロブログテキスト分類装置は、テキスト解析部10とテキスト連結部20とテキスト圧縮部30とスコア出力部40とテキスト分類部50指定テキスト記憶部60と比較テキスト記憶部70と連結テキスト記憶部80から構成され、マイクロブログのテキストと利用者が指定する文字列を入力として受け取り、入力テキストが指定文字列に関連するか否かを分類する。上記の構成のうち、指定テキスト記憶部60、比較テキスト記憶部70、連結テキスト記憶部80は、ハードディスクやメモリ等の記憶媒体である。
指定テキスト記憶部60には、指定文字列を含む入力テキストが格納される。
比較テキスト記憶部70には、指定文字列を含まない入力テキストが格納される。
連結テキスト記憶部80は、テキスト連結部20により連結されたテキストが格納される。
図2は、本発明の一実施の形態におけるマイクロブログテキスト分類装置の動作フローチャートである。
ステップ1)テキスト解析部10は、入力テキスト(マイクロブログテキスト)に、利用者が指定する指定文字列が含まれるか否かを判定する。ここで、指定文字列とは、タグ(#から始まる文字列)、ユーザ名
Figure 0005389764
タグやユーザ名を除く任意のキーワードなど、如何なる文字列でも良い。
入力テキストに指定文字列が含まれない場合はステップ2に進む。入力テキストに指定文字列が含まれる場合はステップ8に進む。
ステップ2)テキスト連結部20は、指定テキスト記憶部60が格納するテキスト集合を連結し、指定連結テキストAを出力する。このとき、テキストは時間順に(古い物ほどテキストの前方にくるように)連結する。
ステップ3)テキスト連結部20は、比較テキスト記憶部70が格納するテキスト集合を連結し、比較連結テキストBを出力する。このとき、テキストは時間順に(古い物ほどテキストの前方にくるように)連結する。
ステップ4)テキスト連結部20は、指定連結テキストAの後に入力テキストを連結したテキストAxと、比較連結テキストBの後に入力テキストxを連結したテキストBxを連結テキスト記憶部80に出力する。
ステップ5)テキスト圧縮部30は、連結テキスト記憶部80から読み出したテキストA、B、Ax、Bxをそれぞれ圧縮して、各テキストの圧縮後サイズZ(A)、Z(B)、Z(Ax)、Z(Bx)を求める。ここで、テキスト圧縮部30は、文献1(Peter Deutsch, "RFC 1951 DEFLATE Compressed Data Format Specification version 1.3", Network Working Group, Request for Comments: 1951, May 1996.)で示されるdeflateなどの公知アルゴリズムのうち、いかなる物を使用しても良い。
ステップ6)スコア出力部40は、テキスト圧縮部30の出力結果Z(A)、Z(B)、Z(Ax)、Z(Bx)を用いて、以下の式により入力テキストxの関連スコアS(x)を算出する。
Figure 0005389764
ここで、γはスムージングパラメータで、短い入力テキストのスコアが小さくなりすぎることと、ゼロ除算を防ぐ目的で用いられる(γ=5などを用いる)。なお、入力テキストxに指定文字列が含まれている場合は、S(x)=0とする。
図3に、マイクロブログテキスト分類装置のデータ構造と、スコア出力例を示す。指定連結テキストAと入力テキストxの間で一致する文字列が多く含まれ、指定連結テキストAを事前情報として用いると入力テキストxを圧縮しやすくなる場合、Z(Ax)−Z(A)の値はゼロに近づく。一方、比較連結テキストBと入力テキストxの間に関連が無い場合、入力テキストxは圧縮されにくいため、Z(Bx)−Z(B)の値がZ(Ax)−Z(A)に比べて大きくなる。データ圧縮による分類は、文献2(Dario Benedetto, Emanuele Caglioti, and Vittorio Loreto, "Language Trees and Zipping", Physical Review Letters, 88:4, 2002)などにより公知であるが、本発明は、圧縮後サイズの差分の比率とスムージングパラメータの適用により、マイクロブログの短いテキストを、利用者が指定する指定文字列に関連するか否かを分類することを可能とする。
ここで、データ圧縮では、形態素解析などを行う必要は無く、いかなる言語で記述されたテキストも精度を落とすことなく扱える。また、非常にシンプルな分類手法であり、従来のテキスト分類器に比べ高速な分類が可能となる。さらに、テキストは時間順に連結されるため、多くのユーザが一斉に同内容のテキストを投稿したような場合はテキストが圧縮されやすくなり、高い分類精度を実現しやすい。
ステップ7)テキスト解析部10は、ステップ1において入力テキストに指定文字列が含まれる場合は、入力テキストを指定テキスト記憶部60に格納する。テキスト解析部10は、入力テキストに指定文字列が含まれない場合は、入力テキストを比較テキスト記憶部70に格納する。
なお、比較テキスト記憶部70に格納する対象のテキストは、指定文字列が含まれるテキストを除く全てのテキストとする。また、指定文字列でタグが指定された場合は、全てのタグが含まれるテキストから前記指定タグを含むテキストを除いたテキストとしてもよい。さらに、指定文字列でユーザ名が指定された場合は、全てのユーザ名が含まれるテキストから前記ユーザ名を含むテキストを除いたテキストとしても良い。
また、指定テキスト記憶部60と比較テキスト記憶部70に格納するテキストの量については、計算量の減少と、ごく最近の傾向を強く反映させるために、最新のN個のテキストや、過去T時間以内のテキスト、最新のMサイズ分のテキストに限定させても良い。
本発明の学習処理は、本ステップに関する処理のみであり、非常に高速な学習が実現できる。
ステップ8)テキスト分類部50は、スコア出力部40の出力結果に基づき、スコアS(x)が閾値θよりも小さい場合に、入力テキストxが指定文字列に関連していると分類する。
閾値θの値を小さく設定すると、高い精度で分類が可能になり、閾値θの値を大きく設定すると、高い網羅率を実現する分類が可能になる。θの値には1.0 などを利用する。
図4に、θ=1.0とした場合のマイクロブログのテキスト分類結果の例を示す。口蹄疫に関連するテキストのみが抽出できていることがわかる。
上記のように、指定の文字列を含むサンプルテキストがあり、サンプルテキストを圧縮したサイズをA、サンプルテキストと入力テキストを連結させて圧縮したサイズをAxとしたとき、テキストxが指定文字列との関係が深いのであれば、効率よく圧縮されAとAxの差(関連度合い)は小さくなる。この数値が小さいほど関連度が深いことになる。従って、マイクロブログのような短いテキストxであっても、指定文字列に関連するかを容易に判定することが可能となる。
また、本発明は、図1に示す構成要素の動作をプログラムとして構築し、マイクロブログテキスト分類装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクやフレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
本発明は、マイクロブログテキストを、利用者が指定する文字列に関連するか否かを分類可能な手法であり、情報検索の支援に利用可能である。
10 テキスト解析部
20 テキスト連結部
30 テキスト圧縮部
40 スコア出力部
50 テキスト分類部
60 指定テキスト記憶部
70 比較テキスト記憶部
80 連結テキスト記憶部

Claims (5)

  1. マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類装置であって、
    前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
    前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
    連結されたテキストを格納する連結テキスト記憶手段と、
    前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析手段と、
    前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結手段と、
    前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮手段と、
    前記データ圧縮手段で求められた前記圧縮後のデータサイズを基に、前記入力テキストの、指定文字列への関連スコアを求めるスコア出力手段と、
    前記スコア出力手段の関連スコアに基づいて、前記入力テキストを前記指定文字列に関連するか否かを分類するテキスト分類手段と、
    を有することを特徴とするマイクロブログテキスト分類装置。
  2. 前記スコア出力手段は、
    データ圧縮後のデータサイズの差分と、短いテキストのスコアが小さくなり過ぎないようにするためのスムージングパラメータを用いて前記関連スコアを求める手段を含む
    請求項1記載のマイクロブログテキスト分類装置。
  3. マイクロブログの入力テキストを、利用者が与える任意の指定文字列に関連するか否かを分類する、マイクロブログテキスト分類方法であって、
    前記指定文字列が含まれる指定テキストを記憶する指定テキスト記憶手段と、
    前記指定テキストを除く比較テキストを記憶する比較テキスト記憶手段と、
    連結されたテキストを格納する連結テキスト記憶手段と、を有する装置において、
    テキスト解析手段が、前記入力テキストに、前記指定文字列が含まれるか否かを判定するテキスト解析ステップと、
    テキスト連結手段が、前記指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと前記入力テキストを連結したテキストと、前記比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを前記連結テキスト記憶手段に出力するテキスト連結ステップと、
    テキスト圧縮手段が、前記連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求めるテキスト圧縮ステップと、
    スコア出力手段が、前記データ圧縮ステップで求められた前記圧縮後のデータサイズを基に、前記入力テキストの、前記指定文字列への関連スコアを求めるスコア出力手段と、
    テキスト分類手段が、前記スコア出力手段の関連スコアに基づいて、前記入力テキストを指定文字列に関連するか否かを分類するテキスト分類ステップと、
    を行うことを特徴とするマイクロブログテキスト分類方法。
  4. 前記スコア出力ステップにおいて、
    データ圧縮後のデータサイズの差分と、短いテキストのスコアが小さくなり過ぎないようにするためのスムージングパラメータを用いて前記関連スコアを求める
    請求項3記載のマイクロブログテキスト分類方法。
  5. 請求項1または2記載のマイクロブログテキスト分類装置を構成する各手段としてコンピュータを機能させるためのマイクロブログテキスト分類プログラム。
JP2010224166A 2010-10-01 2010-10-01 マイクロブログテキスト分類装置及び方法及びプログラム Expired - Fee Related JP5389764B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010224166A JP5389764B2 (ja) 2010-10-01 2010-10-01 マイクロブログテキスト分類装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010224166A JP5389764B2 (ja) 2010-10-01 2010-10-01 マイクロブログテキスト分類装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012079121A JP2012079121A (ja) 2012-04-19
JP5389764B2 true JP5389764B2 (ja) 2014-01-15

Family

ID=46239278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010224166A Expired - Fee Related JP5389764B2 (ja) 2010-10-01 2010-10-01 マイクロブログテキスト分類装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5389764B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201211853D0 (en) * 2012-07-04 2012-08-15 Qatar Foundation A system and method for event or entity analysis and exploration in microblogs
CN108334605B (zh) * 2018-02-01 2020-06-16 腾讯科技(深圳)有限公司 文本分类方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP2012079121A (ja) 2012-04-19

Similar Documents

Publication Publication Date Title
US10565244B2 (en) System and method for text categorization and sentiment analysis
US10110658B2 (en) Automatic genre classification determination of web content to which the web content belongs together with a corresponding genre probability
WO2017107566A1 (zh) 基于词向量相似度的检索方法和系统
JP5138046B2 (ja) 検索システム、検索方法およびプログラム
US20160098433A1 (en) Method for facet searching and search suggestions
US20160155058A1 (en) Non-factoid question-answering system and method
JP4922692B2 (ja) 検索クエリー作成装置
US20060179039A1 (en) Method and system for performing secondary search actions based on primary search result attributes
TW201514845A (zh) 從網頁擷取標題及主體
AU2016204573A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
JP2014149713A (ja) 画像評価装置
CN110879834A (zh) 一种基于循环卷积网络的观点检索系统及其观点检索方法
JP5020352B2 (ja) 名前付き要素マーク付け装置、名前付き要素マーク付け方法及びそのコンピュータ読出可能な媒体
Meuschke et al. A benchmark of pdf information extraction tools using a multi-task and multi-domain evaluation framework for academic documents
JP2009217689A (ja) 情報処理装置、情報処理方法、及びプログラム
JP5389764B2 (ja) マイクロブログテキスト分類装置及び方法及びプログラム
US9323721B1 (en) Quotation identification
US20140358522A1 (en) Information search apparatus and information search method
CN117149804A (zh) 数据处理方法、装置、电子设备及存储介质
JP2010250449A (ja) 情報処理装置、情報処理方法
JP5963310B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP2013222418A (ja) パッセージ分割方法、装置、及びプログラム
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP5206296B2 (ja) 類似文章抽出プログラム、方法、装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131001

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131009

R150 Certificate of patent or registration of utility model

Ref document number: 5389764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees