JP2005122510A - 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 - Google Patents
話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP2005122510A JP2005122510A JP2003357372A JP2003357372A JP2005122510A JP 2005122510 A JP2005122510 A JP 2005122510A JP 2003357372 A JP2003357372 A JP 2003357372A JP 2003357372 A JP2003357372 A JP 2003357372A JP 2005122510 A JP2005122510 A JP 2005122510A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- segment
- topic
- word
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 121
- 239000013598 vector Substances 0.000 claims abstract description 110
- 230000008569 process Effects 0.000 claims description 101
- 230000011218 segmentation Effects 0.000 claims description 85
- 238000000605 extraction Methods 0.000 claims description 20
- 230000005484 gravity Effects 0.000 claims description 10
- 230000000877 morphologic effect Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、テキストを単語単位に分割し、概念ベースを検索することによって、各単語に対応するベクトルを取得し、単語ベクトルの系列からテキストを同一話題の区間であるセグメントの集合へ分割し、セグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングし、得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出し、クラスタ間の関係と、各クラスタの要約文を出力する。
【選択図】 図1
Description
形態素解析手段が、テキストを単語単位に分割する形態素解析過程と(ステップ1)、
単語ベクトル取得手段が、単語の意味を表現するベクトルが格納されている記憶手段である概念ベースを検索することによって、形態素解析過程で得られた各単語に対応するベクトルを取得する単語ベクトル取得過程と(ステップ2)、
トピックセグメンテーション手段が、単語ベクトル取得過程で得られた単語ベクトルの系列から、テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション過程と(ステップ3)、
セグメントクラスタリング手段が、トピックセグメンテーション過程で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング過程と(ステップ4)、
要約手段が、セグメントクラスタリング過程で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約過程と(ステップ5)、
話題構造出力手段が、セグメントクラスタリング過程で得られたクラスタ間の関係と、要約過程で得られた各クラスタの要約文を出力する話題構造出力過程と(ステップ6)、からなる。
要約過程において、要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する。
要約過程において、要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する。
トピックセグメンテーション過程で得られた各セグメント毎に、該トピックセグメンテーション過程において該セグメントSをより短い区間のセグメントの集合へ分割し、この結果得られた、該セグメントS内のセグメント集合をセグメントクラスタリング過程において階層的にクラスタリングする制御過程を更に併せ持つ。
テキストを単語単位に分割する形態素解析手段21と、
単語の意味を表現するベクトルが格納されている記憶手段である概念ベース27と、
概念ベース27を検索することによって、形態素解析手段21で得られた各単語に対応するベクトルを取得する単語ベクトル取得手段22と、
単語ベクトル取得手段22で得られた単語ベクトルの系列から、テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション手段23と、
トピックセグメンテーション手段23で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング手段24と、
セグメントクラスタリング手段24で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約手段25と、
セグメントクラスタリング手段24で得られたクラスタ間の関係と、要約手段25で得られた各クラスタの要約文を出力する話題構造出力手段26と、からなる。
要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する。
要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する。
テキストを単語単位に分割する形態素解析手段と、
単語の意味を表現するベクトルが格納されている記憶手段である概念ベースを検索することによって、形態素解析手段で得られた各単語に対応するベクトルを取得する単語ベクトル取得手段と、
単語ベクトル取得手段で得られた単語ベクトルの系列から、テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション手段と、
トピックセグメンテーション手段で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング手段と、
セグメントクラスタリング手段で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約手段と、
セグメントクラスタリング手段で得られたクラスタ間の関係と、要約手段で得られた各クラスタの要約文を出力する話題構造出力手段として機能させる。
要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する。
要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する。
上記の話題構造抽出プログラムを格納する。
ステップ101)
初期のクラスタ集合を、Ci=Si(1≦i≦n)とする。各CiにコストE(D)を対応付けて記憶しておく。クラスタCi,Cj(1≦i,j≦n,i≠j)の間の距離ΔE(Ci,Cj)を式(1)によって計算する。
距離最小のクラスタ対を探して結合する。
全てのCi∈D,Ci≠C´についてクラスタ間の距離ΔE(C´,Ci)を再計算する。ΔE(C´,Ci)は、
ステップ201)
ルートノードのコストe1とリーフノードのコストe0を端点とする区間を指定した数で等分する。図7では3等分しており、新しくできる等分点はf1,f2でる。以下、等分点といったときは、端点も含めるものとする。
ルートノードを引数にして関数Aを呼び出す。
引数のノードXがリーフなら終了する。
Tw=‖M(C)−vw‖ w∈G
とおく。これは、G内のある単語wに対して定まる値で、wのベクトルとC内の単語ベクトルの重心との距離である。
Uw=‖M(I)−vw‖ w∈G
とおく。これも、G内のある単語wに対して定まる値で、wのベクトルとI内の単語ベクトルの重心との距離である。
22 単語ベクトル取得手段、単語ベクトル取得部
23 トピックセグメンテーション手段、トピックセグメンテーション部
24 セグメントクラスタリング手段、セグメントクラスタリング部
25 要約手段、要約部
26 話題構造出力手段、話題構造出力部
27 概念ベース
28 制御手段、制御部
Claims (13)
- テキスト中の複数の話題を検出し、話題間の関係を抽出・可視化するための話題構造抽出装置が実行する話題構造抽出方法において、
形態素解析手段が、テキストを単語単位に分割する形態素解析過程と、
単語ベクトル取得手段が、単語の意味を表現するベクトルが格納されている記憶手段である概念ベースを検索することによって、前記形態素解析過程で得られた各単語に対応するベクトルを取得する単語ベクトル取得過程と、
トピックセグメンテーション手段が、前記単語ベクトル取得過程で得られた単語ベクトルの系列から、前記テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション過程と、
セグメントクラスタリング手段が、前記トピックセグメンテーション過程で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング過程と、
要約手段が、前記セグメントクラスタリング過程で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約過程と、
話題構造出力手段が、前記セグメントクラスタリング過程で得られたクラスタ間の関係と、前記要約過程で得られた各クラスタの要約文を出力する話題構造出力過程と、からなることを特徴とする話題構造抽出方法。 - 前記話題構造抽出装置が、
前記要約過程において、要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する請求項1記載の話題構造抽出方法。 - 前記話題構造抽出装置が、
前記要約過程において、要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する請求項1記載の話題構造抽出方法。 - 制御手段が、
前記トピックセグメンテーション過程で得られた各セグメント毎に、該トピックセグメンテーション過程において該セグメントSをより短い区間のセグメントの集合へ分割し、この結果得られた、該セグメントS内のセグメント集合を前記セグメントクラスタリング過程において階層的にクラスタリングする制御過程を更に併せ持つ請求項1記載の話題構造抽出方法。 - テキスト中の複数の話題を検出し、話題間の関係を抽出・可視化するための話題構造抽出装置であって、
テキストを単語単位に分割する形態素解析手段と、
単語の意味を表現するベクトルが格納されている記憶手段である概念ベースと、
前記概念ベースを検索することによって、前記形態素解析手段で得られた各単語に対応するベクトルを取得する単語ベクトル取得手段と、
前記単語ベクトル取得手段で得られた単語ベクトルの系列から、前記テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション手段と、
前記トピックセグメンテーション手段で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング手段と、
前記セグメントクラスタリング手段で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約手段と、
前記セグメントクラスタリング手段で得られたクラスタ間の関係と、前記要約手段で得られた各クラスタの要約文を出力する話題構造出力手段と、からなることを特徴とする話題構造抽出装置。 - 前記要約手段において、
要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する請求項5記載の話題構造抽出装置。 - 前記要約手段において、
要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する請求項5記載の話題構造抽出装置。 - 前記トピックセグメンテーション手段で得られた各セグメント毎に、該トピックセグメンテーション手段において該セグメントSをより短い区間のセグメントの集合へ分割し、この結果得られた、該セグメントS内のセグメント集合を前記セグメントクラスタリング手段において階層的にクラスタリングする制御手段を更に併せ持つ請求項5記載の話題構造抽出装置。
- テキスト中の複数の話題を検出し、話題間の関係を抽出・可視化するためのコンピュータを、
テキストを単語単位に分割する形態素解析手段と、
単語の意味を表現するベクトルが格納されている記憶手段である概念ベースを検索することによって、前記形態素解析手段で得られた各単語に対応するベクトルを取得する単語ベクトル取得手段と、
前記単語ベクトル取得手段で得られた単語ベクトルの系列から、前記テキストを同一話題の区間であるセグメントの集合へ分割するトピックセグメンテーション手段と、
前記トピックセグメンテーション手段で得られたセグメント集合を、各セグメントを該セグメントに含まれる単語ベクトルの集合と見做して、距離が近いセグメントを同一クラスタとする基準により、階層的にクラスタリングするセグメントクラスタリング手段と、
前記セグメントクラスタリング手段で得られた各クラスタに対し、該クラスタに含まれるテキストから該クラスタを特徴付ける要約文を抽出する要約手段と、
前記セグメントクラスタリング手段で得られたクラスタ間の関係と、前記要約手段で得られた各クラスタの要約文を出力する話題構造出力手段として機能させる話題構造抽出プログラム。 - 前記要約手段において、
要約対象のクラスタCに含まれる単語の内、該クラスタC内の任意の単語ベクトルとの距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる任意の単語ベクトルとの距離が大きくなるような単語から順にある個数だけ単語を出力する請求項9記載の話題構造抽出プログラム。 - 前記要約手段において、
要約対象のクラスタCに含まれる単語の内、該クラスタC内の単語ベクトルの重心との距離が小さく、該クラスタCの上位クラスタの下位クラスタで該クラスタC以外のクラスタ群に含まれる単語ベクトルの重心との距離が大きくなるような単語から順にある個数だけ単語を出力する請求項9記載の話題構造抽出プログラム。 - 前記トピックセグメンテーション手段で得られた各セグメント毎に、該トピックセグメンテーション手段において該セグメントSをより短い区間のセグメントの集合へ分割し、この結果得られた、該セグメントS内のセグメント集合を前記セグメントクラスタリング手段において階層的にクラスタリングする制御手段を更に併せ持つ請求項9記載の話題構造抽出プログラム。
- テキスト中の複数の話題を検出し、話題間の関係を抽出・可視化するためのプログラムをコンピュータに実行させるための話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体であって、
請求項9乃至12記載のプログラムを格納したことを特徴とする話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003357372A JP4333318B2 (ja) | 2003-10-17 | 2003-10-17 | 話題構造抽出装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003357372A JP4333318B2 (ja) | 2003-10-17 | 2003-10-17 | 話題構造抽出装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005122510A true JP2005122510A (ja) | 2005-05-12 |
JP4333318B2 JP4333318B2 (ja) | 2009-09-16 |
Family
ID=34614279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003357372A Expired - Lifetime JP4333318B2 (ja) | 2003-10-17 | 2003-10-17 | 話題構造抽出装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4333318B2 (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211277A (ja) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 文書データ分類装置、文書データ分類方法、そのプログラム及び記録媒体 |
JP2010028184A (ja) * | 2008-02-04 | 2010-02-04 | Fuji Xerox Co Ltd | 映像ナビゲーション方法、映像ナビゲーションシステム、及び映像ナビゲーションプログラム |
JP2010198278A (ja) * | 2009-02-25 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 評判情報分類装置、評判情報分類方法及びプログラム |
JP2011028638A (ja) * | 2009-07-28 | 2011-02-10 | Nippon Telegr & Teleph Corp <Ntt> | 要約文作成装置、要約文作成方法、プログラム |
JPWO2012111226A1 (ja) * | 2011-02-15 | 2014-07-03 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム |
JP2015088061A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社東芝 | テキスト処理装置、テキスト処理方法およびプログラム |
JP2015130176A (ja) * | 2014-01-07 | 2015-07-16 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 会議内容構造化装置及び方法 |
JP2015225133A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 対話分割装置、方法、及びプログラム |
JP2017152042A (ja) * | 2017-05-10 | 2017-08-31 | アイマトリックス株式会社 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
JP2018073332A (ja) * | 2016-11-04 | 2018-05-10 | 株式会社イトーキ | 会議分析装置、会議分析方法、及びプログラム。 |
CN108776706A (zh) * | 2018-06-13 | 2018-11-09 | 北京信息科技大学 | 一种基于本体的专利技术主题聚类方法 |
CN112231471A (zh) * | 2020-09-04 | 2021-01-15 | 大箴(杭州)科技有限公司 | 文本处理方法及装置、计算机设备、存储介质 |
US20210357589A1 (en) * | 2020-05-14 | 2021-11-18 | Fujitsu Limited | Method of detecting change and information processing apparatus |
JP7048024B1 (ja) | 2021-09-30 | 2022-04-05 | 株式会社ShareFair | 情報処理装置、情報処理方法、および情報処理プログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5416680B2 (ja) * | 2010-11-30 | 2014-02-12 | 日本電信電話株式会社 | 文書分割検索装置及び方法及びプログラム |
JP5483740B2 (ja) * | 2011-05-25 | 2014-05-07 | 日本電信電話株式会社 | 文書分割スコアリング装置、方法、及びプログラム |
-
2003
- 2003-10-17 JP JP2003357372A patent/JP4333318B2/ja not_active Expired - Lifetime
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010028184A (ja) * | 2008-02-04 | 2010-02-04 | Fuji Xerox Co Ltd | 映像ナビゲーション方法、映像ナビゲーションシステム、及び映像ナビゲーションプログラム |
JP4594992B2 (ja) * | 2008-03-03 | 2010-12-08 | 日本電信電話株式会社 | 文書データ分類装置、文書データ分類方法、そのプログラム及び記録媒体 |
JP2009211277A (ja) * | 2008-03-03 | 2009-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 文書データ分類装置、文書データ分類方法、そのプログラム及び記録媒体 |
JP2010198278A (ja) * | 2009-02-25 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 評判情報分類装置、評判情報分類方法及びプログラム |
JP2011028638A (ja) * | 2009-07-28 | 2011-02-10 | Nippon Telegr & Teleph Corp <Ntt> | 要約文作成装置、要約文作成方法、プログラム |
JP5884740B2 (ja) * | 2011-02-15 | 2016-03-15 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム |
JPWO2012111226A1 (ja) * | 2011-02-15 | 2014-07-03 | 日本電気株式会社 | 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム |
JP2015088061A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社東芝 | テキスト処理装置、テキスト処理方法およびプログラム |
JP2015130176A (ja) * | 2014-01-07 | 2015-07-16 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 会議内容構造化装置及び方法 |
JP2015225133A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 対話分割装置、方法、及びプログラム |
JP2018073332A (ja) * | 2016-11-04 | 2018-05-10 | 株式会社イトーキ | 会議分析装置、会議分析方法、及びプログラム。 |
JP2017152042A (ja) * | 2017-05-10 | 2017-08-31 | アイマトリックス株式会社 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
CN108776706A (zh) * | 2018-06-13 | 2018-11-09 | 北京信息科技大学 | 一种基于本体的专利技术主题聚类方法 |
US20210357589A1 (en) * | 2020-05-14 | 2021-11-18 | Fujitsu Limited | Method of detecting change and information processing apparatus |
CN112231471A (zh) * | 2020-09-04 | 2021-01-15 | 大箴(杭州)科技有限公司 | 文本处理方法及装置、计算机设备、存储介质 |
CN112231471B (zh) * | 2020-09-04 | 2022-06-07 | 大箴(杭州)科技有限公司 | 文本处理方法及装置、计算机设备、存储介质 |
JP7048024B1 (ja) | 2021-09-30 | 2022-04-05 | 株式会社ShareFair | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2023051296A (ja) * | 2021-09-30 | 2023-04-11 | 株式会社ShareFair | 情報処理装置、情報処理方法、および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4333318B2 (ja) | 2009-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7295967B2 (en) | System and method of analyzing text using dynamic centering resonance analysis | |
JP4333318B2 (ja) | 話題構造抽出装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
JP2005526317A (ja) | ドキュメントコーパスからコンセプト階層構造を自動に捜索する方法及びシステム | |
Bisandu et al. | Data clustering using efficient similarity measures | |
CN113221559B (zh) | 利用语义特征的科技创新领域中文关键短语抽取方法及系统 | |
Zu et al. | Resume information extraction with a novel text block segmentation algorithm | |
JP2020004156A (ja) | 分類方法、装置、及びプログラム | |
Kutter | Corpus analysis | |
Singh et al. | Writing Style Change Detection on Multi-Author Documents. | |
JP4325370B2 (ja) | 文書関連語彙獲得装置及びプログラム | |
JP6409071B2 (ja) | 文の並び替え方法および計算機 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
Ullah et al. | Pattern and semantic analysis to improve unsupervised techniques for opinion target identification | |
Puscasu | A multilingual method for clause splitting | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR20070118154A (ko) | 정보 처리 장치 및 방법, 및 프로그램 기록 매체 | |
JP7131130B2 (ja) | 分類方法、装置、及びプログラム | |
Melero et al. | Selection of correction candidates for the normalization of Spanish user-generated content | |
Elamine et al. | Intrinsic Detection of Plagiarism based on Writing Style Grouping. | |
JP5744150B2 (ja) | 発話生成装置、方法、及びプログラム | |
TWI813028B (zh) | 文字資料之篩選關聯方法及系統 | |
Dasri et al. | Text mining framework, methods and techniques | |
CN112949287B (zh) | 热词挖掘方法、系统、计算机设备和存储介质 | |
Škrlj et al. | Retrieval-efficiency trade-off of Unsupervised Keyword Extraction | |
Mechti et al. | Hybrid Method for Multilingual Automatic Grouping of Writing Styles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090602 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090615 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4333318 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130703 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |