JP5170787B2 - 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム - Google Patents
投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム Download PDFInfo
- Publication number
- JP5170787B2 JP5170787B2 JP2010016226A JP2010016226A JP5170787B2 JP 5170787 B2 JP5170787 B2 JP 5170787B2 JP 2010016226 A JP2010016226 A JP 2010016226A JP 2010016226 A JP2010016226 A JP 2010016226A JP 5170787 B2 JP5170787 B2 JP 5170787B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- document data
- post
- clustering
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 109
- 238000012552 review Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000013500 data storage Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 7
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
前記文書データに関する時間情報に基づき、前記文書データを順序付けする文書順序付け手段、前記順序で隣接する前記文書データの文書間の文書間距離を算出する文書間距離算出手段、前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリング手段、および、前記クラスタリング手段によりクラスタリングされた文書データ群に対して、前記文書データの投稿時間の関数とした投稿のパターンに応じて、前記文書データ群を類別する文書類別手段として機能させることを特徴とする。
(2.1 投稿文章分析サーバ10の構成および機能)
次に、投稿文章分析サーバ10の構成および機能について、図に基づき説明する。
図2は、投稿文章分析サーバ10の概要構成の一例を示すブロック図である。
次に、ショッピングサーバ20の構成および機能について、図に基づき説明する。
図4は、ショッピングサーバ20の概要構成の一例を示すブロック図である。
次に、本発明の一実施形態に係る投稿文章分析システム1の動作について図に基づき説明する。
(3.1 投稿文章を分析する動作例)
まず、投稿文章分析サーバ10における投稿文章分析の処理の流れについて、図に基づき説明する。
次に、クラスタリングが形成されたユーザの一連の文書に対して、更に、ユーザの動向を判別するために、投稿時間―注文時間の関係を利用する。
次に、投稿文章のクラスタリングのサブルーチンについて説明する。
次に、本実施形態の適用例について説明する。
10:投稿文章分析サーバ
11:通信部
12:記憶部
12a:商品レビュー・データベース
12b:ブログ・データベース
14:システム制御部
30:ユーザ端末
Claims (9)
- ユーザ端末からユーザが投稿してくる文書データを受信する文書データ受信手段と、
前記文書データを記憶する文書データ記憶手段と、
前記文書データに関する時間情報に基づき、前記文書データを順序付けする文書順序付け手段と、
前記順序で隣接する前記文書データの文書間の文書間距離を算出する文書間距離算出手段と、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリング手段と、
前記クラスタリング手段によりクラスタリングされた文書データ群に対して、前記文書データの投稿時間の関数とした投稿のパターンに応じて、前記文書データ群を類別する文書類別手段と、
を備えたことを特徴とする投稿文書分析装置。 - 請求項1に記載の投稿文書分析装置において、
前記文書類別手段が、前記文書データが、商品レビューに関する文書であって、前記文書データの投稿時間に関する投稿時間情報と商品の注文時間との関係を示す前記投稿のパターンに応じて、前記文書データ群を類別することを特徴とする投稿文書分析装置。 - 請求項1または請求項2に記載の投稿文書分析装置において、
前記文書順序付け手段が、前記文書データの受信順序に基づき、前記文書データを順序付けすることを特徴とする投稿文書分析装置。 - 請求項1から請求項3のいずれか1項に記載の投稿文書分析装置において、
前記文書間距離算出手段が、前記文書データを比較して、文書同士の類似性に基づき、文書間距離を算出することを特徴とする投稿文書分析装置。 - 請求項1から請求項4のいずれか1項に記載の投稿文書分析装置において、
前記文書間距離算出手段が、前記文書データの句読点を含めた文字列を比較して、文書間距離を算出することを特徴とする投稿文書分析装置。 - 請求項1から請求項5のいずれか1項に記載の投稿文書分析装置において、
前記クラスタリング手段が、クラスタリングのシーズとなる前記文書データから出発し、前記文書間距離に基づき接続関係にある他の前記文書データを探索してクラスタリングを行うことを特徴とする投稿文書分析装置。 - 請求項1から請求項6のいずれか1項に記載の投稿文書分析装置において、
前記クラスタリング手段により生成したクラスタにおいて、クラスタ間の距離を算出して、上位クラスタを算出する上位クラスタリング手段を更に備えたことを特徴とする投稿文書分析装置。 - 投稿文書分析装置が投稿された文書を分析する投稿文書分析方法であって、
ユーザ端末からユーザが投稿してくる文書データを受信する文書データ受信ステップと、
文書データを記憶する文書データ記憶ステップと、
前記文書データに関する時間情報に基づき、前記文書データを順序付けする文書順序付けステップと、
前記順序で隣接する前記文書データの文書間の文書間距離を算出する文書間距離算出ステップと、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリングステップと、
前記クラスタリングステップにおいて、クラスタリングされた文書データ群に対して、前記文書データの投稿時間の関数とした投稿のパターンに応じて、前記文書データ群を類別する文書類別ステップと、
を有することを特徴とする投稿文書分析方法。 - コンピュータを、
ユーザ端末からユーザが投稿してくる文書データを受信する文書データ受信手段、
文書データを記憶する文書データ記憶手段、
前記文書データに関する時間情報に基づき、前記文書データを順序付けする文書順序付け手段、
前記順序で隣接する前記文書データの文書間の文書間距離を算出する文書間距離算出手段、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリング手段、および、
前記クラスタリング手段によりクラスタリングされた文書データ群に対して、前記文書データの投稿時間の関数とした投稿のパターンに応じて、前記文書データ群を類別する文書類別手段として機能させることを特徴とする投稿文書分析装置用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010016226A JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010016226A JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011154586A JP2011154586A (ja) | 2011-08-11 |
JP5170787B2 true JP5170787B2 (ja) | 2013-03-27 |
Family
ID=44540486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010016226A Active JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5170787B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078878B (zh) * | 2019-12-06 | 2023-07-04 | 北京百度网讯科技有限公司 | 文本处理方法、装置、设备及计算机可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05204991A (ja) * | 1992-01-30 | 1993-08-13 | Hitachi Ltd | 時系列データ検索方法およびこれを用いた検索システム |
JP3489279B2 (ja) * | 1995-07-21 | 2004-01-19 | 株式会社日立製作所 | データ分析装置 |
JPH1153387A (ja) * | 1997-08-06 | 1999-02-26 | Ibm Japan Ltd | 文書の関連付け方法及びそのシステム |
JP2005063249A (ja) * | 2003-08-18 | 2005-03-10 | Fuji Xerox Co Ltd | 分類結果表示装置および方法 |
JP4146326B2 (ja) * | 2003-10-24 | 2008-09-10 | 株式会社東芝 | 時系列活動データ分析装置、方法及びプログラム |
JP2008210024A (ja) * | 2007-02-23 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 |
JP4936455B2 (ja) * | 2007-03-22 | 2012-05-23 | 日本電信電話株式会社 | 文書分類装置、文書分類方法、プログラムおよび記録媒体 |
JP2010146031A (ja) * | 2007-10-19 | 2010-07-01 | Nec Corp | 情報分析装置、情報分析方法、及び情報分析用プログラム |
-
2010
- 2010-01-28 JP JP2010016226A patent/JP5170787B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011154586A (ja) | 2011-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11107118B2 (en) | Management of the display of online ad content consistent with one or more performance objectives for a webpage and/or website | |
US20210158187A1 (en) | System and method for detecting friction in websites | |
US8073865B2 (en) | System and method for content extraction from unstructured sources | |
US8311957B2 (en) | Method and system for developing a classification tool | |
US8355997B2 (en) | Method and system for developing a classification tool | |
US20170053208A1 (en) | Behavioral Prediction for Targeted End Users | |
US20190311395A1 (en) | Estimating click-through rate | |
US11127063B2 (en) | Product and content association | |
US20130282704A1 (en) | Search system with query refinement | |
CN113077317B (zh) | 基于用户数据的物品推荐方法、装置、设备及存储介质 | |
JP2013517563A (ja) | ユーザ通信の解析システムおよび方法 | |
JP6373462B1 (ja) | 予測装置、予測方法及び予測プログラム | |
JP2009193465A (ja) | 情報処理装置、情報提供システム、情報処理方法、およびプログラム | |
JP6976207B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20140101293A1 (en) | Apparatus and method for providing issue record, and generating issue record | |
CN109615437A (zh) | 销售获客跟踪管理方法 | |
JP2008146293A (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
JP2020013413A (ja) | 判断支援装置および判断支援方法 | |
KR20220102054A (ko) | 사용자 분석 데이터를 활용하는 커머스 플랫폼 서버 및 이를 이용한 서비스 제공 방법 | |
JP5293970B2 (ja) | 商品推奨方法及び商品推奨システム | |
JP5170787B2 (ja) | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム | |
CN113127597A (zh) | 搜索信息的处理方法、装置及电子设备 | |
JP5787924B2 (ja) | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム | |
Wu et al. | [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5170787 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |