JP2011154586A - 投稿文章分析装置、投稿文章分析方法、および、投稿文章分析装置用プログラム - Google Patents
投稿文章分析装置、投稿文章分析方法、および、投稿文章分析装置用プログラム Download PDFInfo
- Publication number
- JP2011154586A JP2011154586A JP2010016226A JP2010016226A JP2011154586A JP 2011154586 A JP2011154586 A JP 2011154586A JP 2010016226 A JP2010016226 A JP 2010016226A JP 2010016226 A JP2010016226 A JP 2010016226A JP 2011154586 A JP2011154586 A JP 2011154586A
- Authority
- JP
- Japan
- Prior art keywords
- document
- posted
- data
- sentence
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title description 8
- 238000012552 review Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013500 data storage Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 13
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】本発明は、ユーザ端末30からユーザが投稿してくる文章データを受信し(S1)、文書データを記憶し(S2)、文章データに関する時間情報に基づき、文章データを順序付けし(S3)、順序で隣接する文章データの文書間の文書間距離を算出して、文書間距離に基づき、文書データをクラスタリングする(S4)。
【選択図】図4
Description
(2.1 投稿文章分析サーバ10の構成および機能)
次に、投稿文章分析サーバ10の構成および機能について、図に基づき説明する。
図2は、投稿文章分析サーバ10の概要構成の一例を示すブロック図である。
次に、ショッピングサーバ20の構成および機能について、図に基づき説明する。
図4は、ショッピングサーバ20の概要構成の一例を示すブロック図である。
次に、本発明の一実施形態に係る投稿文章分析システム1の動作について図に基づき説明する。
(3.1 投稿文章を分析する動作例)
まず、投稿文章分析サーバ10における投稿文章分析の処理の流れについて、図に基づき説明する。
次に、クラスタリングが形成されたユーザの一連の文書に対して、更に、ユーザの動向を判別するために、投稿時間―注文時間の関係を利用する。
次に、投稿文章のクラスタリングのサブルーチンについて説明する。
次に、本実施形態の適用例について説明する。
10:投稿文章分析サーバ
11:通信部
12:記憶部
12a:商品レビュー・データベース
12b:ブログ・データベース
14:システム制御部
30:ユーザ端末
Claims (9)
- ユーザ端末からユーザが投稿してくる文章データを受信する文章データ受信手段と、
文書データを記憶する文書データ記憶手段と、
前記文章データに関する時間情報に基づき、前記文章データを順序付けする文書順序付け手段と、
前記順序で隣接する前記文章データの文書間の文書間距離を算出する文書間距離算出手段と、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリング手段と、
を備えたことを特徴とする投稿文章分析装置。 - 請求項1に記載の投稿文章分析装置において、
前記文書順序付け手段が、文章データの受信順序に基づき、前記文章データを順序付けすることを特徴とする投稿文章分析装置。 - 請求項1または請求項2に記載の投稿文章分析装置において、
前記文書間距離算出手段が、前記文書データを比較して、文書同士の類似性に基づき、文書間距離を算出することを特徴とする投稿文章分析装置。 - 請求項1から請求項3のいずれか1項に記載の投稿文章分析装置において、
前記文書間距離算出手段が、前記文書データの句読点を含めた文字列を比較して、文書間距離を算出することを特徴とする投稿文章分析装置。 - 請求項1から請求項4のいずれか1項に記載の投稿文章分析装置において、
前記クラスタリング手段が、クラスタリングのシーズとなる前記文書データから出発し、前記文書間距離に基づき接続関係にある他の前記文書データを探索してクラスタリングを行うことを特徴とする投稿文章分析装置。 - 請求項1から請求項5のいずれか1項に記載の投稿文章分析装置において、
前記クラスタリング手段により生成したクラスタにおいて、クラスタ間の距離を算出して、上位クラスタを算出する前記上位クラスタリング手段を更に備えたことを特徴とする投稿文章分析装置。 - 請求項1から請求項5のいずれか1項に記載の投稿文章分析装置において、
前記文章データが、商品レビューに関する文章であって、
前記文章データに関する時間情報と商品の注文時間との関係に基づき、前記クラスタリング手段によりクラスタリングされた文書データ群に対して、前記文書データ群を類別する文書類別手段を更に備えたことを特徴とする投稿文章分析装置。 - ユーザ端末からユーザが投稿してくる文章データを受信する文章データ受信ステップと、
文書データを記憶する文書データ記憶ステップと、
前記文章データに関する時間情報に基づき、前記文章データを順序付けする文書順序付けステップと、
前記順序で隣接する前記文章データの文書間の文書間距離を算出する文書間距離算出ステップと、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリングステップと、
を有することを特徴とする投稿文章分析方法。 - コンピュータを、
ユーザ端末からユーザが投稿してくる文章データを受信する文章データ受信手段、
文書データを記憶する文書データ記憶手段、
前記文章データに関する時間情報に基づき、前記文章データを順序付けする文書順序付け手段、
前記順序で隣接する前記文章データの文書間の文書間距離を算出する文書間距離算出手段、および、
前記文書間距離に基づき、前記文書データをクラスタリングするクラスタリング手段として機能させることを特徴とする投稿文章分析装置用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010016226A JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010016226A JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011154586A true JP2011154586A (ja) | 2011-08-11 |
JP5170787B2 JP5170787B2 (ja) | 2013-03-27 |
Family
ID=44540486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010016226A Active JP5170787B2 (ja) | 2010-01-28 | 2010-01-28 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5170787B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078878A (zh) * | 2019-12-06 | 2020-04-28 | 北京百度网讯科技有限公司 | 文本处理方法、装置、设备及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05204991A (ja) * | 1992-01-30 | 1993-08-13 | Hitachi Ltd | 時系列データ検索方法およびこれを用いた検索システム |
JPH0934719A (ja) * | 1995-07-21 | 1997-02-07 | Hitachi Ltd | データ分析装置 |
JPH1153387A (ja) * | 1997-08-06 | 1999-02-26 | Ibm Japan Ltd | 文書の関連付け方法及びそのシステム |
JP2005063249A (ja) * | 2003-08-18 | 2005-03-10 | Fuji Xerox Co Ltd | 分類結果表示装置および方法 |
JP2005128887A (ja) * | 2003-10-24 | 2005-05-19 | Toshiba Corp | 時系列活動データ分析装置、方法及びプログラム |
JP2008210024A (ja) * | 2007-02-23 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 |
JP2008234482A (ja) * | 2007-03-22 | 2008-10-02 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置、文書分類方法、プログラムおよび記録媒体 |
WO2009050991A1 (ja) * | 2007-10-19 | 2009-04-23 | Nec Corporation | 情報分析装置、情報分析方法、及び情報分析用プログラム |
-
2010
- 2010-01-28 JP JP2010016226A patent/JP5170787B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05204991A (ja) * | 1992-01-30 | 1993-08-13 | Hitachi Ltd | 時系列データ検索方法およびこれを用いた検索システム |
JPH0934719A (ja) * | 1995-07-21 | 1997-02-07 | Hitachi Ltd | データ分析装置 |
JPH1153387A (ja) * | 1997-08-06 | 1999-02-26 | Ibm Japan Ltd | 文書の関連付け方法及びそのシステム |
JP2005063249A (ja) * | 2003-08-18 | 2005-03-10 | Fuji Xerox Co Ltd | 分類結果表示装置および方法 |
JP2005128887A (ja) * | 2003-10-24 | 2005-05-19 | Toshiba Corp | 時系列活動データ分析装置、方法及びプログラム |
JP2008210024A (ja) * | 2007-02-23 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 |
JP2008234482A (ja) * | 2007-03-22 | 2008-10-02 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置、文書分類方法、プログラムおよび記録媒体 |
WO2009050991A1 (ja) * | 2007-10-19 | 2009-04-23 | Nec Corporation | 情報分析装置、情報分析方法、及び情報分析用プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078878A (zh) * | 2019-12-06 | 2020-04-28 | 北京百度网讯科技有限公司 | 文本处理方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5170787B2 (ja) | 2013-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11107118B2 (en) | Management of the display of online ad content consistent with one or more performance objectives for a webpage and/or website | |
US11301761B2 (en) | Behavioral prediction for targeted end users | |
US20210158187A1 (en) | System and method for detecting friction in websites | |
US8311957B2 (en) | Method and system for developing a classification tool | |
US8073865B2 (en) | System and method for content extraction from unstructured sources | |
US8355997B2 (en) | Method and system for developing a classification tool | |
CN103377250B (zh) | 基于邻域的top‑k推荐方法 | |
US11127063B2 (en) | Product and content association | |
US20190311395A1 (en) | Estimating click-through rate | |
CN113077317B (zh) | 基于用户数据的物品推荐方法、装置、设备及存储介质 | |
JP2013517563A (ja) | ユーザ通信の解析システムおよび方法 | |
US10817522B1 (en) | Product information integration | |
JP2009193465A (ja) | 情報処理装置、情報提供システム、情報処理方法、およびプログラム | |
JP6976207B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN109716377A (zh) | 登录页面生成的改进 | |
KR102458510B1 (ko) | 실시간 보완 가능한 마케팅 시스템 | |
US20140101293A1 (en) | Apparatus and method for providing issue record, and generating issue record | |
CN109615437A (zh) | 销售获客跟踪管理方法 | |
JP2008146293A (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
JP2020013413A (ja) | 判断支援装置および判断支援方法 | |
KR20220102054A (ko) | 사용자 분석 데이터를 활용하는 커머스 플랫폼 서버 및 이를 이용한 서비스 제공 방법 | |
CN113127597A (zh) | 搜索信息的处理方法、装置及电子设备 | |
Wu et al. | [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing | |
JP5170787B2 (ja) | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム | |
JP5787924B2 (ja) | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5170787 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |