JP2010198278A - 評判情報分類装置、評判情報分類方法及びプログラム - Google Patents
評判情報分類装置、評判情報分類方法及びプログラム Download PDFInfo
- Publication number
- JP2010198278A JP2010198278A JP2009041898A JP2009041898A JP2010198278A JP 2010198278 A JP2010198278 A JP 2010198278A JP 2009041898 A JP2009041898 A JP 2009041898A JP 2009041898 A JP2009041898 A JP 2009041898A JP 2010198278 A JP2010198278 A JP 2010198278A
- Authority
- JP
- Japan
- Prior art keywords
- reputation information
- document
- text
- topic
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】所定の文書集合から、所定の検索語についての評判情報を分類する評判情報分類装置において、検索語を含む文と上記検索語を含む文に連続する0以上の文とからなる周辺テキストを、上記所定の文書集合から取得し、上記取得された周辺テキストから、評判情報を抽出し、複数の上記周辺テキストをクラスタリングして複数のクラスタに分類し、この分類された各クラスタから、主要なトピックを示すトピック語を抽出し、上記抽出した評判情報を、上記抽出したクラスタに対応付けて分類する評判情報分類装置。
【選択図】図1
Description
1…文書蓄積手段、
2…周辺テキスト取得手段、
3…評判情報抽出手段、
4…文書クラスタリング手段、
5…評判情報分類手段、
200…評判情報分類装置、
6…評判情報出力手段、
300…評判情報分類装置、
5…評判情報分類手段、
7…周辺テキスト取得手段、
8…評判情報抽出手段、
9…文書クラスタ手段。
Claims (8)
- 所定の文書集合から、所定の検索語についての評判情報を分類する評判情報分類装置において、
検索語を含む文と上記検索語を含む文に連続する0以上の文とからなる周辺テキストを、上記所定の文書集合から取得する周辺テキスト取得手段と;
上記取得された周辺テキストから、評判情報を抽出する評判情報抽出手段と;
複数の上記周辺テキストをクラスタリングして複数のクラスタに分類し、この分類された各クラスタから、主要なトピックを示すトピック語を抽出する文書クラスタリング手段と;
上記評判情報抽出手段が抽出した評判情報を、上記文書クラスタリング手段が抽出したクラスタに対応付けて分類する評判情報分類手段と;
を有することを特徴とする評判情報分類装置。 - 所定の文書集合から、所定の検索語についての評判情報を分類する評判情報分類装置において、
検索語を含む文と上記検索語を含む文に連続する0以上の文とからなる周辺テキストを、上記所定の文書集合から取得する周辺テキスト取得手段と;
上記取得された周辺テキストから、評判情報を抽出する評判情報抽出手段と;
複数の上記周辺テキストをクラスタリングして複数のクラスタに分類し、この分類された各クラスタから、主要なトピックを示すトピック語を抽出する文書クラスタリング手段と;
上記文書クラスタリング手段が抽出したクラスタ毎のトピック語集合と、評判情報抽出手段で抽出された評価表現とを対応付けて分類する評判情報分類手段と;
トピック語集合のノードと評価表現のノードとを区別し、上記評判情報分類手段が対応付けたトピック語集合と評価表現のノードとの間にエッジを存在させてグラフ表示する評判情報出力手段と;
を有することを特徴とする評判情報分類装置。 - 請求項2であって、
上記評判情報出力手段は、複数のクラスタ内に互いに同じトピック語がある場合、上記トピック語を親ノードとして表示する手段であることを特徴とする評判情報分類装置。 - 請求項2であって、
上記評判情報出力手段は、トピック語集合と評価表現との間のエッジを選択すると、上記エッジに対応付けられた評判情報を、評価対象や評価属性毎に分類して表示するか、または一覧として表示する手段であることを特徴とする評判情報分類装置。 - 請求項1〜4のいずれか1項であって、
上記評判情報抽出手段は、評判情報と形態素解析結果とを上記文書クラスタリング手段へ送る手段であり、
上記文書クラスタリング手段は、評判情報に含まれている単語の単語重みを高く設定してクラスタリングする手段であることを特徴とする評判情報分類装置。 - 所定の文書集合から、所定の検索語についての評判情報を分類する評判情報分類方法において、
検索語を含む文と上記検索語を含む文に連続する0以上の文とからなる周辺テキストを、上記所定の文書集合から取得し、記憶装置に記憶する周辺テキスト取得工程と;
上記取得された周辺テキストから、評判情報を抽出し、記憶装置に記憶する評判情報抽出工程と;
複数の上記周辺テキストをクラスタリングして複数のクラスタに分類し、この分類された各クラスタから、主要なトピックを示すトピック語を抽出し、記憶装置に記憶する文書クラスタリング工程と;
上記評判情報抽出工程で抽出された評判情報を、上記文書クラスタリング工程で抽出されたクラスタに対応付けて分類し、記憶装置に記憶する評判情報分類工程と;
を有することを特徴とする評判情報分類方法。 - 所定の文書集合から、所定の検索語についての評判情報を分類する評判情報分類方法において、
検索語を含む文と上記検索語を含む文に連続する0以上の文とからなる周辺テキストを、上記所定の文書集合から取得し、記憶装置に記憶する周辺テキスト取得工程と;
上記取得された周辺テキストから、評判情報を抽出し、記憶装置に記憶する評判情報抽出工程と;
複数の上記周辺テキストをクラスタリングして複数のクラスタに分類し、この分類された各クラスタから、主要なトピックを示すトピック語を抽出し、記憶装置に記憶する文書クラスタリング工程と;
上記文書クラスタリング工程で抽出されたクラスタ毎のトピック語集合と、評判情報抽出工程で抽出された評価表現とを対応付けて分類し、記憶装置に記憶する評判情報分類工程と;
トピック語集合のノードと評価表現のノードとを区別し、上記評判情報分類工程で対応付けられたトピック語集合と評価表現のノードとの間にエッジを存在させてグラフ表示し、記憶装置に記憶する評判情報出力工程と;
を有することを特徴とする評判情報分類方法。 - 請求項1または請求項2記載の評判情報分類装置の各手段として、コンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009041898A JP5224532B2 (ja) | 2009-02-25 | 2009-02-25 | 評判情報分類装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009041898A JP5224532B2 (ja) | 2009-02-25 | 2009-02-25 | 評判情報分類装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198278A true JP2010198278A (ja) | 2010-09-09 |
JP5224532B2 JP5224532B2 (ja) | 2013-07-03 |
Family
ID=42822948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009041898A Expired - Fee Related JP5224532B2 (ja) | 2009-02-25 | 2009-02-25 | 評判情報分類装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5224532B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012128468A (ja) * | 2010-12-13 | 2012-07-05 | National Institute Of Information & Communication Technology | 端末装置、表現出力方法、およびプログラム |
WO2014088335A1 (ko) * | 2012-12-06 | 2014-06-12 | 고려대학교 산학협력단 | 시맨틱 토픽 추출 장치 및 방법 |
JP2015135660A (ja) * | 2013-12-20 | 2015-07-27 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、及びプログラム |
KR101727686B1 (ko) | 2014-12-23 | 2017-04-20 | 고려대학교 산학협력단 | 시맨틱 엔티티 토픽 추출 방법 |
CN110612524A (zh) * | 2017-06-16 | 2019-12-24 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及程序 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259666A (ja) * | 1999-03-11 | 2000-09-22 | Nippon Hoso Kyokai <Nhk> | トピック抽出装置 |
JP2002278982A (ja) * | 2001-03-22 | 2002-09-27 | Ricoh Co Ltd | 情報抽出方法および情報検索方法 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2006236378A (ja) * | 2006-04-26 | 2006-09-07 | Nec Corp | 情報分類装置 |
-
2009
- 2009-02-25 JP JP2009041898A patent/JP5224532B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259666A (ja) * | 1999-03-11 | 2000-09-22 | Nippon Hoso Kyokai <Nhk> | トピック抽出装置 |
JP2002278982A (ja) * | 2001-03-22 | 2002-09-27 | Ricoh Co Ltd | 情報抽出方法および情報検索方法 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2006236378A (ja) * | 2006-04-26 | 2006-09-07 | Nec Corp | 情報分類装置 |
Non-Patent Citations (4)
Title |
---|
CSNG200701282007; 戸田 浩之 外6名: '"目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価"' 情報処理学会論文誌 第48巻,第SIG14TOD35号, 20070915, p.132-151, 社団法人情報処理学会 * |
CSNG200900266175; 水口 弘紀 外2名: '"Weblogを対象にしたリアルタイム評判情報分析システムeHyouban"' 電子情報通信学会 第19回データ工学ワークショップ論文集 [online] , 20080407, 電子情報通信学会データ工学研究専門委員会 * |
JPN6012054735; 戸田 浩之 外6名: '"目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価"' 情報処理学会論文誌 第48巻,第SIG14TOD35号, 20070915, p.132-151, 社団法人情報処理学会 * |
JPN6012054736; 水口 弘紀 外2名: '"Weblogを対象にしたリアルタイム評判情報分析システムeHyouban"' 電子情報通信学会 第19回データ工学ワークショップ論文集 [online] , 20080407, 電子情報通信学会データ工学研究専門委員会 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012128468A (ja) * | 2010-12-13 | 2012-07-05 | National Institute Of Information & Communication Technology | 端末装置、表現出力方法、およびプログラム |
WO2014088335A1 (ko) * | 2012-12-06 | 2014-06-12 | 고려대학교 산학협력단 | 시맨틱 토픽 추출 장치 및 방법 |
KR101423544B1 (ko) * | 2012-12-06 | 2014-08-01 | 고려대학교 산학협력단 | 시맨틱 토픽 추출 장치 및 방법 |
US10423723B2 (en) | 2012-12-06 | 2019-09-24 | Korea University Research And Business Foundation | Apparatus and method for extracting semantic topic |
JP2015135660A (ja) * | 2013-12-20 | 2015-07-27 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、及びプログラム |
JP2016095862A (ja) * | 2013-12-20 | 2016-05-26 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、及びプログラム |
KR101727686B1 (ko) | 2014-12-23 | 2017-04-20 | 고려대학교 산학협력단 | 시맨틱 엔티티 토픽 추출 방법 |
CN110612524A (zh) * | 2017-06-16 | 2019-12-24 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及程序 |
CN110612524B (zh) * | 2017-06-16 | 2023-11-10 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5224532B2 (ja) | 2013-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11048882B2 (en) | Automatic semantic rating and abstraction of literature | |
Talib et al. | Text mining: techniques, applications and issues | |
US9836511B2 (en) | Computer-generated sentiment-based knowledge base | |
Jin et al. | A novel lexicalized HMM-based learning framework for web opinion mining | |
KR101136007B1 (ko) | 문서 감성 분석 시스템 및 그 방법 | |
JP5359399B2 (ja) | テキスト分析装置および方法、並びにプログラム | |
CN110083696B (zh) | 基于元结构技术的全局引文推荐方法、推荐系统 | |
TW200817998A (en) | Method for domain identification of documents in a document database | |
JP2009193584A (ja) | ワードセットに関係するワードの決定 | |
JP5224532B2 (ja) | 評判情報分類装置及びプログラム | |
Yu et al. | Senti-COVID19: An interactive visual analytics system for detecting public sentiment and insights regarding COVID-19 from social media | |
Rani et al. | Study and comparision of vectorization techniques used in text classification | |
Krishnan et al. | Machine learning based sentiment analysis of coronavirus disease related twitter data | |
JP2010198142A (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
KR102126911B1 (ko) | KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법 | |
Palliyali et al. | Comparative study of extractive text summarization techniques | |
Alorini et al. | Machine learning enabled sentiment index estimation using social media big data | |
KR20220041336A (ko) | 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
JP5295818B2 (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
JP2007011892A (ja) | 語彙獲得方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
Shini et al. | Implicit aspect based sentiment analysis for restaurant review using LDA topic modeling and ensemble approach | |
JP5131565B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
JP3444223B2 (ja) | データベース登録装置 | |
ALCABNANI et al. | APPLICATION OF SENTIMENT ANALYSIS IN SOCIAL NETWORKS: A CASE OF ANALYZING ONLINE HOTEL | |
Zhang et al. | Evaluating semantic relatedness through categorical and contextual information for entity disambiguation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121019 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5224532 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |