JP5602980B1 - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents
情報処理システム、情報処理方法、および情報処理プログラム Download PDFInfo
- Publication number
- JP5602980B1 JP5602980B1 JP2014531034A JP2014531034A JP5602980B1 JP 5602980 B1 JP5602980 B1 JP 5602980B1 JP 2014531034 A JP2014531034 A JP 2014531034A JP 2014531034 A JP2014531034 A JP 2014531034A JP 5602980 B1 JP5602980 B1 JP 5602980B1
- Authority
- JP
- Japan
- Prior art keywords
- posted
- onomatopoeia
- information processing
- sentence
- review
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
Abstract
Description
S(w)=log[P(w,O)/{P(w)P(O)}]
S(w)=log(coocw.O)×log[P(w,O)/{P(w)P(O)}]
S(ws)=log[P(ws,O)/{P(ws)P(O)}]
S(ws)=log(coocws.O)×log[P(ws,O)/{P(ws)P(O)}]
Score(s)=ΣS(w)
Score(s)=ΣS(ws)
P(w,O)…取得部11から入力された投稿レビューのすべて(オノマトペを含む投稿レビューとオノマトペを含まない投稿レビューとの集合)のうち、単語wと何らかのオノマトペとの双方を含む投稿レビューが存在する確率。
P(w)…入力されたすべての投稿レビューのうち、単語wを含む投稿レビューが存在する確率
P(O)…入力されたすべての投稿レビューのうち、何らかのオノマトペを含む投稿レビューが存在する確率
coocw.O…単語wと何らかのオノマトペとの双方を含む投稿レビューの個数。
Claims (8)
- 記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、
前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出部と
を備える情報処理システム。 - 前記特定部が、前記複数の投稿レビューを分割することで1以上の前記内容語を取得し、各内容語について前記オノマトペとの共起度を求めることで、前記オノマトペと共起する内容語を特定する、
請求項1に記載の情報処理システム。 - 前記抽出部が、一の投稿文に含まれる前記内容語の前記共起度を集計することで該一の投稿文についてのスコアを求め、該スコアが所定の閾値以上の前記投稿文を抽出する、
請求項2に記載の情報処理システム。 - 前記抽出部が、前記一の投稿文に同じ内容語が複数回出現する場合に、該内容語の共起度を一度だけ集計する、
請求項3に記載の情報処理システム。 - 前記内容語のそれぞれが単語であり、
前記抽出部が、前記一の投稿文に含まれる前記単語についての前記共起度を集計する、
請求項3または4に記載の情報処理システム。 - 前記内容語が複数の単語から成る組であり、
前記抽出部が、前記一の投稿文に含まれる前記複数の単語から成る組についての前記共起度を集計する、
請求項3または4に記載の情報処理システム。 - プロセッサを備える情報処理システムにより実行される情報処理方法であって、
記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定ステップであって、各投稿レビューが1以上の投稿文を含む、該特定ステップと、
前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出ステップと
を含む情報処理方法。 - 記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、
前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出部と
してコンピュータを機能させるための情報処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/055158 WO2015129044A1 (ja) | 2014-02-28 | 2014-02-28 | 情報処理システム、情報処理方法、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5602980B1 true JP5602980B1 (ja) | 2014-10-08 |
JPWO2015129044A1 JPWO2015129044A1 (ja) | 2017-03-30 |
Family
ID=51840428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014531034A Active JP5602980B1 (ja) | 2014-02-28 | 2014-02-28 | 情報処理システム、情報処理方法、および情報処理プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10007935B2 (ja) |
EP (1) | EP3113034A4 (ja) |
JP (1) | JP5602980B1 (ja) |
WO (1) | WO2015129044A1 (ja) |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5887120A (en) * | 1995-05-31 | 1999-03-23 | Oracle Corporation | Method and apparatus for determining theme for discourse |
US7191115B2 (en) * | 2001-06-20 | 2007-03-13 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among words |
US20100153107A1 (en) * | 2005-09-30 | 2010-06-17 | Nec Corporation | Trend evaluation device, its method, and program |
JP2007141051A (ja) | 2005-11-21 | 2007-06-07 | Scenes:Kk | 商品情報を管理する方法及びシステム |
JP4930584B2 (ja) * | 2007-03-20 | 2012-05-16 | 富士通株式会社 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
US20100174739A1 (en) * | 2007-03-30 | 2010-07-08 | Albert Mons | System and Method for Wikifying Content for Knowledge Navigation and Discovery |
KR100925376B1 (ko) * | 2007-09-12 | 2009-11-09 | 엔에이치엔(주) | 댓글 표시 제어 방법, 및 그 방법의 구현을 위한 시스템 및컴퓨터 판독 가능한 기록 매체 |
WO2009110550A1 (ja) * | 2008-03-06 | 2009-09-11 | 日本電気株式会社 | 属性抽出方法、システム及びプログラム |
US8572093B2 (en) * | 2009-01-13 | 2013-10-29 | Emc Corporation | System and method for providing a license description syntax in a software due diligence system |
JP5382651B2 (ja) * | 2009-09-09 | 2014-01-08 | 独立行政法人情報通信研究機構 | 単語対取得装置、単語対取得方法、およびプログラム |
NZ599047A (en) * | 2009-09-26 | 2013-02-22 | Sajari Pty Ltd | Document analysis and association system and method |
US9197736B2 (en) * | 2009-12-31 | 2015-11-24 | Digimarc Corporation | Intuitive computing methods and systems |
US9684683B2 (en) * | 2010-02-09 | 2017-06-20 | Siemens Aktiengesellschaft | Semantic search tool for document tagging, indexing and search |
JP5398007B2 (ja) * | 2010-02-26 | 2014-01-29 | 独立行政法人情報通信研究機構 | 関係情報拡張装置、関係情報拡張方法、及びプログラム |
EP2653981A4 (en) * | 2010-12-17 | 2018-01-17 | Rakuten, Inc. | Natural language processing device, method, and program |
US9082040B2 (en) * | 2011-05-13 | 2015-07-14 | Microsoft Technology Licensing, Llc | Identifying visual contextual synonyms |
US8583669B2 (en) * | 2011-05-30 | 2013-11-12 | Google Inc. | Query suggestion for efficient legal E-discovery |
US8671098B2 (en) * | 2011-09-14 | 2014-03-11 | Microsoft Corporation | Automatic generation of digital composite product reviews |
US20130275429A1 (en) * | 2012-04-12 | 2013-10-17 | Graham York | System and method for enabling contextual recommendations and collaboration within content |
WO2013170344A1 (en) * | 2012-05-15 | 2013-11-21 | Whyz Technologies Limited | Method and system relating to sentiment analysis of electronic content |
US9336297B2 (en) * | 2012-08-02 | 2016-05-10 | Paypal, Inc. | Content inversion for user searches and product recommendations systems and methods |
US20140067370A1 (en) * | 2012-08-31 | 2014-03-06 | Xerox Corporation | Learning opinion-related patterns for contextual and domain-dependent opinion detection |
-
2014
- 2014-02-28 EP EP14881399.1A patent/EP3113034A4/en not_active Ceased
- 2014-02-28 JP JP2014531034A patent/JP5602980B1/ja active Active
- 2014-02-28 US US14/766,072 patent/US10007935B2/en active Active
- 2014-02-28 WO PCT/JP2014/055158 patent/WO2015129044A1/ja active Application Filing
Non-Patent Citations (6)
Title |
---|
CSNG201000459215; 森田 一匡: 'Web上のオノマトペの用例を共起単語で絞り込む用例抽出法' 言語処理学会第16回年次大会発表論文集 , 20100308, 924-927ページ, 言語処理学会 * |
CSNG201200271165; 五十嵐 沢馬: 'オノマトペの音象徴を利用した評判分析' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] , 20120313, 715-718ページ, 言語処理学会 * |
CSNJ201110061083; 内田 ゆず: 'ブログ記事から抽出した用例文に基づくオノマトペの感情分析' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, 273-279ページ, 一般社団法人情報処理学会 * |
JPN6014034796; 五十嵐 沢馬: 'オノマトペの音象徴を利用した評判分析' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] , 20120313, 715-718ページ, 言語処理学会 * |
JPN6014034797; 内田 ゆず: 'ブログ記事から抽出した用例文に基づくオノマトペの感情分析' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, 273-279ページ, 一般社団法人情報処理学会 * |
JPN6014034798; 森田 一匡: 'Web上のオノマトペの用例を共起単語で絞り込む用例抽出法' 言語処理学会第16回年次大会発表論文集 , 20100308, 924-927ページ, 言語処理学会 * |
Also Published As
Publication number | Publication date |
---|---|
EP3113034A4 (en) | 2017-07-12 |
WO2015129044A1 (ja) | 2015-09-03 |
JPWO2015129044A1 (ja) | 2017-03-30 |
EP3113034A1 (en) | 2017-01-04 |
US20160253720A1 (en) | 2016-09-01 |
US10007935B2 (en) | 2018-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | The pile: An 800gb dataset of diverse text for language modeling | |
Rangel et al. | Overview of the 3rd Author Profiling Task at PAN 2015 | |
US10572589B2 (en) | Cognitive matching of narrative data | |
KR101005337B1 (ko) | 웹 문서에서의 의견 추출 및 분석 장치 및 그 방법 | |
US20080154883A1 (en) | System and method for evaluating sentiment | |
US8880390B2 (en) | Linking newsworthy events to published content | |
JP5547669B2 (ja) | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム | |
KR20100034140A (ko) | 인터넷을 이용한 의견 검색 시스템 및 그 방법 | |
JP5942052B1 (ja) | データ分析システム、データ分析方法、およびデータ分析プログラム | |
JP5905652B1 (ja) | データ評価システム、データ評価方法、およびデータ評価プログラム | |
JP2007233584A (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
JP2004280180A (ja) | 広告用キーワード抽出システム、広告文配信システム、広告用キーワード抽出プログラム及び広告文配信プログラム | |
JP2019046289A (ja) | 評価装置、評価方法、ノイズ除去装置、およびプログラム | |
Kaddoura et al. | Dataset of Arabic spam and ham tweets | |
JP5602980B1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Chan et al. | Few-shot adaptation works with unpredictable data | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
JP2006293616A (ja) | 文書集約方法及び装置及びプログラム | |
KR20220142705A (ko) | 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법 | |
Lopez Torres | Omicron Tweets Sentiment Analysis | |
JP5942981B2 (ja) | 要約作成装置、要約作成方法、およびプログラム | |
Gawley et al. | Comparing the intertextuality of multiple authors using Tesserae: A new technique for normalization | |
Sharma et al. | Extraction, summariz ation and sentiment analysis of trending topics on twitter | |
US10217143B2 (en) | Information processing system, information processing method, and information processing program | |
Correia | Evaluation Metrics for Text and Creation of Writing Tool for Sports Journalism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140701 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20140701 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20140811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5602980 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |