JP5646522B2 - 偏り述部抽出装置、方法、及びプログラム - Google Patents
偏り述部抽出装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5646522B2 JP5646522B2 JP2012033242A JP2012033242A JP5646522B2 JP 5646522 B2 JP5646522 B2 JP 5646522B2 JP 2012033242 A JP2012033242 A JP 2012033242A JP 2012033242 A JP2012033242 A JP 2012033242A JP 5646522 B2 JP5646522 B2 JP 5646522B2
- Authority
- JP
- Japan
- Prior art keywords
- predicate
- normalized
- label
- bias
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
・結構使いづらいですよぉ。
・値段が高い。
・使いにくい。
・XXで購入しました。
・とにかく使いづらいです!
・価格が高いです。
・毎日使ってます!
・みなさんにお勧めしたい。
・XXで購入した。
・いつも使っています。
・ぜひお勧めしたいです。
・使いやすいですよ。
=使い(う)<内容語>+づらい<非自立性形容詞>
+です<機能語> (1)
20 述部正規化部
22 形態素解析部
24 意味ラベル付与・述部抽出部
26 不要機能表現削除部
28 機能表現意味ラベル辞書
30 偏り述部粒度選択部
40a 偏り述部抽出部(内容語+意味ラベル)
40b 偏り述部抽出部(表層述部)
42a、42b 頻度計算部
44a、44b 偏り検定部
46a、46b 抽出部
Claims (3)
- 複数の文書集合に含まれる複数の文書各々を形態素解析した解析結果に基づいて、前記文書各々の述部を抽出すると共に、該述部に含まれる機能表現に該機能表現が表す意味を示すラベルを付与し、該ラベルに基づいて、前記述部が表す出来事の意味に影響を与える機能表現以外を削除することにより、前記文書各々の述部を正規化する述部正規化手段と、
前記述部の偏りを抽出する際に、抽出の粒度として、前記正規化された述部の内容語と前記ラベルとの組み合わせを用いるか、または、前記正規化された述部の表層形を用いるかを選択する偏り述部粒度選択手段と、
前記粒度として、前記正規化された述部の内容語と前記ラベルとの組み合わせを用いることが選択された場合には、前記述部正規化手段により正規化された述部の内容語と前記ラベルとの組み合わせの出現頻度、または前記正規化された述部の内容語と前記ラベルとの組み合わせが出現する文書の数に基づいて、前記複数の文書集合のいずれかの文書集合に偏って出現する偏り述部を抽出し、
前記粒度として、前記正規化された述部の表層形を用いることが選択された場合には、前記述部正規化手段により正規化された述部の表層形の出現頻度、または前記正規化された述部の表層形が出現する文書の数に基づいて、前記複数の文書集合のいずれかの文書集合に偏って出現する偏り述部を抽出する抽出手段と、
を含む偏り述部抽出装置。 - 述部正規化手段と、偏り述部粒度選択手段と、抽出手段とを含む偏り述部抽出装置における述部抽出方法であって、
前記述部正規化手段は、複数の文書集合に含まれる複数の文書各々を形態素解析した解析結果に基づいて、前記文書各々の述部を抽出すると共に、該述部に含まれる機能表現に該機能表現が表す意味を示すラベルを付与し、該ラベルに基づいて、前記述部が表す出来事の意味に影響を与える機能表現以外を削除することにより、前記文書各々の述部を正規化し、
前記偏り述部粒度選択手段は、前記述部の偏りを抽出する際に、抽出の粒度として、前記正規化された述部の内容語と前記ラベルとの組み合わせを用いるか、または、前記正規化された述部の表層形を用いるかを選択し、
前記抽出手段は、前記粒度として、前記正規化された述部の内容語と前記ラベルとの組み合わせを用いることが選択された場合には、前記述部正規化手段により正規化された述部の内容語と前記ラベルとの組み合わせの出現頻度、または前記正規化された述部の内容語と前記ラベルとの組み合わせが出現する文書の数に基づいて、前記複数の文書集合のいずれかの文書集合に偏って出現する偏り述部を抽出し、
前記粒度として、前記正規化された述部の表層形を用いることが選択された場合には、前記述部正規化手段により正規化された述部の表層形の出現頻度、または前記正規化された述部の表層形が出現する文書の数に基づいて、前記複数の文書集合のいずれかの文書集合に偏って出現する偏り述部を抽出する
述部抽出方法。 - コンピュータを、請求項1記載の偏り述部抽出装置を構成する各手段として機能させるための述部抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012033242A JP5646522B2 (ja) | 2012-02-17 | 2012-02-17 | 偏り述部抽出装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012033242A JP5646522B2 (ja) | 2012-02-17 | 2012-02-17 | 偏り述部抽出装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013171328A JP2013171328A (ja) | 2013-09-02 |
JP5646522B2 true JP5646522B2 (ja) | 2014-12-24 |
Family
ID=49265238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012033242A Active JP5646522B2 (ja) | 2012-02-17 | 2012-02-17 | 偏り述部抽出装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5646522B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023144925A1 (ja) * | 2022-01-26 | 2023-08-03 | 三菱電機株式会社 | 学習装置、推定装置、学習方法、推定方法、学習プログラム、及び推定プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4322475B2 (ja) * | 2002-06-25 | 2009-09-02 | 日本電気株式会社 | テキスト分析システム、テキスト分析方法、および、テキスト分析プログラム |
JP2007241635A (ja) * | 2006-03-08 | 2007-09-20 | Nec Corp | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム |
JP2010056682A (ja) * | 2008-08-26 | 2010-03-11 | National Institute Of Information & Communication Technology | 電子メール受信装置及び電子メール受信方法、電子メール送信装置及び電子メール送信方法、メール送信サーバ |
JP5370680B2 (ja) * | 2010-01-14 | 2013-12-18 | 日本電信電話株式会社 | 述部機能表現正規化方法、その装置及びプログラム |
JP5366849B2 (ja) * | 2010-02-04 | 2013-12-11 | 日本電信電話株式会社 | 機能表現補完装置、方法及びプログラム |
-
2012
- 2012-02-17 JP JP2012033242A patent/JP5646522B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013171328A (ja) | 2013-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Stamatatos et al. | Clustering by authorship within and across documents | |
JP6781760B2 (ja) | 複数レイヤの単語表現にわたる言語特徴生成のためのシステム及び方法 | |
CN107644011B (zh) | 用于细粒度医疗实体提取的系统和方法 | |
JP5389273B1 (ja) | 文脈解析装置および文脈解析方法 | |
US11755841B2 (en) | Method for updating a knowledge base of a sentiment analysis system | |
US11429790B2 (en) | Automated detection of personal information in free text | |
US9600469B2 (en) | Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon | |
Kawahara et al. | Rapid development of a corpus with discourse annotations using two-stage crowdsourcing | |
Jang et al. | Metaphor detection in discourse | |
US11386270B2 (en) | Automatically identifying multi-word expressions | |
CN107077640B (zh) | 经由经验归属来分析、资格化和摄取非结构化数据源的系统和处理 | |
Wanner | On the relevance of syntactic and discourse features for author profiling and identification | |
Swanson et al. | Extracting the native language signal for second language acquisition | |
Solovyev et al. | Dictionary-based problem phrase extraction from user reviews | |
US10528660B2 (en) | Leveraging word patterns in the language of popular influencers to predict popular trends | |
JP2011145844A (ja) | 述部機能表現正規化方法、その装置及びプログラム | |
Hamdan et al. | Supervised methods for aspect-based sentiment analysis | |
CN108021595B (zh) | 检验知识库三元组的方法及装置 | |
Putri et al. | Software feature extraction using infrequent feature extraction | |
JP5646522B2 (ja) | 偏り述部抽出装置、方法、及びプログラム | |
Bobicev et al. | Can anonymous posters on medical forums be reidentified? | |
Kelebercová et al. | Search queries related to COVID-19 based on keyword extraction | |
Tungthamthiti et al. | Sentiment analyzer with rich features for ironic and sarcastic tweets | |
US10002450B2 (en) | Analyzing a document that includes a text-based visual representation | |
Jayathilaka et al. | Making sense of large volumes of unstructured email responses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5646522 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |