JP2016218512A - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP2016218512A JP2016218512A JP2015099128A JP2015099128A JP2016218512A JP 2016218512 A JP2016218512 A JP 2016218512A JP 2015099128 A JP2015099128 A JP 2015099128A JP 2015099128 A JP2015099128 A JP 2015099128A JP 2016218512 A JP2016218512 A JP 2016218512A
- Authority
- JP
- Japan
- Prior art keywords
- morphemes
- information processing
- subgraph
- processing apparatus
- morpheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
(b)文章群における予め定めた距離(例えば、間に挟まれる単語数が10個以下となる距離)内
(参考文献2)特開2002−183175号公報
(参考文献3)WO06/048998号公報
(d)相互に結合する複数の形態素の品詞が同じである場合
(f)相互に結合する複数の形態素の品詞が異なる場合
(h)相互に結合している複数の形態素間のエッジの重みの平均値、あるいは最低値が、関連性がある値として予め定めた第1閾値以上である複数の形態素
(i)相互に結合している複数の形態素のノードの次数の平均値、あるいは最低値が、関連性がある値として予め定めた第2閾値以上である複数の形態素
12 コントローラ
14 CPU
16 ROM
18 RAM
20 不揮発性メモリ
22 I/Oインタフェース
24 操作部
26 表示部
28 通信部
32 形態素分解部
34 共起関係計算部
42 クラスタ形成部
44 サブグラフ抽出部
46 対応付け部
Claims (12)
- 複数の文章に含まれる複数の形態素の関連性を示す共起ネットワークから、各々関連する複数の形態素を含む複数のクラスタを形成する形成手段と、
前記形成手段により形成された前記複数のクラスタの各々から、相互の関連性を示す予め定めた条件を満たす複数の形態素を含むサブグラフを抽出する抽出手段と、
を備えた情報処理装置。 - 前記形成手段は、前記共起ネットワークにおいて相互に結合している形態素であって、品詞が異なる形態素については、元の共起の強さよりも共起の強さを強めた前記共起ネットワークから、各々関連する複数の形態素を含む複数のクラスタを形成する
請求項1記載の情報処理装置。 - 前記形成手段は、前記共起ネットワークにおいて相互に結合している形態素であって、品詞が同じ形態素のエッジを除去した前記共起ネットワークから、各々関連する複数の形態素を含む複数のクラスタを形成する
請求項1又は2記載の情報処理装置。 - 前記予め定めた条件を満たす複数の形態素は、前記共起ネットワークにおいて全ての形態素が相互に結合している複数の形態素である
請求項1〜3の何れか1項記載の情報処理装置。 - 前記予め定めた条件を満たす複数の形態素は、前記複数の形態素間のエッジの重みの平均値あるいは最低値が予め定めた第1閾値以上である複数の形態素である
請求項1〜4の何れか1項記載の情報処理装置。 - 前記予め定めた条件を満たす複数の形態素は、前記複数の形態素のノードの次数の平均値あるいは最低値が予め定めた第2閾値以上である複数の形態素をサブグラフとして抽出する
請求項1〜5の何れか1項記載の情報処理装置。 - 前記抽出手段により抽出される前記サブグラフに含まれる形態素の数を指定する指定手段を更に備え、
前記抽出手段は、前記指定手段により指定された数の形態素を含むサブグラフを抽出する
請求項1〜6の何れか1項記載の情報処理装置。 - 前記クラスタを上位層とし、前記クラスタから抽出された前記サブグラフを前記クラスタの下位層とした階層構造の情報を記憶する記憶手段を更に備えた
請求項1〜7の何れか1項記載の情報処理装置。 - 前記記憶手段は、前記クラスタに含まれる形態素のうち形態素の重要度を表す指標値が最大となる形態素をクラスタ名として前記階層構造の情報を記憶する
請求項8記載の情報処理装置。 - 前記抽出手段により抽出された前記サブグラフに含まれる形態素と、前記複数の文章に含まれる形態素とを対応付ける対応付け手段を更に備えた
請求項1〜9の何れか1項記載の情報処理装置。 - 前記抽出手段により抽出された前記サブグラフに含まれる形態素の属性値に応じて、前記サブグラフに属する前記文章の数を集計する集計手段を更に備えた
請求項10記載の情報処理装置。 - コンピュータを、請求項1〜11の何れか1項記載の情報処理装置を構成する各手段として機能させるための情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015099128A JP6524790B2 (ja) | 2015-05-14 | 2015-05-14 | 情報処理装置及び情報処理プログラム |
US14/919,927 US20160335249A1 (en) | 2015-05-14 | 2015-10-22 | Information processing apparatus, information processing method, and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015099128A JP6524790B2 (ja) | 2015-05-14 | 2015-05-14 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016218512A true JP2016218512A (ja) | 2016-12-22 |
JP6524790B2 JP6524790B2 (ja) | 2019-06-05 |
Family
ID=57277203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015099128A Expired - Fee Related JP6524790B2 (ja) | 2015-05-14 | 2015-05-14 | 情報処理装置及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20160335249A1 (ja) |
JP (1) | JP6524790B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019021232A (ja) * | 2017-07-21 | 2019-02-07 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP2019117484A (ja) * | 2017-12-27 | 2019-07-18 | 株式会社日立社会情報サービス | テキストマイニング装置およびテキストマイニング方法 |
KR20190110428A (ko) * | 2018-03-20 | 2019-09-30 | 가부시키가이샤 스크린 홀딩스 | 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6852941B1 (ja) * | 2019-05-17 | 2021-03-31 | 株式会社アイエクセス | クラスタ解析方法、クラスタ解析システム、及びクラスタ解析プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032394A (ja) * | 2000-07-18 | 2002-01-31 | Ricoh Co Ltd | 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体 |
WO2006048998A1 (ja) * | 2004-11-05 | 2006-05-11 | Intellectual Property Bank Corp. | キーワード抽出装置 |
JP2009140263A (ja) * | 2007-12-06 | 2009-06-25 | Nec Corp | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010044637A (ja) * | 2008-08-14 | 2010-02-25 | Just Syst Corp | データ処理装置、方法、及びプログラム |
US8560477B1 (en) * | 2010-10-08 | 2013-10-15 | Google Inc. | Graph-based semi-supervised learning of structured tagging models |
US9336186B1 (en) * | 2013-10-10 | 2016-05-10 | Google Inc. | Methods and apparatus related to sentence compression |
-
2015
- 2015-05-14 JP JP2015099128A patent/JP6524790B2/ja not_active Expired - Fee Related
- 2015-10-22 US US14/919,927 patent/US20160335249A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032394A (ja) * | 2000-07-18 | 2002-01-31 | Ricoh Co Ltd | 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体 |
WO2006048998A1 (ja) * | 2004-11-05 | 2006-05-11 | Intellectual Property Bank Corp. | キーワード抽出装置 |
JP2009140263A (ja) * | 2007-12-06 | 2009-06-25 | Nec Corp | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019021232A (ja) * | 2017-07-21 | 2019-02-07 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP2019117484A (ja) * | 2017-12-27 | 2019-07-18 | 株式会社日立社会情報サービス | テキストマイニング装置およびテキストマイニング方法 |
JP7064871B2 (ja) | 2017-12-27 | 2022-05-11 | 株式会社日立社会情報サービス | テキストマイニング装置およびテキストマイニング方法 |
KR20190110428A (ko) * | 2018-03-20 | 2019-09-30 | 가부시키가이샤 스크린 홀딩스 | 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치 |
KR102162779B1 (ko) | 2018-03-20 | 2020-10-07 | 가부시키가이샤 스크린 홀딩스 | 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20160335249A1 (en) | 2016-11-17 |
JP6524790B2 (ja) | 2019-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017097231A1 (zh) | 话题处理方法及装置 | |
US10095685B2 (en) | Phrase pair collecting apparatus and computer program therefor | |
US9965459B2 (en) | Providing contextual information associated with a source document using information from external reference documents | |
US20170075983A1 (en) | Subject-matter analysis of tabular data | |
US20160189057A1 (en) | Computer implemented system and method for categorizing data | |
Quispe et al. | Using virtual edges to improve the discriminability of co-occurrence text networks | |
Lou et al. | Multilabel subject-based classification of poetry | |
CN111090731A (zh) | 基于主题聚类的电力舆情摘要提取优化方法及系统 | |
CN108520007B (zh) | 万维网网页信息提取方法、存储介质及计算机设备 | |
JP6524790B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
CN115409039A (zh) | 一种对标车型数据的分析方法、装置、电子设备及介质 | |
KR101375221B1 (ko) | 의료 프로세스 모델링 및 검증 방법 | |
JP6250833B2 (ja) | 文書検索システム、ディベートシステム、文書検索プログラム | |
JP6409071B2 (ja) | 文の並び替え方法および計算機 | |
Suhas Bharadwaj et al. | A novel multimodal hybrid classifier based cyberbullying detection for social media platform | |
JP4979637B2 (ja) | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム | |
JP7221526B2 (ja) | 分析方法、分析装置及び分析プログラム | |
Hardaya et al. | Application of text mining for classification of community complaints and proposals | |
CN108733733B (zh) | 基于机器学习的生物医学文本分类方法、系统和存储介质 | |
CN106462614B (zh) | 信息分析系统、信息分析方法以及信息分析程序 | |
CN103870459A (zh) | 有意义串的识别方法和装置 | |
KR101088483B1 (ko) | 이종 분류체계들을 매핑시키는 방법 및 장치 | |
CN113326348A (zh) | 一种博客质量评估方法及工具 | |
JP2009104296A (ja) | 関連キーワード抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6524790 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |