JP6136794B2 - 情報処理方法、プログラム、及び、情報処理装置 - Google Patents
情報処理方法、プログラム、及び、情報処理装置 Download PDFInfo
- Publication number
- JP6136794B2 JP6136794B2 JP2013189779A JP2013189779A JP6136794B2 JP 6136794 B2 JP6136794 B2 JP 6136794B2 JP 2013189779 A JP2013189779 A JP 2013189779A JP 2013189779 A JP2013189779 A JP 2013189779A JP 6136794 B2 JP6136794 B2 JP 6136794B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- categories
- similarity
- user
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
以下実施の形態を、図面を参照して説明する。図1は情報処理システムの概要を示す説明図である。情報処理システムは情報処理装置1及びサーバコンピュータ2等を含む。情報処理装置1及びサーバコンピュータ2はインターネット等の通信網Nを介して接続されている。情報処理装置1は例えばパーソナルコンピュータ、サーバコンピュータ、携帯電話機、PDA(Personal Digital Assistant)等である。以下では情報処理装置1をコンピュータ1と読み替えて説明する。サーバコンピュータ2は複数の単語を含む記事、歌詞、つぶやき、商品説明、店舗の説明、または、論文等の文章と、当該文章に対するカテゴリを付与した情報を記憶している。サーバコンピュータ2は図示しない他のコンピュータから文章及びカテゴリを受信し、受信した文章及びカテゴリを記憶する。
本実施例では、以上の処理により、第2類似度よりも演算量の少ない第1類似度によって、第2類似度の算出を行う組み合わせを絞り込むことで、第2類似度の演算量を削減する。これにより、本実施例では、他のカテゴリとの間でモデルに揺れが生じやすいカテゴリを実用的な時間内で求めることが可能となる。
図20は上述した形態のコンピュータ1の動作を示す機能ブロック図である。CPU11が制御プログラム15Pを実行することにより、コンピュータ1は以下のように動作する。算出部201は、ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出する。第1類似度算出部202は、算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出する。抽出部203は閾値を超える第1類似度を有するカテゴリの組み合わせを抽出する。第2類似度算出部204は抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する。
コンピュータを用いた情報処理方法において、
ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出し、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出し、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出し、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する
情報処理方法。
各ユーザに対応付けてカテゴリを記憶した記憶部を参照し、ユーザ毎にカテゴリ間の組み合わせを計数することで、複数のユーザのカテゴリ間の組み合わせ数を算出する
付記1に記載の情報処理方法。
第1のカテゴリと第2のカテゴリ以外の他のカテゴリとの間の算出した組み合わせ数、及び、前記第2のカテゴリと前記第1のカテゴリ以外の他のカテゴリとの間の算出した組み合わせ数とに基づき、第1カテゴリと第2カテゴリとの間の第1類似度を算出する
付記1または2に記載の情報処理方法。
カテゴリに対応付けて用語及び用語数を記憶した記憶部を参照し、抽出した一のカテゴリの用語及び用語数を読み出し、
前記記憶部を参照し、他のカテゴリの用語及び用語数を読み出し、
読み出した前記一のカテゴリの用語及び用語数と前記他のカテゴリの用語及び用語数とに基づき、前記一のカテゴリと前記他のカテゴリとの間の第2類似度を算出する
付記1から3のいずれか一つに記載の情報処理方法。
閾値を超える第2類似度を有するカテゴリの組み合わせを抽出し、
カテゴリに対応付けてユーザに関する情報を記憶した記憶部を参照し、抽出したカテゴリ間で一致しないユーザに関する情報を削除する
付記1から4のいずれか一つに記載の情報処理方法。
コンピュータに、
ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出し、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出し、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出し、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する
処理を実行させるプログラム。
ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出する算出部と、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出する第1類似度算出部と、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出する抽出部と、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する第2類似度算出部と
を備える情報処理装置。
1A 可搬型記録媒体
1B 半導体メモリ
2 サーバコンピュータ
10A 読み取り部
11 CPU
12 RAM
13 入力部
14 表示部
15 記憶部
15P 制御プログラム
16 通信部
151 カテゴリリストファイル
152 ユーザブログ記事リストファイル
153 ユーザカテゴリリストファイル
154 ユーザ記事リストファイル
155 カテゴリ語句リストファイル
156 カテゴリ記事リストファイル
157 カテゴリ共起ファイル
158 カテゴリ共起類似度ファイル
159 内容類似度ファイル
201 算出部
202 第1類似度算出部
203 抽出部
204 第2類似度算出部
N 通信網
Claims (5)
- コンピュータを用いた情報処理方法において、
ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出し、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出し、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出し、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する
情報処理方法。 - 各ユーザに対応付けてカテゴリを記憶した記憶部を参照し、ユーザ毎にカテゴリ間の組み合わせを計数することで、複数のユーザのカテゴリ間の組み合わせ数を算出する
請求項1に記載の情報処理方法。 - 第1のカテゴリと第2のカテゴリ以外の他のカテゴリとの間の算出した組み合わせ数、及び、前記第2のカテゴリと前記第1のカテゴリ以外の他のカテゴリとの間の算出した組み合わせ数とに基づき、第1カテゴリと第2カテゴリとの間の第1類似度を算出する
請求項1または2に記載の情報処理方法。 - コンピュータに、
ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出し、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出し、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出し、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する
処理を実行させるプログラム。 - ユーザに対応付けられたカテゴリを参照し、カテゴリ間の組み合わせ数を算出する算出部と、
算出したカテゴリ間の組み合わせ数に基づき、カテゴリ間の第1類似度を算出する第1類似度算出部と、
閾値を超える第1類似度を有するカテゴリの組み合わせを抽出する抽出部と、
抽出した各カテゴリに対応する用語及び用語数に基づき、抽出したカテゴリ間の第2類似度を算出する第2類似度算出部と
を備える情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189779A JP6136794B2 (ja) | 2013-09-12 | 2013-09-12 | 情報処理方法、プログラム、及び、情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189779A JP6136794B2 (ja) | 2013-09-12 | 2013-09-12 | 情報処理方法、プログラム、及び、情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015056066A JP2015056066A (ja) | 2015-03-23 |
JP6136794B2 true JP6136794B2 (ja) | 2017-05-31 |
Family
ID=52820416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013189779A Active JP6136794B2 (ja) | 2013-09-12 | 2013-09-12 | 情報処理方法、プログラム、及び、情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6136794B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4224707B2 (ja) * | 2004-05-13 | 2009-02-18 | 日本電気株式会社 | 情報分類分析システム、情報分類分析およびプログラム |
US8190473B2 (en) * | 2009-03-10 | 2012-05-29 | Google Inc. | Category similarities |
-
2013
- 2013-09-12 JP JP2013189779A patent/JP6136794B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015056066A (ja) | 2015-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103853834B (zh) | 基于文本结构分析的Web文档摘要的生成方法 | |
CN103874994A (zh) | 用于自动概括电子文档的内容的方法和装置 | |
US9495424B1 (en) | Recognition of characters and their significance within written works | |
Liang | Collaborative, dynamic and diversified user profiling | |
CN113268667B (zh) | 一种基于中文评论情感引导的序列推荐方法及系统 | |
Li-guo et al. | A new naive Bayes text classification algorithm | |
CN109784365B (zh) | 一种特征选择方法、终端、可读介质及计算机程序 | |
CN111400584A (zh) | 联想词的推荐方法、装置、计算机设备和存储介质 | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
Liu et al. | LJ2M dataset: Toward better understanding of music listening behavior and user mood | |
US20230334075A1 (en) | Search platform for unstructured interaction summaries | |
JP6136794B2 (ja) | 情報処理方法、プログラム、及び、情報処理装置 | |
JP6260678B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP6495206B2 (ja) | 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム | |
US20220138407A1 (en) | Document Writing Assistant with Contextual Search Using Knowledge Graphs | |
CN111324701B (zh) | 内容补充方法、装置、计算机设备和存储介质 | |
CN110806861B (zh) | 一种结合用户反馈信息的api推荐方法及终端 | |
Vu et al. | Building a vietnamese sentiwordnet using vietnamese electronic dictionary and string kernel | |
CN113988057A (zh) | 基于概念抽取的标题生成方法、装置、设备及介质 | |
Amrie et al. | Analysis of Google Play Store's Sentiment Review on Indonesia's P2P Fintech Platform | |
US9530094B2 (en) | Jabba-type contextual tagger | |
Umare et al. | A survey on machine learning techniques to extract chemical names from text documents | |
Yuan et al. | Self-adaptive extracting academic entities from World Wide Web | |
CN111767706B (zh) | 文本相似度的计算方法、装置、电子设备及介质 | |
Weerasundara et al. | Comparative analysis of named entity recognition in the dungeons and dragons domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6136794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |