JP6275758B2 - 情報処理システム、情報処理方法、およびプログラム - Google Patents
情報処理システム、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6275758B2 JP6275758B2 JP2016039055A JP2016039055A JP6275758B2 JP 6275758 B2 JP6275758 B2 JP 6275758B2 JP 2016039055 A JP2016039055 A JP 2016039055A JP 2016039055 A JP2016039055 A JP 2016039055A JP 6275758 B2 JP6275758 B2 JP 6275758B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- term
- overall
- information processing
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 58
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
- G06F16/287—Visualization; Browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2264—Multidimensional index structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
サーバ1の一次元データベース生成手段11は、記憶された二次元データベースより、タームと、全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似するタームとでグループ化した全体タームクラスタごとに記憶された一次元データベースを生成する。
10 二次元データベース手段
11 一次元データベース生成手段
12 一次元データベース伝送手段
情報処理装置2
20 ユーザデータベース手段
21 単語抽出手段
22 全体タームクラスタ特定手段
23 キーワード選定手段
23 コンテンツ取得手段
Claims (7)
- サーバと情報処理装置とがネットワーク接続されていることで実現可能な情報処理システムであって、
前記サーバが、
ネットワーク経由でアクセス可能な全体ドキュメントに出現する単語であるタームと、前記全体ドキュメントに出現する全タームに対する前記タームの全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームと前記全体ドキュメントでグループ化して記憶する二次元データベース手段と、
前記記憶された二次元データベースより、前記タームと、前記全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームとでグループ化した全体タームクラスタごとに記憶された一次元データベースを生成する一次元データベース生成手段と、
前記生成された一次元データベースを前記情報処理装置へ伝送する一次元データベース伝送手段と、
を備え、
前記情報処理装置が、
ユーザドキュメントに出現する単語である前記タームと、前記ユーザドキュメントに出現する全タームに対する前記タームのユーザ出現頻度と、を前記ユーザドキュメントにおける出現傾向が類似する前記タームと、前記ユーザドキュメントとでグループ化したユーザデータベースとして記憶するユーザデータベース手段と、
指定されたドキュメントから単語を抽出する単語抽出手段と、
前記抽出された単語に基づいて、前記指定されたドキュメントと類似度が高い前記全体タームクラスタを特定する全体タームクラスタ特定手段と、
前記特定された全体タームクラスタに属する前記タームよりキーワードを選定するキーワード選定手段と、
前記選定されたキーワードに関連するコンテンツをネットワークから取得するコンテンツ取得手段と、
を備える、
ことを特徴とする情報処理システム。 - 前記全体タームクラスタ特定手段は、前記抽出された単語の前記全体タームクラスタごとの出現頻度と、前記一次元データベースに記憶された全体タームクラスタごとの出現頻度と、の相関を算出し、前記算出された相関が最もポジティブなタームクラスタを前記全体タームクラスタとして特定する、
ことを特徴とする請求項1に記載の情報処理システム。 - 前記キーワード選定手段は、前記特定された全体タームクラスタに属する前記タームと、前記ユーザデータベースのうち、前記特定された全体タームクラスタと同タームクラスタに属する前記タームと、の比率に基づいて、前記キーワードを選定する、
ことを特徴とする請求項1、または2に記載の情報処理システム。 - 前記キーワード選定手段は、前記比率が最も大きい前記タームをキーワードとして選定する、
ことを特徴とする請求項3に記載の情報処理システム。 - 前記取得されたコンテンツを、前記指定されたドキュメントと共に表示する表示手段と、
を更に備える請求項1から4のいずれか1項に記載の情報処理システム。 - サーバと情報処理装置とがネットワーク接続されていることで実現可能な情報処理方法であって、
前記サーバが、
ネットワーク経由でアクセス可能な全体ドキュメントに出現する単語であるタームと、前記全体ドキュメントに出現する全タームに対する前記タームの全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームと前記全体ドキュメントでグループ化して記憶するステップと、
前記タームと、前記全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームとでグループ化した全体タームクラスタごとに記憶された一次元データベースを生成するステップと、
前記生成された一次元データベースを前記情報処理装置へ伝送するステップと、
を有し、
前記情報処理装置が、
ユーザドキュメントに出現する単語である前記タームと、前記ユーザドキュメントに出現する全タームに対する前記タームのユーザ出現頻度と、を前記ユーザドキュメントにおける出現傾向が類似する前記タームと、前記ユーザドキュメントとでグループ化したユーザデータベースとして記憶するステップと、
指定されたドキュメントから単語を抽出するステップと、
前記抽出された単語に基づいて、前記指定されたドキュメントと類似度が高い前記全体タームクラスタを特定するステップと、
前記特定された全体タームクラスタに属する前記タームよりキーワードを選定するステップと、
前記選定されたキーワードに関連するコンテンツをネットワークから取得するステップと、
を有する、
ことを特徴とする情報処理方法。 - サーバと情報処理装置とがネットワーク接続されていることで実現可能な情報処理システムをコンピュータに実行させるプログラムであって、
前記サーバが、
ネットワーク経由でアクセス可能な全体ドキュメントに出現する単語であるタームと、前記全体ドキュメントに出現する全タームに対する前記タームの全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームと前記全体ドキュメントでグループ化して記憶する工程と、
前記タームと、前記全体出現頻度と、を前記全体ドキュメントにおける出現傾向が類似する前記タームとでグループ化した全体タームクラスタごとに記憶された一次元データベースを生成する工程と、
前記生成された一次元データベースを前記情報処理装置へ伝送する工程と、
をコンピュータに実行させ、
前記情報処理装置が、
ユーザドキュメントに出現する単語である前記タームと、前記ユーザドキュメントに出現する全タームに対する前記タームのユーザ出現頻度と、を前記ユーザドキュメントにおける出現傾向が類似する前記タームと、前記ユーザドキュメントとでグループ化したユーザデータベースとして記憶する工程と、
指定されたドキュメントから単語を抽出する工程と、
前記抽出された単語に基づいて、前記指定されたドキュメントと類似度が高い前記全体タームクラスタを特定する工程と、
前記特定された全体タームクラスタに属する前記タームよりキーワードを選定する工程と、
前記選定されたキーワードに関連するコンテンツをネットワークから取得する工程と、
をコンピュータに実行させる、
ことを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016039055A JP6275758B2 (ja) | 2016-03-01 | 2016-03-01 | 情報処理システム、情報処理方法、およびプログラム |
US15/444,059 US20170255691A1 (en) | 2016-03-01 | 2017-02-27 | Information processing system, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016039055A JP6275758B2 (ja) | 2016-03-01 | 2016-03-01 | 情報処理システム、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017156952A JP2017156952A (ja) | 2017-09-07 |
JP6275758B2 true JP6275758B2 (ja) | 2018-02-07 |
Family
ID=59723621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016039055A Active JP6275758B2 (ja) | 2016-03-01 | 2016-03-01 | 情報処理システム、情報処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170255691A1 (ja) |
JP (1) | JP6275758B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033142B (zh) * | 2018-06-11 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置及服务器 |
CN109543049B (zh) * | 2018-11-23 | 2021-09-07 | 广东小天才科技有限公司 | 一种针对写作特点自动推送素材的方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3488063B2 (ja) * | 1997-12-04 | 2004-01-19 | 株式会社エヌ・ティ・ティ・データ | 情報分類方法、装置及びシステム |
US6691108B2 (en) * | 1999-12-14 | 2004-02-10 | Nec Corporation | Focused search engine and method |
JP4608740B2 (ja) * | 2000-02-21 | 2011-01-12 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム格納媒体 |
US8463786B2 (en) * | 2010-06-10 | 2013-06-11 | Microsoft Corporation | Extracting topically related keywords from related documents |
US9189539B2 (en) * | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Electronic content curating mechanisms |
-
2016
- 2016-03-01 JP JP2016039055A patent/JP6275758B2/ja active Active
-
2017
- 2017-02-27 US US15/444,059 patent/US20170255691A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2017156952A (ja) | 2017-09-07 |
US20170255691A1 (en) | 2017-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9448992B2 (en) | Natural language search results for intent queries | |
US20080005091A1 (en) | Visual and multi-dimensional search | |
TW201805839A (zh) | 資料處理方法、設備及系統 | |
US11010411B2 (en) | System and method automatically sorting ranked items and generating a visual representation of ranked results | |
US9268767B2 (en) | Semantic-based search system and search method thereof | |
US10909115B2 (en) | System event search based on heterogeneous logs | |
JP6664599B2 (ja) | 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム | |
US20170116314A1 (en) | Integrating real-time news with historic events | |
US20140181097A1 (en) | Providing organized content | |
JP6275758B2 (ja) | 情報処理システム、情報処理方法、およびプログラム | |
Ferrara et al. | Dimensional clustering of linked data: techniques and applications | |
JP6234978B2 (ja) | 情報処理装置、情報処理システム、およびプログラム | |
US20180276294A1 (en) | Information processing apparatus, information processing system, and information processing method | |
Kang et al. | Interactive hierarchical tag clouds for summarizing spatiotemporal social contents | |
EP2026216A1 (en) | Data processing method, computer program product and data processing system | |
JP6421146B2 (ja) | 情報処理システム、情報処理装置、プログラム | |
JP5903370B2 (ja) | 情報検索装置、情報検索方法、及びプログラム | |
JP6243885B2 (ja) | 情報処理装置、およびプログラム | |
JP6325502B2 (ja) | 情報処理装置、情報処理システムおよび情報処理方法 | |
JP6322660B2 (ja) | 情報処理装置、情報処理システムおよび情報処理方法 | |
JP2011257891A (ja) | 検索装置 | |
CN103631863B (zh) | 一种用于确定呈现信息间相似度信息的方法与设备 | |
US20180024998A1 (en) | Information processing apparatus, information processing method, and program | |
Komamizu et al. | A scheme of fragment-based faceted image search | |
CN103559305A (zh) | 文件搜寻系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6275758 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |