JP7323484B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7323484B2 JP7323484B2 JP2020049357A JP2020049357A JP7323484B2 JP 7323484 B2 JP7323484 B2 JP 7323484B2 JP 2020049357 A JP2020049357 A JP 2020049357A JP 2020049357 A JP2020049357 A JP 2020049357A JP 7323484 B2 JP7323484 B2 JP 7323484B2
- Authority
- JP
- Japan
- Prior art keywords
- entity
- entities
- named
- content
- knowledge base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、コンテンツから一つ又は複数の固有表現をエンティティとして抽出する。情報処理装置は、エンティティとして固有表現を抽出すると、あるナレッジベースに含まれるエンティティの属性に基づいて、各固有表現の属性を決定する。
[全体構成]
図1は、実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。実施形態における情報処理システム1は、例えば、一つ以上の端末装置10と、サービス提供装置20と、情報処理装置100とを備える。これらの装置のうち一部または全部は、ネットワークNWを介して互いに接続される。なお、これらの装置のうち一部は、仮想的な装置として他の装置に包含されてもよく、例えば、サービス提供装置20の機能の一部または全部が、情報処理装置100の機能によって実現される仮想マシンであってもよいし、これとは反対に、情報処理装置100の機能の一部または全部が、サービス提供装置20の機能によって実現される仮想マシンであってもよい。
図3は、実施形態における情報処理装置100の構成の一例を示す図である。図示のように、情報処理装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
以下、実施形態における制御部110による一連の処理の流れをフローチャートに即して説明する。図5は、実施形態における制御部110による一連の処理の流れを示すフローチャートである。本フローチャートの処理は、所定の周期で繰り返し行われてよい。
上述した実施形態の情報処理装置100は、例えば、図8に示すようなハードウェア構成により実現される。図8は、実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
Claims (12)
- コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出する抽出部と、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記抽出部によって前記第1エンティティとして抽出された前記一つ又は複数の固有表現のそれぞれの属性を決定する第1決定部と、
前記コンテンツにおける前記固有表現の出現位置に基づいて、前記第1決定部によって属性が決定された前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定する第2決定部と、を備え、
前記第1決定部は、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、前記コンテンツのコンテキストワードに基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択し、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定する、
情報処理装置。 - 前記ナレッジベース上では、複数の前記第2エンティティのそれぞれに対して、ユーザが前記第2エンティティに対応したコンテンツを検索したときの回数に基づく指標値が対応付けられており、
前記第1決定部は、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、複数の前記第2エンティティのそれぞれの前記指標値に基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択し、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定する、
請求項1に記載の情報処理装置。 - 前記指標値は、前記第2エンティティに対応したコンテンツの検索回数が多いほど大きく、前記第2エンティティに対応したコンテンツの検索回数が少ないほど小さい傾向にあり、
前記第1決定部は、複数の前記第2エンティティの中で、前記指標値が大きい前記第2エンティティほど優先的に選択する、
請求項2に記載の情報処理装置。 - 前記指標値は、前記第2エンティティに対応したコンテンツの検索日時が最新に近いほど大きく、前記第2エンティティに対応したコンテンツの検索日時が最新から遠いほど小さい傾向にあり、
前記第1決定部は、複数の前記第2エンティティの中で、前記指標値が大きい前記第2エンティティほど優先的に選択する、
請求項2又は3に記載の情報処理装置。 - 前記第2決定部は、前記コンテンツにおいて前記固有表現の出現位置が冒頭に近いほど、前記重要度を高くし、前記コンテンツにおいて前記固有表現の出現位置が冒頭から遠いほど、前記重要度を低くする、
請求項1から4のうちいずれか一項に記載の情報処理装置。 - 前記第2決定部は、前記コンテンツのタイトルに前記固有表現が出現する場合、前記コンテンツのタイトルに前記固有表現が出現しない場合に比べて、前記重要度を高くする、
請求項1から5のうちいずれか一項に記載の情報処理装置。 - 前記第1決定部によって決定された前記一つ又は複数の固有表現のそれぞれの属性に基づいて、前記コンテンツの意味を表す情報を、前記コンテンツに付与する付与部を更に備える、
請求項1から6のうちいずれか一項に記載の情報処理装置。 - コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出する抽出部と、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記抽出部によって前記第1エンティティとして抽出された前記一つ又は複数の固有表現のそれぞれの属性を決定する第1決定部と、
前記コンテンツにおける前記固有表現の出現位置に基づいて、前記第1決定部によって属性が決定された前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定する第2決定部と、を備え、
前記ナレッジベース上では、複数の前記第2エンティティのそれぞれに対して、ユーザが前記第2エンティティに対応したコンテンツを検索したときの回数に基づく指標値が対応付けられており、
前記第1決定部は、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、複数の前記第2エンティティのそれぞれの前記指標値に基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択し、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定する、
情報処理装置。 - コンピュータが、
コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出し、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記第1エンティティとして抽出した前記一つ又は複数の固有表現のそれぞれの属性を決定し、
前記コンテンツにおける前記固有表現の出現位置に基づいて、属性を決定した前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定し、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、前記コンテンツのコンテキストワードに基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択し、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定する、
情報処理方法。 - コンピュータが、
コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出し、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記第1エンティティとして抽出した前記一つ又は複数の固有表現のそれぞれの属性を決定し、
前記コンテンツにおける前記固有表現の出現位置に基づいて、属性を決定した前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定し、
前記ナレッジベース上では、複数の前記第2エンティティのそれぞれに対して、ユーザが前記第2エンティティに対応したコンテンツを検索したときの回数に基づく指標値が対応付けられており、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、複数の前記第2エンティティのそれぞれの前記指標値に基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択し、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定する、
情報処理方法。 - コンピュータに、
コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出すること、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記第1エンティティとして抽出した前記一つ又は複数の固有表現のそれぞれの属性を決定すること、
前記コンテンツにおける前記固有表現の出現位置に基づいて、属性を決定した前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定すること、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、前記コンテンツのコンテキストワードに基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択すること、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定すること、
を実行させるためのプログラム。 - コンピュータに、
コンテンツから一つ又は複数の固有表現を第1エンティティとして抽出すること、
あるナレッジベースに含まれる第2エンティティの属性に基づいて、前記第1エンティティとして抽出した前記一つ又は複数の固有表現のそれぞれの属性を決定すること、
前記コンテンツにおける前記固有表現の出現位置に基づいて、属性を決定した前記一つ又は複数の固有表現のそれぞれの前記コンテンツに対する重要度を決定すること、
前記ナレッジベース上では、複数の前記第2エンティティのそれぞれに対して、ユーザが前記第2エンティティに対応したコンテンツを検索したときの回数に基づく指標値が対応付けられており、
前記ナレッジベースに、前記固有表現と名称が同じ複数の前記第2エンティティが存在する場合、複数の前記第2エンティティのそれぞれの前記指標値に基づいて、複数の前記第2エンティティの中から、1つの前記第2エンティティを選択すること、
前記選択した第2エンティティの属性を、前記第1エンティティである前記固有表現の属性に決定すること、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020049357A JP7323484B2 (ja) | 2020-03-19 | 2020-03-19 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020049357A JP7323484B2 (ja) | 2020-03-19 | 2020-03-19 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021149580A JP2021149580A (ja) | 2021-09-27 |
JP7323484B2 true JP7323484B2 (ja) | 2023-08-08 |
Family
ID=77848932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020049357A Active JP7323484B2 (ja) | 2020-03-19 | 2020-03-19 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7323484B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006106911A (ja) | 2004-09-30 | 2006-04-20 | Toshiba Corp | 知識情報収集システム、知識情報収集方法及びプログラム |
US20090204596A1 (en) | 2008-02-08 | 2009-08-13 | Xerox Corporation | Semantic compatibility checking for automatic correction and discovery of named entities |
JP2010266971A (ja) | 2009-05-12 | 2010-11-25 | Ntt Data Corp | 端末装置 |
JP2012089019A (ja) | 2010-10-21 | 2012-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
JP2013534673A (ja) | 2010-06-28 | 2013-09-05 | ヤフー! インコーポレイテッド | 無限ブラウズ |
JP2019164424A (ja) | 2018-03-19 | 2019-09-26 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6613644B2 (ja) * | 2015-06-17 | 2019-12-04 | 大日本印刷株式会社 | 情報処理装置、情報処理システム及びプログラム |
-
2020
- 2020-03-19 JP JP2020049357A patent/JP7323484B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006106911A (ja) | 2004-09-30 | 2006-04-20 | Toshiba Corp | 知識情報収集システム、知識情報収集方法及びプログラム |
US20090204596A1 (en) | 2008-02-08 | 2009-08-13 | Xerox Corporation | Semantic compatibility checking for automatic correction and discovery of named entities |
JP2010266971A (ja) | 2009-05-12 | 2010-11-25 | Ntt Data Corp | 端末装置 |
JP2013534673A (ja) | 2010-06-28 | 2013-09-05 | ヤフー! インコーポレイテッド | 無限ブラウズ |
JP2012089019A (ja) | 2010-10-21 | 2012-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
JP2019164424A (ja) | 2018-03-19 | 2019-09-26 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021149580A (ja) | 2021-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11720572B2 (en) | Method and system for content recommendation | |
JP4365074B2 (ja) | ユーザ定義可能なパーソナリティを備えた文書拡充システム | |
JP4893243B2 (ja) | 画像要約方法、画像表示装置、kツリー表示システム、kツリー表示プログラム、および、kツリー表示方法 | |
US8229949B2 (en) | Apparatus, method and program product for presenting next search keyword | |
US10108720B2 (en) | Automatically providing relevant search results based on user behavior | |
JP6381775B2 (ja) | 情報処理システム及び情報処理方法 | |
US20180081880A1 (en) | Method And Apparatus For Ranking Electronic Information By Similarity Association | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
WO2010014082A1 (en) | Method and apparatus for relating datasets by using semantic vectors and keyword analyses | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
US20250077568A1 (en) | Generating personalized content for presentation on user devices | |
US20160299951A1 (en) | Processing a search query and retrieving targeted records from a networked database system | |
CN109952571A (zh) | 基于上下文的图像搜索结果 | |
US20160154885A1 (en) | Method for searching a database | |
JP5226241B2 (ja) | タグを付与する方法 | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
Mata-Rivera et al. | A collaborative learning approach for geographic information retrieval based on social networks | |
KR102088619B1 (ko) | 검색 결과별 가변적 사용자 인터페이스 제공 시스템 및 방법 | |
US20170293683A1 (en) | Method and system for providing contextual information | |
JP7323484B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US8195458B2 (en) | Open class noun classification | |
KR20160007057A (ko) | 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템 | |
KR102111989B1 (ko) | 자연어 질의에 대하여 시계열 정보를 제공하는 시스템 및 방법 | |
WO2014049310A2 (en) | Method and apparatuses for interactive searching of electronic documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221031 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230529 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7323484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |