JP2015179516A - 大量の複雑な構造化データを管理するための知識エンジン - Google Patents
大量の複雑な構造化データを管理するための知識エンジン Download PDFInfo
- Publication number
- JP2015179516A JP2015179516A JP2015054835A JP2015054835A JP2015179516A JP 2015179516 A JP2015179516 A JP 2015179516A JP 2015054835 A JP2015054835 A JP 2015054835A JP 2015054835 A JP2015054835 A JP 2015054835A JP 2015179516 A JP2015179516 A JP 2015179516A
- Authority
- JP
- Japan
- Prior art keywords
- encoded
- entities
- entity
- list
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000004044 response Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 239000012458 free base Substances 0.000 abstract description 6
- 230000008520 organization Effects 0.000 abstract description 2
- 230000007246 mechanism Effects 0.000 description 6
- 239000002585 base Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願は、2014年3月18日に出願された米国仮出願第61/955,077号の利益を主張し、同文献の内容は参照により本明細書にすべて援用される。
Claims (20)
- 符号化されたリソース記述フレームワークエンティティ、属性、値、及び符号化されたカテゴリのセットについて、符号化されたカテゴリのカテゴリ索引を作成するステップであって、前記カテゴリ索引中の各符号化されたカテゴリは、対応する符号化されたエンティティのリストを含む、当該作成するステップと、
符号化された属性ごとに、当該符号化された属性についての符号化された値を有する符号化されたエンティティを判定するステップと、
判定結果に応じて、符号化された属性と、該符号化された属性に対応する符号化されたエンティティ及び符号化された値と、に関する属性索引を形成するステップと、
前記カテゴリ索引及び前記属性索引を記憶して知識データベースを形成するステップと、
を含む方法。 - 構造化クエリを分解して複数の単純クエリにするステップと、
前記複数の単純クエリの各々について、前記知識データベースの前記カテゴリ索引又は前記属性索引にアクセスして、符号化されたエンティティのリストを求めるステップと、
複数の前記符号化されたエンティティのリストの共通集合を求めて、前記構造化クエリに応答性のある前記符号化されたエンティティを判定するステップと、
前記構造化クエリに応答性のある前記符号化されたエンティティを元のエンティティに変換するステップと、
をさらに含む請求項1に記載の方法。 - 符号化された属性、符号化されたエンティティ、符号化された値、及び符号化されたカテゴリが各々、対応する整数からなる請求項2に記載の方法。
- 前記複数の単純クエリの各々が、前記符号化された属性のうち1つの符号化された属性及び前記符号化されたカテゴリのうち1つの符号化されたカテゴリを備える請求項2に記載の方法。
- 複数の前記符号化されたエンティティのリストの共通集合を求める処理が、メモリ中の1つのエンティティリストと前記知識データベース中の別のエンティティリストとの共通集合を求めることを含む請求項2に記載の方法。
- 前記方法が、
前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して前記構造化クエリに応答性のある前記符号化されたエンティティを判定するステップ、
を含む請求項2に記載の方法。 - 前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して前記構造化クエリに応答性のある前記符号化されたエンティティを判定するステップは、
−log(E(A)∩E(B)/E(A)∪E(B))を求めることを含み、
前記E(A)は1つのエンティティであり、前記E(B)は別のエンティティである請求項6に記載の方法。 - 符号化された属性と、該符号化された属性に対応する符号化されたエンティティ及び符号化された値と、に関する属性索引を記憶するように構成された知識データベースであって、符号化されたカテゴリのカテゴリ索引を記憶するようにさらに構成され、前記カテゴリ索引中の各符号化されたカテゴリは、対応する符号化されたエンティティのリストを含む、当該知識データベースと、
前記知識データベースに記憶された前記カテゴリ索引及び前記属性索引を使用して、単純クエリに応答性のある符号化されたエンティティリストを検索するように構成された知識エンジンと、
を備えるシステム。 - 符号化された属性、符号化されたエンティティ、符号化された値、及び符号化されたカテゴリがそれぞれ、対応する整数からなる請求項8に記載のシステム。
- 前記システムが、
自然言語のクエリを受け取ってそれに対応する構造化クエリを前記知識エンジンに提供するように構成されたセマンティックエンジン、
を備える請求項8に記載のシステム。 - 前記知識エンジンが前記知識データベースと対話し、前記単純クエリに応答性のある前記符号化されたエンティティリストをユーザ装置に表示させる請求項8に記載のシステム。
- 前記知識エンジンが、前記符号化されたエンティティの共通集合を求めて、前記単純クエリに応答性のある前記符号化されたエンティティのリストを取得するように構成される請求項8に記載のシステム。
- 前記知識エンジンが、メモリ中の1つのエンティティリストと前記知識データベース中の別のエンティティリストとの共通集合を求めるように構成される請求項8に記載のシステム。
- 前記知識エンジンが、前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して、構造化クエリに応答性のある前記符号化されたエンティティのリストを取得するように構成される請求項8に記載のシステム。
- 前記知識エンジンが、前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して、前記構造化クエリに応答性のある前記符号化されたエンティティのリストを取得するように構成され、前記類似度スコアは、−log((E(A)∩E(B)/E(A)∪E(B))に基づいて求められ、前記E(A)は1つのエンティティであり、前記E(B)は別のエンティティである請求項14に記載のシステム。
- プログラム命令を記憶した非一時的なコンピュータ読み取り可能な記録媒体であって、
前記プログラム命令は、知識エンジンに、
符号化されたリソース記述フォーマットエンティティ、属性、値、及び符号化されたカテゴリのセットについて、符号化されたカテゴリのカテゴリ索引を作成するステップであり、前記カテゴリ索引中の各符号化されたカテゴリは、対応する符号化されたエンティティのリストを含む、当該作成するステップと、
符号化された属性ごとに、当該符号化された属性についての符号化された値を有する符号化されたエンティティを判定するステップと、
判定結果に応じて、符号化された属性と、該符号化された属性に対応する符号化されたエンティティ及び符号化された値と、に関する属性索引を形成するステップと、
前記カテゴリ索引及び前記属性索引を記憶して知識データベースを形成するステップと、
を実行させるためのプログラム命令である、
非一時的なコンピュータ読み取り可能な記録媒体。 - 前記プログラム命令は、知識エンジンに、
構造化クエリを分解して複数の単純クエリにするステップと、
前記複数の単純クエリの各々について、前記知識データベースの前記カテゴリ索引又は前記属性索引にアクセスして、符号化されたエンティティのリストを求めるステップと、
複数の前記符号化されたエンティティのリストの共通集合を求めて、前記構造化クエリに応答性のある前記符号化されたエンティティを判定するステップと、
前記構造化クエリに応答性のある前記符号化されたエンティティを元のエンティティに変換するステップと、
を、さらに実行させるためのプログラム命令である、
請求項16に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記符号化されたエンティティのリストの共通集合を求める処理が、
メモリ中の1つのエンティティリストと前記知識データベース中の別のエンティティリストとの共通集合を求めること、を含む請求項17に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記プログラム命令は、知識エンジンに、
前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して、構造化クエリに応答性のある前記符号化されたエンティティを判定するステップ、
を、さらに実行させるためのプログラム命令である、
請求項16に記載の非一時的なコンピュータ読み取り可能な記録媒体。 - 前記符号化されたエンティティのリスト間の類似度スコアが閾値より大きいことを判定して、前記構造化クエリに応答性のある前記符号化されたエンティティを判定するステップは、
−log(E(A)∩E(B)/E(A)∪E(B))を求めることを含み、
前記E(A)は1つのエンティティであり、前記E(B)は別のエンティティである請求項19に記載の非一時的なコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461955077P | 2014-03-18 | 2014-03-18 | |
US61/955,077 | 2014-03-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015179516A true JP2015179516A (ja) | 2015-10-08 |
JP6440542B2 JP6440542B2 (ja) | 2018-12-19 |
Family
ID=54263471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015054835A Active JP6440542B2 (ja) | 2014-03-18 | 2015-03-18 | 大量の複雑な構造化データを管理するための知識エンジン |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6440542B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6321845B1 (ja) * | 2017-03-10 | 2018-05-09 | ヤフー株式会社 | 付与装置、付与方法および付与プログラム |
JP2019159877A (ja) * | 2018-03-14 | 2019-09-19 | 株式会社日立製作所 | セキュリティシステムとその符号化方式並びにネットワーク制御方式 |
CN111143394A (zh) * | 2019-11-20 | 2020-05-12 | 泰康保险集团股份有限公司 | 知识数据处理方法、装置、介质及电子设备 |
CN111666479A (zh) * | 2019-03-06 | 2020-09-15 | 富士通株式会社 | 搜索网页的方法和计算机可读存储介质 |
KR20210000952A (ko) * | 2019-06-26 | 2021-01-06 | 주식회사 카카오 | 지식그래프 색인 방법 및 장치 |
CN113407730A (zh) * | 2021-05-28 | 2021-09-17 | 北京小米移动软件有限公司 | 基于知识图谱的问答方法、装置及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005196608A (ja) * | 2004-01-09 | 2005-07-21 | National Institute Of Information & Communication Technology | リソース選択システム、リソース選択処理装置、リソース選択プログラム、およびリソース選択処理方法 |
US20060235823A1 (en) * | 2005-04-18 | 2006-10-19 | Oracle International Corporation | Integrating RDF data into a relational database system |
JP2013130965A (ja) * | 2011-12-20 | 2013-07-04 | Hitachi Ltd | データ分析装置、データ分析方法及びプログラム |
WO2013111287A1 (ja) * | 2012-01-25 | 2013-08-01 | 株式会社日立製作所 | Sparqlクエリ最適化方法 |
-
2015
- 2015-03-18 JP JP2015054835A patent/JP6440542B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005196608A (ja) * | 2004-01-09 | 2005-07-21 | National Institute Of Information & Communication Technology | リソース選択システム、リソース選択処理装置、リソース選択プログラム、およびリソース選択処理方法 |
US20060235823A1 (en) * | 2005-04-18 | 2006-10-19 | Oracle International Corporation | Integrating RDF data into a relational database system |
JP2013130965A (ja) * | 2011-12-20 | 2013-07-04 | Hitachi Ltd | データ分析装置、データ分析方法及びプログラム |
WO2013111287A1 (ja) * | 2012-01-25 | 2013-08-01 | 株式会社日立製作所 | Sparqlクエリ最適化方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6321845B1 (ja) * | 2017-03-10 | 2018-05-09 | ヤフー株式会社 | 付与装置、付与方法および付与プログラム |
JP2018151800A (ja) * | 2017-03-10 | 2018-09-27 | ヤフー株式会社 | 付与装置、付与方法および付与プログラム |
JP2019159877A (ja) * | 2018-03-14 | 2019-09-19 | 株式会社日立製作所 | セキュリティシステムとその符号化方式並びにネットワーク制御方式 |
CN111666479A (zh) * | 2019-03-06 | 2020-09-15 | 富士通株式会社 | 搜索网页的方法和计算机可读存储介质 |
KR20210000952A (ko) * | 2019-06-26 | 2021-01-06 | 주식회사 카카오 | 지식그래프 색인 방법 및 장치 |
KR102309375B1 (ko) * | 2019-06-26 | 2021-10-06 | 주식회사 카카오 | 지식그래프 색인 방법 및 장치 |
CN111143394A (zh) * | 2019-11-20 | 2020-05-12 | 泰康保险集团股份有限公司 | 知识数据处理方法、装置、介质及电子设备 |
CN111143394B (zh) * | 2019-11-20 | 2023-06-13 | 泰康保险集团股份有限公司 | 知识数据处理方法、装置、介质及电子设备 |
CN113407730A (zh) * | 2021-05-28 | 2021-09-17 | 北京小米移动软件有限公司 | 基于知识图谱的问答方法、装置及计算机可读存储介质 |
CN113407730B (zh) * | 2021-05-28 | 2024-03-12 | 北京小米移动软件有限公司 | 基于知识图谱的问答方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6440542B2 (ja) | 2018-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10055482B2 (en) | Knowledge engine for managing massive complex structured data | |
JP6440542B2 (ja) | 大量の複雑な構造化データを管理するための知識エンジン | |
US20210165955A1 (en) | Methods and systems for modeling complex taxonomies with natural language understanding | |
US9710468B2 (en) | Topic profile query creation | |
US9633074B1 (en) | Querying data set tables in a non-transactional database | |
US11227011B2 (en) | Content recommendations | |
US20120158791A1 (en) | Feature vector construction | |
US20120246154A1 (en) | Aggregating search results based on associating data instances with knowledge base entities | |
US9959326B2 (en) | Annotating schema elements based on associating data instances with knowledge base entities | |
US20150095407A1 (en) | Recommending content in a client-server environment | |
US9582572B2 (en) | Personalized search library based on continual concept correlation | |
US20140201203A1 (en) | System, method and device for providing an automated electronic researcher | |
US20180129716A1 (en) | Multi-Level Data Pagination | |
US20150081690A1 (en) | Network sourced enrichment and categorization of media content | |
US20140379723A1 (en) | Automatic method for profile database aggregation, deduplication, and analysis | |
US10936640B2 (en) | Intelligent visualization of unstructured data in column-oriented data tables | |
EP3807784A1 (en) | Providing query recommendations | |
US9043321B2 (en) | Enhancing cluster analysis using document metadata | |
JP2019087249A (ja) | 自動検索辞書およびユーザインターフェイス | |
US10642872B2 (en) | System for optimizing content queries | |
US9465658B1 (en) | Task distribution over a heterogeneous environment through task and consumer categories | |
US20170124090A1 (en) | Method of discovering and exploring feature knowledge | |
JP7188879B2 (ja) | 提供装置、提供方法及び提供プログラム | |
US9519710B1 (en) | Dynamic classification of attribute relevance and classification | |
WO2016010591A1 (en) | Search engine using name clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171002 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6440542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |