JP2012226738A - 意味のある実体に基づき、導かれる、関連文書の検索方法 - Google Patents
意味のある実体に基づき、導かれる、関連文書の検索方法 Download PDFInfo
- Publication number
- JP2012226738A JP2012226738A JP2012068155A JP2012068155A JP2012226738A JP 2012226738 A JP2012226738 A JP 2012226738A JP 2012068155 A JP2012068155 A JP 2012068155A JP 2012068155 A JP2012068155 A JP 2012068155A JP 2012226738 A JP2012226738 A JP 2012226738A
- Authority
- JP
- Japan
- Prior art keywords
- search
- entity
- document
- related documents
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
Abstract
【解決手段】一実施形態は、関連文書を検索するためのシステムを提供する。動作中に、システムはソース文書を受信する。システムは、その後、ソース文書から抽出された意味論的実体に基づいて、関連文書を検索する。次に、システムは、ユーザによって調整された検索基準を受信し、それに基づいて関連文書の検索結果を更新する。
【選択図】図2
Description
Claims (10)
- コンピュータによって実行可能な、関連文書の検索方法であって、
ソース文書を受信するステップと、
前記ソース文書から抽出された意味論的実体に基づいて、関連文書を検索するステップと、
ユーザによって調整された検索基準を受信するステップと、
前記ユーザによって調整された検索基準に基づいて関連文書の検索結果を更新するステップとを含む、方法。 - 前記検索基準は、
前記ソース文書から抽出された実体の数に応じた実体抽出の感知と、
実体が関連文書の前記検索に含まれているか、あるいは、関連文書の前記検索から除外されているかを指示する実体に関する選択指示と、
関連文書の前記検索用の実体の重要性を指示する前記実体に関する重みと、
前記検索結果における関連文書の数に応じた検索感知指示であって、より高く感知することによって前記検索結果におけるより多くの関連文書が得られ、より低く感知することによって前記検索結果におけるより少ない関連文書が得られる前記検索感知指示との少なくとも1つを含む、請求項1に記載の方法。 - 1つ以上の追加されたソース文書を受信するステップと、
前記ソース文書から抽出された意味論的実体に基づいて、関連文書の検索結果を更新するステップと、をさらに含む、請求項1に記載の方法。 - さユーザによる1つ以上の付加的な意味論的実体の指定を可能にするステップと、
前記ユーザによって指定された意味論的実体に基づいて、関連文書の検索結果を更新するステップと、をさらに含む、請求項1に記載の方法。 - 前記ユーザによって指定された意味論的実体は、一群の知られている実体から選択された適切な実体である、請求項4に記載の方法。
- 前記検索基準は、構成ファイルに保管される、請求項1に記載の方法。
- 関連文書の前記検索は、ソース文書に関して他の文書の類似度レベルを計算するステップを含む、請求項1に記載の方法。
- 関連文書を検索するためのシステムであって、
ソース文書を受信するように構成された文書受信機構と、
前記ソース文書から抽出された意味論的実体に基づいて、関連文書を検索するように構成された関連文書検索機構と、
ユーザによって調整された検索基準を受信するように構成された検索基準受信機構と、
前記ユーザによって調整された検索基準に基づいて、関連文書の検索結果を更新するように構成された検索更新機構と、を含む、システム。 - 前記検索基準は、
前記ソース文書から抽出された実体の数に応じた実体抽出の感知と、
実体が関連文書の前記検索に含まれているか、あるいは、関連文書の前記検索から除外されているかを指示する実体に関する選択指示と、
関連文書の前記検索用の実体の重要性を指示する前記実体に関する重みと、
前記検索結果における関連文書の数に応じた検索感知指示であって、より高く感知することによって前記検索結果におけるより多くの関連文書が得られ、より低く感知することによって前記検索結果におけるより少ない関連文書が得られる前記検索感知指示との少なくとも1つを含む、請求項8に記載のシステム。 - 前記文書受信機構は、さらに、1つ以上の追加されたソース文書を受信するように構成されており、前記検索更新機構は、さらに、前記ソース文書から抽出された意味論的実体に基づいて、関連文書の検索結果を更新するように構成されている、請求項8に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/089,222 | 2011-04-18 | ||
US13/089,222 US8880530B2 (en) | 2011-04-18 | 2011-04-18 | Method for searching related documents based on and guided by meaningful entities |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012226738A true JP2012226738A (ja) | 2012-11-15 |
JP2012226738A5 JP2012226738A5 (ja) | 2015-05-07 |
JP5837850B2 JP5837850B2 (ja) | 2015-12-24 |
Family
ID=46044388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012068155A Active JP5837850B2 (ja) | 2011-04-18 | 2012-03-23 | 意味のある実体に基づき、導かれる、関連文書の検索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8880530B2 (ja) |
EP (1) | EP2515266A1 (ja) |
JP (1) | JP5837850B2 (ja) |
KR (1) | KR101942578B1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130218885A1 (en) * | 2012-02-22 | 2013-08-22 | Salesforce.Com, Inc. | Systems and methods for context-aware message tagging |
US10713261B2 (en) | 2013-03-13 | 2020-07-14 | Google Llc | Generating insightful connections between graph entities |
US10402061B2 (en) | 2014-09-28 | 2019-09-03 | Microsoft Technology Licensing, Llc | Productivity tools for content authoring |
US10210146B2 (en) | 2014-09-28 | 2019-02-19 | Microsoft Technology Licensing, Llc | Productivity tools for content authoring |
US10528597B2 (en) * | 2014-09-28 | 2020-01-07 | Microsoft Technology Licensing, Llc | Graph-driven authoring in productivity tools |
US10050985B2 (en) | 2014-11-03 | 2018-08-14 | Vectra Networks, Inc. | System for implementing threat detection using threat and risk assessment of asset-actor interactions |
US10033752B2 (en) | 2014-11-03 | 2018-07-24 | Vectra Networks, Inc. | System for implementing threat detection using daily network traffic community outliers |
US11017179B2 (en) | 2018-12-28 | 2021-05-25 | Open Text Sa Ulc | Real-time in-context smart summarizer |
US11003840B2 (en) | 2019-06-27 | 2021-05-11 | Open Text Corporation | System and method for in-context document composition using subject metadata queries |
US11620351B2 (en) | 2019-11-07 | 2023-04-04 | Open Text Holdings, Inc. | Content management methods for providing automated generation of content summaries |
US11256735B2 (en) | 2019-11-07 | 2022-02-22 | Open Text Holdings, Inc. | Content management systems providing automated generation of content summaries |
US11423114B2 (en) | 2019-11-07 | 2022-08-23 | Open Text Holdings, Inc. | Content management systems for providing automated generation of content suggestions |
US11216521B2 (en) | 2019-11-07 | 2022-01-04 | Open Text Holdings, Inc. | Content management methods for providing automated generation of content suggestions |
US11790014B2 (en) * | 2021-12-31 | 2023-10-17 | Microsoft Technology Licensing, Llc | System and method of determining content similarity by comparing semantic entity attributes |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050055365A1 (en) * | 2003-09-09 | 2005-03-10 | I.V. Ramakrishnan | Scalable data extraction techniques for transforming electronic documents into queriable archives |
JP2007065745A (ja) * | 2005-08-29 | 2007-03-15 | Canon Inc | 文書検索方法および文書検索装置、プログラム |
JP2009048369A (ja) * | 2007-08-17 | 2009-03-05 | Fujitsu Ltd | 情報処理方法、情報処理装置、および、情報処理プログラム |
WO2011039848A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | 関心領域抽出装置及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6820075B2 (en) | 2001-08-13 | 2004-11-16 | Xerox Corporation | Document-centric system with auto-completion |
US7444328B2 (en) * | 2005-06-06 | 2008-10-28 | Microsoft Corporation | Keyword-driven assistance |
US8713001B2 (en) * | 2007-07-10 | 2014-04-29 | Asim Roy | Systems and related methods of user-guided searching |
US20090210391A1 (en) * | 2008-02-14 | 2009-08-20 | Hall Stephen G | Method and system for automated search for, and retrieval and distribution of, information |
KR101079769B1 (ko) * | 2009-05-21 | 2011-11-04 | 주식회사 아이네크 | 다수 분류 체계를 연동한 시멘틱 검색 방법 및 시스템 |
US8762375B2 (en) * | 2010-04-15 | 2014-06-24 | Palo Alto Research Center Incorporated | Method for calculating entity similarities |
US8612457B2 (en) * | 2011-03-28 | 2013-12-17 | Palo Alto Research Center Incorporated | Method and system for comparing documents based on different document-similarity calculation methods using adaptive weighting |
-
2011
- 2011-04-18 US US13/089,222 patent/US8880530B2/en active Active
-
2012
- 2012-03-23 JP JP2012068155A patent/JP5837850B2/ja active Active
- 2012-04-13 EP EP12164113A patent/EP2515266A1/en not_active Ceased
- 2012-04-16 KR KR1020120039020A patent/KR101942578B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050055365A1 (en) * | 2003-09-09 | 2005-03-10 | I.V. Ramakrishnan | Scalable data extraction techniques for transforming electronic documents into queriable archives |
JP2007065745A (ja) * | 2005-08-29 | 2007-03-15 | Canon Inc | 文書検索方法および文書検索装置、プログラム |
JP2009048369A (ja) * | 2007-08-17 | 2009-03-05 | Fujitsu Ltd | 情報処理方法、情報処理装置、および、情報処理プログラム |
WO2011039848A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | 関心領域抽出装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20120118420A (ko) | 2012-10-26 |
KR101942578B1 (ko) | 2019-01-25 |
JP5837850B2 (ja) | 2015-12-24 |
EP2515266A1 (en) | 2012-10-24 |
US20120265767A1 (en) | 2012-10-18 |
US8880530B2 (en) | 2014-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5837850B2 (ja) | 意味のある実体に基づき、導かれる、関連文書の検索方法 | |
US11403565B2 (en) | Method and system for generating a learning path using machine learning | |
US20230018582A1 (en) | Identifying relevant information within a document hosting system | |
US8015189B2 (en) | Customizable connections between media and meta-data via feeds | |
US9378290B2 (en) | Scenario-adaptive input method editor | |
US9767186B2 (en) | Retrieving a specific sentence from a document | |
US10929603B2 (en) | Context-based text auto completion | |
US11662872B1 (en) | Providing content presentation elements in conjunction with a media content item | |
US20230221837A1 (en) | Coalescing Notifications Associated with Interactive Digital Content | |
US10810370B2 (en) | System and method for generating predictions | |
JP5754057B2 (ja) | ユーザ生成コンテンツ項目とエンティティのマッチング | |
KR20170037957A (ko) | 스프레드시트의 데이터세트를 폼 기반 뷰 내에 표현하는 기법 | |
US10945040B1 (en) | Generating and providing topic visual elements based on audio content and video content of a digital video | |
US20130041962A1 (en) | Information Filtering | |
US10409463B2 (en) | Forking digital content items between digital topical environments | |
JP6728178B2 (ja) | 検索データを処理するための方法及び装置 | |
CN104881431B (zh) | 一种用于在计算机设备中获得搜索结果页的方法和装置 | |
CN110569494A (zh) | 用于生成信息的方法和装置 | |
US10365798B1 (en) | Feedback manager for integration with an application | |
US11775493B2 (en) | Information retrieval system | |
CN106775711B (zh) | 针对联系人的信息处理方法、设备和计算机可读存储介质 | |
JP2010015394A (ja) | リンク先提示装置およびコンピュータプログラム | |
CN106021416A (zh) | 一种文件图标的创建方法和终端 | |
US11928320B1 (en) | Storing and arranging application windows for video call scenes | |
US11960911B1 (en) | Storing and restoring desktop application scenes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150320 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150320 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20150320 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5837850 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |