JP2010538374A - 曖昧感応自然言語処理システムにおける同一指示解決 - Google Patents
曖昧感応自然言語処理システムにおける同一指示解決 Download PDFInfo
- Publication number
- JP2010538374A JP2010538374A JP2010523185A JP2010523185A JP2010538374A JP 2010538374 A JP2010538374 A JP 2010538374A JP 2010523185 A JP2010523185 A JP 2010523185A JP 2010523185 A JP2010523185 A JP 2010523185A JP 2010538374 A JP2010538374 A JP 2010538374A
- Authority
- JP
- Japan
- Prior art keywords
- text
- same
- computer
- identifying
- fact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003058 natural language processing Methods 0.000 title abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 238000013507 mapping Methods 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 22
- 230000006870 function Effects 0.000 abstract description 6
- 230000014509 gene expression Effects 0.000 description 30
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 241000272525 Anas platyrhynchos Species 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- RGNPBRKPHBKNKX-UHFFFAOYSA-N hexaflumuron Chemical compound C1=C(Cl)C(OC(F)(F)C(F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F RGNPBRKPHBKNKX-UHFFFAOYSA-N 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
【選択図】 図3
Description
「パブロ・ピカソはマラガで生まれた。」
「このスペイン人の画家は、彼の変化に富む様式で有名になった。」
「彼の絵画の中には、大規模なグェルニカがある。」
「彼は、スペイン市民戦争中に、このおぞましい傑作を描いた。」
「ピカソは1973年に亡くなった。」
「[ジョン]は[ジョージ・ワシントン]に[アーヴィング]は偉大な作家だと言った。」
「[ジョン]は[ジョージ]に[ワシントン・アーヴィング]は偉大な作家だと言った。」
1.[ジョン]および[ジョージ]および[ワシントン・アーヴィング]
2.[ジョン]および[ジョージ]および[ワシントン]および[アーヴィング]
3.[ジョン]および[ジョージ・ワシントン]および[アーヴィング]
4.[ジョン]および[ジョージ・ワシントン・アーヴィング]
解析部可能性の3番および4番は、指示解決320によって提示された存在E2「ワシントン・アーヴィング」の左境界と両立しないので、除外するとよい。
Claims (20)
- 同一指示解決メカニズムを統合する方法であって、
テキストの一部を取り出すステップと、
前記テキストの一部の中において同一指示を識別するステップと、
前記テキストの一部から事実を抽出するステップと、
前記識別した同一指示に基づいて、同一指示的意味を含むように、前記事実を拡張するステップと、
を含む、方法。 - 請求項1記載の方法において、前記同一指示を識別するステップは、統語解析からの情報を組み込む、方法。
- 請求項1記載の方法において、前記同一指示を識別するステップは、意味マッピングからの情報を組み込む、方法。
- 請求項1記載の方法において、前記同一指示を識別するステップは、曖昧な同一指示を識別することを含む、方法。
- 請求項1記載の方法であって、更に、前記テキストの一部において曖昧さを識別するステップを含む、方法。
- 請求項5記載の方法であって、更に、前記識別した曖昧さに基づいて、曖昧な意味を含むように前記事実を拡張するステップを含む、方法。
- 請求項1記載の方法であって、更に、前記拡張した事実を、情報取り出しをサポートするように動作可能なインデックスに格納するステップを含む、方法。
- 請求項7記載の方法であって、更に、検索問い合せに応答して、前記インデックスから前記拡張した事実を取り出すステップを含む、方法。
- 請求項1記載の方法であって、更に、前記テキストの一部において識別した同一指示に注釈を付けるステップを含む、方法。
- 請求項2記載の方法であって、更に、前記統語解析からの情報をキャッシュするステップを含む、方法。
- コンピューター実行可能命令が格納されたコンピューター記憶媒体であって、前記コンピューター実行可能命令は、コンピューターによって実行されると、該コンピューターに、
テキストの一部を取り出させ、
前記テキストの一部の中において同一指示を識別させ、
前記テキストの一部から事実を抽出させ、
前記識別した同一指示に基づいて、同一指示的意味を含むように、前記事実を拡張させる、コンピューター記憶媒体。 - 請求項11記載のコンピューター記憶媒体において、前記同一指示を識別することは、統語解析からの情報を組み込む、コンピューター記憶媒体。
- 請求項11記載のコンピューター記憶媒体において、前記同一指示を識別することは、意味マッピングからの情報を組み込む、コンピューター記憶媒体。
- 請求項11記載のコンピューター記憶媒体において、前記同一指示を識別することは、曖昧な同一指示を識別することを含む、コンピューター記憶媒体。
- 請求項11記載のコンピューター記憶媒体であって、更に、前記コンピューターに、前記テキストの一部において曖昧さを識別させる、コンピューター記憶媒体。
- 請求項15記載のコンピューター記憶媒体であって、更に、前記コンピューターに、前記識別した曖昧さに基づいて、曖昧な意味を含むように前記事実を拡張させる、コンピューター記憶媒体。
- 請求項11記載のコンピューター記憶媒体であって、更に、前記コンピューターに、前記拡張した事実を、情報取り出しをサポートするように動作可能なインデックスに格納させる、コンピューター記憶媒体。
- 請求項17記載のコンピューター記憶媒体であって、更に、前記コンピューターに、検索問い合せに応答して、前記インデックスから前記拡張した事実を取り出させる、コンピューター記憶媒体。
- 請求項11記載のコンピューター記憶媒体であって、更に、前記コンピューターに、前記テキストの一部における識別した同一指示に注釈を付けさせる、コンピューター記憶媒体。
- 同一指示解決メカニズムを統合する方法であって、
テキストの一部を取り出すステップと、
前記テキストの一部の中において同一指示を識別するステップと、
前記テキストの一部の中において曖昧さを識別するステップと、
前記テキストの一部から事実を抽出するステップと、
前記識別した同一指示に基づいて、同一指示的意味を含むように、前記事実を拡張するステップと、
情報取り出しをサポートするように動作可能なインデックスに、前記拡張した事実を格納するステップと、
検索問い合せに応答して、前記事実から前記拡張した事実を取り出すステップと、
を含む、方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96942607P | 2007-08-31 | 2007-08-31 | |
US96948307P | 2007-08-31 | 2007-08-31 | |
PCT/US2008/074935 WO2009029903A2 (en) | 2007-08-31 | 2008-08-29 | Coreference resolution in an ambiguity-sensitive natural language processing system |
US12/200,962 US8712758B2 (en) | 2007-08-31 | 2008-08-29 | Coreference resolution in an ambiguity-sensitive natural language processing system |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014156393A Division JP2014238865A (ja) | 2007-08-31 | 2014-07-31 | 曖昧感応自然言語処理システムにおける同一指示解決 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010538374A true JP2010538374A (ja) | 2010-12-09 |
JP2010538374A5 JP2010538374A5 (ja) | 2011-10-13 |
Family
ID=42041476
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010523185A Pending JP2010538374A (ja) | 2007-08-31 | 2008-08-29 | 曖昧感応自然言語処理システムにおける同一指示解決 |
JP2014156393A Pending JP2014238865A (ja) | 2007-08-31 | 2014-07-31 | 曖昧感応自然言語処理システムにおける同一指示解決 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014156393A Pending JP2014238865A (ja) | 2007-08-31 | 2014-07-31 | 曖昧感応自然言語処理システムにおける同一指示解決 |
Country Status (11)
Country | Link |
---|---|
EP (1) | EP2183684A4 (ja) |
JP (2) | JP2010538374A (ja) |
KR (1) | KR101522049B1 (ja) |
CN (1) | CN101796508B (ja) |
AU (1) | AU2008292779B2 (ja) |
BR (1) | BRPI0815826A2 (ja) |
CA (1) | CA2698054C (ja) |
MX (1) | MX2010002349A (ja) |
RU (1) | RU2480822C2 (ja) |
WO (1) | WO2009029903A2 (ja) |
ZA (1) | ZA201001259B (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2643438C2 (ru) * | 2013-12-25 | 2018-02-01 | Общество с ограниченной ответственностью "Аби Продакшн" | Обнаружение языковой неоднозначности в тексте |
RU2563148C2 (ru) * | 2013-07-15 | 2015-09-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Система и метод семантического поиска |
JP5699789B2 (ja) * | 2011-05-10 | 2015-04-15 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
US9286291B2 (en) * | 2013-02-15 | 2016-03-15 | International Business Machines Corporation | Disambiguation of dependent referring expression in natural language processing |
CN104462053B (zh) * | 2013-09-22 | 2018-10-12 | 江苏金鸽网络科技有限公司 | 一种文本内的基于语义特征的人称代词指代消解方法 |
US9606977B2 (en) * | 2014-01-22 | 2017-03-28 | Google Inc. | Identifying tasks in messages |
US9497153B2 (en) * | 2014-01-30 | 2016-11-15 | Google Inc. | Associating a segment of an electronic message with one or more segment addressees |
CN109101533B (zh) * | 2014-05-12 | 2022-07-15 | 谷歌有限责任公司 | 自动化阅读理解 |
CA2959651C (en) * | 2014-09-03 | 2021-04-20 | The Dun & Bradstreet Corporation | System and process for analyzing, qualifying and ingesting sources of unstructured data via empirical attribution |
RU2591175C1 (ru) * | 2015-03-19 | 2016-07-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ и система для глобальной идентификации в коллекции документов |
CN106815215B (zh) * | 2015-11-30 | 2019-11-26 | 华为技术有限公司 | 生成标注库的方法和装置 |
CN107515851B (zh) * | 2016-06-16 | 2021-09-10 | 佳能株式会社 | 用于共指消解、信息提取以及相似文档检索的装置和方法 |
JP7135399B2 (ja) * | 2018-04-12 | 2022-09-13 | 富士通株式会社 | 特定プログラム、特定方法および情報処理装置 |
JP7503000B2 (ja) * | 2018-06-25 | 2024-06-19 | セールスフォース インコーポレイテッド | エンティティー間の関係の調査するためのシステム及び方法 |
US20200074322A1 (en) * | 2018-09-04 | 2020-03-05 | Rovi Guides, Inc. | Methods and systems for using machine-learning extracts and semantic graphs to create structured data to drive search, recommendation, and discovery |
CN109815482B (zh) * | 2018-12-17 | 2023-05-23 | 北京百度网讯科技有限公司 | 一种新闻交互的方法、装置、设备和计算机存储介质 |
US11630953B2 (en) * | 2019-07-25 | 2023-04-18 | Baidu Usa Llc | Systems and methods for end-to-end deep reinforcement learning based coreference resolution |
US11151321B2 (en) * | 2019-12-10 | 2021-10-19 | International Business Machines Corporation | Anaphora resolution |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0268661A (ja) * | 1988-09-05 | 1990-03-08 | Agency Of Ind Science & Technol | 文脈理解装置 |
JPH1011462A (ja) * | 1996-06-26 | 1998-01-16 | Fuji Xerox Co Ltd | 類似関係展開辞書、類似度評価装置、検索装置 |
JPH11282844A (ja) * | 1998-03-26 | 1999-10-15 | Toshiba Corp | 文書作成方法および情報処理装置および記録媒体 |
JP2006330298A (ja) * | 2005-05-25 | 2006-12-07 | Toshiba Corp | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP2006344102A (ja) * | 2005-06-10 | 2006-12-21 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2096824C1 (ru) * | 1996-04-29 | 1997-11-20 | Государственный научно-технический центр гиперинформационных технологий | Способы автоматизированной обработки информационных материалов для персонализированного использования |
JP3504439B2 (ja) * | 1996-07-25 | 2004-03-08 | 日本電信電話株式会社 | 映像検索方法 |
US6185592B1 (en) * | 1997-11-18 | 2001-02-06 | Apple Computer, Inc. | Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds |
CA2419105C (en) * | 2002-02-20 | 2007-01-09 | Xerox Corporation | Generating with lexical functional grammars |
US20050108630A1 (en) * | 2003-11-19 | 2005-05-19 | Wasson Mark D. | Extraction of facts from text |
US20050149499A1 (en) * | 2003-12-30 | 2005-07-07 | Google Inc., A Delaware Corporation | Systems and methods for improving search quality |
US7401077B2 (en) * | 2004-12-21 | 2008-07-15 | Palo Alto Research Center Incorporated | Systems and methods for using and constructing user-interest sensitive indicators of search results |
US8060357B2 (en) * | 2006-01-27 | 2011-11-15 | Xerox Corporation | Linguistic user interface |
-
2008
- 2008-08-29 EP EP08828084.7A patent/EP2183684A4/en not_active Ceased
- 2008-08-29 BR BRPI0815826-6A2A patent/BRPI0815826A2/pt not_active IP Right Cessation
- 2008-08-29 RU RU2010107148/08A patent/RU2480822C2/ru not_active IP Right Cessation
- 2008-08-29 CA CA2698054A patent/CA2698054C/en not_active Expired - Fee Related
- 2008-08-29 WO PCT/US2008/074935 patent/WO2009029903A2/en active Application Filing
- 2008-08-29 MX MX2010002349A patent/MX2010002349A/es not_active Application Discontinuation
- 2008-08-29 KR KR1020107006475A patent/KR101522049B1/ko not_active IP Right Cessation
- 2008-08-29 AU AU2008292779A patent/AU2008292779B2/en not_active Ceased
- 2008-08-29 CN CN200880105563XA patent/CN101796508B/zh active Active
- 2008-08-29 JP JP2010523185A patent/JP2010538374A/ja active Pending
-
2010
- 2010-02-22 ZA ZA2010/01259A patent/ZA201001259B/en unknown
-
2014
- 2014-07-31 JP JP2014156393A patent/JP2014238865A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0268661A (ja) * | 1988-09-05 | 1990-03-08 | Agency Of Ind Science & Technol | 文脈理解装置 |
JPH1011462A (ja) * | 1996-06-26 | 1998-01-16 | Fuji Xerox Co Ltd | 類似関係展開辞書、類似度評価装置、検索装置 |
JPH11282844A (ja) * | 1998-03-26 | 1999-10-15 | Toshiba Corp | 文書作成方法および情報処理装置および記録媒体 |
JP2006330298A (ja) * | 2005-05-25 | 2006-12-07 | Toshiba Corp | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP2006344102A (ja) * | 2005-06-10 | 2006-12-21 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2014238865A (ja) | 2014-12-18 |
KR101522049B1 (ko) | 2015-05-20 |
RU2480822C2 (ru) | 2013-04-27 |
EP2183684A2 (en) | 2010-05-12 |
CA2698054C (en) | 2015-12-22 |
CN101796508A (zh) | 2010-08-04 |
EP2183684A4 (en) | 2017-10-18 |
CA2698054A1 (en) | 2009-03-05 |
CN101796508B (zh) | 2013-03-06 |
RU2010107148A (ru) | 2011-09-10 |
BRPI0815826A2 (pt) | 2015-02-18 |
MX2010002349A (es) | 2010-07-30 |
AU2008292779A1 (en) | 2009-03-05 |
AU2008292779B2 (en) | 2012-09-06 |
ZA201001259B (en) | 2012-05-30 |
KR20100075451A (ko) | 2010-07-02 |
WO2009029903A2 (en) | 2009-03-05 |
WO2009029903A3 (en) | 2009-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8712758B2 (en) | Coreference resolution in an ambiguity-sensitive natural language processing system | |
KR101522049B1 (ko) | 모호성 민감 자연 언어 처리 시스템에서의 동일 지시어 분석 | |
US11657223B2 (en) | Keyphase extraction beyond language modeling | |
US10025819B2 (en) | Generating a query statement based on unstructured input | |
Kowalski | Information retrieval systems: theory and implementation | |
US8280721B2 (en) | Efficiently representing word sense probabilities | |
US20140114942A1 (en) | Dynamic Pruning of a Search Index Based on Search Results | |
US20160292153A1 (en) | Identification of examples in documents | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
KR20210097347A (ko) | 인공지능 기반 이미지 검색 방법 및 장치 | |
Moncla et al. | Automated geoparsing of paris street names in 19th century novels | |
KR20120064559A (ko) | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 | |
US8554539B2 (en) | Method for analyzing morpheme using additional information and morpheme analyzer for executing the method | |
US8229970B2 (en) | Efficient storage and retrieval of posting lists | |
Dumitru et al. | Garbage in, garbage out: An analysis of HTML text extractors and their impact on NLP performance | |
Garrido et al. | GEO-NASS: A semantic tagging experience from geographical data on the media | |
Yunus et al. | Semantic method for query translation. | |
Vidya et al. | Web Page Ranking Using Multilingual Information Search Algorithm-A Novel Approach | |
US20080033953A1 (en) | Method to search transactional web pages | |
Hazman et al. | An ontology based approach for automatically annotating document segments | |
Tran et al. | A model of vietnamese person named entity question answering system | |
CN113918804A (zh) | 商品信息检索系统及方法 | |
KR20100039968A (ko) | 자동 언어 번역을 통한 다국어의 전거 표목에 대한 온톨로지 기반 의미 검색 시스템 및 방법 | |
Singh et al. | Intelligent Bilingual Data Extraction and Rebuilding Using Data Mining for Big Data | |
Alam et al. | Improving accessibility of archived raster dictionaries of complex script languages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110826 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130816 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140401 |