RU2010107150A - Идентификация семантических отношений в косвенной речи - Google Patents
Идентификация семантических отношений в косвенной речи Download PDFInfo
- Publication number
- RU2010107150A RU2010107150A RU2010107150/08A RU2010107150A RU2010107150A RU 2010107150 A RU2010107150 A RU 2010107150A RU 2010107150/08 A RU2010107150/08 A RU 2010107150/08A RU 2010107150 A RU2010107150 A RU 2010107150A RU 2010107150 A RU2010107150 A RU 2010107150A
- Authority
- RU
- Russia
- Prior art keywords
- semantic
- identified elements
- elements
- identified
- information
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых: ! идентифицируют на этапе 910 текстовую часть документа; ! определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов; ! идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции; ! связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и ! создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов. ! 2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных. ! 3. Способ по п.1, дополнительно содержащий этап, на котором: ! получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа. ! 4. Способ по п.1, дополнительно содержащий этап, на котором: ! проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление. ! 5. Способ по п.1, д
Claims (20)
1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых:
идентифицируют на этапе 910 текстовую часть документа;
определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов;
идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции;
связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и
создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов.
2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных.
3. Способ по п.1, дополнительно содержащий этап, на котором:
получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа.
4. Способ по п.1, дополнительно содержащий этап, на котором:
проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление.
5. Способ по п.1, дополнительно содержащий этап, на котором:
распознают один или более объектов в пределах текстовой части, в котором один или более объектов распознаются посредством поиска заданного списка слов, хранящегося в хранилище данных.
6. Способ по п.1, дополнительно содержащий этап, на котором:
ассоциируют с каждым из идентифицированных элементов множество слов, имеющих схожее значение.
7. Способ по п.1, в котором ассоциирование идентифицированных элементов содержит идентификацию одного или более уровней ассоциации в пределах текстовой части, причем каждый один или более уровней ассоциации содержит один или более идентифицированных элементов.
8. Способ по п.7, дополнительно содержащий этапы, на которых:
идентифицируют действие по предоставлению информации, по меньшей мере, для одного или более уровней ассоциации; и
ассоциируют первое действие по предоставлению информации с каждым идентифицированным элементом из первого набора идентифицированных элементов, при этом первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации.
9. Способ по п.8, дополнительно содержащий этап, на котором:
ассоциируют второе действие по предоставлению информации с каждым из идентифицированных элементов второго набора идентифицированных элементов, при этом второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации.
10. Способ по п.8, в котором первое действие по предоставлению информации и каждый из идентифицированных элементов первого набора идентифицированных элементов ассоциируются посредством реляционного элемента, который описывает ассоциацию.
11. Способ по п.10, дополнительно содержащий этап, на котором:
индексируют семантическое представление, в котором семантическое представление, содержащее идентифицированные элементы и реляционные элементы, хранится в индексе для извлечения, и в котором индекс доступен для поиска.
12. Способ по п.11, в котором индекс содержит указатели от семантического представления к его ассоциированной текстовой части, которая хранится в хранилище данных.
13. Осуществляемый компьютером способ создания в ответ на получение запроса ассоциаций между различными терминами, извлеченными из запроса для создания суждения, причем суждение используется для опроса семантических представлений содержания из документов, хранящихся в семантическом индексе, чтобы обеспечить соответствующие результаты поиска, содержащий этапы, на которых:
определяют на этапе 1010 семантическую информацию для одного или более терминов для поиска;
идентифицируют на этапе 1020 первое действие по предоставлению информации в пределах запроса;
определяют на этапе 1030, основываясь на определенной семантической информации для одного или более терминов для поиска, семантические отношения между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, тем самым, ассоциацию с помощью реляционного элемента, который описывает семантические отношения; и
создают на этапе 1040 суждение, причем суждение содержит ассоциацию между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска.
14. Способ по п.13, дополнительно содержащий этап, на котором:
проводят синтаксический анализ запроса, чтобы определить в нем один или более терминов для поиска.
15. Способ по п.13, в котором семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов.
16. Способ по п.13, дополнительно содержащий этап, на котором:
ассоциируют с каждым одним или более терминами для поиска множество слов, имеющих схожее значение, по меньшей мере, с одним или более терминами для поиска.
17. Способ по п.13, в котором суждение является логическим представлением значения запроса, которое используется для опроса семантических отношений, содержащихся среди семантических представлений содержания, полученных из документов.
18. Способ по п.13, дополнительно содержащий этапы, на которых:
идентифицируют второе действие по предоставлению информации в рамках запроса; и
определяют, основываясь на определенной семантической информации, для одного или более терминов для поиска семантические отношения между вторым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, таким образом, ассоциацию посредством реляционного элемента, который описывает семантические отношения.
19. Способ по п.13, дополнительно содержащий этап, на котором:
сравнивают суждение с один или более семантическими представлениями, хранящимися в семантическом индексе, чтобы определить одну или более совпадающих пар.
20. Один или более считываемых компьютером носителей, на которых находятся используемые компьютером команды для выполнения способа построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, дополнительно позволяющего индексирование содержания, способа, содержащего этапы, на которых:
идентифицируют на этапе 1110, по меньшей мере, часть документа, которая должна быть индексирована, причем, по меньшей мере, часть документа является текстовой частью;
проводят на этапе 1120 синтаксический анализ текстовой части документа, чтобы идентифицировать элементы, которые должны быть семантически представлены;
получают на этапе 1130 доступ к хранилищу данных, чтобы определить потенциальные значения и грамматические функции идентифицированных элементов;
определяют на этапе 1140 один или более уровней ассоциации в пределах текстовой части;
идентифицируют на этапе 1150 действие по предоставлению информации в пределах текстовой части для каждого одного или более определенных уровней ассоциации;
ассоциируют на этапе 1160 первое действие по предоставлению информации с первым набором идентифицированных элементов, в котором первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации;
ассоциируют на этапе 1170 второе действие по предоставлению информации со вторым набором идентифицированных элементов, в котором второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации; и
создают на этапе 1180 семантическое представление, содержащее ассоциации, посредством реляционного элемента, который описывает ассоциации между первым набором идентифицированных элементов с первым действием по предоставлении информации и между вторым набором идентифицированных элементов со вторым действием по предоставлении информации.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96943407P | 2007-08-31 | 2007-08-31 | |
US60/969,434 | 2007-08-31 | ||
US12/201,675 | 2008-08-29 | ||
PCT/US2008/074938 WO2009029905A2 (en) | 2007-08-31 | 2008-08-29 | Identification of semantic relationships within reported speech |
US12/201,675 US8868562B2 (en) | 2007-08-31 | 2008-08-29 | Identification of semantic relationships within reported speech |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010107150A true RU2010107150A (ru) | 2011-09-10 |
RU2488877C2 RU2488877C2 (ru) | 2013-07-27 |
Family
ID=42041477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010107150/08A RU2488877C2 (ru) | 2007-08-31 | 2008-08-29 | Идентификация семантических взаимоотношений в косвенной речи |
Country Status (11)
Country | Link |
---|---|
EP (1) | EP2183686A4 (ru) |
JP (1) | JP5501967B2 (ru) |
KR (1) | KR101524889B1 (ru) |
CN (1) | CN101796511B (ru) |
AU (1) | AU2008292781B2 (ru) |
BR (1) | BRPI0816088A2 (ru) |
CA (1) | CA2698105C (ru) |
IL (1) | IL204108A (ru) |
MX (1) | MX2010002350A (ru) |
RU (1) | RU2488877C2 (ru) |
WO (1) | WO2009029905A2 (ru) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
JP6087899B2 (ja) * | 2011-03-31 | 2017-03-01 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 会話ダイアログ学習および会話ダイアログ訂正 |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
JP6176017B2 (ja) * | 2013-09-17 | 2017-08-09 | 富士通株式会社 | 検索装置、検索方法、およびプログラム |
RU2544739C1 (ru) * | 2014-03-25 | 2015-03-20 | Игорь Петрович Рогачев | Способ преобразования структурированного массива данных |
CA2970168A1 (en) * | 2014-12-10 | 2016-06-16 | Kyndi, Inc. | Weighted subsymbolic data encoding |
US10503832B2 (en) * | 2016-07-29 | 2019-12-10 | Rovi Guides, Inc. | Systems and methods for disambiguating a term based on static and temporal knowledge graphs |
CN107818076B (zh) * | 2016-09-12 | 2021-11-12 | 微软技术许可有限责任公司 | 针对自然语言的语义处理 |
US10798027B2 (en) * | 2017-03-05 | 2020-10-06 | Microsoft Technology Licensing, Llc | Personalized communications using semantic memory |
JP7176233B2 (ja) | 2018-06-04 | 2022-11-22 | 富士通株式会社 | 検索方法、検索プログラムおよび検索装置 |
CN110895657B (zh) * | 2018-09-11 | 2023-05-26 | 慧捷(上海)科技股份有限公司 | 一种基于口语对话特征的语义逻辑表达和分析方法 |
WO2020079752A1 (ja) * | 2018-10-16 | 2020-04-23 | 株式会社島津製作所 | 文献検索方法および文献検索システム |
CN109871428B (zh) * | 2019-01-30 | 2022-02-18 | 北京百度网讯科技有限公司 | 用于确定文本相关度的方法、装置、设备和介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
EP0962873A1 (en) * | 1998-06-02 | 1999-12-08 | International Business Machines Corporation | Processing of textual information and automated apprehension of information |
US6901402B1 (en) * | 1999-06-18 | 2005-05-31 | Microsoft Corporation | System for improving the performance of information retrieval-type tasks by identifying the relations of constituents |
US7120574B2 (en) * | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US8799776B2 (en) * | 2001-07-31 | 2014-08-05 | Invention Machine Corporation | Semantic processor for recognition of whole-part relations in natural language documents |
US20050071150A1 (en) * | 2002-05-28 | 2005-03-31 | Nasypny Vladimir Vladimirovich | Method for synthesizing a self-learning system for extraction of knowledge from textual documents for use in search |
RU2273879C2 (ru) * | 2002-05-28 | 2006-04-10 | Владимир Владимирович Насыпный | Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем |
US7424420B2 (en) * | 2003-02-11 | 2008-09-09 | Fuji Xerox Co., Ltd. | System and method for dynamically determining the function of a lexical item based on context |
US7593845B2 (en) * | 2003-10-06 | 2009-09-22 | Microsoflt Corporation | Method and apparatus for identifying semantic structures from text |
US20050182617A1 (en) * | 2004-02-17 | 2005-08-18 | Microsoft Corporation | Methods and systems for providing automated actions on recognized text strings in a computer-generated document |
JP2005284723A (ja) * | 2004-03-30 | 2005-10-13 | Fuji Xerox Co Ltd | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
US20070073533A1 (en) | 2005-09-23 | 2007-03-29 | Fuji Xerox Co., Ltd. | Systems and methods for structural indexing of natural language text |
-
2008
- 2008-08-29 AU AU2008292781A patent/AU2008292781B2/en not_active Ceased
- 2008-08-29 RU RU2010107150/08A patent/RU2488877C2/ru not_active IP Right Cessation
- 2008-08-29 CN CN2008801056172A patent/CN101796511B/zh active Active
- 2008-08-29 JP JP2010523188A patent/JP5501967B2/ja not_active Expired - Fee Related
- 2008-08-29 CA CA2698105A patent/CA2698105C/en not_active Expired - Fee Related
- 2008-08-29 WO PCT/US2008/074938 patent/WO2009029905A2/en active Application Filing
- 2008-08-29 MX MX2010002350A patent/MX2010002350A/es not_active Application Discontinuation
- 2008-08-29 BR BRPI0816088-0A2A patent/BRPI0816088A2/pt not_active IP Right Cessation
- 2008-08-29 KR KR1020107006570A patent/KR101524889B1/ko not_active IP Right Cessation
- 2008-08-29 EP EP08828391.6A patent/EP2183686A4/en not_active Ceased
-
2010
- 2010-02-23 IL IL204108A patent/IL204108A/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20100075454A (ko) | 2010-07-02 |
MX2010002350A (es) | 2010-07-30 |
KR101524889B1 (ko) | 2015-06-01 |
CN101796511B (zh) | 2012-11-14 |
JP5501967B2 (ja) | 2014-05-28 |
CN101796511A (zh) | 2010-08-04 |
EP2183686A4 (en) | 2018-03-28 |
CA2698105A1 (en) | 2009-03-05 |
WO2009029905A2 (en) | 2009-03-05 |
AU2008292781A1 (en) | 2009-03-05 |
IL204108A (en) | 2013-09-30 |
WO2009029905A3 (en) | 2009-05-14 |
RU2488877C2 (ru) | 2013-07-27 |
CA2698105C (en) | 2016-07-05 |
EP2183686A2 (en) | 2010-05-12 |
AU2008292781B2 (en) | 2012-08-09 |
JP2010538375A (ja) | 2010-12-09 |
BRPI0816088A2 (pt) | 2015-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2010107150A (ru) | Идентификация семантических отношений в косвенной речи | |
US9424524B2 (en) | Extracting facts from unstructured text | |
CN102982076B (zh) | 基于语义标签库的多维度内容标注方法 | |
US11030227B2 (en) | Discrepancy handler for document ingestion into a corpus for a cognitive computing system | |
TWI512507B (zh) | A method and apparatus for providing multi-granularity word segmentation results | |
US9842161B2 (en) | Discrepancy curator for documents in a corpus of a cognitive computing system | |
CN105608232B (zh) | 一种基于图形数据库的bug知识建模方法 | |
WO2008031062A3 (en) | System and method for building and retriving a full text index | |
US20150154306A1 (en) | Method for searching related entities through entity co-occurrence | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
JP2010538375A5 (ru) | ||
US20090112845A1 (en) | System and method for language sensitive contextual searching | |
CN112231494B (zh) | 信息抽取方法、装置、电子设备及存储介质 | |
WO2020074017A1 (zh) | 基于深度学习的医学文献中关键词筛选方法及装置 | |
CN105843960B (zh) | 基于语义树的索引方法和系统 | |
KR101787062B1 (ko) | 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법 | |
KR101095866B1 (ko) | 웹 기반의 정보 저장 및 검색 방법, 이를 위한 정보 관리 시스템 | |
JP2003281186A (ja) | 類似性判断のための例題ベース検索方法及び検索システム | |
US20150154265A1 (en) | Search suggestions using fuzzy-score matching and entity co-occurrence | |
Klampfl et al. | Reconstructing the logical structure of a scientific publication using machine learning | |
Shah et al. | Analysis and comparative study on phonetic matching techniques | |
CN102207947B (zh) | 一种直接引语素材库的生成方法 | |
CN115617965A (zh) | 一种语言结构大数据的快速检索方法 | |
Soo | A non-learning approach to spelling correction in web queries | |
US8024347B2 (en) | Method and apparatus for automatically differentiating between types of names stored in a data collection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20150526 |
|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20170830 |