RU2010107150A - Идентификация семантических отношений в косвенной речи - Google Patents

Идентификация семантических отношений в косвенной речи Download PDF

Info

Publication number
RU2010107150A
RU2010107150A RU2010107150/08A RU2010107150A RU2010107150A RU 2010107150 A RU2010107150 A RU 2010107150A RU 2010107150/08 A RU2010107150/08 A RU 2010107150/08A RU 2010107150 A RU2010107150 A RU 2010107150A RU 2010107150 A RU2010107150 A RU 2010107150A
Authority
RU
Russia
Prior art keywords
semantic
identified elements
elements
identified
information
Prior art date
Application number
RU2010107150/08A
Other languages
English (en)
Other versions
RU2488877C2 (ru
Inventor
Ричард КРАУЧ (US)
Ричард КРАУЧ
Ден Берг Ван (Us)
Ден Берг Ван
Дэвид АН (US)
Дэвид АН
Оля ГУРЕВИЧ (US)
Оля ГУРЕВИЧ
Барни ПЕЛЛ (US)
Барни ПЕЛЛ
Ливия ПОЛАНИ (US)
Ливия ПОЛАНИ
Скотт ПРИВОСТ (US)
Скотт ПРИВОСТ
Джованни Лоренцо ТИОНЕ (US)
Джованни Лоренцо ТИОНЕ
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Priority claimed from US12/201,675 external-priority patent/US8868562B2/en
Publication of RU2010107150A publication Critical patent/RU2010107150A/ru
Application granted granted Critical
Publication of RU2488877C2 publication Critical patent/RU2488877C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых: ! идентифицируют на этапе 910 текстовую часть документа; ! определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов; ! идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции; ! связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и ! создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов. ! 2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных. ! 3. Способ по п.1, дополнительно содержащий этап, на котором: ! получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа. ! 4. Способ по п.1, дополнительно содержащий этап, на котором: ! проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление. ! 5. Способ по п.1, д

Claims (20)

1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых:
идентифицируют на этапе 910 текстовую часть документа;
определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов;
идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции;
связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и
создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов.
2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных.
3. Способ по п.1, дополнительно содержащий этап, на котором:
получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа.
4. Способ по п.1, дополнительно содержащий этап, на котором:
проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление.
5. Способ по п.1, дополнительно содержащий этап, на котором:
распознают один или более объектов в пределах текстовой части, в котором один или более объектов распознаются посредством поиска заданного списка слов, хранящегося в хранилище данных.
6. Способ по п.1, дополнительно содержащий этап, на котором:
ассоциируют с каждым из идентифицированных элементов множество слов, имеющих схожее значение.
7. Способ по п.1, в котором ассоциирование идентифицированных элементов содержит идентификацию одного или более уровней ассоциации в пределах текстовой части, причем каждый один или более уровней ассоциации содержит один или более идентифицированных элементов.
8. Способ по п.7, дополнительно содержащий этапы, на которых:
идентифицируют действие по предоставлению информации, по меньшей мере, для одного или более уровней ассоциации; и
ассоциируют первое действие по предоставлению информации с каждым идентифицированным элементом из первого набора идентифицированных элементов, при этом первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации.
9. Способ по п.8, дополнительно содержащий этап, на котором:
ассоциируют второе действие по предоставлению информации с каждым из идентифицированных элементов второго набора идентифицированных элементов, при этом второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации.
10. Способ по п.8, в котором первое действие по предоставлению информации и каждый из идентифицированных элементов первого набора идентифицированных элементов ассоциируются посредством реляционного элемента, который описывает ассоциацию.
11. Способ по п.10, дополнительно содержащий этап, на котором:
индексируют семантическое представление, в котором семантическое представление, содержащее идентифицированные элементы и реляционные элементы, хранится в индексе для извлечения, и в котором индекс доступен для поиска.
12. Способ по п.11, в котором индекс содержит указатели от семантического представления к его ассоциированной текстовой части, которая хранится в хранилище данных.
13. Осуществляемый компьютером способ создания в ответ на получение запроса ассоциаций между различными терминами, извлеченными из запроса для создания суждения, причем суждение используется для опроса семантических представлений содержания из документов, хранящихся в семантическом индексе, чтобы обеспечить соответствующие результаты поиска, содержащий этапы, на которых:
определяют на этапе 1010 семантическую информацию для одного или более терминов для поиска;
идентифицируют на этапе 1020 первое действие по предоставлению информации в пределах запроса;
определяют на этапе 1030, основываясь на определенной семантической информации для одного или более терминов для поиска, семантические отношения между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, тем самым, ассоциацию с помощью реляционного элемента, который описывает семантические отношения; и
создают на этапе 1040 суждение, причем суждение содержит ассоциацию между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска.
14. Способ по п.13, дополнительно содержащий этап, на котором:
проводят синтаксический анализ запроса, чтобы определить в нем один или более терминов для поиска.
15. Способ по п.13, в котором семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов.
16. Способ по п.13, дополнительно содержащий этап, на котором:
ассоциируют с каждым одним или более терминами для поиска множество слов, имеющих схожее значение, по меньшей мере, с одним или более терминами для поиска.
17. Способ по п.13, в котором суждение является логическим представлением значения запроса, которое используется для опроса семантических отношений, содержащихся среди семантических представлений содержания, полученных из документов.
18. Способ по п.13, дополнительно содержащий этапы, на которых:
идентифицируют второе действие по предоставлению информации в рамках запроса; и
определяют, основываясь на определенной семантической информации, для одного или более терминов для поиска семантические отношения между вторым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, таким образом, ассоциацию посредством реляционного элемента, который описывает семантические отношения.
19. Способ по п.13, дополнительно содержащий этап, на котором:
сравнивают суждение с один или более семантическими представлениями, хранящимися в семантическом индексе, чтобы определить одну или более совпадающих пар.
20. Один или более считываемых компьютером носителей, на которых находятся используемые компьютером команды для выполнения способа построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, дополнительно позволяющего индексирование содержания, способа, содержащего этапы, на которых:
идентифицируют на этапе 1110, по меньшей мере, часть документа, которая должна быть индексирована, причем, по меньшей мере, часть документа является текстовой частью;
проводят на этапе 1120 синтаксический анализ текстовой части документа, чтобы идентифицировать элементы, которые должны быть семантически представлены;
получают на этапе 1130 доступ к хранилищу данных, чтобы определить потенциальные значения и грамматические функции идентифицированных элементов;
определяют на этапе 1140 один или более уровней ассоциации в пределах текстовой части;
идентифицируют на этапе 1150 действие по предоставлению информации в пределах текстовой части для каждого одного или более определенных уровней ассоциации;
ассоциируют на этапе 1160 первое действие по предоставлению информации с первым набором идентифицированных элементов, в котором первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации;
ассоциируют на этапе 1170 второе действие по предоставлению информации со вторым набором идентифицированных элементов, в котором второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации; и
создают на этапе 1180 семантическое представление, содержащее ассоциации, посредством реляционного элемента, который описывает ассоциации между первым набором идентифицированных элементов с первым действием по предоставлении информации и между вторым набором идентифицированных элементов со вторым действием по предоставлении информации.
RU2010107150/08A 2007-08-31 2008-08-29 Идентификация семантических взаимоотношений в косвенной речи RU2488877C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US96943407P 2007-08-31 2007-08-31
US60/969,434 2007-08-31
US12/201,675 2008-08-29
PCT/US2008/074938 WO2009029905A2 (en) 2007-08-31 2008-08-29 Identification of semantic relationships within reported speech
US12/201,675 US8868562B2 (en) 2007-08-31 2008-08-29 Identification of semantic relationships within reported speech

Publications (2)

Publication Number Publication Date
RU2010107150A true RU2010107150A (ru) 2011-09-10
RU2488877C2 RU2488877C2 (ru) 2013-07-27

Family

ID=42041477

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010107150/08A RU2488877C2 (ru) 2007-08-31 2008-08-29 Идентификация семантических взаимоотношений в косвенной речи

Country Status (11)

Country Link
EP (1) EP2183686A4 (ru)
JP (1) JP5501967B2 (ru)
KR (1) KR101524889B1 (ru)
CN (1) CN101796511B (ru)
AU (1) AU2008292781B2 (ru)
BR (1) BRPI0816088A2 (ru)
CA (1) CA2698105C (ru)
IL (1) IL204108A (ru)
MX (1) MX2010002350A (ru)
RU (1) RU2488877C2 (ru)
WO (1) WO2009029905A2 (ru)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
JP6087899B2 (ja) * 2011-03-31 2017-03-01 マイクロソフト テクノロジー ライセンシング,エルエルシー 会話ダイアログ学習および会話ダイアログ訂正
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
JP6176017B2 (ja) * 2013-09-17 2017-08-09 富士通株式会社 検索装置、検索方法、およびプログラム
RU2544739C1 (ru) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Способ преобразования структурированного массива данных
CA2970168A1 (en) * 2014-12-10 2016-06-16 Kyndi, Inc. Weighted subsymbolic data encoding
US10503832B2 (en) * 2016-07-29 2019-12-10 Rovi Guides, Inc. Systems and methods for disambiguating a term based on static and temporal knowledge graphs
CN107818076B (zh) * 2016-09-12 2021-11-12 微软技术许可有限责任公司 针对自然语言的语义处理
US10798027B2 (en) * 2017-03-05 2020-10-06 Microsoft Technology Licensing, Llc Personalized communications using semantic memory
JP7176233B2 (ja) 2018-06-04 2022-11-22 富士通株式会社 検索方法、検索プログラムおよび検索装置
CN110895657B (zh) * 2018-09-11 2023-05-26 慧捷(上海)科技股份有限公司 一种基于口语对话特征的语义逻辑表达和分析方法
WO2020079752A1 (ja) * 2018-10-16 2020-04-23 株式会社島津製作所 文献検索方法および文献検索システム
CN109871428B (zh) * 2019-01-30 2022-02-18 北京百度网讯科技有限公司 用于确定文本相关度的方法、装置、设备和介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
EP0962873A1 (en) * 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6901402B1 (en) * 1999-06-18 2005-05-31 Microsoft Corporation System for improving the performance of information retrieval-type tasks by identifying the relations of constituents
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
US20050071150A1 (en) * 2002-05-28 2005-03-31 Nasypny Vladimir Vladimirovich Method for synthesizing a self-learning system for extraction of knowledge from textual documents for use in search
RU2273879C2 (ru) * 2002-05-28 2006-04-10 Владимир Владимирович Насыпный Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем
US7424420B2 (en) * 2003-02-11 2008-09-09 Fuji Xerox Co., Ltd. System and method for dynamically determining the function of a lexical item based on context
US7593845B2 (en) * 2003-10-06 2009-09-22 Microsoflt Corporation Method and apparatus for identifying semantic structures from text
US20050182617A1 (en) * 2004-02-17 2005-08-18 Microsoft Corporation Methods and systems for providing automated actions on recognized text strings in a computer-generated document
JP2005284723A (ja) * 2004-03-30 2005-10-13 Fuji Xerox Co Ltd 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
US20070073533A1 (en) 2005-09-23 2007-03-29 Fuji Xerox Co., Ltd. Systems and methods for structural indexing of natural language text

Also Published As

Publication number Publication date
KR20100075454A (ko) 2010-07-02
MX2010002350A (es) 2010-07-30
KR101524889B1 (ko) 2015-06-01
CN101796511B (zh) 2012-11-14
JP5501967B2 (ja) 2014-05-28
CN101796511A (zh) 2010-08-04
EP2183686A4 (en) 2018-03-28
CA2698105A1 (en) 2009-03-05
WO2009029905A2 (en) 2009-03-05
AU2008292781A1 (en) 2009-03-05
IL204108A (en) 2013-09-30
WO2009029905A3 (en) 2009-05-14
RU2488877C2 (ru) 2013-07-27
CA2698105C (en) 2016-07-05
EP2183686A2 (en) 2010-05-12
AU2008292781B2 (en) 2012-08-09
JP2010538375A (ja) 2010-12-09
BRPI0816088A2 (pt) 2015-03-03

Similar Documents

Publication Publication Date Title
RU2010107150A (ru) Идентификация семантических отношений в косвенной речи
US9424524B2 (en) Extracting facts from unstructured text
CN102982076B (zh) 基于语义标签库的多维度内容标注方法
US11030227B2 (en) Discrepancy handler for document ingestion into a corpus for a cognitive computing system
TWI512507B (zh) A method and apparatus for providing multi-granularity word segmentation results
US9842161B2 (en) Discrepancy curator for documents in a corpus of a cognitive computing system
CN105608232B (zh) 一种基于图形数据库的bug知识建模方法
WO2008031062A3 (en) System and method for building and retriving a full text index
US20150154306A1 (en) Method for searching related entities through entity co-occurrence
CN105045852A (zh) 一种教学资源的全文搜索引擎系统
JP2010538375A5 (ru)
US20090112845A1 (en) System and method for language sensitive contextual searching
CN112231494B (zh) 信息抽取方法、装置、电子设备及存储介质
WO2020074017A1 (zh) 基于深度学习的医学文献中关键词筛选方法及装置
CN105843960B (zh) 基于语义树的索引方法和系统
KR101787062B1 (ko) 위키피디아의 콘텐츠를 기반으로 하는 정보검색 장치 및 정보검색 방법
KR101095866B1 (ko) 웹 기반의 정보 저장 및 검색 방법, 이를 위한 정보 관리 시스템
JP2003281186A (ja) 類似性判断のための例題ベース検索方法及び検索システム
US20150154265A1 (en) Search suggestions using fuzzy-score matching and entity co-occurrence
Klampfl et al. Reconstructing the logical structure of a scientific publication using machine learning
Shah et al. Analysis and comparative study on phonetic matching techniques
CN102207947B (zh) 一种直接引语素材库的生成方法
CN115617965A (zh) 一种语言结构大数据的快速检索方法
Soo A non-learning approach to spelling correction in web queries
US8024347B2 (en) Method and apparatus for automatically differentiating between types of names stored in a data collection

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20150526

MM4A The patent is invalid due to non-payment of fees

Effective date: 20170830