RU2010107150A

RU2010107150A - Идентификация семантических отношений в косвенной речи

Info

Publication number: RU2010107150A
Application number: RU2010107150/08A
Authority: RU
Inventors: Ричард КРАУЧ (US); Ричард КРАУЧ; Ден Берг Ван (Us); Ден Берг Ван; Дэвид АН (US); Дэвид АН; Оля ГУРЕВИЧ (US); Оля ГУРЕВИЧ; Барни ПЕЛЛ (US); Барни ПЕЛЛ; Ливия ПОЛАНИ (US); Ливия ПОЛАНИ; Скотт ПРИВОСТ (US); Скотт ПРИВОСТ; Джованни Лоренцо ТИОНЕ (US); Джованни Лоренцо ТИОНЕ
Original assignee: Майкрософт Корпорейшн (Us); Майкрософт Корпорейшн
Priority date: 2007-08-31
Filing date: 2008-08-29
Publication date: 2011-09-10
Also published as: KR20100075454A; MX2010002350A; KR101524889B1; CN101796511B; JP5501967B2; CN101796511A; EP2183686A4; CA2698105A1; WO2009029905A2; AU2008292781A1; IL204108A; WO2009029905A3; RU2488877C2; CA2698105C; EP2183686A2; AU2008292781B2; JP2010538375A; BRPI0816088A2

Abstract

1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых: ! идентифицируют на этапе 910 текстовую часть документа; ! определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов; ! идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции; ! связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и ! создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов. ! 2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных. ! 3. Способ по п.1, дополнительно содержащий этап, на котором: ! получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа. ! 4. Способ по п.1, дополнительно содержащий этап, на котором: ! проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление. ! 5. Способ по п.1, д

Claims

1. Осуществляемый компьютером способ построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, содержащий этапы, на которых:

идентифицируют на этапе 910 текстовую часть документа;

определяют на этапе 920 семантическую информацию для множества элементов, идентифицированных в текстовой части, причем семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов;

идентифицируют на этапе 930, по меньшей мере, один из идентифицированных элементов как действие по предоставлению информации, соответствующей косвенной речи или сообщению о занимаемой позиции;

связывают на этапе 940, основываясь на определенной семантической информации для идентифицированных элементов, идентифицированные элементы так, чтобы каждая ассоциация идентифицированных элементов представляла определенное семантическое отношение; и

создают на этапе 950 семантическое представление, содержащее ассоциации идентифицированных элементов.

2. Способ по п.1, в котором текстовая часть содержит, по меньшей мере, одно или более предложений, таблиц, шаблонов или множество данных.

3. Способ по п.1, дополнительно содержащий этап, на котором:

получают доступ к хранилищу данных, чтобы извлечь, по меньшей мере, часть содержания из документа.

4. Способ по п.1, дополнительно содержащий этап, на котором:

проводят синтаксический анализ текстовой части документа, чтобы идентифицировать множество элементов, которые должны быть введены в семантическое представление.

5. Способ по п.1, дополнительно содержащий этап, на котором:

распознают один или более объектов в пределах текстовой части, в котором один или более объектов распознаются посредством поиска заданного списка слов, хранящегося в хранилище данных.

6. Способ по п.1, дополнительно содержащий этап, на котором:

ассоциируют с каждым из идентифицированных элементов множество слов, имеющих схожее значение.

7. Способ по п.1, в котором ассоциирование идентифицированных элементов содержит идентификацию одного или более уровней ассоциации в пределах текстовой части, причем каждый один или более уровней ассоциации содержит один или более идентифицированных элементов.

8. Способ по п.7, дополнительно содержащий этапы, на которых:

идентифицируют действие по предоставлению информации, по меньшей мере, для одного или более уровней ассоциации; и

ассоциируют первое действие по предоставлению информации с каждым идентифицированным элементом из первого набора идентифицированных элементов, при этом первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации.

9. Способ по п.8, дополнительно содержащий этап, на котором:

ассоциируют второе действие по предоставлению информации с каждым из идентифицированных элементов второго набора идентифицированных элементов, при этом второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации.

10. Способ по п.8, в котором первое действие по предоставлению информации и каждый из идентифицированных элементов первого набора идентифицированных элементов ассоциируются посредством реляционного элемента, который описывает ассоциацию.

11. Способ по п.10, дополнительно содержащий этап, на котором:

индексируют семантическое представление, в котором семантическое представление, содержащее идентифицированные элементы и реляционные элементы, хранится в индексе для извлечения, и в котором индекс доступен для поиска.

12. Способ по п.11, в котором индекс содержит указатели от семантического представления к его ассоциированной текстовой части, которая хранится в хранилище данных.

13. Осуществляемый компьютером способ создания в ответ на получение запроса ассоциаций между различными терминами, извлеченными из запроса для создания суждения, причем суждение используется для опроса семантических представлений содержания из документов, хранящихся в семантическом индексе, чтобы обеспечить соответствующие результаты поиска, содержащий этапы, на которых:

определяют на этапе 1010 семантическую информацию для одного или более терминов для поиска;

идентифицируют на этапе 1020 первое действие по предоставлению информации в пределах запроса;

определяют на этапе 1030, основываясь на определенной семантической информации для одного или более терминов для поиска, семантические отношения между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, тем самым, ассоциацию с помощью реляционного элемента, который описывает семантические отношения; и

создают на этапе 1040 суждение, причем суждение содержит ассоциацию между первым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска.

14. Способ по п.13, дополнительно содержащий этап, на котором:

проводят синтаксический анализ запроса, чтобы определить в нем один или более терминов для поиска.

15. Способ по п.13, в котором семантическая информация содержит одно или более значений идентифицированных элементов или грамматических функций идентифицированных элементов.

16. Способ по п.13, дополнительно содержащий этап, на котором:

ассоциируют с каждым одним или более терминами для поиска множество слов, имеющих схожее значение, по меньшей мере, с одним или более терминами для поиска.

17. Способ по п.13, в котором суждение является логическим представлением значения запроса, которое используется для опроса семантических отношений, содержащихся среди семантических представлений содержания, полученных из документов.

18. Способ по п.13, дополнительно содержащий этапы, на которых:

идентифицируют второе действие по предоставлению информации в рамках запроса; и

определяют, основываясь на определенной семантической информации, для одного или более терминов для поиска семантические отношения между вторым действием по предоставлению информации и, по меньшей мере, одним или более терминами для поиска, создавая, таким образом, ассоциацию посредством реляционного элемента, который описывает семантические отношения.

19. Способ по п.13, дополнительно содержащий этап, на котором:

сравнивают суждение с один или более семантическими представлениями, хранящимися в семантическом индексе, чтобы определить одну или более совпадающих пар.

20. Один или более считываемых компьютером носителей, на которых находятся используемые компьютером команды для выполнения способа построения семантических отношений между элементами, извлеченными из содержания документа, чтобы создать семантическое представление содержания, дополнительно позволяющего индексирование содержания, способа, содержащего этапы, на которых:

идентифицируют на этапе 1110, по меньшей мере, часть документа, которая должна быть индексирована, причем, по меньшей мере, часть документа является текстовой частью;

проводят на этапе 1120 синтаксический анализ текстовой части документа, чтобы идентифицировать элементы, которые должны быть семантически представлены;

получают на этапе 1130 доступ к хранилищу данных, чтобы определить потенциальные значения и грамматические функции идентифицированных элементов;

определяют на этапе 1140 один или более уровней ассоциации в пределах текстовой части;

идентифицируют на этапе 1150 действие по предоставлению информации в пределах текстовой части для каждого одного или более определенных уровней ассоциации;

ассоциируют на этапе 1160 первое действие по предоставлению информации с первым набором идентифицированных элементов, в котором первое действие по предоставлению информации ассоциируется с первым уровнем ассоциации;

ассоциируют на этапе 1170 второе действие по предоставлению информации со вторым набором идентифицированных элементов, в котором второе действие по предоставлению информации ассоциируется со вторым уровнем ассоциации; и

создают на этапе 1180 семантическое представление, содержащее ассоциации, посредством реляционного элемента, который описывает ассоциации между первым набором идентифицированных элементов с первым действием по предоставлении информации и между вторым набором идентифицированных элементов со вторым действием по предоставлении информации.