RU2013156495A

RU2013156495A - Разрешение семантической неоднозначности при помощи семантического классификатора

Info

Publication number: RU2013156495A
Application number: RU2013156495/08A
Authority: RU
Inventors: Константин Алексеевич Зуев; Дарья Николаевна Богданова
Original assignee: Общество с ограниченной ответственностью "Аби ИнфоПоиск"
Priority date: 2013-12-19
Filing date: 2013-12-19
Publication date: 2015-06-27
Also published as: US20150178269A1; RU2579873C2

Abstract

1. Способ, содержащий:получение с помощью вычислительного устройства первого текста на первом языке;обнаружение, по меньшей мере, одного неизвестного слова в первом тексте на первом языке;выбор, по меньшей мере, одного второго языка, причем первый язык отличается от любого из выбранных вторых языков;для каждого второго языка получение вычислительным устройством первого набора текстов на первом языке и второго набора текстов на втором языке, причем тексты первого набора на первом языке выровнены по отношению к текстам второго набора текстов на втором языке;сопоставление неизвестного слова с по меньшей мере одним словом во втором наборе текстов, выровненным с, по меньшей мере, одним неизвестным словом;выявление семантического класса, соответствующего по меньшей мере одному выровненному слову; иназначение семантического класса по меньшей мере одному неизвестному слову.2. Способ по п. 1, в котором сопоставление по меньшей мере одного неизвестного слова дополнительно содержит:построение первой независимой от языка семантической структуры, соответствующей первому тексту, причем первая независимая от языка семантическая структура содержит семантические классы, соответствующие словам первого текста;построение второй независимой от языка семантической структуры, соответствующей второму тексту, причем независимая от языка семантическая структура содержит семантические классы, соответствующие словам второго текста; исравнение первой независящей от языка семантической структуры со второй независящей от языка семантической структурой.3. Способ по п. 1, в котором выявленный семантический класс, соответствую

Claims

1. Способ, содержащий:

получение с помощью вычислительного устройства первого текста на первом языке;

обнаружение, по меньшей мере, одного неизвестного слова в первом тексте на первом языке;

выбор, по меньшей мере, одного второго языка, причем первый язык отличается от любого из выбранных вторых языков;

для каждого второго языка получение вычислительным устройством первого набора текстов на первом языке и второго набора текстов на втором языке, причем тексты первого набора на первом языке выровнены по отношению к текстам второго набора текстов на втором языке;

сопоставление неизвестного слова с по меньшей мере одним словом во втором наборе текстов, выровненным с, по меньшей мере, одним неизвестным словом;

выявление семантического класса, соответствующего по меньшей мере одному выровненному слову; и

назначение семантического класса по меньшей мере одному неизвестному слову.

2. Способ по п. 1, в котором сопоставление по меньшей мере одного неизвестного слова дополнительно содержит:

построение первой независимой от языка семантической структуры, соответствующей первому тексту, причем первая независимая от языка семантическая структура содержит семантические классы, соответствующие словам первого текста;

построение второй независимой от языка семантической структуры, соответствующей второму тексту, причем независимая от языка семантическая структура содержит семантические классы, соответствующие словам второго текста; и

сравнение первой независящей от языка семантической структуры со второй независящей от языка семантической структурой.

3. Способ по п. 1, в котором выявленный семантический класс, соответствующий по меньшей мере одному неизвестному слову во втором тексте, основан на выравнивании семантических классов первой независимой от языка семантической структуры с семантическими классами второй независимой от языка семантической структуры.

4. Способ по п. 1, в котором назначение семантического класса по меньшей мере одному неизвестному слову содержит:

применение семантических свойств идентифицированного семантического класса к по меньшей мере одному неизвестному слову в первом тексте.

5. Способ по п. 1, в котором выравнивание первого набора текстов на первом языке со вторым набором текстов на втором языке осуществляется по предложениям, причем каждое предложение на первом языке соответствует предложению на втором языке.

6. Система, содержащая:

один или более процессоров данных; и

одно или более устройств хранения, хранящих инструкции, которые, будучи исполненными одним или более процессорами данных, воздействуют на один или более процессоров данных для выполнения операций, содержащих:

7. Система по п. 6, в которой сопоставление по меньшей мере одного неизвестного слова дополнительно содержит:

сравнение первой независящей от языка семантической структуры со второй независящей от языка семантической структурой..

8. Система по п. 6, в которой выявленный семантический класс, соответствующий по меньшей мере одному неизвестному слову во втором тексте, основан на выравнивании семантических классов первой независимой от языка семантической структуры с семантическими классами второй независимой от языка семантической структуры.

9. Система по п. 6, в которой назначение семантического класса по меньшей мере одному неизвестному слову содержит:

10. Система по п. 6, в которой выравнивание первого набора текстов на первом языке со вторым набором текстов на втором языке осуществляется по предложениям, причем каждое предложение на первом языке соответствует предложению на втором языке.

11. Машиночитаемый носитель данных, имеющий хранящиеся на нем машинные инструкции, причем процессор исполняет инструкции для выполнения операций, содержащих:

12. Машиночитаемый носитель данных по п. 11, в котором сопоставление по меньшей мере одного неизвестного слова дополнительно содержит:

13. Машиночитаемый носитель данных по п. 11, в котором выявленный семантический класс, соответствующий по меньшей мере одному неизвестному слову во втором тексте, основан на выравнивании семантических классов первой независимой от языка семантической структуры с семантическими классами второй независимой от языка семантической структуры.

14. Машиночитаемый носитель данных по п. 11, в котором назначение семантического класса по меньшей мере одному неизвестному слову содержит:

15. Машиночитаемый носитель данных по п. 11, в котором выравнивание первого набора текстов на первом языке со вторым набором текстов на втором языке осуществляется по предложениям, причем каждое предложение на первом языке соответствует предложению на втором языке.