RU2011122784A - Способ семантической обработки естественного языка с использованием графического языка-посредника - Google Patents
Способ семантической обработки естественного языка с использованием графического языка-посредника Download PDFInfo
- Publication number
- RU2011122784A RU2011122784A RU2011122784/08A RU2011122784A RU2011122784A RU 2011122784 A RU2011122784 A RU 2011122784A RU 2011122784/08 A RU2011122784/08 A RU 2011122784/08A RU 2011122784 A RU2011122784 A RU 2011122784A RU 2011122784 A RU2011122784 A RU 2011122784A
- Authority
- RU
- Russia
- Prior art keywords
- language
- text
- module
- independent
- processing system
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
1. Способ обработки естественного языка с использованием системы языковой обработки, в котором письменный или устный текст вводится в систему языковой обработки, отличающийся тем, что содержит этапы, на которыханализируют текст в отношении его синтаксиса и морфологии,извлекают компоненты текста и их взаимосвязи,генерируют или используют граф или графическое представление текста в качестве не зависящего от языка представления смысла текста, иосуществляют обработку текста с использованием графа или графического представления.2. Способ по п.1, в котором создают визуально-графическую модель текста, причем визуально-графическая модель не зависит от языка, что позволяет пользователям расширять систему языковой обработки, не располагая знанием об используемых языках.3. Способ по п.1 или 2, в котором грамматические данные, используемые на этапе анализа, вводят в систему языковой обработки посредством редактора грамматики, не зависящего от языка.4. Способ по п.1, в котором этап анализа осуществляется синтаксическим слоем системы языковой обработки, который осуществляет сегментацию и токенизацию текста, причем синтаксический слой может быть привязан к системе языковой обработки.5. Способ по п.4, в котором каждый язык, подлежащий обработке системой языковой обработки, представляют в отдельном синтаксическом слое, что позволяет повторно использовать абстракции других языков в отдельных синтаксических слоях.6. Способ по п.4 или 5, в котором дополнительное абстрагирование и обобщение данных, сгенерированных синтаксическим слоем, осуществляется реляционным слоем, причем данные, предпочтительно, описывают отношения ме
Claims (30)
1. Способ обработки естественного языка с использованием системы языковой обработки, в котором письменный или устный текст вводится в систему языковой обработки, отличающийся тем, что содержит этапы, на которых
анализируют текст в отношении его синтаксиса и морфологии,
извлекают компоненты текста и их взаимосвязи,
генерируют или используют граф или графическое представление текста в качестве не зависящего от языка представления смысла текста, и
осуществляют обработку текста с использованием графа или графического представления.
2. Способ по п.1, в котором создают визуально-графическую модель текста, причем визуально-графическая модель не зависит от языка, что позволяет пользователям расширять систему языковой обработки, не располагая знанием об используемых языках.
3. Способ по п.1 или 2, в котором грамматические данные, используемые на этапе анализа, вводят в систему языковой обработки посредством редактора грамматики, не зависящего от языка.
4. Способ по п.1, в котором этап анализа осуществляется синтаксическим слоем системы языковой обработки, который осуществляет сегментацию и токенизацию текста, причем синтаксический слой может быть привязан к системе языковой обработки.
5. Способ по п.4, в котором каждый язык, подлежащий обработке системой языковой обработки, представляют в отдельном синтаксическом слое, что позволяет повторно использовать абстракции других языков в отдельных синтаксических слоях.
6. Способ по п.4 или 5, в котором дополнительное абстрагирование и обобщение данных, сгенерированных синтаксическим слоем, осуществляется реляционным слоем, причем данные, предпочтительно, описывают отношения между объектами и их абстракциями.
7. Способ по п.4, в котором информация текста, не зависящая от языка, извлекается в синтаксическом и реляционном слоях, причем информация, не зависящая от языка, передается в семантический слой, и информация, не зависящая от языка, содержит объекты, действия и атрибуты.
8. Способ по п.1, в котором на этапе генерации графа или графического представления объекты, действия и атрибуты предложения или фразы связаны друг с другом.
9. Способ по п. 8, в котором объекты, действия и атрибуты представляют графически.
10. Способ по п.1, в котором на этапе обработки осмысливают информацию в модели смыслового мира, таким образом проверяя согласованность извлеченной семантики текста.
11. Способ по п.1, в котором на этапе обработки генерируют перевод текста на язык, отличный от исходного языка текста, причем граф или графическое представление является основой перевода.
12. Способ по п.1, в котором на этапе обработки анализируют текст для поиска или другой языковой обработки.
13. Способ по любому из пп.10-12, в котором на этапе обработки генерируют ответ на текст с использованием информации, заданной в модели смыслового мира.
14. Способ по п.1, в котором текст, сгенерированный на этапе обработки, выводят пользователю в качестве письменного или устного языка или в виде изображения.
15. Способ по п.1, в котором знание, используемое на отдельных этапах, вводят с использованием веб-интерфейса для универсального пользования, причем знание может включать в себя теги лексикона, содержимое модели смыслового мира, грамматическую информацию и представление атрибутов.
16. Система для обработки естественного языка, содержащая
модуль, не зависящий от языка, причем этот модуль манипулирует совокупностью объектов, представляющих термины и отношения между объектами,
совокупность словарных модулей, зависящих от языка, причем каждый словарный модуль имеет совокупность статей, причем каждая статья словарей связана с одним из совокупности объектов, хранящейся в модуле, не зависящем от языка,
анализатор текста, связанный с одним или несколькими из словарных модулей, зависящих от языка, и
генератор предложений, связанный с одним или несколькими из словарей, зависящих от языка,
в которой анализатор текста принимает ввод, извлекает из ввода ключевые термины и использует представление ключевых терминов в виде графа на основании совокупности объектов из базового модуля, не зависящего от языка, и генератор предложений формулирует выходной текст на одном из связанных с ним языков на основании представления в виде графа.
17. Система по п.16, в которой ввод содержит письменный текст или устный текст.
18. Система по п.16, содержащая по меньшей мере один лингвистический синтаксический модуль, связанный с одним или несколькими из словарей, зависящих от языка, причем лингвистический синтаксический модуль включает в себя упомянутый анализатор текста, множество правил грамматики и множество шаблонов.
19. Система по п.18, в которой каждый словарь, зависящий от языка, связан с отдельным лингвистическим синтаксическим модулем.
20. Система по п.18, в которой словари, зависящие от языка по меньшей мере двух близкородственных языков, связаны с одним и тем же лингвистическим синтаксическим модулем.
21. Система по п.16, в которой в модуле, не зависящем от языка, дополнительно хранятся мультимедийные представления соответствующих терминов, хранящихся в этом модуле.
22. Система по п.21, в которой мультимедийные представления содержат изображения, звуки или видеозаписи.
23. Система по п.21, дополнительно содержащая модуль редактирующего компонента, причем модуль редактирующего компонента облегчает изменение словарных статей и их связей с одним из совокупности объектов, хранящейся в модуле, не зависящем от языка.
24. Система по п.23, в которой модуль редактирующего компонента дополнительно приспособлен облегчать добавление статей в совокупность словарей, зависящих от языка.
25. Система по п.23, в которой доступ к модулю редактирующего компонента возможен через веб-сайт.
26. Система по п.25, в которой мультимедийные представления терминов можно отображать в виртуальном мире.
27. Система по п.23, в которой доступ к модулю редактирующего компонента ограничен квалифицированными пользователями.
28. Способ разработки системы языковой обработки, содержащий этапы, на которых разрабатывают ядро, не зависящее от языка, причем данное ядро содержит объекты терминов языка, причем каждый объект терминов языка содержит мультимедийные представления терминов языка и связи между соответствующими терминами языка,
добавляют объект словаря, связанный с конкретным языком,
добавляют слова конкретного языка в объект словаря, и
связывают слова с надлежащими объектами терминов языка в ядре.
29. Способ по п.28, в котором связи между соответствующими терминами языка включают в себя реляционные связи и иерархические связи.
30. Способ по п.28, содержащий этап, на котором создают анализатор языка для конкретного языка на основании правил грамматики и синтаксиса.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/267,461 | 2008-11-07 | ||
EP08019498.8 | 2008-11-07 | ||
EP08019498A EP2184685A1 (en) | 2008-11-07 | 2008-11-07 | Method for semantic processing of natural language using graphical interlingua |
US12/267,461 US20100121630A1 (en) | 2008-11-07 | 2008-11-07 | Language processing systems and methods |
PCT/EP2009/007868 WO2010051966A1 (en) | 2008-11-07 | 2009-11-03 | Method for semantic processing of natural language using graphical interlingua |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2011122784A true RU2011122784A (ru) | 2012-12-20 |
RU2509350C2 RU2509350C2 (ru) | 2014-03-10 |
Family
ID=41460497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011122784/08A RU2509350C2 (ru) | 2008-11-07 | 2009-11-03 | Способ семантической обработки естественного языка с использованием графического языка-посредника |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN102272755A (ru) |
RU (1) | RU2509350C2 (ru) |
WO (1) | WO2010051966A1 (ru) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2667717C2 (ru) * | 2013-06-21 | 2018-09-24 | МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи | Диалоговые политики на основе параметров окружающей среды и генерация ответа |
RU2685392C1 (ru) * | 2016-02-24 | 2019-04-17 | ГУГЛ ЭлЭлСи | Обеспечение автономной семантической обработки в устройстве с ограниченными ресурсами |
US10497367B2 (en) | 2014-03-27 | 2019-12-03 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
US10572602B2 (en) | 2013-06-21 | 2020-02-25 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2595489C2 (ru) * | 2014-06-18 | 2016-08-27 | Самсунг Электроникс Ко., Лтд. | Выделение временных выражений для текстов на естественном языке |
RU2584457C1 (ru) * | 2015-02-03 | 2016-05-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке |
RU2605077C2 (ru) * | 2015-03-19 | 2016-12-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ и система для хранения и поиска информации, извлекаемой из текстовых документов |
US10467598B2 (en) | 2015-04-30 | 2019-11-05 | Samsung Electronics Co., Ltd. | Apparatus and method for automatically converting note to action reminders |
CN105488024B (zh) * | 2015-11-20 | 2017-10-13 | 广州神马移动信息科技有限公司 | 网页主题句的抽取方法及装置 |
CN105630771B (zh) * | 2015-12-25 | 2019-03-26 | 陈福 | 语句处理方法及装置 |
RU2639652C1 (ru) * | 2016-07-13 | 2017-12-21 | Общество с ограниченной ответственностью "ЭсДиАй Рисёчь" | Система семантического поиска в объектно-процессной модели данных |
RU2635882C1 (ru) * | 2016-11-22 | 2017-11-16 | Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук | Устройство для распознавания степени научности опубликованных построений |
CN108460026B (zh) | 2017-02-22 | 2021-02-12 | 华为技术有限公司 | 一种翻译方法及装置 |
US10460044B2 (en) * | 2017-05-26 | 2019-10-29 | General Electric Company | Methods and systems for translating natural language requirements to a semantic modeling language statement |
KR102103563B1 (ko) * | 2018-12-31 | 2020-04-22 | 충남대학교산학협력단 | 챗봇을 이용한 사용자 명령어의 태깅처리 시스템 |
CN109933805B (zh) * | 2019-03-26 | 2024-06-07 | 深圳Tcl数字技术有限公司 | 文本解析方法、系统及计算机可读存储介质 |
RU2714899C1 (ru) * | 2019-11-10 | 2020-02-20 | Игорь Петрович Рогачев | Способ формирования онтологической базы данных структурированного массива данных |
CN112200317B (zh) * | 2020-09-28 | 2024-05-07 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多模态知识图谱构建方法 |
RU2759090C1 (ru) * | 2020-12-18 | 2021-11-09 | Общество с ограниченной ответственностью "Виртуальные Ассистенты" | Способ управления диалогом и система понимания естественного языка в платформе виртуальных ассистентов |
CN112883278A (zh) * | 2021-03-23 | 2021-06-01 | 西安电子科技大学昆山创新研究院 | 基于智慧社区大数据知识图谱的不良舆论传播抑制方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9716887D0 (en) * | 1997-08-08 | 1997-10-15 | British Telecomm | Translation |
US7016828B1 (en) * | 2000-10-23 | 2006-03-21 | At&T Corp. | Text-to-scene conversion |
KR20020045343A (ko) * | 2000-12-08 | 2002-06-19 | 오길록 | 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법 |
US20020165708A1 (en) * | 2001-05-03 | 2002-11-07 | International Business Machines Corporation | Method and system for translating human language text |
WO2003032199A2 (en) * | 2001-10-05 | 2003-04-17 | Jarg Corporation | Classification of information sources using graph structures |
US7346493B2 (en) * | 2003-03-25 | 2008-03-18 | Microsoft Corporation | Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system |
-
2009
- 2009-11-03 RU RU2011122784/08A patent/RU2509350C2/ru not_active IP Right Cessation
- 2009-11-03 CN CN2009801537961A patent/CN102272755A/zh active Pending
- 2009-11-03 WO PCT/EP2009/007868 patent/WO2010051966A1/en active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2667717C2 (ru) * | 2013-06-21 | 2018-09-24 | МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи | Диалоговые политики на основе параметров окружающей среды и генерация ответа |
US10304448B2 (en) | 2013-06-21 | 2019-05-28 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
US10572602B2 (en) | 2013-06-21 | 2020-02-25 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US10497367B2 (en) | 2014-03-27 | 2019-12-03 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
RU2685392C1 (ru) * | 2016-02-24 | 2019-04-17 | ГУГЛ ЭлЭлСи | Обеспечение автономной семантической обработки в устройстве с ограниченными ресурсами |
Also Published As
Publication number | Publication date |
---|---|
CN102272755A (zh) | 2011-12-07 |
RU2509350C2 (ru) | 2014-03-10 |
WO2010051966A1 (en) | 2010-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2011122784A (ru) | Способ семантической обработки естественного языка с использованием графического языка-посредника | |
Vasiliev | Natural language processing with Python and spaCy: A practical introduction | |
CN109213995A (zh) | 一种基于双语词嵌入的跨语言文本相似度评估技术 | |
Davydov et al. | Mathematical method of translation into Ukrainian sign language based on ontologies | |
CN103314369B (zh) | 机器翻译装置和方法 | |
KR100918338B1 (ko) | 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트 생성 방법, 장치 및 프로그램을 저장한 기록 매체 | |
Grif et al. | Development of computer sign language translation technology for deaf people | |
Bautista et al. | Aratraductor: text to pictogram translation using natural language processing techniques | |
Jain et al. | Vishit: A visualizer for hindi text | |
Hämäläinen et al. | The current state of Finnish NLP | |
Bamman et al. | The Latin Dependency Treebank in a cultural heritage digital library | |
Majewska et al. | Verb classification across languages | |
Kwong | Natural language processing | |
Torjmen et al. | Construction of morphological grammars for the Tunisian dialect | |
Sinhal et al. | Machine translation approaches and design aspects | |
Keezhatta | Understanding EFL Linguistic Models through Relationship between Natural Language Processing and Artificial Intelligence Applications. | |
Maegaard et al. | The BLARK concept and BLARK for Arabic. | |
Mírovský et al. | Extending Coverage of a Lexicon of Discourse Connectives Using Annotation Projection. | |
Nejme et al. | Toward an amazigh language processing | |
JP2007133905A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Silberztein | Linguistic Resources for Natural Language Processing: On the Necessity of Using Linguistic Methods to Develop NLP Software | |
Wushouer et al. | Building contemporary Uyghur grammatical information dictionary | |
Salim Keezhatta | Understanding EFL Linguistic Models through Relationship between Natural Language Processing and Artificial Intelligence Applications | |
Sprugnoli | Sentiment analysis for Latin: a journey from Seneca to Dante Alighieri | |
Moumen et al. | An NLP based text-to-speech synthesizer for Moroccan Arabic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HZ9A | Changing address for correspondence with an applicant | ||
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20151104 |