RU2011122784A - Способ семантической обработки естественного языка с использованием графического языка-посредника - Google Patents

Способ семантической обработки естественного языка с использованием графического языка-посредника Download PDF

Info

Publication number
RU2011122784A
RU2011122784A RU2011122784/08A RU2011122784A RU2011122784A RU 2011122784 A RU2011122784 A RU 2011122784A RU 2011122784/08 A RU2011122784/08 A RU 2011122784/08A RU 2011122784 A RU2011122784 A RU 2011122784A RU 2011122784 A RU2011122784 A RU 2011122784A
Authority
RU
Russia
Prior art keywords
language
text
module
independent
processing system
Prior art date
Application number
RU2011122784/08A
Other languages
English (en)
Other versions
RU2509350C2 (ru
Inventor
Михаэль МЕНДЕ
Original Assignee
Лингупедиа Инвестментс Сарл
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP08019498A external-priority patent/EP2184685A1/en
Priority claimed from US12/267,461 external-priority patent/US20100121630A1/en
Application filed by Лингупедиа Инвестментс Сарл filed Critical Лингупедиа Инвестментс Сарл
Publication of RU2011122784A publication Critical patent/RU2011122784A/ru
Application granted granted Critical
Publication of RU2509350C2 publication Critical patent/RU2509350C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

1. Способ обработки естественного языка с использованием системы языковой обработки, в котором письменный или устный текст вводится в систему языковой обработки, отличающийся тем, что содержит этапы, на которыханализируют текст в отношении его синтаксиса и морфологии,извлекают компоненты текста и их взаимосвязи,генерируют или используют граф или графическое представление текста в качестве не зависящего от языка представления смысла текста, иосуществляют обработку текста с использованием графа или графического представления.2. Способ по п.1, в котором создают визуально-графическую модель текста, причем визуально-графическая модель не зависит от языка, что позволяет пользователям расширять систему языковой обработки, не располагая знанием об используемых языках.3. Способ по п.1 или 2, в котором грамматические данные, используемые на этапе анализа, вводят в систему языковой обработки посредством редактора грамматики, не зависящего от языка.4. Способ по п.1, в котором этап анализа осуществляется синтаксическим слоем системы языковой обработки, который осуществляет сегментацию и токенизацию текста, причем синтаксический слой может быть привязан к системе языковой обработки.5. Способ по п.4, в котором каждый язык, подлежащий обработке системой языковой обработки, представляют в отдельном синтаксическом слое, что позволяет повторно использовать абстракции других языков в отдельных синтаксических слоях.6. Способ по п.4 или 5, в котором дополнительное абстрагирование и обобщение данных, сгенерированных синтаксическим слоем, осуществляется реляционным слоем, причем данные, предпочтительно, описывают отношения ме

Claims (30)

1. Способ обработки естественного языка с использованием системы языковой обработки, в котором письменный или устный текст вводится в систему языковой обработки, отличающийся тем, что содержит этапы, на которых
анализируют текст в отношении его синтаксиса и морфологии,
извлекают компоненты текста и их взаимосвязи,
генерируют или используют граф или графическое представление текста в качестве не зависящего от языка представления смысла текста, и
осуществляют обработку текста с использованием графа или графического представления.
2. Способ по п.1, в котором создают визуально-графическую модель текста, причем визуально-графическая модель не зависит от языка, что позволяет пользователям расширять систему языковой обработки, не располагая знанием об используемых языках.
3. Способ по п.1 или 2, в котором грамматические данные, используемые на этапе анализа, вводят в систему языковой обработки посредством редактора грамматики, не зависящего от языка.
4. Способ по п.1, в котором этап анализа осуществляется синтаксическим слоем системы языковой обработки, который осуществляет сегментацию и токенизацию текста, причем синтаксический слой может быть привязан к системе языковой обработки.
5. Способ по п.4, в котором каждый язык, подлежащий обработке системой языковой обработки, представляют в отдельном синтаксическом слое, что позволяет повторно использовать абстракции других языков в отдельных синтаксических слоях.
6. Способ по п.4 или 5, в котором дополнительное абстрагирование и обобщение данных, сгенерированных синтаксическим слоем, осуществляется реляционным слоем, причем данные, предпочтительно, описывают отношения между объектами и их абстракциями.
7. Способ по п.4, в котором информация текста, не зависящая от языка, извлекается в синтаксическом и реляционном слоях, причем информация, не зависящая от языка, передается в семантический слой, и информация, не зависящая от языка, содержит объекты, действия и атрибуты.
8. Способ по п.1, в котором на этапе генерации графа или графического представления объекты, действия и атрибуты предложения или фразы связаны друг с другом.
9. Способ по п. 8, в котором объекты, действия и атрибуты представляют графически.
10. Способ по п.1, в котором на этапе обработки осмысливают информацию в модели смыслового мира, таким образом проверяя согласованность извлеченной семантики текста.
11. Способ по п.1, в котором на этапе обработки генерируют перевод текста на язык, отличный от исходного языка текста, причем граф или графическое представление является основой перевода.
12. Способ по п.1, в котором на этапе обработки анализируют текст для поиска или другой языковой обработки.
13. Способ по любому из пп.10-12, в котором на этапе обработки генерируют ответ на текст с использованием информации, заданной в модели смыслового мира.
14. Способ по п.1, в котором текст, сгенерированный на этапе обработки, выводят пользователю в качестве письменного или устного языка или в виде изображения.
15. Способ по п.1, в котором знание, используемое на отдельных этапах, вводят с использованием веб-интерфейса для универсального пользования, причем знание может включать в себя теги лексикона, содержимое модели смыслового мира, грамматическую информацию и представление атрибутов.
16. Система для обработки естественного языка, содержащая
модуль, не зависящий от языка, причем этот модуль манипулирует совокупностью объектов, представляющих термины и отношения между объектами,
совокупность словарных модулей, зависящих от языка, причем каждый словарный модуль имеет совокупность статей, причем каждая статья словарей связана с одним из совокупности объектов, хранящейся в модуле, не зависящем от языка,
анализатор текста, связанный с одним или несколькими из словарных модулей, зависящих от языка, и
генератор предложений, связанный с одним или несколькими из словарей, зависящих от языка,
в которой анализатор текста принимает ввод, извлекает из ввода ключевые термины и использует представление ключевых терминов в виде графа на основании совокупности объектов из базового модуля, не зависящего от языка, и генератор предложений формулирует выходной текст на одном из связанных с ним языков на основании представления в виде графа.
17. Система по п.16, в которой ввод содержит письменный текст или устный текст.
18. Система по п.16, содержащая по меньшей мере один лингвистический синтаксический модуль, связанный с одним или несколькими из словарей, зависящих от языка, причем лингвистический синтаксический модуль включает в себя упомянутый анализатор текста, множество правил грамматики и множество шаблонов.
19. Система по п.18, в которой каждый словарь, зависящий от языка, связан с отдельным лингвистическим синтаксическим модулем.
20. Система по п.18, в которой словари, зависящие от языка по меньшей мере двух близкородственных языков, связаны с одним и тем же лингвистическим синтаксическим модулем.
21. Система по п.16, в которой в модуле, не зависящем от языка, дополнительно хранятся мультимедийные представления соответствующих терминов, хранящихся в этом модуле.
22. Система по п.21, в которой мультимедийные представления содержат изображения, звуки или видеозаписи.
23. Система по п.21, дополнительно содержащая модуль редактирующего компонента, причем модуль редактирующего компонента облегчает изменение словарных статей и их связей с одним из совокупности объектов, хранящейся в модуле, не зависящем от языка.
24. Система по п.23, в которой модуль редактирующего компонента дополнительно приспособлен облегчать добавление статей в совокупность словарей, зависящих от языка.
25. Система по п.23, в которой доступ к модулю редактирующего компонента возможен через веб-сайт.
26. Система по п.25, в которой мультимедийные представления терминов можно отображать в виртуальном мире.
27. Система по п.23, в которой доступ к модулю редактирующего компонента ограничен квалифицированными пользователями.
28. Способ разработки системы языковой обработки, содержащий этапы, на которых разрабатывают ядро, не зависящее от языка, причем данное ядро содержит объекты терминов языка, причем каждый объект терминов языка содержит мультимедийные представления терминов языка и связи между соответствующими терминами языка,
добавляют объект словаря, связанный с конкретным языком,
добавляют слова конкретного языка в объект словаря, и
связывают слова с надлежащими объектами терминов языка в ядре.
29. Способ по п.28, в котором связи между соответствующими терминами языка включают в себя реляционные связи и иерархические связи.
30. Способ по п.28, содержащий этап, на котором создают анализатор языка для конкретного языка на основании правил грамматики и синтаксиса.
RU2011122784/08A 2008-11-07 2009-11-03 Способ семантической обработки естественного языка с использованием графического языка-посредника RU2509350C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US12/267,461 2008-11-07
EP08019498.8 2008-11-07
EP08019498A EP2184685A1 (en) 2008-11-07 2008-11-07 Method for semantic processing of natural language using graphical interlingua
US12/267,461 US20100121630A1 (en) 2008-11-07 2008-11-07 Language processing systems and methods
PCT/EP2009/007868 WO2010051966A1 (en) 2008-11-07 2009-11-03 Method for semantic processing of natural language using graphical interlingua

Publications (2)

Publication Number Publication Date
RU2011122784A true RU2011122784A (ru) 2012-12-20
RU2509350C2 RU2509350C2 (ru) 2014-03-10

Family

ID=41460497

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011122784/08A RU2509350C2 (ru) 2008-11-07 2009-11-03 Способ семантической обработки естественного языка с использованием графического языка-посредника

Country Status (3)

Country Link
CN (1) CN102272755A (ru)
RU (1) RU2509350C2 (ru)
WO (1) WO2010051966A1 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2667717C2 (ru) * 2013-06-21 2018-09-24 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Диалоговые политики на основе параметров окружающей среды и генерация ответа
RU2685392C1 (ru) * 2016-02-24 2019-04-17 ГУГЛ ЭлЭлСи Обеспечение автономной семантической обработки в устройстве с ограниченными ресурсами
US10497367B2 (en) 2014-03-27 2019-12-03 Microsoft Technology Licensing, Llc Flexible schema for language model customization
US10572602B2 (en) 2013-06-21 2020-02-25 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2595489C2 (ru) * 2014-06-18 2016-08-27 Самсунг Электроникс Ко., Лтд. Выделение временных выражений для текстов на естественном языке
RU2584457C1 (ru) * 2015-02-03 2016-05-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке
RU2605077C2 (ru) * 2015-03-19 2016-12-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Способ и система для хранения и поиска информации, извлекаемой из текстовых документов
US10467598B2 (en) 2015-04-30 2019-11-05 Samsung Electronics Co., Ltd. Apparatus and method for automatically converting note to action reminders
CN105488024B (zh) * 2015-11-20 2017-10-13 广州神马移动信息科技有限公司 网页主题句的抽取方法及装置
CN105630771B (zh) * 2015-12-25 2019-03-26 陈福 语句处理方法及装置
RU2639652C1 (ru) * 2016-07-13 2017-12-21 Общество с ограниченной ответственностью "ЭсДиАй Рисёчь" Система семантического поиска в объектно-процессной модели данных
RU2635882C1 (ru) * 2016-11-22 2017-11-16 Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук Устройство для распознавания степени научности опубликованных построений
CN108460026B (zh) 2017-02-22 2021-02-12 华为技术有限公司 一种翻译方法及装置
US10460044B2 (en) * 2017-05-26 2019-10-29 General Electric Company Methods and systems for translating natural language requirements to a semantic modeling language statement
KR102103563B1 (ko) * 2018-12-31 2020-04-22 충남대학교산학협력단 챗봇을 이용한 사용자 명령어의 태깅처리 시스템
CN109933805B (zh) * 2019-03-26 2024-06-07 深圳Tcl数字技术有限公司 文本解析方法、系统及计算机可读存储介质
RU2714899C1 (ru) * 2019-11-10 2020-02-20 Игорь Петрович Рогачев Способ формирования онтологической базы данных структурированного массива данных
CN112200317B (zh) * 2020-09-28 2024-05-07 西南电子技术研究所(中国电子科技集团公司第十研究所) 多模态知识图谱构建方法
RU2759090C1 (ru) * 2020-12-18 2021-11-09 Общество с ограниченной ответственностью "Виртуальные Ассистенты" Способ управления диалогом и система понимания естественного языка в платформе виртуальных ассистентов
CN112883278A (zh) * 2021-03-23 2021-06-01 西安电子科技大学昆山创新研究院 基于智慧社区大数据知识图谱的不良舆论传播抑制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9716887D0 (en) * 1997-08-08 1997-10-15 British Telecomm Translation
US7016828B1 (en) * 2000-10-23 2006-03-21 At&T Corp. Text-to-scene conversion
KR20020045343A (ko) * 2000-12-08 2002-06-19 오길록 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
US20020165708A1 (en) * 2001-05-03 2002-11-07 International Business Machines Corporation Method and system for translating human language text
WO2003032199A2 (en) * 2001-10-05 2003-04-17 Jarg Corporation Classification of information sources using graph structures
US7346493B2 (en) * 2003-03-25 2008-03-18 Microsoft Corporation Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2667717C2 (ru) * 2013-06-21 2018-09-24 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Диалоговые политики на основе параметров окружающей среды и генерация ответа
US10304448B2 (en) 2013-06-21 2019-05-28 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
US10572602B2 (en) 2013-06-21 2020-02-25 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US10497367B2 (en) 2014-03-27 2019-12-03 Microsoft Technology Licensing, Llc Flexible schema for language model customization
RU2685392C1 (ru) * 2016-02-24 2019-04-17 ГУГЛ ЭлЭлСи Обеспечение автономной семантической обработки в устройстве с ограниченными ресурсами

Also Published As

Publication number Publication date
CN102272755A (zh) 2011-12-07
RU2509350C2 (ru) 2014-03-10
WO2010051966A1 (en) 2010-05-14

Similar Documents

Publication Publication Date Title
RU2011122784A (ru) Способ семантической обработки естественного языка с использованием графического языка-посредника
Vasiliev Natural language processing with Python and spaCy: A practical introduction
CN109213995A (zh) 一种基于双语词嵌入的跨语言文本相似度评估技术
Davydov et al. Mathematical method of translation into Ukrainian sign language based on ontologies
CN103314369B (zh) 机器翻译装置和方法
KR100918338B1 (ko) 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트 생성 방법, 장치 및 프로그램을 저장한 기록 매체
Grif et al. Development of computer sign language translation technology for deaf people
Bautista et al. Aratraductor: text to pictogram translation using natural language processing techniques
Jain et al. Vishit: A visualizer for hindi text
Hämäläinen et al. The current state of Finnish NLP
Bamman et al. The Latin Dependency Treebank in a cultural heritage digital library
Majewska et al. Verb classification across languages
Kwong Natural language processing
Torjmen et al. Construction of morphological grammars for the Tunisian dialect
Sinhal et al. Machine translation approaches and design aspects
Keezhatta Understanding EFL Linguistic Models through Relationship between Natural Language Processing and Artificial Intelligence Applications.
Maegaard et al. The BLARK concept and BLARK for Arabic.
Mírovský et al. Extending Coverage of a Lexicon of Discourse Connectives Using Annotation Projection.
Nejme et al. Toward an amazigh language processing
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Silberztein Linguistic Resources for Natural Language Processing: On the Necessity of Using Linguistic Methods to Develop NLP Software
Wushouer et al. Building contemporary Uyghur grammatical information dictionary
Salim Keezhatta Understanding EFL Linguistic Models through Relationship between Natural Language Processing and Artificial Intelligence Applications
Sprugnoli Sentiment analysis for Latin: a journey from Seneca to Dante Alighieri
Moumen et al. An NLP based text-to-speech synthesizer for Moroccan Arabic

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant
MM4A The patent is invalid due to non-payment of fees

Effective date: 20151104