RU2014102111A - EXCLUSIVE AUTOMATIC PROCESSING OF TEXT INFORMATION - Google Patents

EXCLUSIVE AUTOMATIC PROCESSING OF TEXT INFORMATION Download PDF

Info

Publication number
RU2014102111A
RU2014102111A RU2014102111/08A RU2014102111A RU2014102111A RU 2014102111 A RU2014102111 A RU 2014102111A RU 2014102111/08 A RU2014102111/08 A RU 2014102111/08A RU 2014102111 A RU2014102111 A RU 2014102111A RU 2014102111 A RU2014102111 A RU 2014102111A
Authority
RU
Russia
Prior art keywords
descriptions
language
natural language
semantic
syntactic
Prior art date
Application number
RU2014102111/08A
Other languages
Russian (ru)
Other versions
RU2662699C2 (en
Inventor
Татьяна Владимировна Даниэлян
Анатолий Сергеевич Старостин
Константин Алексеевич Зуев
Константин Владимирович Анисимович
Владимир Павлович Селегей
Original Assignee
Общество с ограниченной ответственностью "Аби ИнфоПоиск"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби ИнфоПоиск" filed Critical Общество с ограниченной ответственностью "Аби ИнфоПоиск"
Priority to RU2014102111A priority Critical patent/RU2662699C2/en
Priority to US14/509,492 priority patent/US9633005B2/en
Publication of RU2014102111A publication Critical patent/RU2014102111A/en
Application granted granted Critical
Publication of RU2662699C2 publication Critical patent/RU2662699C2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

1. Способ создания программ обработки естественного языка, включающий в себя:получение семантической иерархии независимых от языка семантических описаний на естественном языке, релевантных к любому естественному языку;создание зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков; ипостроение первой программы обработки естественного языка на основе независимых от языка семантических описаний, зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков.2. Способ по п. 1, дополнительно включающий построение одной или нескольких дополнительных программ обработки естественного языка на основе независимых от языка семантических описаний и использования зависящих от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков.3. Способ по п. 1, дополнительно включающий получение онтологической информации, связанной с текстовой информацией.4. Способ по п. 1, дополнительно включающий получение универсального представления, которое содержит независимую от языка семантическую структуру для каждого предложения, в том числе информацию о семантическом классе для каждого слова в текстовой информации.5. Способ по п. 4, отличающийся тем, что независимая от языка семантическая структура получается в результате исчерпывающего семантико-синтаксического анализа.6. Способ по п. 1, в котором первая программа обработки естественного языка выполняет машинный перевод с первого языка на второй язык.7. Способ по п. 5, отличающи1. A method of creating natural language processing programs, which includes: obtaining a semantic hierarchy of language-independent semantic descriptions in a natural language relevant to any natural language; creating language-dependent morphological descriptions, lexical descriptions, and syntactic descriptions of one or more target languages; and the construction of the first natural language processing program based on language-independent semantic descriptions, language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages. 2. The method of claim 1, further comprising constructing one or more additional natural language processing programs based on language-independent semantic descriptions and using language-dependent morphological descriptions, lexical descriptions, and syntactic descriptions of one or more target languages. The method of claim 1, further comprising obtaining ontological information associated with the text information. The method according to claim 1, further comprising obtaining a universal representation that contains a language-independent semantic structure for each sentence, including information about the semantic class for each word in textual information. The method according to claim 4, characterized in that the language-independent semantic structure is obtained as a result of an exhaustive semantic-syntactic analysis. The method of claim 1, wherein the first natural language processing program performs machine translation from the first language into the second language. The method of claim 5, wherein

Claims (20)

1. Способ создания программ обработки естественного языка, включающий в себя:1. The method of creating natural language processing programs, including: получение семантической иерархии независимых от языка семантических описаний на естественном языке, релевантных к любому естественному языку;obtaining a semantic hierarchy of language-independent semantic descriptions in a natural language, relevant to any natural language; создание зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков; иcreation of language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages; and построение первой программы обработки естественного языка на основе независимых от языка семантических описаний, зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков.building the first natural language processing program based on language-independent semantic descriptions, language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages. 2. Способ по п. 1, дополнительно включающий построение одной или нескольких дополнительных программ обработки естественного языка на основе независимых от языка семантических описаний и использования зависящих от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков.2. The method according to claim 1, further comprising constructing one or more additional natural language processing programs based on language-independent semantic descriptions and using language-dependent morphological descriptions, lexical descriptions, and syntactic descriptions of one or more target languages. 3. Способ по п. 1, дополнительно включающий получение онтологической информации, связанной с текстовой информацией.3. The method according to claim 1, further comprising obtaining ontological information associated with the text information. 4. Способ по п. 1, дополнительно включающий получение универсального представления, которое содержит независимую от языка семантическую структуру для каждого предложения, в том числе информацию о семантическом классе для каждого слова в текстовой информации.4. The method according to claim 1, further comprising obtaining a universal representation that contains a language-independent semantic structure for each sentence, including information about the semantic class for each word in text information. 5. Способ по п. 4, отличающийся тем, что независимая от языка семантическая структура получается в результате исчерпывающего семантико-синтаксического анализа.5. The method according to p. 4, characterized in that the language-independent semantic structure is obtained as a result of exhaustive semantic-syntactic analysis. 6. Способ по п. 1, в котором первая программа обработки естественного языка выполняет машинный перевод с первого языка на второй язык.6. The method of claim 1, wherein the first natural language processing program performs machine translation from the first language into the second language. 7. Способ по п. 5, отличающийся тем, что первая программа обработки естественного языка выполняет семантический поиск.7. The method according to p. 5, characterized in that the first natural language processing program performs a semantic search. 8. Способ по п. 7, дополнительно содержащий определение семантического индекса.8. The method of claim 7, further comprising determining a semantic index. 9. Способ по п. 5, отличающийся тем, что первая программа обработки естественного языка выполняет автоматическое реферирование документов.9. The method according to p. 5, characterized in that the first natural language processing program performs automatic abstracting of documents. 10. Способ по п. 1, отличающийся тем, что первая программа обработки естественного языка выполняет извлечение фактов.10. The method according to p. 1, characterized in that the first natural language processing program performs the extraction of facts. 11. Способ по п. 1, отличающийся тем, что первая программа обработки естественного языка выполняет классификацию документов.11. The method according to p. 1, characterized in that the first natural language processing program performs the classification of documents. 12. Способ по п. 1, отличающийся тем, что первая программа обработки естественного языка производит лингвистический анализ.12. The method according to p. 1, characterized in that the first natural language processing program performs linguistic analysis. 13. Способ по п. 1, отличающийся тем, что первая программа обработки естественного языка выполняет поиск похожих документов.13. The method according to p. 1, characterized in that the first natural language processing program searches for similar documents. 14. Система, включающая:14. A system including: один или несколько процессоров данных, а такжеone or more data processors as well одно или несколько устройств хранения команд при выполнении их на одном или нескольких процессорах данных, заставляющих процессоры данных выполнять операции, включающие:one or more command storage devices when executed on one or more data processors, forcing data processors to perform operations including: получение семантической иерархии независимых от языка семантических описаний естественного языка, релевантных к любому естественному языку;obtaining a semantic hierarchy of language-independent semantic descriptions of a natural language relevant to any natural language; создание зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков; а такжеcreation of language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages; as well as построение первой программы обработки естественного языка на основе независимых от языка семантических описаний, зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков.building the first natural language processing program based on language-independent semantic descriptions, language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages. 15. Система по п. 14, дополнительно содержащая построение одной или нескольких дополнительных программ обработки естественного языка на основе универсального представления.15. The system of claim 14, further comprising constructing one or more additional natural language processing programs based on a universal representation. 16. Система по п. 14, дополнительно включающая получение онтологической информации, связанной с текстовой информацией.16. The system of claim 14, further comprising receiving ontological information associated with the text information. 17. Система по п. 14, дополнительно включающая получение универсального представления, которое содержит независимую от языка семантическую структуру каждого предложения.17. The system of claim 14, further comprising obtaining a universal representation that contains a language-independent semantic structure of each sentence. 18. Система по п. 17, отличающаяся тем, что независимая от языка семантическая структура получается на основе исчерпывающего семантико-синтаксического анализа.18. The system of claim 17, wherein the language-independent semantic structure is obtained on the basis of exhaustive semantic-syntactic analysis. 19. Система по п. 14, отличающаяся тем, что первая программа для естественного языка выполняет машинный перевод с первого языка на второй язык.19. The system of claim 14, wherein the first natural language program performs machine translation from the first language into the second language. 20. Машиночитаемый носитель данных, хранящий машинные команды, при выполнении которых процессор осуществляет операции, включающие:20. A machine-readable storage medium that stores machine instructions, during which the processor performs operations, including: получение семантической иерархии независимых от языка семантических описаний на естественном языке, релевантных к любому естественному языку;obtaining a semantic hierarchy of language-independent semantic descriptions in a natural language, relevant to any natural language; создание зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний на одном или нескольких целевых языках; в такжеcreating language-dependent morphological descriptions, lexical descriptions, and syntactic descriptions in one or more target languages; in also построение первой программы обработки естественного языка на основе независимых от языка семантических описаний, зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний одного или нескольких целевых языков. building the first natural language processing program based on language-independent semantic descriptions, language-dependent morphological descriptions, lexical descriptions and syntactic descriptions of one or more target languages.
RU2014102111A 2006-10-10 2014-01-23 Comprehensive automatic processing of text information RU2662699C2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2014102111A RU2662699C2 (en) 2014-01-23 2014-01-23 Comprehensive automatic processing of text information
US14/509,492 US9633005B2 (en) 2006-10-10 2014-10-08 Exhaustive automatic processing of textual information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014102111A RU2662699C2 (en) 2014-01-23 2014-01-23 Comprehensive automatic processing of text information

Publications (2)

Publication Number Publication Date
RU2014102111A true RU2014102111A (en) 2015-07-27
RU2662699C2 RU2662699C2 (en) 2018-07-26

Family

ID=53761861

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014102111A RU2662699C2 (en) 2006-10-10 2014-01-23 Comprehensive automatic processing of text information

Country Status (1)

Country Link
RU (1) RU2662699C2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306497A (en) * 2020-11-03 2021-02-02 高炼 Method and system for converting natural language into program code

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691837C1 (en) * 2018-09-20 2019-06-18 Юрий Михайлович Акаткин Method of automated design of applications
WO2023003488A1 (en) * 2021-07-22 2023-01-26 Общество С Ограниченной Ответственностью "Б152" Checking of a document for compliance with personal data requirements

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185592B1 (en) * 1997-11-18 2001-02-06 Apple Computer, Inc. Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds
RU2273879C2 (en) * 2002-05-28 2006-04-10 Владимир Владимирович Насыпный Method for synthesis of self-teaching system for extracting knowledge from text documents for search engines
US20060020916A1 (en) * 2004-07-20 2006-01-26 Allison David J Automatic Derivation of Morphological, Syntactic, and Semantic Meaning from a Natural Language System Using a Monte Carlo Markov Chain Process
US9098489B2 (en) * 2006-10-10 2015-08-04 Abbyy Infopoisk Llc Method and system for semantic searching

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306497A (en) * 2020-11-03 2021-02-02 高炼 Method and system for converting natural language into program code
CN112306497B (en) * 2020-11-03 2024-04-26 高炼 Method and system for converting natural language into program code

Also Published As

Publication number Publication date
RU2662699C2 (en) 2018-07-26

Similar Documents

Publication Publication Date Title
US10061768B2 (en) Method and apparatus for improving a bilingual corpus, machine translation method and apparatus
CN107038158B (en) Method and apparatus for creating translation corpus, recording medium, and machine translation system
Ramisch et al. mwetoolkit: A framework for multiword expression identification.
US9940324B2 (en) Performance detection and enhancement of machine translation
US20160267073A1 (en) Performance detection and enhancement of machine translation
US10394961B2 (en) Foreign language sentence creation support apparatus, method, and program
Songlin Piao et al. Lexical coverage evaluation of large-scale multilingual semantic lexicons for twelve languages
RU2013156495A (en) RESOLUTION OF SEMANTIC DIFFERENCE BY MEANS OF SEMANTIC CLASSIFIER
RU2018122648A (en) REFRASING OF A CLINICAL RANDOM TEXT IN ELECTRONIC VIEW WITH A READER
RU2013156492A (en) AUTOMATIC CONSTRUCTION OF A SEMANTIC DESCRIPTION OF A TARGET LANGUAGE
CN103544326A (en) Chinese and English cross-language plagiarism recognition method based on characteristics and content of translations
Pinnis et al. MT adaptation for under-resourced domains–What works and what not
RU2014102111A (en) EXCLUSIVE AUTOMATIC PROCESSING OF TEXT INFORMATION
Yıldız et al. The effect of parallel corpus quality vs size in English-to-Turkish SMT
Pinnis et al. Accurat toolkit for multi-level alignment and information extraction from comparable corpora
CN109902306B (en) Voice recognition method, device, storage medium and voice equipment
RU2013132622A (en) SYSTEM AND SEMANTIC SEARCH METHOD
CN102982063A (en) Control method based on tuple elaboration of relation keywords extension
Li et al. A discriminative framework of integrating translation memory features into SMT
McCrae et al. Mining translations from the web of open linked data
Phuoc et al. Building a bidirectional english-vietnamese statistical machine translation system by using moses
Pal et al. How sentiment analysis can help machine translation
Farahmand et al. Modeling the statistical idiosyncrasy of multiword expressions
Zarnoufi et al. Machine normalization: Bringing social media text from non-standard to standard form
Attardi et al. Adapting linguistic tools for the analysis of italian medical records

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant
HE9A Changing address for correspondence with an applicant
QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311