RU2014135303A - Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) - Google Patents

Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) Download PDF

Info

Publication number
RU2014135303A
RU2014135303A RU2014135303A RU2014135303A RU2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A
Authority
RU
Russia
Prior art keywords
phrase
input
output
features
words
Prior art date
Application number
RU2014135303A
Other languages
English (en)
Other versions
RU2639684C2 (ru
Inventor
Илья Алексеевич Мельников
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2014135303A priority Critical patent/RU2639684C2/ru
Priority to EP14900381.6A priority patent/EP3186804A4/en
Priority to PCT/IB2014/066336 priority patent/WO2016030730A1/en
Priority to US14/921,189 priority patent/US9898448B2/en
Publication of RU2014135303A publication Critical patent/RU2014135303A/ru
Application granted granted Critical
Publication of RU2639684C2 publication Critical patent/RU2639684C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

1. Способ обработки текстов, выполняемый на компьютерном устройстве, включающий следующие этапы:понимание смысла входной фразы, состоящей из входных слов;понимание смысла выходной фразы, состоящей из выходных слов;установление соответствия множества признаков входных слов для каждого входного слова;установление соответствия множества признаков выходных слов для каждого выходного слова;анализирование множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; ина основании преобразования, генерация одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.2. Способ по п. 1, в котором на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова определяют сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов.3. Способ по п. 2, в котором:каждое из множеств признаков входных слов включает один или несколько грамматических признаков входного слова, к которому относится это множество признаков;каждое из множеств признаков выходных слов включает один или несколько грамматических признаков выходного слова, к которому относится это множество признаков; ипри определении сходства каждого из множеств признаков входных слов с каждым из множеств признаков выходных слов выполняют сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.4. Способ по любому из пп. 2 и 3, в котором:к

Claims (33)

1. Способ обработки текстов, выполняемый на компьютерном устройстве, включающий следующие этапы:
понимание смысла входной фразы, состоящей из входных слов;
понимание смысла выходной фразы, состоящей из выходных слов;
установление соответствия множества признаков входных слов для каждого входного слова;
установление соответствия множества признаков выходных слов для каждого выходного слова;
анализирование множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
на основании преобразования, генерация одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.
2. Способ по п. 1, в котором на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова определяют сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов.
3. Способ по п. 2, в котором:
каждое из множеств признаков входных слов включает один или несколько грамматических признаков входного слова, к которому относится это множество признаков;
каждое из множеств признаков выходных слов включает один или несколько грамматических признаков выходного слова, к которому относится это множество признаков; и
при определении сходства каждого из множеств признаков входных слов с каждым из множеств признаков выходных слов выполняют сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.
4. Способ по любому из пп. 2 и 3, в котором:
каждое из множеств признаков входных слов включает значение входного слова, к которому относится это множество признаков;
каждое из множеств признаков выходных слов включает значение выходного слова, к которому относится это множество признаков; и
при определении сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов выполняют определение сходства соответствующего значения каждого из входных слов с соответствующим значением каждого из выходных слов.
5. Способ по любому из пп. 2 и 3, в котором:
на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова дополнительно выполняют этап подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова; и
на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова.
6. Способ по п. 4, в котором:
на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова дополнительно выполняют этап подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова; и
на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова.
7. Способ по п. 5, в котором:
входное слово, соотнесенное с одним из множеств признаков входного слова, и выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова, имеют одинаковый корень; и
первое правило трансформации фразы применяют к входной фразе для видоизменения формы входного слова в форму выходного слова.
8. Способ по п. 6, в котором:
входное слово, соотнесенное с одним из множеств признаков входного слова, и выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова, имеют одинаковый корень; и
первое правило трансформации фразы применяют к входной фразе для видоизменения формы входного слова в форму выходного слова.
9. Способ по любому из пп. 1-3, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию второго правила трансформации фразы, применяемого к входной фразе, которое удаляет по меньшей мере одно слово из входной фразы.
10. Способ по любому из пп. 1-3, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова.
11. Способ по п. 9, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова.
12. Способ по любому из пп. 1-3, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
13. Способ по п. 9, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
14. Способ по п. 11, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
15. Способ по п. 12, в котором текстовая фраза отличается от входной фразы, а до применения одного или нескольких правил трансформации фразы к текстовой фразе дополнительно выполняют этап определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение.
16. Способ по любому из пп. 13 и 14, в котором текстовая фраза отличается от входной фразы, а до применения одного или нескольких правил трансформации фразы к текстовой фразе дополнительно выполняют этап определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение.
17. Способ по п. 15, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
18. Способ по п. 16, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
19. Способ обработки текстов, выполняемый на компьютерном устройстве, содержащем память, на которой хранятся одно или несколько правил трансформации фразы, которые были сгенерированы на основании анализа множеств признаков, в том числе множества признаков входного слова, сопоставленного с входным словом входной фразы, и множества признаков выходного слова, сопоставленного с выходным словом выходной фразы, который включает следующие этапы:
понимание смысла текстовой фразы;
определение того, что сходство текстовой фразы с входной фразой превышает пороговое значение; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
20. Способ по п. 19, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
21. Постоянный машиночитаемый носитель, хранящий программные команды для обработки текстов, обеспечивающие, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
понимания смысла входной фразы, состоящей из входных слов;
понимания смысла выходной фразы, состоящей из выходных слов;
установления соответствия множества признаков входных слов для каждого входного слова;
установления соответствия множества признаков выходных слов для каждого выходного слова;
анализа множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
генерации одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу, на основании преобразования.
22. Носитель по п. 21, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: определения сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов при анализе множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова.
23. Носитель по п. 22, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
определения сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов включает сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.
24. Носитель по любому из пп. 22 и 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
определения сходства соответствующего значения каждого из входных слов с соответствующим значением каждого из выходных слов при определении сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов.
25. Носитель по любому из пп. 22 и 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова при анализе множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
генерации первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.
26. Носитель по п. 25, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
применения первого правила трансформации фразы к входной фразе для видоизменения формы входного слова в форму выходного слова.
27. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: генерации второго правила трансформации фразы, применяемого к входной фразе, которое удаляет по меньшей мере одно слово из входной фразы при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу.
28. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: генерации третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу.
29. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
понимания смысла текстовой фразы; и
применения одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
30. Носитель по п. 29, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение до применения одного или нескольких правил трансформации фразы к текстовой фразе.
31. Носитель по п. 30, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: по меньшей мере грамматического, или по меньшей мере семантического анализа текстовой фразы и входной фразы при определении того, что сходство текстовой фразы с входной фразой превышает пороговое значение.
32. Постоянный машиночитаемый носитель, на котором хранятся одно или несколько правил трансформации фразы - сгенерированные на основе анализа множества признаков, в том числе множества признаков входного слова, сопоставленного с входным словом входной фразы, и множества признаков выходного слова, сопоставленного с выходным словом выходной фразы - и программные команды, обеспечивающие, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: понимания смысла текстовой фразы;
определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение; и
применения одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
33. Носитель по п. 32, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: по меньшей мере грамматического, или по меньшей мере семантического анализа текстовой фразы и входной фразы при определении того, что сходство текстовой фразы с входной фразой превышает пороговое значение.
RU2014135303A 2014-08-29 2014-08-29 Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) RU2639684C2 (ru)

Priority Applications (4)

Application Number Priority Date Filing Date Title
RU2014135303A RU2639684C2 (ru) 2014-08-29 2014-08-29 Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)
EP14900381.6A EP3186804A4 (en) 2014-08-29 2014-11-25 Method for text processing
PCT/IB2014/066336 WO2016030730A1 (en) 2014-08-29 2014-11-25 Method for text processing
US14/921,189 US9898448B2 (en) 2014-08-29 2015-10-23 Method for text processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014135303A RU2639684C2 (ru) 2014-08-29 2014-08-29 Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)

Publications (2)

Publication Number Publication Date
RU2014135303A true RU2014135303A (ru) 2016-03-20
RU2639684C2 RU2639684C2 (ru) 2017-12-21

Family

ID=55398802

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014135303A RU2639684C2 (ru) 2014-08-29 2014-08-29 Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)

Country Status (4)

Country Link
US (1) US9898448B2 (ru)
EP (1) EP3186804A4 (ru)
RU (1) RU2639684C2 (ru)
WO (1) WO2016030730A1 (ru)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10176819B2 (en) * 2016-07-11 2019-01-08 The Chinese University Of Hong Kong Phonetic posteriorgrams for many-to-one voice conversion
US11562141B2 (en) * 2017-07-18 2023-01-24 Koninklijke Philips N.V. Mapping of coded medical vocabularies
WO2019023412A1 (en) * 2017-07-26 2019-01-31 Siuvo Inc. DIGITAL SEMANTIC CLASSIFICATION DATA IN NATURAL LANGUAGE CONTEXT BASED ON MACHINE LEARNING
US10915707B2 (en) * 2017-10-20 2021-02-09 MachineVantage, Inc. Word replaceability through word vectors
US10747833B2 (en) 2017-10-30 2020-08-18 Nio Usa, Inc. Personalized news recommendation engine
RU2685044C1 (ru) * 2018-07-03 2019-04-16 Федеральное государственное бюджетное учреждение "Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт" (НИЦ "Курчатовский институт"- ИТЭФ) Способ определения контекста слова и текстового файла
CN110489750A (zh) * 2019-08-12 2019-11-22 昆明理工大学 基于双向lstm-crf的缅甸语分词及词性标注方法及装置
CN111832318B (zh) * 2020-07-16 2023-03-21 平安科技(深圳)有限公司 单语句自然语言处理方法、装置、计算机设备及可读存储介质
CN112395408B (zh) * 2020-11-19 2023-11-07 平安科技(深圳)有限公司 停用词表生成方法、装置、电子设备及存储介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
EP0598598B1 (en) 1992-11-18 2000-02-02 Canon Information Systems, Inc. Text-to-speech processor, and parser for use in such a processor
US5634084A (en) 1995-01-20 1997-05-27 Centigram Communications Corporation Abbreviation and acronym/initialism expansion procedures for a text to speech reader
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6345243B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically propagating translations in a translation-memory system
DE19910621C2 (de) * 1999-03-10 2001-01-25 Thomas Poetter Vorrichtung und Verfahren zum Verbergen von Informationen und Vorrichtung und Verfahren zum Extrahieren von Informationen
WO2000055842A2 (en) * 1999-03-15 2000-09-21 British Telecommunications Public Limited Company Speech synthesis
JP2003505778A (ja) * 1999-05-28 2003-02-12 セーダ インコーポレイテッド 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化
US20020120451A1 (en) * 2000-05-31 2002-08-29 Yumiko Kato Apparatus and method for providing information by speech
US6885985B2 (en) * 2000-12-18 2005-04-26 Xerox Corporation Terminology translation for unaligned comparable corpora using category based translation probabilities
US7054803B2 (en) * 2000-12-19 2006-05-30 Xerox Corporation Extracting sentence translations from translated documents
US20020173961A1 (en) * 2001-03-09 2002-11-21 Guerra Lisa M. System, method and computer program product for dynamic, robust and fault tolerant audio output in a speech recognition framework
US7689405B2 (en) * 2001-05-17 2010-03-30 Language Weaver, Inc. Statistical method for building a translation memory
US7313513B2 (en) * 2002-05-13 2007-12-25 Wordrake Llc Method for editing and enhancing readability of authored documents
US20040215461A1 (en) 2003-04-24 2004-10-28 Visteon Global Technologies, Inc. Text-to-speech system for generating information announcements
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US20050267757A1 (en) 2004-05-27 2005-12-01 Nokia Corporation Handling of acronyms and digits in a speech recognition and text-to-speech engine
GB2415518A (en) * 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
US20070016401A1 (en) * 2004-08-12 2007-01-18 Farzad Ehsani Speech-to-speech translation system with user-modifiable paraphrasing grammars
US8239184B2 (en) * 2006-03-13 2012-08-07 Newtalk, Inc. Electronic multilingual numeric and language learning tool
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8201156B1 (en) * 2007-06-08 2012-06-12 Emc Corporation Automatic generation of message IDS
JP5638948B2 (ja) * 2007-08-01 2014-12-10 ジンジャー ソフトウェア、インコーポレイティッド インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善
US8615388B2 (en) * 2008-03-28 2013-12-24 Microsoft Corporation Intra-language statistical machine translation
US20090326938A1 (en) * 2008-05-28 2009-12-31 Nokia Corporation Multiword text correction
EP2300939A4 (en) * 2008-06-09 2016-03-30 Nat Res Council Canada METHOD AND SYSTEM FOR USING ALIGNMENT MEANS IN TRANSLATION MATCHING
CN101667176A (zh) * 2008-09-01 2010-03-10 株式会社东芝 基于短语的统计机器翻译方法和系统
US20100145676A1 (en) * 2008-12-09 2010-06-10 Qualcomm Incorporated Method and apparatus for adjusting the length of text strings to fit display sizes
US8463806B2 (en) * 2009-01-30 2013-06-11 Lexisnexis Methods and systems for creating and using an adaptive thesaurus
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) * 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
RU2421827C2 (ru) * 2009-08-07 2011-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ синтеза речи
US8478581B2 (en) * 2010-01-25 2013-07-02 Chung-ching Chen Interlingua, interlingua engine, and interlingua machine translation system
US9015036B2 (en) * 2010-02-01 2015-04-21 Ginger Software, Inc. Automatic context sensitive language correction using an internet corpus particularly for small keyboard devices
US8571870B2 (en) * 2010-02-12 2013-10-29 Nuance Communications, Inc. Method and apparatus for generating synthetic speech with contrastive stress
US8447610B2 (en) * 2010-02-12 2013-05-21 Nuance Communications, Inc. Method and apparatus for generating synthetic speech with contrastive stress
US8949128B2 (en) * 2010-02-12 2015-02-03 Nuance Communications, Inc. Method and apparatus for providing speech output for speech-enabled applications
US9110883B2 (en) * 2011-04-01 2015-08-18 Rima Ghannam System for natural language understanding
US9064006B2 (en) * 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9164983B2 (en) * 2011-05-27 2015-10-20 Robert Bosch Gmbh Broad-coverage normalization system for social media language
RU2460154C1 (ru) * 2011-06-15 2012-08-27 Александр Юрьевич Бредихин Способ автоматизированной обработки текста и компьютерное устройство для реализации этого способа
US8781810B2 (en) * 2011-07-25 2014-07-15 Xerox Corporation System and method for productive generation of compound words in statistical machine translation
US9245253B2 (en) * 2011-08-19 2016-01-26 Disney Enterprises, Inc. Soft-sending chat messages
CN104239286A (zh) * 2013-06-24 2014-12-24 阿里巴巴集团控股有限公司 同义短语的挖掘方法和装置及搜索相关内容的方法和装置
JP6417649B2 (ja) * 2013-08-22 2018-11-07 株式会社リコー 文章処理装置、文章表示システム、プログラム
US9817813B2 (en) * 2014-01-08 2017-11-14 Genesys Telecommunications Laboratories, Inc. Generalized phrases in automatic speech recognition systems
US20150286632A1 (en) * 2014-04-03 2015-10-08 Xerox Corporation Predicting the quality of automatic translation of an entire document

Also Published As

Publication number Publication date
US9898448B2 (en) 2018-02-20
EP3186804A1 (en) 2017-07-05
EP3186804A4 (en) 2018-04-25
WO2016030730A1 (en) 2016-03-03
US20160232142A1 (en) 2016-08-11
RU2639684C2 (ru) 2017-12-21

Similar Documents

Publication Publication Date Title
RU2014135303A (ru) Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты)
JP2021523464A5 (ru)
RU2015151699A (ru) Извлечение сущностей из текстов на естественном языке
BR112017010222A2 (pt) discriminando expressões ambíguas para aprimorar experiência do usuário
JP2016509711A5 (ru)
JP2017528842A5 (ru)
RU2016137787A (ru) Персонализированный поиск на основе явной подачи сигналов
JP2016510449A5 (ru)
JP2016157407A (ja) テキスト分析及び応答システムのための語彙意味パターンの事前構築方法
RU2016137176A (ru) Связывание преобразованного исходного кода с первоначальным исходным кодом с помощью метаданных
GB2581705A (en) Abstraction and portablity to intent recognition
JP2020537228A5 (ru)
GB2575580A (en) Supporting interactive text mining process with natural language dialog
RU2013156495A (ru) Разрешение семантической неоднозначности при помощи семантического классификатора
JPWO2018180106A1 (ja) 情報処理装置、情報処理方法及びプログラム
KR101635275B1 (ko) 데이터베이스의 데이터 확장 방법 및 장치
CN104021117A (zh) 语言处理方法与电子设备
JP7384221B2 (ja) 要約学習方法、要約学習装置及びプログラム
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
US10452355B2 (en) Automaton deforming device, automaton deforming method, and computer program product
CN112527953B (zh) 规则匹配方法及装置
US20220207239A1 (en) Utterance pair acquisition apparatus, utterance pair acquisition method, and program
Dlugolinsky et al. MSM2013 IE Challenge: Annotowatch.
JP2018077604A (ja) 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置
KR20160053587A (ko) 엔-그램 언어 모델의 데이터베이스 사이즈 최소화 방법

Legal Events

Date Code Title Description
HE9A Changing address for correspondence with an applicant
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20161129

HE9A Changing address for correspondence with an applicant
FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20171027