RU2014135303A - Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) - Google Patents
Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) Download PDFInfo
- Publication number
- RU2014135303A RU2014135303A RU2014135303A RU2014135303A RU2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A RU 2014135303 A RU2014135303 A RU 2014135303A
- Authority
- RU
- Russia
- Prior art keywords
- phrase
- input
- output
- features
- words
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims 2
- 230000009466 transformation Effects 0.000 claims abstract 25
- 238000000034 method Methods 0.000 claims abstract 23
- 238000004458 analytical method Methods 0.000 claims abstract 11
- 238000006243 chemical reaction Methods 0.000 claims abstract 10
- 230000001131 transforming effect Effects 0.000 claims 11
- 230000002596 correlated effect Effects 0.000 claims 8
- 230000000875 corresponding effect Effects 0.000 claims 8
- 230000002085 persistent effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
1. Способ обработки текстов, выполняемый на компьютерном устройстве, включающий следующие этапы:понимание смысла входной фразы, состоящей из входных слов;понимание смысла выходной фразы, состоящей из выходных слов;установление соответствия множества признаков входных слов для каждого входного слова;установление соответствия множества признаков выходных слов для каждого выходного слова;анализирование множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; ина основании преобразования, генерация одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.2. Способ по п. 1, в котором на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова определяют сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов.3. Способ по п. 2, в котором:каждое из множеств признаков входных слов включает один или несколько грамматических признаков входного слова, к которому относится это множество признаков;каждое из множеств признаков выходных слов включает один или несколько грамматических признаков выходного слова, к которому относится это множество признаков; ипри определении сходства каждого из множеств признаков входных слов с каждым из множеств признаков выходных слов выполняют сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.4. Способ по любому из пп. 2 и 3, в котором:к
Claims (33)
1. Способ обработки текстов, выполняемый на компьютерном устройстве, включающий следующие этапы:
понимание смысла входной фразы, состоящей из входных слов;
понимание смысла выходной фразы, состоящей из выходных слов;
установление соответствия множества признаков входных слов для каждого входного слова;
установление соответствия множества признаков выходных слов для каждого выходного слова;
анализирование множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
на основании преобразования, генерация одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.
2. Способ по п. 1, в котором на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова определяют сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов.
3. Способ по п. 2, в котором:
каждое из множеств признаков входных слов включает один или несколько грамматических признаков входного слова, к которому относится это множество признаков;
каждое из множеств признаков выходных слов включает один или несколько грамматических признаков выходного слова, к которому относится это множество признаков; и
при определении сходства каждого из множеств признаков входных слов с каждым из множеств признаков выходных слов выполняют сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.
4. Способ по любому из пп. 2 и 3, в котором:
каждое из множеств признаков входных слов включает значение входного слова, к которому относится это множество признаков;
каждое из множеств признаков выходных слов включает значение выходного слова, к которому относится это множество признаков; и
при определении сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов выполняют определение сходства соответствующего значения каждого из входных слов с соответствующим значением каждого из выходных слов.
5. Способ по любому из пп. 2 и 3, в котором:
на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова дополнительно выполняют этап подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова; и
на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова.
6. Способ по п. 4, в котором:
на этапе анализирования множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова дополнительно выполняют этап подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова; и
на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова.
7. Способ по п. 5, в котором:
входное слово, соотнесенное с одним из множеств признаков входного слова, и выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова, имеют одинаковый корень; и
первое правило трансформации фразы применяют к входной фразе для видоизменения формы входного слова в форму выходного слова.
8. Способ по п. 6, в котором:
входное слово, соотнесенное с одним из множеств признаков входного слова, и выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова, имеют одинаковый корень; и
первое правило трансформации фразы применяют к входной фразе для видоизменения формы входного слова в форму выходного слова.
9. Способ по любому из пп. 1-3, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию второго правила трансформации фразы, применяемого к входной фразе, которое удаляет по меньшей мере одно слово из входной фразы.
10. Способ по любому из пп. 1-3, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова.
11. Способ по п. 9, в котором на этапе генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу, выполняют генерацию третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова.
12. Способ по любому из пп. 1-3, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
13. Способ по п. 9, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
14. Способ по п. 11, в котором дополнительно выполняют следующие этапы:
понимание смысла текстовой фразы; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
15. Способ по п. 12, в котором текстовая фраза отличается от входной фразы, а до применения одного или нескольких правил трансформации фразы к текстовой фразе дополнительно выполняют этап определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение.
16. Способ по любому из пп. 13 и 14, в котором текстовая фраза отличается от входной фразы, а до применения одного или нескольких правил трансформации фразы к текстовой фразе дополнительно выполняют этап определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение.
17. Способ по п. 15, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
18. Способ по п. 16, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
19. Способ обработки текстов, выполняемый на компьютерном устройстве, содержащем память, на которой хранятся одно или несколько правил трансформации фразы, которые были сгенерированы на основании анализа множеств признаков, в том числе множества признаков входного слова, сопоставленного с входным словом входной фразы, и множества признаков выходного слова, сопоставленного с выходным словом выходной фразы, который включает следующие этапы:
понимание смысла текстовой фразы;
определение того, что сходство текстовой фразы с входной фразой превышает пороговое значение; и
применение одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
20. Способ по п. 19, в котором на этапе определения того, что сходство текстовой фразы с входной фразой превышает пороговое значение, выполняют по меньшей мере грамматический, или по меньшей мере семантический анализ текстовой фразы и входной фразы.
21. Постоянный машиночитаемый носитель, хранящий программные команды для обработки текстов, обеспечивающие, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
понимания смысла входной фразы, состоящей из входных слов;
понимания смысла выходной фразы, состоящей из выходных слов;
установления соответствия множества признаков входных слов для каждого входного слова;
установления соответствия множества признаков выходных слов для каждого выходного слова;
анализа множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
генерации одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу, на основании преобразования.
22. Носитель по п. 21, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: определения сходства между каждым множеством признаков входных слов и каждым множеством признаков выходных слов при анализе множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова.
23. Носитель по п. 22, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
определения сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов включает сравнение соответствующих грамматических признаков каждого из входных слов с соответствующими грамматическими признаками каждого из выходных слов.
24. Носитель по любому из пп. 22 и 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
определения сходства соответствующего значения каждого из входных слов с соответствующим значением каждого из выходных слов при определении сходства каждого из множеств признаков входных слов с каждым и множеств признаков выходных слов.
25. Носитель по любому из пп. 22 и 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
подбора одному из множеств признаков входного слова наиболее подобного множества признаков из множеств признаков выходного слова при анализе множеств признаков входных слов и множеств признаков выходных слов для определения преобразования входных слов в выходные слова; и
генерации первого правила трансформации фразы, применимого к входной фразе, которое трансформирует входное слово, соотнесенное с одним из множеств признаков входного слова, в выходное слово, соотнесенное с наиболее подобным множеством признаков выходного слова при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе, для трансформации ее в выходную фразу.
26. Носитель по п. 25, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
применения первого правила трансформации фразы к входной фразе для видоизменения формы входного слова в форму выходного слова.
27. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: генерации второго правила трансформации фразы, применяемого к входной фразе, которое удаляет по меньшей мере одно слово из входной фразы при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу.
28. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: генерации третьего правила трансформации фразы, применяемого к входной фразе для добавления в нее по меньшей мере одного слова при генерации одного или нескольких правил трансформации фразы, применимых к входной фразе для трансформации ее в выходную фразу.
29. Носитель по п. 23, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством:
понимания смысла текстовой фразы; и
применения одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
30. Носитель по п. 29, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение до применения одного или нескольких правил трансформации фразы к текстовой фразе.
31. Носитель по п. 30, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: по меньшей мере грамматического, или по меньшей мере семантического анализа текстовой фразы и входной фразы при определении того, что сходство текстовой фразы с входной фразой превышает пороговое значение.
32. Постоянный машиночитаемый носитель, на котором хранятся одно или несколько правил трансформации фразы - сгенерированные на основе анализа множества признаков, в том числе множества признаков входного слова, сопоставленного с входным словом входной фразы, и множества признаков выходного слова, сопоставленного с выходным словом выходной фразы - и программные команды, обеспечивающие, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: понимания смысла текстовой фразы;
определения того, что сходство между текстовой фразой и входной фразой превышает пороговое значение; и
применения одного или нескольких правил трансформации фразы к текстовой фразе для генерации трансформированной текстовой фразы.
33. Носитель по п. 32, в котором программные команды для обработки текстов, обеспечивают, при их выполнении на компьютерном устройстве, выполнение компьютерным устройством: по меньшей мере грамматического, или по меньшей мере семантического анализа текстовой фразы и входной фразы при определении того, что сходство текстовой фразы с входной фразой превышает пороговое значение.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014135303A RU2639684C2 (ru) | 2014-08-29 | 2014-08-29 | Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) |
EP14900381.6A EP3186804A4 (en) | 2014-08-29 | 2014-11-25 | Method for text processing |
PCT/IB2014/066336 WO2016030730A1 (en) | 2014-08-29 | 2014-11-25 | Method for text processing |
US14/921,189 US9898448B2 (en) | 2014-08-29 | 2015-10-23 | Method for text processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014135303A RU2639684C2 (ru) | 2014-08-29 | 2014-08-29 | Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2014135303A true RU2014135303A (ru) | 2016-03-20 |
RU2639684C2 RU2639684C2 (ru) | 2017-12-21 |
Family
ID=55398802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014135303A RU2639684C2 (ru) | 2014-08-29 | 2014-08-29 | Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) |
Country Status (4)
Country | Link |
---|---|
US (1) | US9898448B2 (ru) |
EP (1) | EP3186804A4 (ru) |
RU (1) | RU2639684C2 (ru) |
WO (1) | WO2016030730A1 (ru) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10176819B2 (en) * | 2016-07-11 | 2019-01-08 | The Chinese University Of Hong Kong | Phonetic posteriorgrams for many-to-one voice conversion |
US11562141B2 (en) * | 2017-07-18 | 2023-01-24 | Koninklijke Philips N.V. | Mapping of coded medical vocabularies |
WO2019023412A1 (en) * | 2017-07-26 | 2019-01-31 | Siuvo Inc. | DIGITAL SEMANTIC CLASSIFICATION DATA IN NATURAL LANGUAGE CONTEXT BASED ON MACHINE LEARNING |
US10915707B2 (en) * | 2017-10-20 | 2021-02-09 | MachineVantage, Inc. | Word replaceability through word vectors |
US10747833B2 (en) | 2017-10-30 | 2020-08-18 | Nio Usa, Inc. | Personalized news recommendation engine |
RU2685044C1 (ru) * | 2018-07-03 | 2019-04-16 | Федеральное государственное бюджетное учреждение "Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт" (НИЦ "Курчатовский институт"- ИТЭФ) | Способ определения контекста слова и текстового файла |
CN110489750A (zh) * | 2019-08-12 | 2019-11-22 | 昆明理工大学 | 基于双向lstm-crf的缅甸语分词及词性标注方法及装置 |
CN111832318B (zh) * | 2020-07-16 | 2023-03-21 | 平安科技(深圳)有限公司 | 单语句自然语言处理方法、装置、计算机设备及可读存储介质 |
CN112395408B (zh) * | 2020-11-19 | 2023-11-07 | 平安科技(深圳)有限公司 | 停用词表生成方法、装置、电子设备及存储介质 |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4916614A (en) * | 1986-11-25 | 1990-04-10 | Hitachi, Ltd. | Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words |
EP0598598B1 (en) | 1992-11-18 | 2000-02-02 | Canon Information Systems, Inc. | Text-to-speech processor, and parser for use in such a processor |
US5634084A (en) | 1995-01-20 | 1997-05-27 | Centigram Communications Corporation | Abbreviation and acronym/initialism expansion procedures for a text to speech reader |
US6424983B1 (en) * | 1998-05-26 | 2002-07-23 | Global Information Research And Technologies, Llc | Spelling and grammar checking system |
US6345243B1 (en) * | 1998-05-27 | 2002-02-05 | Lionbridge Technologies, Inc. | System, method, and product for dynamically propagating translations in a translation-memory system |
DE19910621C2 (de) * | 1999-03-10 | 2001-01-25 | Thomas Poetter | Vorrichtung und Verfahren zum Verbergen von Informationen und Vorrichtung und Verfahren zum Extrahieren von Informationen |
WO2000055842A2 (en) * | 1999-03-15 | 2000-09-21 | British Telecommunications Public Limited Company | Speech synthesis |
JP2003505778A (ja) * | 1999-05-28 | 2003-02-12 | セーダ インコーポレイテッド | 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化 |
US20020120451A1 (en) * | 2000-05-31 | 2002-08-29 | Yumiko Kato | Apparatus and method for providing information by speech |
US6885985B2 (en) * | 2000-12-18 | 2005-04-26 | Xerox Corporation | Terminology translation for unaligned comparable corpora using category based translation probabilities |
US7054803B2 (en) * | 2000-12-19 | 2006-05-30 | Xerox Corporation | Extracting sentence translations from translated documents |
US20020173961A1 (en) * | 2001-03-09 | 2002-11-21 | Guerra Lisa M. | System, method and computer program product for dynamic, robust and fault tolerant audio output in a speech recognition framework |
US7689405B2 (en) * | 2001-05-17 | 2010-03-30 | Language Weaver, Inc. | Statistical method for building a translation memory |
US7313513B2 (en) * | 2002-05-13 | 2007-12-25 | Wordrake Llc | Method for editing and enhancing readability of authored documents |
US20040215461A1 (en) | 2003-04-24 | 2004-10-28 | Visteon Global Technologies, Inc. | Text-to-speech system for generating information announcements |
US7412385B2 (en) * | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
US20050267757A1 (en) | 2004-05-27 | 2005-12-01 | Nokia Corporation | Handling of acronyms and digits in a speech recognition and text-to-speech engine |
GB2415518A (en) * | 2004-06-24 | 2005-12-28 | Sharp Kk | Method and apparatus for translation based on a repository of existing translations |
US20070016401A1 (en) * | 2004-08-12 | 2007-01-18 | Farzad Ehsani | Speech-to-speech translation system with user-modifiable paraphrasing grammars |
US8239184B2 (en) * | 2006-03-13 | 2012-08-07 | Newtalk, Inc. | Electronic multilingual numeric and language learning tool |
US8831928B2 (en) * | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8201156B1 (en) * | 2007-06-08 | 2012-06-12 | Emc Corporation | Automatic generation of message IDS |
JP5638948B2 (ja) * | 2007-08-01 | 2014-12-10 | ジンジャー ソフトウェア、インコーポレイティッド | インターネットコーパスを用いた、文脈依存言語の自動的な修正および改善 |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US20090326938A1 (en) * | 2008-05-28 | 2009-12-31 | Nokia Corporation | Multiword text correction |
EP2300939A4 (en) * | 2008-06-09 | 2016-03-30 | Nat Res Council Canada | METHOD AND SYSTEM FOR USING ALIGNMENT MEANS IN TRANSLATION MATCHING |
CN101667176A (zh) * | 2008-09-01 | 2010-03-10 | 株式会社东芝 | 基于短语的统计机器翻译方法和系统 |
US20100145676A1 (en) * | 2008-12-09 | 2010-06-10 | Qualcomm Incorporated | Method and apparatus for adjusting the length of text strings to fit display sizes |
US8463806B2 (en) * | 2009-01-30 | 2013-06-11 | Lexisnexis | Methods and systems for creating and using an adaptive thesaurus |
GB2468278A (en) * | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US9262403B2 (en) * | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
RU2421827C2 (ru) * | 2009-08-07 | 2011-06-20 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ синтеза речи |
US8478581B2 (en) * | 2010-01-25 | 2013-07-02 | Chung-ching Chen | Interlingua, interlingua engine, and interlingua machine translation system |
US9015036B2 (en) * | 2010-02-01 | 2015-04-21 | Ginger Software, Inc. | Automatic context sensitive language correction using an internet corpus particularly for small keyboard devices |
US8571870B2 (en) * | 2010-02-12 | 2013-10-29 | Nuance Communications, Inc. | Method and apparatus for generating synthetic speech with contrastive stress |
US8447610B2 (en) * | 2010-02-12 | 2013-05-21 | Nuance Communications, Inc. | Method and apparatus for generating synthetic speech with contrastive stress |
US8949128B2 (en) * | 2010-02-12 | 2015-02-03 | Nuance Communications, Inc. | Method and apparatus for providing speech output for speech-enabled applications |
US9110883B2 (en) * | 2011-04-01 | 2015-08-18 | Rima Ghannam | System for natural language understanding |
US9064006B2 (en) * | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US9164983B2 (en) * | 2011-05-27 | 2015-10-20 | Robert Bosch Gmbh | Broad-coverage normalization system for social media language |
RU2460154C1 (ru) * | 2011-06-15 | 2012-08-27 | Александр Юрьевич Бредихин | Способ автоматизированной обработки текста и компьютерное устройство для реализации этого способа |
US8781810B2 (en) * | 2011-07-25 | 2014-07-15 | Xerox Corporation | System and method for productive generation of compound words in statistical machine translation |
US9245253B2 (en) * | 2011-08-19 | 2016-01-26 | Disney Enterprises, Inc. | Soft-sending chat messages |
CN104239286A (zh) * | 2013-06-24 | 2014-12-24 | 阿里巴巴集团控股有限公司 | 同义短语的挖掘方法和装置及搜索相关内容的方法和装置 |
JP6417649B2 (ja) * | 2013-08-22 | 2018-11-07 | 株式会社リコー | 文章処理装置、文章表示システム、プログラム |
US9817813B2 (en) * | 2014-01-08 | 2017-11-14 | Genesys Telecommunications Laboratories, Inc. | Generalized phrases in automatic speech recognition systems |
US20150286632A1 (en) * | 2014-04-03 | 2015-10-08 | Xerox Corporation | Predicting the quality of automatic translation of an entire document |
-
2014
- 2014-08-29 RU RU2014135303A patent/RU2639684C2/ru not_active Application Discontinuation
- 2014-11-25 EP EP14900381.6A patent/EP3186804A4/en not_active Withdrawn
- 2014-11-25 WO PCT/IB2014/066336 patent/WO2016030730A1/en active Application Filing
-
2015
- 2015-10-23 US US14/921,189 patent/US9898448B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9898448B2 (en) | 2018-02-20 |
EP3186804A1 (en) | 2017-07-05 |
EP3186804A4 (en) | 2018-04-25 |
WO2016030730A1 (en) | 2016-03-03 |
US20160232142A1 (en) | 2016-08-11 |
RU2639684C2 (ru) | 2017-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2014135303A (ru) | Способ обработки текстов (варианты) и постоянный машиночитаемый носитель (варианты) | |
JP2021523464A5 (ru) | ||
RU2015151699A (ru) | Извлечение сущностей из текстов на естественном языке | |
BR112017010222A2 (pt) | discriminando expressões ambíguas para aprimorar experiência do usuário | |
JP2016509711A5 (ru) | ||
JP2017528842A5 (ru) | ||
RU2016137787A (ru) | Персонализированный поиск на основе явной подачи сигналов | |
JP2016510449A5 (ru) | ||
JP2016157407A (ja) | テキスト分析及び応答システムのための語彙意味パターンの事前構築方法 | |
RU2016137176A (ru) | Связывание преобразованного исходного кода с первоначальным исходным кодом с помощью метаданных | |
GB2581705A (en) | Abstraction and portablity to intent recognition | |
JP2020537228A5 (ru) | ||
GB2575580A (en) | Supporting interactive text mining process with natural language dialog | |
RU2013156495A (ru) | Разрешение семантической неоднозначности при помощи семантического классификатора | |
JPWO2018180106A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR101635275B1 (ko) | 데이터베이스의 데이터 확장 방법 및 장치 | |
CN104021117A (zh) | 语言处理方法与电子设备 | |
JP7384221B2 (ja) | 要約学習方法、要約学習装置及びプログラム | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
US10452355B2 (en) | Automaton deforming device, automaton deforming method, and computer program product | |
CN112527953B (zh) | 规则匹配方法及装置 | |
US20220207239A1 (en) | Utterance pair acquisition apparatus, utterance pair acquisition method, and program | |
Dlugolinsky et al. | MSM2013 IE Challenge: Annotowatch. | |
JP2018077604A (ja) | 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置 | |
KR20160053587A (ko) | 엔-그램 언어 모델의 데이터베이스 사이즈 최소화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HE9A | Changing address for correspondence with an applicant | ||
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20161129 |
|
HE9A | Changing address for correspondence with an applicant | ||
FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20171027 |