RU2017119853A - Сложность локализации произвольных языковых материалов и ресурсов - Google Patents
Сложность локализации произвольных языковых материалов и ресурсов Download PDFInfo
- Publication number
- RU2017119853A RU2017119853A RU2017119853A RU2017119853A RU2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A
- Authority
- RU
- Russia
- Prior art keywords
- complexity
- source content
- arbitrary
- user interface
- content
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
- User Interface Of Digital Computer (AREA)
Claims (39)
1. Реализуемый компьютером процесс, содержащий
прием произвольного исходного содержимого, содержащего последовательность из одного или более слов на исходном языке;
извлечение множества признаков из исходного содержимого;
применение используемой в машинном обучении основанной на лингвистическом предсказании модели к признакам для предсказания исходной оценки сложности;
при этом исходная оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого в конечное содержимое на конечном языке; и
представление оценки сложности через пользовательский интерфейс;
причем используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
2. Реализуемый компьютером процесс по п.1, дополнительно содержащий применение используемой в машинном обучении основанной на лингвистическом предсказании модели для идентификации одного или более элементов произвольного исходного содержимого, которые повышают предсказанную исходную оценку сложности.
3. Реализуемый компьютером процесс по п.1 или 2, дополнительно содержащий автоматическую идентификацию одного или более предложенных изменений к исходному содержимому, которые понижают предсказанную оценку сложности.
4. Реализуемый компьютером процесс по п.1, или 2, или 3, в котором пользовательский интерфейс предоставляет возможность редактирования одного или более элементов произвольного исходного содержимого для понижения оценки сложности.
5. Реализуемый компьютером процесс по п.1, или 2, или 3, или 4, в котором пользовательский интерфейс предоставляет в реальном времени оценивание сложности произвольного исходного содержимого при вводе, создании или редактировании пользователем произвольного исходного содержимого через пользовательский интерфейс.
6. Реализуемый компьютером процесс по п.1, в котором пользовательский интерфейс предоставляет возможность выбора любого из или обоих из исходного языка и конечного языка из множества доступных пар исходного и конечного языков, для которых были созданы одна или более используемых в машинном обучении основанных на лингвистическом предсказании моделей.
7. Реализуемый компьютером процесс по п.1, дополнительно содержащий:
предсказание исходных оценок сложности для множества произвольных исходных материалов или ресурсов; и
применение оценок сложности для приоритезации множества произвольных исходных материалов или ресурсов в порядке сложности.
8. Система, содержащая
вычислительное устройство общего назначения; и
компьютерную программу, содержащую программные модули, исполняемые вычислительным устройством, причем вычислительное устройство управляется программными модулями компьютерной программы для:
ввода произвольного исходного содержимого на исходном языке через пользовательский интерфейс;
идентификации конечного языка, через пользовательский интерфейс, на который должно быть локализовано произвольное исходное содержимое;
извлечения множества признаков из произвольного исходного содержимого;
применения используемой в машинном обучении основанной на лингвистическом предсказании модели к извлеченным признакам для связывания оценки сложности с произвольным исходным содержимым, причем упомянутая оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого на конечный язык; и
представления оценки сложности через пользовательский интерфейс;
при этом используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
9. Считываемый компьютером носитель, имеющий сохраненные на себе исполняемые компьютером команды, причем упомянутые команды предписывают вычислительному устройству исполнять способ, содержащий этапы, на которых:
принимают ввод произвольного исходного содержимого на исходном языке через пользовательский интерфейс;
идентифицируют конечный язык, через пользовательский интерфейс, на который должно быть локализовано произвольное исходное содержимое;
извлекают множество признаков из произвольного исходного содержимого во время ввода произвольного исходного содержимого;
применяют используемую в машинном обучении основанную на лингвистическом предсказании модель к извлеченным признакам во время ввода произвольного исходного содержимого, и связывают оценку сложности с произвольным исходным содержимым в реальном времени во время ввода произвольного исходного содержимого; и
причем оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого на конечный язык; и
представляют оценку сложности через пользовательский интерфейс в реальном времени во время ввода произвольного исходного содержимого;
причем используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
10. Система по п.8, дополнительно содержащая применение используемой в машинном обучении основанной на лингвистическом предсказании модели для идентификации одного или более элементов произвольного исходного содержимого, которые повышают предсказанную оценку сложности.
11. Система по п.8 или 10, дополнительно содержащая автоматическое представление одного или более предложенных изменений к произвольному исходному содержимому, которые понижают предсказанную оценку сложности.
12. Система по п.8, дополнительно содержащая предоставление в реальном времени оценивания сложности произвольного исходного содержимого при вводе произвольного исходного содержимого через пользовательский интерфейс.
13. Считываемый компьютером носитель по п.9, дополнительно содержащий команды для представления, через пользовательский интерфейс, одного или более предложенных изменений к произвольному исходному содержимому, которые понижают предсказанную оценку сложности.
14. Считываемый компьютером носитель по п.9, дополнительно содержащий команды для:
предсказания исходных оценок сложности для множества произвольных исходных содержимых; и
применения оценок сложности для приоритезации множества произвольных исходных содержимых в порядке сложности.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/563,029 US20160162473A1 (en) | 2014-12-08 | 2014-12-08 | Localization complexity of arbitrary language assets and resources |
US14/563,029 | 2014-12-08 | ||
PCT/US2015/062872 WO2016094096A1 (en) | 2014-12-08 | 2015-11-30 | Localization complexity of arbitrary language assets and resources |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2017119853A true RU2017119853A (ru) | 2018-12-07 |
RU2017119853A3 RU2017119853A3 (ru) | 2019-06-17 |
Family
ID=55025349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017119853A RU2017119853A (ru) | 2014-12-08 | 2015-11-30 | Сложность локализации произвольных языковых материалов и ресурсов |
Country Status (11)
Country | Link |
---|---|
US (1) | US20160162473A1 (ru) |
EP (1) | EP3230896B1 (ru) |
JP (1) | JP2017539042A (ru) |
KR (1) | KR20170094191A (ru) |
CN (1) | CN107003998A (ru) |
AU (1) | AU2015360997A1 (ru) |
BR (1) | BR112017010225A2 (ru) |
CA (1) | CA2967977A1 (ru) |
MX (1) | MX2017007364A (ru) |
RU (1) | RU2017119853A (ru) |
WO (1) | WO2016094096A1 (ru) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities |
US10949904B2 (en) * | 2014-10-04 | 2021-03-16 | Proz.Com | Knowledgebase with work products of service providers and processing thereof |
US9864744B2 (en) | 2014-12-03 | 2018-01-09 | Facebook, Inc. | Mining multi-lingual data |
JP6635049B2 (ja) * | 2014-12-26 | 2020-01-22 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9830386B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Determining trending topics in social media |
US9830404B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Analyzing language dependency structures |
US10067936B2 (en) | 2014-12-30 | 2018-09-04 | Facebook, Inc. | Machine translation output reranking |
US9477652B2 (en) | 2015-02-13 | 2016-10-25 | Facebook, Inc. | Machine learning dialect identification |
US9734142B2 (en) * | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
US10185713B1 (en) * | 2015-09-28 | 2019-01-22 | Amazon Technologies, Inc. | Optimized statistical machine translation system with rapid adaptation capability |
US10268684B1 (en) | 2015-09-28 | 2019-04-23 | Amazon Technologies, Inc. | Optimized statistical machine translation system with rapid adaptation capability |
US10133738B2 (en) | 2015-12-14 | 2018-11-20 | Facebook, Inc. | Translation confidence scores |
US9734143B2 (en) | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
US10002125B2 (en) | 2015-12-28 | 2018-06-19 | Facebook, Inc. | Language model personalization |
US9747283B2 (en) | 2015-12-28 | 2017-08-29 | Facebook, Inc. | Predicting future translations |
US9805029B2 (en) | 2015-12-28 | 2017-10-31 | Facebook, Inc. | Predicting future translations |
US9558182B1 (en) * | 2016-01-08 | 2017-01-31 | International Business Machines Corporation | Smart terminology marker system for a language translation system |
US11727198B2 (en) * | 2016-02-01 | 2023-08-15 | Microsoft Technology Licensing, Llc | Enterprise writing assistance |
US9910914B1 (en) * | 2016-05-05 | 2018-03-06 | Thomas H. Cowley | Information retrieval based on semantics |
US10902215B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10902221B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
WO2018089456A1 (en) * | 2016-11-09 | 2018-05-17 | Gamalon, Inc. | Machine learning data analysis system and method |
US10180935B2 (en) | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item |
US10437935B2 (en) * | 2017-04-18 | 2019-10-08 | Salesforce.Com, Inc. | Natural language translation and localization |
CN109325509B (zh) * | 2017-07-31 | 2023-01-17 | 北京国双科技有限公司 | 相似度确定方法及装置 |
US10431203B2 (en) * | 2017-09-05 | 2019-10-01 | International Business Machines Corporation | Machine training for native language and fluency identification |
US10275462B2 (en) * | 2017-09-18 | 2019-04-30 | Sap Se | Automatic translation of string collections |
US10380249B2 (en) | 2017-10-02 | 2019-08-13 | Facebook, Inc. | Predicting future trending topics |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11157704B2 (en) * | 2018-06-18 | 2021-10-26 | DataChat.ai | Constrained natural language processing |
US11048885B2 (en) * | 2018-09-25 | 2021-06-29 | International Business Machines Corporation | Cognitive translation service integrated with context-sensitive derivations for determining program-integrated information relationships |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11790245B2 (en) | 2019-01-22 | 2023-10-17 | International Business Machines Corporation | Cognitive machine learning for semantic network |
US10789266B2 (en) | 2019-02-08 | 2020-09-29 | Innovaccer Inc. | System and method for extraction and conversion of electronic health information for training a computerized data model for algorithmic detection of non-linearity in a data |
US10706045B1 (en) * | 2019-02-11 | 2020-07-07 | Innovaccer Inc. | Natural language querying of a data lake using contextualized knowledge bases |
US11544333B2 (en) * | 2019-08-26 | 2023-01-03 | Adobe Inc. | Analytics system onboarding of web content |
US10789461B1 (en) | 2019-10-24 | 2020-09-29 | Innovaccer Inc. | Automated systems and methods for textual extraction of relevant data elements from an electronic clinical document |
CN111209363B (zh) * | 2019-12-25 | 2024-02-09 | 华为技术有限公司 | 语料数据处理方法、装置、服务器和存储介质 |
WO2021232175A1 (en) * | 2020-05-16 | 2021-11-25 | Citrix Systems, Inc. | Input method language determination |
FR3110740A1 (fr) | 2020-05-20 | 2021-11-26 | Seed-Up | Procédé de conversion automatique de fichiers numériques |
US11226858B1 (en) * | 2020-12-24 | 2022-01-18 | Salesforce.Com, Inc. | Root cause analysis of logs generated by execution of a system |
US20220334709A1 (en) | 2021-04-14 | 2022-10-20 | DataChat.ai | User interface for data analytics systems |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285978B1 (en) * | 1998-09-24 | 2001-09-04 | International Business Machines Corporation | System and method for estimating accuracy of an automatic natural language translation |
US7215434B1 (en) * | 1999-10-29 | 2007-05-08 | Oce-Technologies B.V. | Automated scan processing |
US8886517B2 (en) * | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
US7752501B2 (en) * | 2006-07-27 | 2010-07-06 | International Business Machines Corporation | Dynamic generation and implementation of globalization verification testing for user interface controls |
US8387024B2 (en) * | 2007-04-18 | 2013-02-26 | Xerox Corporation | Multilingual software testing tool |
CN102650987A (zh) * | 2011-02-25 | 2012-08-29 | 北京百度网讯科技有限公司 | 一种基于源语言复述资源的机器翻译方法及装置 |
US9122673B2 (en) * | 2012-03-07 | 2015-09-01 | International Business Machines Corporation | Domain specific natural language normalization |
US8880445B2 (en) * | 2012-04-20 | 2014-11-04 | Unbound Concepts, Inc. | Method and apparatus for performing dynamic textual complexity analysis using machine learning artificial intelligence |
-
2014
- 2014-12-08 US US14/563,029 patent/US20160162473A1/en not_active Abandoned
-
2015
- 2015-11-30 RU RU2017119853A patent/RU2017119853A/ru not_active Application Discontinuation
- 2015-11-30 EP EP15816945.8A patent/EP3230896B1/en not_active Not-in-force
- 2015-11-30 AU AU2015360997A patent/AU2015360997A1/en not_active Abandoned
- 2015-11-30 CA CA2967977A patent/CA2967977A1/en not_active Abandoned
- 2015-11-30 BR BR112017010225A patent/BR112017010225A2/pt not_active Application Discontinuation
- 2015-11-30 KR KR1020177015617A patent/KR20170094191A/ko unknown
- 2015-11-30 WO PCT/US2015/062872 patent/WO2016094096A1/en active Application Filing
- 2015-11-30 MX MX2017007364A patent/MX2017007364A/es unknown
- 2015-11-30 JP JP2017548358A patent/JP2017539042A/ja active Pending
- 2015-11-30 CN CN201580066869.9A patent/CN107003998A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112017010225A2 (pt) | 2017-12-26 |
WO2016094096A1 (en) | 2016-06-16 |
CN107003998A (zh) | 2017-08-01 |
EP3230896B1 (en) | 2018-09-12 |
RU2017119853A3 (ru) | 2019-06-17 |
CA2967977A1 (en) | 2016-06-16 |
KR20170094191A (ko) | 2017-08-17 |
EP3230896A1 (en) | 2017-10-18 |
MX2017007364A (es) | 2017-09-28 |
US20160162473A1 (en) | 2016-06-09 |
AU2015360997A1 (en) | 2017-05-25 |
JP2017539042A (ja) | 2017-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2017119853A (ru) | Сложность локализации произвольных языковых материалов и ресурсов | |
RU2018119149A (ru) | Определение задач в сообщениях | |
JP2016535335A5 (ru) | ||
RU2017106150A (ru) | Преобразование потоков событий | |
RU2017122991A (ru) | Различение неоднозначных выражений для улучшения взаимодействия с пользователем | |
RU2016144028A (ru) | Человекоподобный робот со способностью автономного функцинирования | |
SG11201900470SA (en) | Modeling method and device for evaluation model | |
WO2017176356A3 (en) | Partitioned machine learning architecture | |
JP2013533527A5 (ru) | ||
SE1851266A1 (sv) | System and method for training object classifier by machine learning | |
MX2016013015A (es) | Métodos y sistemas de administrar un dialogo con un robot. | |
WO2016164680A3 (en) | Automated model development process | |
MX2016014224A (es) | Configuracion de flujos de trabajo en un dispositivo anfitrion que funciona en un sistema de control de procesos. | |
JP2015011722A5 (ru) | ||
PH12018501577A1 (en) | Risk control method and device | |
IN2013MU02853A (ru) | ||
EP3182279A3 (en) | Software-as-a-service reference process extension verification framework | |
RU2015134855A (ru) | Способ и устройство для оптимизации плана распределения ресурсов | |
RU2014127483A (ru) | Входная задержка указателя | |
WO2014137893A3 (en) | Interactive healthcare modeling | |
SG11201903685PA (en) | Method and apparatus for barcode identification | |
MX2022004130A (es) | Algoritmo genetico con logica determinista. | |
EP3629260A3 (en) | System and method for predicting contact center behavior | |
BR112021016447A2 (pt) | Método de previsão de resultado de operação, método de treinamento de modelo de aprendizagem, dispositivo de previsão de resultado de operação e dispositivo de treinamento para modelo de aprendizagem | |
JP5944859B2 (ja) | 評価情報抽出装置、確信度学習装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20191016 |