RU2017119853A - Сложность локализации произвольных языковых материалов и ресурсов - Google Patents

Сложность локализации произвольных языковых материалов и ресурсов Download PDF

Info

Publication number
RU2017119853A
RU2017119853A RU2017119853A RU2017119853A RU2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A RU 2017119853 A RU2017119853 A RU 2017119853A
Authority
RU
Russia
Prior art keywords
complexity
source content
arbitrary
user interface
content
Prior art date
Application number
RU2017119853A
Other languages
English (en)
Other versions
RU2017119853A3 (ru
Inventor
Джеймс КОГЛИ
Деклан ГРОУВЗ
Майкл Азиэл ДЖОУНС
Майкл Рейд ХЕДЛИ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2017119853A publication Critical patent/RU2017119853A/ru
Publication of RU2017119853A3 publication Critical patent/RU2017119853A3/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • User Interface Of Digital Computer (AREA)

Claims (39)

1. Реализуемый компьютером процесс, содержащий
прием произвольного исходного содержимого, содержащего последовательность из одного или более слов на исходном языке;
извлечение множества признаков из исходного содержимого;
применение используемой в машинном обучении основанной на лингвистическом предсказании модели к признакам для предсказания исходной оценки сложности;
при этом исходная оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого в конечное содержимое на конечном языке; и
представление оценки сложности через пользовательский интерфейс;
причем используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
2. Реализуемый компьютером процесс по п.1, дополнительно содержащий применение используемой в машинном обучении основанной на лингвистическом предсказании модели для идентификации одного или более элементов произвольного исходного содержимого, которые повышают предсказанную исходную оценку сложности.
3. Реализуемый компьютером процесс по п.1 или 2, дополнительно содержащий автоматическую идентификацию одного или более предложенных изменений к исходному содержимому, которые понижают предсказанную оценку сложности.
4. Реализуемый компьютером процесс по п.1, или 2, или 3, в котором пользовательский интерфейс предоставляет возможность редактирования одного или более элементов произвольного исходного содержимого для понижения оценки сложности.
5. Реализуемый компьютером процесс по п.1, или 2, или 3, или 4, в котором пользовательский интерфейс предоставляет в реальном времени оценивание сложности произвольного исходного содержимого при вводе, создании или редактировании пользователем произвольного исходного содержимого через пользовательский интерфейс.
6. Реализуемый компьютером процесс по п.1, в котором пользовательский интерфейс предоставляет возможность выбора любого из или обоих из исходного языка и конечного языка из множества доступных пар исходного и конечного языков, для которых были созданы одна или более используемых в машинном обучении основанных на лингвистическом предсказании моделей.
7. Реализуемый компьютером процесс по п.1, дополнительно содержащий:
предсказание исходных оценок сложности для множества произвольных исходных материалов или ресурсов; и
применение оценок сложности для приоритезации множества произвольных исходных материалов или ресурсов в порядке сложности.
8. Система, содержащая
вычислительное устройство общего назначения; и
компьютерную программу, содержащую программные модули, исполняемые вычислительным устройством, причем вычислительное устройство управляется программными модулями компьютерной программы для:
ввода произвольного исходного содержимого на исходном языке через пользовательский интерфейс;
идентификации конечного языка, через пользовательский интерфейс, на который должно быть локализовано произвольное исходное содержимое;
извлечения множества признаков из произвольного исходного содержимого;
применения используемой в машинном обучении основанной на лингвистическом предсказании модели к извлеченным признакам для связывания оценки сложности с произвольным исходным содержимым, причем упомянутая оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого на конечный язык; и
представления оценки сложности через пользовательский интерфейс;
при этом используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
9. Считываемый компьютером носитель, имеющий сохраненные на себе исполняемые компьютером команды, причем упомянутые команды предписывают вычислительному устройству исполнять способ, содержащий этапы, на которых:
принимают ввод произвольного исходного содержимого на исходном языке через пользовательский интерфейс;
идентифицируют конечный язык, через пользовательский интерфейс, на который должно быть локализовано произвольное исходное содержимое;
извлекают множество признаков из произвольного исходного содержимого во время ввода произвольного исходного содержимого;
применяют используемую в машинном обучении основанную на лингвистическом предсказании модель к извлеченным признакам во время ввода произвольного исходного содержимого, и связывают оценку сложности с произвольным исходным содержимым в реальном времени во время ввода произвольного исходного содержимого; и
причем оценка сложности представляет собой предсказанный уровень трудности для локализации исходного содержимого на конечный язык; и
представляют оценку сложности через пользовательский интерфейс в реальном времени во время ввода произвольного исходного содержимого;
причем используемая в машинном обучении основанная на лингвистическом предсказании модель обучается на признаках, извлеченных из множества исходных материалов или ресурсов, которые были успешно локализованы на конечный язык, и на количестве раз, когда каждый из множества исходных материалов или ресурсов был локализован на конечный язык до того, как локализация была расценена в качестве приемлемой.
10. Система по п.8, дополнительно содержащая применение используемой в машинном обучении основанной на лингвистическом предсказании модели для идентификации одного или более элементов произвольного исходного содержимого, которые повышают предсказанную оценку сложности.
11. Система по п.8 или 10, дополнительно содержащая автоматическое представление одного или более предложенных изменений к произвольному исходному содержимому, которые понижают предсказанную оценку сложности.
12. Система по п.8, дополнительно содержащая предоставление в реальном времени оценивания сложности произвольного исходного содержимого при вводе произвольного исходного содержимого через пользовательский интерфейс.
13. Считываемый компьютером носитель по п.9, дополнительно содержащий команды для представления, через пользовательский интерфейс, одного или более предложенных изменений к произвольному исходному содержимому, которые понижают предсказанную оценку сложности.
14. Считываемый компьютером носитель по п.9, дополнительно содержащий команды для:
предсказания исходных оценок сложности для множества произвольных исходных содержимых; и
применения оценок сложности для приоритезации множества произвольных исходных содержимых в порядке сложности.
RU2017119853A 2014-12-08 2015-11-30 Сложность локализации произвольных языковых материалов и ресурсов RU2017119853A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/563,029 US20160162473A1 (en) 2014-12-08 2014-12-08 Localization complexity of arbitrary language assets and resources
US14/563,029 2014-12-08
PCT/US2015/062872 WO2016094096A1 (en) 2014-12-08 2015-11-30 Localization complexity of arbitrary language assets and resources

Publications (2)

Publication Number Publication Date
RU2017119853A true RU2017119853A (ru) 2018-12-07
RU2017119853A3 RU2017119853A3 (ru) 2019-06-17

Family

ID=55025349

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017119853A RU2017119853A (ru) 2014-12-08 2015-11-30 Сложность локализации произвольных языковых материалов и ресурсов

Country Status (11)

Country Link
US (1) US20160162473A1 (ru)
EP (1) EP3230896B1 (ru)
JP (1) JP2017539042A (ru)
KR (1) KR20170094191A (ru)
CN (1) CN107003998A (ru)
AU (1) AU2015360997A1 (ru)
BR (1) BR112017010225A2 (ru)
CA (1) CA2967977A1 (ru)
MX (1) MX2017007364A (ru)
RU (1) RU2017119853A (ru)
WO (1) WO2016094096A1 (ru)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US10949904B2 (en) * 2014-10-04 2021-03-16 Proz.Com Knowledgebase with work products of service providers and processing thereof
US9864744B2 (en) 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
JP6635049B2 (ja) * 2014-12-26 2020-01-22 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10185713B1 (en) * 2015-09-28 2019-01-22 Amazon Technologies, Inc. Optimized statistical machine translation system with rapid adaptation capability
US10268684B1 (en) 2015-09-28 2019-04-23 Amazon Technologies, Inc. Optimized statistical machine translation system with rapid adaptation capability
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US10002125B2 (en) 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US9558182B1 (en) * 2016-01-08 2017-01-31 International Business Machines Corporation Smart terminology marker system for a language translation system
US11727198B2 (en) * 2016-02-01 2023-08-15 Microsoft Technology Licensing, Llc Enterprise writing assistance
US9910914B1 (en) * 2016-05-05 2018-03-06 Thomas H. Cowley Information retrieval based on semantics
US10902215B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
US10902221B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
WO2018089456A1 (en) * 2016-11-09 2018-05-17 Gamalon, Inc. Machine learning data analysis system and method
US10180935B2 (en) 2016-12-30 2019-01-15 Facebook, Inc. Identifying multiple languages in a content item
US10437935B2 (en) * 2017-04-18 2019-10-08 Salesforce.Com, Inc. Natural language translation and localization
CN109325509B (zh) * 2017-07-31 2023-01-17 北京国双科技有限公司 相似度确定方法及装置
US10431203B2 (en) * 2017-09-05 2019-10-01 International Business Machines Corporation Machine training for native language and fluency identification
US10275462B2 (en) * 2017-09-18 2019-04-30 Sap Se Automatic translation of string collections
US10380249B2 (en) 2017-10-02 2019-08-13 Facebook, Inc. Predicting future trending topics
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11157704B2 (en) * 2018-06-18 2021-10-26 DataChat.ai Constrained natural language processing
US11048885B2 (en) * 2018-09-25 2021-06-29 International Business Machines Corporation Cognitive translation service integrated with context-sensitive derivations for determining program-integrated information relationships
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
US11790245B2 (en) 2019-01-22 2023-10-17 International Business Machines Corporation Cognitive machine learning for semantic network
US10789266B2 (en) 2019-02-08 2020-09-29 Innovaccer Inc. System and method for extraction and conversion of electronic health information for training a computerized data model for algorithmic detection of non-linearity in a data
US10706045B1 (en) * 2019-02-11 2020-07-07 Innovaccer Inc. Natural language querying of a data lake using contextualized knowledge bases
US11544333B2 (en) * 2019-08-26 2023-01-03 Adobe Inc. Analytics system onboarding of web content
US10789461B1 (en) 2019-10-24 2020-09-29 Innovaccer Inc. Automated systems and methods for textual extraction of relevant data elements from an electronic clinical document
CN111209363B (zh) * 2019-12-25 2024-02-09 华为技术有限公司 语料数据处理方法、装置、服务器和存储介质
WO2021232175A1 (en) * 2020-05-16 2021-11-25 Citrix Systems, Inc. Input method language determination
FR3110740A1 (fr) 2020-05-20 2021-11-26 Seed-Up Procédé de conversion automatique de fichiers numériques
US11226858B1 (en) * 2020-12-24 2022-01-18 Salesforce.Com, Inc. Root cause analysis of logs generated by execution of a system
US20220334709A1 (en) 2021-04-14 2022-10-20 DataChat.ai User interface for data analytics systems

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285978B1 (en) * 1998-09-24 2001-09-04 International Business Machines Corporation System and method for estimating accuracy of an automatic natural language translation
US7215434B1 (en) * 1999-10-29 2007-05-08 Oce-Technologies B.V. Automated scan processing
US8886517B2 (en) * 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
US7752501B2 (en) * 2006-07-27 2010-07-06 International Business Machines Corporation Dynamic generation and implementation of globalization verification testing for user interface controls
US8387024B2 (en) * 2007-04-18 2013-02-26 Xerox Corporation Multilingual software testing tool
CN102650987A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于源语言复述资源的机器翻译方法及装置
US9122673B2 (en) * 2012-03-07 2015-09-01 International Business Machines Corporation Domain specific natural language normalization
US8880445B2 (en) * 2012-04-20 2014-11-04 Unbound Concepts, Inc. Method and apparatus for performing dynamic textual complexity analysis using machine learning artificial intelligence

Also Published As

Publication number Publication date
BR112017010225A2 (pt) 2017-12-26
WO2016094096A1 (en) 2016-06-16
CN107003998A (zh) 2017-08-01
EP3230896B1 (en) 2018-09-12
RU2017119853A3 (ru) 2019-06-17
CA2967977A1 (en) 2016-06-16
KR20170094191A (ko) 2017-08-17
EP3230896A1 (en) 2017-10-18
MX2017007364A (es) 2017-09-28
US20160162473A1 (en) 2016-06-09
AU2015360997A1 (en) 2017-05-25
JP2017539042A (ja) 2017-12-28

Similar Documents

Publication Publication Date Title
RU2017119853A (ru) Сложность локализации произвольных языковых материалов и ресурсов
RU2018119149A (ru) Определение задач в сообщениях
JP2016535335A5 (ru)
RU2017106150A (ru) Преобразование потоков событий
RU2017122991A (ru) Различение неоднозначных выражений для улучшения взаимодействия с пользователем
RU2016144028A (ru) Человекоподобный робот со способностью автономного функцинирования
SG11201900470SA (en) Modeling method and device for evaluation model
WO2017176356A3 (en) Partitioned machine learning architecture
JP2013533527A5 (ru)
SE1851266A1 (sv) System and method for training object classifier by machine learning
MX2016013015A (es) Métodos y sistemas de administrar un dialogo con un robot.
WO2016164680A3 (en) Automated model development process
MX2016014224A (es) Configuracion de flujos de trabajo en un dispositivo anfitrion que funciona en un sistema de control de procesos.
JP2015011722A5 (ru)
PH12018501577A1 (en) Risk control method and device
IN2013MU02853A (ru)
EP3182279A3 (en) Software-as-a-service reference process extension verification framework
RU2015134855A (ru) Способ и устройство для оптимизации плана распределения ресурсов
RU2014127483A (ru) Входная задержка указателя
WO2014137893A3 (en) Interactive healthcare modeling
SG11201903685PA (en) Method and apparatus for barcode identification
MX2022004130A (es) Algoritmo genetico con logica determinista.
EP3629260A3 (en) System and method for predicting contact center behavior
BR112021016447A2 (pt) Método de previsão de resultado de operação, método de treinamento de modelo de aprendizagem, dispositivo de previsão de resultado de operação e dispositivo de treinamento para modelo de aprendizagem
JP5944859B2 (ja) 評価情報抽出装置、確信度学習装置、方法、及びプログラム

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20191016