WO2021134551A1 - 多个机器翻译输出的人类合并和训练 - Google Patents

多个机器翻译输出的人类合并和训练 Download PDF

Info

Publication number
WO2021134551A1
WO2021134551A1 PCT/CN2019/130697 CN2019130697W WO2021134551A1 WO 2021134551 A1 WO2021134551 A1 WO 2021134551A1 CN 2019130697 W CN2019130697 W CN 2019130697W WO 2021134551 A1 WO2021134551 A1 WO 2021134551A1
Authority
WO
WIPO (PCT)
Prior art keywords
rate
speech
result
interval
recognition
Prior art date
Application number
PCT/CN2019/130697
Other languages
English (en)
French (fr)
Inventor
李庆远
Original Assignee
李庆远
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 李庆远 filed Critical 李庆远
Priority to PCT/CN2019/130697 priority Critical patent/WO2021134551A1/zh
Publication of WO2021134551A1 publication Critical patent/WO2021134551A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Definitions

  • the present invention relates to human merging and training of multiple machine translation outputs, and in particular to a human merging of multiple machine translation outputs to improve the translation results, and feedback the results of human merging and modification as materials for machine translation training. Methods.
  • AI Artificial Intelligence
  • machine translation speech recognition, face recognition, AI beauty, AI music recognition, AI voice change, video face change, audio/ Video synthesis, etc.
  • machine translation speech recognition, face recognition, AI beauty, AI music recognition, AI voice change, video face change, audio/ Video synthesis, etc.
  • human Intelligence hereinafter referred to as AI
  • machine translation speech recognition, face recognition, AI beauty, AI music recognition, AI voice change, video face change, audio/ Video synthesis, etc.
  • speech recognition face recognition
  • AI beauty AI music recognition
  • AI voice change video face change
  • audio/ Video synthesis etc.
  • the accuracy of tasks performed by these weak AI applications is not enough to completely replace humans.
  • automatic translation is greatly affected by the quality of training materials.
  • the usability of Chinese to English translation is very high, but English translation is completely incomprehensible. It is because of the same high education, the native Chinese can read English, and the native English is extremely strong.
  • specially trained AI can also be called to identify and highlight the differences between multiple AI translation results, allowing human users to focus on the differences and pros and cons of multiple AI translation results .
  • the translation of natural languages requires cross-language and cross-cultural translation, and the word order may be completely different, and AI is needed to identify the differences.
  • a machine translation result is defaulted, and other machine translations are merged on the basis or modified.
  • a human user mouses over or applies a predefined gesture or touch such as two fingers to define the modification range
  • the difference clause paragraph corresponding to other machine translation results is provided, such as displayed on the floating layer, when The user clicks or touches the difference clause paragraph of a certain machine translation result, that is, replace the difference clause paragraph of the basic machine translation result to the difference clause paragraph of the corresponding machine translation result.
  • a human user clicks on the mouse or applies another predefined gesture or touch it can be manually modified.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

一种提高语音识别率的方法,方法包括:根据统计结果得出最佳识别准确率的语速区间;实时检测输入语音的语速,当语速超出最佳准确率的区间时,调整语速到最佳准确率的区间;输出根据调整后语速语音识别结果。

Description

多个机器翻译输出的人类合并和训练 发明领域
本发明涉及多个机器翻译输出的人类合并和训练,具体涉及一种通过对多个机器翻译输出进行人类合并,改进翻译结果的同时,将人类合并和修改的结果,反馈作为机器翻译训练的材料的方法。
背景技术
智能手机时代,弱人工智能(Artificial Intelligence,以下简称为AI)得到了广泛的应用,譬如机器翻译、语音识别、人脸识别、AI美颜、AI识曲、AI变声、视频换脸、音频/视频合成等。然而,这些弱AI应用执行任务的准确率,还不足以完全取代人类。例如,自动翻译受训练材料质量的影响很大,中译英可用性很高,英译中却完全看不懂,就因为同样受过良好高等教育,汉语母语的都能阅读英语,英语母语的绝大部分一点都不识汉字,这就导致了汉语文献翻译的英语材料,高质量翻译的数量要远高于英语文献翻译的汉语材料,而英语翻译到汉语,主要为畅销书。
发明概述
可以设想同时调用多种机器翻译,比如百度翻译和谷歌翻译,将多个相应的输出结果展示给用户,再由人类用户逐句挑选最好的子结果,最后将人类用户的工作成果反馈作为AI训练的材料。
为提高人类用户合并多个AI翻译结果的效率,也可调用专门训练的AI识别和高亮显示多个AI翻译结果之间的差异,让人类用户专注于多个AI翻译结果的差异和优劣。而对自然语言进行翻译需要跨语言、跨文化,语序可能完全不同,需要AI来识别其中的差异。我们可以分隔符为界,将翻译结果分成若干子句,根据输入结果的语序,来判定需要比较差异的子句组,然后用专门训练的AI识别和高亮显示这些差异。
然而,应当理解,本发明内容可能不包含本发明的所有方面和实施例该发明内容并不意味着以任何方式进行限制或限制,并且本文公开的本发明将被下列之一理解:本领域普通技术人员包括对其的明显改进和修改。
具体实施方式
现在将在下文中更充分地描述本发明。然而,本发明可以以许多不同的形式实施,并且不应被解释为限于本文所阐述的实施例。但愿,提供这些实施例使得本公开将是彻底和完整的,并且将向本领域技术人员充分地传达本发明的范围。
应当理解,在不脱离所附权利要求书中阐述的精神和范围的情况下,可以对元件的功能和布置进行各种改变。因此,实施例是本发明的示例或实现,而不是唯一的实现。各种出现“一个实施例”,“实施例”或“一些实施例”不一定都指代相同的实施例。虽然可以在单个实施例的上下文中描述本发明的各种特征,但是特征也可以单独地或以任何合适的组合提供。相反的,尽管为了清楚起见,本文中可以在单独的实施例的上下文中描述本发明,但是本发明也可以在单个实施例或实施例的任何组合中实现。
除非另有定义,本文使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员通常理解的相同的含义。将进一步理解的是,诸如在通常使用的字典中定义的那些术语应当被解释为具有与它们在相关技术和本公开的上下文中的含义一致的含义,并且将不被解释为理想化的或过度正式的意义,除非本文中明确地这样定义。
参考术语如“左”、“右”、“上”、“下”、“前”和“后”旨在用于在相对于描绘实施例中的具体特征,结构或元件的取向本发明的实施例。显然,关于设备的实际使用的这种方向性术语没有特定的含义,因为设备可以由用户或多个用户在多个方向中使用。
由人类用户自己选择,或根据大量人类用户选择的统计结果,默认一个机器翻译结果,在其基础上合并其它机器翻译,或进行修改。当人类用户鼠标悬停或施加预先定义的手势或触碰(比如双指定义修改范围)高亮的差异时,即提供其他机器翻译结果对应的差异子句段落,比如显示于悬浮图层,当用户点击或触碰某一个机器翻译结果的差异子句段落,即替换基础机器翻译结果的差异子句段落,到对应机器翻译结果的差异子句段落。当人类用户鼠标点击或施加预先定义的另一种手势或触碰,则可手工修改。
以上描述仅是本发明的实施例,并不意在限制本发明的范围。根据本公开的权利要求书和说明书的各种变化和修改仍在所要求保护的发明的范围内。此外,每个实施例和权利要求书未必包含了所公开的所有优点或特可收紧机械夹性。此外,摘要和标题仅用于便于搜索专利文献,并且不旨在以任何方式限制所要求保护的发明的范围。

Claims (3)

  1. 一种提高语音识别率的输入法,包含了:
    α.根据统计结果得出最佳识别准确率的语速区间;
    β.实时检测输入语音的语速,当语速超出所述最佳准确率的区间,调整语速到所述最佳准确率的区间;
    γ.输出根据调整后语速语音识别结果。
  2. 一种提高语音识别率的输入法,包含了:
    α.根据统计结果得出最佳识别准确率的语速区间;
    β.实时检测输入语音的语速,当语速超出所述最佳准确率的区间,调整语速到所述最佳准确率的区间;
    γ.在调整语速的同时,根据原始语速语音识别,并输出结果一;
    δ.输出根据调整后语速语音识别结果,标记为结果二;
    ε.高亮显示标出所述结果一、所述结果二之间的差异;
    στ.由用户选择准确的结果,将所述结果一、所述结果二和用户的选择作为所述输入法人工智能训练素材。
  3. 一种提高语音识别率的输入法,包含了:
    α.根据统计结果得出最佳识别准确率的语速区间;
    β.实时检测输入语音的语速,当语速超出所述最佳准确率的区间,调整语速到所述最佳准确率的区间,并在所述最佳准确率的区间选择多个语速同时进行多次识别;
    γ.在调整语速的同时,根据原始语速语音识别,并输出结果一;
    δ.输出根据调整后语速语音识别结果,标记为结果二、结果三…;
    ε.高亮显示标出所述结果一、所述结果二、结果三…之间的差异;
    στ.由用户选择准确的结果,将所述结果一、所述结果二、所述结果三…和用户的选择作为所述输入法人工智能训练素材。
PCT/CN2019/130697 2019-12-31 2019-12-31 多个机器翻译输出的人类合并和训练 WO2021134551A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/130697 WO2021134551A1 (zh) 2019-12-31 2019-12-31 多个机器翻译输出的人类合并和训练

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/130697 WO2021134551A1 (zh) 2019-12-31 2019-12-31 多个机器翻译输出的人类合并和训练

Publications (1)

Publication Number Publication Date
WO2021134551A1 true WO2021134551A1 (zh) 2021-07-08

Family

ID=76685800

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/130697 WO2021134551A1 (zh) 2019-12-31 2019-12-31 多个机器翻译输出的人类合并和训练

Country Status (1)

Country Link
WO (1) WO2021134551A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543076A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 用于语音输入法的语音训练方法及相应的系统
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107895572A (zh) * 2016-09-30 2018-04-10 法乐第(北京)网络科技有限公司 一种语音识别训练方法及系统
US20180166071A1 (en) * 2016-12-08 2018-06-14 Electronics And Telecommunications Research Institute Method of automatically classifying speaking rate and speech recognition system using the same
CN109979474A (zh) * 2019-03-01 2019-07-05 珠海格力电器股份有限公司 语音设备及其用户语速修正方法、装置和存储介质
JP2019184631A (ja) * 2018-04-02 2019-10-24 アルパイン株式会社 音声認識システム及びコンピュータプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543076A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 用于语音输入法的语音训练方法及相应的系统
CN107895572A (zh) * 2016-09-30 2018-04-10 法乐第(北京)网络科技有限公司 一种语音识别训练方法及系统
US20180166071A1 (en) * 2016-12-08 2018-06-14 Electronics And Telecommunications Research Institute Method of automatically classifying speaking rate and speech recognition system using the same
CN107767869A (zh) * 2017-09-26 2018-03-06 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
JP2019184631A (ja) * 2018-04-02 2019-10-24 アルパイン株式会社 音声認識システム及びコンピュータプログラム
CN109979474A (zh) * 2019-03-01 2019-07-05 珠海格力电器股份有限公司 语音设备及其用户语速修正方法、装置和存储介质

Similar Documents

Publication Publication Date Title
Russo et al. Making way in corpus-based interpreting studies
US20110184723A1 (en) Phonetic suggestion engine
WO2016155144A1 (zh) 翻译信息的提供方法及系统
Korchagina Normalizing medieval german texts: from rules to deep learning
US10055404B2 (en) Translation apparatus
Napoles et al. Paraphrastic sentence compression with a character-based metric: Tightening without deletion
Svantesson et al. Dictionary of Kammu Yùan language and culture
WO2021134551A1 (zh) 多个机器翻译输出的人类合并和训练
US20150088486A1 (en) Written language learning using an enhanced input method editor (ime)
WO2021134549A1 (zh) 多个人工智能输出的人类合并和训练
WO2021134550A1 (zh) 多个语音识别输出的人类合并和训练
Ramakrishnan et al. Transliteration of Indic languages to Kannada with a user-friendly interface
CN106233373B (zh) 信息提供装置及信息提供方法
Wuebker et al. Comparison of data selection techniques for the translation of video lectures
Mukesh et al. Statistical Machine Translation
TW201415256A (zh) 提供外語詞組以輔助外語文章撰寫的系統及其方法
Lin A new tool for concordancing the Web as a multimodal corpus
Storme Closed-syllable vowel laxing: A contrast enhancement strategy
Yuan An Adaptive Chinese Word Segmentation Method
KR20170108621A (ko) 단일언어 코퍼스를 이용한 통계 및 학습기반 번역 장치
이고운 Use of acoustic cues in the perception of complex syllable structure
CN109766545A (zh) 基于多特征融合的文本相似度计算方法
Wijaya et al. INDONESIAN TO ENGLISH SINGABLE TRANSLATIONS BY LOCAL AND FOREIGN TRANSLATORS
Liu et al. Production and perception of English phonemes for Chinese college students
Yeung et al. Character Set Construction for Chinese Language Learning

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19958175

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19958175

Country of ref document: EP

Kind code of ref document: A1