CN109657252A - 信息处理方法、装置、电子设备及计算机可读存储介质 - Google Patents

信息处理方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109657252A
CN109657252A CN201811593116.5A CN201811593116A CN109657252A CN 109657252 A CN109657252 A CN 109657252A CN 201811593116 A CN201811593116 A CN 201811593116A CN 109657252 A CN109657252 A CN 109657252A
Authority
CN
China
Prior art keywords
information
translated
translation
preset
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811593116.5A
Other languages
English (en)
Inventor
刘炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Microlive Vision Technology Co Ltd
Original Assignee
Beijing Microlive Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Microlive Vision Technology Co Ltd filed Critical Beijing Microlive Vision Technology Co Ltd
Priority to CN201811593116.5A priority Critical patent/CN109657252A/zh
Publication of CN109657252A publication Critical patent/CN109657252A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本公开涉及应用软件技术领域,特别是涉及一种信息处理方法、装置、电子设备及计算机可读存储介质,该信息处理方法包括:接收待翻译信息;对所述待翻译信息进行分析,确定所述待翻译信息是否满足第一预设条件;当所述待翻译信息满足第一预设条件时,基于预设的翻译模型对所述待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验。

Description

信息处理方法、装置、电子设备及计算机可读存储介质
技术领域
本公开涉及应用软件技术领域,特别是涉及一种信息处理方法、装置、电子设备及计算机可读存储介质。
背景技术
现有的文本翻译过程中,对于用户输入的文本,可以根据用户所选择的翻译语言或默认选择翻译语言,进行自动翻译或人工翻译,翻译处理之后输出相应的翻译结果。
虽然自动翻译输出的翻译结果迅速,但是,其翻译相对死板,输出的翻译结果往往直译较多,并不会考虑某个词在语句中的用法,致使输出的翻译结果词不达意、不够连贯、不够通顺。而对于人工翻译,虽然其输出的翻译结果相对准确,且语句通顺连贯,但其翻译过程耗时较长,且如果待翻译的文本较大时,有可能会出现遗漏或翻译错误的地方。
所以,在保证翻译速度的情况下,如何得到较为准确的翻译结果成为了当前亟待解决的技术问题。
发明内容
本公开提供了一种信息处理方法、装置、电子设备及计算机可读存储介质,以实现在保证翻译速度的情况下,得到较为准确的翻译结果。
第一方面,提供了一种信息处理方法,包括:
接收待翻译信息;
对所述待翻译信息进行分析,确定所述待翻译信息是否满足第一预设条件;
当所述待翻译信息满足第一预设条件时,基于预设的翻译模型对所述待翻译信息进行翻译,得到对应的翻译结果。
在一个可能地实现方式中,对所述待翻译信息进行分析之前,还包括:
对所述待翻译信息进行语义识别,得到对应的语义特征信息;
其中,所述待翻译信息包括语音信息或文本信息。
在一个可能地实现方式中,若所述待翻译信息为语音信息时,所述对所述待翻译信息进行语义识别,得到对应的语义特征信息,包括:
对所述语音信息进行特征提取,得到所述语音信息对应的声学特征信息;
对所述声学特征信息进行语义识别,得到对应的语义特征信息。
在一个可能地实现方式中,当所述待翻译信息不满足第一预设条件时,基于预设的语料库对所述待翻译信息中的内容进行调整,以使其满足第一预设条件。
在一个可能地实现方式中,所述第一预设条件用于表征所述待翻译信息中不包含有特定类型信息;
其中,所述特定类型信息包括如下任一项:
成语;
歇后语;
俚语;
俗语;
谚语。
在一个可能地实现方式中,基于预设的翻译模型对所述语义特征信息进行翻译之前,还包括:
获取样本数据;所述样本数据包括待训练的待翻译信息及其对应的标识信息,所述标识信息用于表征待训练的待翻译信息对应的翻译结果;
提取所述样本数据对应的语义特征信息;
基于所述样本数据的语义特征信息进行模型训练,得到所述翻译模型。
在一个可能地实现方式中,还包括:
当满足第二预设条件时,对所述翻译模型的样本数据进行更新;
其中,所述对所述翻译模型的样本数据进行更新,包括:
获取用于更新的待翻译信息;
基于用于更新的待翻译信息对所述翻译模型中的样本数据进行在线更新。
在一个可能地实现方式中,所述第二预设条件包括如下任一项:
所述翻译结果与实际结果为不同的结果;
所述翻译结果与实际结果为不同结果的次数满足预设阈值;
预设时间段。
在一个可能地实现方式中,在得到针对所述待翻译信息的翻译结果之后,还包括:
基于所述翻译结果进行校验处理,得到经校验处理后的翻译结果;
显示所述经校验处理后的翻译结果。
第二方面,提供了一种信息处理装置,包括:
接收单元,用于接收待翻译信息;
分析单元,用于对所述待翻译信息进行分析,确定所述待翻译信息是否满足第一预设条件;
第一处理单元,用于当所述待翻译信息满足第一预设条件时,基于预设的翻译模型对所述待翻译信息进行翻译,得到对应的翻译结果。
在一个可能地实现方式中,还包括:
识别单元,用于对所述待翻译信息进行语义识别,得到对应的语义特征信息;
其中,所述待翻译信息包括语音信息或文本信息。
在一个可能地实现方式中,若所述待翻译信息为语音信息时,所述识别单元,用于对所述语音信息进行特征提取,得到所述语音信息对应的声学特征信息;对所述声学特征信息进行语义识别,得到对应的语义特征信息。
在一个可能地实现方式中,第二处理单元,用于当所述待翻译信息不满足第一预设条件时,基于预设的语料库对所述待翻译信息中的内容进行调整,以使其满足第一预设条件。
在一个可能地实现方式中,所述第一预设条件用于表征所述待翻译信息中不包含有特定类型信息;
其中,所述特定类型信息包括如下任一项:
成语;
歇后语;
俚语;
俗语;
谚语。
在一个可能地实现方式中,还包括:
第三处理单元,用于获取样本数据;所述样本数据包括待训练的待翻译信息及其对应的标识信息,所述标识信息用于表征待训练的待翻译信息对应的翻译结果;提取所述样本数据对应的语义特征信息;基于所述样本数据的语义特征信息进行模型训练,得到所述翻译模型。
在一个可能地实现方式中,还包括:
更新单元,用于当满足第二预设条件时,对所述翻译模型的样本数据进行更新;
其中,更新单元,用于具体用于获取用于更新的待翻译信息;基于用于更新的待翻译信息对所述翻译模型中的样本数据进行在线更新。
在一个可能地实现方式中,所述第二预设条件包括如下任一项:
所述翻译结果与实际结果为不同的结果;
所述翻译结果与实际结果为不同结果的次数满足预设阈值;
预设时间段。
在一个可能地实现方式中,还包括:
校验单元,用于基于所述翻译结果进行校验处理,得到经校验处理后的翻译结果;
显示单元,用于显示所述经校验处理后的翻译结果。
第三方面,提供了一种电子设备,包括:处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述的信息处理方法。
第四方面,提供了一种计算机可读存储介质,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机执行上述的信息处理方法。
借由上述技术方案,本公开提供的技术方案至少具有下列优点:
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本公开实施例提供的信息处理方法的流程示意图;
图2为本公开实施例提供的信息处理方法的一种可能实现方式的具体处理流程示意图;
图3为本公开实施例提供的信息处理装置的结构示意图;
图4为本公开实施例提供的信息处理方法的电子设备的结构示意图。
具体实施方式
本公开提供了一种信息处理方法、装置、电子设备及计算机可读存储介质,下面结合附图,对本公开具体实施方式进行详细说明。
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能解释为对本公开的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本公开所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。在本公开中,该电子设备可以是终端设备,也可以是服务器,在本公开中并不做具体限定。
如图1所示,为本公开提供的信息处理方法的流程示意图,该方法包括如下步骤:
步骤S101,接收待翻译信息;
步骤S102,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件;
步骤S103,当待翻译信息满足第一预设条件时,基于预设的翻译模型对待翻译信息进行翻译,得到对应的翻译结果。
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验。
基于上述本公开所提供的技术方案,下面对该技术方案进行详尽阐释,如图2所示,为本公开提供的信息处理方法的一个可能地实现方式的具体处理流程图。
在一个可能地实现方式中,前述步骤S101的处理具体包括下述步骤S201~步骤S202的处理。
步骤S201,接收待翻译信息。
对于本公开,上述接收待翻译信息的处理可以是电子设备直接接收用户输入的待翻译信息,还可以是接收终端的上传请求中携带的用户输入的待翻译信息。该待翻译信息可以包括语音信息或文本信息,其中,文本信息可以是一个词、一段话或者说一篇文本。
其中,当该待翻译信息是语音信息时,电子设备通过其上的麦克风实时获取环境中的声音信号,并将获取到的声音信号进行数模转换以及降噪等处理后,再按照特定格式进行编码,并将编码后的音频数据输入到语音识别的软件模块。
对于本公开,语音识别的软件模块对于实时输入的流式音频数据,按照一定的时间间隔划分为一帧,并提取相应的音频特征。
对于本公开,当该待翻译信息为语音信息时,在步骤S202的处理之前还包括步骤S202’(图中未示出)。
步骤S202’,对语音信息进行特征提取,得到语音信息对应的声学特征信息。
对于本公开,在下述步骤S202中,通过对本步骤中得到的声学特征信息进行语义识别,从而得到对应的语义特征信息。
在一个可能地实现方式中,在对输入的语音信息进行声学特征提取之前,还可以包括:
对输入的语音信息进行预处理。
为了提高系统的鲁棒性,可以对采集到的原始语音信号做前端降噪预处理。例如,首先通过对语音信号执行短时能量和短时过零率分析,将连续的语音信号分割成独立的语音片断和非语音片断。随后通过维纳滤波等技术对语音片断进行语音增强,进一步消除语音信号中的噪音,提高后续系统对该信号的处理能力。
对于本公开,考虑到降噪处理后的语音信号中依然存在大量语音识别无关的冗余信息,直接对其识别将导致运算量增加和识别准确率的下降,为此可以从语音能量信号中提取识别有效的语音特征信息,并存入特征缓存区内,以表征用户的语音信息输入。在一个可能地实现方式中,提取语音信息的声学特征信息可以包括:提取MFCC(Mel FrequencyCepstrum Coefficient,梅尔频率倒谱系数)特征信息。在一个可能地实现方式中,还可以采用PLP
(Perceptual Linear Predictive,感知线性预测系数)特征信息、F-bank(Mel-scale Filter Bank,梅尔标度滤波器组)特征信息、CQCC(Constant Q CepstrumCoefficient,常数Q值倒谱系数)特征信息和LPCC(Linear Prediction CepstrumCoefficient,线性预测倒谱系数)特征信息等,来提取输入的语音信息的特征以表征语音输入。为了避免模糊本公开的要点,在此对已知的语音信号跟踪技术、预处理技术和特征提取技术不再详述。
此外,应该理解,本公开的原始的或经预处理的用户输入的语音信息或其特征标识可以存储在存储器中,并且不限于任何特定的存储格式。
步骤S202,对待翻译信息进行语义识别,得到对应的语义特征信息。
对于本公开,在进行语义识别时,可以通过预先对语义特征进行神经网络训练深度学习过程处理,从而构建出相应的语义识别模块,其中,该神经网络可以为CNN(Convolutional Neural Network,卷积神经网络)、DNN(Deep Neural Network,深层神经网络)或RNN(Recurrent neural Network、循环神经网络)。
在一个可能地实现方式中,前述步骤S102的处理具体包括下述步骤S203的处理。
步骤S203,对待翻译信息进行分析。
对于本公开,在得到待翻译信息对应的语义特征信息后,需要对该语义特征信息进行分析,从而确定该待翻译信息是否满足第一预设条件,即确定该待翻译信息对应的语句中是否包括有特定类型信息,如成语、歇后语、俚语、俗语、谚语等,并在该待翻译信息满足第一预设条件时,转到步骤S204,否则,对该待翻译信息进行调整处理;其中,该第一预设条件用于表征待翻译信息中不包含有上述的特定类型信息。
对于本公开,当该待翻译信息不满足第一预设条件时,基于预设的语料库对待翻译信息中的内容进行调整,以使其满足第一预设条件。如待翻译信息为“在运动场上,运动员们可谓是八仙过海”,其中包括了谚语“八仙过海”,而该谚语所要表达的含义是“各显神通,各有各的本事”,所以需要将该谚语先转换成其所要表达的含义。
在一个可能地实现方式中,前述步骤S103的处理具体包括下述步骤S204的处理。
步骤S204,基于预设的翻译模型对待翻译信息进行翻译,得到对应的翻译结果。
本步骤中,基于预先确定的该待翻译信息所期望的目标翻译语言,通过预设的翻译模型对该待翻译信息进行相应的翻译,从而确定该待翻译信息所对应的翻译结果。
对于本公开,例如,接收到的待翻译信息为“你好,很高兴认识你”,经前述的语义识别处理后,并结合预先确定的目标翻译语言为英语,通过预设的翻译模型对该语义识别处理得到的语义特征信息进行对应的翻译处理,确定该待翻译信息对应的翻译结果为“Hello,nice to meet you”。
在一个可能地实现方式中,在该电子设备对该待翻译信息进行翻译处理之前,需要先进行用于待翻译信息处理的翻译模型的训练,其训练过程可以是在电子设备中进行,利用大量的样本数据不断地循环往复训练,能够使得在利用翻译模型进行待翻译信息处理时所得到的翻译结果更加趋于准确,从而提升处理的准确度。
对于本公开,该翻译模型的训练过程,可以包括如下处理:
1、获取样本数据
该样本数据可以包括待训练的待翻译信息及其对应的标识信息;其中,该标识信息用于表征待训练的待翻译信息对应的翻译结果。每一条标识信息均是针对其对应的每一条待翻译信息通过人为分析进行标注的。如用户说出的语音信息是“很高兴认识你”,在人为分析标注时,其标识信息为“Nice to meet you”。
对于本公开,在进行翻译模型训练之前,会先获取大量的样本数据,该样本数据可以是人为输入的,也可以是从本地存储中提取得到的,还可以通过向服务器发送样本数据的获取请求来得到的,当然,该样本数据的获取途径并不仅限于此。
2、翻译模型的训练过程
对于本公开,将获取到的大量样本数据依次输入到待训练的模型中,通过大量地训练,不断完善该模型,从而得到该翻译模型,通过前述的大量训练也使得该翻译模型在对类似待翻译信息的处理时能够愈发精确、准确。
对于本公开,对于得到的翻译结果,无法做到每一次都是准确的,可能会出现翻译结果与实际结果不同的情形发生,如待翻译信息是“I like many cities,like City A、City B and City C”,翻译结果是“我喜欢很多城市,喜欢A城市、B城市和C城市”,但实际结果是“我喜欢很多城市,像A城市、B城市和C城市”,所以为了避免该种类似情况的发生,需要对该翻译模型不断的训练,以完善优化,基于此,需要在满足第二预设条件时对该翻译模型的样本数据进行更新。
其中,该第二预设条件可以包括:
P1、实时进行该翻译模型的样本数据更新。
一旦确定翻译结果与实际结果为不同的结果时,说明该翻译结果对应的待翻译信息有可能未存储于该翻译模型的样本数据中,则直接利用该翻译结果对应的待翻译信息进行该翻译模型的样本数据更新。
P2、每隔一段时间进行该翻译模型的样本数据更新。
此时并不关心翻译结果与实际结果是否相同,只要达到了预设时间段就利用这段时间中获取到的待翻译信息进行该翻译模型的样本数据更新,从而丰富扩大该翻译模型的样本数据库。
其中,该预设时间段可以是提前预先配置好的。
P3、在翻译结果与实际结果为不同结果的次数达到一定阈值时进行该翻译模型的样本数据更新,从而丰富扩大该翻译模型的样本数据库。
对于每一次翻译结果与实际结果为不同结果的情况均进行记录,当出现该情况的次数达到预设阈值时,利用出现这种情况的每一个处理结果所对应的待翻译信息进行该翻译模型的样本数据更新,从而丰富扩大该翻译模型的样本数据库。
对于本公开,通过获取用于更新的待翻译信息,并基于该获取的待翻译信息来对该翻译模型中的样本数据进行在线更新。其中,该用于更新的待翻译信息可以是上述提及的与实际结果为不同的结果的翻译结果对应的待翻译信息,还可以是一段时间内的接收到的所有待翻译信息。
对于本公开,在基于该获取的待翻译信息来对翻译模型中的样本数据进行在线更新时,可以分成两种情形:
情形一、若电子设备为终端设备时,上述在线更新的过程包括:
1、基于本地存储的待翻译信息来对该翻译模型中的样本数据进行在线更新。
在该处理过程中,该用于更新的待翻译信息可以是存储在本地存储中的,当需要进行更新时,直接在本地存储中提取相应的样本数据进行在线的更新处理。
2、基于服务器发送的用于更新的样本数据来对该翻译模型中的样本数据进行在线更新。
在该处理过程中,通过接收服务器发送的针对该翻译模型的用于更新的样本数据来对该翻译模型进行更新。
情形二、若电子设备为服务器时,上述在线更新的过程包括:
1、基于本地存储的待翻译信息来对该翻译模型中的样本数据进行在线更新。
在该处理过程中,该用于更新的待翻译信息可以是存储在本地存储中的,当需要进行更新时,直接在本地存储中提取相应的样本数据进行在线的更新处理。
2、基于终端设备发送的用于更新的待翻译信息来对该翻译模型中的样本数据进行在线更新。
在该处理过程中,通过接收终端设备发送的针对该翻译模型的用于更新的待翻译信息来对该翻译模型进行更新。
对于本公开,无论是基于本地存储的待翻译信息,或是基于服务器发送的样本数据,或是基于终端设备上传的待翻译信息来对翻译模型中的样本数据进行的更新过程,可以是由该终端设备或服务器主动发起的更新过程。
在一个可能地实现方式中,本公开还包括下述步骤S205~步骤S206的处理。
步骤S205,对翻译结果的校验处理。
对于本公开,在得到翻译结果之后,为了使翻译结果更为准确,则需要对该翻译结果进行校验处理,从而得到经校验处理后的翻译结果。其中,当电子设备为终端设备或服务器时,该校验处理过程是不同的,具体如下:
当电子设备为终端设备时,该基于翻译结果进行校验处理,得到经校验处理后的翻译结果,包括如下处理:
向服务器发送携带有翻译结果的校验请求消息;
接收服务器返回的校验响应消息,获取该校验响应消息中携带的经校验处理后的翻译结果。
当电子设备为服务器时,该基于翻译结果进行校验处理,得到经校验处理后的翻译结果,包括如下处理:
基于得到的翻译结果进行相应的校验处理,得到经校验处理后的翻译结果。其中,在服务器对该翻译结果进行校验处理时,可以通过该服务器上预先配置的校验单元进行该翻译结果的校验处理,还可以是该服务器通过发送指示信息,来指示专业的校验人员对该翻译结果进行校验处理。
步骤S206,显示经校验处理后的翻译结果。
对于本公开,在得到上述经校验处理后的翻译结果后,需要对其进行相应的显示。
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验,且通过进一步的校验处理,保证了翻译结果的准确性,提升了翻译处理的准确度。
本公开提供了一种信息处理装置的结构示意图,如图3所示,本公开的信息处理装置30可以包括:接收单元31、分析单元32、第一处理单元33、识别单元34、第二处理单元35、第三处理单元36、更新单元37、校验单元38以及显示单元39,其中,
接收单元31,用于接收用户输入的待翻译信息;
分析单元32,用于对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件;
第一处理单元33,用于当待翻译信息满足第一预设条件时,基于预设的翻译模型对待翻译信息进行翻译,得到对应的翻译结果。
在一个可能地实现方式中,识别单元34,用于对待翻译信息进行语义识别,得到对应的语义特征信息;
其中,待翻译信息包括语音信息或文本信息,
在一个可能地实现方式中,若待翻译信息为语音信息时,识别单元34,用于对语音信息进行特征提取,得到语音信息对应的声学特征信息;对声学特征信息进行语义识别,得到对应的语义特征信息。
在一个可能地实现方式中,第二处理单元35,用于当待翻译信息不满足第一预设条件时,基于预设的语料库对待翻译信息中的内容进行调整,以使其满足第一预设条件。
在一个可能地实现方式中,第一预设条件用于表征待翻译信息中不包含有特定类型信息;
其中,特定类型信息包括如下任一项:
成语;
歇后语;
俚语;
俗语;
谚语。
在一个可能地实现方式中,还包括:
第三处理单元36,用于获取样本数据;样本数据包括待训练的待翻译信息及其对应的标识信息,标识信息用于表征待训练的待翻译信息对应的翻译结果;提取样本数据对应的语义特征信息;基于样本数据的语义特征信息进行模型训练,得到翻译模型。
在一个可能地实现方式中,
更新单元37,用于当满足第二预设条件时,对翻译模型的样本数据进行更新;
其中,更新单元37,用于具体用于获取用于更新的待翻译信息;基于用于更新的待翻译信息对翻译模型中的样本数据进行在线更新。
在一个可能地实现方式中,第二预设条件包括如下任一项:
翻译结果与实际结果为不同的结果;
翻译结果与实际结果为不同结果的次数满足预设阈值;
预设时间段。
在一个可能地实现方式中,
校验单元38,用于基于翻译结果进行校验处理,得到经校验处理后的翻译结果;
显示单元39,用于显示经校验处理后的翻译结果。
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验,且通过进一步的校验处理,保证了翻译结果的准确性,提升了翻译处理的准确度。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备(例如图1中的终端设备或服务器)400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
本公开提供的电子设备,适用于上述方法的任一实施例,在此不再赘述。
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验,且通过进一步的校验处理,保证了翻译结果的准确性,提升了翻译处理的准确度。
本公开提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机执行上述的信息处理方法。
本公开提供的计算机可读存储介质,适用于上述方法的任一实施例,在此不再赘述。
本公开中,接收待翻译信息,对待翻译信息进行分析,确定待翻译信息是否满足第一预设条件,并当待翻译信息满足第一预设条件时,基于预设的翻译模型对该待翻译信息进行翻译,得到对应的翻译结果。本公开提供的上述处理,实现了对待翻译信息的翻译,基于翻译模型的引入,提升了翻译的准确度,同时相较于现有技术中的人工翻译处理,提升了翻译的速度,增加了用户的使用体验,且通过进一步的校验处理,保证了翻译结果的准确性,提升了翻译处理的准确度。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本公开公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
其中,本公开装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本公开序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本公开的几个具体实施例,但是,本公开并非局限于此,任何本领域的技术人员能思之的变化都应落入本公开的保护范围。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
接收待翻译信息;
对所述待翻译信息进行分析,确定所述待翻译信息是否满足第一预设条件;
当所述待翻译信息满足第一预设条件时,基于预设的翻译模型对所述待翻译信息进行翻译,得到对应的翻译结果。
2.如权利要求1所述的方法,其特征在于,对所述待翻译信息进行分析之前,还包括:
对所述待翻译信息进行语义识别,得到对应的语义特征信息;
其中,所述待翻译信息包括语音信息或文本信息。
3.如权利要求2所述的方法,其特征在于,若所述待翻译信息为语音信息时,所述对所述待翻译信息进行语义识别,得到对应的语义特征信息,包括:
对所述语音信息进行特征提取,得到所述语音信息对应的声学特征信息;
对所述声学特征信息进行语义识别,得到对应的语义特征信息。
4.如权利要求1-3中任一项所述的方法,其特征在于,当所述待翻译信息不满足第一预设条件时,基于预设的语料库对所述待翻译信息中的内容进行调整,以使其满足第一预设条件。
5.如权利要求1-4中任一项所述的方法,其特征在于,所述第一预设条件用于表征所述待翻译信息中不包含有特定类型信息;
其中,所述特定类型信息包括如下任一项:
成语;
歇后语;
俚语;
俗语;
谚语。
6.如权利要求1-5中任一项所述的方法,其特征在于,基于预设的翻译模型对所述语义特征信息进行翻译之前,还包括:
获取样本数据;所述样本数据包括待训练的待翻译信息及其对应的标识信息,所述标识信息用于表征待训练的待翻译信息对应的翻译结果;
提取所述样本数据对应的语义特征信息;
基于所述样本数据的语义特征信息进行模型训练,得到所述翻译模型。
7.如权利要求6所述的方法,其特征在于,还包括:
当满足第二预设条件时,对所述翻译模型的样本数据进行更新;
其中,所述对所述翻译模型的样本数据进行更新,包括:
获取用于更新的待翻译信息;
基于用于更新的待翻译信息对所述翻译模型中的样本数据进行在线更新。
8.如权利要求7所述的方法,其特征在于,所述第二预设条件包括如下任一项:
所述翻译结果与实际结果为不同的结果;
所述翻译结果与实际结果为不同结果的次数满足预设阈值;
预设时间段。
9.如权利要求1-8中任一项所述的方法,其特征在于,在得到针对所述待翻译信息的翻译结果之后,还包括:
基于所述翻译结果进行校验处理,得到经校验处理后的翻译结果;
显示所述经校验处理后的翻译结果。
10.一种信息处理装置,其特征在于,包括:
接收单元,用于接收待翻译信息;
分析单元,用于基于预设的语料库对所述待翻译信息进行分析,得到分析结果;
第一处理单元,用于当所述分析结果满足预设条件时,基于预设的翻译模型对所述待翻译信息进行翻译,得到对应的翻译结果。
11.一种电子设备,其特征在于,包括:处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述权利要求1至权利要求9中任一项所述的信息处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机执行上述权利要求1至权利要求9中任一项所述的信息处理方法。
CN201811593116.5A 2018-12-25 2018-12-25 信息处理方法、装置、电子设备及计算机可读存储介质 Pending CN109657252A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811593116.5A CN109657252A (zh) 2018-12-25 2018-12-25 信息处理方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811593116.5A CN109657252A (zh) 2018-12-25 2018-12-25 信息处理方法、装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109657252A true CN109657252A (zh) 2019-04-19

Family

ID=66116631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811593116.5A Pending CN109657252A (zh) 2018-12-25 2018-12-25 信息处理方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109657252A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571044A (zh) * 2021-07-28 2021-10-29 北京有竹居网络技术有限公司 语音信息处理方法、装置和电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683861A (ja) * 1991-05-24 1994-03-25 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN1559042A (zh) * 2001-09-28 2004-12-29 �ʼҷ����ֵ��ӹɷ����޹�˾ 多语言转录系统
CN1573741A (zh) * 2003-06-20 2005-02-02 微软公司 自适应性机器翻译
WO2008131509A1 (en) * 2007-04-30 2008-11-06 Fireswirl Systems Inc. Systems and methods for improving translation systems
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN102831108A (zh) * 2011-06-08 2012-12-19 埃森哲环球服务有限公司 包括实时语言翻译的整合多平台通信的自动化系统和方法
CN104572632A (zh) * 2014-12-25 2015-04-29 语联网(武汉)信息技术有限公司 一种确定具有专名译文的词汇的翻译方向的方法
CN105408891A (zh) * 2013-06-03 2016-03-16 机械地带有限公司 用于多用户多语言通信的系统和方法
CN107168958A (zh) * 2017-05-15 2017-09-15 北京搜狗科技发展有限公司 一种翻译方法及装置
CN107943796A (zh) * 2017-11-17 2018-04-20 珠海市魅族科技有限公司 一种翻译方法和装置、终端、可读存储介质
CN108415905A (zh) * 2018-03-06 2018-08-17 喻海联 实时翻译方法、智能眼镜及计算机可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683861A (ja) * 1991-05-24 1994-03-25 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN1559042A (zh) * 2001-09-28 2004-12-29 �ʼҷ����ֵ��ӹɷ����޹�˾ 多语言转录系统
CN1573741A (zh) * 2003-06-20 2005-02-02 微软公司 自适应性机器翻译
WO2008131509A1 (en) * 2007-04-30 2008-11-06 Fireswirl Systems Inc. Systems and methods for improving translation systems
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN102831108A (zh) * 2011-06-08 2012-12-19 埃森哲环球服务有限公司 包括实时语言翻译的整合多平台通信的自动化系统和方法
CN105408891A (zh) * 2013-06-03 2016-03-16 机械地带有限公司 用于多用户多语言通信的系统和方法
CN104572632A (zh) * 2014-12-25 2015-04-29 语联网(武汉)信息技术有限公司 一种确定具有专名译文的词汇的翻译方向的方法
CN107168958A (zh) * 2017-05-15 2017-09-15 北京搜狗科技发展有限公司 一种翻译方法及装置
CN107943796A (zh) * 2017-11-17 2018-04-20 珠海市魅族科技有限公司 一种翻译方法和装置、终端、可读存储介质
CN108415905A (zh) * 2018-03-06 2018-08-17 喻海联 实时翻译方法、智能眼镜及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571044A (zh) * 2021-07-28 2021-10-29 北京有竹居网络技术有限公司 语音信息处理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN107945786B (zh) 语音合成方法和装置
KR102401942B1 (ko) 번역품질 평가 방법 및 장치
CN109817213B (zh) 用于自适应语种进行语音识别的方法、装置及设备
CN112183120B (zh) 语音翻译方法、装置、设备和存储介质
CN109036384B (zh) 语音识别方法和装置
CN107657017B (zh) 用于提供语音服务的方法和装置
US10522136B2 (en) Method and device for training acoustic model, computer device and storage medium
US20230298562A1 (en) Speech synthesis method, apparatus, readable medium, and electronic device
CN112528637B (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN112259089B (zh) 语音识别方法及装置
CN110349564A (zh) 一种跨语言语音识别方法和装置
US20230306954A1 (en) Speech synthesis method, apparatus, readable medium and electronic device
US20230127787A1 (en) Method and apparatus for converting voice timbre, method and apparatus for training model, device and medium
CN112927674B (zh) 语音风格的迁移方法、装置、可读介质和电子设备
US9953029B2 (en) Prediction and optimized prevention of bullying and other counterproductive interactions in live and virtual meeting contexts
CN109410918B (zh) 用于获取信息的方法及装置
US11562735B1 (en) Multi-modal spoken language understanding systems
CN111813909A (zh) 一种智能问答方法和装置
CN111681661B (zh) 语音识别的方法、装置、电子设备和计算机可读介质
CN112509562A (zh) 用于文本后处理的方法、装置、电子设备和介质
CN114220461A (zh) 客服话术的引导方法、装置、设备及存储介质
CN114255740A (zh) 语音识别方法、装置、计算机设备和存储介质
WO2023005729A1 (zh) 语音信息处理方法、装置和电子设备
CN113793599B (zh) 语音识别模型的训练方法和语音识别方法及装置
CN114550702A (zh) 一种语音识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 408, 4th floor, 51 Zhichun Road, Haidian District, Beijing 100086

Applicant after: Tiktok Technology Co.,Ltd.

Address before: 408, 4th floor, 51 Zhichun Road, Haidian District, Beijing 100086

Applicant before: BEIJING MICROLIVE VISION TECHNOLOGY Co.,Ltd.

Country or region before: China

CB02 Change of applicant information