CN109979454B - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN109979454B CN109979454B CN201910252033.8A CN201910252033A CN109979454B CN 109979454 B CN109979454 B CN 109979454B CN 201910252033 A CN201910252033 A CN 201910252033A CN 109979454 B CN109979454 B CN 109979454B
- Authority
- CN
- China
- Prior art keywords
- data
- identification
- result data
- result
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Abstract
本申请实施例公开了数据处理方法及装置,其中,所述方法包括:获得第一输入数据;向第一识别模组传输所述第一输入数据;获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
Description
技术领域
本申请实施例涉及电子技术,涉及但不限于数据处理方法及装置。
背景技术
终端在获取到待识别的语音数据之后,通过语音识别引擎对该语音数据进行识别,并根据识别结果对该语音数据进行响应,例如,输出该识别结果,或者,执行该识别结果所指示的任务。然而,目前,语音识别引擎的识别准确率依然面临挑战,错误的识别结果给用户体验带来负面影响。
发明内容
有鉴于此,本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种数据处理方法,包括:获得第一输入数据;向第一识别模组传输所述第一输入数据;获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
第二方面,本申请实施例提供一种数据处理装置,包括:第一获取模块,配置为:获得第一输入数据;数据传输模块,配置为:向第一识别模组传输所述第一输入数据;第二获取模块,配置为:获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;数据处理模块,配置为:处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;指令执行模块,配置为:如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
本申请实施例中,在输出第一结果数据之前,先对第一结果数据进行处理,以获得第一结果数据的可靠性,也就是第一标识数据,当第一标识数据满足第一条件时,执行第一指令,输出第一结果数据;当第一标识数据不满足第一条件时,执行不同于第一指令的第二指令,如此可以减少输出错误结果数据的概率,改善用户体验。
附图说明
图1A为本申请实施例数据处理方法的应用场景示意图;
图1B为本申请实施例数据处理方法的又一个应用场景示意图;
图2A为本申请实施例数据处理方法的实现流程示意图;
图2B为本申请实施例显示第一结果数据的界面示意图;
图3为本申请实施例另一数据处理方法的实现流程示意图;
图4为本申请实施例再一数据处理方法的实现流程示意图;
图5为本申请实施例语音识别系统的组成结果示意图;
图6为本申请实施例数据处理装置的组成结构示意图;
图7为本申请实施例数据处理设备的一种硬件实体示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
需要指出,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
本申请实施例先提供两种应用场景,图1A为本申请实施例数据处理方法的应用场景示意图,如图1A所示,在该应用场景中,包括终端101和服务器102。其中,终端101可以是移动电话(例如手机)、平板电脑、笔记本电脑等具有无线通信能力的移动终端,还可以是不便移动的具有计算功能的台式计算机、桌面电脑等。终端101中可以安装有语音识别应用程序(Application,App)。服务器102可以是一台服务器,也可以是由多台服务器构成的服务器集群、云计算中心等等,在此不加以限定。
当用户通过终端101上的语音识别APP输入一段语音时,终端101获得该语音数据之后,将该语音数据发送给服务器102,服务器102对该语音数据进行处理,并将处理结果返回给终端101,终端101执行该处理结果。
图1B为本申请实施例数据处理方法的又一个应用场景示意图,如图1B所示,在该应用场景中,包括:终端111,终端111中可以安装有语音识别APP,用户通过该APP输入一段语音,终端111获得该语音数据之后,对该语音数据进行处理,并输出处理结果。
结合图1A和图1B所示的应用场景示意图,以下对数据处理方法及装置、设备的各实施例进行说明。在本申请各实施例中,数据处理设备可以是如图1A中所示的服务器,还可以是如图1B中所示的终端。
本申请实施例提供一种数据处理方法,图2A为本申请实施例数据处理方法的实现流程示意图,如图2A所示,所述方法包括以下步骤:
步骤S201,数据处理设备获得第一输入数据;
这里,对于第一输入数据的内容,本实施例中不做限定。例如,第一输入数据可以是一段语音、至少一张图像或者用户的运动参数等,不同的应用场景中,第一输入数据的内容不同。例如:在语音识别应用中,第一输入数据为一段语音;在图像识别应用中,第一输入数据为至少一张图像;在健康监护应用中,第一输入数据为用户的运动参数。
以第一输入数据为一段语音为例,当步骤S201由终端实现时,终端可以通过运行的语音识别APP接收用户输入的语音;当步骤S201由服务器实现时,服务器可以接收终端发送的语音数据。
步骤S202,数据处理设备向第一识别模组传输所述第一输入数据;
同样地,这里,第一识别模组与应用场景对应,例如:在语音识别应用中,第一识别模组为语音识别引擎,语音识别引擎是负责将语音数据识别为文字的工具;在图像识别应用中,第一识别模组为图像分类器,图像分类器是负责识别图像所属类型的工具;在健康监护应用中,第一识别模组为用于确定用户健康状况的检测器。
步骤S203,数据处理设备获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;
同样地,这里,例如:在语音识别应用中,第一输入数据为一组语音数据时,数据处理设备获得的第一结果数据可以为该语音数据对应的文本内容,例如,语音数据为“我今天下午五点开会”,第一识别模组识别该语音数据后生成的第一结果数据为“我今天下午五点开会”;再如,语音数据为“给小明打电话”,第一识别模组识别该语音数据后生成的第一结果数据为“给小明打电话”;在图像识别应用中,第一输入数据为一张宠物狗的照片,第一识别模组识别该照片后生成的第一结果数据为“狗狗的品种为金毛”;在健康监护应用中,第一输入数据为“小明的高压为160,低压为100”,第一识别模组识别该数据之后生成的第一结果数据为“小明目前血压偏高”。
步骤S204,数据处理设备处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;
目前,第一识别模组的识别准确率依然面临挑战,第一识别模组无法对每一第一输入数据都能够正确识别,基于此,在本实施例中,数据处理设备在输出第一结果数据之前,预先对第一结果数据进行处理,获得表征第一结果数据可靠性的第一标识数据,然后,依据第一标识数据,确定是否输出第一结果数据,例如,当第一结果数据的可靠性满足第一条件时,执行第一指令,输出第一结果数据;当第一结果数据的可靠性不满足第一条件时,执行第二指令,如此,可以减少数据处理设备输出错误的第一结果数据的概率,改善用户体验。
需要说明的是,这里不限定用于处理第一结果数据的处理策略,例如,所述处理策略可以是一个机器学习模型,该模型输出的第一标识数据为表征第一结果数据可靠性的置信度,例如,置信度为大于0且小于或等于1的数值;再如,所述处理策略还可以是确定第一结果数据对错的算法,获得的第一标识数据为表征第一结果数据对错的数值,例如,“1”表示第一结果数据是错误的,与第一输入数据表达的真实内容相差甚远,“0”表示第一结果数据是正确的,与第一输入数据表达的真实内容比较接近。
步骤S205,数据处理设备确定所述第一标识数据是否满足第一条件;如果是,数据处理设备执行步骤S206;否则,数据处理设备执行步骤S207;
例如,第一标识数据通过置信度来表示时,第一条件可以为第一标识数据大于第一阈值,在实现步骤S205时,如果第一标识数据大于第一阈值时,数据处理设备执行步骤S206;否则,数据处理设备执行步骤S207。再如,第一标识数据为表征第一结果数据对错的数值时,第一条件可以为第一标识数据等于0;那么,在实现步骤S206时,如果第一标识数据等于0,表示第一结果数据正确,此时数据处理设备执行步骤S206;否则(即第一标识数据等于1),数据处理设备执行步骤S207。
步骤S206,数据处理设备执行第一指令,输出所述第一结果数据;
这里,当服务器实现步骤S206时,服务器执行第一指令,将第一结果数据发送给终端,终端接收第一结果数据,并输出;当终端实现步骤S206时,终端执行第一指令,输出第一结果数据。
需要说明的是,不同的应用场景下,终端输出第一结果数据的方式是不同的。例如,在备忘录应用中,如图2B所示,终端在备忘录的应用界面20上显示第一输入数据201“我下午五点开会”的文字内容202(即第一结果数据),且保存第一结果数据;再如,在语音助手应用中,终端执行第一结果数据“给小明打电话”所指示的任务;其中,备忘录应用指的是用于记录用户待办事件等备忘内容的APP;语音助手应用指的是用于执行用户发出的语音指令的APP。
步骤S207,数据处理设备执行第二指令,其中,所述第一指令和所述第二指令不同。
在其他实施例中,数据处理设备在实现步骤S207时,包括:数据处理设备确定所述第一标识数据满足第二条件还是第三条件,如果所述第一标识数据满足第二条件,数据处理设备输出所述第一结果数据,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据。
举例来说,假设第一标识数据通过置信度来表示时,第二条件为第一标识数据小于等于第一阈值且大于第二阈值;第三条件为第一标识数据小于等于第二阈值;其中,第一阈值大于第二阈值。
可以理解地,如果第一标识数据满足第一条件,说明第一结果数据的可靠性较高,第一结果数据足够可信,此时数据处理设备可以执行第一指令,直接输出第一结果数据;如果第一标识数据不满足第一条件,且第一标识数据满足第二条件,说明第一结果数据的可靠性较低,第一结果数据不足够可信,但是第一结果数据不会给用户体验带来较大的负面影响,此时数据处理设备也可以输出第一结果数据,但是还需要关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据,以便后台依据这些存储的数据对处理第一结果数据的处理策略或者第一识别模组进行更新、优化。
在其他实施例中,数据处理设备在实现步骤S207时,还包括:如果所述第一标识数据满足第三条件,数据处理设备输出提示数据,所述提示数据用于提示再次输入第一输入数据。
可以理解地,在本实施例中,当所述第一标识数据满足第三条件时,说明第一输入数据能够被识别,但是识别后生成的第一结果数据的可靠性非常差,例如,第一输入数据为“明天要去高新管委会办理户籍登记”,而识别后生成的第一结果数据却是“明天要去HI办理后记得几”,此时,如果数据处理设备输出第一结果数据,可能会导致用户体验变差。所以,在本实施例中,数据处理设备即便识别得到了第一结果数据,但由于第一结果数据的可靠性非常差,也不输出的第一结果数据,而是输出提示数据,提示再次输入第一输入数据,以便第一识别模组对新的第一输入数据进行识别,获得更为准确的第一结果数据之后再输出。当然,在其他实施例中,如果第一输入数据无法被识别,数据处理设备也要输出提示数据,以提示再次输入第一输入数据。
这里,当输出所述提示数据由终端实现时,终端可以在屏幕上显示所述提示数据,或者,终端可以语音播放所述提示数据,例如,终端通过播放内容为“主人,没听清您在说什么,请重新说一遍”的提示数据,以提示用户重新输入第一输入数据。当输出所述提示数据由服务器实现时,服务器可以将所述提示数据发送给终端,终端接收并输出所述提示数据。
在其他实施例中,数据处理设备在实现步骤S207时,还包括:如果所述第一标识数据满足第三条件,数据处理设备关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据,以便后台依据这些存储的数据对处理第一结果数据的处理策略或者第一识别模组进行更新、优化。
在本申请实施例提供的数据处理方法中,数据处理设备在获得第一结果数据之后,不是直接输出第一结果数据,而是先对第一结果数据进行处理,获得表征第一结果数据可靠性的第一标识数据,如果第一标识数据满足第一条件,则输出第一结果数据,如此可以减少数据处理设备输出错误的第一结果数据的概率,改善用户体验。
基于前述实施例,本申请实施例提供另一数据处理方法,图3为本申请实施例另一数据处理方法的实现流程示意图,如图3所示所述方法包括以下步骤:
步骤S301,数据处理设备获得第一输入数据;
步骤S302,数据处理设备向第一识别模组传输所述第一输入数据;且向第二识别模组传输所述第一输入数据;
数据处理设备可以向一个或一个以上第二识别模组传输第一输入数据,第一识别模组和第二识别模组不同,第二识别模组和其他第二识别模组也不同。
需要说明的是,步骤S302为上述实施例中步骤S202的一种实施示例。
步骤S303,数据处理设备获得第一结果数据和第二结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的,所述第二结果数据是所述第二识别模组识别所述第一输入数据后生成的;
可以理解地,数据处理设备向多个第二识别模组传输所述第一输入数据时,获得的第二结果数据也为多组数据。
步骤S304,数据处理设备处理第一结果数据和第二结果数据,依据所述第一结果数据和第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据;
可以理解地,第一识别模组本身无法判定第一结果数据的可靠性,例如,语音识别引擎将一段语音数据识别转化为对应的文本内容之后,语音识别引擎无法自我判断该文本内容是否正确。假设第一结果数据和第二结果数据都是正确的,那么第一结果数据和第二结果数据之间的差异应该会非常小;但是,如果第一结果数据和第二结果数据都是错误的,那么第一结果数据和第二结果数据之间的差异会比较大,这是因为错误的结果具有不确定性。基于这样的思路,在本实施例中,依据第一结果数据和第二结果数据的差异,能够获得较为准确的第一标识数据。
以语音识别应用场景为例,第一结果数据和第二结果数据的差异可以通过两者之间的文本距离(即文本相似度)来表征,例如,文本距离为第一结果数据和第二结果数据之间的汉明距离。
需要说明的是,数据处理设备在实现步骤S304时,不限定获得第一标识数据的方法。例如,可以预先获得样本数据集合,基于该集合对机器学习模型(比如支持向量机)进行训练,训练后的机器学习模型用于依据所述差异获得第一标识数据。以语音识别应用场景为例,样本数据集合中可以包括第一结果数据和第二结果数据的识别标签、第一结果数据和第二结果数据之间的文本距离等,其中,所述识别标签用于标注对应的结果数据的准确程度。再如,还可以将第一结果数据分别和多个第二结果数据之间的差异进行加权平均,以获得第一标识数据,或者,判定所述差异满足哪个预定条件,以获得与所述预定条件对应的第一标识数据。
步骤S305,数据处理设备确定所述第一标识数据是否满足第一条件;如果是,数据处理设备执行步骤S306;否则,数据处理设备执行步骤S307;
步骤S306,数据处理设备执行第一指令,输出所述第一结果数据;
步骤S307,数据处理设备执行第二指令,其中,所述第一指令和所述第二指令不同。
这里,数据处理设备在实现步骤S307时,包括:数据处理设备输出所述第一结果数据,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据;数据处理设备在实现步骤S307时,还包括:数据处理设备输出提示数据,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据,所述提示数据用于提示再次输入第一输入数据;数据处理设备在实现步骤S307时,还包括如下实施例中步骤S407至步骤S410的内容。
在本申请实施例提供的数据处理方法中,数据处理设备不仅向第一识别模组传输第一输入数据,还向第二识别模组传输第一输入数据,以对应获得第一结果数据和第二结果数据;然后,数据处理设备依据第一结果数据和第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据。如此,可以解决第一识别模组无法自我判断第一结果数据是否正确的缺陷,通过参考其他识别模组(即第二识别模组)识别生成的第二结果数据,以获得较为准确的第一标识数据,提高判定第一结果数据是否准确的可靠性,进而输出更加准确的结果数据,以改善用户体验。
基于前述实施例,本申请实施例提供又一数据处理方法,所述方法包括以下步骤:
步骤S401,数据处理设备获得第一输入数据;
步骤S402,数据处理设备向第一识别模组传输所述第一输入数据;且向第二识别模组传输所述第一输入数据;
步骤S403,数据处理设备获得第一结果数据和第二结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的,所述第二结果数据是所述第二识别模组识别所述第一输入数据后生成的;
步骤S404,数据处理设备处理第一结果数据和第二结果数据,依据所述第一结果数据和第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据;
步骤S405,数据处理设备确定所述第一标识数据是否满足第一条件;如果是,执行步骤S406;否则,执行步骤S407;
步骤S406,数据处理设备执行第一指令,输出所述第一结果数据;
步骤S407,数据处理设备处理所述第二结果数据,获得表征所述第二结果数据可靠性的第二标识数据;
可以理解地,如果第一标识数据不满足第一条件,数据处理设备可以处理第二结果数据,确定第二结果数据的可靠性(即第二标识数据)是否满足第一条件,当第二结果数据的可靠性满足第一条件时,数据处理设备还可以输出第二结果数据,如此,可以增强数据处理设备的鲁棒性,避免第一识别结果不准确时就将提示数据输出,从而改善用户体验。
需要说明的是,数据处理设备处理第二结果数据的处理策略与处理第一结果数据的处理策略一般是同一处理策略。
步骤S408,数据处理设备确定所述第二标识数据是否满足所述第一条件;如果是,执行步骤S409;否则,执行步骤S410;
步骤S409,数据处理设备输出所述第二结果数据;
这里,数据处理设备输出第二结果数据的方式与前述输出第一结果数据的方式相同,所以在此不再赘述。
步骤S410,数据处理设备执行第二指令,其中,所述第一指令和所述第二指令不同。
如果第二标识数据不满足第一条件,此时数据处理设备可以执行第二指令,输出第一结果数据,且关联地存储第一输入数据、第一结果数据和第一标识数据;或者,数据处理设备可以输出提示数据,以提示用户再次输入第一输入数据。在其他实施例中,如果第二标识数据不满足第一条件,数据处理设备还可以关联地存储第一输入数据、第二结果数据和第二标识数据,以便后台依据存储的这些数据更新用于处理第一结果数据、第二结果数据的处理策略,使得更新后的处理策略获得的标识数据更加准确。
在本申请实施例提供的数据处理方法中,如果第一标识数据不满足第一条件,数据处理设备处理第二结果数据,当第二结果数据的可靠性满足第一条件时,输出第二结果数据,如此,可以增强数据处理设备的鲁棒性,避免第一识别结果不准确时就将提示数据输出,从而改善用户体验。
本申请实施例提供再一数据处理方法,所述方法应用于至少由终端和服务器构成的数据处理系统,图4为本申请实施例再一数据处理方法的实现流程示意图,如图4所示,所述方法包括以下步骤:
步骤S501,终端获得第一输入数据;
步骤S502,终端向服务器发送所述第一输入数据;
步骤S503,服务器向第一识别模组传输所述第一输入数据;
步骤S504,服务器获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;
步骤S505,服务器处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;
需要说明的是,服务器在实现步骤S503时,可以向第一识别模组传输第一输入数据,且向第二识别模组传输第一输入数据。对应地,服务器在实现步骤S504时,服务器获得第一结果数据和第二结果数据,其中,第二结果数据是第二识别模组识别第一输入数据后生成的。基于此,服务器在实现步骤S505时,服务器处理第一结果数据和第二结果数据,依据第一结果数据和第二结果数据的差异,获得表征第一结果数据可靠性的第一标识数据。
步骤S506,服务器确定所述第一标识数据是否满足第一条件;如果是,服务器执行步骤S507;否则,服务器执行步骤S510;
步骤S507,服务器执行第一指令,将所述第一结果数据发送给终端;
可以理解地,如果所述第一标识数据满足第一条件,服务器执行第一指令,输出所述第一结果数据给终端,即,服务器将所述第一结果数据发送给终端。
步骤S508,终端接收所述第一结果数据;
步骤S509,终端响应所述第一结果数据;
需要说明的是,终端响应第一结果数据的方式和应用场景有关,例如,在备忘录应用中,终端响应第一结果数据的方式为:终端在备忘录的应用界面上显示第一结果数据,且保存第一结果数据;再如,在语音助手应用中,终端响应第一结果数据的方式为:终端执行第一结果数据所指示的任务。
步骤S510,服务器确定所述第一标识数据是否满足第二条件;如果是,服务器执行步骤S511;否则,服务器执行步骤S514;
步骤S511,服务器将所述第一结果数据发送给终端,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据;
步骤S512,终端接收所述第一结果数据;
步骤S513,终端响应所述第一结果数据;
步骤S514,服务器发送提示数据给终端,且服务器关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据,所述提示数据用于提示终端再次发送第一输入数据;
步骤S515,终端输出所述提示数据,以提示用户重新输入第一输入数据;
至此,步骤S501至步骤S515即实现了线上识别功能,在线上识别的过程中,如果第一标识数据不满足第一条件,说明可能是处理第一结果数据的处理策略的性能较差,得到的第一标识数据不准确;或者,还可能是第一识别模组的识别性能较差,得到的第一结果数据不准确。因此,当第一标识数据不满足第一条件时,服务器关联地存储第一输入数据、第一结果数据和第一标识数据,以便后台基于存储的至少一组第一输入数据和所述至少一组第一输入数据对应的第一结果数据和第一标识数据,线下更新优化所述处理策略和第一识别模组。这里不限定线上识别过程(即上述步骤S501至步骤S515)和线下更新优化过程(即以下步骤S516至步骤S522)的执行顺序,也不限定每次进行线上识别过程都要进行线下更新优化过程。当存储的数据达到一定数量时,服务器可以依据存储的这些数据执行线下更新优化过程。
步骤S516,服务器依据存储的至少一组第一输入数据的第一结果数据和第一标识数据,更新用于处理所述第一结果数据的处理策略;
例如,在语音识别应用中,所述处理策略为机器学习模型,服务器在实现步骤S516时,服务器依据至少一组第一输入数据的第一结果数据、参考结果数据和第一标识数据,更新机器学习模型的模型参数。其中,所述参考结果数据指的是第一输入数据的正确结果数据,参考结果数据可以通过人工标注的方式获得,例如,第一输入数据为一段语音,通过人工听取该语音的内容,并将其转化为文字之后导入服务器。所述参考结果数据还可以自动获得,例如,从第二结果数据集合中选择可靠性最高的第二结果数据作为所述参考结果数据,从而实现第一识别模组的自动化更新,降低人工标注成本。
在其他实施例中,服务器在实现步骤S516时,包括:服务器获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;服务器依据所述至少一组第一输入数据对应的第一结果数据、参考结果数据和第一标识数据,获得表征所述处理策略可靠性的第三标识数据;如果所述第三标识数据不满足第四条件,服务器获得所述第一标识数据的参考标识数据;服务器依据所述至少一组第一输入数据对应的第一标识数据和参考标识数据,更新所述处理策略。
可以理解地,当第三标识数据不满足第四条件时,说明所述处理策略的性能较差,获得的第一标识数据是不准确的,此时可以基于至少一组第一输入数据对应的第一标识数据和参考标识数据,更新所述处理策略。其中,参考标识数据可以通过人工标注的方式获得,也可以依据第一结果数据和参考结果数据之间的差异获得。
需要说明的是,步骤S503至步骤S507、步骤S510至步骤S511、步骤S514、步骤S516均可以由终端实现,这样可以省去终端与服务器的数据交互过程,另外,终端存储的第一输入数据、第一结果数据和第一标识数据,是终端所属用户的个性化数据,因此,终端在依据这些数据更新所述处理策略时,可以获得符合终端所述用户特点的处理策略,从而获得更加准确的第一标识数据,减少提示数据输出的次数,改善用户体验。
步骤S517,服务器获得存储的至少一组第一输入数据的第一结果数据;
步骤S518,服务器获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;
需要说明的是,所述参考结果数据可以通过人工标注的方式获得,例如,第一输入数据为一段语音,通过人工听取该语音的内容,并将其转化为文字之后导入服务器。所述参考结果数据还可以自动获得,例如,从第二结果数据集合中选择可靠性最高的第二结果数据作为所述参考结果数据,从而实现第一识别模组的自动化更新,降低人工标注成本。
步骤S519,服务器依据所述至少一组第一输入数据的第一结果数据和参考结果数据,更新所述第一识别模组。
同样地,步骤S517至步骤S519也可以由终端实现,终端存储的第一输入数据、第一结果数据和第一标识数据,是终端所属用户的个性化数据,因此,终端在依据这些数据更新所述第一识别模组时,可以获得符合终端所述用户特点的识别模组,从而获得更加准确的第一结果数据,改善用户体验。
在其他实施例中,服务器还可以通过以下步骤S520至步骤S522实现对所述第一识别模组的更新:
步骤S520,服务器依据获得的N个第一结果数据的第一标识数据,获得表征所述第一识别模组可靠性的第四标识数据;N为大于0的整数;
需要说明的是,所述N个第一结果数据可以是第一识别模组在某段时间内进行至少N次识别后生成的不同结果数据,例如,N等于10000。这些结果数据可以是同一用户在不同时刻输入的不同第一输入数据所对应的第一结果数据,还可以是不同用户在同一时刻或不同时刻输入的第一输入数据所对应的第一结果数据。
步骤S521,服务器依据获得的M个第二结果数据的第二标识数据,获得表征所述第二识别模组可靠性的第五标识数据;M为大于0的整数;
步骤S522,如果所述第五标识数据和所述第四标识数据满足第五条件,服务器将所述第一识别模组更新为所述第二识别模组;其中,所述第五条件为所述第五标识数据表征的可靠性优于所述第四标识数据表征的可靠性。
可以理解地,如果在某段时间内,第一识别模组的识别性能较差,那么可以将第一识别模组更新为识别性能较优的第二识别模组,从而提升第一识别模组的识别性能,改善用户体验。
自动语音识别(Automatic Speech Recognition,ASR)是将语音识别为文字的语音识别引擎,常用于用户实时语音识别。目前ASR的识别正确率依然面临挑战,ASR引擎需要不断地被修正以提升识别正确率,但是由于ASR引擎无法自我判断一句话的识别结果是否正确,识别结果的好坏需要事后进行人工筛选和评价。然而,一个商用ASR引擎每日处理数以万计的用户话语,通过人工筛选识别结果的好坏,效率非常低。人们需要一种方法快速找到错误的案例,并在出错时第一时间给予用户及时的提示。
针对上述困难,本申请实施例为ASR引擎增加一个自动评价系统,该系统可以在较少的人工干预下,自动化判断ASR引擎的识别准确率,并依据错误识别结果,实时给用户反馈。
需要说明的是,所述自动评价系统即为前述实施例处理第一结果数据的处理策略的一种示例。
本申请实施例所具备的优势在于:第一,线上系统实时评价ASR引擎的正确率,无需人工干预;第二,ASR引擎输出的识别结果出错时,可以实时给予用户反馈,例如,告诉用户:“没听清,请您再说一遍”;第三,自动评价系统可以不断学习进步,从而提升评价准确度。
可以理解地,ASR引擎的功能是将用户语音识别为文本,在实施例中,如图5所示,构建两个系统,一个是线上运行系统,一个是后端训练系统;其中,
所述线上运行系统,包括一个ASR主引擎(即前述实施例所述的第一识别模组的一种示例)、多个ASR参考引擎(即前述实施例所述的第二识别模组的一种示例)和ASR评估(Rator)模块。ASR Rator模块,它除了将用户语音传送给ASR主引擎之外,还将用户语音同时传送给多个ASR参考引擎,所述多个ASR参考引擎通常是不同模型的产品或市面上不同厂家的商业产品。ASRRator模块内置一个评价模型(即前述实施例所述的处理策略的一种示例),它根据主引擎和若干参考引擎返回的识别结果(即前述实施例所述的第一结果数据和第二结果数据的一种示例),评价出主引擎返回的识别结果的正确情况,即一个置信度分数R(即前述实施例所述的第一标识数据的一种示例),取值范围归一化为0.00-1.00。ASRRator模块设置有Rh和Rl这两个置信度阈值,且Rh>Rl。例如Rh=0.90,Rl=0.50,根据打分R的情况判定识别结果的错误情况,例如,当R>Rh时,表示足够准确,ASR Rator模块将主引擎的识别结果返回给用户;当Rl<R<Rh时,表示不很准确,但是可以接受,ASR Rator模块将主引擎的识别结果返回,同时ASR Rator模块将这个案例收藏用于训练改进评价模型;当R<Rl时,表示很不准确,不可接受,ASR Rator模块生成某种提示返回给用户,例如“我没有听清楚你的话”,同时ASR Rator模块将这个案例收藏用于训练改进评价模型。
后端训练系统设置有一个案例数据库,记录了ASR Rator模块收藏的错误案例,同时也记录了通过人工方式主动筛选更多的错误案例以使案例数据库中的数据更加全面。这些案例先进行人工数据标注,然后进入机器学习模型进行训练,结果满意之后生成改进的评价模型,该模型将更新到ASR Rator模块里。
需要说明的是,ASR Rator模块中的评价模型,主要基于这样一个原理:当ASR引擎识别接近于正确时,多个ASR引擎的识别结果接近于相同;当ASR引擎识别错误时,多个ASR引擎的识别结果有较大的不同。当ASR主引擎给出一个识别结果时,计算其他ASR参考引擎的识别结果与之的相对文本相似度(即前述实施例第一结果数据和第二结果数据的差异的一种示例),例如,以Levenshtein相似度的方法计算。例如一句语音,主引擎返回结果为T0,k个参考引擎返回结果分别为T1,T2,…,Tk,它们到T0的相似度分别为S1,S2,…,Sk。该句语音的识别结果文本由人工标注,正确结果记为为Tc,那么该句语音的识别结果T0到正确结果Tc的相似度为Sc,它表达了该句语音的ASR主引擎识别结果的置信度R,即Sc越高,置信度R越高。简单地,可以将Sc等同于R,并取2个经验值作为前文所述的Rh和Rl。在实现时,可以通过F(S1,S2,…,Sk)=Sc,确定置信度R,也就是将S1至Sk这k个相似度输入至函数F中,从而计算出置信度R。其中,函数F,可以通过收集大量的语句案例,并做数据标注之后,送入机器学习模型训练得到。该机器学习模型可以采用但不限于支持向量机模型,Rh,Rl两个阈值可凭经验指定。
基于前述的实施例,本申请实施例提供一种数据处理装置,该装置包括所包括的各模块、以及各模块所包括的各单元,可以通过电子设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图6为本申请实施例数据处理装置的组成结构示意图,如图6所示,所述装置600包括第一获取模块601、数据传输模块602、第二获取模块603、数据处理模块604和指令执行模块605,其中:
第一获取模块601,配置为:获得第一输入数据;
数据传输模块602,配置为:向第一识别模组传输所述第一输入数据;
第二获取模块603,配置为:获得第一结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;
数据处理模块604,配置为:处理所述第一结果数据,获得表征所述第一结果数据可靠性的第一标识数据;
指令执行模块605,配置为:如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
在其他实施例中,指令执行模块605,配置为:如果所述第一标识数据不满足所述第一条件,且所述第一标识数据满足第二条件,输出所述第一结果数据,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据。
在其他实施例中,指令执行模块605,还配置为:如果所述第一标识数据不满足所述第一条件,且所述第一标识数据满足第三条件,输出提示数据,所述提示数据用于提示再次输入第一输入数据。
在其他实施例中,数据传输模块602,配置为:向第一识别模组传输所述第一输入数据;且向第二识别模组传输所述第一输入数据;数据处理模块604,配置为:处理第一结果数据和第二结果数据,依据所述第一结果数据和第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据;其中,所述第二结果数据是所述第二识别模组识别所述第一输入数据后生成的。
在其他实施例中,指令执行模块605,还配置为:如果所述第一标识数据不满足所述第一条件,处理所述第二结果数据,获得表征所述第二结果数据可靠性的第二标识数据;如果所述第二标识数据满足所述第一条件,输出所述第二结果数据。
在其他实施例中,所述数据处理装置600还包括策略更新模块606,所述策略更新模块606,配置为:依据存储的至少一组第一输入数据的第一结果数据和第一标识数据,更新用于处理所述第一结果数据的处理策略。
在其他实施例中,所述策略更新模块606,配置为:获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;依据所述至少一组第一输入数据对应的第一结果数据、参考结果数据和第一标识数据,获得表征所述处理策略可靠性的第三标识数据;如果所述第三标识数据不满足第四条件,获得所述第一标识数据的参考标识数据;依据所述至少一组第一输入数据对应的第一标识数据和参考标识数据,更新所述处理策略。
在其他实施例中,所述数据处理装置600还包括模组更新模块607,所述模组更新模块607,配置为:获得存储的至少一组第一输入数据的第一结果数据;获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;依据所述至少一组第一输入数据的第一结果数据和参考结果数据,更新所述第一识别模组。
在其他实施例中,所述模组更新模块607,还配置为:依据获得的N个第一结果数据的第一标识数据,获得表征所述第一识别模组可靠性的第四标识数据;N为大于0的整数;依据获得的M个第二结果数据的第二标识数据,获得表征所述第二识别模组可靠性的第五标识数据;M为大于0的整数;如果所述第五标识数据和所述第四标识数据满足第五条件,将所述第一识别模组更新为所述第二识别模组;其中,所述第五条件为所述第五标识数据表征的可靠性优于所述第四标识数据表征的可靠性。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的数据处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read OnlyMemory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例提供一种数据处理设备,图7为本申请实施例数据处理设备的一种硬件实体示意图,如图7所示,该数据处理设备700的硬件实体包括:包括存储器701和处理器702,所述存储器701存储有可在处理器702上运行的计算机程序,所述处理器702执行所述程序时实现上述实施例中提供的数据处理方法中的步骤。
存储器701配置为存储由处理器702可执行的指令和应用,还可以缓存待处理器702以及数据处理设备700中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random AccessMemory,RAM)实现。
对应地,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的数据处理方法中的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得终端或服务器执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种数据处理方法,包括:
获得第一输入数据;
向第一识别模组和第二识别模组传输所述第一输入数据;
获得第一结果数据和第二结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;所述第二结果数据是所述第二识别模组识别所述第一输入数据后生成的;
处理所述第一结果数据和所述第二结果数据,依据所述第一结果数据和所述第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据;
如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;
如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
2.根据权利要求1所述的方法,所述如果所述第一标识数据不满足所述第一条件,执行第二指令,包括:
如果所述第一标识数据不满足所述第一条件,输出所述第一结果数据,且关联地存储所述第一输入数据、所述第一结果数据和所述第一标识数据。
3.根据权利要求1所述的方法,所述如果所述第一标识数据不满足所述第一条件,执行第二指令,还包括:
如果所述第一标识数据不满足所述第一条件,输出提示数据,所述提示数据用于提示再次输入第一输入数据。
4.根据权利要求1所述的方法,所述如果所述第一标识数据不满足所述第一条件,执行第二指令,还包括:
如果所述第一标识数据不满足所述第一条件,处理所述第二结果数据,获得表征所述第二结果数据可靠性的第二标识数据;
如果所述第二标识数据满足所述第一条件,输出所述第二结果数据。
5.根据权利要求2或3所述的方法,还包括:
依据存储的至少一组第一输入数据的第一结果数据和第一标识数据,更新用于处理所述第一结果数据的处理策略。
6.根据权利要求5所述的方法,所述依据存储的至少一组第一输入数据的第一结果数据和第一标识数据,更新用于处理所述第一结果数据的处理策略,包括:
获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;
依据所述至少一组第一输入数据对应的第一结果数据、参考结果数据和第一标识数据,获得表征所述处理策略可靠性的第三标识数据;
如果所述第三标识数据不满足第四条件,获得所述第一标识数据的参考标识数据;
依据所述至少一组第一输入数据对应的第一标识数据和参考标识数据,更新所述处理策略。
7.根据权利要求2或3所述的方法,还包括:
获得存储的至少一组第一输入数据的第一结果数据;
获得所述至少一组第一输入数据的参考结果数据,所述参考结果数据和所述第一结果数据不同;
依据所述至少一组第一输入数据的第一结果数据和参考结果数据,更新所述第一识别模组。
8.根据权利要求4所述的方法,所述方法还包括:
依据获得的N个第一结果数据的第一标识数据,获得表征所述第一识别模组可靠性的第四标识数据;N为大于0的整数;
依据获得的M个第二结果数据的第二标识数据,获得表征所述第二识别模组可靠性的第五标识数据;M为大于0的整数;
如果所述第五标识数据和所述第四标识数据满足第五条件,将所述第一识别模组更新为所述第二识别模组;其中,所述第五条件为所述第五标识数据表征的可靠性优于所述第四标识数据表征的可靠性。
9.一种数据处理装置,包括:
第一获取模块,配置为:获得第一输入数据;
数据传输模块,配置为:向第一识别模组和第二识别模组传输所述第一输入数据;
第二获取模块,配置为:获得第一结果数据和第二结果数据,其中,所述第一结果数据是所述第一识别模组识别所述第一输入数据后生成的;所述第二结果数据是所述第二识别模组识别所述第一输入数据后生成的;
数据处理模块,配置为:处理所述第一结果数据和所述第二结果数据,依据所述第一结果数据和所述第二结果数据的差异,获得表征所述第一结果数据可靠性的第一标识数据;
指令执行模块,配置为:如果所述第一标识数据满足第一条件,执行第一指令,输出所述第一结果数据;如果所述第一标识数据不满足所述第一条件,执行第二指令,其中,所述第一指令和所述第二指令不同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910252033.8A CN109979454B (zh) | 2019-03-29 | 2019-03-29 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910252033.8A CN109979454B (zh) | 2019-03-29 | 2019-03-29 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109979454A CN109979454A (zh) | 2019-07-05 |
CN109979454B true CN109979454B (zh) | 2021-08-17 |
Family
ID=67081773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910252033.8A Active CN109979454B (zh) | 2019-03-29 | 2019-03-29 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109979454B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
EP2728576A1 (en) * | 2012-11-06 | 2014-05-07 | Samsung Electronics Co., Ltd | Method and apparatus for voice recognition |
CN104239853A (zh) * | 2014-08-27 | 2014-12-24 | 北京捷通华声语音技术有限公司 | 一种图像的处理方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1262954A1 (en) * | 2001-05-30 | 2002-12-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for verbal entry of digits or commands |
US20090240498A1 (en) * | 2008-03-19 | 2009-09-24 | Microsoft Corporation | Similiarity measures for short segments of text |
CN102215233A (zh) * | 2011-06-07 | 2011-10-12 | 盛乐信息技术(上海)有限公司 | 信息系统客户端及信息发布与获取方法 |
CN103903617A (zh) * | 2012-12-24 | 2014-07-02 | 联想(北京)有限公司 | 一种语音识别方法及电子设备 |
CN106228975A (zh) * | 2016-09-08 | 2016-12-14 | 康佳集团股份有限公司 | 一种移动终端的语音识别系统及方法 |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与系统 |
CN107564524A (zh) * | 2017-10-20 | 2018-01-09 | 高井云 | 工业机器人的语音控制系统和方法 |
-
2019
- 2019-03-29 CN CN201910252033.8A patent/CN109979454B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
EP2728576A1 (en) * | 2012-11-06 | 2014-05-07 | Samsung Electronics Co., Ltd | Method and apparatus for voice recognition |
CN104239853A (zh) * | 2014-08-27 | 2014-12-24 | 北京捷通华声语音技术有限公司 | 一种图像的处理方法和装置 |
Non-Patent Citations (2)
Title |
---|
Efficient On-The-Fly Hypothesis Rescoring in a Hybrid GPU/CPU-based Large Vocabulary Continuous Speech Recognition Engine;Jungsuk Kim et al;《INTERSPEECH 2012 ISCA"s 13th Annual Conference》;20120913;全文 * |
多路并行的语音识别引擎的设计与实现;吉鸿雁等;《计算机应用》;20030828;第23卷(第8期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109979454A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991366B2 (en) | Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query | |
JP2019079034A (ja) | 自己学習自然言語理解を伴うダイアログ・システム | |
CN111046133A (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
CN108038208B (zh) | 上下文信息识别模型的训练方法、装置和存储介质 | |
CN111261162B (zh) | 语音识别方法、语音识别装置及存储介质 | |
CN111554276B (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN110998719A (zh) | 信息处理设备和信息处理方法 | |
US11816609B2 (en) | Intelligent task completion detection at a computing device | |
CN112417158A (zh) | 文本数据分类模型的训练方法、分类方法、装置和设备 | |
EP3980991B1 (en) | System and method for recognizing user's speech | |
CN114218945A (zh) | 实体识别方法、装置、服务器及存储介质 | |
CN109408175B (zh) | 通用高性能深度学习计算引擎中的实时交互方法及系统 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN108153875B (zh) | 语料处理方法、装置、智能音箱和存储介质 | |
CN112786028A (zh) | 声学模型处理方法、装置、设备和可读存储介质 | |
CN109979454B (zh) | 数据处理方法及装置 | |
CN112052316A (zh) | 模型评估方法、装置、存储介质及电子设备 | |
JP6839001B2 (ja) | モデル学習装置、情報判定装置およびそれらのプログラム | |
CN111680514A (zh) | 信息处理和模型训练方法、装置、设备及存储介质 | |
CN114783424A (zh) | 文本语料筛选方法、装置、设备及存储介质 | |
CN112037772A (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
KR102422844B1 (ko) | 인공지능에 기반하여 영상 컨텐츠의 언어 위기를 관리하는 방법 | |
CN114548103B (zh) | 一种命名实体识别模型的训练方法和命名实体的识别方法 | |
CN113111652B (zh) | 数据处理方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |