CN112837687A - 一种答题方法、装置、计算机设备及存储介质 - Google Patents

一种答题方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112837687A
CN112837687A CN202110235038.7A CN202110235038A CN112837687A CN 112837687 A CN112837687 A CN 112837687A CN 202110235038 A CN202110235038 A CN 202110235038A CN 112837687 A CN112837687 A CN 112837687A
Authority
CN
China
Prior art keywords
voice
answer
voice recognition
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110235038.7A
Other languages
English (en)
Inventor
张帆
李伟
王冠军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baijia Technology Group Co ltd
Original Assignee
Beijing Baijia Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baijia Technology Group Co ltd filed Critical Beijing Baijia Technology Group Co ltd
Priority to CN202110235038.7A priority Critical patent/CN112837687A/zh
Publication of CN112837687A publication Critical patent/CN112837687A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开提供了一种答题方法、装置、计算机设备及存储介质,其中,该方法包括:获取用户针对目标题目录制的答题语音信息;通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;基于所述语音识别结果,确定用户针对所述目标题目的答题结果。从而,通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。

Description

一种答题方法、装置、计算机设备及存储介质
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种答题方法、装置、计算机设备及存储介质。
背景技术
为了提高学生的运算能力,在学校或是一些课外辅导机构会面向学龄儿童,开设一些口算课程以训练学生的口算能力。但是由于时间和场地的限制,无法使得学生可以利用零散的空闲时间进行口算能力训练,因此市面了涌现了大量的答题口算类应用程序(Application,APP),使得学生可以随时随地地进行口算答题,更便捷地提升学生的口算答题能力。
目前的答题口算类APP大多是基于学生手写输入的答案来判断学生的作答情况,但是由于手写识别技术的限制,对于学生的手写输入速度具有一定的限制,例如:需要在一定的时间间隔内手写输入全部答案,若手写速度较慢,则易被识别系统认定为手写输入结束,从而判定错误,给学生答题造成不便;又或者,需要在手写输入一个数字或者字符之后,等待一定的时间间隔,才能继续进行手写输入,使得学生手写等待时间较长,答题效率较低,进而导致学生答题过程的沉浸感较低。
发明内容
本公开实施例至少提供一种答题方法、装置、计算机设备及存储介质。
第一方面,本公开实施例提供了一种答题方法,所述答题方法包括:
获取用户针对目标题目录制的答题语音信息;
通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
在本公开实施例,利用语音输入代替手写输入,提高用户的答题速率,从而提高用户的答题体验感与沉浸感。
一种可选的实施方式中,所述获取用户针对目标题目录制的答题语音信息,包括:
响应于针对所述目标题目的语音录制触发操作,获取所述答题语音信息,直到检测到语音录制完成。
一种可选的实施方式中,所述语音录制触发操作包括以下至少一种:
触发预设的语音录制启动按钮、触发预设的语音录制启动区域、触发预设的语音录制启动链接。
在本可选的实施方式中,通过多种预设的触发操作,可以提高用户的操作体验感。
一种可选的实施方式中,通过以下步骤检测语音录制是否完成:
当所述答题语音信息的声音响度低于预设的响度最低值,且所述声音响度低于所述响度最低值的时长大于预设时长阈值时,确定所述用户针对目标题目的语音录制完成。
在本可选的实施方式中,基于用户的声音特征,智能判定用户是否完成语音录制,从而提高对于任一题目的时间消耗,提高答题效率。
一种可选的实施方式中,通过以下步骤确定与当前网络传输速度匹配的语音识别工具:
当所述当前网络传输速度等于或低于所述网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
当所述当前网络传输速度高于所述网络调度阈值时,确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。在本可选的实施方式中,通过判断当前的网络状态,选取匹配的语音识别工具,从而提高对于用户答题语音的识别效率。
一种可选的实施方式中,当所述当前网络传输速度高于所述网络调度阈值时,所述答题方法包括:
获取用户针对预设的语音识别测试信息发出的语音测试信息;
通过所述本地语音识别包对所述语音测试信息进行语音识别,并根据所述语音测试信息的语音识别结果和所述语音测试信息,对所述语音识别结果进行准确率判定;
若所述语音测试信息的语音识别结果的准确率高于预设的准确率阈值,则确定调用所述本地语音识别包,作为针对所述答题语音信息的语音识别工具;
若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定所述网络语音识别包,作为针对所述答题语音信息的语音识别工具。
在本可选的实施方式中,当网络状态较佳时,可以调用网络识别的方法,从而确保对于用户答题语音的识别准确率。
一种可选的实施方式中,在得到与所述答题语音信息对应的语音识别结果之后,所述答题方法还包括:
响应于用户针对前端展示的所述目标题目的语音识别结果的修改操作,获取所述用户输入的针对所述语音识别结果的修改内容;
基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
在本可选的实施方式中,当语音识别结果并非用户想要表达的结果时,可以启动手动修正机制,确保可以正确判断用户对于目标题目的答题情况。
第二方面,本公开实施例还提供一种答题装置,所述答题装置包括:
第一获取模块,用于获取用户针对目标题目录制的答题语音信息;
识别模块,用于通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
第一确定模块,用于基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
一种可选的实施方式中,所述第一获取模块具体用于:
响应于针对所述目标题目的语音录制触发操作,获取所述答题语音信息,直到检测到语音录制完成。
一种可选的实施方式中,所述语音录制触发操作包括以下至少一种:
触发预设的语音录制启动按钮、触发预设的语音录制启动区域、触发预设的语音录制启动链接。
一种可选的实施方式中,所述答题装置还包括:检测模块;
所述检测模块具体用于:当所述答题语音信息的声音响度低于预设的响度最低值,且所述声音响度低于所述响度最低值的时长大于预设时长阈值时,确定所述用户针对目标题目的语音录制完成。
一种可选的实施方式中,所述答题装置还包括:第二确定模块;
所述第二确定模块包括:
确定单元,用于当所述当前网络传输速度等于或低于所述网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
调用单元,用于当所述当前网络传输速度高于所述网络调度阈值时,确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
一种可选的实施方式中,所述确定单元还用于:
获取用户针对预设的语音识别测试信息发出的语音测试信息;
通过所述本地语音识别包对所述语音测试信息进行语音识别,并根据所述语音测试信息的语音识别结果和所述语音测试信息,对所述语音识别结果进行准确率判定;
若所述语音测试信息的语音识别结果的准确率高于预设的准确率阈值,则确定所述本地语音识别包,作为针对所述答题语音信息的语音识别工具;
若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定所述网络语音识别包,作为针对所述答题语音信息的语音识别工具。
一种可选的实施方式中,所述答题装置还包括:
第二获取模块,用于响应于用户针对前端展示的所述目标题目的语音识别结果的修改操作,获取所述用户输入的针对所述语音识别结果的修改内容;
第三确定模块,用于基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本公开实施例提供的一种答题方法、装置、计算机设备及存储介质,包括:获取用户针对目标题目录制的答题语音信息;通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
本公开实施例中,通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种答题方法的流程图;
图2示出了本公开实施例所提供的另一种答题方法的流程图;
图3示出了本公开实施例所提供的一种答题装置的示意图;
图4示出了本公开实施例所提供的另一种答题装置的示意图;
图5示出了本公开实施例所提供的答题装置中,第二确定模块的具体示意图;
图6示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,目前的答题口算类APP大多是基于学生手写输入的答案来判断学生的作答情况,但是由于手写识别技术的限制,对于学生的手写输入速度具有一定的限制,例如:需要在一定的时间间隔内手写输入全部答案,若手写速度较慢,则易被识别系统认定为手写输入结束,从而判定错误,给学生答题造成不便;又或者,需要在手写输入一个数字或者字符之后,等待一定的时间间隔,才能继续进行手写输入,使得学生手写等待时间较长,答题效率较低,进而导致学生答题过程的沉浸感较低。
基于上述研究,本公开提供了一种答题,包括:获取用户针对目标题目录制的答题语音信息;通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;基于所述语音识别结果,确定用户针对所述目标题目的答题结果。从而,通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种答题方法进行详细介绍,本公开实施例所提供的答题方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该答题方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例提供的答题方法的流程图,所述方法包括步骤S101~S103,其中:
S101:获取用户针对目标题目录制的答题语音信息。
该步骤中,基于预设的语音录制功能,可以获取用户在针对目标题目作答时、全部过程中发出的答题语音信息。
具体的,可以响应于针对所述目标题目的语音录制触发操作,获取所述答题语音信息,直到检测到语音录制完成。
其中,所述语音录制触发操作包括以下至少一种:
触发预设的语音录制启动按钮、触发预设的语音录制启动区域、触发预设的语音录制启动链接。
示例性的,当用户想要进行答题操作时,可以进入对应的答题界面,答题界面上显示有对应的题目选项,当用户确定想要回答的题目时,在答题界面上会显示出对应的答题启动标识,例如:启动按钮、启动区域、启动连接等,通过多种预设的触发操作,可以提高用户的操作体验感。当用户点击对应的启动标识时,便可以触发针对该目标题目的录制机制,获取所述用户针对目标题目录制的答题语音信息,直到检测到语音录制完成。
在一些可能的实施方式中,在启动语音录制之前,还可以获取设备的录音权限,在获得授权之后,开始语音录制,对此不做赘述。
在本公开的另一个实施例中,若在检测到所述语音录制触发操作之后的预设语音录制时间内,未获取到所述用户发出的答题语音内容,则结束针对所述目标题目的语音录制。
默认的,在用户启动语音录制之后,可以将获取的所有语音信息均作为答题语音内容,当其中包含多种语音信息时,可进行去噪处理,进行语音筛选,选择出实际的答题语音内容,对此不做任何限定。
示例性的,当用户触发语音录制机制之后,若在一定的、预设的语音录制时间内,没有获取到任何语音信息的时候,便可以结束对该目标题目的录制过程。从而,可以及时终止对于未获取到语音信息的目标题目的录制过程,可以减少用户针对任一题目的时间消耗,提高答题效率,避免由于用户离开、溜号或者无法作答而造成时间浪费的情况发生。
此外,在本公开的另一个实施例中,若未能检测到用户发出的答题语音内容之后,可以以屏幕显示或提醒音的方法提醒用户进行作答,或者在预设的时间阈值之后,继续停留在当前答题题目,不做跳转,或是延长针对当前答题题目的作答时间等,在此不做赘述。
S102:通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果。
该步骤中,在用户对目标题目录制完成之后,便可以对录制的答题语音信息进行识别,从而确定对应的语音识别结果。
具体的,可以通过以下步骤检测语音录制是否完成:
当所述答题语音信息的声音响度低于预设的响度最低值,且所述声音响度低于所述响度最低值的时长大于预设时长阈值时,确定所述用户针对目标题目的语音录制完成。
其中,响度最低值是指能够被清晰识别出具体内容的声音响度的最低取值,即,低于这个值,获取到的答题语音信息无法识别,可认为用户没有说话,或者已经说完;高于这个值,获取到的答题语音信息可以被精准识别出来。预设时长阈值是指可以为用户设置的等待时间的最小值,即,低于这个时长,可以认为是用户正在组织语言、语言出现卡顿等,可以选择等待,高于这个时长,认为用户已经说完,选择退出。
在一些可能的实施方式中,用户还可以在答题语音信息的最后加上结束性语音,意味着此次语音录制已经结束,无需等待。例如在用户回答很快的场景中,预留答复时间为20秒,用户实际仅用5秒完成,用户可以在说完答案之后加上“答题结束”等语音,指示系统提前跳转至下一题或者提交。
当然,除了用户在发语音时加上结束性语音之外,还可手动操作,例如手动点击开启,也可手动点击结束,对此不做赘述。
在一些可能的实施方式中,用户在答题过程中,还可选择暂停,例如在背古诗的场景中,用户点击启动,开始背诵“落霞与孤鹜齐飞”,突然想不起来下一句,可以先按暂停按键,或者语音操作,想起来之后,点击继续按键(启动、暂定、继续、结束各按键可为同一个,也可部分或者全部相同),背诵“秋水共长天一色”,然后点击结束按键或者等待自动结束,或者语音操作结束,对此不做任何限定。
示例性的,由于人类的发声特性,即开始发声以及结束发声时对应的音调(声音响度)有所不同,因此可以基于对答题语音信息的声音响度判断来确定用户是否完成了对于目标题目的语音录制过程。具体的,可以首先基于所述用户针对目标题目录制的答题语音信息,获取所述答题语音信息的声音响度,并在对用户的答题语音信息进行录制的同时,对该答题语音信息的声音响度进行检测,当所述声音响度低于预设的响度最低值时,可以粗测用户将要完成答题语音录制,当声音响度低于预设的响度最低值的时长大于预设的时长阈值时,即在一段时间内,一直包括声音响度较低的状态时,便可以判定用户针对目标题目的语音录制完成。由此,可以基于用户的声音特征,智能判定用户是否完成语音录制,从而提高对于任一题目的时间消耗,提高答题效率。
此外,还可以基于用户声音的其他特性,例如声音频率、声音识别清晰度等判定检测语音录制是否完成。
在本公开实施例中,为了更好、更准确地对用户的答题语音信息进行识别,在进行语音识别之前,还可以确定最适配于当前环境的语音识别机制,即选取最适合当前环境的语音识别工具。
具体的,可以通过以下步骤确定与当前网络传输速度匹配的语音识别工具:
当所述当前网络传输速度等于或低于网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
当所述当前网络传输速度高于所述网络调度阈值时,确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
网络调度阈值是指能够保证传输答题语音信息并基于该答题语音信息在远端服务器或者云端服务器进行数据获取的最低网络传输速度,即高于网络调度阈值时,意味着网络传输速度很好,可以采用远端或者云端的语音识别包对答题语音信息进行识别和分析,低于网络调度阈值时,意味着网络传输速度较差,只能采用本地语音识别包对答题语音信息进行识别和分析,对此不做赘述。
示例性的,可以通过网速测试工作,获取当前答题环境的网络传输速度,并将测试得到的网络传输速度与预先设置的网络调度阈值进行比对。当前网络传输速度等于或低于所述网络调度阈值时,即当前网络传输速度较差时,无法实现对于线上语音包的调用,因此,当所当前网络传输速度等于或低于所述网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对答题语音信息的语音识别工具。对应的,当前网络传输速度高于所述网络调度阈值时,即当前网络传输速度较佳时,可以实现对于线上语音包的调用时,可以确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。从而可以通过判断当前的网络状态,选取匹配的语音识别工具,从而提高对于用户答题语音的识别效率
在本公开实施例中,对应于当前网络传输速度高于所述网络调度阈值的情况时,对于调用本地语音包还是线上语音包的选取包括以下步骤:
获取用户针对预设的语音识别测试信息发出的语音测试信息;
通过所述本地语音识别包对所述语音测试信息进行语音识别,并根据所述语音测试信息的语音识别结果和所述语音测试信息,对所述语音识别结果进行准确率判定;
若所述语音测试信息的语音识别结果的准确率高于预设的准确率阈值,则确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
准确率阈值指的是识别出的语音信息和实际录入的答题语音信息之间的误差处于容错范围的最低准确率,即低于准确率阈值,识别出的语音信息和实际录入的答题语音信息之间的误差太大,无法表征正确含义,高于准确度阈值,识别出的语音信息和答题语音信息之间的误差很小,不影响表征正确含义,对此不做赘述。
具体的,当网络传输速度较佳时,为了确保可以对用户的答题语音信息准确的识别,因此可以设立一定的识别检测机制,以确立最佳的语音识别工具。
示例性的,当用户进行答题界面时,首先进行语音测试界面,当界面上出现目标汉字、字母、或数字等文本时,用户可以基于该展示文本发出语音,并通过录制机制获取用户的语音测试信息。由于利用本地语音包对答题语音信息进行识别时无需占用线上资源,且识别速度较快,因此,首先采用本地语音识别包对语音测试信息进行识别,并与预先设定的语音测试结果进行比对,获取本地语音识别包对语音测试信息的识别准确率。若本地语音识别包的语音识别结果的准确率高于预设的准确率阈值,则直接确定调用存储于本地的本地语音识别包,作为针对答题语音信息的语音识别工具,其中,该准确率阈值可以设定为90%等较高的数值,以确保对于用户答题语音识别信息的识别准确性。对应的,若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
此外,在本公开实施例中,针对于调用在线语音识别包的情况,还可以基于在线语音识别结果对本地语音识别包进行更新修正,以适应不同用户的发声特性,例如:中文场景、外文(英韩日等)场景、方言特性、发声习惯等,以确保在网络传输速度不佳时也可以很好地对用户发出的答题语音信息进行识别,以及减少对于线上语音识别包的调用。
S103:基于所述语音识别结果,确定所述用户针对所述目标题目的答题结果。
该步骤中,当获取到用户针对目标题目的语音识别结果时,便可以基于该语音识别结果确定用户对目标题目的解答正确与否。
具体的,基于针对用户针对目标题目发出的语音,得到对应的语音识别结果,并将该结果与预设的目标题目答案相比照,由此,便可以判定出该用户对于目标题目的答题结果。
在本公开另一实施例中,所述基于所述语音识别结果,确定所述用户针对所述目标题目的答题结果,包括:
若所述语音识别结果包括目标关键词,则针对所述目标题目执行与所述目标关键词对应的预设操作,以及确定所述用户针对所述目标题目的答题结果;
若所述语音识别结果不包括所述目标关键词,则对所述语音识别结果进行判断,确定所述用户针对所述目标题目的答题结果。
示例性的,目标关键词可以为“过”、“跳过”、“下一题”等指示性的词语,当检测到目标关键词时,便可以执行与目标关键词对应的预设操作,例如:“过”或“下一题”对应跳转至下一题等,并且基于预设的操作与答题结果的对应关系,确定用户针对目标题目的答题结果,例如,用户跳过了目标题目,便可以确定用户针对该目标题目未作答或记为零分等。
对应的,若语音识别结果不包括目标关键词,则可以对所述语音识别结果进行判断,确定所述用户针对所述目标题目的答题结果。例如:算数结果、背诵结果等。
本公开实施例中,通过获取用户针对目标题目录制的答题语音信息;通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;基于所述语音识别结果,确定用户针对所述目标题目的答题结果。从而,通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。
在一种可能的实施方式中,在确定答题结果正确时,可以向用户反馈奖励信息,如自动在用户账户增加可以用来购买课时的金币、学币、经验值等,或者,也可以向用户反馈动画、语音等,且奖励信息可以在每一题结束之后立即反馈,也可以在整个试题做完之后一并反馈,一并反馈时,还可向用户发送正确率、较上次的提升率、待提高知识点等,对此不做赘述。
在一种可能的实施方式中,在确定答题结果错误时,可以向用户反馈待提高信息,如自动在用户档案中标记易错题目、薄弱知识点等,或者,也可以向用户反馈动画、语音等,且待提高信息可以在每一题结束之后立即反馈,也可以在整个试题做完之后一并反馈,一并反馈时,还可向用户发送正确率、较上次的提高率、待提高知识点、推荐学习课程、推荐学习规划时间等,方便用户及时根据待提高信息转变学习策略,对此不做赘述。
参见图2所示,图2公开实施例提供的另一种答题方法的流程图,所述方法包括步骤S201~S204:
S201:获取用户针对目标题目录制的答题语音信息。
S202:通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果。
其中,步骤S201至步骤S202的描述可以参考步骤S101至步骤S102的描述,并且可以达到相同的技术效果,在此不再赘述。
S203:响应于用户针对前端展示的所述目标题目的语音识别结果的修改操作,获取所述用户输入的针对所述语音识别结果的修改内容。
S204:基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
在本公开实施例中,由于语音识别技术尚不完全成熟,且针对不同的用户的使用体验有所偏差,因此本公开实施例中设置一修改机制,使得用户可以修改识别出的语音结果,以获取正确的答题结果。
示例性的,当识别出语音识别结果之后,可以在屏幕上展示语音识别结果,用户可以查看并判断该语音识别结果是不是想要表达的语音内容,当该语音识别结果不是想要表达的语音内容时,可以通过设置的修改按钮、修改链接等,进行修改操作,即手动输入针对目标题目的答题结果,从而确保可以正确判断用户对于目标题目的答题情况。
在获取用户输入的针对语音识别结果的修改内容之后,便可以基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
本公开实施例中,通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。
在一种可能的实施方式中,修改内容可以进行语音录入,也可手写输入,对此不做任何限定。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
进一步地,在本申请中,还可基于用户的答题结果作出相应的信息推送,例如课程推荐、课时安排等,对此不做赘述。
基于同一发明构思,本公开实施例中还提供了与答题方法对应的答题装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述答题方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图3所示,为本公开实施例提供的一种答题装置的示意图,所述装置包括:第一获取模块310、识别模块320、第一确定模块330;其中,
第一获取模块310,用于获取用户针对目标题目录制的答题语音信息;
识别模块320,用于通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
第一确定模块330,用于基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
本公开实施例通过对用户答题语音的识别,从而确定用户的答题结果,可以减少用户在答题过程中的操作过程,提高用户的答题效率,增加用户在答题过程中的沉浸感。
一种可选的实施方式中,所述第一获取模块310具体用于:
响应于针对所述目标题目的语音录制触发操作,获取所述用户针对目标题目录制的答题语音信息,直到检测到语音录制完成。
一种可选的实施方式中,所述语音录制触发操作包括以下至少一种:
触发预设的语音录制启动按钮、触发预设的语音录制启动区域、触发预设的语音录制启动链接。
一种可选的实施方式中,所述答题装置还包括:检测模块340;
所述检测模块340具体用于:基于所述答题语音信息,获取所述答题语音信息的声音响度;
当所述声音响度低于预设的响度最低值,且所述声音响度低于预设的响度最低值的时长大于预设的低频时长阈值时,确定所述用户针对目标题目的语音录制完成。
一种可选的实施方式中,所述答题装置还包括:第二确定模块350;
所述第二确定模块350包括:
确定单元351,用于当所述当前网络传输速度等于或低于所述网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
调用单元352,用于当所述当前网络传输速度高于所述网络调度阈值时,确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
一种可选的实施方式中,所述确定单元352还用于:
获取用户针对预设的语音识别测试信息发出的语音测试信息;
通过所述本地语音识别包对所述语音测试信息进行语音识别,并根据所述语音测试信息的语音识别结果和所述语音测试信息,对所述语音识别结果进行准确率判定;
若所述语音测试信息的语音识别结果的准确率高于预设的准确率阈值,则确定所述本地语音识别包,作为针对所述答题语音信息的语音识别工具;
若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定所述网络语音识别包,作为针对所述答题语音信息的语音识别工具。
一种可选的实施方式中,所述答题装置还包括:
第二获取模块360,用于响应于用户针对前端展示的所述目标题目的语音识别结果的修改操作,获取所述用户输入的针对所述语音识别结果的修改内容;
第三确定模块370,用于基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
对应于图1中的答题方法,本公开实施例还提供了一种计算机设备,如图6所示,为本公开实施例提供的计算机设备结构示意图,包括:
处理器601、存储器602、和总线603;存储器602用于存储执行指令,包括内存6021和外部存储器6022;这里的内存6021也称内存储器,用于暂时存放处理器601中的运算数据,以及与硬盘等外部存储器6022交换的数据,处理器601通过内存6021与外部存储器6022进行数据交换,当所述计算机设备运行时,所述处理器601与所述存储器602之间通过总线603通信,使得所述处理器601执行以下指令:
获取用户针对目标题目录制的答题语音信息;
通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的答题方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的答题方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种答题方法,其特征在于,所述答题方法包括:
获取用户针对目标题目录制的答题语音信息;
通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
2.根据权利要求1所述的答题方法,其特征在于,所述获取用户针对目标题目录制的答题语音信息,包括:
响应于针对所述目标题目的语音录制触发操作,获取所述答题语音信息,直到检测到语音录制完成。
3.根据权利要求2所述的答题方法,其特征在于,所述语音录制触发操作包括以下至少一种:
触发预设的语音录制启动按钮、触发预设的语音录制启动区域、触发预设的语音录制启动链接。
4.根据权利要求2所述的答题方法,其特征在于,通过以下步骤检测语音录制是否完成:
当所述答题语音信息的声音响度低于预设的响度最低值,且所述声音响度低于所述响度最低值的时长大于预设时长阈值时,确定所述用户针对目标题目的语音录制完成。
5.根据权利要求1所述的答题方法,其特征在于,通过以下步骤确定与当前网络传输速度匹配的语音识别工具:
当所述当前网络传输速度等于或低于网络调度阈值时,确定调用存储于本地的本地语音识别包,作为针对所述答题语音信息的语音识别工具;
当所述当前网络传输速度高于所述网络调度阈值时,确定调用所述本地语音识别包作为针对所述答题语音信息的语音识别工具,或者,调用预先配置的网络语音识别包,作为针对所述答题语音信息的语音识别工具。
6.根据权利要求5所述的答题方法,其特征在于,当所述当前网络传输速度高于所述网络调度阈值时,所述答题方法包括:
获取用户针对预设的语音识别测试信息发出的语音测试信息;
通过所述本地语音识别包对所述语音测试信息进行语音识别,并根据所述语音测试信息的语音识别结果和所述语音测试信息,对所述语音识别结果进行准确率判定;
若所述语音测试信息的语音识别结果的准确率高于预设的准确率阈值,则确定调用所述本地语音识别包,作为针对所述答题语音信息的语音识别工具;
若所述语音测试信息的语音识别结果的准确率低于预设的准确率阈值时,则确定所述网络语音识别包,作为针对所述答题语音信息的语音识别工具。
7.根据权利要求1所述的答题方法,其特征在于,在得到与所述答题语音信息对应的语音识别结果之后,所述答题方法还包括:
响应于用户针对前端展示的所述目标题目的语音识别结果的修改操作,获取所述用户输入的针对所述语音识别结果的修改内容;
基于所述修改内容,确定所述用户针对所述目标题目的答题结果。
8.一种答题装置,其特征在于,所述答题装置包括:
第一获取模块,用于获取用户针对目标题目录制的答题语音信息;
识别模块,用于通过与当前网络传输速度匹配的语音识别工具,对所述答题语音信息进行语音识别,得到与所述答题语音信息对应的语音识别结果;
第一确定模块,用于基于所述语音识别结果,确定用户针对所述目标题目的答题结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的答题方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一项所述的答题方法的步骤。
CN202110235038.7A 2021-03-03 2021-03-03 一种答题方法、装置、计算机设备及存储介质 Pending CN112837687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110235038.7A CN112837687A (zh) 2021-03-03 2021-03-03 一种答题方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110235038.7A CN112837687A (zh) 2021-03-03 2021-03-03 一种答题方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112837687A true CN112837687A (zh) 2021-05-25

Family

ID=75934507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110235038.7A Pending CN112837687A (zh) 2021-03-03 2021-03-03 一种答题方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112837687A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407093A (zh) * 2021-06-21 2021-09-17 珠海格力电器股份有限公司 一种电子福利发放方法、装置、存储介质及设备
CN113438492A (zh) * 2021-06-02 2021-09-24 广州方硅信息技术有限公司 直播中的题目生成方法、系统、计算机设备及存储介质
CN113793539A (zh) * 2021-09-16 2021-12-14 联想(北京)有限公司 辅助教学方法、装置及电子设备和存储介质
CN114155844A (zh) * 2021-12-21 2022-03-08 科大讯飞股份有限公司 一种评分方法、装置、计算设备及存储介质
CN114566167A (zh) * 2022-02-28 2022-05-31 安徽淘云科技股份有限公司 语音答题方法、装置、电子设备和存储介质
CN116153312A (zh) * 2023-03-05 2023-05-23 广州网才信息技术有限公司 利用语音识别的在线笔试方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050001160A (ko) * 2003-06-27 2005-01-06 주식회사 케이티 네트워크 상황에 따른 선택적 음성인식 장치 및 그 방법
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备
CN107678561A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 基于人工智能的语音输入纠错方法及装置
CN109524027A (zh) * 2018-12-11 2019-03-26 平安科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质
CN111881675A (zh) * 2020-06-30 2020-11-03 北京百度网讯科技有限公司 文本纠错方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050001160A (ko) * 2003-06-27 2005-01-06 주식회사 케이티 네트워크 상황에 따른 선택적 음성인식 장치 및 그 방법
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备
CN107678561A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 基于人工智能的语音输入纠错方法及装置
CN109524027A (zh) * 2018-12-11 2019-03-26 平安科技(深圳)有限公司 语音处理方法、装置、计算机设备及存储介质
CN111881675A (zh) * 2020-06-30 2020-11-03 北京百度网讯科技有限公司 文本纠错方法、装置、电子设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113438492A (zh) * 2021-06-02 2021-09-24 广州方硅信息技术有限公司 直播中的题目生成方法、系统、计算机设备及存储介质
CN113407093A (zh) * 2021-06-21 2021-09-17 珠海格力电器股份有限公司 一种电子福利发放方法、装置、存储介质及设备
CN113407093B (zh) * 2021-06-21 2022-05-20 珠海格力电器股份有限公司 一种电子福利发放方法、装置、存储介质及设备
CN113793539A (zh) * 2021-09-16 2021-12-14 联想(北京)有限公司 辅助教学方法、装置及电子设备和存储介质
CN114155844A (zh) * 2021-12-21 2022-03-08 科大讯飞股份有限公司 一种评分方法、装置、计算设备及存储介质
CN114566167A (zh) * 2022-02-28 2022-05-31 安徽淘云科技股份有限公司 语音答题方法、装置、电子设备和存储介质
CN116153312A (zh) * 2023-03-05 2023-05-23 广州网才信息技术有限公司 利用语音识别的在线笔试方法和装置

Similar Documents

Publication Publication Date Title
CN112837687A (zh) 一种答题方法、装置、计算机设备及存储介质
CN108537207B (zh) 唇语识别方法、装置、存储介质及移动终端
US20190217206A1 (en) Method and system for training a chatbot
CN108427722A (zh) 智能交互方法、电子装置及存储介质
CN110009537B (zh) 一种信息处理方法、装置、设备及存储介质
CN111723855A (zh) 一种学习知识点的显示方法、终端设备及存储介质
CN109119071A (zh) 一种语音识别模型的训练方法及装置
US20040023195A1 (en) Method for learning language through a role-playing game
CN109977426A (zh) 一种翻译模型的训练方法、装置以及机器可读介质
CN106920428B (zh) 一种基于阿拉伯数字和汉字的综合认知方法及系统
CN113486970B (zh) 阅读能力评测方法及装置
CN113763962A (zh) 音频处理方法、装置、存储介质及计算机设备
CN108986796A (zh) 一种语音搜索方法及装置
CN110070858B (zh) 一种文明用语提醒方法、装置及移动设备
CN111027358A (zh) 一种基于书写进度的听写报读方法及电子设备
CN109712443A (zh) 一种内容跟读方法、装置、存储介质及电子设备
US20240249713A1 (en) Information processing device and information processing method
CN112800192B (zh) 多轮对话方法、系统、介质及装置
KR20190070683A (ko) 강의 콘텐츠 구성 및 제공을 위한 장치 및 방법
CN110310086B (zh) 辅助背诵提醒方法、设备和存储介质
CN109726267B (zh) 用于故事机的故事推荐方法和装置
CN111078890A (zh) 一种生字词的收集方法及电子设备
CN111026872A (zh) 一种关联听写方法及电子设备
JP2020091456A (ja) 学習支援プログラム
CN111027794B (zh) 一种听写作业的批改方法及学习设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210525

RJ01 Rejection of invention patent application after publication