CN107871001B

CN107871001B - 音频播放方法、装置、存储介质及电子设备

Info

Publication number: CN107871001B
Application number: CN201711087228.9A
Authority: CN
Inventors: 王君龙
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2017-11-07
Filing date: 2017-11-07
Publication date: 2020-08-04
Anticipated expiration: 2037-11-07
Also published as: CN107871001A

Abstract

本申请实施例公开了一种音频播放方法、装置、存储介质及电子设备。该音频播放方法，当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像，然后根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整，基于调整后的匹配阈值从样本图像集合中选取与待点读图像匹配的目标样本图像，再获取与目标样本图像对应的音频数据，并播放该音频数据。该方案可以提升待点读图像的匹配成功率和匹配速度，减少了反应时间，从而提升音频播放效率。

Description

音频播放方法、装置、存储介质及电子设备

技术领域

本申请涉及电子设备技术领域，尤其涉及一种音频播放方法、装置、存储介质及电子设备。

背景技术

目前，点读设备可以根据点读对象的坐标或者编码等方式，对点读对象进行识别和定位。其中，编码方式为在书本上印刷编码，然后利用点读笔识别编码以确定内容，再根据内容播放对应的音频。坐标方式为利用点读笔点击点读机的位置以确定坐标，确认坐标后结合点读设备当前页面播放对应的音频。即，相关技术中，需要借助点读笔或者点读机来实现点读对象的识别和定位。

发明内容

本申请实施例提供一种音频播放方法、装置、存储介质及电子设备，可以加快图像匹配速度，提高了音频的播放效率。

第一方面，本申请实施例提供一种音频播放方法，应用于电子设备，所述方法包括：

当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像；

根据所述历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整；

基于调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的目标样本图像；

获取与所述目标样本图像对应的音频数据并播放所述音频数据。

第二方面，本申请实施例提供了一种音频播放装置，应用于电子设备，所述装置包括：

确定模块，用于当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像；

调整模块，用于根据所述历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整；

选取模块，用于基于调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的目标样本图像；

处理模块，用于获取与所述目标样本图像对应的音频数据并播放所述音频数据。

第三方面，本申请实施例还提供了一种存储介质，所述存储介质中存储有多条指令，所述指令适于由处理器加载以执行上述的音频播放方法。

第四方面，本申请实施例还提供了一种电子设备，包括处理器及存储器，所述处理器与所述存储器电性连接，所述存储器用于存储指令和数据；处理器用于执行上述的音频播放方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的音频播放方法的场景示意图。

图2是本申请实施例提供的音频播放方法的一种流程示意图。

图3是本申请实施例中电子设备与用户之间的交互示意图。

图4是本申请实施例提供的音频播放方法的另一种流程示意图。

图5是本申请实施例提供的音频播放装置的一种结构示意图。

图6是本申请实施例提供的音频播放装置的另一种结构示意图。

图7是本申请实施例提供的音频播放装置的又一种结构示意图。

图8是本申请实施例提供的电子设备的一种结构示意图。

图9是本申请实施例提供的电子设备的另一种结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种音频播放方法、装置、存储介质及电子设备。以下将分别进行详细说明。

在一种实施方式中，电子设备可以先获取点读样本，点读样本可以是图片、照片或者编码等。其中，电子设备可以为移动终端，如手机、平板电脑、笔记本电脑等，本申请实施例对此不进行限定。

在获取到点读样本之后，电子设备可以获取多媒体样本，多媒体样本可以是音频文件或者视频文件等。然后，电子设备可以将获取到的点读样本和多媒体样本相关联。例如，电子设备将照片A和音频a关联，将照片B和音频b关联，将照片C和视频c关联。在将点读样本和多媒体样本关联之后，电子设备可以将这些样本数据保存在预设数据库中。

可以理解的是，在一些实施方式中，点读样本和多媒体样本之间可以是一一对应的关系，也可以是一对多的关系，或者多对一的关系等等，本实施例对此不做具体限定。

在使用电子设备点读功能时，用户可以先使用移动电子设备拍摄一张照片或者从相册中选取一张照片或者扫描某个编码。用户拍摄得到的照片或者选取的照片或者扫描得到的编码就是需要进行点读的对象。在获取到需要进行点读的对象之后，电子设备可以在预设数据库中查找与该需要进行点读的对象匹配的照片或者编码。若在预设数据库中存在与该需要进行点读的对象匹配的照片或编码，那么电子设备就可以查找与之关联的多媒体文件，并播放该多媒体文件。

在一种实施方式中，例如点读样本为照片A，该照片中包含三段文字，每一段文字都关联了一段音频。那么，当用户拍摄得到的照片与预设数据库中的照片A匹配时，由于照片A中包含有三段文字，且每段文字均关联有对应的一段音频，那么用户可以通过具体选取照片A中的某段文字的方式，选择播放其对应的音频。或者，用户也可以不作具体的选择，那么电子设备可以顺序播放三段文字对应的音频。

比如，参考图1，用户使用电子设备拍摄得到一张照片X，电子设备在预设数据库中查找到与照片X匹配的为照片A。照片A中包含三段文字，其中第一段文字关联音频甲，第二段文字关联音频乙，第三段文字关联音频丙。例如，如图1所示，用户在屏幕上圈选了第二段文字所在的区域，那么电子设备可以对应播放音频乙。

可以理解的是，本实施例可以在电子设备上实现对某一对象(如照片)中的文本进行点读的功能，这种方式具有成本低、便捷性好等有益效果。

实际应用中，由于幼儿手部无力，扫描的角度控制不稳定，在拍照时会大范围晃动，导致明明对着书本却无法匹配成功，或者匹配的耗时比较长。

在一实施例中，提供一种音频播放方法，应用于电子设备，该电子设备可以为智能手机、平板电脑、笔记本电脑等移动终端。如图2所示，流程可以如下：

101、当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像。

其中，待点读图像具体可以可包括中文、英文或其他国文字。本申请实施例中，对文字的类型(包括国别和版本)不作限定。当然，该待点读图像内还可以包括图案、表格等其他信息。

本申请实施例中，用户在本次使用电子设备的点读功能过程中，第一次点播的音频数据，则可作为下一段音频数据的历史音频数据。比如，用户在30分钟内连续点播了音频数据1，音频数据2，音频数据3以及音频数据4，则对于音频数据2，音频数据1为上一次播放的历史音频数据。同样的，相对于音频数据3，音频数据2为上一次播放的音频数据；相对于音频数据4，音频数据3为上一次播放的历史音频数据。

需要说明的是，本申请实施例中，需预先建立样本图像与音频数据之间的映射关系，以便基于该映射关系获取历史音频数据所对应的历史样本图像。具体操作可如下：

首先，需要采集大量数据，即采集样本图像和音频数据。比如，可以利用电子设备的内置摄像头或其他外接摄像头对点读对象(如书籍)进行拍摄，以获取点读所需要的样本图像。

然后，可人工朗读或机器朗读所获取的样本图像上所显示的文字信息，并进行录音，以得到多个音频数据。而所朗读的内容可以包括：文字信息中所显示的原文文字和/或其他相关拓展内容等等。

最后，将所获取到的样本图像与音频数据建立映射关系，其中，可以根据实际需求，设置每一样本图像对应关联一个或多个音频数据。将所获取的样本图像、音频数据、以及两者之间的映射关系保存在电子设备的存储区域中，以得到点读数据库。

102、根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整。

在本申请实施例中，需预先构建算法模型。该预设算法模型可以是电子设备对用户使用习惯进行机器学习，采集用户使用点读功能时的音频播放信息，进而生成训练样本对某一算法模型不断更新迭代训练而成的。

具体地，参考图3，电子设备中可以包括数据采集统计系统与带回馈调整的预测系统。数据采集统计系统，用于采集用户操作电子设备执行点读功能时音频播放对应的初始数据，并做出相应的统计，分析处理后得到较为理想的算法模型。预测系统在电子设备获取到待点读图像时，根据该算法模型，以历史样本图像为输入，预测出点读数据库中，每一样本图像将会被点读的预测结果。然后，根据该预测结果对样本集合中每一样本图像当前对应的匹配阈值进行调整。按照调整后的匹配阈值进行后续的音频播放，得到最终的播放结果。然后进行结果分析，判断该播放结果是否正确，也即判断所播放的音频数据是否为待点读图像实际上所关联的音频数据。根据结果分析对所得到的算法模型不断进行更新迭代，最终得到较为优化的算法模型。

而调整的规则，可有产品生产厂商进行设定。

其中，匹配阈值为可触发播放此样本图像所对应的音频数据的最小阈值。

103、基于调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像。

具体地，可将待点读图像与该样本图像集合中的每一样本图像进行比较，并以各样本图像所对应的调整后的匹配阈值为判断基准，从该样本图像集合中选取出符合要求的目标样本图像。

104、获取与目标样本图像对应的音频数据并播放该音频数据。

具体地，可根据预先建立的样本图像与音频数据之间的映射关系，从点读数据库中提取出与该目标图像关联的音频数据，然后播放该音频数据即可。

由上可知，本申请是实施例提供的音频播放方法，当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像，然后根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整，基于调整后的匹配阈值从样本图像集合中选取与待点读图像匹配的目标样本图像，再获取与目标样本图像对应的音频数据，并播放该音频数据。该方案可以提升待点读图像的匹配成功率和匹配速度，减少了反应时间，从而提升音频播放效率。

在一实施例中，还提供另一种音频播放方法，应用于电子设备，该电子设备可以为智能手机、平板电脑、笔记本电脑等移动终端。如图4所示，流程可以如下：

201、构建点读数据库，该点读数据库中可包括多个音频数据、多个样本图像、以及音频数据库与样本图像之间的映射关系。

需要采集大量数据，即采集样本图像和音频数据。比如，可以利用电子设备的内置摄像头或其他外接摄像头对点读对象(如书籍)进行拍摄，以获取点读所需要的样本图像。其中，该样本图像可包括有文字信息，当然，还可以包括图案、表格等其他信息。

202、当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像。

203、根据历史样本图像和预设算法模型，预测样本图像集合中每一样本图像对应的置信参数，其中，置信参数表示样本图像为目标样本图像的概率，目标图像为与该待点读图像匹配的样本图像。

本申请实施例中，需预先构建算法模型。其中，预设算法模型可以是电子设备对用户使用习惯进行机器学习，采集用户使用点读功能时的音频播放信息，进而生成训练样本对某一算法模型不断更新迭代训练而成的。

基于该预设算法模型，以历史样本图像为输入，预测出点读数据库中每一样本图像将会被点读的概率，将所预测出的概率作为各样本图像对应的置信参数。置信参数越高，意味着对应的样本图像的身份为实际需点读的图像越(即目标样本图像)接近。当置信参数接近上限时，则可直接认为对应的样本图像便为待点读的图像。

尤其对于批量设置的点读对象，往往都是基于一定的顺序，因此在播放某一个样本读图像对应的音频数据时，可以较大概率地成功预测下一个样本图像。通过智能学习，可得出判断正确的置信度。

204、根据置信参数对每一样本图像当前对应的匹配阈值进行调整。

在一些实施例中，置信参数可为置信水平。由于置信水平越高，则意味着应的样本图像的身份为目标样本图像的概率越大，表明用户实际想要电子设备播放的是该样本图像对应的音频数据。此时，可适当降低该样本图像所对应的匹配阈值，以待点读图像能与该样本图像匹配的成功率，进而播放对应的音频数据。因此，置信水平越高，则可以采用越低的匹配阈值，反之则可采用越高的匹配阈值。

在一些实施例中，步骤“根据置信参数对样本图像当前对应的匹配阈值进行调整”可以包括以下流程：

根据预设映射关系集合获取与所述置信参数对应的样本匹配阈值，该预设映射关系集合中包括样本置信参数与样本匹配阈值之间的映射关系；

根据样本匹配阈值调整样本图像当前对应的匹配阈值。

匹配阈值是有一定范围的，是有下限的，以确保匹配的成功率。比如，置信水平是80％时，可设置匹配阈值设为60％，置信水平为70％时，可设置匹配阈值设为70％，置信水平为60％时，可设置匹配阈值设为80％。

205、将待点读图像与样本集合中的样本图像进行匹配，得到匹配结果。

具体地，可基于图像处理算法，提取待点读图像的图像特征，将所提取的图像特征并与每一样本图像的样本图像特征进行匹配，进而得到匹配结果。

其中，特征提取是使用计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征提取最重要的一个特性是“可重复性”，即同一场景的不同图像所提取的特征应该是相同的。

本实施例中，可提取待点读图像中的颜色信息、纹理信息、形状信息等。具体实施过程中，可利用傅立叶变换法、窗口傅立叶变换法、小波变换法、最小二乘法、边界方向直方图法、基于Tamura纹理特征的纹理特征提取等，提取目标图像区域的图像特征。

206、根据匹配结果和调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像。

在一些实施例中，该匹配结果包括样本图像与待点读图像的匹配值。步骤“根据所述比较结果和调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的目标样本图像”可以包括以下流程：

判断匹配值是否大于调整后的匹配阈值；

若是，则将该匹配值对应的样本图像，作为与待点读图像匹配的目标样本图像。

207、获取与目标样本图像对应的音频数据并播放该音频数据。

在一些实施例中，可根据用户习惯，按照之前音频的播放设置参数播放该音频数据。具体地，可以对电子设备中音频数据的在历史时间段内的播放设置信息进行记录，如播放音量、播放音效、播放音调、播放音色等等。然后，通过电子设备的机器学习功能，对所记录的音频数据的播放设置信息进行统计，从而提炼出较佳的播放设置参数，以作在该历史时间段内音频数据的历史播放设置参数。然后，将电子设备当前的播放设置参数调节为该历史播放设置参数，以按照之前的播放音量、播放音效等播放该音频数据。

由上可知，本申请实施例提供的音频播放方法，通过构建点读数据库，并电子设备的智能学习训练出算法模型。当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像，然后根据历史样本图像和预设算法模型，预测样本图像集合中每一样本图像对应的置信参数，根据该置信参数对每一样本图像当前对应的匹配阈值进行调整。然后，将待点读图像与样本集合中的样本图像进行匹配，根据匹配结果和调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像。最后获取与目标样本图像对应的音频数据，并播放该音频数据。该方案可以提升待点读图像的匹配成功率和匹配速度，减少了反应时间，从而提升音频播放效率。

在本申请又一实施例中，还提供一种音频播放装置，该音频播放装置可以软件或硬件的形式集成在电子设备中，该电子设备具体可以包括手机、平板电脑、笔记本电脑等设备。如图5所示，该音频播放装置30可以包括确定模块31、调整模块32、选取模块33以及处理模块34，其中：

确定模块31，用于当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像；

调整模块32，用于根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整；

选取模块33，用于基于调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像；

处理模块34，用于获取与目标样本图像对应的音频数据并播放音频数据。

在一些实施例中，参考图6，调整模块32可以包括：

预测子模块321，用于根据历史样本图像和预设算法模型，预测样本图像集合中每一样本图像对应的置信参数，置信参数表示样本图像为目标样本图像的概率；

调整子模块322，用于根据置信参数对样本图像当前对应的匹配阈值进行调整。

在一些是实施例中，调整子模块322进一步可以用于：

根据预设映射关系集合获取与置信参数对应的样本匹配阈值，预设映射关系集合中包括样本置信参数与样本匹配阈值之间的映射关系；

根据样本匹配阈值调整样本图像当前对应的匹配阈值

在一些实施例中，参考图7，选取模块33可以包括：

匹配子模块331，用于将待点读图像与样本集合中的样本图像进行匹配，得到匹配结果；

选取子模块332，用于根据匹配结果和调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像。

在一些实施例中，匹配结果包括样本图像与待点读图像的匹配值；选取子模块332进一步可以用于：

判断匹配值是否大于调整后的匹配阈值；

若是，则将匹配值对应的样本图像，作为与待点读图像匹配的目标样本图像。

由上可知，本申请实施例提供的音频播放装置，当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像，然后根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整，基于调整后的匹配阈值从样本图像集合中选取与待点读图像匹配的目标样本图像，再获取与目标样本图像对应的音频数据，并播放该音频数据。该方案可以提升待点读图像的匹配成功率和匹配速度，减少了反应时间，从而提升音频播放效率。

在本申请又一实施例中还提供一种电子设备，该电子设备可以是智能手机、平板电脑等设备。如图8所示，电子设备400包括处理器401及存储器402。其中，处理器401与存储器402电性连接。

处理器401是电子设备400的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或加载存储在存储器402内的应用，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。

在本实施例中，电子设备400中的处理器401会按照如下的步骤，将一个或一个以上的应用的进程对应的指令加载到存储器402中，并由处理器401来运行存储在存储器402中的应用，从而实现各种功能：

根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整；

基于调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像；

获取与目标样本图像对应的音频数据并播放音频数据。

在一些是实施例中，处理器401进一步可以用于执行以下步骤：

根据历史样本图像和预设算法模型，预测样本图像集合中每一样本图像对应的置信参数，置信参数表示样本图像为目标样本图像的概率；

根据置信参数对样本图像当前对应的匹配阈值进行调整。

根据样本匹配阈值调整样本图像当前对应的匹配阈值。

将待点读图像与样本集合中的样本图像进行匹配，得到匹配结果；

根据匹配结果和调整后的匹配阈值，从样本图像集合中选取与待点读图像匹配的目标样本图像。

在一些是实施例中，匹配结果包括样本图像与待点读图像的匹配值；处理器401进一步可以用于执行以下步骤：

判断匹配值是否大于调整后的匹配阈值；

存储器402可用于存储应用和数据。存储器402存储的应用中包含有可在处理器中执行的指令。应用可以组成各种功能模块。处理器401通过运行存储在存储器402的应用，从而执行各种功能应用以及数据处理。

在一些实施例中，如图9所示，电子设备400还包括：显示屏403、控制电路404、射频电路405、输入单元406、音频电路407、传感器408以及电源409。其中，处理器401分别与显示屏403、控制电路404、射频电路405、输入单元406、音频电路407、传感器408以及电源409电性连接。

显示屏403可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口，这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。

控制电路404与显示屏403电性连接，用于控制显示屏403显示信息。

射频电路405用于收发射频信号，以通过无线通信与网络设备或其他电子设备建立无线通讯，与网络设备或其他电子设备之间收发信号。

输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹)，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中，输入单元406可以包括指纹识别模组。

音频电路407可通过扬声器、传声器提供用户与电子设备之间的音频接口。

传感器408用于采集外部环境信息。传感器408可以包括环境亮度传感器、加速度传感器、光传感器、运动传感器、以及其他传感器。

电源409用于给电子设备400的各个部件供电。在一些实施例中，电源409可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图9中未示出，电子设备400还可以包括摄像头、蓝牙模块等，在此不再赘述。

由上可知，本申请实施例提供的电子设备，当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像，然后根据历史样本图像和预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整，基于调整后的匹配阈值从样本图像集合中选取与待点读图像匹配的目标样本图像，再获取与目标样本图像对应的音频数据，并播放该音频数据。该方案可以提升待点读图像的匹配成功率和匹配速度，减少了反应时间，从而提升音频播放效率。

在一些实施例中，还提供了一种存储介质，该存储介质中存储有多条指令，该指令适于由处理器加载以执行上述任一音频播放方法。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，RandomAccess Memory)、磁盘或光盘等。

在描述本申请的概念的过程中使用了术语“一”和“所述”以及类似的词语(尤其是在所附的权利要求书中)，应该将这些术语解释为既涵盖单数又涵盖复数。此外，除非本文中另有说明，否则在本文中叙述数值范围时仅仅是通过快捷方法来指代属于相关范围的每个独立的值，而每个独立的值都并入本说明书中，就像这些值在本文中单独进行了陈述一样。另外，除非本文中另有指明或上下文有明确的相反提示，否则本文中所述的所有方法的步骤都可以按任何适当次序加以执行。本申请的改变并不限于描述的步骤顺序。除非另外主张，否则使用本文中所提供的任何以及所有实例或示例性语言(例如，“例如”)都仅仅为了更好地说明本申请的概念，而并非对本申请的概念的范围加以限制。在不脱离精神和范围的情况下，所属领域的技术人员将易于明白多种修改和适应。

以上对本申请实施例所提供的音频播放方法、装置、存储介质及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种音频播放方法，应用于电子设备，其特征在于，所述方法包括：

基于用户使用习惯，采集用户使用点读功能时的音频播放信息，将所述音频播放信息作为训练样本，使用所述训练样本对预设算法模型进行迭代训练；

当获取到待点读图像时，确定上一次播放的历史音频数据所对应的历史样本图像；根据所述历史样本图像和迭代训练后的预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整，具体包括：根据所述历史样本图像和迭代训练后的预设算法模型，预测样本图像集合中每一样本图像对应的置信水平，根据所述置信水平对所述样本图像当前对应的匹配阈值进行调整，其中，所述迭代训练后的预设算法模型以所述历史样本图像为输入，预测出所述样本图像集合中每一样本图像将会被点读的概率，并将预测出的概率作为每一样本图像对应的置信水平，所述置信水平表示样本图像为目标样本图像的概率，所述目标样本图像为与所述待点读图像匹配的样本图像，对于每一样本图像，其对应的置信水平越高，调整后的匹配阈值越低，对应的置信水平越低，调整后的匹配阈值越高；

基于调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的所述目标样本图像；

基于用户习惯，对所述电子设备在历史时间段内的播放设置信息进行记录，通过机器学习功能从记录的播放设置信息中提炼出播放设置参数，以作为在所述历史时间段内的历史播放设置参数；

获取与所述目标样本图像对应的音频数据，按照所述历史播放设置参数播放所述音频数据。

2.如权利要求1所述的音频播放方法，其特征在于，根据所述置信水平对所述样本图像当前对应的匹配阈值进行调整的步骤，包括：

根据预设映射关系集合获取与所述置信水平对应的样本匹配阈值，所述预设映射关系集合中包括样本置信水平与样本匹配阈值之间的映射关系；

根据所述样本匹配阈值调整所述样本图像当前对应的匹配阈值。

3.如权利要求1所述的音频播放方法，其特征在于，基于调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的所述目标样本图像的步骤，包括：

将所述待点读图像与所述样本集合中的样本图像进行匹配，得到匹配结果；

根据所述匹配结果和调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的所述目标样本图像。

4.如权利要求3所述的音频播放方法，其特征在于，所述匹配结果包括样本图像与待点读图像的匹配值；

根据所述匹配结果和调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的所述目标样本图像的步骤，包括：

判断所述匹配值是否大于所述调整后的匹配阈值；

若是，则将所述匹配值对应的样本图像，作为与所述待点读图像匹配的所述目标样本图像。

5.一种音频播放装置，应用于电子设备，其特征在于，所述装置包括：

训练模块，用于基于用户使用习惯，采集用户使用点读功能时的音频播放信息，将所述音频播放信息作为训练样本，使用所述训练样本对预设算法模型进行迭代训练；

调整模块，用于根据所述历史样本图像和迭代训练后的预设算法模型，对样本集合中每一样本图像当前对应的匹配阈值进行调整；

所述调整模块，具体包括预测子模块和调整子模块；

所述预测子模块，用于根据所述历史样本图像和迭代训练后的预设算法模型，预测样本图像集合中每一样本图像对应的置信水平，其中，所述迭代训练后的预设算法模型以所述历史样本图像为输入，预测出所述样本图像集合中每一样本图像将会被点读的概率，并将预测出的概率作为每一样本图像对应的置信水平，所述置信水平表示样本图像为目标样本图像的概率，所述目标样本图像为与所述待点读图像匹配的样本图像；

所述调整子模块，用于根据所述置信水平对所述样本图像当前对应的匹配阈值进行调整，其中，对于每一样本图像，其对应的置信水平越高，调整后的匹配阈值越低，对应的置信水平越低，调整后的匹配阈值越高；

选取模块，用于基于调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的所述目标样本图像；

处理模块，用于基于用户习惯，对所述电子设备在历史时间段内的播放设置信息进行记录，通过机器学习功能从记录的播放设置信息中提炼出播放设置参数，以作为在所述历史时间段内的历史播放设置参数，获取与所述目标样本图像对应的音频数据，按照所述历史播放设置参数播放所述音频数据。

6.如权利要求5所述的音频播放装置，其特征在于，所述调整子模块具体用于：

7.如权利要求5所述的音频播放装置，其特征在于，所述选取模块包括：

匹配子模块，用于将所述待点读图像与所述样本集合中的样本图像进行匹配，得到匹配结果；

选取子模块，用于根据所述匹配结果和调整后的匹配阈值，从所述样本图像集合中选取与所述待点读图像匹配的目标样本图像。

8.如权利要求7所述的音频播放装置，其特征在于，所述匹配结果包括样本图像与待点读图像的匹配值；所述选取子模块具体用于：

判断所述匹配值是否大于所述调整后的匹配阈值；

若是，则将所述匹配值对应的样本图像，作为与所述待点读图像匹配的目标样本图像。

9.一种存储介质，其特征在于，所述存储介质中存储有多条指令，所述指令适于由处理器加载以执行如权利要求1-4中任一项所述的音频播放方法。

10.一种电子设备，其特征在于，包括处理器及存储器，所述处理器与所述存储器电性连接，所述存储器用于存储指令和数据；所述处理器用于执行如权利要求1-4中任一项所述的音频播放方法。