CN110134817A

CN110134817A - 一种录音文件的存储方法、搜索方法及相关装置

Info

Publication number: CN110134817A
Application number: CN201910409852.9A
Authority: CN
Inventors: 杨学理; 王志军; 孙立刚
Original assignee: Tianjin Xunfeiji Technology Co Ltd
Current assignee: Tianjin Xunfeiji Technology Co Ltd
Priority date: 2019-05-16
Filing date: 2019-05-16
Publication date: 2019-08-16

Abstract

本申请公开了一种录音文件的存储方法、搜索方法及相关装置，该方法包括：根据录音请求进行录音，得到目标录音文件，并生成该目标录音文件的多维度信息，以便对应存储该目标录音文件以及该目标录音文件的多维度信息，使得该目标录音文件与其多维度信息之间具有相应的映射关系，如此，可以存储大量的录音文件及其对应的多维度信息。基于此，当用户需要搜索其中的一个或多个录音文件时，可以根据至少一个维度信息搜索这些录音文件，无需从所有文件夹中进行顺序搜索，从而能够快速、准确的搜索到用户所需的录音文件。

Description

一种录音文件的存储方法、搜索方法及相关装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种录音文件的存储方法、搜索方法及相关装置。

背景技术

目前，人们通常会将一些具有重要信息或具有某种特殊用途的音频(比如语音)进行录音，当通过多次录音后将形成多个录音文件，这些录音文件会被保存在录音设备的一个或多个文件夹中。

然而，当用户需要搜索其中的一个或多个录音文件时，需要从这些文件夹中进行顺序搜索，搜索效率低下且搜索结果不够准确。

发明内容

本申请实施例的主要目的在于提供一种录音文件的存储方法、搜索方法及相关装置，能够快速、准确的搜索到用户所需的录音文件。

本申请实施例提供了一种录音文件的存储方法，包括：

在接收到录音请求后进行录音，得到目标录音文件；

生成所述目标录音文件的多维度信息；

对应存储所述目标录音文件以及所述目标录音文件的多维度信息。

可选的，所述在接收到录音请求后进行录音，得到目标录音文件，包括：

接收用户触发的录音请求，所述录音请求中携带了录音场景的信息，所述录音场景是所述用户从录音设备支持的各个录音场景模式下选择的一个目标场景模式对应的录音场景；

在所述目标场景模式下进行录音，得到目标录音文件。

可选的，所述多维度信息包括所述目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称、转写内容中的一项或多项。

可选的，按照下述方式生成所述目标录音文件的录音位置：

若在录音的过程中检测到录音地点，则将所述录音地点作为所述目标录音文件的录音位置；

若在录音的过程中未检测到录音地点，则根据最近时刻检测到的地点信息，确定所述目标录音文件的录音位置。

可选的，按照下述方式生成所述目标录音文件的文件标签：

若在录音的过程中或在目标录音文件的播放过程中接收到用户触发的打标签请求，则确定在所述目标录音文件的音频上所请求的打标签位置，并将所述打标签位置对应的至少一个维度的标签信息，作为所述目标录音文件的文件标签。

可选的，所述方法还包括：

在所述目标录音文件的音频上显示所述打标签位置。

可选的，所述方法还包括：

根据所述目标录音文件的打标签位置，对所述目标录音文件进行分段，得到各个分段文件。

可选的，按照下述方式生成所述目标录音文件的文件名称：

将所述目标录音文件的开始录制时刻和/或结束录制时刻，作为所述目标录音文件的文件名称；

或者，将从所述目标录音文件中提取的关键词，作为所述目标录音文件的文件名称；

或者，将基于所述目标录音文件的文本内容生成的主题名称，作为所述目标录音文件的文件名称。

本申请实施例还提供了一种录音文件的搜索方法，包括：

接收搜索请求，所述搜索请求中携带了至少一个维度的搜索信息；

将所述至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到匹配的至少一个录音文件；

其中，所述录音文件集合中的录音文件为权利要求1至8任一项所述方法中的目标录音文件。

本申请实施例还提供了一种录音文件的存储装置，包括：

目标录音文件获取单元，用于在接收到录音请求后进行录音，得到目标录音文件；

多维度信息生成单元，用于生成所述目标录音文件的多维度信息；

录音文件信息存储单元，用于对应存储所述目标录音文件以及所述目标录音文件的多维度信息。

可选的，所述目标录音文件获取单元，包括：

录音请求接收子单元，用于接收用户触发的录音请求，所述录音请求中携带了录音场景的信息，所述录音场景是所述用户从录音设备支持的各个录音场景模式下选择的一个目标场景模式对应的录音场景；

录音文件获取子单元，用于在所述目标场景模式下进行录音，得到目标录音文件。

可选的，按照下述方式生成所述目标录音文件的录音位置：

可选的，按照下述方式生成所述目标录音文件的文件标签：

可选的，所述装置还包括：

打标签位置显示单元，用于在所述目标录音文件的音频上显示所述打标签位置。

可选的，所述装置还包括：

分段文件生成单元，用于根据所述目标录音文件的打标签位置，对所述目标录音文件进行分段，得到各个分段文件。

可选的，按照下述方式生成所述目标录音文件的文件名称：

本申请实施例还提供了一种录音文件的搜索装置，包括：

搜索请求接收单元，用于接收搜索请求，所述搜索请求中携带了至少一个维度的搜索信息；

搜索信息匹配单元，用于将所述至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到匹配的至少一个录音文件；

其中，所述录音文件集合中的录音文件为权利要求10至17任一项所述装置中的目标录音文件。

本申请实施例还提供了一种录音文件的存储设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述录音文件的存储方法的任一实施方式。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述录音文件的存储方法的任一实施方式。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述录音文件的存储方法的任一实施方式。

本申请实施例还提供了一种录音文件的搜索设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述录音文件的搜索方法。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述录音文件的搜索方法。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述录音文件的搜索方法。

基于上述技术方案，本申请具有以下有益效果：

本申请实施例提供的录音文件的存储方法、搜索方法及相关装置，可以根据录音请求进行录音，从而得到目标录音文件，并生成该目标录音文件的多维度信息，以便对应存储该目标录音文件以及该目标录音文件的多维度信息，使得该目标录音文件与其多维度信息之间具有相应的映射关系，如此，可以存储大量的录音文件及其对应的多维度信息。基于此，当用户需要搜索其中的一个或多个录音文件时，可以根据至少一个维度信息搜索这些录音文件，无需从所有文件夹中进行顺序搜索，从而能够快速、准确的搜索到用户所需的录音文件。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请方法实施例一所提供的录音文件的存储方法的流程图；

图2为本申请实施例提供的录音设备所支持的录音场景模式示意图；

图3为本申请实施例提供的目标录音文件的录音位置的生成方法的流程图；

图4为本申请实施例提供的文件标签的生成方法流程图；

图5为本申请实施例提供的文件标签的显示示意图；

图6为本申请实施例提供的文件名称的生成方法流程图；

图7为本申请实施例提供的目标录音文件的属性特征示意图；

图8为本申请方法实施例二提供的录音文件的搜索方法的流程图；

图9为本申请实施例提供的录音文件的搜索界面示意图；

图10为本申请实施例提供的录音文件的关键字搜索界面示意图；

图11为本申请装置实施例一提供的录音文件的存储装置的结构示意图；

图12为本申请装置实施例二提供的录音文件的搜索装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

方法实施例一

参见图1，该图为本申请方法实施例一所提供的录音文件的存储方法的流程图。

本申请实施例提供的录音文件的存储方法，包括：

S11：在接收到录音请求后进行录音，得到目标录音文件。

S12：生成目标录音文件的多维度信息。

S13：对应存储目标录音文件以及该目标录音文件的多维度信息。

需要说明的是，本申请方法实施例一提供的录音文件的存储方法，应用于一种录音设备，该录音设备可以是录音笔，还可以是其他具有录音功能的电子设备，比如智能手机等。

以上为本申请方法实施例一提供的录音文件的存储方法的具体执行步骤，为了便于理解和解释本申请方法实施例一提供的录音文件的存储方法，下面将依次介绍S11、S12和S13的具体实施方式。

首先介绍S11的具体实施方式。

在步骤S11中，录音请求可以采用现有的或未来的任一种能够触发录音的方式进行触发，比如点击录音设备上的录音按钮，本申请对此不作具体限定。

录音请求可以包括触发录音的请求指令，可以还包括其他与录音相关的录音需求信息。其中，录音需求信息可以预先设定，尤其可以由用户根据其自身需求进行设定；而且，录音需求信息可以包括至少一种需求信息，例如，录音需求信息可以包括录音场景的信息。

为了便于解释和理解录音请求，下面将结合示例进行说明。

作为示例，由于不同录音场景下的录音需求是不同的，因而，为了满足用户在不同录音场景的录音需求，可以根据用户所选的录音场景生成录音请求，以便使得该录音请求中携带了录音场景的信息；其中，录音场景可以是用户从录音设备支持的各个录音场景模式下选择的一个目标场景模式对应的录音场景。

录音设备所支持的录音场景模式包括至少一种录音场景模式，例如，录音设备所支持的录音场景模式可以包括标准场景模式、采访场景模式、会议场景模式、音乐场景模式、演讲场景模式、备忘场景模式等场景模式中的至少一个。

需要说明的是，由于标准场景模式的普适性更强，因而通常可以在录音设备出厂时将标准场景模式设置为默认的场景模式，使得在用户没有选择录音场景的情况下，能够按照标准场景模式进行录音。另外，也可以由用户根据自身需求将其从录音设备支持的各个录音场景模式下选择的一个目标场景模式设置为默认的场景模式。本申请实施例对默认的场景模式不进行限定。

基于上述所介绍的录音请求的相关内容，为了满足用户在不同录音场景下的录音需求，本申请提供了S11的一种实施方式，在该实施方式中，S11具体可以包括S111-S112：

S111：接收用户触发的录音请求；其中，录音请求中携带了录音场景的信息，且该录音场景是用户从录音设备支持的各个录音场景模式下选择的一个目标场景模式对应的录音场景。

作为示例，当用户所选择的目标场景模式为会议场景模式时，则S111具体可以为：接收用户触发的录音请求，且该录音请求中携带有会议场景的信息。

S112：在目标场景模式下进行录音，得到目标录音文件。

作为示例，当用户所选择的目标场景模式为会议场景模式时，则S112具体可以为：在会议场景模式下进行录音，得到目标录音文件，使得该目标录音文件能够满足会议场景模式下的录音需求。

以上为步骤S11的具体实施方式，在该实施方式中，可以根据接收到的录音请求进行录音，得到目标录音文件，以便使得目标录音文件能够符合录音请求中所携带的录音需求。

下面介绍S12的具体实施方式。

在步骤S12中，目标录音文件的多维度信息中的任一维度信息，均能够对目标录音文件的特征信息进行描述；而且，该多维度信息可以包括目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称、转写内容中的一项或多项。

为了便于解释和理解多维度信息，下面将依次介绍上述每一维度信息。

首先介绍目标录音文件的录音场景的相关内容。

目标录音文件的录音场景可以预先设定，尤其可以由用户根据自身需求设定。

作为示例，如图2所示，当录音设备所支持的录音场景模式包括标准场景模式、采访场景模式、会议场景模式、演讲场景模式、备忘场景模式和音乐场景模式时，则用户可以在触发录音请求之前根据录音需求选择其中的一个场景模式，作为目标场景模式，使得在录音结束之后目标录音文件能够存储到该目标场景模式对应的文件夹下，以便于在后续搜索过程中用户能够根据待搜索的录音文件的场景模式进行快速而准确地搜索。

以上为目标录音文件的录音场景的相关内容。

下面介绍目标录音文件的录音位置的相关内容。

录音位置是指收录目标录音文件时所处的位置信息，需要说明的是，在录制目标录音文件时，可以由录音设备进行自动定位，并将该定位位置作为录音位置，此外，录音设备可以将该录音位置信息展示给用户、或不展示给用户，当将录音位置展示给用户时，用户可以核对当前的定位位置是否正确，从而在定位错误时可以选择重新定位或手动录入录音位置。

而且，录音位置信息可以采用任一种数据格式进行表示，例如，录音位置信息可以采用文本格式进行表示。

为了便于解释和理解录音位置的表示方式，下面将以采用文本格式进行表示的录音位置为例进行说明。

作为示例，当用户在北京市朝阳区789艺术区的东方艺术馆对目标录音文件进行收录时，则该目标录音文件的录音位置可以为北京市朝阳区789艺术区的东方艺术馆；此时，该录音位置信息可以表示为：“北京，朝阳区，789艺术区，东方艺术馆”，也可以表示为：“北京/朝阳区/789艺术区/东方艺术馆”。

另外，录音位置可以利用预设定位方法进行定位获取，由于在不同场景下可以采用不同的预设定位方法，因而，为了便于解释和理解预设定位方法，下面将结合三个示例进行解释和说明。

作为第一示例，预设定位方法可以是利用现有的或未来的至少一种定位系统进行定位，本申请对定位系统不做具体限定。例如，定位系统可以包括全球定位系统(GlobalPositioning System，GPS)和北斗卫星导航系统(BeiDou Navigation Satellite System，BDS)中的至少一个。

作为第二示例，当定位系统(例如，GPS或BDS等)的信号较差或没有信号时，预设定位方法可以是利用网络信号(例如，4G或WIFI)进行定位。

作为第三示例，当定位系统(例如，GPS或BDS等)、以及网络信号(例如，4G或WIFI)的信号较差或没有信号时，预设定位方法可以是按照最近时刻能够检测到的位置信息中的最大位置进行定位，例如，当最近时刻所检测到的位置信息为“北京市朝阳区789艺术区的东方艺术馆”时，则可以定位于北京市，以便后续能够将“北京市”作为目标录音文件的录音位置；或者，预设定位方法可以是根据最近时刻所检测到的位置信息、用户可能的移动速度和该最近时刻到当前时刻的时间差进行定位，例如，当最近时刻所检测到的位置信息为“北京市朝阳区789艺术区的东方艺术馆”，用户可能的移动速度为1m/s，且最近时刻到当前时刻的时间差为30秒时，则可以定位于北京市朝阳区，以便后续能够将“北京市朝阳区”作为录音位置。

基于上述三个示例，本申请实施例提供了一种目标录音文件的录音位置的生成方法，如图3所示，该方法具体包括S31-S33：

S31：判断在录音的过程中是否能够检测到录音地点，若是，则执行S32；若否，则执行S33。

S32：将检测到的录音地点作为目标录音文件的录音位置。

步骤S32可以按照上述第一示例和第二示例所提供的预设定位方法进行录音地点的检测，为了简要起见，在此不再赘述。

S33：根据最近时刻检测到的地点信息，确定目标录音文件的录音位置。

步骤S33可以按照上述第三示例提供的预设定位方法的两种实施方式进行录音地点的检测，为了简要起见，在此不再赘述。

以上为目标录音文件的录音位置的相关内容。

下面介绍目标录音文件的录音时间的相关内容。

录音时间是指收录目标录音文件时所对应的时间信息；而且，录音时间可以利用网络同步时间进行录音时间的确定，也可以利用录音设备自身所配备的时钟部件进行录音时间的确定。

需要说明的是，为了保证录音时间的准确性，通常将采用网络同步时间进行录音时间的确定；可以在网络信号较差或没有信号的情况下，将利用录音设备自身所配备的时钟部件进行录音时间的确定。

以上为目标录音文件的录音时间的相关内容。

下面介绍目标录音文件的文件标签的相关内容。

文件标签是由用户根据自身需求添加到目标录音文件中的书签；而且，文件标签可以在目标录音文件的收录过程中添加，也可以在目标录音文件收录完成后再添加，本申请对此不做限定。

为了便于解释和理解文件标签的生成过程，下面将以两个具体实施方式为例进行说明。

作为第一种实施方式，如图4所示，文件标签的生成方法具体可以包括S41-S42：

S41：若在录音的过程中接收到用户触发的打标签请求，则确定在目标录音文件的音频上所请求的打标签位置。

打标签位置可以根据打标签请求的触发时刻确定。例如，若用户在录音过程中触发了打标签请求，假设用户在10点22分8秒时触发了打标签请求，则可以将10点22分8秒所对应的录音时刻的音频位置(即目标录音文件的某一音频点)作为该请求的打标签位置。

实际上，可以在目标录音文件上打一个或多个标签，由于各个标签依次对应不同的录音时刻，因而，可以在打标签过程中或用户查看目标录音文件时，将各个标签的打标签位置显示在音频上，如此，本申请实施例可以进一步包括：在目标录音文件的音频上显示打标签位置，为了便于解释和理解，下面结合图5进行说明。

在图5所示的目标录音文件的音频上，“①、②、③和④”均用于表示打标签位置。其中，打标签位置①所对应的标签生成时间最早，且打标签位置④所对应的标签生成时间最晚。

可见，当目标录音文件的音频上显示有打标签位置时，用户能够快速地了解到每个标签的生成时间，也能够快速地了解到不同标签之间的生成顺序，也能够快速地了解到每个标签的相邻标签，如此能够提高用户获知标签相关内容的速度，也能够方便用户查找各个标签。

此外，由于目标录音文件所包括的数据量可能较大，但用户有时只需使用该目标录音文件所包括的部分数据，因而，为了满足用户能够快速地查看目标录音文件的部分数据的需求，可以基于打标签位置对目标录音文件进行分段。如此，本申请实施例可以进一步包括：根据目标录音文件的打标签位置，对该目标录音文件进行分段，得到各个分段文件。

为了便于解释和理解各个分段文件，下面结合图5进行说明。

作为示例，根据图5所示的目标录音文件的音频可知，该目标录音文件的音频上包括①-④共四个打标签位置，而且，该四个打标签位置可以将该目标录音文件划分成五个分段文件，也就是第一分段文件至第五分段文件。

其中，第一分段文件是指该目标录音文件的音频上的录音开始位置至打标签位置①之间所对应的录音文件；第二分段文件是指该目标录音文件的音频上的打标签位置①至打标签位置②之间所对应的录音文件；第三分段文件是指该目标录音文件的音频上的打标签位置②至打标签位置③之间所对应的录音文件；第四分段文件是指该目标录音文件的音频上的打标签位置③至打标签位置④之间所对应的录音文件；第五分段文件是指该目标录音文件的音频上的打标签位置④至录音结束位置之间所对应的录音文件。

需要说明的是，上述示例是以包括4个打标签位置的目标录音文件为例进行说明的。然而，在本申请中，目标录音文件可以不包括标签，也可以包括至少一个标签，本申请对目标录音文件所包括的标签个数不做具体限定。

进一步地，当利用各个打标签位置将目标录音文件划分为各个分段文件后，使用户后续能够通过对该各个分段文件执行播放、转写、截取和分享中的任一动作，实现目标录音文件的分段播放、分段转写、分段截取和分段分享中的任一功能，如此能够满足用户能够快速地查看目标录音文件的部分数据的需求。

以上为S41的相关内容，这些内容详细描述了各个标签的打标签位置的确定方法、显示方法以及用途等内容。

S42：将打标签位置对应的至少一个维度的标签信息，作为该目标录音文件的文件标签。

标签信息可以包括时间、地点、内容等中的至少一个维度；而且标签信息可以采用多种生成方式。

为了便于解释和理解标签信息生成方法，下面将以三种实施方式为例进行说明。

作为第一种实施方式，标签信息可以按照预设规则自动生成。

其中，预设规则可以预先设定，尤其可以由用户根据自身需求设定；而且，预设规则可以是按照标签所对应的打标签请求的触发时刻生成标签信息，也可以按照标签所对应的打标签位置周边的语音内容生成标签信息，也可以按照标签所对应的打标签请求的触发地点生成标签信息，还可以按照其他标签相关信息生成标签信息。

需要说明的是，打标签请求的触发地点是指用户触发打标签请求时其所处的地理位置信息，而且该地理位置信息可以采用现有的或未来的任一种表示方式，本申请对此不作具体限定。

为了便于解释和理解第一种实施方式，下面将结合三个示例进行说明。

作为第一示例，当用户在10点22分8秒时触发了打标签请求时，则标签信息可以自动生成为10点22分8秒。

需要说明的是，由于时间可以采用多种表达方式，例如，10点22分8秒可以表示为10:22:08，还可以表示为十点二十二分八秒等，因而，在本申请中，作为标签信息的打标签请求的触发时刻可以采用任一种表达方式。

作为第二示例，当标签所对应的打标签位置位于目标录音文件的音频上10点22分8秒处时，则可以根据目标录音文件的音频上10点22分0秒至10点22分16秒之间的语音内容，生成标签信息，其中，关于该语音内容所对应的时间段长度，本申请对此不做具体限定。

需要说明的是，在第二示例中，根据语音内容生成标签信息可以采用多种实施方式。例如，可以直接将该语音内容作为标签信息；也可以生成该语音内容的标题信息，用于作为标签信息；也可以从该语音内容中提取关键词，并将该关键词作为标签信息，其中，关键词的提取方法，本申请对此不做具体限定。

作为第三示例，当用户在录音过程中处于经度为116.402182、且纬度为39.916537的地理位置触发了打标签请求时，则可以将该地理坐标作为标签信息。

以上为标签信息的生成方式的第一种实施方式，在该实施方式中，可以自动生成标签信息。

作为第二种实施方式，标签信息可以根据用户在标签信息编辑位置输入的内容生成，而且，该标签信息编辑位置可以是该标签信息所对应的输入文本框，也可以是该标签信息所对应的语音输入窗口。例如，当用户在标签信息所对应的文本框中输入了“深圳”，则该标签信息为“深圳”。

作为第三种实施方式，标签信息可以在自动生成之后由用户进行修改生成。该实施方式的实质是：先利用上述第一种实施方式生成初始标签信息，然后在初始标签信息的基础上，利用上述第二种实施方式生成最终标签信息。

以上为S42的相关内容，这些内容详细描述了作为文件标签的标签信息的生成方法等内容。

需要说明的是，上述所提供的文件标签的生成方法的第一种实施方式可以在目标录音文件的收录过程中执行。

另外，在一些情况下，用户可以在目标录音文件收录结束后再添加标签。因而，为了满足用户该需求，本申请还提供了文件标签的生成方法的第二种实施方式，在该实施方式中，该方法具体为：若在目标录音文件的播放过程中接收到用户触发的打标签请求，则确定在目标录音文件的音频上所请求的打标签位置，并将打标签位置对应的至少一个维度的标签信息，作为目标录音文件的文件标签，进一步地，还可以在目标录音文件的音频上显示打标签位置。

需要说明的是，在本申请中，文件标签的生成方法的第二种实施方式可以采用上述所提供的文件标签的生成方法的第一种实施方式所采用的具体实施过程，只需将上述所提供的文件标签的生成方法的第一种实施方式所采用的具体实施过程中的“在录音的过程中”替换为“在目标录音文件的播放过程中”即可，为了简要起见，在此不再赘述。

以上为目标录音文件的文件标签的生成方法的相关内容。

另外，为了便于区分不同的文件标签，在本申请中，还可以对各个文件标签进行区别展示。

在本实施例中，可以采用多种手段区别展示各个文件标签。此外，可以采用默认的区别展示方式、也可以采用用户预设的区别展示方式。

作为一种实施方式，可以通过采用不同的标签颜色对各个文件标签进行区别展示。作为另一种实施方式，也可以通过采用不同的标签样式对各个文件标签进行区别展示。其中，标签样式可以为方形、圆形、不规则图形、自定义图形等任一种样式。

以上为目标录音文件的文件标签的相关内容。

下面介绍目标录音文件的文件名称的相关内容。

文件名称用于对目标录音文件进行标识，而且，文件名称可以采用多种方式生成。为了便于解释和说明文件名称的生成过程，下面将以五种实施方式为例进行说明。

作为第一种实施方式，文件名称的生成方法具体可以为：将目标录音文件的开始录制时刻和/或结束录制时刻，作为该目标录音文件的文件名称。

例如，当目标录音文件在10点30分10秒开始录制，直到11点10分30秒结束录制时，则目标录音文件的文件名称可以是10点30分10秒，也可以是11点10分30秒，还可以是10点30分10秒至11点10分30秒。

需要说明的是，由于时间可以采用多种表达方式，例如，10点30分10秒可以表示为10:30:10，还可以表示为十点三十分十秒等，因而，在本申请中，作为文件名称的开始录制时刻和/或结束录制时刻可以采用任一种表达方式。

作为第二种实施方式，文件名称的生成方法具体可以为：将从目标录音文件中提取的关键词，作为该目标录音文件的文件名称。

关键词是指能够表示目标录音文件的核心语义的词汇。

本申请不限定关键词的提取方法，在该实施方式中可以采用任一种关键词提取方法对目标录音文件进行关键词的提取，从而得到能够作为文件名称的关键词。

作为第三种实施方式，文件名称的生成方法具体可以为：将基于目标录音文件的文本内容生成的主题名称，作为该目标录音文件的文件名称。

主题名称用于表示目标录音文件的中心思想或主要内容。

本申请不限定主题名称的生成方法，在该实施方式中可以采用任一种主题名称生成方法来根据目标录音文件进行主题名称的生成，比如利用训练得到的主题生成模型来生成，从而得到能够作为文件名称的主题名称。

另外，为了能够满足用户欲自主编辑文件名称的需求，本申请还提供了文件名称的生成方法的第四种实施方式，在该实施方式中，该方法具体可以为：接收目标录音文件的文件名称编辑请求，并根据文件名称编辑请求获取该目标录音文件的文件名称。其中，目标录音文件的文件名称编辑请求携带了用户输入的文件名称。

作为示例，当用户想要自主编辑目标录音文件的文件名称时，用户可以点击目标录音文件所对应的文件名称编辑按钮，在文本框中输入文件名称，比如输入“2015年随记”，并触发目标录音文件的文件名称编辑请求，以便后续能够根据该请求，将“2015年随记”作为文件名称。

此外，为了避免因文件名称过长而影响用户的查看，可以限定文件名称的长度，因而，本申请还提供了文件名称的生成方法的第五种实施方式，在该实施方式中，如图6所示，该方法具体可以包括步骤S61-S64：

S61：利用上述所提供的文件名称的生成方法的第一种实施方式至第四种实施方式中的任一实施方式，生成初始文件名称。

S62：判断初始文件名称的长度是否超过预设长度阈值，若是，则执行S63；若否，则执行S64。

预设长度阈值可以预先设定，例如，预设长度阈值可以预先设定为40字。

S63：采用预设提取方法从该初始文件名称中提取到最终文件名称，作为目标录音文件的文件名称。

最终文件名称的长度低于预设长度阈值。

预设提取方法用于从初始文件名称中提取出低于预设长度阈值的最终文件名称；而且，预设提取方法可以预先设定。

作为一种实施方式，S63具体可以为：将初始文件名称中的前(或，中部；或，后)N个字作为目标录音文件的最终文件名称。其中，N可以预先设定，且N≤预设长度阈值。

S64：将该初始文件名称作为目标录音文件的文件名称。

可见，在上述文件名称的生成方法的第五种实施方式中，最终确定的目标录音文件的文件名称的长度没有超过预设长度阈值，从而避免了因文件名称过长而影响用户的查看。

以上为目标录音文件的文件名称的相关内容。

下面介绍目标录音文件的转写内容的相关内容。

在本申请中，转写用于将语音内容转换为文本内容，因而，转写内容是指通过转写获得的目标录音文件所对应的文本内容。其中，文本内容可以包括文字、数字、标点符号等内容。

另外，在本申请中，可以采用任一种能够将语音文件转换成文本文件的语音转写方法，本申请对此不做具体限定。

需要说明的是，目标录音文件的转写过程可以在目标录音文件收录结束之后的任一时刻进行触发。

以上为目标录音文件的转写内容的相关内容。

以上为S12的具体实施方式。

下面介绍S13的具体实施方式。

在步骤S13中，本申请中的多维度信息可以采用相同的存储方式，也可以采用不同的存储方式，本申请对此不做具体限定。

作为一种实施方式，多维度信息中的目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称等信息可以作为目标录音文件的属性特征进行存储。

作为示例，在图7所示的目标录音文件的属性特征中，“录音笔发布会.mp3”为该目标录音文件的文件名称；“深圳”为该目标录音文件的文件标签；“2018年11月22日19:08”为该目标录音文件的录音时间；“会议”为该目标录音文件的录音场景；“中国北京市海淀区西二旗中关村软件园互联网创新中心”为该目标录音文件的录音位置。

作为另一种实施方式，多维度信息中的转写内容可以存储为独立文件，并对该包括转写内容的独立文件进行存储。

在存储过程中，包括转写内容的独立文件可以采用多种存储方式。例如，包括转写内容的独立文件可以与相应的目标录音文件存储在同一个存储空间内；包括转写内容的独立文件也可以与相应的目标录音文件存储在同一文件夹下；各个包括转写内容的独立文件还可以存储在同一个文件夹下，并利用存储的转写内容与录音文件的映射关系，来确定各个包括转写内容的独立文件与各个录音文件的对应关系。

以上为S13的具体实施方式。

以上为方法实施例一所提供的录音文件的存储方法，可以根据录音请求进行录音，从而得到目标录音文件，并生成该目标录音文件的多维度信息，以便对应存储该目标录音文件以及该目标录音文件的多维度信息，使得该目标录音文件与其多维度信息之间具有相应的映射关系，如此，可以存储大量的录音文件及其对应的多维度信息。基于此，当用户需要搜索其中的一个或多个录音文件时，可以根据至少一个维度信息搜索这些录音文件，无需从所有文件夹中进行顺序搜索，从而能够快速、准确的搜索到用户所需的录音文件。

方法实施例二

为了能够实现从录音文件集合中对上述方法实施例一所提供的录音文件的存储方法中的目标录音文件进行搜索，本申请还提供了一种录音文件的搜索方法，下面将结合附图进行解释和说明。

参见图8，该图为本申请方法实施例二提供的录音文件的搜索方法的流程图。

本申请实施例提供的录音文件的搜索方法，包括：

S81：接收搜索请求，该搜索请求中携带了至少一个维度的搜索信息。

S82：将至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到匹配的至少一个录音文件。

以上为本申请方法实施例二提供的录音文件的搜索方法的具体执行步骤，为了便于理解和解释本申请方法实施例二提供的录音文件的搜索方法，下面将依次介绍S81和S82的具体实施方式。

首先介绍S81的具体实施方式。

在步骤S81中，搜索请求可以根据用户所提供的待搜索内容生成。

其中，待搜索内容用于描述用户欲搜索的录音文件的相关信息，本申请不限定待搜索内容的格式，例如，待搜索内容可以是语音格式、也可以是文本格式、还可以是图片格式。搜索信息可以是场景信息、地点信息、时间信息、文件名称信息、文件标签信息、内容关键字信息等中的至少一维信息。

此外，为了便于解释和理解S81，下面结合图9和图10进行说明。

作为示例，当用户点击了图9所示的搜索按钮91之后，可以得到图10所示的搜索页面，此时，用户可以在搜索框101内录入待搜索内容“2018年3月10日”，并触发携带有“2018年3月10日”的搜索请求，以便后续能够根据该搜索请求进行录音文件的搜索。其中，搜索信息“2018年3月10日”是一种时间信息。

以上为S81的具体实施方式。

下面介绍S82的具体实施方式。

在步骤S82中，录音文件集合中的录音文件为上述方法实施例一所提供的录音文件的存储方法中的目标录音文件，录音文件集合中包括不同的目标录音文件。

在本申请中，当搜索请求中只携带了一个维度的搜索信息时，则可以将录音文件集合中的各个录音文件分别与该维度的搜索信息进行匹配，并筛选出匹配度较高的至少一个录音文件作为匹配成功的录音文件；当搜索请求中携带了两个或两个以上维度的搜索信息时，则在录音文件集合中交叉定位具有相关信息的录音文件，以便得到匹配成功的录音文件。

为了便于解释和理解上述提供的匹配过程，下面将以S82的一种实施方式为例进行说明。

作为一种实施方式，S82具体可以为：

S821：将至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到该至少一个维度的搜索信息与各个录音文件的匹配度。

为了便于解释和理解步骤S821，下面以包括三个维度的搜索信息的匹配过程为例进行说明。

作为示例，当搜索请求中携带了第一维搜索信息、第二维搜索信息和第三维搜索信息，且录音文件集合包括M个录音文件时，则S821具体可以为：将第一维搜索信息分别与录音文件集合中的M个录音文件的多维度信息进行匹配，得到每一录音文件的多维度信息与第一维搜索信息的匹配度，即得到M个匹配度；将第二维搜索信息分别与录音文件集合中的M个录音文件的多维度信息进行匹配，得到每一录音文件的多维度信息与第二维搜索信息的匹配度，即得到M个匹配度；将第三维搜索信息分别与录音文件集合中的M个录音文件的多维度信息进行匹配，得到每一录音文件的多维度信息与第三维搜索信息的匹配度，即得到M个匹配度。如此，最终得到了3M个匹配度，即，每一录音文件对应3个匹配度。

S822：根据至少一个维度的搜索信息与各个录音文件的匹配度，得到各个录音文件各自对应的综合匹配度。

为了便于解释和理解S822，下面将结合示例进行说明。

作为示例，当存在第一维搜索信息、第二维搜索信息和第三维搜索信息，且录音文件集合包括第一录音文件和第二录音文件时，可以根据第一录音文件的多维度信息与第一维搜索信息的匹配度、第一录音文件的多维度信息与第二维搜索信息的匹配度、以及第一录音文件的多维度信息与第三维搜索信息的匹配度，得到第一录音文件的综合匹配度；同理，根据第二录音文件的多维度信息与第一维搜索信息的匹配度、第二录音文件的多维度信息与第二维搜索信息的匹配度、以及第二录音文件的多维度信息与第三维搜索信息的匹配度，得到第二录音文件的综合匹配度。

需要说明的是，上述示例是以得到第一录音文件的综合匹配度和第二录音文件的综合匹配度为例进行说明的。然而，在本申请中不限定搜索请求中携带的搜索信息的维度数，也不限定录音文件集合中所包括的录音文件的个数。当搜索请求中携带了至少一个维度的搜索信息，且录音文件集合中包括至少一个录音文件时，每一录音文件的综合匹配度均可以按照上述示例提供的第一录音文件的综合匹配度(或，第二录音文件的综合匹配度)的获取过程进行获取。

另外，在本申请中，每一录音文件的综合匹配度可以采用多种计算方式得到，例如，可以采用加权平均的方法实现，也可以采用累加的方法实现，还可以采用其他的方法实现，本申请对此不作具体限定。

为了便于理解和解释综合匹配度，下面以上述第一录音文件的综合匹配度的获取过程为例进行说明。

作为示例，当搜索请求中携带了N个维度的搜索信息，也就是第一维搜索信息至第N维搜索信息，且录音文件集合中包括第一录音文件时，则执行S821步骤后可以得到第一录音文件的多维度信息与第一维搜索信息的匹配度、第一录音文件的多维度信息与第二维搜索信息的匹配度，……，以及第一录音文件的多维度信息与第N维搜索信息的匹配度，即N个匹配度。

此时，作为一种实施方式，第一录音文件的综合匹配度可以利用公式(1)得到；作为另一种实施方式，第一录音文件的综合匹配度也可以利用公式(2)得到。

P_all＝a₁×P₁+a₂×P₂+…+a_N×P_N (1)

P_all＝P₁+P₂+…+P_N (2)

式中，P_all表示第一录音文件的综合匹配度，P₁表示第一录音文件的多维度信息与第一维搜索信息的匹配度，P₂表示第一个录音文件的多维度信息与第二维搜索信息的匹配度，……，P_N表示第一录音文件的多维度信息与第N维搜索信息的匹配度；a₁至a_N分别表示P₁至P_N所对应的权重值，这些权重值可以基于实验或经验设定；N为正整数。

需要说明的是，上述示例是以第一录音文件的综合匹配度的计算过程为例进行说明的。然而，在本申请中所提供的录音文件集合中所包括的各个录音文件均可以采用上述提供的第一录音文件的综合匹配度的计算过程进行计算，为了简要起见，在此不再赘述。

S823：根据各个录音文件的综合匹配度，利用预设筛选规则，得到匹配的至少一个录音文件。

预设筛选规则可以预先设定，例如，预设筛选规则可以是将各个录音文件的综合匹配度与预设匹配阈值进行比较，若录音文件的综合匹配度超过该预设匹配阈值，则确定该录音文件匹配成功；若录音文件的综合匹配度未超过该预设匹配阈值，则确定该录音文件匹配失败。

其中，预设匹配阈值可以预先设定，尤其可以由用户根据自身需求设定。

为了便于解释和理解S823，下面将结合示例进行说明。

作为示例，当录音文件包括第一录音文件和第二录音文件，且第一录音文件的综合匹配度高于预设匹配阈值，第二录音文件的综合匹配度低于预设匹配阈值时，则S823具体可以为：分别判断第一录音文件的综合匹配度和第二录音文件的综合匹配度是否超过预设匹配阈值，此时，由于第一录音文件的综合匹配度高于预设匹配阈值，则确定第一录音文件匹配成功；由于第二录音文件的综合匹配度低于预设匹配阈值，则确定第二录音文件匹配失败。如此，最终筛选得到第一录音文件。

需要说明的是，S82还可以采用现有的或未来的任一种能够实现将至少一个维度的搜索信息与各个录音文件的多维度信息进行匹配的方法，本申请对此不做具体限定。

另外，匹配的至少一个录音文件可以按照预设顺序进行显示，其中，该预设顺序可以预先设定，尤其可以由用户根据其自身需求设定。

例如，匹配的至少一个录音文件可以按照录音文件的综合匹配度的排列顺序进行显示，也可以按照录音文件的录音时间的排列顺序进行显示，也可以按照录音文件的文件名称的排列顺序进行显示，也可以按照录音文件的录音位置的排列顺序进行显示，也可以按照录音文件的录音场景的排列顺序进行显示，也可以按照录音文件的两个或两个以上维度信息的排列顺序进行显示，还可以按照其他顺序进行排序，本申请对此不做具体限定。

以上为S82的具体实施方式。

以上为方法实施例二提供的录音文件的搜索方法的具体实施方式，在该实施方式中，当接收到搜索请求之后，可以将该搜索请求中携带的至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到匹配的至少一个录音文件。由于搜索请求中携带了至少一个维度的搜索信息，而且录音文件集合中的各个录音文件均包括多维度信息，因而能够根据搜索请求中携带的多个维度的搜索信息进行多方位的搜索，无需从所有文件夹中进行顺序搜索，从而能够提高录音文件的搜索效率和准确率。

装置实施例一

本申请实施例将对一种录音文件的存储装置进行介绍，相关内容请参见上述方法实施例。

参见图11，该图为本申请装置实施例一提供的录音文件的存储装置的结构示意图。

本申请实施例提供的录音文件的存储装置110包括：

目标录音文件获取单元111，用于在接收到录音请求后进行录音，得到目标录音文件；

多维度信息生成单元112，用于生成所述目标录音文件的多维度信息；

录音文件信息存储单元113，用于对应存储所述目标录音文件以及所述目标录音文件的多维度信息。

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，所述目标录音文件获取单元111，包括：

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，所述多维度信息包括所述目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称、转写内容中的一项或多项。

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，按照下述方式生成所述目标录音文件的录音位置：

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，按照下述方式生成所述目标录音文件的文件标签：

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，所述装置110还包括：

作为一种实施方式，为了使得后续能够快速、准确的搜索到用户所需的录音文件，按照下述方式生成所述目标录音文件的文件名称：

进一步地，本申请实施例还提供了一种录音文件的存储设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述方法实施例提供的录音文件的存储方法的任一实施方式。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述方法实施例提供的录音文件的存储方法的任一实施方式。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述方法实施例提供的录音文件的存储方法的任一实施方式。

装置实施例二

本申请实施例将对一种录音文件的搜索装置进行介绍，相关内容请参见上述方法实施例。

参见图12，该图为本申请装置实施例一提供的录音文件的搜索装置的结构示意图。

本申请实施例提供的录音文件的搜索装置120包括：

搜索请求接收单元121，用于接收搜索请求，所述搜索请求中携带了至少一个维度的搜索信息；

搜索信息匹配单元122，用于将所述至少一个维度的搜索信息，与录音文件集合中的各个录音文件的多维度信息进行匹配，得到匹配的至少一个录音文件；

其中，所述录音文件集合中的录音文件为上述装置实施例一提供的录音文件的存储装置的任一实施方式中的目标录音文件。

进一步地，本申请实施例还提供了一种录音文件的搜索设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述方法实施例提供的录音文件的搜索方法的任一实施方式。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述方法实施例提供的录音文件的搜索方法的任一实施方式。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述方法实施例提供的录音文件的搜索方法的任一实施方式。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种录音文件的存储方法，其特征在于，包括：

在接收到录音请求后进行录音，得到目标录音文件；

生成所述目标录音文件的多维度信息；

2.根据权利要求1所述的方法，其特征在于，所述在接收到录音请求后进行录音，得到目标录音文件，包括：

在所述目标场景模式下进行录音，得到目标录音文件。

3.根据权利要求1或2所述的方法，其特征在于，所述多维度信息包括所述目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称、转写内容中的一项或多项。

4.根据权利要求3所述的方法，其特征在于，按照下述方式生成所述目标录音文件的录音位置：

5.根据权利要求3所述的方法，其特征在于，按照下述方式生成所述目标录音文件的文件标签：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

在所述目标录音文件的音频上显示所述打标签位置。

7.根据权利要求5所述的方法，其特征在于，所述方法还包括：

8.根据权利要求3所述的方法，其特征在于，按照下述方式生成所述目标录音文件的文件名称：

9.一种录音文件的搜索方法，其特征在于，包括：

10.一种录音文件的存储装置，其特征在于，包括：

11.根据权利要求10所述的装置，其特征在于，所述目标录音文件获取单元，包括：

12.根据权利要求10或11所述的装置，其特征在于，所述多维度信息包括所述目标录音文件的录音场景、录音位置、录音时间、文件标签、文件名称、转写内容中的一项或多项。

13.一种录音文件的搜索装置，其特征在于，包括：

其中，所述录音文件集合中的录音文件为权利要求10至12任一项所述装置中的目标录音文件。