CN108027815A

CN108027815A - 一种语音与图案个性化关联的方法和系统

Info

Publication number: CN108027815A
Application number: CN201580075543.2A
Authority: CN
Inventors: 周鹏; 杨陶柳; 张可; 杨晴; 贾海涛; 吴小川
Original assignee: Chengdu Yazhishepin Network Technology Co ltd
Current assignee: Chengdu Yazhishepin Network Technology Co ltd
Priority date: 2015-09-17
Filing date: 2015-11-09
Publication date: 2018-05-11
Also published as: EP3352093A1; KR20180049054A; SG11201801821YA; US20180277129A1; WO2017045257A1; EP3352093A4; CN105302852A; JP2018537750A; CA2998655A1

Abstract

本发明提供了一种语音与图案个性化关联的方法，包括：采集用户语音数据；将所述语音数据转化成图案并存储；根据用户的查询指令，读取出待查询图案对应的语音数据。本发明建立了语音与图案的个性化关联关系，以语音对应的图案作为互联网可以有效传播的图案，并且还可以通过图案转化为语音，形成图像和语音双重介质，扩大传播范围和有效性。

Description

说明书发明名称：一种语音与图案个性化关联的方法和系统技术领域

[0001] 本发明属于数据处理技术领域。

背景技术

[0002] 随着互联网技术的发展，特别是移动互联网的发展，设计与科技和互联网的结合趋势越来越频繁和紧密，运用场景也越来越广泛。特别随着人们对个性化需求越来越多，对变化的元素将有着强烈的需求。

发明概述

技术问题

[0003] 提供一种基于互联网的信息传播方式，满足人们的个性化需求。

问题的解决方案

技术解决方案

[0004] 有鉴于此，本发明的一个目的是提供一种语音与图案个性化关联的方法。为了对披露的实施例的一些方面有一个基本的理解，下面给出了简单的概括。该概括部分不是泛泛评述，也不是要确定关键 /重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念，以此作为后面的详细说明的序言。

[0005] 本发明提供了一种语音与图案个性化关联的方法，包括：采集用户语音数据；将所述语音数据转化成图案并存储；根据用户的查询指令，读取出待查询图案对应的语音数据。

[0006] 较佳地，将所述语音数据转化成图案包括：将语音数据转换成二进制流；将所述二进制流逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[0007] 较佳地，将语音数据转换成二进制流后，采用加密算法对所述二进制流进行数学变换；对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[0008] 较佳地，利用基准图像符号表示比特位包括：以条纹表示比特位时，通过色彩的跳变表示二进制中 0和 1 ; 或者，以特定形状的图案表示比特位时，通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。

[0009] 较佳地，还包括通过 Web云服务器执行：将采集到的语音数据存储于大容量云存储介质中，将语音及其对应图案的存储路径参数发送至语音转换接口；调用语音转换接口，将语音转换成图案后存储至所述大容量云存储介质上；生成语音及其对应的图案的条目数据，并将其更新至数据库系统中；接收用户的查询指令，从数据库系统获取待查询图案对应的条目数据，据以从大容量云存储介质中读取出所述待查询图案对应的语音数据。

[0010] 较佳地，通过终端的移动应用程序（Appl ication,简称 APP) 采用安卓（Andro id) 系统或者 iOS系统提供的麦克风接口，或者采用超文本标记语言 5 (Hyper text Markup Language 5，简称 HTML5 ) 技术来采集用户语音数据；或者通过网页端采用 HTML5技术或者 Flash技术采集用户语音数据。

[0011] 本发明实施例还提供了一种语音与图案个性化关联的系统，包括语音采集装置、 Web云服务器、大容量云存储介质、语音转换接口和数据库系统，其中：

[0012] 语音采集装置，用于采集用户语音数据；

[0013] Web云服务器，用于将采集到的语音数据存储于大容量云存储介质中，将语音及其对应图案的存储路径参数发送至语音转换接口，将条目数据更新至数据库系统中；

[0014] 语音转换接口，用于将语音转换成图案后存储至所述大容量云存储介质上； [0015] 数据库系统，用于存储语音及其对应的图案的条目数据。

[0016] 较佳地，所述语音转换接口被编译为动态链接库的形式，对外提供 2个接口，其中：

[0017] 第一接口，用于为语音文件及其对应的图案文件生成唯一的文件名称；

[0018] 第二接口，用于将语音数据转换成二进制流后，逐个比特用自定义的基准图像符号表示，构成转换成的图案，然后将所述转换后的图案存储至所述大容量云存储介质上。

[0019] 较佳地，所述第一接口用于将语音数据转换成二进制流，按照加密算法进行数学变换，生成一个生成码，以所述生成码来命名语音文件及其对应的图案文件。所述第二接口，用于对所述数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[0020] 较佳地，所述第二接口利用基准图像符号表示比特位包括：

[0021] 以条纹表示比特位时，通过色彩的跳变表示二进制中 0和 1 ; 或者

[0022] 以特定形状的图案表示比特位时，通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。

[0023] 较佳地，所述语音采集装置是通过终端的应用程序采用 Android系统或者 iOS系统提供的麦克风接口，或者采用 HTML5技术来采集用户语音数据；或者，

[0024] 所述语音采集装置是通过网页端采用 HTML5技术或者 Flash技术采集用户语音数据。

[0025] 为了上述以及相关的目的，一个或多个实施例包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明某些示例性方面，并且其指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。其它的益处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显，所公开的实施例是要包括所有这些方面以及它们的等同。

发明的有益效果

有益效果

[0026] 提供了一种基于互联网的信息传播方式，满足了人们的个性化需求，由于具有图像和语音双重介质，扩大了信息传播的范围和有效性。

对附图的简要说明

附图说明

[0027] 图 1是本发明实施例一种语音与图案个性化关联的方法流程图。

[0028] 图 2是本发明实施例使用条纹作为基准图像符号构成的图案示意图。

[0029] 图 3是本发明实施例一种语音与图案个性化关联的系统方框图。

发明实施例

本发明的实施方式

[0030] 以下描述和附图充分地示出本发明的具体实施方案，以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求，否则单独的组件和功能是可选的，并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。在本文中，本发明的这些实施方案可以被单独地或总地用术语 "发明"来表示，这仅仅是为了方便，并且如果事实上公开了超过一个的发明，不是要自动地限制该应用的范围为任何单个发明或发明构思。

[0031] 申请人通过研究发现，声音是人和动物最特别的识别方式，若将声音转化成图案，既可以达到个性美观的目的，又可以达到方便传播的目的。因此，本发明实施例提供了一种语音与图案个性化关联的方法，如图 1所示，包括步骤：

[0032] 步骤 S101 : 采集用户语音数据；

[0033] 步骤 S102: 将所述语音数据转化成图案并存储；

[0034] 步骤 S103: 根据用户的查询指令，读取出待查询图案对应的语音数据。

[0035] 本发明建立了语音与图案的个性化关联关系，以语音对应的图案作为互联网可以有效传播的图案，并且还可以通过图案转化为语音，形成图像和语音双重介质，扩大传播范围和有效性。

[0036] 其中，步骤 S102中涉及的语音与图案的转换算法包括：将语音数据转换成二进制流；将所述二进制流逐个比特用自定义的基准图像符号表示，构成一个图案

。使用基于这些基准图像符号结合编码信息产生的独特的图案可以用于标记或者识别。

[0037] 对于本项技术牵涉的可变换的基准图像符号，这个符号的运用本身就是一个方便传播的方式。所述基准图像符号可自定义，因此能够为用户提供一种个性化的定制方案。

[0038] 其中，基准图像符号根据实际应用的需求而确定，由设计师根据应用场景，并结合产品的一贯风格设计，本发明对此不做限制。

[0039] 在一具体实施例中，如图 2所示，可使用条纹作为基准图像符号，该条纹由于其色彩的选择和排列的顺序具有独特的风格。该基准图像符号的设计如果以条纹表示比特位时，可以通过色彩的跳变表示二进制中 0和 1。本发明实施例仅以黑白示例，还可以是彩色条纹，可以设计各种色彩的选择和排列顺序。

[0040] 在另一实施例中，也可以以特定形状的平面图形作为基准图像符号。如果以特定形状的图案表示比特位时，可以通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。

[0041] 较佳地，逐个比特位用自定义的基准图像符号表示时，可以按照从高比特位至低比特位的顺序表示，也可以按照从低比特位至高比特位的顺序表示。

[0042] 较佳地，还可以采用加密算法对所述二进制流进行数学变换，对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成一个图案，作为互联网可以有效传播的图案。由于图案本身表示了一串唯一的加密算法编码，进而图案本身具有防伪标签的功能，而且可以通过解析设备读取出相关产品信息。

[0043] 所述加密算法可以采用信息摘要算法 5 (Message-Digest Algorithm

5,简称 MD5)、安全哈希算法 ( Secure Hash Algorithm, 简称 SHA) 、哈希消息验证码（Hashed Message Authentication Code, 简称 HMAC) ，等等。

[0044] 另外，本发明还涉及语音录入技术，提供网页端和移动应用程序（Appl icatio n，简称 APP) 两种的语音录入模式。可以通过移动应用程序采用超文本标记语言 5 (Hyper text Markup Language 5，简称扁 L5 ) 技术或者安卓 (Android) 系统或者 iOS系统提供的麦克风接口来采集用户语音数据。也可以通过网页端采用 HTML5技术或者 Flash技术采集用户语音数据。

[0045] 较佳地，对于采集后的语音数据，通过 Web云服务器方式，存储于大容量云存储介质中。该大容量云存储介质便于后期的扩充与管理。通过 Web云服务器，将语音及其对应图案的存储路径参数发送至语音转换接口；调用语音转换接口，将语音转换成图案后存储至所述大容量云存储介质上；生成语音及其对应的图案的条目数据，并将其更新至数据库系统中。所述条目数据，至少包括存储路径和用户信息。

[0046] 在一实施例中，所述语音转换接口被编译为动态链接库（. dl l)的形式，对外提供 2个接口，其中：

[0047] 第一接口，用于为语音文件及其对应的图案文件生成唯一的文件名称； [0048] 第二接口，用于将语音数据转换成二进制流后，逐个比特用自定义的基准图像符号表示，构成转换成的图案，然后存储至所述大容量云存储介质上。

[0049] 在另一实施例中，提供一种生成加密的图案文件的方案，其中：

[0050] 所述第一接口，用于将语音数据转换成二进制流，按照加密算法进行数学变换，生成一个生成码，以命名语音文件及其对应的图案文件。所述通过加密算法得到的生成码具有唯一性，因此能够唯一命名所述语音文件及其对应的图案文件。

[0051] 所述第二接口，用于对所述数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。由于图案本身表示了一串唯一的加密算法编码，进而图案本身具有防伪标签的功能，而且可以通过解析设备读取出相关产品信息。

[0052] 下面以采用 MD5加密算法为例，说明采用. dl l文件方式实现语音转换接口，功能被编译为动态链接库的形式，对外提供的 2个接口：

[0053] 1、 const char* voice2MD5 (char* voiceUrl)；

[0054] 该函数的作用是通过用户上传的语音文件，产生一个 MD5编码，用于命名语音文件。

[0055] 2、 int voiceToIm (char^ imgUrl, char* voice2MD5, char* userlD, char* remark)；

[0056] 该函数的作用是将语音转换为图案后存储至大容量云存储介质上，其文件名也是语音文件产生的 MD5编码，后缀为 " . bmp" 。

[0057] 文件名使用生成的 MD5码命名，这样可以在大量文件的检索中提高检索访问速度，同时可以保证文件名的命名格式统一，且可以用于检验文件内容和文件名是否匹配。

[0058] 较佳地，数据库系统中存储的条目数据可以设计如下：

[] [表 1]

[0059] 用户可以通过独有的图案，通过远程的云数据库服务器方式读取相关信息，从大容量云存储介质中相关位置读取原始语音信息，以逆转换达到还原成声音的目的，便于语音和图案两种方式的信息存储与传播。

[0060] 为了实现本发明语音与图案个性化关联方法，本发明还提供了一种语音与图案个性化关联的系统，如图 3所示，包括语音采集装置 301、 Web云服务器 302、大容量云存储介质 303、语音转换接口 304和数据库系统 305，其中：

[0061] 语音采集装置 301，用于采集用户语音数据；

[0062] Web云服务器 302，用于将采集到的语音数据存储于大容量云存储介质 303中，将语音及其对应图案的存储路径参数发送至语音转换接口 304，将条目数据更新至数据库系统 305中；

[0063] 语音转换接口 304，用于将语音转换成图案后存储至所述大容量云存储介质 303 上；

[0064] 数据库系统 305，用于存储语音及其对应的图案的条目数据。 [0065] 其中，语音采集装置 301可以提供两种模式，一种是移动 APP模式，一种是网页端模式。在移动 APP模式下，可以通过终端的移动应用程序采用 Android系统或者 iOS系统提供的麦克风接口，或者采用超文本标记语言 HTML5技术来采集用户语音数据。在网页端模式下，则可以通过网页端采用 HTML5技术或者 Flash技术采集用户语音数据。

[0066] Web云服务器 302提供交互平台，供用户通过移动 APP或者网页端下发查询指令，远程的云数据库服务器 302根据查询指令从数据库系统系统 305获取待查询图案对应的条目数据，据以从大容量云存储介质 303中读取出所述待查询图案对应的语音数据，将其发送给用户。

[0067] 在一实施例中，所述语音转换接口 304可以通过将语音数据转换成二进制流，将所述二进制流逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[0068] 具体地，所述语音转换接口 304可以是被编译为动态链接库的形式，对外提供 2 个接口，其中：

[0069] 第一接口，用于为语音文件及其对应的图案文件生成唯一的文件名称；

[0070] 第二接口，用于将语音数据转换成二进制流后，逐个比特用自定义的基准图像符号表示，构成转换成的图案，然后存储至所述大容量云存储介质上。

[0071] 在另一实施例中，所述语音转换接口 304还可以通过将语音数据转换成二进制流，采用加密算法对所述二进制流进行数学变换，对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[0072] 具体地，所述语音转换接口 304还可以是被编译为动态链接库的形式，对外提供 2个接口，其中：

[0073] 所述第一接口，用于将语音数据转换成二进制流，按照加密算法进行数学变换，生成一个生成码，以命名语音文件及其对应的图案文件。所述通过加密算法得到的生成码具有唯一性，因此能够唯一命名所述语音文件及其对应的图案文件。

[0074] 所述第二接口，用于对所述数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。由于图案本身表示了一串唯一的加密算法编码，进而图案本身具有防伪标签的功能，而且可以通过解析设备读取出相关产品信息。

[0075] 其中，基准图像符号根据实际应用的需求而确定，由设计师根据应用场景，并结合产品的一贯风格设计，本发明对此不做限制。

[0076] 在一实施例中，可使用条纹作为基准图像符号，该条纹由于其色彩的选择和排列的顺序具有独特的风格。该基准图像符号的设计如果以条纹表示比特位时，可以通过色彩的跳变表示二进制中 0和 1。

[0077] 在另一实施例中，也可以以特定形状的平面图形作为基准图像符号。如果以特定形状的图案表示比特位时，可以通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。

[0078] 较佳地，逐个比特用自定义的基准图像符号表示时，可以按照从高比特位至低比特位的顺序表示，也可以按照从低比特位至高比特位的顺序表示。

[0079] 其中，所述数据库系统 305中存储的条目数据至少包括存储路径和用户信息。

在一实施例中，可以设计如表 1所示。

[0080] 应该明白，公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好，应该理解，过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素，并且不是要限于所述的特定顺序或层次。

[0081] 在上述的详细描述中，各种特征一起组合在单个的实施方案中，以简化本公开。不应该将这种公开方法解释为反映了这样的意图，即，所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反，如所附的权利要求书所反映的那样，本发明处于比所公开的单个实施方案的全部特征少的状态。因此，所附的权利要求书特此清楚地被并入详细描述中，其中每项权利要求独自作为本发明单独的优选实施方案。

[0082] 本领域技术人员还应当理解，结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性，上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件，取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用，以变通的方式实现所描述的功能，但是，这种实现决策不应解释为背离本公开的保护范围。

[0083] 上文的描述包括一个或多个实施例的举例。当然，为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的，但是本领域普通技术人员应该认识至 I」，各个实施例可以做进一步的组合和排列。因此，本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外，就说明书或权利要求书中使用的术语 "包含" ，该词的涵盖方式类似于术语 "包括" ，就如同 "包括， "在权利要求中用作衔接词所解释的那样。此外，使用在权利要求书的说明书中的任何一个术语 "或者"是要表示 "非排它性的或者" 。

工业实用性

[0084] 提供了一种基于互联网的信息传播方式，满足了人们的个性化需求，由于具有图像和语音双重介质，扩大了信息传播的范围和有效性。

Claims

权利要求书

一种语音与图案个性化关联的方法，其特征在于，包括：

采集用户语音数据；

将所述语音数据化换成图案并存储；

根据用户的查询指令，读取出待查询图案对应的语音数据。

如权利要求 1所述的方法，其特征在于，将所述语音数据转化成图案包括：

将语音数据转换成二进制流；

将所述二进制流逐个比特用自定义的基准图像符号表示，构成转换成的图案。

如权利要求 2所述的方法，其特征在于：

采用加密算法对所述二进制流进行数学变换；

对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。

如权利要求 2或 3所述的方法，其特征在于，利用基准图像符号表示比特位包括：

以条纹表示比特位时，通过色彩的跳变表示二进制中 0和 1 ; 或者以特定形状的图案表示比特位时，通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。

如权利要求 1所述的方法，其特征在于，通过 Web云服务器执行：将采集到的语音数据存储于大容量云存储介质中，将语音及其对应图案的存储路径参数发送至语音转换接口；

调用语音转换接口，将语音转换成图案后存储至所述大容量云存储介质上；

生成语音及其对应的图案的条目数据，并将其更新至数据库系统中；接收用户的查询指令，从数据库系统获取待查询图案对应的条目数据 [权利要求 6] 一种语音与图案个性化关联的系统，其特征在于，包括语音采集装置、 Web云服务器、大容量云存储介质、语音转换接口和数据库系统，其中：

语音采集装置，用于采集用户语音数据；

Web云服务器，用于将采集到的语音数据存储于大容量云存储介质中，将语音及其对应图案的存储路径参数发送至语音转换接口，将条目数据更新至数据库系统中；

语音转换接口，用于将语音转换成图案后存储至所述大容量云存储介质上；

数据库系统，用于存储语音及其对应的图案的条目数据。

[权利要求 7] 如权利要求 6所述的系统，其特征在于：

所述语音转换接口被编译为动态链接库的形式，对外提供 2个接口，其中：

第一接口，用于为语音文件及其对应的图案文件生成唯一的文件名称第二接口，用于将语音数据转换成二进制流后，逐个比特用自定义的基准图像符号表示，构成转换成的图案，然后存储至所述大容量云存储介质上。

[权利要求 8] 如权利要求 7所述的系统，其特征在于：

所述第一接口，用于将语音数据转换成二进制流，按照加密算法进行数学变换，生成一个生成码，以命名语音文件及其对应的图案文件；所述第二接口，用于对所述数学变换后得到的生成码逐个比特用自定义的基准图像符号表示，构成转换成的图案。

[权利要求 9] 如权利要求 7或 8所述的系统，其特征在于，所述第二接口利用基准图像符号表示比特位包括：

以条纹表示比特位时，通过色彩的跳变表示二进制中 0和 1 ; 或者以特定形状的图案表示比特位时，通过该图案相对于参考点的旋转角度来表示二进制中 0和 1。 [权利要求 10] 如权利要求 6所述的系统，其特征在于：

所述语音采集装置是通过移动应用程序采用安卓系统或者 iOS系统提供的麦克风接口，或者采用超文本标记语言 HTML5技术来采集用户语音数据；或者，

所述语音采集装置是通过网页端采用 HTML5技术或者 Flash技术采集用户语音数据。