CN108027815A - 一种语音与图案个性化关联的方法和系统 - Google Patents

一种语音与图案个性化关联的方法和系统 Download PDF

Info

Publication number
CN108027815A
CN108027815A CN201580075543.2A CN201580075543A CN108027815A CN 108027815 A CN108027815 A CN 108027815A CN 201580075543 A CN201580075543 A CN 201580075543A CN 108027815 A CN108027815 A CN 108027815A
Authority
CN
China
Prior art keywords
voice
pattern
patterns
voice data
represented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580075543.2A
Other languages
English (en)
Inventor
周鹏
杨陶柳
张可
杨晴
贾海涛
吴小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Yazhishepin Network Technology Co ltd
Original Assignee
Chengdu Yazhishepin Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yazhishepin Network Technology Co ltd filed Critical Chengdu Yazhishepin Network Technology Co ltd
Publication of CN108027815A publication Critical patent/CN108027815A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Storage Device Security (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种语音与图案个性化关联的方法,包括:采集用户语音数据;将所述语音数据转化成图案并存储;根据用户的查询指令,读取出待查询图案对应的语音数据。本发明建立了语音与图案的个性化关联关系,以语音对应的图案作为互联网可以有效传播的图案,并且还可以通过图案转化为语音,形成图像和语音双重介质,扩大传播范围和有效性。

Description

说明书 发明名称: 一种语音与图案个性化关联的方法和系统 技术领域
[0001] 本发明属于数据处理技术领域。
背景技术
[0002] 随着互联网技术的发展, 特别是移动互联网的发展, 设计与科技和互联网的结 合趋势越来越频繁和紧密, 运用场景也越来越广泛。 特别随着人们对个性化需 求越来越多, 对变化的元素将有着强烈的需求。
发明概述
技术问题
[0003] 提供一种基于互联网的信息传播方式, 满足人们的个性化需求。
问题的解决方案
技术解决方案
[0004] 有鉴于此, 本发明的一个目的是提供一种语音与图案个性化关联的方法。 为了 对披露的实施例的一些方面有一个基本的理解, 下面给出了简单的概括。 该概 括部分不是泛泛评述, 也不是要确定关键 /重要组成元素或描绘这些实施例的 保护范围。 其唯一目的是用简单的形式呈现一些概念, 以此作为后面的详细说 明的序言。
[0005] 本发明提供了一种语音与图案个性化关联的方法, 包括: 采集用户语音数据; 将所述语音数据转化成图案并存储; 根据用户的查询指令, 读取出待查询图案 对应的语音数据。
[0006] 较佳地, 将所述语音数据转化成图案包括: 将语音数据转换成二进制流; 将所 述二进制流逐个比特用自定义的基准图像符号表示, 构成转换成的图案。
[0007] 较佳地, 将语音数据转换成二进制流后, 采用加密算法对所述二进制流进行数 学变换; 对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示, 构成转换成的图案。
[0008] 较佳地, 利用基准图像符号表示比特位包括: 以条纹表示比特位时, 通过色彩 的跳变表示二进制中 0和 1 ; 或者, 以特定形状的图案表示比特位时, 通过该图 案相对于参考点的旋转角度来表示二进制中 0和 1。
[0009] 较佳地, 还包括通过 Web云服务器执行: 将采集到的语音数据存储于大容量云 存储介质中, 将语音及其对应图案的存储路径参数发送至语音转换接口; 调用 语音转换接口, 将语音转换成图案后存储至所述大容量云存储介质上; 生成语 音及其对应的图案的条目数据, 并将其更新至数据库系统中; 接收用户的查询 指令, 从数据库系统获取待查询图案对应的条目数据, 据以从大容量云存储介 质中读取出所述待查询图案对应的语音数据。
[0010] 较佳地, 通过终端的移动应用程序 (Appl ication,简称 APP) 采用安卓 (Andro id) 系统或者 iOS系统提供的麦克风接口, 或者采用超文本标记语言 5 (Hyper text Markup Language 5, 简称 HTML5 ) 技术来采集用户语音数据; 或者通过网 页端采用 HTML5技术或者 Flash技术采集用户语音数据。
[0011] 本发明实施例还提供了一种语音与图案个性化关联的系统, 包括语音采集装置 、 Web云服务器、 大容量云存储介质、 语音转换接口和数据库系统, 其中:
[0012] 语音采集装置, 用于采集用户语音数据;
[0013] Web云服务器, 用于将采集到的语音数据存储于大容量云存储介质中, 将语音 及其对应图案的存储路径参数发送至语音转换接口, 将条目数据更新至数据库 系统中;
[0014] 语音转换接口, 用于将语音转换成图案后存储至所述大容量云存储介质上; [0015] 数据库系统, 用于存储语音及其对应的图案的条目数据。
[0016] 较佳地, 所述语音转换接口被编译为动态链接库的形式, 对外提供 2个接口, 其中:
[0017] 第一接口, 用于为语音文件及其对应的图案文件生成唯一的文件名称;
[0018] 第二接口, 用于将语音数据转换成二进制流后, 逐个比特用自定义的基准图像 符号表示, 构成转换成的图案, 然后将所述转换后的图案存储至所述大容量云 存储介质上。
[0019] 较佳地, 所述第一接口用于将语音数据转换成二进制流, 按照加密算法进行数 学变换, 生成一个生成码, 以所述生成码来命名语音文件及其对应的图案文件 。 所述第二接口, 用于对所述数学变换后得到的生成码逐个比特用自定义的基 准图像符号表示, 构成转换成的图案。
[0020] 较佳地, 所述第二接口利用基准图像符号表示比特位包括:
[0021] 以条纹表示比特位时, 通过色彩的跳变表示二进制中 0和 1 ; 或者
[0022] 以特定形状的图案表示比特位时, 通过该图案相对于参考点的旋转角度来表示 二进制中 0和 1。
[0023] 较佳地, 所述语音采集装置是通过终端的应用程序采用 Android系统或者 iOS系 统提供的麦克风接口, 或者采用 HTML5技术来采集用户语音数据; 或者,
[0024] 所述语音采集装置是通过网页端采用 HTML5技术或者 Flash技术采集用户语音数 据。
[0025] 为了上述以及相关的目的, 一个或多个实施例包括后面将详细说明并在权利要 求中特别指出的特征。 下面的说明以及附图详细说明某些示例性方面, 并且其 指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。 其它的益 处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显, 所公开的实 施例是要包括所有这些方面以及它们的等同。
发明的有益效果
有益效果
[0026] 提供了一种基于互联网的信息传播方式, 满足了人们的个性化需求, 由于具有 图像和语音双重介质, 扩大了信息传播的范围和有效性。
对附图的简要说明
附图说明
[0027] 图 1是本发明实施例一种语音与图案个性化关联的方法流程图。
[0028] 图 2是本发明实施例使用条纹作为基准图像符号构成的图案示意图。
[0029] 图 3是本发明实施例一种语音与图案个性化关联的系统方框图。
发明实施例
本发明的实施方式
[0030] 以下描述和附图充分地示出本发明的具体实施方案, 以使本领域的技术人员能 够实践它们。 其他实施方案可以包括结构的、 逻辑的、 电气的、 过程的以及其 他的改变。 实施例仅代表可能的变化。 除非明确要求, 否则单独的组件和功能 是可选的, 并且操作的顺序可以变化。 一些实施方案的部分和特征可以被包括 在或替换其他实施方案的部分和特征。 本发明的实施方案的范围包括权利要求 书的整个范围, 以及权利要求书的所有可获得的等同物。 在本文中, 本发明的 这些实施方案可以被单独地或总地用术语 "发明"来表示, 这仅仅是为了方便 , 并且如果事实上公开了超过一个的发明, 不是要自动地限制该应用的范围为 任何单个发明或发明构思。
[0031] 申请人通过研究发现, 声音是人和动物最特别的识别方式, 若将声音转化成图 案, 既可以达到个性美观的目的, 又可以达到方便传播的目的。 因此, 本发明 实施例提供了一种语音与图案个性化关联的方法, 如图 1所示, 包括步骤:
[0032] 步骤 S101 : 采集用户语音数据;
[0033] 步骤 S102: 将所述语音数据转化成图案并存储;
[0034] 步骤 S103: 根据用户的查询指令, 读取出待查询图案对应的语音数据。
[0035] 本发明建立了语音与图案的个性化关联关系, 以语音对应的图案作为互联网可 以有效传播的图案, 并且还可以通过图案转化为语音, 形成图像和语音双重介 质, 扩大传播范围和有效性。
[0036] 其中, 步骤 S102中涉及的语音与图案的转换算法包括: 将语音数据转换成二进 制流; 将所述二进制流逐个比特用自定义的基准图像符号表示, 构成一个图案
。 使用基于这些基准图像符号结合编码信息产生的独特的图案可以用于标记或 者识别。
[0037] 对于本项技术牵涉的可变换的基准图像符号, 这个符号的运用本身就是一个方 便传播的方式。 所述基准图像符号可自定义, 因此能够为用户提供一种个性化 的定制方案。
[0038] 其中, 基准图像符号根据实际应用的需求而确定, 由设计师根据应用场景, 并 结合产品的一贯风格设计, 本发明对此不做限制。
[0039] 在一具体实施例中, 如图 2所示, 可使用条纹作为基准图像符号, 该条纹由于 其色彩的选择和排列的顺序具有独特的风格。 该基准图像符号的设计如果以条 纹表示比特位时, 可以通过色彩的跳变表示二进制中 0和 1。 本发明实施例仅以 黑白示例, 还可以是彩色条纹, 可以设计各种色彩的选择和排列顺序。
[0040] 在另一实施例中, 也可以以特定形状的平面图形作为基准图像符号。 如果以特 定形状的图案表示比特位时, 可以通过该图案相对于参考点的旋转角度来表示 二进制中 0和 1。
[0041] 较佳地, 逐个比特位用自定义的基准图像符号表示时, 可以按照从高比特位至 低比特位的顺序表示, 也可以按照从低比特位至高比特位的顺序表示。
[0042] 较佳地, 还可以采用加密算法对所述二进制流进行数学变换, 对数学变换后得 到的生成码逐个比特用自定义的基准图像符号表示, 构成一个图案, 作为互联 网可以有效传播的图案。 由于图案本身表示了一串唯一的加密算法编码, 进而 图案本身具有防伪标签的功能, 而且可以通过解析设备读取出相关产品信息。
[0043] 所述加密算法可以采用信息摘要算法 5 (Message-Digest Algorithm
5,简称 MD5)、 安全哈希算法 ( Secure Hash Algorithm, 简称 SHA) 、 哈希消息 验证码 (Hashed Message Authentication Code, 简称 HMAC) , 等等。
[0044] 另外, 本发明还涉及语音录入技术, 提供网页端和移动应用程序 (Appl icatio n, 简称 APP) 两种的语音录入模式。 可以通过移动应用程序采用超文本标记语 言 5 (Hyper text Markup Language 5, 简称扁 L5 ) 技术或者安卓 (Android) 系统或者 iOS系统提供的麦克风接口来采集用户语音数据。 也可以通过网页端采 用 HTML5技术或者 Flash技术采集用户语音数据。
[0045] 较佳地, 对于采集后的语音数据, 通过 Web云服务器方式, 存储于大容量云存 储介质中。 该大容量云存储介质便于后期的扩充与管理。 通过 Web云服务器, 将 语音及其对应图案的存储路径参数发送至语音转换接口; 调用语音转换接口, 将语音转换成图案后存储至所述大容量云存储介质上; 生成语音及其对应的图 案的条目数据, 并将其更新至数据库系统中。 所述条目数据, 至少包括存储路 径和用户信息。
[0046] 在一实施例中, 所述语音转换接口被编译为动态链接库(. dl l)的形式, 对外提 供 2个接口, 其中:
[0047] 第一接口, 用于为语音文件及其对应的图案文件生成唯一的文件名称; [0048] 第二接口, 用于将语音数据转换成二进制流后, 逐个比特用自定义的基准图像 符号表示, 构成转换成的图案, 然后存储至所述大容量云存储介质上。
[0049] 在另一实施例中, 提供一种生成加密的图案文件的方案, 其中:
[0050] 所述第一接口, 用于将语音数据转换成二进制流, 按照加密算法进行数学变换 , 生成一个生成码, 以命名语音文件及其对应的图案文件。 所述通过加密算法 得到的生成码具有唯一性, 因此能够唯一命名所述语音文件及其对应的图案文 件。
[0051] 所述第二接口, 用于对所述数学变换后得到的生成码逐个比特用自定义的基准 图像符号表示, 构成转换成的图案。 由于图案本身表示了一串唯一的加密算法 编码, 进而图案本身具有防伪标签的功能, 而且可以通过解析设备读取出相关 产品信息。
[0052] 下面以采用 MD5加密算法为例, 说明采用. dl l文件方式实现语音转换接口, 功 能被编译为动态链接库的形式, 对外提供的 2个接口:
[0053] 1、 const char* voice2MD5 (char* voiceUrl);
[0054] 该函数的作用是通过用户上传的语音文件, 产生一个 MD5编码, 用于命名语音 文件。
[0055] 2、 int voiceToIm (char^ imgUrl, char* voice2MD5, char* userlD, char* remark);
[0056] 该函数的作用是将语音转换为图案后存储至大容量云存储介质上, 其文件名也 是语音文件产生的 MD5编码, 后缀为 " . bmp" 。
[0057] 文件名使用生成的 MD5码命名, 这样可以在大量文件的检索中提高检索访问速 度, 同时可以保证文件名的命名格式统一, 且可以用于检验文件内容和文件名 是否匹配。
[0058] 较佳地, 数据库系统中存储的条目数据可以设计如下:
[] [表 1]
[0059] 用户可以通过独有的图案, 通过远程的云数据库服务器方式读取相关信息, 从 大容量云存储介质中相关位置读取原始语音信息, 以逆转换达到还原成声音的 目的, 便于语音和图案两种方式的信息存储与传播。
[0060] 为了实现本发明语音与图案个性化关联方法, 本发明还提供了一种语音与图案 个性化关联的系统, 如图 3所示, 包括语音采集装置 301、 Web云服务器 302、 大 容量云存储介质 303、 语音转换接口 304和数据库系统 305, 其中:
[0061] 语音采集装置 301, 用于采集用户语音数据;
[0062] Web云服务器 302, 用于将采集到的语音数据存储于大容量云存储介质 303中, 将语音及其对应图案的存储路径参数发送至语音转换接口 304, 将条目数据更新 至数据库系统 305中;
[0063] 语音转换接口 304, 用于将语音转换成图案后存储至所述大容量云存储介质 303 上;
[0064] 数据库系统 305, 用于存储语音及其对应的图案的条目数据。 [0065] 其中, 语音采集装置 301可以提供两种模式, 一种是移动 APP模式, 一种是网页 端模式。 在移动 APP模式下, 可以通过终端的移动应用程序采用 Android系统或 者 iOS系统提供的麦克风接口, 或者采用超文本标记语言 HTML5技术来采集用户 语音数据。 在网页端模式下, 则可以通过网页端采用 HTML5技术或者 Flash技术 采集用户语音数据。
[0066] Web云服务器 302提供交互平台, 供用户通过移动 APP或者网页端下发查询指令 , 远程的云数据库服务器 302根据查询指令从数据库系统系统 305获取待查询图 案对应的条目数据, 据以从大容量云存储介质 303中读取出所述待查询图案对应 的语音数据, 将其发送给用户。
[0067] 在一实施例中, 所述语音转换接口 304可以通过将语音数据转换成二进制流, 将所述二进制流逐个比特用自定义的基准图像符号表示, 构成转换成的图案。
[0068] 具体地, 所述语音转换接口 304可以是被编译为动态链接库的形式, 对外提供 2 个接口, 其中:
[0069] 第一接口, 用于为语音文件及其对应的图案文件生成唯一的文件名称;
[0070] 第二接口, 用于将语音数据转换成二进制流后, 逐个比特用自定义的基准图像 符号表示, 构成转换成的图案, 然后存储至所述大容量云存储介质上。
[0071] 在另一实施例中, 所述语音转换接口 304还可以通过将语音数据转换成二进制 流, 采用加密算法对所述二进制流进行数学变换, 对数学变换后得到的生成码 逐个比特用自定义的基准图像符号表示, 构成转换成的图案。
[0072] 具体地, 所述语音转换接口 304还可以是被编译为动态链接库的形式, 对外提 供 2个接口, 其中:
[0073] 所述第一接口, 用于将语音数据转换成二进制流, 按照加密算法进行数学变换 , 生成一个生成码, 以命名语音文件及其对应的图案文件。 所述通过加密算法 得到的生成码具有唯一性, 因此能够唯一命名所述语音文件及其对应的图案文 件。
[0074] 所述第二接口, 用于对所述数学变换后得到的生成码逐个比特用自定义的基准 图像符号表示, 构成转换成的图案。 由于图案本身表示了一串唯一的加密算法 编码, 进而图案本身具有防伪标签的功能, 而且可以通过解析设备读取出相关 产品信息。
[0075] 其中, 基准图像符号根据实际应用的需求而确定, 由设计师根据应用场景, 并 结合产品的一贯风格设计, 本发明对此不做限制。
[0076] 在一实施例中, 可使用条纹作为基准图像符号, 该条纹由于其色彩的选择和排 列的顺序具有独特的风格。 该基准图像符号的设计如果以条纹表示比特位时, 可以通过色彩的跳变表示二进制中 0和 1。
[0077] 在另一实施例中, 也可以以特定形状的平面图形作为基准图像符号。 如果以特 定形状的图案表示比特位时, 可以通过该图案相对于参考点的旋转角度来表示 二进制中 0和 1。
[0078] 较佳地, 逐个比特用自定义的基准图像符号表示时, 可以按照从高比特位至低 比特位的顺序表示, 也可以按照从低比特位至高比特位的顺序表示。
[0079] 其中, 所述数据库系统 305中存储的条目数据至少包括存储路径和用户信息。
在一实施例中, 可以设计如表 1所示。
[0080] 应该明白, 公开的过程中的步骤的特定顺序或层次是示例性方法的实例。 基于 设计偏好, 应该理解, 过程中的步骤的特定顺序或层次可以在不脱离本公开的 保护范围的情况下得到重新安排。 所附的方法权利要求以示例性的顺序给出了 各种步骤的要素, 并且不是要限于所述的特定顺序或层次。
[0081] 在上述的详细描述中, 各种特征一起组合在单个的实施方案中, 以简化本公开 。 不应该将这种公开方法解释为反映了这样的意图, 即, 所要求保护的主题的 实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。 相反, 如所 附的权利要求书所反映的那样, 本发明处于比所公开的单个实施方案的全部特 征少的状态。 因此, 所附的权利要求书特此清楚地被并入详细描述中, 其中每 项权利要求独自作为本发明单独的优选实施方案。
[0082] 本领域技术人员还应当理解, 结合本文的实施例描述的各种说明性的逻辑框、 模块、 电路和算法步骤均可以实现成电子硬件、 计算机软件或其组合。 为了清 楚地说明硬件和软件之间的可交换性, 上面对各种说明性的部件、 框、 模块、 电路和步骤均围绕其功能进行了一般地描述。 至于这种功能是实现成硬件还是 实现成软件, 取决于特定的应用和对整个系统所施加的设计约束条件。 熟练的 技术人员可以针对每个特定应用, 以变通的方式实现所描述的功能, 但是, 这 种实现决策不应解释为背离本公开的保护范围。
[0083] 上文的描述包括一个或多个实施例的举例。 当然, 为了描述上述实施例而描述 部件或方法的所有可能的结合是不可能的, 但是本领域普通技术人员应该认识 至 I」, 各个实施例可以做进一步的组合和排列。 因此, 本文中描述的实施例旨在 涵盖落入所附权利要求书的保护范围内的所有这样的改变、 修改和变型。 此外 , 就说明书或权利要求书中使用的术语 "包含" , 该词的涵盖方式类似于术语 "包括" , 就如同 "包括, "在权利要求中用作衔接词所解释的那样。 此外, 使用在权利要求书的说明书中的任何一个术语 "或者"是要表示 "非排它性的 或者" 。
工业实用性
[0084] 提供了一种基于互联网的信息传播方式, 满足了人们的个性化需求, 由于具有 图像和语音双重介质, 扩大了信息传播的范围和有效性。

Claims (1)

  1. 权利要求书
    一种语音与图案个性化关联的方法, 其特征在于, 包括:
    采集用户语音数据;
    将所述语音数据化换成图案并存储;
    根据用户的查询指令, 读取出待查询图案对应的语音数据。
    如权利要求 1所述的方法, 其特征在于, 将所述语音数据转化成图案 包括:
    将语音数据转换成二进制流;
    将所述二进制流逐个比特用自定义的基准图像符号表示, 构成转换成 的图案。
    如权利要求 2所述的方法, 其特征在于:
    采用加密算法对所述二进制流进行数学变换;
    对数学变换后得到的生成码逐个比特用自定义的基准图像符号表示, 构成转换成的图案。
    如权利要求 2或 3所述的方法, 其特征在于, 利用基准图像符号表示比 特位包括:
    以条纹表示比特位时, 通过色彩的跳变表示二进制中 0和 1 ; 或者 以特定形状的图案表示比特位时, 通过该图案相对于参考点的旋转角 度来表示二进制中 0和 1。
    如权利要求 1所述的方法, 其特征在于, 通过 Web云服务器执行: 将采集到的语音数据存储于大容量云存储介质中, 将语音及其对应图 案的存储路径参数发送至语音转换接口;
    调用语音转换接口, 将语音转换成图案后存储至所述大容量云存储介 质上;
    生成语音及其对应的图案的条目数据, 并将其更新至数据库系统中; 接收用户的查询指令, 从数据库系统获取待查询图案对应的条目数据 [权利要求 6] 一种语音与图案个性化关联的系统, 其特征在于, 包括语音采集装置 、 Web云服务器、 大容量云存储介质、 语音转换接口和数据库系统, 其中:
    语音采集装置, 用于采集用户语音数据;
    Web云服务器, 用于将采集到的语音数据存储于大容量云存储介质中 , 将语音及其对应图案的存储路径参数发送至语音转换接口, 将条目 数据更新至数据库系统中;
    语音转换接口, 用于将语音转换成图案后存储至所述大容量云存储介 质上;
    数据库系统, 用于存储语音及其对应的图案的条目数据。
    [权利要求 7] 如权利要求 6所述的系统, 其特征在于:
    所述语音转换接口被编译为动态链接库的形式, 对外提供 2个接口, 其中:
    第一接口, 用于为语音文件及其对应的图案文件生成唯一的文件名称 第二接口, 用于将语音数据转换成二进制流后, 逐个比特用自定义的 基准图像符号表示, 构成转换成的图案, 然后存储至所述大容量云存 储介质上。
    [权利要求 8] 如权利要求 7所述的系统, 其特征在于:
    所述第一接口, 用于将语音数据转换成二进制流, 按照加密算法进行 数学变换, 生成一个生成码, 以命名语音文件及其对应的图案文件; 所述第二接口, 用于对所述数学变换后得到的生成码逐个比特用自定 义的基准图像符号表示, 构成转换成的图案。
    [权利要求 9] 如权利要求 7或 8所述的系统, 其特征在于, 所述第二接口利用基准图 像符号表示比特位包括:
    以条纹表示比特位时, 通过色彩的跳变表示二进制中 0和 1 ; 或者 以特定形状的图案表示比特位时, 通过该图案相对于参考点的旋转角 度来表示二进制中 0和 1。 [权利要求 10] 如权利要求 6所述的系统, 其特征在于:
    所述语音采集装置是通过移动应用程序采用安卓系统或者 iOS系统提 供的麦克风接口, 或者采用超文本标记语言 HTML5技术来采集用户语 音数据; 或者,
    所述语音采集装置是通过网页端采用 HTML5技术或者 Flash技术采集用 户语音数据。
CN201580075543.2A 2015-09-17 2015-11-09 一种语音与图案个性化关联的方法和系统 Pending CN108027815A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510590655.3A CN105302852A (zh) 2015-09-17 2015-09-17 一种语音与图案个性化关联的方法
CN2015105906553 2015-09-17
PCT/CN2015/094086 WO2017045257A1 (zh) 2015-09-17 2015-11-09 一种语音与图案个性化关联的方法和系统

Publications (1)

Publication Number Publication Date
CN108027815A true CN108027815A (zh) 2018-05-11

Family

ID=55200124

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510590655.3A Pending CN105302852A (zh) 2015-09-17 2015-09-17 一种语音与图案个性化关联的方法
CN201580075543.2A Pending CN108027815A (zh) 2015-09-17 2015-11-09 一种语音与图案个性化关联的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510590655.3A Pending CN105302852A (zh) 2015-09-17 2015-09-17 一种语音与图案个性化关联的方法

Country Status (8)

Country Link
US (1) US20180277129A1 (zh)
EP (1) EP3352093A4 (zh)
JP (1) JP2018537750A (zh)
KR (1) KR20180049054A (zh)
CN (2) CN105302852A (zh)
CA (1) CA2998655A1 (zh)
SG (1) SG11201801821YA (zh)
WO (1) WO2017045257A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI724722B (zh) * 2019-12-31 2021-04-11 技嘉科技股份有限公司 電子裝置及螢幕上顯示介面的顯示方法
CN111880677B (zh) * 2020-06-22 2024-08-20 深圳市鸿合创新信息技术有限责任公司 触控计算方法、装置、系统、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0311482A (ja) * 1989-06-09 1991-01-18 Casio Comput Co Ltd 音声記録方法及び装置並びに音声再生方法及び装置
CN2745296Y (zh) * 2004-06-01 2005-12-07 深圳矽感科技有限公司 能生成语音条码相片的嵌入式数码照相设备
US20060249573A1 (en) * 2005-05-06 2006-11-09 Berkun Kenneth A Systems and methods for generating, reading and transferring identifiers
CN101228770A (zh) * 2005-07-27 2008-07-23 国际商业机器公司 用于将文件安全发送至被授权的接收者的系统和方法
CN103219013A (zh) * 2013-04-23 2013-07-24 江苏圆坤科技发展有限公司 一种语音二维码生成系统及其操作方法
WO2014204074A1 (ko) * 2013-06-18 2014-12-24 (주) 엠티콤 전자문서 생성 및 조회 방법 및 기록 매체
US20150161204A1 (en) * 2013-12-11 2015-06-11 Samsung Electronics Co., Ltd. Interactive system, server and control method thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388731B (zh) * 2007-09-14 2013-07-10 刘林泉 一种低速率等效语音水声通信技术
CN101751591B (zh) * 2010-01-14 2016-05-25 复旦大学 可记录语音信息的大容量二维条码及阅读器
US20150379255A1 (en) * 2014-06-25 2015-12-31 Anand Konanur Systems and methods for granting access to a computing device using a wearable device
CN104778435A (zh) * 2015-03-11 2015-07-15 华南理工大学 一种基于彩色二维码技术的物流商品信息语音播报的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0311482A (ja) * 1989-06-09 1991-01-18 Casio Comput Co Ltd 音声記録方法及び装置並びに音声再生方法及び装置
CN2745296Y (zh) * 2004-06-01 2005-12-07 深圳矽感科技有限公司 能生成语音条码相片的嵌入式数码照相设备
US20060249573A1 (en) * 2005-05-06 2006-11-09 Berkun Kenneth A Systems and methods for generating, reading and transferring identifiers
CN101228770A (zh) * 2005-07-27 2008-07-23 国际商业机器公司 用于将文件安全发送至被授权的接收者的系统和方法
US20100281254A1 (en) * 2005-07-27 2010-11-04 Fernando Incertis Carro Systems and method for secure delivery of files to authorized recipients
CN103219013A (zh) * 2013-04-23 2013-07-24 江苏圆坤科技发展有限公司 一种语音二维码生成系统及其操作方法
WO2014204074A1 (ko) * 2013-06-18 2014-12-24 (주) 엠티콤 전자문서 생성 및 조회 방법 및 기록 매체
US20150161204A1 (en) * 2013-12-11 2015-06-11 Samsung Electronics Co., Ltd. Interactive system, server and control method thereof

Also Published As

Publication number Publication date
EP3352093A1 (en) 2018-07-25
KR20180049054A (ko) 2018-05-10
SG11201801821YA (en) 2018-04-27
US20180277129A1 (en) 2018-09-27
WO2017045257A1 (zh) 2017-03-23
EP3352093A4 (en) 2019-10-09
CN105302852A (zh) 2016-02-03
JP2018537750A (ja) 2018-12-20
CA2998655A1 (en) 2017-03-23

Similar Documents

Publication Publication Date Title
CN107665233A (zh) 数据库数据处理方法、装置、计算机设备和存储介质
CN110781155B (zh) 基于ipfs的数据存储读取方法、系统、设备和介质
CN106970820A (zh) 代码存储方法及代码存储装置
CN102567485B (zh) 用于内容检索的提供商专用解析
CN105825083A (zh) 图片版权保护方法和识别方法及其相关方法和系统
CN105095168A (zh) 一种合同文档的自动生成方法和装置
CN106648445B (zh) 用于网络爬虫的数据存储方法及装置
CN112053692B (zh) 语音识别处理方法、装置及存储介质
CN113448817A (zh) 一种页面录屏方法、装置以及存储介质
CN111460394A (zh) 一种版权文件的验证方法、装置及计算机可读存储介质
CN112784112A (zh) 报文校验方法及装置
CN109710894A (zh) 文件内容提取方法、设备、装置及计算机可读存储介质
CN106780280B (zh) 数字水印加密方法及装置
CN108027815A (zh) 一种语音与图案个性化关联的方法和系统
CN101226534B (zh) 一种查找关联文件的方法、终端和系统
CN101512519A (zh) 封装uri方案以标识并引用包的多个部分
CN102932474B (zh) 报文解析方法、设备及系统
CN106293862B (zh) 一种可扩展标记语言xml数据的解析方法和装置
Haupert et al. The object memory server for semantic product memories
CN114065269B (zh) 无绑定型非同质化代币的生成方法和解析方法和存储介质
CN112003736B (zh) 一种多节点配置信息确定方法、装置及存储介质
CN106961626A (zh) 一种视频元信息自动补全整理的方法和装置
CN105353948A (zh) 一种信息处理方法和装置
CN104780148A (zh) 服务器、终端、文档在线操作的系统和方法
Khatri et al. A manual approach for multimedia file carving

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180511