CN112860468A - 利用声音传递信息的方法和系统 - Google Patents
利用声音传递信息的方法和系统 Download PDFInfo
- Publication number
- CN112860468A CN112860468A CN202110089317.7A CN202110089317A CN112860468A CN 112860468 A CN112860468 A CN 112860468A CN 202110089317 A CN202110089317 A CN 202110089317A CN 112860468 A CN112860468 A CN 112860468A
- Authority
- CN
- China
- Prior art keywords
- amplitude
- point
- audio file
- preset
- data embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Hardware Design (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本说明书实施例公开了利用声音传递信息的方法和系统。具有数据处理功能的音频播放设备将基于待传递信息得到二进制信息,根据所述二进制信息,按预设编码规则对待播放的音频文件进行处理,并播放处理后的音频文件。接收设备获得录音文件,按预设解码规则从所述录音文件中提取二进制信息,并基于所述二进制信息得到待传递信息。
Description
分案说明
本申请是2020年9月25日提交的题为“利用声音传递信息的方法和系统”的中国专利申请2020110202293的分案申请。
技术领域
本说明书涉及信息技术领域,特别涉及利用声音传递信息的方法和系统。
背景技术
音频播放设备在日常使用过程中可能会出现故障。用户自身往往难以判断故障原因或无法自行维修,需要向技术人员提供设备的相关信息,以便技术人员进行初步的故障分析,进而反馈故障原因、维修建议等,或者上门提供维保服务。
目前,亟需提供一种能够方便用户享受音频播放设备的维保服务的方案。
发明内容
本说明书实施例之一提供一种利用声音传递信息的方法。所述方法由具有数据处理功能的音频播放设备执行,其包括:获取待传递信息;基于所述待传递信息得到二进制信息;根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点,处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的方法。所述方法由具有数据处理功能的音频播放设备执行,其包括:获取待传递信息;基于所述待传递信息得到二进制信息;根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点,处理前所述数据嵌入点对应的极大值低于预设的幅度下限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的方法。所述方法由具有数据处理功能的音频播放设备执行,其包括:获取待传递信息;基于所述待传递信息得到二进制信息;根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的系统。所述系统在具有数据处理功能的音频播放设备上实现,其包括:待传递信息获取模块,用于获取待传递信息;二进制信息获取模块,用于基于所述待传递信息得到二进制信息;处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点,处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的系统。所述系统在具有数据处理功能的音频播放设备上实现,其包括:待传递信息获取模块,用于获取待传递信息;二进制信息获取模块,用于基于所述待传递信息得到二进制信息;处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点,处理前所述数据嵌入点对应的极大值低于预设的幅度下限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的系统。所述系统在具有数据处理功能的音频播放设备上实现,其包括:待传递信息获取模块,用于获取待传递信息;二进制信息获取模块,用于基于所述待传递信息得到二进制信息;处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,所述预设码元为0或1。
本说明书实施例之一提供一种利用声音传递信息的装置,包括处理器和存储设备,所述存储设备用于存储指令,当所述处理器执行指令时,实现如本说明书任一实施例所述的利用声音传递信息的方法。
本说明书实施例之一提供从声音中提取信息的方法。所述方法包括:获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点且处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否低于所述幅度上限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供从声音中提取信息的方法。所述方法包括:获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点且处理前所述数据嵌入点对应的极小值低于预设的幅度下限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否高于所述幅度下限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供从声音中提取信息的方法。所述方法包括:获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否在与所述第一幅度区间对应的第二幅度区间之内,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供一种从声音中提取信息的系统。所述系统包括:录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;待传递信息获取模块,用于基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点且处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否低于所述幅度上限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供一种从声音中提取信息的系统。所述系统包括:录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;待传递信息获取模块,用于基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点且处理前所述数据嵌入点对应的极小值低于预设的幅度下限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否高于所述幅度下限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供一种从声音中提取信息的系统。所述系统包括:录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;待传递信息获取模块,用于基于所述二进制信息得到待传递信息。其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否在与所述第一幅度区间对应的第二幅度区间之内,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
本说明书实施例之一提供一种从声音中提取信息的装置,包括处理器和存储设备,所述存储设备用于存储指令,当所述处理器执行指令时,实现如本说明书任一实施例所述的从声音中提取信息的方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的利用声音传递日志信息的应用场景示意图;
图2是根据本说明书一些实施例所示的利用声音传递信息的应用场景示意图;
图3是根据本说明书一些实施例所示的处理前的音频文件波形图;
图4是根据本说明书一些实施例所示的处理前后的音频文件波形对比示意图;
图5是根据本说明书一些实施例所示的录音文件的波形图;
图6是根据本说明书一些实施例所示的利用声音传递信息的系统的模块图;
图7是根据本说明书一些实施例所示的从声音中提取信息的系统的模块图;
图8是根据本说明书又一些实施例所示的利用声音传递信息的系统的模块图;
图9是根据本说明书又一些实施例所示的从声音中提取信息的系统的模块图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的利用声音传递日志信息的应用场景示意图。如图1所示,系统100可以包括音频播放设备110、音频录制设备120、用户端130、服务端140和网络150。
音频播放设备110除具备基本的声音播放功能外,还具备一定的数据处理功能,即对待播放的音频文件进行处理以传递信息的功能。在一些实施例中,音频播放设备110可以是智能音箱。
音频播放设备110可以获取能够用于故障分析的日志信息,将所述日志信息转换成二进制信息,根据所述二进制信息按预设编码规则对原始(处理前的)音频文件进行处理,并播放处理后的音频文件。用户可利用音频录制设备120录制播放的处理后的音频文件,并将得到的录音文件通过用户端130上传至服务端140。服务端140可按与所述编码规则匹配的解码规则,从接收到的录音文件中提取所述日志信息对应的二进制信息,并将提取出的二进制信息转换(还原)为所述日志信息。
如此,用户通过录音并上传录音文件,即可向服务端提供能够用于故障分析的日志信息,有助于技术人员根据日志信息进行初步的故障分析,进而反馈故障原因、维修建议等,或者根据初步结论做好准备(如准备好可能需要的维修工具、元器件等),再上门提供维保服务。
另外,所处理的音频文件可以是音频播放设备在日常使用中播放的音频文件,如歌曲文件。对音频文件的处理以尽量不影响音频文件的原始听感为原则,即在播放音频文件以传递信息的同时尽可能保证音频文件的听觉体验。
值得说明的是,日志信息可以包含完整的日志内容,也可以只包含部分日志内容。在一些实施例中,完整的日志内容可以被划分成至少N段(N为不小于2的整数),每段日志内容用于对一份音频文件的处理,通过轮流播放与所述N段日志内容一一对应的处理后的N份音频文件,可以从录制得到的N份录音文件中提取出所述N段日志内容,进而拼接所述N段日志内容即可得到完整的日志内容。
在一些实施例中,音频录制设备120可以集成于用户端130。例如,用户端130可以是集成有麦克风的手机、电脑等。在一些实施例中,音频录制设备120可以是用户端130的外接设备。在一些实施例中,音频录制设备120可以是支持数据导出的设备,如录音笔,用户端130可以获取从音频录制设备120导出的录音文件。
在一些实施例中,用户端130可以包括各类计算设备,如智能电话、平板电脑、膝上型计算机、台式计算机等等。
服务端140可以包括各类计算设备,如智能电话、平板电脑、膝上型计算机、台式计算机、服务器等等。其中,服务器可以是独立的服务器或者服务器组,该服务器组可以是集中式的或者分布式的。在一些实施例中,服务器可以是区域的或者远程的。在一些实施例中,服务器可在云平台上执行。例如,该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等中的一种或其任意组合。
网络150连接系统100的各组成部分,使得各部分(如用户端130和服务端140)之间可以进行通讯。在系统100中各部分之间的网络可以包括有线网络和/或无线网络。例如,网络150可以包括电缆网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)、城域网(MAN)、公共交换电话网络(PSTN)、蓝牙网络、紫蜂网络(ZigBee)、近场通信(NFC)、设备内总线、设备内线路、线缆连接等或其任意组合。每两个部分之间的网络连接可以是采用上述一种方式,也可以是采取多种方式。
图2是根据本说明书一些实施例所示的利用声音传递信息的应用场景示意图。系统200可以包括音频播放设备210和接收设备220。其中,接收设备220可以如图2所示集成有音频录制模块,也可以支持外接音频录制设备。接收设备220还具备一定的数据处理功能,即从录音文件中提取信息的功能。关于音频播放设备210的细节,可以参考图1中音频播放设备110的相关描述。
在一些实施例中,可以利用声音近距离地在音频播放设备210和接收设备220之间传递信息,如传递控制指令、Wi-Fi密码(无线网络密码)等。例如,可以借助智能音箱控制附近的其他电器(如电视、空调等),用户可以通过按下智能音箱上与应用于接收设备220的控制指令关联的按键对接收设备220进行控制,控制起来十分方便。又如,可以借助智能音箱将Wi-Fi密码自动发送至附近开启录音功能的用户终端(如手机、平板电脑、笔记本电脑等),如此用户无需通过手动输入密码、扫码等操作即可方便地获取Wi-Fi密码。参考前述内容,音频播放设备210可以将待传递信息(如传递控制指令、Wi-Fi密码等)转换成二进制信息,根据所述二进制信息按预设编码规则对原始(处理前)的音频文件进行处理,并播放处理后的音频文件。音频播放设备210附近的接收设备220可录制播放的处理后的音频文件,按与所述编码规则匹配的解码规则从接收到的录音文件中提取出所述待传递信息对应的二进制信息,并将提取出的二进制信息转换(还原)为所述待传递信息。
下面结合图3、图4以及图5示例用于将信息嵌入音频文件的编码规则以及用于从录音文件中提取信息的解码规则。
图3是根据本说明书一些实施例所示的处理前的音频文件波形图。图4是根据本说明书一些实施例所示的处理前后的音频文件波形对比示意图。图中,横轴表示时间,纵轴表示幅度,幅度的单位可以是dB。
如图3所示,可以在处理前的音频文件波形上选取数据嵌入点(黑色圆点),以传递二进制信息的每一位(bit,以下称为码元)。
可以理解,二进制信息的每一码元可对应处理前的音频文件波形上的一个数据嵌入点。另外,二进制信息中各码元的顺序可与处理前音频文件波形上各数据嵌入点的时间顺序一致。即,若按时间先后顺序将波形上第一个(最先)出现的数据嵌入点记为第1个数据嵌入点,后续出现的数据嵌入点依次被记为第2个数据嵌入点、第3个数据嵌入点、....、第N个数据嵌入点,其中,N为二进制信息的位数(码元数量),则第N个数据嵌入点对应二进制信息的第N个码元。以图3为例,二进制信息至少包括6位,数据嵌入点D1-D6与二进制信息的第1个码元到第6个码元一一对应。
此外,可以将二进制信息的码元和数据嵌入点的关系视为编码规则的一部分。
在一些实施例中,可以以音频文件波形上的极值点作为数据嵌入点,通过处理前后数据嵌入点的幅度(该点对应的极值)的不同特征,在数据嵌入点处“嵌入”不同的码元。
在一些实施例中,可以预先设置幅度区间,进而可选取处理前位于预设幅度区间之外的极值点作为数据嵌入点。例如,可以设置幅度上限(与“零”构成幅度区间),并选取幅度大于上限的极大值点作为数据嵌入点。又如,如图3所示,可以设置幅度上限b和幅度下限a以构成幅度区间(a,b),并选取幅度大于上限b的极大值点(如D1、D2、D4和D6)和幅度小于下限a的极小值点(如D3和D5)作为数据嵌入点。
仅作为示例,可以将幅度最大值减小预设值,得到幅度上限。类似地,可以将幅度最小值增大预设值,得到幅度下限。在一些实施例中,用于得到幅度上限/下限的预设值可在[3dB,6dB]内取值。应当理解,用于得到幅度上限的预设值和用于得到幅度下限的预设值可以相同,也可以不同。
在一些实施例中,如图3所示,可以选取处理前音频文件波形上晚于第一时刻(t=t1)的极值点作为数据嵌入点,第一时刻t1晚于音频文件波形的起始时刻(t=0)。应当理解,可以将第一时刻t1之后的最大/最小幅度减小/增大预设值,得到幅度上限/下限。
需要说明的是,由于声音信号从播放的音频文件到录制的录音文件幅度可能被整体缩放了一定比例(以下称为增益比,记为G1/G2),即在录制和播放同时开始且忽略噪声的情况下,录制的录音文件波形相对播放的音频文件波形在纵向上经历了一定比例的拉伸,音频文件波形上的幅值区间映射到录音文件波形上的幅度区间也经历了相同比例的拉伸。例如,音频文件波形上的幅值区间(0,b)对应录音文件波形上的幅值区间(0,b*G1/G2)。又如,音频文件波形上的幅值区间(a,b)对应录音文件波形上的幅值区间(a*G1/G2,b*G1/G2)。区分起见,本说明书中将音频文件波形上的幅值区间称为第一幅度区间,并将录音文件波形上与之对应的幅值区间称为第二幅度区间。
相应地,编码规则可以包括:调整音频文件波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至第一幅度区间内,其中,预设码元为0或1。
可以理解,波峰/波谷是否移动到某个幅度区间是通过极值来界定的,即波峰对应的极大值/波谷对应的极小值位于某个幅度区间时,可视为波峰/波谷位于该幅度区间。因此,对音频文件波形的调整,使得对应预设码元的数据嵌入点的幅度(极值)从第一幅度区间之外变化至第一幅度区间之内,而对应非预设码元的数据嵌入点的幅度始终在第一幅度区间之外。基于此,可以设置匹配的解码规则,具体可以参考图5及其相关描述。
不妨假设预设码元是0,参考图4,若日志信息对应的二进制信息为“101101”,则可以将数据嵌入点D2所在波峰下移至第一幅度区间(a,b)内以及将数据嵌入点D5所在波谷上移至第一幅度区间(a,b)内。
需要指出的是,一方面,对数据嵌入点的幅度(极值)的调整值过大可能导致无法从录音文件中准确提取出日志信息对应的二进制信息。当幅度上限/下限确定后,若以数值过大的极大值点或数值过小的极小值点为数据嵌入点,则对该数据嵌入点的幅度(极值)的调整值也会过大,从而对音频文件的听感造成较大影响。为此,可以选择处理前小于第一阈值的极大值点或大于第二阈值的极小值点作为数据嵌入点。其中,第一阈值介于幅度最大值和幅度上限之间,第二阈值介于幅度最小值和幅度上限之间。
另一方面,对数据嵌入点的幅度(极值)的调整值过小使得调整后的极值过于接近第一幅度区间的边界值,即调整后的极大值接近第一幅度区间的上限或调整后的极小值接近第一幅度区间的下限,进而可能导致在噪声的影响下无法从录音文件中准确提取出日志信息对应的二进制信息。
基于这两方面的考虑,在一些实施例中,可以根据调整前的极值(对应预设码元的数据嵌入点的幅度)和第一幅度区间的边界值的差值以及预设比例,来调整极值(对应预设码元的数据嵌入点的幅度)。例如,对于属于极大值点的数据嵌入点,对数据嵌入点的幅度的调整值为调整前的幅度与幅度上限之间差值的所述预设比例。又如,对于属于极小值点的数据嵌入点,对数据嵌入点的幅度的调整值为幅度下限与调整前的幅度之间差值的所述预设比例,其中的预设比例不小于0.5且不超过1。
在又一些实施例中,对于属于极大值点的数据嵌入点,可以将对应预设码元的数据嵌入点的幅度调整为第一幅度区间内的第三阈值。对于属于极小值点的数据嵌入点,将对应预设码元的数据嵌入点的幅度调整为第一幅度区间之内的第四阈值。其中,第三阈值大于第四阈值。此外,第三阈值/第四阈值可以通过测试确定。即,可以设置第三阈值/第四阈值的多个候选值并在不同候选值下测试准确提取出日志信息对应的二进制信息的概率(可称为解码成功率),以将解码成功率高的候选值确定为第三阈值/第四阈值。
图5是根据本说明书一些实施例所示的录音文件的波形图。录音文件波形具有与音频文件波形上的每个数据嵌入点对应的数据提取点。相应地,参考前述内容,二进制信息的每个码元可以对应一个数据提取点。参考图3和图5,数据嵌入点D1~D6和数据提取点E1~E6一一对应,二进制信息的第1个码元到第6个码元和数据提取点E1~E6一一对应。
可以理解,用户可以在(处理后的)音频文件播放前就开始录音,以确保将完整的(处理后的)录音文件录制下来。在一些实施例中,用户端130可以提示用户提前开始录音。
在一些实施例中,可以基于处理前的音频文件波形确定录音文件波形上的数据提取点。
根据前文的相关描述,处理前的音频文件波形上每个数据嵌入点对应的时刻晚于第一时刻t1。为了在录音文件中定位与音频文件的第一时刻t1对应的第二时刻t2,设备(如,服务端140、接收设备220)可以保存有音频文件的开启时刻(记为t0)到第一时刻的时间间隔(t1-t0),音频文件波形上从起始时刻到开启时刻间对应的幅度可近似为零,幅度近似为零的条件可以是幅度不超过设定阈值。基于开启时刻的特性,设备可定位录音文件波形上的开启时刻(记为t0')。由于t1-t0=t1-t0',设备可以将开启时刻t0'延长时间间隔(t1-t0),从而定位到与第一时刻t1对应的第二时刻t2。可以理解,音频文件的开启时刻可以晚于起始时刻,例如,歌曲可以具有一段安静的前奏。当然,结合参考图3-图5,音频文件的开启时刻可以也可以是起始时刻(t=0),那么满足t2=t0'+t1。
定位起始时刻/开启时刻有助于定位与每个数据嵌入点对应的数据提取点。设备可以保存有每个数据嵌入点所在波峰或波谷对应的时间段内任一时刻到音频文件波形上的起始时刻/开启时刻的时间间隔,并将录音文件上的起始时刻/开启时刻延长相同的时间间隔,从而定位到与每个数据嵌入点对应的数据提取点。
定位第二时刻t2有助于确定增益比G1/G2。设备可以记录音频文件波形上第一时刻t1对应的幅度,并计算第一时刻t1对应的幅度与录音文件波形上第二时刻t2对应的幅度之比,得到增益比G1/G2。
与前述编码规则相匹配,解码规则可以包括:对于每个数据提取点,判断该数据提取点的幅度是否在第二幅度区间内,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元。
此外,数据提取点的确定方式以及提取出的二进制信息的每一位和数据提取点的对应方式可以作为解码规则的一部分。
在一些实施例中,设备可以保存有第一幅度区间的临界值(上限或者上限和下限),进而可以先根据增益比G1/G2缩放第一幅度区间以确定第二幅度区间,再判断数据提取点的幅度是否在第二幅度区间内。结合参考图3和图5,第一幅度区间为(a,b),则第二幅度区间为(a*G1/G2,b*G1/G2)。不妨假设第一码元是0,参考图5,数据提取点E2和E5的幅度在第二幅度区间(a*G1/G2,b*G1/G2)内,则提取出二进制信息的第二个码元和第五个码元,这两个码元均为0,其余码元均为1,从而提取出二进制信息“101101”。
在一些实施例中,设备可以保存有第一幅度区间的临界值(上限或者上限和下限),进而可以先根据增益比G1/G2缩放数据提取点的幅度,再判断缩放后的幅度是否在第一幅度区间之内,等效于判断数据提取点的幅度是否在第二幅度区间内。图6是根据本说明书一些实施例所示的利用声音传递信息的系统的模块图。系统600可以在音频播放设备110上实现。如图6所示,系统600可以包括日志信息获取模块610、第一转换模块620和处理模块630。
日志信息获取模块610可以用于获取日志信息,所述日志信息能够用于故障分析。
第一转换模块620可以用于将所述日志信息转换成二进制信息。
处理模块630根据所述二进制信息,按预设编码规则对待播放的音频文件进行处理,并播放处理后的音频文件。
图7是根据本说明书一些实施例所示的从声音中提取信息的系统的模块图。系统700可以在服务端140上实现。如图7所示,系统700可以包括录音文件接收模块710、信息提取模块720和第二转换模块730。
录音文件接收模块710可以用于接收用户端130上传的录音文件,所述录音文件是(例如由音频录制设备120)通过录制播放的按预设编码规则处理过的音频文件得到的。
信息提取模块720可以用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配。
第二转换模块730可以用于将提取出的二进制信息转换成日志信息。
图8是根据本说明书又一些实施例所示的利用声音传递信息的系统的模块图。系统800可以在音频播放设备210上实现。如图8所示,系统800可以包括待传递信息获取模块810、二进制信息获取模块820和处理模块830。
待传递信息获取模块810可以用于获取待传递信息。在一些实施例中,所述待传递信息可以包括控制指令、Wi-Fi密码等。
二进制信息获取模块820可以用于基于所述待传递信息得到二进制信息。在一些实施例中,待传递信息本身可以是二进制信息。在一些实施例中,可以将所述待传递信息转换成二进制信息。
处理模块830可以用于根据所述待传递信息,按预设编码规则对待播放的音频文件进行处理,并播放处理后的音频文件。
图9是根据本说明书又一些实施例所示的从声音中提取信息的系统的模块图。系统900可以在接收设备220上实现。如图9所示,系统900可以包括录音文件获取模块910、信息提取模块920和待传递信息获取模块930。
录音文件获取模块910可以用于获取录音文件。所述录音文件可通过录制播放的按预设编码规则处理过的音频文件得到,接收设备220可以集成有音频录制模块和/或支持外接音频录制设备。
信息提取模块920可以用于按预设解码规则从所述录音文件中提取二进制信息所述解码规则与所述编码规则匹配。
待传递信息获取模块930可以用于基于提取出的二进制信息得到所述待传递信息。在一些实施例中,提取出的二进制信息本身可以是所述待传递信息。在一些实施例中,可以将提取出的二进制信息转换成转换(还原)成所述待传递信息。
关于图6-图9及其模块的更多细节,可以参考图1-图5及其相关描述。
应当理解,图2所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要注意的是,以上对于系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,在一些实施例中,日志信息获取模块610和第一转换模块620可以是一个系统中的不同模块,也可以是一个模块实现这两个模块的功能。又如,在一些实施例中,信息提取模块720和第二转换模块730可以是两个模块,也可以合并为一个模块。诸如此类的变形,均在本说明书的保护范围之内。
应当注意的是,本说明书中有关流程的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
本说明书实施例可能带来的有益效果包括但不限于:(1)实现了利用声音传递信息以及从声音中提取信息;(2)通过选取数据嵌入点、控制对极值的调整值等手段,可以尽量减小对音频文件听感的影响,即可以在保持音频文件的正常播放的情况下传递信息;(3)用户通过录音和上传录音文件,可向服务端提供能够用于故障分析的日志信息,有助于技术人员根据日志信息进行初步的故障分析,进而反馈故障原因、维修建议等,或者根据初步结论做好准备(如准备好可能需要的维修工具、元器件等),再上门提供维保服务;(4)用户可以借助智能音箱控制附近的其他电器(如电视、空调等),控制起来十分方便;(5)可以借助智能音箱将Wi-Fi密码自动发送至附近开启录音功能的用户终端(如手机、平板电脑、笔记本电脑等),如此用户无需通过手动输入密码、扫码等操作即可方便地获取Wi-Fi密码。需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书实施例的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书实施例进行各种修改、改进和修正。该类修改、改进和修正在本说明书实施例中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书实施例的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书实施例的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书实施例的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书实施例各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、VisualBasic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书实施例所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书实施例流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书实施例披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书实施例对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书实施例的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (27)
1.一种利用声音传递信息的方法,其特征在于,所述方法由具有数据处理功能的音频播放设备执行,其包括:
获取待传递信息;
基于所述待传递信息得到二进制信息;
根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点,处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,所述预设码元为0或1。
2.如权利要求1所述的方法,其中,处理前所述数据嵌入点对应的极大值还小于介于幅度最大值和所述幅度上限之间的第一阈值。
3.如权利要求1所述的方法,其中,处理前的音频文件的波形上每个数据嵌入点对应的时刻晚于第一时刻,所述第一时刻晚于所述音频文件的波形的起始时刻。
4.如权利要求1所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,包括:
根据对应预设码元的数据嵌入点的幅度和所述幅度上限的差值以及预设比例,调整对应预设码元的数据嵌入点的幅度;
其中,对数据嵌入点的幅度的调整值为调整前的幅度与所述幅度上限之间差值的所述预设比例,所述预设比例不超过1。
5.如权利要求1所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,包括:
将对应预设码元的数据嵌入点的幅度调整为第三阈值,所述第三阈值小于所述幅度上限。
6.一种利用声音传递信息的方法,其特征在于,所述方法由具有数据处理功能的音频播放设备执行,其包括:
获取待传递信息;
基于所述待传递信息得到二进制信息;
根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点,处理前所述数据嵌入点对应的极大值低于预设的幅度下限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,所述预设码元为0或1。
7.如权利要求6所述的方法,其中,处理前所述数据嵌入点对应的极小值还小于介于幅度最小值和所述幅度下限之间的第二阈值。
8.如权利要求6所述的方法,其中,处理前的音频文件的波形上每个数据嵌入点对应的时刻晚于第一时刻,所述第一时刻晚于所述音频文件的波形的起始时刻。
9.如权利要求6所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,包括:
根据对应预设码元的数据嵌入点的幅度和所述幅度下限的差值以及预设比例,调整对应预设码元的数据嵌入点的幅度;
其中,对数据嵌入点的幅度的调整值为所述幅度下限与调整前的幅度之间差值的所述预设比例,所述预设比例不超过1。
10.如权利要求6所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,包括:
将对应预设码元的数据嵌入点的幅度调整为第四阈值,所述第四阈值大于所述幅度下限。
11.一种利用声音传递信息的方法,其特征在于,所述方法由具有数据处理功能的音频播放设备执行,其包括:
获取待传递信息;
基于所述待传递信息得到二进制信息;
根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,所述预设码元为0或1。
12.如权利要求11所述的方法,其中,处理前所述数据嵌入点对应的极大值小于介于幅度最大值和所述幅度上限之间的第一阈值。
13.如权利要求11所述的方法,其中,处理前所述数据嵌入点对应的极小值大于介于幅度最小值和所述幅度下限之间的第二阈值。
14.如权利要求11所述的方法,其中,处理前的音频文件的波形上每个数据嵌入点对应的时刻晚于第一时刻,所述第一时刻晚于所述音频文件的波形的起始时刻。
15.如权利要求11所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,包括:
根据对应预设码元的数据嵌入点的幅度和第一幅度区间的边界值的差值以及预设比例,调整对应预设码元的数据嵌入点的幅度;
其中,对于属于极大值点的数据嵌入点,对数据嵌入点的幅度的调整值为调整前的幅度与所述幅度上限之间差值的所述预设比例;对于属于极小值点的数据嵌入点,对数据嵌入点的幅度的调整值为所述幅度下限与调整前的幅度之间差值的所述预设比例,所述预设比例不超过1。
16.如权利要求21所述的方法,其中,所述调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,包括:
对于属于极大值点的数据嵌入点,将对应预设码元的数据嵌入点的幅度调整为所述第一幅度区间内的第三阈值;对于属于极小值点的数据嵌入点,将对应预设码元的数据嵌入点的幅度调整为所述第一幅度区间之内的第四阈值;所述第三阈值大于所述第四阈值。
17.一种利用声音传递信息的装置,其中,包括处理器和存储设备,所述存储设备用于存储指令,当所述处理器执行指令时,实现如权利要求1~16中任一项所述的方法。
18.一种利用声音传递信息的系统,其特征在于,所述系统在具有数据处理功能的音频播放设备上实现,其包括:
待传递信息获取模块,用于获取待传递信息;
二进制信息获取模块,用于基于所述待传递信息得到二进制信息;
处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点,处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰移动至低于所述幅度上限,所述预设码元为0或1。
19.一种利用声音传递信息的系统,其特征在于,所述系统在具有数据处理功能的音频播放设备上实现,其包括:
待传递信息获取模块,用于获取待传递信息;
二进制信息获取模块,用于基于所述待传递信息得到二进制信息;
处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点,处理前所述数据嵌入点对应的极大值低于预设的幅度下限;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波谷移动至高于所述幅度下限,所述预设码元为0或1。
20.一种利用声音传递信息的系统,其特征在于,所述系统在具有数据处理功能的音频播放设备上实现,其包括:
待传递信息获取模块,用于获取待传递信息;
二进制信息获取模块,用于基于所述待传递信息得到二进制信息;
处理模块,用于根据所述二进制信息,按预设编码规则对音频文件进行处理,并播放处理后的音频文件;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述编码规则包括:所述二进制信息的每个码元对应一个数据嵌入点,调整音频文件的波形使得对应预设码元的数据嵌入点所在波峰或波谷移动至所述第一幅度区间内,所述预设码元为0或1。
21.一种从声音中提取信息的方法,其特征在于,包括:
获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点且处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否低于所述幅度上限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
22.一种从声音中提取信息的方法,其特征在于,包括:
获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点且处理前所述数据嵌入点对应的极小值低于预设的幅度下限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否高于所述幅度下限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
23.一种从声音中提取信息的方法,其特征在于,包括:
获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否在与所述第一幅度区间对应的第二幅度区间之内,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
24.一种从声音中提取信息的装置,其中,包括处理器和存储设备,所述存储设备用于存储指令,当所述处理器执行指令时,实现如权利要求21~23中任一项所述的方法。
25.一种从声音中提取信息的系统,其特征在于,包括:
录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
待传递信息获取模块,用于基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极大值点且处理前所述数据嵌入点对应的极大值高于预设的幅度上限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否低于所述幅度上限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
26.一种从声音中提取信息的系统,其特征在于,包括:
录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
待传递信息获取模块,用于基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极小值点且处理前所述数据嵌入点对应的极小值低于预设的幅度下限;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否高于所述幅度下限,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
27.一种从声音中提取信息的系统,其特征在于,包括:
录音文件接收模块,用于获得录音文件,所述录音文件是通过录制播放的按预设编码规则处理过的音频文件得到的;
信息提取模块,用于按预设解码规则从所述录音文件中提取二进制信息,所述解码规则与所述编码规则匹配;
待传递信息获取模块,用于基于所述二进制信息得到待传递信息;
其中,所述音频文件的波形具有数据嵌入点,所述数据嵌入点为极值点且处理前所述数据嵌入点位于预设幅度上限和预设幅度下限构成的第一幅度区间之外;所述录音文件的波形具有与所述音频文件的波形上的每个数据嵌入点对应的数据提取点;所述解码规则包括:基于处理前的音频文件的波形确定录音文件的波形上的数据提取点;二进制信息的每个码元对应一个数据提取点,对于每个数据提取点,判断该数据提取点的幅度是否在与所述第一幅度区间对应的第二幅度区间之内,若是,则确定该数据提取点对应的码元为预设码元,若否,则确定该码元为非预设码元,所述预设码元为0或1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110089317.7A CN112860468B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011020229.3A CN111930551B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
CN202110089317.7A CN112860468B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011020229.3A Division CN111930551B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112860468A true CN112860468A (zh) | 2021-05-28 |
CN112860468B CN112860468B (zh) | 2022-05-10 |
Family
ID=73334134
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011020229.3A Active CN111930551B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
CN202110089317.7A Active CN112860468B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011020229.3A Active CN111930551B (zh) | 2020-09-25 | 2020-09-25 | 利用声音传递信息的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN111930551B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6690831B1 (en) * | 1998-07-15 | 2004-02-10 | Sony Corporation | Encoding device and encoding method, decoding device and decoding method, information processing device and information processing method as well as a medium |
CN101964202A (zh) * | 2010-09-09 | 2011-02-02 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
CN104991936A (zh) * | 2015-07-03 | 2015-10-21 | 广州市动景计算机科技有限公司 | 一种目标信息获取、推送方法及装置 |
WO2015192451A1 (zh) * | 2014-06-18 | 2015-12-23 | 中兴通讯股份有限公司 | 音频播放方法及装置 |
CN108024120A (zh) * | 2016-11-04 | 2018-05-11 | 上海百蝠信息技术有限公司 | 音频生成、播放、接听方法及装置和音频传输系统 |
CN108735223A (zh) * | 2017-04-14 | 2018-11-02 | 北大方正集团有限公司 | 音频文件数字水印的嵌入及提取方法及系统 |
CN108964787A (zh) * | 2018-07-06 | 2018-12-07 | 南京航空航天大学 | 一种基于超声波的信息广播方法 |
CN110309662A (zh) * | 2019-06-10 | 2019-10-08 | 广东云立方互动科技有限公司 | 音频信号处理方法、电子设备、服务器及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1859584A (zh) * | 2005-11-14 | 2006-11-08 | 华为技术有限公司 | 一种媒体播放终端设备的视频播放质量测试方法 |
US8943218B2 (en) * | 2006-10-12 | 2015-01-27 | Concurrent Computer Corporation | Method and apparatus for a fault resilient collaborative media serving array |
JP5197336B2 (ja) * | 2008-12-08 | 2013-05-15 | 三菱電機株式会社 | 無線通信装置 |
CN107084754A (zh) * | 2017-04-27 | 2017-08-22 | 深圳万发创新进出口贸易有限公司 | 一种变压器故障检测装置 |
-
2020
- 2020-09-25 CN CN202011020229.3A patent/CN111930551B/zh active Active
- 2020-09-25 CN CN202110089317.7A patent/CN112860468B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6690831B1 (en) * | 1998-07-15 | 2004-02-10 | Sony Corporation | Encoding device and encoding method, decoding device and decoding method, information processing device and information processing method as well as a medium |
CN101964202A (zh) * | 2010-09-09 | 2011-02-02 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
WO2015192451A1 (zh) * | 2014-06-18 | 2015-12-23 | 中兴通讯股份有限公司 | 音频播放方法及装置 |
CN104991936A (zh) * | 2015-07-03 | 2015-10-21 | 广州市动景计算机科技有限公司 | 一种目标信息获取、推送方法及装置 |
CN108024120A (zh) * | 2016-11-04 | 2018-05-11 | 上海百蝠信息技术有限公司 | 音频生成、播放、接听方法及装置和音频传输系统 |
CN108735223A (zh) * | 2017-04-14 | 2018-11-02 | 北大方正集团有限公司 | 音频文件数字水印的嵌入及提取方法及系统 |
CN108964787A (zh) * | 2018-07-06 | 2018-12-07 | 南京航空航天大学 | 一种基于超声波的信息广播方法 |
CN110309662A (zh) * | 2019-06-10 | 2019-10-08 | 广东云立方互动科技有限公司 | 音频信号处理方法、电子设备、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112860468B (zh) | 2022-05-10 |
CN111930551A (zh) | 2020-11-13 |
CN111930551B (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9336773B2 (en) | System and method for standardized speech recognition infrastructure | |
US6775651B1 (en) | Method of transcribing text from computer voice mail | |
CN108986826A (zh) | 自动生成会议记录的方法、电子装置及可读存储介质 | |
CN102842306A (zh) | 语音控制方法及装置、语音响应方法及装置 | |
CN104681026A (zh) | 语音识别终端及系统、服务器及其控制方法、非易失性存储介质 | |
CN103578468A (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
CN108305618A (zh) | 语音获取及搜索方法、智能笔、搜索终端及存储介质 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN106981289A (zh) | 一种识别模型训练方法及系统以及智能终端 | |
JP2014176033A (ja) | 通信システム、通信方法およびプログラム | |
CN105498168A (zh) | 一种通过语音控制跑步机的方法和装置 | |
CN110364155A (zh) | 语音控制报错方法、电器及计算机可读存储介质 | |
CN112860468B (zh) | 利用声音传递信息的方法和系统 | |
CN109147791A (zh) | 一种速记系统和方法 | |
CN106528715A (zh) | 一种音频内容校核方法及装置 | |
CN103730117A (zh) | 一种自适应智能语音装置及方法 | |
CN116403591A (zh) | 语音增强方法、设备及计算机可读存储介质 | |
CN105225661B (zh) | 语音控制方法和系统 | |
CN109859763A (zh) | 一种智能语音信号模式识别系统 | |
CN106297775A (zh) | 语音识别装置及方法 | |
CN114095883B (zh) | 固话终端通信方法、装置、计算机设备和存储介质 | |
CN114666706B (zh) | 音效增强方法、装置及系统 | |
CN105280188A (zh) | 基于终端运行环境的音频信号编码方法和系统 | |
CN114179083B (zh) | 一种引领机器人语音信息的生成方法、装置和引领机器人 | |
CN114368654B (zh) | 数据处理方法、装置、设备,及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: No.8, Kangping street, Jiangning Economic and Technological Development Zone, Nanjing, Jiangsu, 211106 Patentee after: Hansang (Nanjing) Technology Co.,Ltd. Address before: No.8, Kangping street, Jiangning Economic and Technological Development Zone, Nanjing, Jiangsu, 211106 Patentee before: HANSONG (NANJING) TECHNOLOGY CO.,LTD. |