CN111176607A - 一种基于电力业务的语音交互系统及方法 - Google Patents

一种基于电力业务的语音交互系统及方法 Download PDF

Info

Publication number
CN111176607A
CN111176607A CN201911382422.9A CN201911382422A CN111176607A CN 111176607 A CN111176607 A CN 111176607A CN 201911382422 A CN201911382422 A CN 201911382422A CN 111176607 A CN111176607 A CN 111176607A
Authority
CN
China
Prior art keywords
voice
module
event
volume
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911382422.9A
Other languages
English (en)
Inventor
魏洪昌
郝武俊
孙志宇
陈宏达
刘继婷
何健
管莉
刘猛
苏彪
胡峥
闫先海
牛永光
周超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linyi Power Supply Co of State Grid Shandong Electric Power Co Ltd
Shandong Luneng Software Technology Co Ltd
Original Assignee
Linyi Power Supply Co of State Grid Shandong Electric Power Co Ltd
Shandong Luneng Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linyi Power Supply Co of State Grid Shandong Electric Power Co Ltd, Shandong Luneng Software Technology Co Ltd filed Critical Linyi Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority to CN201911382422.9A priority Critical patent/CN111176607A/zh
Publication of CN111176607A publication Critical patent/CN111176607A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • G10L13/0335Pitch control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种基于电力业务的语音交互系统级方法,包括:语音采集单元、语音播放单元、业务流程控制单元,所述的语音采集单元、语音播放单元以及业务流程控制单元之间,通过回调接口进行数据之间的相互调取;所述的语音采集单元包括:语音录入模块、音量分析模块以及状态展示模块;所述的语音播放单元包括:音频流解析播放模块和操作控制模块;所述的业务流程控制单元包括:业务事件建模模块、事件管理模块、回调管理模块。

Description

一种基于电力业务的语音交互系统及方法
技术领域
本发明属于电力设备技术领域,具体涉及一种基于电力业务的语音交互系统及方法。
背景技术
随着移动互联网的高速发展,智能手机移动应用在各行各业爆发式增长,各种类型的用户交互方式层出不穷。但考虑到受使用人群年龄、文化水平、使用习惯、使用环境等各方面因素的限制,交互的准确性及便捷性还有很大的提升空间。尤其是在电力行业,作业人员在相对恶劣的操作环境中如何更方便、快速、高效的使用业务应用,成为行业面临的一项重大课题。
近年来,随着云计算、人工智能、网络通信技术迅猛发展,基于云服务的语音语义智能识别在理论研究和技术实践层面均取得关键性突破。电力行业引入语音识别技术,在作业现场可方便的实现人机交互。考虑到该技术的专业性,移动应用的集成引入还存在较大的困难。
有鉴于此,本申请给出一种基于电力业务的语音交互系统及方法;以解决现有技术中缺陷。
发明内容
本发明的目的在于,针对上述现有技术存在的缺陷,提供设计一种基于电力业务的语音交互系统及方法,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种基于电力业务的语音交互系统,包括:
语音采集单元、语音播放单元、业务流程控制单元,所述的语音采集单元、语音播放单元以及业务流程控制单元之间,通过回调接口进行数据之间的相互调取;
所述的语音采集单元包括:语音录入模块、音量分析模块以及状态展示模块;
所述的语音录入模块,对语音信号进行录入,同时将采集到的音频流的实时音量传递到音量分析模块;
所述的音量分析模块,对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值,并将音频帧的音量差值传递至状态展示模块;
所述的状态展示模块,根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态。
所述的语音播放单元包括:音频流解析播放模块和操作控制模块;
所述的音频流解析播放模块,调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
操作控制模块,根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
所述的业务流程控制单元包括:业务事件建模模块、事件管理模块、回调管理模块,
所述的业务事件建模模块,对每个业务节点抽象成事件模型;并构建事件列表,存放所有事件模型;
所述的事件管理模块,对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
事件管理模块通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
作为优选,所述音量分析模块中,设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音;将语音的停顿和停止收音进行区分。
作为优选,所述的业务事件建模模块中,事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。
作为优选,所述的语音录入模块中,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。
本发明还提供一种基于电力业务的语音交互方法,包括以下步骤:
S1:语音信号的采集步骤,具体包括:
对语音信号进行录入,同时将采集到的音频流的实时音量传递到音量分析模块;
对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值;
根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态;
S2:语音播放的步骤,具体包括:
调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
S3:业务流程控制的步骤,具体包括:
对每个业务节点抽象成事件模型;并构建事件列表,存放所有事件模型;
对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
作为优选,所述步骤S1中,设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音;将语音的停顿和停止收音进行区分。
作为优选,所述步骤S1中,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。
作为优选,所述步骤S3中,事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。
本发明的有益效果在于,对语音数据进行采集后并完成播放以及相应的业务流程控制,方便各专业移动应用集成接入,提高应用质量,降低开发门槛,助力于语音识别技术的大范围推广实施。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
图1是本发明提供的一种基于电力业务的语音交互系统的原理框图。
图2是本发明提供的一种基于电力业务的语音交互系统中语音采集单元的流程图。
图3是本发明提供的一种基于电力业务的语音交互系统中语音播放单元的流程图。
图4是本发明提供的一种基于电力业务的语音交互系统中业务流程控制单元的流程图。
其中,1-语音采集单元,2-语音播放单元,3-业务流程控制单元,1.1-语音录入模块,1.2-音量分析模块,1.3-状态展示模块;2.1-音频流解析播放模块,2.2-操作控制模块;3.1-业务事件建模模块,3.2-事件管理模块,3.3-回调管理模块。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例1:
如图1-4所示,本实施例提供的一种基于电力业务的语音交互系统,包括:
语音采集单元1、语音播放单元2、业务流程控制单元3,所述的语音采集单元、语音播放单元以及业务流程控制单元之间,通过回调接口进行数据之间的相互调取;
所述的语音采集单元1包括:语音录入模块1.1、音量分析模块1.2以及状态展示模块1.3;
所述的语音录入模块,对语音信号进行录入,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。同时将采集到的音频流的实时音量传递到音量分析模块;
所述的音量分析模块,对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值,并将音频帧的音量差值传递至状态展示模块;设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音;将语音的停顿和停止收音进行区分。
所述的状态展示模块,根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态。
所述的语音播放单元2包括:音频流解析播放模块2.1和操作控制模块2.2;
所述的音频流解析播放模块,调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
操作控制模块,根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
所述的业务流程控制单元3包括:业务事件建模模块3.1、事件管理模块3.2、回调管理模块3.3,
所述的业务事件建模模块,对每个业务节点抽象成事件模型;事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。并构建事件列表,存放所有事件模型;
所述的事件管理模块,对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
事件管理模块通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
实施例2:
本实施例提供一种基于电力业务的语音交互方法,包括以下步骤:
S1:语音信号的采集步骤,具体包括:
对语音信号进行录入,同时将采集到的音频流的实时音量传递到音量分析模块;
对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值;
根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态;
S2:语音播放的步骤,具体包括:
调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
S3:业务流程控制的步骤,具体包括:
对每个业务节点抽象成事件模型;并构建事件列表,存放所有事件模型;
对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
所述步骤S1中,设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音;将语音的停顿和停止收音进行区分。
所述步骤S1中,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。
所述步骤S3中,事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (8)

1.一种基于电力业务的语音交互系统,其特征在于,包括:
语音采集单元、语音播放单元、业务流程控制单元,所述的语音采集单元、语音播放单元以及业务流程控制单元之间,通过回调接口进行数据之间的相互调取;
所述的语音采集单元包括:语音录入模块、音量分析模块以及状态展示模块;
所述的语音录入模块,对语音信号进行录入,同时将采集到的音频流的实时音量传递到音量分析模块;
所述的音量分析模块,对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值,并将音频帧的音量差值传递至状态展示模块;
所述的状态展示模块,根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态;
所述的语音播放单元包括:音频流解析播放模块和操作控制模块;
所述的音频流解析播放模块,调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
操作控制模块,根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
所述的业务流程控制单元包括:业务事件建模模块、事件管理模块、回调管理模块,
所述的业务事件建模模块,对每个业务节点抽象成事件模型;并构建事件列表,存放所有事件模型;
所述的事件管理模块,对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
事件管理模块通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
2.根据权利要求1所述的一种基于电力业务的语音交互系统,其特征在于,所述音量分析模块中,设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音。
3.根据权利要求2所述的一种基于电力业务的语音交互系统,其特征在于,所述的业务事件建模模块中,事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。
4.根据权利要求3所述的一种基于电力业务的语音交互系统,其特征在于,所述的语音录入模块中,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。
5.一种基于电力业务的语音交互方法,其特征在于,包括以下步骤:
S1:语音信号的采集步骤,具体包括:
对语音信号进行录入,同时将采集到的音频流的实时音量传递到音量分析模块;
对接收到的音频流进行音量对比处理,将当前音频帧的音量与上一音频帧的音量进行对比,实时更新音频帧的音量差值;
根据音频帧的音量差值,更新波形状态展示界面,以展示说话状态;
S2:语音播放的步骤,具体包括:
调取语音录入模块收集到的语音数据信息,对调取的语音数据信息进行语音合成处理,将合成后的音频进行缓存,通过安卓系统的Framework层将音频流进行PCM解码,解码后的PCM流传递给AudioTrack库进行混音播放;
根据播放状态对外提供音量调整,播放速率调整及暂停、继续、停止;
S3:业务流程控制的步骤,具体包括:
对每个业务节点抽象成事件模型;并构建事件列表,存放所有事件模型;
对事件模型进行统一管理、解析以及执行,结合语音识别及语音合成API,判断用户完成语音录入、语音转写及终端语音合成的状态;
通过事件驱动和回调管理模块控制要执行的下一个流程;当前流程执行完成后,删除事件列表中的对应事件。
6.根据权利要求5所述的一种基于电力业务的语音交互方法,其特征在于,所述步骤S1中,设定持续3秒音量小于固定阈值则为静音状态,语音录入模块停止收音;3秒内再次监测到声波变化则为停顿状态,语音录入模块继续收音。
7.根据权利要求6所述的一种基于电力业务的语音交互方法,其特征在于,所述步骤S1中,通过实时调用安卓系统底层录音API对语音信息进行录入,将录取到的音频流进行16kHZ、16bit的编码处理。
8.根据权利要求7所述的一种基于电力业务的语音交互方法,其特征在于,所述步骤S3中,事件模型包含执行动作前置条件、事件内容、完成回调三部分数据。
CN201911382422.9A 2019-12-27 2019-12-27 一种基于电力业务的语音交互系统及方法 Pending CN111176607A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911382422.9A CN111176607A (zh) 2019-12-27 2019-12-27 一种基于电力业务的语音交互系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911382422.9A CN111176607A (zh) 2019-12-27 2019-12-27 一种基于电力业务的语音交互系统及方法

Publications (1)

Publication Number Publication Date
CN111176607A true CN111176607A (zh) 2020-05-19

Family

ID=70654144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911382422.9A Pending CN111176607A (zh) 2019-12-27 2019-12-27 一种基于电力业务的语音交互系统及方法

Country Status (1)

Country Link
CN (1) CN111176607A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112885345A (zh) * 2021-01-13 2021-06-01 中航华东光电(上海)有限公司 一种特种服装语音交互系统及方法
CN113777978A (zh) * 2021-08-25 2021-12-10 四川长风致远科技有限公司 一种基于pir监测的智能语音播报显示系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203734789U (zh) * 2013-12-20 2014-07-23 北京长吉加油设备有限公司 一种语音播报对讲系统
CN106790598A (zh) * 2016-12-29 2017-05-31 上海木爷机器人技术有限公司 功能配置方法和系统
CN107146605A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音识别方法、装置及电子设备
CN107277237A (zh) * 2017-06-08 2017-10-20 努比亚技术有限公司 语音质量调节方法、移动终端及可读存储介质
WO2018006489A1 (zh) * 2016-07-06 2018-01-11 深圳Tcl数字技术有限公司 终端的语音交互方法及装置
CN109447048A (zh) * 2018-12-25 2019-03-08 苏州闪驰数控系统集成有限公司 一种人工智能预警系统
CN109616111A (zh) * 2018-12-24 2019-04-12 北京恒泰实达科技股份有限公司 一种基于语音识别的场景交互控制方法
CN110299135A (zh) * 2018-06-04 2019-10-01 宫文峰 智能语音信号模式自动识别系统装置
CN110311943A (zh) * 2019-04-16 2019-10-08 南京华盾电力信息安全测评有限公司 一种电力企业大数据平台中数据的查询与展示方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203734789U (zh) * 2013-12-20 2014-07-23 北京长吉加油设备有限公司 一种语音播报对讲系统
WO2018006489A1 (zh) * 2016-07-06 2018-01-11 深圳Tcl数字技术有限公司 终端的语音交互方法及装置
CN106790598A (zh) * 2016-12-29 2017-05-31 上海木爷机器人技术有限公司 功能配置方法和系统
CN107146605A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音识别方法、装置及电子设备
CN107277237A (zh) * 2017-06-08 2017-10-20 努比亚技术有限公司 语音质量调节方法、移动终端及可读存储介质
CN110299135A (zh) * 2018-06-04 2019-10-01 宫文峰 智能语音信号模式自动识别系统装置
CN109616111A (zh) * 2018-12-24 2019-04-12 北京恒泰实达科技股份有限公司 一种基于语音识别的场景交互控制方法
CN109447048A (zh) * 2018-12-25 2019-03-08 苏州闪驰数控系统集成有限公司 一种人工智能预警系统
CN110311943A (zh) * 2019-04-16 2019-10-08 南京华盾电力信息安全测评有限公司 一种电力企业大数据平台中数据的查询与展示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112885345A (zh) * 2021-01-13 2021-06-01 中航华东光电(上海)有限公司 一种特种服装语音交互系统及方法
CN113777978A (zh) * 2021-08-25 2021-12-10 四川长风致远科技有限公司 一种基于pir监测的智能语音播报显示系统

Similar Documents

Publication Publication Date Title
CN107277272A (zh) 一种基于软件app的蓝牙设备语音交互方法及系统
CN103905834B (zh) 音频数据编码格式转换的方法及装置
CN111176607A (zh) 一种基于电力业务的语音交互系统及方法
CN111078930A (zh) 音频文件数据处理方法及装置
CN102427465B (zh) 语音服务代理方法及装置、通过代理集成语音应用的系统
EP2936489A1 (en) Audio processing apparatus and audio processing method
CN110351445B (zh) 一种基于智能语音识别的高并发voip录音服务系统
CN106528040A (zh) 改进安卓设备音质的方法及装置
CN103366784A (zh) 具有语音控制和哼唱检索功能的多媒体播放方法及装置
CN114244821B (zh) 数据处理方法、装置、设备、电子设备和存储介质
JP7375089B2 (ja) 音声応答速度確定方法、装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
CN101339789B (zh) 一种多媒体引擎的实现方法
CN111223489B (zh) 一种基于Attention注意力机制的特定关键词识别方法及系统
CN109545211A (zh) 语音交互方法及系统
CN113192510A (zh) 实现语音年龄和/或性别识别服务的方法、系统及介质
Liu et al. Design and implementation of human-computer interaction intelligent system based on speech control
CN101753579B (zh) 一种用于移动通讯设备的多媒体播放方法
CN114879930B (zh) 一种安卓兼容环境的音频输出优化方法
CN103051946A (zh) 基于Android系统的通用RTSP流播放器
WO2022127498A1 (zh) 可穿戴设备及其音频处理方法
CN101990094A (zh) 一种码流分析方法和装置
CN112347125B (zh) 一种设备数据处理的方法及物联网数据处理方法
CN112783569A (zh) 一种基于云计算的云电脑系统
CN110502207A (zh) 背景声的静音方法、系统、设备及存储介质
CN111899764B (zh) 音频监控方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519