CN117544727A - 一种家用智能音箱内置话机系统及实现方法 - Google Patents

一种家用智能音箱内置话机系统及实现方法 Download PDF

Info

Publication number
CN117544727A
CN117544727A CN202311646662.1A CN202311646662A CN117544727A CN 117544727 A CN117544727 A CN 117544727A CN 202311646662 A CN202311646662 A CN 202311646662A CN 117544727 A CN117544727 A CN 117544727A
Authority
CN
China
Prior art keywords
voice
module
sound box
intelligent sound
fxo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311646662.1A
Other languages
English (en)
Inventor
杨刚
陶斯禄
林慧
郑才俊
杜晓扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze River Delta Research Institute of UESTC Huzhou
Original Assignee
Yangtze River Delta Research Institute of UESTC Huzhou
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze River Delta Research Institute of UESTC Huzhou filed Critical Yangtze River Delta Research Institute of UESTC Huzhou
Priority to CN202311646662.1A priority Critical patent/CN117544727A/zh
Publication of CN117544727A publication Critical patent/CN117544727A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0024Services and arrangements where telephone services are combined with data services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0024Services and arrangements where telephone services are combined with data services
    • H04M7/003Click to dial services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • H04M7/1205Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal where the types of switching equipement comprises PSTN/ISDN equipment and switching equipment of networks other than PSTN/ISDN, e.g. Internet Protocol networks
    • H04M7/126Interworking of session control protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • H04M7/1205Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal where the types of switching equipement comprises PSTN/ISDN equipment and switching equipment of networks other than PSTN/ISDN, e.g. Internet Protocol networks
    • H04M7/1285Details of finding and selecting a gateway for a particular call
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • H04M7/1205Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal where the types of switching equipement comprises PSTN/ISDN equipment and switching equipment of networks other than PSTN/ISDN, e.g. Internet Protocol networks
    • H04M7/1295Details of dual tone multiple frequency signalling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种家用智能音箱内置话机系统及实现方法,所述家用智能音箱内置话机系统将传统固定电话内置到智能音箱中,所述系统包括:安卓应用层、安卓HAL层、Linux层、硬件层,仍然通过RJ11电话线实现传统固话语音业务。本发明在传统智能音箱走进千家万户和传统固定话机逐步退出家庭环境的背景下,以及中小学生近视比例逐年攀升和父母经常需要远程和孩子沟通的背景下,可以在家庭没有传统固定电话机的情况下实现传统固定电话机的功能,支持人工智能语音呼叫,操作方便,实用性强,提升用户感知。

Description

一种家用智能音箱内置话机系统及实现方法
技术领域
本发明属于语音技术领域,尤其涉及一种家用智能音箱内置话机系统及实现方法。
背景技术
随着社会的发展,手机和电话手表逐步取代固定电话,尤其是居家环境中,固定电话越来越少。虽然手机和电话手表更加便捷,但是手机和电话手表损伤视力,手机和电话手表信号不稳定,充电中的手机和电话手表打电话辐射较大,有些老年人和儿童不会用手机和电话手表,手机还需要频繁充电,以及手机和电话手表价格较贵等等。特别是中小学生近视比例逐年攀升和父母经常需要远程和孩子沟通的背景下,手机或电话手表显然是一把双刃剑,便捷了沟通的同时也损伤了视力,信号还不稳定。
深圳市华翼翔电子有限公司提出一种具有接听电话功能的音箱鼠标,通过在鼠标本体上设置蓝牙音箱和手机蓝牙通信控制模块使得鼠标在具备音乐播放的功能的同时还具备接听电话的功能。该音箱鼠标还需要手机的配合,同时也没有主动打电话的功能。
随着科技的发展,智能音箱已经走进千家万户,深受喜爱。有些智能音箱可以配合光猫实现传统语音通话业务,和手机、固定电话实现通话。但是这种方式下,智能音箱和光猫之间需要通过无线通信手段连接来传输语音RTP(Real-time Transport Protocol)流,信号经常不稳定,而且用户选购智能音箱时还必修和光猫强绑定使用,软件升级时也需要相互配合。
发明内容
本发明的目的是提供一种家用智能音箱内置话机系统,以至少解决现有技术中智能音箱需配合光猫才能实现传统语音通话业务,和手机、固定电话实现通话的问题。
本发明提供的一种家用智能音箱内置话机系统,所述系统包括:第一层、第二层、Linux层、硬件层;
所述第一层有平台通信和调度模块,该模块用于将智能音箱的语音PCM(PulseCode Modulation,脉冲编码调制)流上传给语音云平台,供语音云平台识别,并将语音云平台的信息下发给智能音箱;所述平台通信和调度模块还用于调度语音驱动适配模块驱动Linux层相关模块完成相关功能;
所述第二层有语音驱动适配模块,该模块用于将Linux层音频输入输出模块的语音流传给第一层的平台通信和调度模块,并用于将来自平台通信和调度模块的被叫号码传给Linux层的FXO(Foreign Exchange Office,外部交换机)驱动模块;
所述Linux层有语音驱动子系统,所述语音驱动子系统包括:音频输入输出模块、唤醒词模块、数据流模块、FXO驱动模块、麦克风驱动模块、前端声学处理模块、语音播放模块、喇叭驱动模块、语音DSP模块、PCM驱动模块;
所述音频输入输出模块用于根据唤醒词模块的识别结果把语音流上传给安卓HAL层(Hardware Abstraction Layer,系统硬件抽象层)的语音驱动适配模块,或要求语音播放模块播放特定语音内容;
所述唤醒词模块用于实时本地识别唤醒词,并在识别出唤醒词时把识别结果传给音频输入输出模块;
所述数据流模块用于接收前端声学处理模块处理后的语音流,并传给唤醒词模块和音频输入输出模块;
所述FXO驱动模块用于接收所述第二层语音驱动适配模块的信息,用于调用语音播放模块进行语音播放,用于驱动FXO芯片模拟摘机、挂机事件,用于通知语音DSP模块开通道、关通道;
所述麦克风驱动模块配合数字麦克风硬件把数字化的语音信号传给前端声学处理进行处理;
所述前端声学处理模块用于语音检测、降低噪声和消除噪声、声学回声消除、去混响处理、声源定位以及波束形成;
所述语音播放模块用于选择相应的语音内容并驱动喇叭驱动模块进行播放;
所述喇叭驱动模块用于驱动喇叭完成语音播放;
所述语音DSP模块用于开通道、关通道、双向转发通话语音流、调用喇叭驱动模块放信号音;
所述PCM驱动模块用于为FXO驱动模块、FXO芯片和语音DSP模块之间的交互提供驱动;
进一步的,所述第一层为安卓应用层;所述第二层为安卓HAL层;所述硬件层包括:数字麦克风、喇叭、FXO芯片、免提键。
本发明的另一目的是提供所述家用智能音箱内置话机系统的实现方法,包括以下步骤:
步骤101,智能音箱默认处于音箱模式,识别到话机模式请求时,智能音箱由音箱模式切换为话机模式;
步骤102,语音云平台通过PCM码流和智能音箱的安卓应用层通信;
步骤103,智能音箱的安卓应用层通过安卓HAL层和linux层的语音驱动子系统通信;
步骤104,语音驱动子系统和语音FXO芯片通信;
步骤105,语音FXO芯片通过RJ11(Registered Jack type 11,标准电话接口11)所属语音家庭网关设备以及语音服务器和对方实现基本语音业务;
步骤106,基本语音业务结束时,智能音箱由话机模式切换为音箱模式。
进一步的,所述实现方法还包括:摘机产生和DTMF(Dual Tone Multi Frequency,双音多频)拨号方法,步骤如下:
步骤201,智能音箱准备,智能音箱充当主叫时,用户声音中的唤醒词通过数字麦克风转为数字语音信号,经过PDM(Pulse Duration Modulation,脉冲持续时间调制)总线传给麦克风驱动模块形成语音流,经过前端声学处理模块处理并传给数据流模块,将语音流传给唤醒词模块,经唤醒词模块识别出语音流中的唤醒词并把“是唤醒词”的结果传给音频输入输出模块,调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放声音以通知用户“智能音箱已经准备好接收语音指令”;
步骤202,摘机产生,用户语音输入语音呼叫请求和被叫号码通过数字麦克风转为数字语音信号,经PDM总线传给麦克风驱动模块形成语音流,经前端声学处理模块处理并传给数据流模块,将语音流传给唤醒词模块,语音流经过唤醒词模块识别不出唤醒词,语音流由数据流模块传给音频输入输出模块,语音流由音频输入输出模块经过语音驱动适配模块传给平台通信和调度模块,将语音流发给语音云平台,语音云平台解析出智能音箱的语音呼叫请求和被叫号码,将主叫语音呼叫请求和被叫号码发给智能音箱的平台通信和调度模块,平台通信和调度模块将被叫号码通过语音驱动适配模块传给FXO驱动模块,调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作,经过RJ11接口传给语音家庭网关设备,等待40ms以上,语音家庭网关设备检测到智能音箱的摘机动作并把摘机动作上报给语音服务器;
步骤203,DTMF拨号,FXO驱动模块通过SPI总线控制FXO芯片在模拟线路上产生DTMF号码经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱发来的被叫号码并把被叫号码上报给语音服务器;
智能音箱充当被叫时,先把来自语音家庭网关设备RJ11接口的振铃信号转为音乐由喇叭播放,用户按免提键后,FXO驱动模块调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的摘机动作并把摘机动作上报给语音服务器。
进一步的,所述实现方法还包括我方主动挂机;
智能音箱通话过程中,我方主动挂机按免提键,则FXO驱动模块调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作,并把挂机动作上报给语音服务器。
进一步的,所述实现方法还包括对方先挂机;
智能音箱通话过程中,对方先挂机时,语音服务器要求家庭网关设备通过RJ11接口放忙音给智能音箱,若忙音停止前,用户按免提键,则FXO驱动模块调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作,并把挂机动作上报给语音服务器;若忙音停止前,用户没按免提键,则忙音停止后FXO驱动模块仍然调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作并把挂机动作上报给语音服务器。
进一步的,所述实现方法还包括振铃产生;
智能音箱充当被叫时,语音服务器要求语音家庭网关设备将振铃信号通过RJ11接口传给智能音箱的FXO芯片,FXO芯片先检测出模拟振铃信号,再把振铃请求上报给FXO驱动模块,FXO驱动模块调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放一段充当铃声的音乐。
进一步的,所述实现方法还包括开通道和关通道;
当智能音箱摘机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块开通道;智能音箱挂机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块关通道。
进一步的,所述实现方法还包括信号音放音;
语音家庭网关设备的信号音先通过RJ11接口传给智能音箱的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,通过I2S总线(Inter—IC Sound总线,集成电路内置音频总线)驱动喇叭播放信号音。
进一步的,所述实现方法还包括语音通话时语音传输;
语音通话时语音传输由语音服务器→语音家庭网关设备→智能音箱方向,或智能音箱→语音家庭网关设备→语音服务器方向模式实现;
语音服务器→语音家庭网关设备→智能音箱方向,语音服务器将语音RTP流传给语音家庭网关设备,语音家庭网关设备将语音RTP流数模转换为模拟语音信号,语音家庭网关设备的模拟语音信号先通过RJ11接口传给智能音箱的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,喇叭驱动模块通过I2S总线驱动喇叭播放声音;
智能音箱→语音家庭网关设备→语音服务器方向,用户说话的声音被数字麦克风拾取并完成模数转换,先通过PDM总线传给麦克风驱动模块,麦克风驱动模块经过语音DSP模块传给PCM驱动模块,PCM驱动模块将语音流通过PCM总线传给FXO芯片,FXO芯片完成数模转换并通过RJ11接口传给语音家庭网关设备,语音家庭网关设备将模拟语音信号转换为语音RTP流并将语音RTP流上传给语音服务器。
本发明将传统智能音箱和传统固定电话机合二为一,使用时不需要使用光猫,可以在家庭没有传统固定电话机的情况下实现传统固定电话机的功能。
附图说明
图1是本发明实施例提供的一种家用智能音箱内置话机实现方法流程图;
图2是本发明实施例提供的一种家用智能音箱内置话机实现系统结构图;
图3是本发明实施例提供的智能音箱内置话机充当主叫时简要流程图;
图4是本发明实施例提供的智能音箱内置话机充当被叫时简要流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本实施例提供一种家用智能音箱内置话机系统,如图2所示,该系统包括:第一层、第二层、Linux层、硬件层;
第一层以安卓应用层,第二层以安卓HAL层为例。
安卓应用层有平台通信和调度模块,该模块用于将智能音箱设备的语音PCM流上传给语音云平台供语音云平台识别,并用于将语音云平台的信息下发给智能音箱设备,还用于调度语音驱动适配模块驱动Linux层相关模块完成相关功能。
安卓HAL层有语音驱动适配模块,该模块用于将Linux层音频输入输出模块的语音流传给安卓应用层的平台通信和调度模块,并用于将来自平台通信和调度模块的被叫号码传给Linux层的FXO驱动模块。
Linux层有语音驱动子系统,该子系统包括音频输入输出模块、唤醒词模块、数据流模块、FXO驱动模块、麦克风驱动模块、前端声学处理模块、语音播放模块、喇叭驱动模块、语音DSP模块、PCM驱动模块,其中:音频输入输出模块用于根据唤醒词模块的识别结果把语音流上传给安卓HAL层的语音驱动适配模块,或要求语音播放模块播放特定语音内容;
唤醒词模块用于实时本地识别唤醒词,并在识别出唤醒词时把识别结果传给音频输入输出模块;
数据流模块用于接收前端声学处理模块处理后的语音流,并传给唤醒词模块和音频输入输出模块;
FXO驱动模块用于接收安卓HAL层语音驱动适配模块的信息,用于调用语音播放模块进行语音播放,用于驱动FXO芯片模拟摘机、挂机事件,用于通知语音DSP模块开通道和关通道;
麦克风驱动模块用于配合数字麦克风硬件把数字化的语音信号传给前端声学处理进行处理;
前端声学处理模块用于语音检测、降低噪声和消除噪声(比如喇叭播放的声音和环境杂音一起被数字麦克风硬件拾取后形成的噪声需要降低或消除)、声学回声消除、去混响处理、声源定位以及波束形成;
语音播放模块用于选择相应的语音内容并驱动喇叭驱动模块进行播放;
喇叭驱动模块用于驱动喇叭完成语音播放;
语音DSP模块用于开通道、关通道、双向转发通话语音流、调用喇叭驱动模块放各种信号音;
PCM驱动模块用于为FXO驱动模块、FXO芯片和语音DSP模块之间的交互提供驱动;
硬件层包括数字麦克风、喇叭、FXO芯片、免提键,配合软件相关模块完成相关功能。
本发明实施例将传统智能音箱和传统固定电话机合二为一,在传统智能音箱走进千家万户和传统固定话机逐步退出家庭环境的背景下,以及中小学生近视比例逐年攀升和父母经常需要远程和孩子沟通的背景下,可以在家庭没有传统固定电话机的情况下实现传统固定电话机的功能,简化组网;
智能音箱内置话机就是把传统固定电话内置到了智能音箱中,仍然通过RJ11电话线实现传统固话语音业务,具有高实时性和可靠性。
实施例2
如图1所示,本发明实施例提供一种家用智能音箱内置话机实现方法,所述家用智能音箱内置话机实现方法包括以下步骤:
步骤101,智能音箱默认处于音箱模式,识别到话机模式请求时,智能音箱由音箱模式切换为话机模式;
步骤102,语音云平台通过PCM码流和智能音箱设备的安卓应用层通信;
步骤103,智能音箱设备的安卓应用层通过安卓HAL层和linux层的语音驱动子系统通信;
步骤104,语音驱动子系统和语音FXO芯片通信;
步骤105,语音FXO芯片通过RJ11所属语音家庭网关设备以及语音服务器和对方实现基本语音业务;
步骤106,基本语音业务结束时,智能音箱由话机模式切换为音箱模式。
本发明实施例通过采用安卓系统,使得系统能够根据不同的用户需求或外部条件动态调整参数,具有灵活性和可编程性,这种灵活性还允许系统通过软件更新来适应新的技术和标准,保护了投资并延长了产品的使用寿命。
智能音箱可以借助语音云平台等进行在线软件升级和远程操控,这使得系统的维护和升级变得更加方便。
可选的,摘机产生和DTMF拨号实现方法为:
步骤201,智能音箱准备,智能音箱设备充当主叫时,用户声音中的唤醒词如“小湖先生”先通过数字麦克风转为数字语音信号,数字语音信号经过PDM总线传给麦克风驱动模块形成语音流,语音流经过前端声学处理模块处理并传给数据流模块,数据流模块将语音流传给唤醒词模块,经过唤醒词模块识别出语音流中的唤醒词“小湖先生”并把“是唤醒词”的结果传给音频输入输出模块,音频输入输出模块调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放声音,如“您好!主人”,以通知用户“智能音箱设备已经准备好接收语音指令”;
步骤202,摘机产生,用户说如“请打电话给05572811000”,用户说话内容通过数字麦克风转为数字语音信号,数字语音信号经过PDM总线传给麦克风驱动模块形成语音流,语音流经过前端声学处理模块处理并传给数据流模块,数据流模块将语音流传给唤醒词模块,语音流经过唤醒词模块识别不出唤醒词,语音流由数据流模块传给音频输入输出模块,语音流由音频输入输出模块经过语音驱动适配模块传给平台通信和调度模块,平台通信和调度模块将语音流发给语音云平台,语音云平台解析出智能音箱设备的语音呼叫请求“打电话”和被叫号码05572811000,语音云平台将主叫语音呼叫请求“打电话”和被叫号码05572811000发给智能音箱设备的平台通信和调度模块,平台通信和调度模块将被叫号码05572811000通过语音驱动适配模块传给FXO驱动模块,FXO驱动模块调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作经过RJ11接口传给语音家庭网关设备,等待一段时间,如100ms确保语音家庭网关设备检测到智能音箱设备的摘机动作并把摘机动作上报给语音服务器;
步骤203,DTMF拨号,FXO驱动模块通过SPI总线控制FXO芯片在模拟线路上产生DTMF号码05572811000经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱设备发来的被叫号码05572811000,并把被叫号码05572811000上报给语音服务器。
智能音箱设备充当被叫时,先把来自语音家庭网关设备RJ11接口的振铃信号转为音乐如“感恩的心”由喇叭播放,用户按免提键,FXO驱动模块调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱设备的摘机动作并把摘机动作上报给语音服务器。
可选的,挂机产生之我方主动挂机实现方法为:智能音箱设备通话过程中,我方主动挂机时,用户按免提键,则FXO驱动模块调用挂机产生接口通过SPI总线控制FXO芯片在模拟线路上产生挂机动作经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱设备的挂机动作并把挂机动作上报给语音服务器。
可选的,挂机产生之对方先挂机实现方法为:智能音箱设备通话过程中,对方先挂机时,语音服务器会要求家庭网关设备通过RJ11接口放忙音给智能音箱设备,若忙音停止前,用户按免提键,则FXO驱动模块调用挂机产生接口通过SPI总线控制FXO芯片在模拟线路上产生挂机动作经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱设备的挂机动作并把挂机动作上报给语音服务器;若忙音停止前,用户没按免提键,则忙音停止后FXO驱动模块仍然调用挂机产生接口通过SPI总线控制FXO芯片在模拟线路上产生挂机动作经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱设备的挂机动作并把挂机动作上报给语音服务器。
可选的,振铃产生实现方法为:智能音箱设备充当被叫时,语音服务器要求语音家庭网关设备将振铃信号通过RJ11接口传给智能音箱设备的FXO芯片,FXO芯片先检测出模拟振铃信号,再把振铃请求上报给FXO驱动模块,FXO驱动模块调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放一段充当铃声的音乐如“感恩的心”。
可选的,开通道和关通道实现方法为:智能音箱设备摘机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块开通道;智能音箱设备挂机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块关通道。
可选的,信号音(拨号音、忙音等)放音实现方法为:语音家庭网关设备的信号音先通过RJ11接口传给智能音箱设备的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,喇叭驱动模块通过I2S总线驱动喇叭播放信号音。
可选的,语音通话时语音传输实现方法为:
语音服务器→语音家庭网关设备→智能音箱设备方向,语音服务器将语音RTP流传给语音家庭网关设备,语音家庭网关设备将语音RTP流数模转换为模拟语音信号,语音家庭网关设备的模拟语音信号先通过RJ11接口传给智能音箱设备的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,喇叭驱动模块通过I2S总线驱动喇叭播放声音;
智能音箱设备→语音家庭网关设备→语音服务器方向,用户说话的声音被数字麦克风拾取并完成模数转换,先通过PDM总线传给麦克风驱动模块,麦克风驱动模块经过语音DSP模块传给PCM驱动模块,PCM驱动模块将语音流通过PCM总线传给FXO芯片,FXO芯片完成数模转换并通过RJ11接口传给语音家庭网关设备,语音家庭网关设备将模拟语音信号转换为语音RTP流并将语音RTP流上传给语音服务器。
实施例3
本实施例在实施例2的基础上,具体应用示例,如图3所示,智能音箱内置话机充当主叫,智能音箱侧用户称为我方用户,智能音箱侧语音家庭网关设备称为我方家庭网关设备。
步骤1,我方用户在智能音箱附近说唤醒词“小湖先生”;
步骤2,智能音箱识别唤醒词后回答“您好!主人”;
步骤3,我方用户对智能音箱说“请打电话给05572811000”;
步骤4,智能音箱通过语音云平台识别语音内容后驱动内置话机模拟传统话机摘机并进行DTMF拨号;
步骤5,我方语音家庭网关设备开语音通道,识别DTMF号码并将号码上报给语音SIP服务器;
步骤6,对方语音家庭网关设备振铃;
步骤7,对方用户摘机,对方语音家庭网关设备开通道,通话建立;
步骤8,我方按“免提键”挂机,智能音箱设备和我方语音家庭网关设备关通道;
步骤9,对方挂机,对方语音家庭网关设备关通道,通话结束。
实施例4
本实施例在实施例2的基础上,另一具体应用示例,如图4所示,智能音箱内置话机充当被叫,智能音箱侧用户称为我方用户,智能音箱侧语音家庭网关设备称为我方家庭网关设备。
步骤1,对方语音用户摘机,并用传统电话DTMF拨号方式拨打我方号码0278888999;
步骤2,对方语音家庭网关设备开通道,识别DTMF号码并将号码上报给语音SIP服务器;
步骤3,语音SIP服务器要求我方语音家庭网关设备将振铃信号下发给智能音箱设备;
步骤4,智能音箱设备检测到振铃信号,播放音乐“感恩的心”;
步骤5,我方用户按“免提键”摘机,智能音箱设备和我方语音家庭网关设备开通道,通话建立;
步骤6,对方挂机,对方语音家庭网关设备关通道;
步骤7,我方按“免提键”挂机,智能音箱设备和我方语音家庭网关设备关通道,通话结束。
本发明提供的系统的设计考虑了传统固定话机在使用过程中遇到的多种情况,在保留传统固定话机优点的基础上,并充分利用智能音箱可以支持语音输入呼叫请求和号码、可以在线软件升级和维护的优点,提供了一种高实时性和可靠性,灵活性和可编程性,且长期可维护的解决方案。操作方便,实用性强,提升用户感知。解决了当前“手机和电话手表打电话经常信号不好”、“部分老年人和儿童不会使用手机和电话手表打电话”、“中小学生使用手机和电话手表损失视力”、“手机和电话手表充电时打电话对用户辐射较大”等现实问题。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解,技术人员阅读本申请说明书后依然可以对本发明的具体实施方式进行修改或者等同替换,但这些修改或变更均未脱离本发明申请待批权利要求保护范围之内。

Claims (10)

1.一种家用智能音箱内置话机系统,其特征在于,所述系统包括:第一层、第二层、Linux层、硬件层;
所述第一层有平台通信和调度模块,该模块用于将智能音箱的语音PCM流上传给语音云平台,供语音云平台识别,并将语音云平台的信息下发给智能音箱;所述平台通信和调度模块还用于调度语音驱动适配模块驱动Linux层相关模块完成相关功能;
所述第二层有语音驱动适配模块,该模块用于将Linux层音频输入输出模块的语音流传给第一层的平台通信和调度模块,并用于将来自平台通信和调度模块的被叫号码传给Linux层的FXO驱动模块;
所述Linux层有语音驱动子系统,所述语音驱动子系统包括:音频输入输出模块、唤醒词模块、数据流模块、FXO驱动模块、麦克风驱动模块、前端声学处理模块、语音播放模块、喇叭驱动模块、语音DSP模块、PCM驱动模块;
所述音频输入输出模块用于根据唤醒词模块的识别结果把语音流上传给安卓HAL层的语音驱动适配模块,或要求语音播放模块播放特定语音内容;
所述唤醒词模块用于实时本地识别唤醒词,并在识别出唤醒词时把识别结果传给音频输入输出模块;
所述数据流模块用于接收前端声学处理模块处理后的语音流,并传给唤醒词模块和音频输入输出模块;
所述FXO驱动模块用于接收所述第二层语音驱动适配模块的信息,用于调用语音播放模块进行语音播放,用于驱动FXO芯片模拟摘机、挂机事件,用于通知语音DSP模块开通道、关通道;
所述麦克风驱动模块配合数字麦克风硬件把数字化的语音信号传给前端声学处理进行处理;
所述前端声学处理模块用于语音检测、降低噪声和消除噪声、声学回声消除、去混响处理、声源定位以及波束形成;
所述语音播放模块用于选择相应的语音内容并驱动喇叭驱动模块进行播放;
所述喇叭驱动模块用于驱动喇叭完成语音播放;
所述语音DSP模块用于开通道、关通道、双向转发通话语音流、调用喇叭驱动模块放信号音;
所述PCM驱动模块用于为FXO驱动模块、FXO芯片和语音DSP模块之间的交互提供驱动。
2.根据权利要求1所述一种家用智能音箱内置话机系统,其特征在于,所述第一层为安卓应用层;所述第二层为安卓HAL层;所述硬件层包括:数字麦克风、喇叭、FXO芯片、免提键。
3.权利要求1-2任意一项所述家用智能音箱内置话机系统的实现方法,其特征在于,包括以下步骤:
步骤101,智能音箱默认处于音箱模式,识别到话机模式请求时,智能音箱由音箱模式切换为话机模式;
步骤102,语音云平台通过PCM码流和智能音箱的安卓应用层通信;
步骤103,智能音箱的安卓应用层通过安卓HAL层和linux层的语音驱动子系统通信;
步骤104,语音驱动子系统和语音FXO芯片通信;
步骤105,语音FXO芯片通过RJ11所属语音家庭网关设备以及语音服务器和对方实现基本语音业务;
步骤106,基本语音业务结束时,智能音箱由话机模式切换为音箱模式。
4.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括:摘机产生和DTMF拨号方法,步骤如下:
步骤201,智能音箱准备,智能音箱充当主叫时,用户声音中的唤醒词通过数字麦克风转为数字语音信号,经过PDM总线传给麦克风驱动模块形成语音流,经过前端声学处理模块处理并传给数据流模块,将语音流传给唤醒词模块,经唤醒词模块识别出语音流中的唤醒词并把“是唤醒词”的结果传给音频输入输出模块,调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放声音以通知用户“智能音箱已经准备好接收语音指令”;
步骤202,摘机产生,用户语音输入语音呼叫请求和被叫号码通过数字麦克风转为数字语音信号,经PDM总线传给麦克风驱动模块形成语音流,经前端声学处理模块处理并传给数据流模块,将语音流传给唤醒词模块,语音流经过唤醒词模块识别不出唤醒词,语音流由数据流模块传给音频输入输出模块,语音流由音频输入输出模块经过语音驱动适配模块传给平台通信和调度模块,将语音流发给语音云平台,语音云平台解析出智能音箱的语音呼叫请求和被叫号码,将主叫语音呼叫请求和被叫号码发给智能音箱的平台通信和调度模块,平台通信和调度模块将被叫号码通过语音驱动适配模块传给FXO驱动模块,调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作,经过RJ11接口传给语音家庭网关设备,等待40ms以上,语音家庭网关设备检测到智能音箱的摘机动作并把摘机动作上报给语音服务器;
步骤203,DTMF拨号,FXO驱动模块通过SPI总线控制FXO芯片在模拟线路上产生DTMF号码经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱发来的被叫号码并把被叫号码上报给语音服务器;
智能音箱充当被叫时,先把来自语音家庭网关设备RJ11接口的振铃信号转为音乐由喇叭播放,用户按免提键后,FXO驱动模块调用摘机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生摘机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的摘机动作并把摘机动作上报给语音服务器。
5.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括我方主动挂机;
智能音箱通话过程中,我方主动挂机按免提键,则FXO驱动模块调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作,并把挂机动作上报给语音服务器。
6.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括对方先挂机;
智能音箱通话过程中,对方先挂机时,语音服务器要求家庭网关设备通过RJ11接口放忙音给智能音箱,若忙音停止前,用户按免提键,则FXO驱动模块调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作,并把挂机动作上报给语音服务器;若忙音停止前,用户没按免提键,则忙音停止后FXO驱动模块仍然调用挂机产生接口,通过SPI总线控制FXO芯片在模拟线路上产生挂机动作,经过RJ11接口传给语音家庭网关设备,语音家庭网关设备检测到智能音箱的挂机动作并把挂机动作上报给语音服务器。
7.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括振铃产生;
智能音箱充当被叫时,语音服务器要求语音家庭网关设备将振铃信号通过RJ11接口传给智能音箱的FXO芯片,FXO芯片先检测出模拟振铃信号,再把振铃请求上报给FXO驱动模块,FXO驱动模块调用语音播放模块,语音播放模块调用喇叭驱动模块驱动喇叭播放一段充当铃声的音乐。
8.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括开通道和关通道;
当智能音箱摘机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块开通道;智能音箱挂机产生后,FXO驱动模块调用PCM驱动模块要求语音DSP模块关通道。
9.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括信号音放音;
语音家庭网关设备的信号音先通过RJ11接口传给智能音箱的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,通过I2S总线驱动喇叭播放信号音。
10.根据权利要求3所述家用智能音箱内置话机系统的实现方法,其特征在于,所述实现方法还包括语音通话时语音传输;
语音通话时语音传输由语音服务器→语音家庭网关设备→智能音箱方向,或智能音箱→语音家庭网关设备→语音服务器方向模式实现;
语音服务器→语音家庭网关设备→智能音箱方向,语音服务器将语音RTP流传给语音家庭网关设备,语音家庭网关设备将语音RTP流数模转换为模拟语音信号,语音家庭网关设备的模拟语音信号先通过RJ11接口传给智能音箱的FXO芯片,FXO芯片将语音信号模数转换后通过PCM总线把语音流传给PCM驱动模块,PCM驱动模块经过语音DSP模块调用喇叭驱动模块,喇叭驱动模块通过I2S总线驱动喇叭播放声音;
智能音箱→语音家庭网关设备→语音服务器方向,用户说话的声音被数字麦克风拾取并完成模数转换,先通过PDM总线传给麦克风驱动模块,麦克风驱动模块经过语音DSP模块传给PCM驱动模块,PCM驱动模块将语音流通过PCM总线传给FXO芯片,FXO芯片完成数模转换并通过RJ11接口传给语音家庭网关设备,语音家庭网关设备将模拟语音信号转换为语音RTP流并将语音RTP流上传给语音服务器。
CN202311646662.1A 2023-12-04 2023-12-04 一种家用智能音箱内置话机系统及实现方法 Pending CN117544727A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311646662.1A CN117544727A (zh) 2023-12-04 2023-12-04 一种家用智能音箱内置话机系统及实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311646662.1A CN117544727A (zh) 2023-12-04 2023-12-04 一种家用智能音箱内置话机系统及实现方法

Publications (1)

Publication Number Publication Date
CN117544727A true CN117544727A (zh) 2024-02-09

Family

ID=89793662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311646662.1A Pending CN117544727A (zh) 2023-12-04 2023-12-04 一种家用智能音箱内置话机系统及实现方法

Country Status (1)

Country Link
CN (1) CN117544727A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117834330A (zh) * 2024-03-04 2024-04-05 四川天邑康和通信股份有限公司 基于fttr或pon的外置语音设备接入pstn的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117834330A (zh) * 2024-03-04 2024-04-05 四川天邑康和通信股份有限公司 基于fttr或pon的外置语音设备接入pstn的方法及装置
CN117834330B (zh) * 2024-03-04 2024-05-14 四川天邑康和通信股份有限公司 基于fttr或pon的外置语音设备接入pstn的方法及装置

Similar Documents

Publication Publication Date Title
CN101277331B (zh) 声音再现设备和声音再现方法
US20110136547A1 (en) Wireless Headset with Voice Announcement
CN102136918B (zh) 一种远程接入广播的方法、装置及系统
CN103685711A (zh) 一种基于手机自动接通的通话控制和处理方法
CN117544727A (zh) 一种家用智能音箱内置话机系统及实现方法
WO2001078443A2 (en) Earset communication system
US6449359B1 (en) Telephone identification calling apparatus and procedures
CN111835923B (zh) 一种基于人工智能的移动式语音交互对话系统
CN111775165A (zh) 一种实现移动式智能客服机器人的系统、机器人终端以及后端处理模块
CN104767856A (zh) 一种桌面电话系统
CN101510904A (zh) 一种手机扩音器及其实现方法
CN101212529B (zh) 一种电话控制汽车音响的系统、装置及方法
CN101510906A (zh) 一种移动终端应答方法及应用该方法的移动终端
CN100411403C (zh) 网络电话终端及网络电话的呼叫、接听方法
CN1694471A (zh) 一种移动通讯终端机的来电提示方法
KR100413387B1 (ko) 음성변조 통화 시스템의 헤드셋 및 이를 이용한 통화방법
JP2001503936A (ja) 記録ユニットを有する無線受信機
CN203399179U (zh) 基于网络通话的专家应答系统
US5852774A (en) Sidetone level reduction circuit and method
JPH10271204A (ja) 留守応答装置及び留守番機能付き電話機
CN116684392A (zh) 电脑和手机的通讯方法、装置、电子设备及存储介质
CN1447572A (zh) 固定电话留言短信息及其接收装置
CN2814822Y (zh) 一种网络电话机
CN102833136A (zh) 数字家庭控制方法及无线终端
CN1984186A (zh) 电话回铃提示系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination