CN107071125A - 利用云端实现智能摄像机自动拨号的方法 - Google Patents

利用云端实现智能摄像机自动拨号的方法 Download PDF

Info

Publication number
CN107071125A
CN107071125A CN201710332775.2A CN201710332775A CN107071125A CN 107071125 A CN107071125 A CN 107071125A CN 201710332775 A CN201710332775 A CN 201710332775A CN 107071125 A CN107071125 A CN 107071125A
Authority
CN
China
Prior art keywords
clouds
call
user
audio
realized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710332775.2A
Other languages
English (en)
Other versions
CN107071125B (zh
Inventor
徐婷
彭远疆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Wulang Intelligent Technology Co., Ltd
Original Assignee
Shenzhen Sound Acoustics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sound Acoustics Technology Co Ltd filed Critical Shenzhen Sound Acoustics Technology Co Ltd
Priority to CN201710332775.2A priority Critical patent/CN107071125B/zh
Publication of CN107071125A publication Critical patent/CN107071125A/zh
Application granted granted Critical
Publication of CN107071125B publication Critical patent/CN107071125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了利用云端实现智能摄像机自动拨号的方法,包括步骤:S1,所述摄像机采集音频与视频信号;S2,音频信号经过声学算法处理,视频信号经过图像算法处理,然后RTP打包处理并发送至云端;S3,云端实时检测收到的RTP音频与视频信息,经过解码识别;S4,结果为用户呼叫指令,则支持呼叫,跳至S7;S5,若云端结果为关键字或预设频率的音频,跳至S8;S6,若识别结果符合用户的预设条件,则自动拨打用户预设的电话号码,跳至S8;S7,摄像机提示用户进行指令确定;若执行则跳至S8,若否则跳至S3;S8,建立通信关系;S9,接受请求,则通话;不接受请求,重播或者顺序呼叫其他预设号码,执行S8;S10,云端通话释放,执行S3。

Description

利用云端实现智能摄像机自动拨号的方法
技术领域
本发明涉及智能家电领域,尤其涉及利用云端实现智能摄像机自动拨号的方法。
背景技术
随着家庭监控类产品概念被引爆,一波家庭智能摄像机的浪潮也在中国迅速掀起。360、小米、联想、大华、海康纷纷推出自己的家庭智能摄像机产品,一时国内家庭智能摄像机市场呈现百花齐放之景,各种品牌家庭智能摄像机层出不穷。
所谓的智能摄像机相比传统摄像机,智能摄像机基于云计算技术的发展,让摄像机结合人工智能,给家庭智能摄像机的应用提供了一个更广阔的平台。
现有智能摄像机大多是手机应用对摄像头进行远程控制,接入云端,提供监控功能、双向通话、云录等功能。现有技术如需实现智能摄像机与APP通话,则智能摄像机及配套APP必须联网。而且通话质量很大程度受网络状况影响,并且只对特定的用户才能实现双向通话,如一些报警号码、急救号码、公共服务号码则无法与其进行通话。
发明内容
为了解决上述技术问题,本发明提出利用云端实现智能摄像机自动拨号的方法,解决了用户在紧急情况或对方未联网的情况下,可通过此方案进行求助、报警、通话,通过云端智能识别即可主动拨打任意或预设号码。
为了实现上述目的,本发明采用的方案是:
利用云端实现智能摄像机自动拨号的方法,包括步骤:
S1,所述摄像机采集音频与视频信号;
S2,所述摄像机将步骤S1中采集到的音频信号经过降噪算法、回声消除算法以及增益控制算法的处理,采集到的视频信号经过滤镜算法、美颜算法以及白平衡算法的处理,然后将处理后的音频信号与视频信号进行RTP打包处理并发送至云端;
S3,所述云端实时检测收到的RTP音频与视频信息,进行解码后打包发送至第三方人工智能开放平台进行识别;并接收所述第三方人工智能开放平台反馈的识别结果;
S4,如果所述云端接收到的音频识别结果为用户呼叫指令,则所述云端支持呼叫,跳至步骤S7;
S5,如果所述云端接收到的音频识别结果为关键字或预设频率的音频,则所述云端直接拨打用户预设的电话号码,跳至步骤S8;
S6,所述云端接收到视频识别结果后,如果识别结果符合用户的预设条件,则所述云端自动拨打用户预设的电话号码,跳至步骤S8;
S7,所述摄像机接收到所述云端在步骤S4中的呼叫指令后提示用户进行指令确定,并将所述用户给出的指令确定的结果发送给所述云端;若所述云端收到的是确认执行指令,则执行步骤S8,若所述云端收到的是确认执行指令,则跳至步骤S3;
S8,所述云端建立用户与被呼叫方的通信关系;
S9,在步骤S8中,若被呼叫方接受通话请求,则进行通话;若被呼叫方没有接受通话请求,所述云端支持用户重播或者顺序呼叫其他预设号码,执行步骤S8;
S10,在所述步骤S9中,通话结束后,所述云端通话释放,执行步骤S3。
步骤S3中所述的第三方人工智能开放平台为讯飞开放平台。
步骤S5中所述的关键字包括:救命以及报警。
步骤S5中所述的预设频率为婴儿哭声频率:频率范围1500—3000赫兹,声音大小75-85分贝。
步骤S6中视频识别结果的预设条件包括:火灾、摔倒、人形以及打斗。
所述火灾的验证方法包括:通过对视频进行火灾色彩验证、图像面积阀值以及相似度计算;所述摔倒的验证方法包括:通过高斯混合模型算法对背景进行更新,并用背景减除法来分割运动目标。
所述人形的验证方法包括:目标检测、边界提取、人形目标匹配和人形目标识别;所述打斗的验证方法包括:利用光流法获得两帧图像的相对运动,根据光流的相对运动,获取能量变化的历史图,通过能量变化的大小来检测打斗。
在步骤S8中,所述云端通过接入第三方SIP落地网关、第三方通讯云服务商接入国内外运营商,或者直接接入国内外运营商不经过第三方;所述国内外运营商呼叫被呼叫方。
本发明的有益效果为:
1、通过语音识别拨打手机或固定电话。可以是用户语音指令让智能摄像机拨打任意固定电话及手机。也可以是智能摄像机检测到其他声音(如婴儿哭声)后拨打预设的手机及固定电话。
2、通过图像智能识别拨打手机或固定电话。实时检测智能摄像机上传的图像,分析图像判断是否需要拨打预设的手机及固定电话。如用户设置人形检测(看家应用)、摔倒检测(家中老人摔倒)、打斗检测、火灾检测等拨打手机。
3、基于智能摄像机的多方语音通话。
4、可预设多个手机或固定电话,当第一个手机或固定电话打不通时,则呼叫第二个手机或固定电话,以此类推。
附图说明
图1本发明的流程图。
具体实施方式
为了更好的了解本发明的技术方案,下面结合附图对本发明作进一步说明。
如图1所示,利用云端实现智能摄像机自动拨号的方法,包括步骤:
S1,所述摄像机采集音频与视频信号。
S2,所述摄像机将步骤S1中采集到的音频信号经过声学算法处理,采集到的视频信号经过图像算法处理,然后将处理后的音频信号与视频信号进行RTP打包处理并发送至云端。
S3,所述云端实时检测收到的RTP音频与视频信息,进行解码后打包发送至第三方人工智能开放平台进行识别;并接收所述第三方人工智能开放平台反馈的识别结果;所述的第三方人工智能开放平台为科大讯飞。
S4,如果所述云端接收到的音频识别结果为用户呼叫指令,则所述云端支持呼叫,跳至步骤S7。
S5,如果所述云端接收到的音频识别结果为关键字或预设频率的音频,则所述云端直接拨打用户预设的电话号码,跳至步骤S8;所述的关键字包括:救命以及报警。所述的预设频率为婴儿哭声频率:频率范围1500—3000赫兹,声音大小75-85分贝左右。
S6,所述云端接收到视频识别结果后,如果识别结果符合用户的预设条件,则所述云端自动拨打用户预设的电话号码,跳至步骤S8。
视频识别结果的预设条件包括:火灾、摔倒、人形以及打斗。
所述火灾的验证方法包括:通过对视频进行火灾色彩验证、图像面积阀值以及相似度计算;所述摔倒的验证方法包括:通过高斯混合模型算法对背景进行更新,并用背景减除法来分割运动目标。
所述人形的验证方法包括:目标检测、边界提取、人形目标匹配和人形目标识别;所述打斗的验证方法包括:利用光流法获得两帧图像的相对运动,根据光流的相对运动,获取能量变化的历史图,通过能量变化的大小来检测打斗。
S7,所述摄像机接收到所述云端在步骤S4中的呼叫指令后提示用户进行指令确定,并将所述用户给出的指令确定的结果发送给所述云端;若所述云端收到的是确认执行指令,则执行步骤S8,若所述云端收到的是确认执行指令,则跳至步骤S3。
S8,所述云端建立用户与被呼叫方的通信关系;所述云端通过接入第三方SIP落地网关、第三方通讯云服务商接入国内外运营商,或者直接接入国内外运营商不经过第三方;所述国内外运营商呼叫被呼叫方。
S9,在步骤S8中,若被呼叫方接受通话请求,则进行通话;若被呼叫方没有接受通话请求,所述云端支持用户重播或者顺序呼叫其他预设号码,执行步骤S8。
S10,在所述步骤S9中,通话结束后,所述云端通话释放,执行步骤S3。
本申请所涉及的技术专业名词有:
SIP:Session Initiation Protocol,会话初始协议。
RTP:Real-time Transport Protocol,实时传输协议RTP。
PSTN:Public Switched Telephone Network,公用电话交换网。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.利用云端实现智能摄像机自动拨号的方法,其特征在于,包括步骤:
S1,所述摄像机采集音频与视频信号;
S2,所述摄像机将步骤S1中采集到的音频信号经过降噪算法、回声消除算法以及增益控制算法的处理,采集到的视频信号经过滤镜算法、美颜算法以及白平衡算法的处理,然后将处理后的音频信号与视频信号进行RTP打包处理并发送至云端;
S3,所述云端实时检测收到的RTP音频与视频信息,进行解码后打包发送至第三方人工智能开放平台进行识别;并接收所述第三方人工智能开放平台反馈的识别结果;
S4,如果所述云端接收到的音频识别结果为用户呼叫指令,则所述云端支持呼叫,跳至步骤S7;
S5,如果所述云端接收到的音频识别结果为关键字或预设频率的音频,则所述云端直接拨打用户预设的电话号码,跳至步骤S8;
S6,所述云端接收到视频识别结果后,如果识别结果符合用户的预设条件,则所述云端自动拨打用户预设的电话号码,跳至步骤S8;
S7,所述摄像机接收到所述云端在步骤S4中的呼叫指令后提示用户进行指令确定,并将所述用户给出的指令确定的结果发送给所述云端;若所述云端收到的是确认执行指令,则执行步骤S8,若所述云端收到的是确认执行指令,则跳至步骤S3;
S8,所述云端建立用户与被呼叫方的通信关系;
S9,在步骤S8中,若被呼叫方接受通话请求,则进行通话;若被呼叫方没有接受通话请求,所述云端支持用户重播或者顺序呼叫其他预设号码,执行步骤S8;
S10,在所述步骤S9中,通话结束后,所述云端通话释放,执行步骤S3。
2.根据权利要求1所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,步骤S3中所述的第三方人工智能开放平台为讯飞开放平台。
3.根据权利要求1所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,步骤S5中所述的关键字包括:救命以及报警。
4.根据权利要求1所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,步骤S5中所述的预设频率为婴儿哭声频率:频率范围1500—3000赫兹,声音大小75-85分贝。
5.根据权利要求1所述的根据权利要求1所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,步骤S6中视频识别结果的预设条件包括:火灾、摔倒、人形以及打斗。
6.根据权利要求5所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,所述火灾的验证方法包括:通过对视频进行火灾色彩验证、图像面积阀值以及相似度计算;所述摔倒的验证方法包括:通过高斯混合模型算法对背景进行更新,并用背景减除法来分割运动目标。
7.根据权利要求5或6所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,所述人形的验证方法包括:目标检测、边界提取、人形目标匹配和人形目标识别;所述打斗的验证方法包括:利用光流法获得两帧图像的相对运动,根据光流的相对运动,获取能量变化的历史图,通过能量变化的大小来检测打斗。
8.根据权利要求1所述的利用云端实现智能摄像机自动拨号的方法,其特征在于,在步骤S8中,所述云端通过接入第三方SIP落地网关、第三方通讯云服务商接入国内外运营商,或者直接接入国内外运营商不经过第三方;所述国内外运营商呼叫被呼叫方。
CN201710332775.2A 2017-05-12 2017-05-12 利用云端实现智能摄像机自动拨号的方法 Active CN107071125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710332775.2A CN107071125B (zh) 2017-05-12 2017-05-12 利用云端实现智能摄像机自动拨号的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710332775.2A CN107071125B (zh) 2017-05-12 2017-05-12 利用云端实现智能摄像机自动拨号的方法

Publications (2)

Publication Number Publication Date
CN107071125A true CN107071125A (zh) 2017-08-18
CN107071125B CN107071125B (zh) 2020-04-14

Family

ID=59596595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710332775.2A Active CN107071125B (zh) 2017-05-12 2017-05-12 利用云端实现智能摄像机自动拨号的方法

Country Status (1)

Country Link
CN (1) CN107071125B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336919A (zh) * 2019-07-04 2019-10-15 杭州视洞科技有限公司 一种智能监控设备的语音通话系统及其通话方案
CN111787160A (zh) * 2020-07-07 2020-10-16 上海茂声智能科技有限公司 一种用于语音网关安全检测的方法、装置以及系统
CN111865878A (zh) * 2019-04-29 2020-10-30 北京感瞰科技有限公司 一种通话方法、监控装置、云端平台及监控系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1269575A (zh) * 2000-03-10 2000-10-11 厦门华侨电子企业有限公司 远程图像/语音自动传输监控系统
US20120051714A1 (en) * 2009-05-06 2012-03-01 Ts Australia Pty Ltd surveillance and recording device
CN103021146A (zh) * 2012-12-31 2013-04-03 浙江天地人科技有限公司 报警终端
CN105472312A (zh) * 2014-08-19 2016-04-06 北京奇虎科技有限公司 智能摄像系统的报警方法、智能摄像系统和网络摄像头

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1269575A (zh) * 2000-03-10 2000-10-11 厦门华侨电子企业有限公司 远程图像/语音自动传输监控系统
US20120051714A1 (en) * 2009-05-06 2012-03-01 Ts Australia Pty Ltd surveillance and recording device
CN103021146A (zh) * 2012-12-31 2013-04-03 浙江天地人科技有限公司 报警终端
CN105472312A (zh) * 2014-08-19 2016-04-06 北京奇虎科技有限公司 智能摄像系统的报警方法、智能摄像系统和网络摄像头

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111865878A (zh) * 2019-04-29 2020-10-30 北京感瞰科技有限公司 一种通话方法、监控装置、云端平台及监控系统
CN111865878B (zh) * 2019-04-29 2023-02-03 北京感瞰科技有限公司 一种通话方法、监控装置、云端平台及监控系统
CN110336919A (zh) * 2019-07-04 2019-10-15 杭州视洞科技有限公司 一种智能监控设备的语音通话系统及其通话方案
CN111787160A (zh) * 2020-07-07 2020-10-16 上海茂声智能科技有限公司 一种用于语音网关安全检测的方法、装置以及系统

Also Published As

Publication number Publication date
CN107071125B (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
US11570292B1 (en) Providing hands-free service to multiple devices
US20210375298A1 (en) Voice processing method, apparatus, electronic device, and storage medium
CN107071125A (zh) 利用云端实现智能摄像机自动拨号的方法
TWI446780B (zh) 通訊裝置及其通訊方法
US20010047333A1 (en) Method for billing a VoIP call in a communication system
US9319783B1 (en) Attenuation of output audio based on residual echo
EP2815566B1 (en) Audio signal processing in a communication system
CN105872833A (zh) 视频通信方法及装置、智能电视
WO2010022604A1 (zh) 一种外呼处理的方法、装置和系统
CN105744052A (zh) 来电铃声控制系统及方法
CN106791245B (zh) 确定滤波器系数的方法及装置
CN111199751A (zh) 一种麦克风的屏蔽方法、装置和电子设备
CN106791681A (zh) 视频监控和人脸识别方法、装置及系统
US20230162738A1 (en) Communication transfer between devices
US11875800B2 (en) Talker prediction method, talker prediction device, and communication system
CN105025149A (zh) 一种自动调节通话音量的方法及装置
CN105657149A (zh) 一种语音通信方法、系统和通信终端
JP6155882B2 (ja) エコー抑圧装置及びプログラム
EP3703362A1 (en) Electronic doorbell system with camera selection
JP2015023485A (ja) 特定音付き音声コマンド対応情報端末
JP2015023485A5 (zh)
CN205490897U (zh) 一种视频通信终端及系统
EP1480409A3 (en) Digital video recorder having an internet phone and communication method thereof
CN103313025A (zh) 一种基于移动互联网的访客快照实时采集及快照推送方法
CN112995178B (zh) 一种具有远程回拨功能的电梯多方通话装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191231

Address after: 518000 unit 203, building 3, xujingjiayuan (phase I), Bantian street, Longgang District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Wulang Intelligent Technology Co., Ltd

Address before: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets Science Park Road 4, 4 floor B01

Applicant before: Shenzhen sound Acoustics Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant