CN112330897B - 用户语音对应性别改变方法、装置、智能门铃及存储介质 - Google Patents

用户语音对应性别改变方法、装置、智能门铃及存储介质 Download PDF

Info

Publication number
CN112330897B
CN112330897B CN202010841534.2A CN202010841534A CN112330897B CN 112330897 B CN112330897 B CN 112330897B CN 202010841534 A CN202010841534 A CN 202010841534A CN 112330897 B CN112330897 B CN 112330897B
Authority
CN
China
Prior art keywords
gender
visitor
user
voice
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010841534.2A
Other languages
English (en)
Other versions
CN112330897A (zh
Inventor
王献强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202010841534.2A priority Critical patent/CN112330897B/zh
Publication of CN112330897A publication Critical patent/CN112330897A/zh
Application granted granted Critical
Publication of CN112330897B publication Critical patent/CN112330897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B3/00Audible signalling systems; Audible personal calling systems
    • G08B3/10Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electromagnetism (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户语音对应性别改变方法、装置、智能门铃及存储介质,方法包括:获取用户性别和来访者性别;若用户性别与来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与来访者性别相同。本发明避免了来访者产生歹意,从而提高了用户在使用智能门铃时的安全性。

Description

用户语音对应性别改变方法、装置、智能门铃及存储介质
技术领域
本发明涉及改变语音技术领域,尤其涉及一种用户语音对应性别改变方法、装置、智能门铃及存储介质。
背景技术
随着智能门铃的发展,用户可通过智能门铃获取门口的实况,例如,有来访者到来时,可通过智能门铃获取该来访者的图像,以确定该来访者的身份。但是,在该来访者为陌生人时,例如,该来访者是男性快递员,用户是女性时,男性来访者知道用户为女性,可能会产生歹意,然而,在此时,智能门铃并不能提供一定的功能来提高用户的人身安全。
由此可知,目前智能门铃存在用户使用时,安全性不高的问题。
发明内容
本发明的主要目的在于提供一种用户语音对应性别改变方法、装置、智能门铃及存储介质,旨在解决现有的智能门铃存在用户使用时,安全性不高的技术问题。
为实现上述目的,本发明提供一种用户语音对应性别改变方法,包括:
获取用户性别和来访者性别;
若用户性别与来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与来访者性别相同。
此外,为实现上述目的,本发明还提供一种用户语音对应性别改变装置,包括:
获取模块,用于获取用户性别和来访者性别;
改变模块,用于若用户性别与来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与来访者性别相同。
此外,为实现上述目的,本发明还提供一种智能门铃,智能门铃包括存储器、处理器和存储在存储器上并可在处理器上运行的用户语音对应性别改变程序,用户语音对应性别改变程序被处理器执行时实现如上的用户语音对应性别改变方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有用户语音对应性别改变程序,用户语音对应性别改变程序被处理器执行时实现如上的用户语音对应性别改变方法的步骤。
本发明实现了通过获取用户性别和来访者性别,以确定用户性别和来访者性别是否相同,在用户性别和来访者性别不同时,例如,用户为女性,来访者为男性时,改变用户语音的性别,改变后的用户语音的性别与来访者性别相同,即,将女声改变为男声,可使来访者误以为用户为男性,避免了来访者产生歹意,从而提高了用户在使用智能门铃时的安全性。
附图说明
图1是本发明用户语音对应性别改变方法第一实施例的流程示意图;
图2是本发明用户语音对应性别改变方法第二实施例的流程示意图;
图3是本发明用户语音对应性别改变装置较佳实施例的功能模块示意图;
图4是本发明实施例方案涉及的硬件运行环境的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种用户语音对应性别改变方法,参照图1,图1为本发明用户语音对应性别改变方法第一实施例的流程示意图。
本发明实施例提供了用户语音对应性别改变方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。该用户语音对应性别改变方法应用于智能门铃,包括:
步骤S110,智能门铃获取用户性别和来访者性别。
具体地,在有来访者造访时,智能门铃获取用户性别和来访者性别。
需要说明的是,智能门铃获取用户性别和来访者性别时相对于待机时是非常耗电的,而为了省电,在来访者离智能门铃的距离小于一定值时,才确定有来访者造访。该一定值可由用户根据需要设定,例如,0.5米。
进一步地,智能门铃获取用户性别,包括:
步骤a,智能门铃获取用户语音。
具体地,智能门铃获取用户语音,该用户语音为用户用于答复来访者的语音。
步骤b,智能门铃提取用户语音中的音频特征;
步骤c,若音频特征与预设用户的音频特征匹配,则智能门铃确定预设用户的性别为用户性别。
具体地,智能门铃提取用户语音中的音频特征,若音频特征与预设用户的音频特征匹配,则智能门铃确定预设用户的性别为用户性别。在其他实施例中,智能门铃还可直接通过获取用户用于答复来访者的语音的性别来确定用户的性别。
需要说明的是,对于预设用户的音频特征,智能门铃可在用户首次使用时通过注册的方式,获取用于注册的用户语音,并提取其中的音频特征作为预设用户的音频特征,同时,将该预设用户的音频特征与该用户的其他信息进行绑定,例如,与用户的用户性别进行绑定,其中,该预设用户的音频特征包括声纹特征,可以理解的是,不同的用户的声纹特征不同。
步骤S120,若用户性别与来访者性别不相同,则智能门铃改变用户语音的性别,改变后的用户语音的性别与来访者性别相同。
具体地,若用户性别和来访者性别不同(即用户性别为女性时,来访者性别为男性;或,用户性别为男性时,来访者性别为女性),则智能门铃改变用户语音的性别,改变后的用户语音的性别与来访者性别相同;若用户性别和来访者性别相同,则智能门铃不对用户语音的性别进行改变。
本实施例中,实现了通过获取用户语音的音频特征来获取用户性别,并且获取来访者性别,以确定用户性别和来访者性别是否相同,在用户性别和来访者性别不同时,例如,用户为女性,来访者为男性时,改变用户语音的性别,改变后的用户语音的性别与来访者性别相同,即,将女声改变为男声,可使来访者误以为用户为男性,避免了来访者产生歹意,从而提高了用户在使用智能门铃时的安全性。
参照图2,基于本发明用户语音对应性别改变方法第一实施例,提出第二实施例,上述智能门铃获取来访者性别,包括:
步骤S111,智能门铃获取来访者语音和来访者图像。
具体地,智能门铃通过麦克风获取来访者语音和摄像头获取来访者图像,优选地,该来访者图像包括完整的五官和头发,即来访者图像为来访者的头部正对摄像头且包括完整的肩部以上头像的图像。
步骤S112,智能门铃确定来访者语音的声音特征以及来访者图像中的头发与头部的比值。
具体地,智能门铃确定来访者语音的声音特征以及来访者图像中的头发与头部的比值,除获取来访者图像中的头发与头部的比值外,智能门铃还可获取来访者图像中的头发与头发和头部的整体之间的比值。
需要说明的是,一般情况下,男性的头发要短于女性,即男性的头发与头发和头部的整体之间的比值要小于女性的头发与头发和头部的整体之间的比值,因此,获取上述比值的目的为通过图像中头发占图像中头部(即头发和头部的整体)的比值确定该图像中的人的性别。
步骤S113,智能门铃根据来访者语音的声音特征和头发与头部的比值对来访者进行性别识别,得到来访者性别。
具体地,智能门铃根据上述来访者语音的声音特征得到一个来访者性别识别结果,再通过上述头发与头部的比值得到另一个来访者性别识别结果,根据这两个识别结果得到来访者性别,以提高确定来访者性别的准确性。
来访者语音的声音特征包括频率和幅度,上述智能门铃根据来访者语音的声音特征和头发与头部的比值对来访者进行性别识别,得到来访者性别,包括:
步骤d,智能门铃计算来访者语音的频率与预设频率阈值之间的频率差值。
具体地,智能门铃计算来访者语音的频率与预设频率阈值之间的频率差值。需要说明的是,频率大于预设频率阈值时,该来访者大概率为女性,频率小于或等于预设频率阈值时,该来访者大概率为男性;或,频率大于或等于预设频率阈值时,该来访者语音大概率为女性,频率小于预设频率阈值时,该来访者大概率为男性。需要说明的是,预设频率阈值可为经验值。
步骤e,智能门铃计算来访者语音的幅度与预设幅度阈值之间的幅度差值。
具体地,智能门铃计算来访者语音的幅度与预设幅度阈值之间的幅度差值。需要说明的是,幅度小于预设幅度阈值时,该来访者大概率为女性,幅度大于或等于预设幅度阈值时,该来访者大概率为男性;或,幅度小于或等于预设幅度阈值时,该来访者大概率为女性,幅度大于预设幅度阈值时,该来访者大概率为男性。
步骤f,智能门铃将频率差值和幅度差值与第一预设性别映射关系进行匹配,得到第一映射关系匹配结果。
具体地,智能门铃将频率差值和幅度差值与第一预设性别映射关系进行匹配,得到第一映射关系匹配结果。需要说明的是,第一预设性别映射关系为同时考虑频率差值和幅度差值时与性别的对应关系,例如,在频率差值为正值、幅度差值为负值时,第一映射关系匹配结果为来访者性别为女性;在频率差值为负值、幅度差值为正值时,第一映射关系匹配结果为来访者性别为男性;在频率差值和幅度差值同时为正值或同时为负值时,不进行性别的判断,而是进入下一步骤,以通过头发与头部的比值来确定来访者性别。
步骤g,智能门铃计算头发与头部的比值与预设比值阈值之间的比值差值。
具体地,智能门铃计算头发与头部(包括头发和脸部)的比值与预设比值阈值之间的比值差值。
需要说明的是,头发与头部的比值可通过图像中对应的像素比值(头发对应的像素和头部对应的像素之间的数量的比值)来确定,可以理解的是,头发的颜色一般与脸部的肤色不同,并且头发的颜色一般深于脸部的肤色,因此,可通过像素将来访者图像中的头部分为头发和脸部,例如,头发的色值为(200-255,200-255,200-255),而脸部的色值则一般小于200。
步骤h,智能门铃将比值差值与第二预设性别映射关系进行匹配,得到第二映射关系匹配结果。
具体地,智能门铃将比值差值与第二预设性别映射关系进行匹配,得到第二映射关系匹配结果。第二预设性别映射关系为头发与头部的比值与性别的对应关系,例如,比值差值为正值时,该来访者大概率为女性;比值差值为负值时,该来访者大概率为男性。
步骤i,智能门铃根据第一映射关系匹配结果和第二映射关系匹配结果确定来访者性别。
具体地,智能门铃根据第一映射关系匹配结果和第二映射关系匹配结果确定来访者性别。需要说明的是,不同的第一映射关系匹配结果和不同的第二映射关系匹配结果会得到不同的来访者性别。具体如下。
上述智能门铃根据第一映射关系匹配结果和第二映射关系匹配结果确定来访者性别,包括:
步骤i1,若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别一致,则智能门铃确定第一映射关系匹配结果中的性别或第二映射关系匹配结果中的性别为来访者性别。
具体地,若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别一致,则智能门铃确定第一映射关系匹配结果中的性别或第二映射关系匹配结果中的性别为来访者性别。例如,若第一映射关系匹配结果和第二映射关系匹配结果均为女性,则确定来访者性别为女性;若第一映射关系匹配结果和第二映射关系匹配结果均为男性,则确定来访者性别为男性。
进一步地,智能门铃根据第一映射关系匹配结果和所述第二映射关系匹配结果确定来访者性别,包括:
步骤i2,若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别不一致,则智能门铃确定频率差值对应的频率等级、幅度差值对应的幅度等级和比值差值对应的比值等级。
具体地,若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别不一致,则智能门铃确定频率差值对应的频率等级、幅度差值对应的幅度等级和比值差值对应的比值等级,以最终确定来访者性别。
步骤i3,智能门铃从频率等级、幅度等级和比值等级中选取最高等级,确定最高等级对应的性别为来访者性别。
具体地,智能门铃从频率等级、幅度等级和比值等级中选取最高等级,确定最高等级对应的性别为来访者性别。
需要说明的是,频率等级以预设频率阈值为界限设置,频率大于预设频率阈值对应的性别为女性,并根据频率大于预设频率阈值的范围设置等级,频率越大,等级越高;频率小于预设频率阈值对应的性别为男性,并根据频率大于预设频率阈值的范围设置等级,频率越小,等级越高。例如,预设频率阈值为400赫兹,420赫兹为女性一级、440赫兹为女性二级、460赫兹为女性三级、……,以此类推,以等差的形式设置频率等级;可以理解的是,380赫兹为男性一级、360赫兹为男性二级、340赫兹为男性三级、……,以此类推,以等差的形式设置频率等级。可以理解的是,除等差的形式外,还可以其他形式设置频率等级,例如,预设频率阈值为400赫兹,420赫兹为女性一级、450赫兹为女性二级、490赫兹为女性三级、……,对于频率等级的设置,本实施例中不作具体限制,频率等级可根据需要自行设置。
需要说明的是,幅度等级以预设幅度阈值为界限设置,幅度大于预设幅度阈值对应的性别为男性,并根据幅度大于预设幅度阈值的范围设置等级,幅度越大,等级越高;幅度小于预设幅度阈值对应的性别为女性,并根据幅度大于预设幅度阈值的范围设置等级,幅度越小,等级越高。例如,预设幅度阈值为2,2.1为男性一级、2.2为男性二级、2.3为男性三级、……,以此类推,以等差的形式设置幅度等级;可以理解的是,1.9为女性一级、1.8为女性二级、1.7为女性三级、……,以此类推,以等差的形式设置幅度等级。可以理解的是,除等差的形式外,还可以其他形式设置幅度等级,例如,预设幅度阈值为2,2.1为男性一级、2.3为男性二级、2.5为男性三级、……,对于幅度等级的设置,本实施例中不作具体限制,幅度等级可根据需要自行设置。
需要说明的是,比值等级以预设比值阈值为界限设置,比值大于预设比值阈值对应的性别为女性,并根据比值大于预设比值阈值的范围设置等级,比值越大,等级越高;比值小于预设比值阈值对应的性别为男性,并根据比值大于预设比值阈值的范围设置等级,比值越小,等级越高。例如,预设比值阈值为30%,35%为女性一级、40%为女性二级、45%为女性三级、……,以此类推,以等差的形式设置比值等级;可以理解的是,25%为男性一级、20%为男性二级、15%为男性三级、……,以此类推,以等差的形式设置比值等级。可以理解的是,除等差的形式外,还可以其他形式设置比值等级,例如,预设比值阈值为30%,35%为女性一级、41%为女性二级、47%为女性三级、……,对于比值等级的设置,本实施例中不作具体限制,比值等级可根据需要自行设置。
需要说明的是,由于频率和幅度同属语音的声音特征,在确定等级的高低时,需先从频率等级和幅度等级中选出等级高的一方,之后将该等级高的一方与比值等级进行等级高低判断。例如,在频率等级为男性二级、幅度等级为男性三级时,幅度等级为等级高的一方,若比值等级为女性二级,则确定来访者性别为男性(男性也可能留长头发);在频率等级为男性二级、幅度等级为男性三级时,幅度等级为等级高的一方,若比值等级为女性四级,则确定来访者性别为女性(女性也可能声音粗犷)。
上述改变用户语音的性别,包括:
步骤j,若用户性别为女性,则智能门铃降低用户语音的频率并调高用户语音的幅度;
步骤k,若用户性别为男性,则智能门铃调高用户语音的频率并降低用户语音的幅度。
具体地,若用户性别为女性,则智能门铃降低用户语音的频率并调高用户语音的幅度,优选地,根据预设频率阈值对用户语音的频率进行对称降低,根据预设幅度阈值对用户语音的幅度进行对称调高,例如,预设频率阈值为400赫兹,用户语音的频率为480赫兹,由于预设频率阈值与用户语音的频率之间的差值为80赫兹,则在预设频率阈值的基础上减少80赫兹作为调低后的用户语音的频率,即调整用户语音的频率为320赫兹;若用户性别为男性,则智能门铃调高用户语音的频率并降低用户语音的幅度,优选地,根据预设频率阈值对用户语音的频率进行对称调高,根据预设幅度阈值对用户语音的幅度进行对称降低,例如,预设频率阈值为400赫兹,用户语音的频率为320赫兹,由于预设频率阈值与用户语音的频率之间的差值为80赫兹,则在预设频率阈值的基础上增加80赫兹作为调低后的用户语音的频率,即调整用户语音的频率为480赫兹。
本实施例中,通过来访者语音和来访者图像,以及它们所对应的频率等级、幅度等级和比值等级来确定来访者性别,提高了确定来访者性别的准确性。
此外,本发明还提供一种用户语音对应性别改变装置,如图3所示,该装置包括:
获取模块10,用于获取用户性别和来访者性别;
改变模块20,用于若用户性别与来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与来访者性别相同。
可选地,在获取用户性别方面,获取模块10包括:
第一获取子模块,用于获取用户语音;
提取子模块,用于提取用户语音中的音频特征;
第一确定子模块,用于若音频特征与预设用户的音频特征匹配,则确定预设用户的性别为用户性别。
可选地,在获取来访者性别方面,获取模块10还包括:
第二获取子模块,用于获取来访者语音和来访者图像;
第二确定子模块,用于确定来访者语音的声音特征以及来访者图像中的头发与头部的比值;
识别子模块,用于根据来访者语音的声音特征和头发与头部的比值对来访者进行性别识别,得到来访者性别。
可选地,性别特征包括频率和幅度,在根据来访者语音的声音特征和头发与头部的比值对来访者进行性别识别,确定来访者性别方面,识别子模块包括:
第一计算单元,用于计算来访者语音的频率与预设频率阈值之间的频率差值;
第一计算单元还用于计算来访者语音的幅度与预设幅度阈值之间的幅度差值;
第一匹配单元,用于将频率差值和幅度差值与第一预设性别映射关系进行匹配,得到第一映射关系匹配结果;
第二计算单元,用于计算头发与头部的比值与预设比值阈值之间的比值差值;
第二匹配单元,用于将比值差值与第二预设性别映射关系进行匹配,得到第二映射关系匹配结果;
确定单元,用于根据第一映射关系匹配结果和第二映射关系匹配结果,确定来访者性别。
可选地,在根据第一映射关系匹配结果和第二映射关系匹配结果,确定来访者性别方面,确定单元具体用于:
若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别一致,则确定第一映射关系匹配结果中的性别或第二映射关系匹配结果中的性别为来访者性别。
可选地,确定单元,还包括:
确定子单元,用于若第一映射关系匹配结果中的性别与第二映射关系匹配结果中的性别不一致,则确定频率差值对应的频率等级、幅度差值对应的幅度等级和比值差值对应的比值等级;
选取子单元,用于从频率等级、幅度等级和比值等级中选取最高等级,确定最高等级对应的性别为来访者性别。
可选地,改变模块20,包括:
第一降低子模块,用于若用户性别为女性,则降低用户语音的频率;
第一调高子模块,用于调高用户语音的幅度;
第二调高子模块,用于若用户性别为男性,则调高用户语音的频率;
第二降低子模块,用于降低用户语音的幅度。
本发明用户语音对应性别改变装置具体实施方式与上述用户语音对应性别改变方法各实施例基本相同,在此不再赘述。
此外,本发明还提供一种用户语音对应性别改变设备。如图4所示,图4是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图4即可为用户语音对应性别改变设备的硬件运行环境的结构示意图。
如图4所示,该用户语音对应性别改变设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,用户语音对应性别改变设备还可以包括RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图4中示出的用户语音对应性别改变设备结构并不构成对用户语音对应性别改变设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及用户语音对应性别改变程序。其中,操作系统是管理和控制用户语音对应性别改变设备硬件和软件资源的程序,支持用户语音对应性别改变程序以及其它软件或程序的运行。
在图4所示的用户语音对应性别改变设备中,用户接口1003主要用于连接终端,与终端进行数据通信,如获取用户语音;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的用户语音对应性别改变程序,并执行如上的用户语音对应性别改变方法的步骤。
本发明用户语音对应性别改变设备具体实施方式与上述用户语音对应性别改变方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质上存储有用户语音对应性别改变程序,用户语音对应性别改变程序被处理器执行时实现如上的用户语音对应性别改变方法的步骤。
本发明计算机可读存储介质具体实施方式与上述用户语音对应性别改变方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,设备,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种用户语音对应性别改变方法,其特征在于,包括:
获取用户性别和来访者性别;
获取来访者语音和来访者图像;
确定所述来访者语音的声音特征以及所述来访者图像中的头发与头部的比值,所述来访者语音的声音特征包括频率和幅度;
计算所述来访者语音的频率与预设频率阈值之间的频率差值;
计算所述来访者语音的幅度与预设幅度阈值之间的幅度差值;
将所述频率差值和所述幅度差值与第一预设性别映射关系进行匹配,得到第一映射关系匹配结果;
计算所述头发与头部的比值与预设比值阈值之间的比值差值;
将所述比值差值与第二预设性别映射关系进行匹配,得到第二映射关系匹配结果;
根据所述第一映射关系匹配结果和所述第二映射关系匹配结果确定来访者性别;
若所述用户性别与所述来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与所述来访者性别相同。
2.如权利要求1所述的方法,其特征在于,所述获取用户性别,包括:
获取用户语音;
提取所述用户语音中的音频特征;
若所述音频特征与预设用户的音频特征匹配,则确定所述预设用户的性别为用户性别。
3.如权利要求1所述的方法,其特征在于,所述根据所述第一映射关系匹配结果和所述第二映射关系匹配结果确定来访者性别,包括:
若所述第一映射关系匹配结果中的性别与所述第二映射关系匹配结果中的性别一致,则确定所述第一映射关系匹配结果中的性别或所述第二映射关系匹配结果中的性别为来访者性别。
4.如权利要求1所述的方法,其特征在于,所述根据所述第一映射关系匹配结果和所述第二映射关系匹配结果确定来访者性别,包括:
若所述第一映射关系匹配结果中的性别与所述第二映射关系匹配结果中的性别不一致,则确定所述频率差值对应的频率等级、所述幅度差值对应的幅度等级和所述比值差值对应的比值等级;
从所述频率等级、所述幅度等级和所述比值等级中选取最高等级,确定所述最高等级对应的性别为来访者性别。
5.如权利要求3或4所述的方法,其特征在于,所述改变用户语音的性别,包括:
若所述用户性别为女性,则降低所述用户语音的频率并调高所述用户语音的幅度;
若所述用户性别为男性,则调高所述用户语音的频率并降低所述用户语音的幅度。
6.一种用户语音对应性别改变装置,其特征在于,包括:
获取模块,用于获取用户性别和来访者性别;
改变模块,用于获取来访者语音和来访者图像;确定所述来访者语音的声音特征以及所述来访者图像中的头发与头部的比值,所述来访者语音的声音特征包括频率和幅度;计算所述来访者语音的频率与预设频率阈值之间的频率差值;计算所述来访者语音的幅度与预设幅度阈值之间的幅度差值;将所述频率差值和所述幅度差值与第一预设性别映射关系进行匹配,得到第一映射关系匹配结果;计算所述头发与头部的比值与预设比值阈值之间的比值差值;将所述比值差值与第二预设性别映射关系进行匹配,得到第二映射关系匹配结果;根据所述第一映射关系匹配结果和所述第二映射关系匹配结果确定来访者性别;
若所述用户性别与所述来访者性别不相同,则改变用户语音的性别,改变后的用户语音的性别与所述来访者性别相同。
7.一种智能门铃,其特征在于,所述智能门铃包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的用户语音对应性别改变程序,所述用户语音对应性别改变程序被所述处理器执行时实现如权利要求1至5中任一项所述的用户语音对应性别改变方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有用户语音对应性别改变程序,所述用户语音对应性别改变程序被处理器执行时实现如权利要求1至5中任一项所述的用户语音对应性别改变方法的步骤。
CN202010841534.2A 2020-08-19 2020-08-19 用户语音对应性别改变方法、装置、智能门铃及存储介质 Active CN112330897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010841534.2A CN112330897B (zh) 2020-08-19 2020-08-19 用户语音对应性别改变方法、装置、智能门铃及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010841534.2A CN112330897B (zh) 2020-08-19 2020-08-19 用户语音对应性别改变方法、装置、智能门铃及存储介质

Publications (2)

Publication Number Publication Date
CN112330897A CN112330897A (zh) 2021-02-05
CN112330897B true CN112330897B (zh) 2023-07-25

Family

ID=74304391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010841534.2A Active CN112330897B (zh) 2020-08-19 2020-08-19 用户语音对应性别改变方法、装置、智能门铃及存储介质

Country Status (1)

Country Link
CN (1) CN112330897B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806137A (zh) * 2018-06-14 2018-11-13 北京奇虎科技有限公司 一种智能门铃、智能门铃的控制方法及装置
CN109215681A (zh) * 2018-10-24 2019-01-15 北京疯景科技有限公司 应用于智能门铃中的语音交互方法和系统
CN110459242A (zh) * 2019-08-21 2019-11-15 广州国音智能科技有限公司 变声检测方法、终端及计算机可读存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473836B (zh) * 2013-08-30 2015-11-25 福建星网锐捷通讯股份有限公司 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统
CN104980396A (zh) * 2014-04-03 2015-10-14 北京千橡网景科技发展有限公司 一种用于社交网络的通信方法及系统
CN105304092A (zh) * 2015-09-18 2016-02-03 深圳市海派通讯科技有限公司 一种基于智能终端的实时变声方法
CN115719592A (zh) * 2016-08-15 2023-02-28 中兴通讯股份有限公司 一种语音信息处理方法和装置
CN106295591A (zh) * 2016-08-17 2017-01-04 乐视控股(北京)有限公司 基于人脸图像的性别识别方法及装置
US10629192B1 (en) * 2018-01-09 2020-04-21 Electronic Arts Inc. Intelligent personalized speech recognition
CN208734212U (zh) * 2018-06-19 2019-04-12 重庆阿拉丁魔方科技有限公司 一种带变声系统的门锁
CN109190032A (zh) * 2018-08-23 2019-01-11 百度在线网络技术(北京)有限公司 推送方法、装置的存储介质
CN110310645A (zh) * 2019-07-02 2019-10-08 上海迥灵信息技术有限公司 智能控制系统的语音控制方法、装置和存储介质
CN110956966B (zh) * 2019-11-01 2023-09-19 平安科技(深圳)有限公司 声纹认证方法、装置、介质及电子设备
CN111028845A (zh) * 2019-12-06 2020-04-17 广州国音智能科技有限公司 多音频识别方法、装置、设备及可读存储介质
CN111325173A (zh) * 2020-02-28 2020-06-23 腾讯科技(深圳)有限公司 毛发类型识别方法、装置、电子设备及存储介质
CN111507774A (zh) * 2020-04-28 2020-08-07 上海依图网络科技有限公司 一种数据处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806137A (zh) * 2018-06-14 2018-11-13 北京奇虎科技有限公司 一种智能门铃、智能门铃的控制方法及装置
CN109215681A (zh) * 2018-10-24 2019-01-15 北京疯景科技有限公司 应用于智能门铃中的语音交互方法和系统
CN110459242A (zh) * 2019-08-21 2019-11-15 广州国音智能科技有限公司 变声检测方法、终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN112330897A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
EP3306867B1 (en) Auto-response method, apparatus and device, and computer-readable storage medium
KR102455966B1 (ko) 중개 장치, 방법 및 컴퓨터 판독 가능한 기록매체
CN108681390B (zh) 信息交互方法和装置、存储介质及电子装置
US20210342632A1 (en) Image processing method and apparatus, electronic device, and storage medium
US10592759B2 (en) Object recognition apparatus and control method therefor
CN104636453A (zh) 非法用户资料识别方法及装置
CN111325322A (zh) 基于隐私保护的深度学习方法、系统、服务器及存储介质
CN111045774A (zh) 应用程序的智能调节方法、装置、设备及存储介质
CN107085823B (zh) 人脸图像处理方法及装置
CN111435432A (zh) 网络优化方法及装置、图像处理方法及装置、存储介质
WO2021135286A1 (zh) 视频的处理方法、视频的搜索方法、终端设备及计算机可读存储介质
CN114332503A (zh) 对象重识别方法及装置、电子设备和存储介质
CN115202599A (zh) 一种投屏显示方法和相关装置
CN112560840B (zh) 多个识别区域识别方法、识别终端及可读存储介质
CN114501144A (zh) 基于图像的电视控制方法、装置、设备及存储介质
CN112330897B (zh) 用户语音对应性别改变方法、装置、智能门铃及存储介质
CN108364346B (zh) 构建三维人脸模型的方法、装置和计算机可读存储介质
CN103905837A (zh) 图像处理方法、装置及终端
CN106331281A (zh) 移动终端及信息处理方法
KR20180052858A (ko) 지능형 인형 및 그 동작 방법
KR102293416B1 (ko) 통신 장치, 서버 및 그것의 통신 방법
CN108153568B (zh) 一种信息处理方法及电子设备
CN109740361B (zh) 数据处理方法、装置及计算机可读存储介质
CN113038256A (zh) 电子设备的音频输出方法、智能电视及可读存储介质
CN111753656B (zh) 特征提取方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant