CN106210239A - 恶意来电者声纹的自动识别方法、装置和移动终端 - Google Patents
恶意来电者声纹的自动识别方法、装置和移动终端 Download PDFInfo
- Publication number
- CN106210239A CN106210239A CN201610827253.5A CN201610827253A CN106210239A CN 106210239 A CN106210239 A CN 106210239A CN 201610827253 A CN201610827253 A CN 201610827253A CN 106210239 A CN106210239 A CN 106210239A
- Authority
- CN
- China
- Prior art keywords
- malice
- caller
- vocal print
- stored
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001755 vocal effect Effects 0.000 title claims abstract description 171
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000006854 communication Effects 0.000 claims abstract description 32
- 239000000284 extract Substances 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 230000005611 electricity Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000006399 behavior Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 4
- 230000033764 rhythmic process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 208000031481 Pathologic Constriction Diseases 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000151 deposition Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 210000000088 lip Anatomy 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 210000002105 tongue Anatomy 0.000 description 2
- 210000000515 tooth Anatomy 0.000 description 2
- 210000001215 vagina Anatomy 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/66—Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
- H04M1/663—Preventing unauthorised calls to a telephone set
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/27453—Directories allowing storage of additional subscriber data, e.g. metadata
- H04M1/27457—Management thereof, e.g. manual editing of data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Environmental & Geological Engineering (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种恶意来电者声纹的自动识别方法和装置,确定来电呼叫相对应的来电号码为正常来电;获取通话过程中来电者的语音数据,从语音数据中提取来电者的声纹特征;判断来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将来电号码存储到恶意号码黑名单中。这样,恶意来电者即使使用其他正常电话号码(未被标识为恶意电话号码)再次呼叫用户时也会被识别出来,及时的提示用户并将该电话号码列入黑名单,提高了安全性并节约了用户时间。本发明还提供一种移动终端。
Description
技术领域
本发明涉及通话安全技术领域,具体而言,本发明涉及一种恶意来电者声纹的自动识别方法、装置和移动终端。
背景技术
近年来,电话诈骗、电话推销、电话骚扰等恶意电话行为越来越猖獗,电信用户不胜其扰。一些手机安全软件例如360手机卫士,会将这些被众多用户举报为恶意来电的电话号码统一标识为恶意号码,并在该电话号码进行呼叫时提示被叫用户该电话号码为恶意号码,使得被叫用户可以有效分辨,避免被骗或者浪费时间,这在一定程度上保证了用户安全和节约了用户时间。然而,如果这些恶意来电者更换了电话号码再次进行恶意电话行为,则由于刚开始时该电话号码并没有被有效标识,导致被叫用户存在被骗的风险并且会浪费用户时间,安全性和效率都有待提高。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一,特别是安全性不佳的技术缺陷。
本发明提供一种恶意来电者声纹的自动识别方法,包括如下步骤:
确定来电呼叫相对应的来电号码为正常来电;
获取通话过程中来电者的语音数据,从所述语音数据中提取来电者的声纹特征;
判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中。
在其中一个实施例中,所述恶意声纹数据库多于一个,每个恶意声纹数据库对应各自的恶意类型,每个恶意声纹数据库存储有对应恶意类型的预存声纹特征。
在其中一个实施例中,所述恶意号码黑名单多于一个,每个恶意号码黑名单对应各自的恶意类型。
在其中一个实施例中,将所述来电号码存储到与所述恶意声纹数据库对应的恶意类型相一致的恶意号码黑名单中。
在其中一个实施例中,所述恶意类型包括诈骗类型、推销类型、骚扰类型中的至少之一。
在其中一个实施例中,所述预存声纹特征与电话号码相关联。
在其中一个实施例中,所述判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中包括:
从所述恶意声纹数据库中获取与所述来电号码关联的预存声纹特征,判断所述来电者的声纹特征是否与所述预存声纹特征匹配。
在其中一个实施例中,判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中,以及将所述来电号码与所述来电者的声纹特征建立好映射关系存储到所述恶意声纹数据库中。
在其中一个实施例中,所述确定来电呼叫相对应的来电号码为正常来电的过程包括:
判断所述来电号码是否已经存储在恶意号码黑名单中,若否则确定对应的来电为正常来电。
在其中一个实施例中,所述恶意号码黑名单存储在本地或服务器。
在其中一个实施例中,所述来电者的声纹特征为携带具有特征字或词的言语信息的声波频谱。
在其中一个实施例中,所述获取通话过程中的来电者语音数据,从所述语音数据中提取来电者的声纹特征的过程包括:
检测到来电者产生语音流时,记录并存储至少一段语音数据;
解析所述至少一段语音数据以提取来电者的声纹特征。
在其中一个实施例中,所述解析所述至少一段语音数据以提取来电者的声纹特征包括:
解析至少一段语音数据,提取所述语音数据中至少一组特征字或词;
根据所述特征字或词提取来电者的声纹特征。
在其中一个实施例中,所述语音数据为设定时长的语音数据。
在其中一个实施例中,提取来电者的声纹特征成功后,或确认无法提取来电者的声纹特征后,删除所述语音数据。
在其中一个实施例中,所述存储所述来电者的声纹特征到所述恶意声纹数据库中包括:
存储与所述来电号码建立有映射关系的所述来电者的声纹特征到所述恶意声纹数据库中。
在其中一个实施例中,所述恶意声纹数据库建立在服务器。
在其中一个实施例中,若所述来电者的声纹特征已经存储在所述恶意声纹数据库中,则警示用户并将所述来电号码存储到恶意号码黑名单中,并自动挂断电话。
在其中一个实施例中,若已经存储在所述恶意声纹数据库中,则警示用户并将所述来电号码存储到恶意号码黑名单中,并经过预设的等候时长后自动挂断电话。
本发明还提供一种恶意来电者声纹的自动识别装置,其包括:
识别模块,用于确定来电呼叫相对应的来电号码为正常来电;
分析模块,用于获取通话过程中来电者的语音数据,从所述语音数据中提取来电者的声纹特征;
处理模块,用于判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中。
在其中一个实施例中,所述恶意声纹数据库多于一个,每个恶意声纹数据库对应各自的恶意类型,每个恶意声纹数据库存储有对应恶意类型的预存声纹特征。
在其中一个实施例中,所述恶意号码黑名单多于一个,每个恶意号码黑名单对应各自的恶意类型。
在其中一个实施例中,所述处理模块将所述来电号码存储到与所述恶意声纹数据库对应的恶意类型相一致的恶意号码黑名单中。
在其中一个实施例中,所述恶意类型包括诈骗类型、推销类型、骚扰类型中的至少之一。
在其中一个实施例中,所述预存声纹特征与电话号码相关联。
在其中一个实施例中,所述处理模块用于:
从所述恶意声纹数据库中获取与所述来电号码关联的预存声纹特征,判断所述来电者的声纹特征是否与所述预存声纹特征匹配。
在其中一个实施例中,所述处理模块用于:判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中,以及将所述来电号码与所述来电者的声纹特征建立好映射关系存储到所述恶意声纹数据库中。
在其中一个实施例中,所述识别模块用于:
判断所述来电号码是否已经存储在恶意号码黑名单中,若否则确定对应的来电为正常来电。
在其中一个实施例中,所述恶意号码黑名单存储在本地或服务器。
在其中一个实施例中,所述来电者的声纹特征为携带具有特征字或词的言语信息的声波频谱。
在其中一个实施例中,所述分析模块用于:
检测到来电者产生语音流时,记录并存储至少一段语音数据;
解析所述至少一段语音数据以提取来电者的声纹特征。
在其中一个实施例中,所述解析所述至少一段语音数据以提取来电者的声纹特征包括:
解析至少一段语音数据,提取所述语音数据中至少一组特征字或词;
根据所述特征字或词提取来电者的声纹特征。
在其中一个实施例中,所述语音数据为设定时长的语音数据。
在其中一个实施例中,所述装置还包括删除模块;所述删除模块用于:在所述分析模块提取来电者的声纹特征成功后,或确认无法提取来电者的声纹特征后,删除所述语音数据。
在其中一个实施例中,所述处理模块用于:
存储与所述来电号码建立有映射关系的所述来电者的声纹特征到所述恶意声纹数据库中。
在其中一个实施例中,所述恶意声纹数据库建立在服务器。
在其中一个实施例中,所述装置还包括保护模块;若所述来电者的声纹特征已经存储在所述恶意声纹数据库中,则所述处理模块警示用户并将所述来电号码存储到恶意号码黑名单中,所述保护模块自动挂断电话。
在其中一个实施例中,若已经存储在所述恶意声纹数据库中,则所述处理模块警示用户并将所述来电号码存储到恶意号码黑名单中,所述保护模块经过预设的等候时长后自动挂断电话。
本发明还提供一种移动终端,其包括:
触敏显示器;
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行任一实施例所述的恶意来电者声纹的自动识别方法。
上述的恶意来电者声纹的自动识别方法、装置和移动终端,确定来电呼叫相对应的来电号码为正常来电;获取通话过程中来电者的语音数据,从所述语音数据中提取来电者的声纹特征;判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若没有存储则警示用户并将所述来电号码存储到恶意号码黑名单中。这样,恶意来电者即使使用其他正常电话号码(未被标识为恶意电话号码)再次呼叫用户时也会被识别出来,及时的提示用户并将该电话号码列入黑名单,提高了安全性并节约了用户时间。
而且,恶意来电者即使正常的日常通话都会被提示为恶意来电,可以有效遏制恶意来电者不再进行恶意电话行为。如果在一段预设的考察时长内恶意来电者的来电不再被用户举报为恶意来电,则还可以删除恶意声纹数据库中的该来电者的声纹特征。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为一个实施例的恶意来电者声纹的自动识别方法流程图;
图2为一个实施例的恶意来电者声纹的自动识别装置模块图;
图3示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通讯链路上,执行双向通讯的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通讯设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通讯设备;PCS(Personal Communications Service,个人通讯系统),其可以组合语音、数据处理、传真和/或数据通讯能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通讯终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本技术领域技术人员可以理解,这里所使用的远端网络设备,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,远端网络设备、终端设备与WNS服务器之间可通过任何通讯方式实现通讯,包括但不限于,基于3GPP、LTE、WIMAX的移动通讯、基于TCP/IP、UDP协议的计算机网络通讯以及基于蓝牙、红外传输标准的近距无线传输方式。
以下描述的恶意来电者声纹的自动识别方法和装置,可以应用于移动终端,例如应用于手机、平板电脑,总之是具有通信功能的终端,在以下说明中以终端为例子。
图1为一个实施例的恶意来电者声纹的自动识别方法流程图。
本发明提供一种恶意来电者声纹的自动识别方法,包括如下步骤:
步骤S100:确定来电呼叫相对应的来电号码为正常来电。
可以在本机或服务器预先建立好恶意号码黑名单,当终端收到来电时,获取来电号码,判断来电号码是否已经存储在恶意号码黑名单中,若是则确定对应的来电为恶意来电,若否则确定为正常来电。如果恶意号码黑名单存储在本机,则在本地进行识别;如果恶意号码黑名单存储在服务器,则在服务器进行识别,服务器将识别结果反馈给终端。
恶意号码黑名单既可以是由用户自行建立的黑名单,例如用户在接到某些恶意电话时将该电话号码添加到黑名单中,这个时候恶意号码黑名单可以存储在本地,用户还可以分享该恶意号码黑名单到服务器。当然,恶意号码黑名单也可以是由服务器建立的黑名单,例如服务器将众多用户举报的电话号码列入黑名单中,这个时候恶意号码黑名单可以存储在服务器,用户还可以主动到服务器请求获取该恶意号码黑名单。
恶意号码黑名单既可以是一个黑名单,也可以按照恶意类型分成多个恶意号码名单。例如恶意类型可以分为诈骗类型、推销类型、骚扰类型等等,则恶意号码黑名单可以分成诈骗黑名单、推销黑名单、骚扰黑名单。终端在识别到来电号码是属于哪个恶意号码黑名单中,然后进行相应的提示。例如识别来电号码是属于诈骗黑名单中的,则提示用户来电为诈骗来电。因此,当还对恶意类型进行细分时,终端可以获取来电呼叫相对应的来电号码,确定来电号码为恶意来电,并确定其恶意类型。具体过程为:终端获取来电呼叫相对应的来电号码后,将来电号码在多个恶意号码黑名单中进行比对,当某一恶意类型的恶意号码黑名单中存储有该电话号码时,则确定该电话号码为恶意来电号码,并确定其恶意类型;若没有恶意号码黑名单存储有该电话号码,则确定该电话号码为正常来电。
步骤S200:获取通话过程中来电者的语音数据,从该语音数据中提取来电者的声纹特征。
由于每个人的声音器官,诸如声带、口腔、鼻腔、舌、齿、唇、肺等,在发音时呈现千姿百态。由于年龄、性格、语言习惯等多种原因,再加上发音容量大小不一,发音频率不尽相同,哪怕是微小的差异,也会导致这些器官发出的声音必然有着各自的特点,从而形成每个人独具一格的声纹(Voiceprint),可用语谱图观察出来。
声纹识别,就是从某段语音中识别出说话人的身份的过程。与指纹类似,每个人说话过程中蕴涵的语音特征和发音习惯等也几乎是唯一的。语音识别是共性识别,判定所说的内容(说的什么)。声纹识别是个性识别,判定说话人身份(是谁说的)。
声纹识别有两个关键问题,一是特征提取,二是模式识别。
特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。虽然目前大部分声纹识别系统用的都是声学层面的特征,但是表征一个人特点的特征应该是多层面的,包括:(1)与人类的发音机制的解剖学结构有关的声学特征(如频谱、倒频谱、共振峰、基音、反射系数等等)、鼻音、带深呼吸音、沙哑音、笑声等;(2)受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等;(3)个人特点或受父母影响的韵律、节奏、速度、语调、音量等特征。从利用数学方法可以建模的角度出发,声纹自动识别模型目前可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道);等等。
对于模式识别,主要有这几大类方法:(1)模板匹配方法:利用动态时间弯折(DTW)以对准训练和测试特征序列,主要用于固定词组的应用(通常为文本相关任务);(2)最近邻方法:训练时保留所有特征矢量,识别时对每个矢量都找到训练矢量中最近的K个,据此进行识别,通常模型存储和相似计算的量都很大;(3)神经网络方法:有很多种形式,如多层感知、径向基函数(RBF)等,可以显式训练以区分说话人和其背景说话人,其训练量很大,且模型的可推广性不好;(4)隐式马尔可夫模型(HMM)方法:通常使用单状态的HMM,或高斯混合模型(GMM),是比较流行的方法,效果比较好;(5)VQ聚类方法(如LBG,K-均值):效果比较好,算法复杂度也不高,和HMM方法配合起来更可以收到更好的效果;(6)多项式分类器方法:有较高的精度,但模型存储和计算量都比较大。
其中模板匹配法的要点是,在训练过程中从每个说话人的训练语句中提取相应的特征矢量来描述各个说话人的行为;在测试阶段,从说话人的测试语音信号中用同样的方法提取测试模板,主要有动态时间规整方法和矢量量化方法。在以下的描述中,以模板匹配法为例。
由于每个人的声纹都是唯一的,因此可以通过解析来电者的声音以获取来电者的声纹特征从而识别恶意来电者,来电者的声纹特征为携带具有特征字或词的言语信息的声波频谱。例如,终端可以在检测到来电者正在说话(产生语音流)时,记录并存储至少一段语音数据;然后解析至少一段语音数据以提取来电者的声纹特征。该语音数据可以为设定时长的语音数据,例如设定时长为10秒,从检测到来电者正在说话时开始录音,录音10秒。
获取通话过程中来电者的语音数据,从该语音数据中提取来电者的声纹特征可以通过如下过程实现:解析至少一段语音数据,提取语音数据中至少一组特征字或词;根据该特征字或词提取来电者的声纹特征。
特征字或词是预先设置好的,这是因为通常诈骗者、推销者、骚扰者都会在通话中说出特定的字或词,例如“你好”、“喂”、“请问”、“你是”、“先生”、“女士”、“吗”等等特征字或词,通过在语音数据中识别这些特征字或词,可以有效提高声纹识别的效率。例如,在语音片段中识别出了来电者说的句子“你好,请问你是唐伯虎先生吗”,终端提取出“你好”、“请问”、“你是”、“先生”、“吗”这五组特征字或词,然后根据这些特征字或词提取来电者的声纹特征。
获取的语音数据会存储或暂时存储在终端的存储介质中,当提取来电者的声纹特征成功后,或确认无法提取来电者的声纹特征后,终端可以删除语音片段,以节约终端的存储空间。
步骤S300:判断该来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将该来电号码存储到恶意号码黑名单中。
终端提取来电者的来电者的声纹特征后,判断来电者的声纹特征是否已经存储在恶意声纹数据库中。恶意声纹数据库存储有与电话号码相关联的预存声纹特征,这些预存声纹特征是服务器在之前的众多恶意来电中收集并存储的,并在收集后将预存声纹特征与对应的电话号码建立好映射关系。因此,恶意声纹数据库建立在服务器。
恶意声纹数据库可能不止一个,例如可以是多于一个的恶意声纹数据库,每个恶意声纹数据库对应各自的恶意类型。例如恶意类型多于种,可以分为诈骗类型、推销类型、骚扰类型等等,则恶意声纹数据库可以分成诈骗数据库、推销数据库、骚扰数据库。
因此,判断来电者的声纹特征是否已经存储在恶意声纹数据库中可以通过以下过程实现:从恶意声纹数据库中获取与来电号码关联的预存声纹特征,判断来电者的声纹特征是否与预存声纹特征匹配。
若来电者的声纹特征已经存储在恶意声纹数据库中,终端则警示用户并将来电号码存储到恶意号码黑名单中。警示用户可以是通过文字信息、语音或振动等方式进行警示,例如在来电界面发出“疑似诈骗”等文字信息,还可以加以语音和振动提醒以加强警示力度。
在一些实施例中,为了进一步保护电信安全,若来电者的声纹特征已经存储在恶意声纹数据库中,则警示用户并将来电号码存储到恶意号码黑名单中,并自动挂断电话。这种方式有利于避免那些辨别能力较弱的用户上当受骗,例如老人用户。进一步的,在一些实施例中,若已经存储在恶意声纹数据库中,则警示用户并将来电号码存储到恶意号码黑名单中,并经过预设的等候时长后自动挂断电话。在判断出来电者的声纹特征为恶意声纹特征开始计时,经过预设的等候时长(例如)后再自动挂断电话,可以有利于让用户通过这段等候时长确信该来电为恶意来电(同时通过文字信息、语音、振动警示用户),并给用户一定的缓冲时间,增强用户体验。
若按照恶意类型分成多个对应恶意类型的恶意声纹数据库,则终端将来电号码存储到恶意号码黑名单中时,将来电号码存储到与恶意声纹数据库对应的恶意类型相一致的恶意号码黑名单中。例如,如果来电号码已经存储在诈骗数据库中,则将来电号码存储到诈骗黑名单中。
终端还可以在存储好来电号码到恶意号码黑名单后,可以将来电号码与来电者的声纹特征建立好映射关系存储到恶意声纹数据库中。由于恶意声纹数据库是建立在服务器的,因此终端可以将来电号码上传到服务器进行存储。
当然,如果恶意来电者不再进行恶意电话行为,则可以将该恶意来电者的声纹特征从恶意声纹数据库中删除。例如,预设考察时长(例如2个月),如果在考察时长内该来电者的声纹特征不再被采集到,即相当于在考察时长内恶意来电者的来电不再被用户举报为恶意来电,则还可以删除恶意声纹数据库中的该来电者的声纹特征。
上述的恶意来电者声纹的自动识别方法,确定来电呼叫相对应的来电号码为正常来电;获取通话过程中来电者的语音数据,从语音数据中提取来电者的声纹特征;判断来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将来电号码存储到恶意号码黑名单中。这样,恶意来电者即使使用其他正常电话号码(未被标识为恶意电话号码)再次呼叫用户时也会被识别出来,及时的提示用户并将该电话号码列入黑名单,提高了安全性并节约了用户时间。
而且,通过收集恶意来电者的声纹特征,使得恶意来电者即使正常的日常通话都会被提示为恶意来电,可以有效遏制恶意来电者不再进行恶意电话行为。如果在一段预设的考察时长内恶意来电者的来电不再被用户举报为恶意来电,则还可以删除恶意声纹数据库的该来电者的声纹特征。
通过众多用户的参与而形成的恶意声纹数据库,除了在恶意来电时通过来电者的声纹特征来识别并提示用户外,还可以具有以下的扩展作用。例如,随着实名制办理sim卡的业务持续开展,后续“身份证-手机号码”的数据库(DB1)系统会日趋完善,待终端海量的“用户声纹-手机号码-是否有诈骗记录”的数据库(DB2)的完善,通过两个数据库的互相访问,后续可以做到如下数据查询平台:
1、诈骗记录查询平台:
当诈骗者通过电话有诈骗行为时,云端(服务器)通过数据库DB2的声纹特征可以查询其身份认证的手机号码,再通过数据库DB1查询确认到诈骗者的真正身份。
2、金融信用查询平台:
结合数据库DB1和DB2,可以整合出完整的信用评价平台,共同建立维护社会诚信的制度保障。
以下描述一种与上述恶意来电者声纹的自动识别方法相应的装置,该装置应用于移动终端。图2为一个实施例的恶意来电者声纹的自动取证装置模块图。一种恶意来电者声纹的自动取证装置,其包括:识别模块100、分析模块200和处理模块300。
识别模块100用于确定来电呼叫相对应的来电号码为正常来电;分析模块200用于获取通话过程中来电者的语音数据,从该语音数据中提取来电者的声纹特征;处理模块300判断该来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中。
识别模块100确定来电呼叫相对应的来电号码为恶意来电。
可以在本机或服务器预先建立好恶意号码黑名单,当终端收到来电时,识别模块100获取来电号码,判断来电号码是否已经存储在恶意号码黑名单中,若是则确定对应的来电为恶意来电。如果恶意号码黑名单存储在本机,则在本地进行识别;如果恶意号码黑名单存储在服务器,则在服务器进行识别,服务器将识别结果反馈给终端。
恶意号码黑名单既可以是由用户自行建立的黑名单,例如用户在接到某些恶意电话时将该电话号码添加到黑名单中,这个时候恶意号码黑名单可以存储在本地,用户还可以分享该恶意号码黑名单到服务器。当然,恶意号码黑名单也可以是由服务器建立的黑名单,例如服务器将众多用户举报的电话号码列入黑名单中,这个时候恶意号码黑名单可以存储在服务器,用户还可以主动到服务器请求获取该恶意号码黑名单。
恶意号码黑名单既可以是一个黑名单,也可以按照恶意类型分成多个恶意号码名单。例如恶意类型可以分为诈骗类型、推销类型、骚扰类型等等,则恶意号码黑名单可以分成诈骗黑名单、推销黑名单、骚扰黑名单。终端在识别到来电号码是属于哪个恶意号码黑名单中,然后进行相应的提示。例如识别来电号码是属于诈骗黑名单中的,则提示用户来电为诈骗来电。因此,当还对恶意类型进行细分时,识别模块100可以获取来电呼叫相对应的来电号码,确定来电号码为恶意来电,并确定其恶意类型。具体过程为:识别模块100获取来电呼叫相对应的来电号码后,将来电号码在多个恶意号码黑名单中进行比对,当某一恶意类型的恶意号码黑名单中存储有该电话号码时,则确定该电话号码为恶意来电号码,并确定其恶意类型;若没有恶意号码黑名单存储有该电话号码,则确定该电话号码为正常来电。
分析模块200获取通话过程中来电者的语音数据,从该语音数据中提取来电者的声纹特征。
由于每个人的声音器官,诸如声带、口腔、鼻腔、舌、齿、唇、肺等,在发音时呈现千姿百态。由于年龄、性格、语言习惯等多种原因,再加上发音容量大小不一,发音频率不尽相同,哪怕是微小的差异,也会导致这些器官发出的声音必然有着各自的特点,从而形成每个人独具一格的声纹(Voiceprint),可用语谱图观察出来。
声纹识别,就是从某段语音中识别出说话人的身份的过程。与指纹类似,每个人说话过程中蕴涵的语音特征和发音习惯等也几乎是唯一的。语音识别是共性识别,判定所说的内容(说的什么)。声纹识别是个性识别,判定说话人身份(是谁说的)。
声纹识别有两个关键问题,一是特征提取,二是模式识别。
特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。虽然目前大部分声纹识别系统用的都是声学层面的特征,但是表征一个人特点的特征应该是多层面的,包括:(1)与人类的发音机制的解剖学结构有关的声学特征(如频谱、倒频谱、共振峰、基音、反射系数等等)、鼻音、带深呼吸音、沙哑音、笑声等;(2)受社会经济状况、受教育水平、出生地等影响的语义、修辞、发音、言语习惯等;(3)个人特点或受父母影响的韵律、节奏、速度、语调、音量等特征。从利用数学方法可以建模的角度出发,声纹自动识别模型目前可以使用的特征包括:(1)声学特征(倒频谱);(2)词法特征(说话人相关的词n-gram,音素n-gram);(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道);等等。
对于模式识别,主要有这几大类方法:(1)模板匹配方法:利用动态时间弯折(DTW)以对准训练和测试特征序列,主要用于固定词组的应用(通常为文本相关任务);(2)最近邻方法:训练时保留所有特征矢量,识别时对每个矢量都找到训练矢量中最近的K个,据此进行识别,通常模型存储和相似计算的量都很大;(3)神经网络方法:有很多种形式,如多层感知、径向基函数(RBF)等,可以显式训练以区分说话人和其背景说话人,其训练量很大,且模型的可推广性不好;(4)隐式马尔可夫模型(HMM)方法:通常使用单状态的HMM,或高斯混合模型(GMM),是比较流行的方法,效果比较好;(5)VQ聚类方法(如LBG,K-均值):效果比较好,算法复杂度也不高,和HMM方法配合起来更可以收到更好的效果;(6)多项式分类器方法:有较高的精度,但模型存储和计算量都比较大。
其中模板匹配法的要点是,在训练过程中从每个说话人的训练语句中提取相应的特征矢量来描述各个说话人的行为;在测试阶段,从说话人的测试语音信号中用同样的方法提取测试模板,主要有动态时间规整方法和矢量量化方法。在以下的描述中,以模板匹配法为例。
由于每个人的声纹都是唯一的,因此分析模块200可以通过解析来电者的声音以获取来电者的声纹特征从而识别恶意来电者,来电者的声纹特征为携带具有特征字或词的言语信息的声波频谱。例如,终端可以在检测到来电者正在说话(产生语音流)时,记录并存储至少一段语音数据;然后分析模块200解析至少一段语音数据以提取来电者的声纹特征。该语音数据可以为设定时长的语音数据,例如设定时长为10秒,从检测到来电者正在说话时开始录音,录音10秒。
分析模块200获取通话过程中来电者的语音数据,从该语音数据中提取来电者的声纹特征可以通过如下过程实现:分析模块200解析至少一段语音数据,获取语音数据中至少一组特征字或词;根据该特征字或词获取来电者的声纹特征。
特征字或词是预先设置好的,这是因为通常诈骗者、推销者、骚扰者都会在通话中说出特定的字或词,例如“你好”、“喂”、“请问”、“你是”、“先生”、“女士”、“吗”等等特征字或词,通过在语音数据中识别这些特征字或词,可以有效提高声纹识别的效率。例如,在语音数据中识别出了来电者说的句子“你好,请问你是唐伯虎先生吗”,终端提取出“你好”、“请问”、“你是”、“先生”、“吗”这五组特征字或词,然后根据这些特征字或词提取来电者的声纹特征。
该装置还可以包括删除模块(图未示)。获取的语音数据会存储或暂时存储在终端的存储介质中,当提取来电者的声纹特征成功后,或确认无法提取来电者的声纹特征后,删除模块可以删除语音数据,以节约终端的存储空间。
处理模块300判断该来电者的声纹特征是否已经存储在恶意声纹数据库中,若没有存储则存储来电者的声纹特征到恶意声纹数据库中。
分析模块200提取来电者的来电者的声纹特征后,处理模块300判断来电者的声纹特征是否已经存储在恶意声纹数据库中。恶意声纹数据库存储有与电话号码相关联的预存声纹特征,这些预存声纹特征是服务器在之前的众多恶意来电中收集并存储的,并在收集后将预存声纹特征与对应的电话号码建立好映射关系。因此,恶意声纹数据库建立在服务器。
恶意声纹数据库可能不止一个,例如可以是多于一个的恶意声纹数据库,每个恶意声纹数据库对应各自的恶意类型。例如恶意类型多于种,可以分为诈骗类型、推销类型、骚扰类型等等,则恶意声纹数据库可以分成诈骗数据库、推销数据库、骚扰数据库。
因此,分析模块200判断来电者的声纹特征是否已经存储在恶意声纹数据库中可以通过以下过程实现:从恶意声纹数据库中获取与来电号码关联的预存声纹特征,判断来电者的声纹特征是否与预存声纹特征匹配。
若来电者的声纹特征已经存储在恶意声纹数据库中,处理模块300则警示用户并将来电号码存储到恶意号码黑名单中。警示用户可以是通过文字信息、语音或振动等方式进行警示,例如在来电界面发出“疑似诈骗”等文字信息,还可以加以语音和振动提醒以加强警示力度。
在一些实施例中,为了进一步保护电信安全,还可以包括保护模块(图未示)。若来电者的声纹特征已经存储在恶意声纹数据库中,则处理模块300警示用户并将来电号码存储到恶意号码黑名单中,保护模块自动挂断电话。这种方式有利于避免那些辨别能力较弱的用户上当受骗,例如老人用户。进一步的,在一些实施例中,若已经存储在恶意声纹数据库中,则处理模块300警示用户并将来电号码存储到恶意号码黑名单中,保护模块经过预设的等候时长后自动挂断电话。在判断出来电者的声纹特征为恶意声纹特征开始计时,保护模块经过预设的等候时长(例如)后再自动挂断电话,可以有利于让用户通过这段等候时长确信该来电为恶意来电(同时通过文字信息、语音、振动警示用户),并给用户一定的缓冲时间,增强用户体验。
若按照恶意类型分成多个对应恶意类型的恶意声纹数据库,则处理模块300将来电号码存储到恶意号码黑名单中时,将来电号码存储到与恶意声纹数据库对应的恶意类型相一致的恶意号码黑名单中。例如,如果来电号码已经存储在诈骗数据库中,则将来电号码存储到诈骗黑名单中。
处理模块300还可以在存储好来电号码到恶意号码黑名单后,可以将来电号码与来电者的声纹特征建立好映射关系存储到恶意声纹数据库中。由于恶意声纹数据库是建立在服务器的,因此处理模块300可以将来电号码上传到服务器进行存储。
当然,如果恶意来电者不再进行恶意电话行为,则删除模块可以将该恶意来电者的声纹特征从恶意声纹数据库中删除。例如,预设考察时长(例如2个月),如果在考察时长内该来电者的声纹特征不再被采集到,即相当于在考察时长内恶意来电者的来电不再被用户举报为恶意来电,则删除模块还可以删除恶意声纹数据库的该来电者的声纹特征。
上述的恶意来电者声纹的自动取证装置,识别模块确定来电呼叫相对应的来电号码为正常来电;分析模块获取通话过程中来电者的语音数据,从语音数据中提取来电者的声纹特征;处理模块判断来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将来电号码存储到恶意号码黑名单中。这样,恶意来电者即使使用其他正常电话号码(未被标识为恶意电话号码)再次呼叫用户时也会被识别出来,及时的提示用户并将该电话号码列入黑名单,提高了安全性并节约了用户时间。
而且,通过收集恶意来电者的声纹特征,使得恶意来电者即使正常的日常通话都会被提示为恶意来电,可以有效遏制恶意来电者不再进行恶意电话行为。如果在一段预设的考察时长内恶意来电者的来电不再被用户举报为恶意来电,则还可以删除恶意声纹数据库的该来电者的声纹特征。
本发明实施例还提供了移动终端,如图3所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point ofSales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:
图3示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图3,手机包括:射频(Radio Frequency,RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(wireless fidelity,WiFi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解,图3中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对手机的各个构成部件进行具体的介绍:
RF电路1510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1580处理;另外,将设计上行的数据发送给基站。通常,RF电路1510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路1510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器1520可用于存储软件程序以及模块,处理器1580通过运行存储在存储器1520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声纹播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1530可包括触控面板1531以及其他输入设备1532。触控面板1531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1531上或在触控面板1531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1580,并能接收处理器1580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1531。除了触控面板1531,输入单元1530还可以包括其他输入设备1532。具体地,其他输入设备1532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1540可包括显示面板1541,可选的,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1541。进一步的,触控面板1531可覆盖显示面板1541,当触控面板1531检测到在其上或附近的触摸操作后,传送给处理器1580以确定触摸事件的类型,随后处理器1580根据触摸事件的类型在显示面板1541上提供相应的视觉输出。虽然在图3中,触控面板1531与显示面板1541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1531与显示面板1541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1560、扬声器1561,传声器1562可提供用户与手机之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声纹信号输出;另一方面,传声器1562将收集的声纹信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出处理器1580处理后,经RF电路1510以发送给比如另一手机,或者将音频数据输出至存储器1520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图3示出了WiFi模块1570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1520内的软件程序和/或模块,以及调用存储在存储器1520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1580可包括一个或多个处理单元;优选的,处理器1580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1580中。
手机还包括给各个部件供电的电源1590(比如电池),优选的,电源可以通过电源管理系统与处理器1580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本发明实施例中,该终端所包括的处理器1580还具有以下功能:确定来电呼叫相对应的来电号码为正常来电;获取通话过程中来电者的语音数据,从语音数据中提取来电者的声纹特征;判断来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将来电号码存储到恶意号码黑名单中。也即处理器1580具备执行上述的任一实施例恶意来电者声纹的自动识别方法的功能,在此不再赘述。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种恶意来电者声纹的自动识别方法,其特征在于,包括如下步骤:
确定来电呼叫相对应的来电号码为正常来电;
获取通话过程中来电者的语音数据,从所述语音数据中提取来电者的声纹特征;
判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中。
2.根据权利要求1所述的恶意来电者声纹的自动识别方法,其特征在于,所述恶意声纹数据库多于一个,每个恶意声纹数据库对应各自的恶意类型,每个恶意声纹数据库存储有对应恶意类型的预存声纹特征。
3.根据权利要求2所述的恶意来电者声纹的自动识别方法,其特征在于,所述恶意号码黑名单多于一个,每个恶意号码黑名单对应各自的恶意类型。
4.根据权利要求3所述的恶意来电者声纹的自动识别方法,其特征在于,将所述来电号码存储到与所述恶意声纹数据库对应的恶意类型相一致的恶意号码黑名单中。
5.根据权利要求2所述的恶意来电者声纹的自动识别方法,其特征在于,所述恶意类型包括诈骗类型、推销类型、骚扰类型中的至少之一。
6.根据权利要求2所述的恶意来电者声纹的自动识别方法,其特征在于,所述预存声纹特征与电话号码相关联。
7.根据权利要求6所述的恶意来电者声纹的自动识别方法,其特征在于,所述判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中包括:
从所述恶意声纹数据库中获取与所述来电号码关联的预存声纹特征,判断所述来电者的声纹特征是否与所述预存声纹特征匹配。
8.根据权利要求6所述的恶意来电者声纹的自动识别方法,其特征在于,判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中,以及将所述来电号码与所述来电者的声纹特征建立好映射关系存储到所述恶意声纹数据库中。
9.一种恶意来电者声纹的自动识别装置,其特征在于,其包括:
识别模块,用于确定来电呼叫相对应的来电号码为正常来电;
分析模块,用于获取通话过程中来电者的语音数据,从所述语音数据中提取来电者的声纹特征;
处理模块,用于判断所述来电者的声纹特征是否已经存储在恶意声纹数据库中,若已经存储则警示用户并将所述来电号码存储到恶意号码黑名单中。
10.一种移动终端,其特征在于,其包括:
触敏显示器;
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~8任一项所述的恶意来电者声纹的自动识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610827253.5A CN106210239A (zh) | 2016-09-14 | 2016-09-14 | 恶意来电者声纹的自动识别方法、装置和移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610827253.5A CN106210239A (zh) | 2016-09-14 | 2016-09-14 | 恶意来电者声纹的自动识别方法、装置和移动终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106210239A true CN106210239A (zh) | 2016-12-07 |
Family
ID=58067163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610827253.5A Pending CN106210239A (zh) | 2016-09-14 | 2016-09-14 | 恶意来电者声纹的自动识别方法、装置和移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106210239A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN108234485A (zh) * | 2017-12-30 | 2018-06-29 | 广东世纪网通信设备股份有限公司 | 基于voip平台的诈骗声纹获取装置及利用该装置来拦截诈骗电话的方法、装置和系统 |
CN108848507A (zh) * | 2018-05-31 | 2018-11-20 | 厦门快商通信息技术有限公司 | 一种不良电信用户信息采集方法 |
CN109257479A (zh) * | 2017-07-14 | 2019-01-22 | 中兴通讯股份有限公司 | 移动终端的防干扰方法、装置及可读存储介质 |
CN109377983A (zh) * | 2018-10-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 一种基于语音交互的骚扰电话拦截方法及相关设备 |
CN109547621A (zh) * | 2018-12-11 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种信息提醒方法、装置、电子设备及存储介质 |
CN109819089A (zh) * | 2017-11-21 | 2019-05-28 | 中国移动通信集团广东有限公司 | 声纹提取的方法、核心网网元、电子设备和存储介质 |
CN109857773A (zh) * | 2018-12-21 | 2019-06-07 | 厦门市美亚柏科信息股份有限公司 | 一种自动分析服务号码的方法和装置 |
CN110010135A (zh) * | 2018-01-05 | 2019-07-12 | 北京搜狗科技发展有限公司 | 一种基于语音的身份识别方法、装置和电子设备 |
CN111429918A (zh) * | 2020-03-26 | 2020-07-17 | 云知声智能科技股份有限公司 | 一种基于声纹识别和意图分析的访电话诈骗方法和系统 |
CN111988461A (zh) * | 2020-06-29 | 2020-11-24 | 北京捷通华声科技股份有限公司 | 来电拦截方法及装置 |
CN112151070A (zh) * | 2019-06-26 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 一种语音检测的方法、装置及电子设备 |
CN113099040A (zh) * | 2021-04-02 | 2021-07-09 | 刘远 | 存储器、异常主叫防控方法、装置和设备 |
CN113726941A (zh) * | 2021-08-30 | 2021-11-30 | 平安普惠企业管理有限公司 | 基于人工智能的骚扰电话监控方法、装置、设备及介质 |
CN113763963A (zh) * | 2021-08-24 | 2021-12-07 | 南京龙垣信息科技有限公司 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
CN113905134A (zh) * | 2021-10-21 | 2022-01-07 | 中国联合网络通信集团有限公司 | 基于区块链的通讯录黑名单管理方法、系统、设备及介质 |
CN114189574A (zh) * | 2021-12-08 | 2022-03-15 | 北京声智科技有限公司 | 反诈骗预警过程中的呼叫转移识别方法、装置及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110072499A1 (en) * | 2009-09-18 | 2011-03-24 | Chung-Yu Lin | Method of identity authentication and fraudulent phone call verification that utilizes an identification code of a communication device and a dynamic password |
CN105306657A (zh) * | 2014-06-20 | 2016-02-03 | 中兴通讯股份有限公司 | 身份识别方法、装置及通讯终端 |
CN105872185A (zh) * | 2016-04-20 | 2016-08-17 | 乐视控股(北京)有限公司 | 信息提示方法、装置及系统 |
-
2016
- 2016-09-14 CN CN201610827253.5A patent/CN106210239A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110072499A1 (en) * | 2009-09-18 | 2011-03-24 | Chung-Yu Lin | Method of identity authentication and fraudulent phone call verification that utilizes an identification code of a communication device and a dynamic password |
CN105306657A (zh) * | 2014-06-20 | 2016-02-03 | 中兴通讯股份有限公司 | 身份识别方法、装置及通讯终端 |
CN105872185A (zh) * | 2016-04-20 | 2016-08-17 | 乐视控股(北京)有限公司 | 信息提示方法、装置及系统 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN109257479A (zh) * | 2017-07-14 | 2019-01-22 | 中兴通讯股份有限公司 | 移动终端的防干扰方法、装置及可读存储介质 |
CN109819089A (zh) * | 2017-11-21 | 2019-05-28 | 中国移动通信集团广东有限公司 | 声纹提取的方法、核心网网元、电子设备和存储介质 |
CN108234485B (zh) * | 2017-12-30 | 2020-09-01 | 广东世纪网通信设备股份有限公司 | 基于voip平台的诈骗声纹获取装置及利用该装置来拦截诈骗电话的方法、装置和系统 |
CN108234485A (zh) * | 2017-12-30 | 2018-06-29 | 广东世纪网通信设备股份有限公司 | 基于voip平台的诈骗声纹获取装置及利用该装置来拦截诈骗电话的方法、装置和系统 |
CN110010135B (zh) * | 2018-01-05 | 2024-05-07 | 北京搜狗科技发展有限公司 | 一种基于语音的身份识别方法、装置和电子设备 |
CN110010135A (zh) * | 2018-01-05 | 2019-07-12 | 北京搜狗科技发展有限公司 | 一种基于语音的身份识别方法、装置和电子设备 |
CN108848507A (zh) * | 2018-05-31 | 2018-11-20 | 厦门快商通信息技术有限公司 | 一种不良电信用户信息采集方法 |
CN109377983A (zh) * | 2018-10-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 一种基于语音交互的骚扰电话拦截方法及相关设备 |
CN109547621A (zh) * | 2018-12-11 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种信息提醒方法、装置、电子设备及存储介质 |
CN109857773B (zh) * | 2018-12-21 | 2022-03-01 | 厦门市美亚柏科信息股份有限公司 | 一种自动分析服务号码的方法和装置 |
CN109857773A (zh) * | 2018-12-21 | 2019-06-07 | 厦门市美亚柏科信息股份有限公司 | 一种自动分析服务号码的方法和装置 |
CN112151070A (zh) * | 2019-06-26 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 一种语音检测的方法、装置及电子设备 |
CN112151070B (zh) * | 2019-06-26 | 2023-05-05 | 杭州海康威视数字技术股份有限公司 | 一种语音检测的方法、装置及电子设备 |
CN111429918A (zh) * | 2020-03-26 | 2020-07-17 | 云知声智能科技股份有限公司 | 一种基于声纹识别和意图分析的访电话诈骗方法和系统 |
CN111988461A (zh) * | 2020-06-29 | 2020-11-24 | 北京捷通华声科技股份有限公司 | 来电拦截方法及装置 |
CN113099040A (zh) * | 2021-04-02 | 2021-07-09 | 刘远 | 存储器、异常主叫防控方法、装置和设备 |
CN113763963A (zh) * | 2021-08-24 | 2021-12-07 | 南京龙垣信息科技有限公司 | 电话卡冒用检测方法、系统、计算机设备及存储介质 |
CN113726941A (zh) * | 2021-08-30 | 2021-11-30 | 平安普惠企业管理有限公司 | 基于人工智能的骚扰电话监控方法、装置、设备及介质 |
CN113905134A (zh) * | 2021-10-21 | 2022-01-07 | 中国联合网络通信集团有限公司 | 基于区块链的通讯录黑名单管理方法、系统、设备及介质 |
CN114189574A (zh) * | 2021-12-08 | 2022-03-15 | 北京声智科技有限公司 | 反诈骗预警过程中的呼叫转移识别方法、装置及终端 |
CN114189574B (zh) * | 2021-12-08 | 2023-08-04 | 北京声智科技有限公司 | 反诈骗预警过程中的呼叫转移识别方法、装置、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106210239A (zh) | 恶意来电者声纹的自动识别方法、装置和移动终端 | |
CN105940407B (zh) | 用于评估音频口令的强度的系统和方法 | |
CN106341539A (zh) | 恶意来电者声纹的自动取证方法、装置和移动终端 | |
CN106201424B (zh) | 一种信息交互方法、装置及电子设备 | |
CN112464661B (zh) | 模型训练方法、语音对话检测方法及相关设备 | |
EP4064276A1 (en) | Method and device for speech recognition, terminal and storage medium | |
CN110853617B (zh) | 一种模型训练的方法、语种识别的方法、装置及设备 | |
CN108735209A (zh) | 唤醒词绑定方法、智能设备及存储介质 | |
US8521681B2 (en) | Apparatus and method for recognizing a context of an object | |
CN104834847B (zh) | 身份验证方法及装置 | |
CN110534099A (zh) | 语音唤醒处理方法、装置、存储介质及电子设备 | |
CN110211588A (zh) | 语音识别方法、装置及电子设备 | |
CN110570840B (zh) | 一种基于人工智能的智能设备唤醒方法和装置 | |
CN110890093A (zh) | 一种基于人工智能的智能设备唤醒方法和装置 | |
CN107506166A (zh) | 信息提示方法及装置、计算机装置及可读存储介质 | |
CN108962241B (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN110096611A (zh) | 一种歌曲推荐方法、移动终端及计算机可读存储介质 | |
CN110047481A (zh) | 用于语音识别的方法和装置 | |
CN107104994A (zh) | 语音识别方法、电子装置及语音识别系统 | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN110544468B (zh) | 应用唤醒方法、装置、存储介质及电子设备 | |
CN108694947A (zh) | 语音控制方法、装置、存储介质及电子设备 | |
CN109462482A (zh) | 声纹识别方法、装置、电子设备及计算机可读存储介质 | |
CN109545221A (zh) | 参数调整方法、移动终端及计算机可读存储介质 | |
CN110308886A (zh) | 提供与个性化任务相关联的声音命令服务的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20170725 Address after: 100102, 18 floor, building 2, Wangjing street, Beijing, Chaoyang District, 1801 Applicant after: BEIJING ANYUN SHIJI SCIENCE AND TECHNOLOGY CO., LTD. Address before: 100088 Beijing city Xicheng District xinjiekouwai Street 28, block D room 112 (Desheng Park) Applicant before: Beijing Qihu Technology Co., Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161207 |