CN114125153A - 通话的预警方法、装置、服务器、存储介质及产品 - Google Patents
通话的预警方法、装置、服务器、存储介质及产品 Download PDFInfo
- Publication number
- CN114125153A CN114125153A CN202111305193.8A CN202111305193A CN114125153A CN 114125153 A CN114125153 A CN 114125153A CN 202111305193 A CN202111305193 A CN 202111305193A CN 114125153 A CN114125153 A CN 114125153A
- Authority
- CN
- China
- Prior art keywords
- call
- hidden danger
- information
- early warning
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 230000006399 behavior Effects 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 15
- 230000010485 coping Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000010295 mobile communication Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000000556 factor analysis Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
- G06F16/636—Filtering based on additional data, e.g. user or group profiles by using biological or physiological data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42034—Calling party identification service
- H04M3/42042—Notifying the called party of information on the calling party
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42034—Calling party identification service
- H04M3/42059—Making use of the calling party identifier
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Technology Law (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种通话的预警方法、装置、服务器、存储介质及产品,属于移动通信技术领域。方法包括:若通话为目标类型的通话,获取通话的第一音频数据,第一音频数据包括通话的第一通话对象的音频数据,目标类型为存在隐患的通话类型,第一通话对象为造成隐患的通话对象;确定第一音频数据对应的第一语义信息和第一通话对象的第一声纹特征;基于第一语义信息和第一声纹特征,确定通话对应的隐患级别;基于隐患级别对应的预警措施信息,对通话进行预警。该方法由于先确定了通话的隐患级别,进而再基于该隐患级别对应的预警措施信息,对该通话进行预警,就能够实现对该通话的针对性预警,从而能够提高对造成隐患的通话进行预警的有效性。
Description
技术领域
本申请涉及移动通信技术领域,特别涉及一种通话的预警方法、装置、服务器、存储介质及产品。
背景技术
随着移动通信技术的快速发展,电话已经成为用户的生活必需品。电话给用户带来方便的同时,也给用户的生活带来了隐患。例如,一些人通过电话通信骗取用户的钱财,而由于用户缺乏防范意识,很容易造成财产的损失。因此,对这些通话造成的隐患进行预警十分重要。
相关技术中,是将不安全的电话号码标记后存在数据库中,使得不安全的电话号码来电后该电话号码会携带标记,以提醒接听的用户该电话号码为不安全的电话号码。由于用户在接听电话时,往往忽视来电的电话号码的标记,使得对电话号码进行标记并不能对用户起到有效的预警作用,进而使得该方法对通话造成的隐患进行预警的有效性较低。
发明内容
本申请实施例提供了一种通话的预警方法、装置、服务器、存储介质及产品,能够提高对造成隐患的通话进行预警的有效性。所述技术方案如下:
一方面,提供了一种通话的预警方法,所述方法包括:
若通话为目标类型的通话,获取所述通话的第一音频数据,所述第一音频数据包括所述通话的第一通话对象的音频数据,所述目标类型为存在隐患的通话类型,所述第一通话对象为造成隐患的通话对象;
确定所述第一音频数据对应的第一语义信息和所述第一通话对象的第一声纹特征;
基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别;
基于所述隐患级别对应的预警措施信息,对所述通话进行预警。
在一种可能的实现方式中,所述基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别,包括:
若所述第一声纹特征与目标声纹特征匹配,且所述第一语义信息与目标语义信息匹配,确定所述隐患级别为第一级别,所述目标声纹特征和所述目标语义信息分别为所述目标类型的通话所对应的声纹特征和语义信息;
若所述第一声纹特征与所述目标声纹特征不匹配,但所述第一语义信息与所述目标语义信息匹配,确定所述隐患级别为第二级别;
若所述第一声纹特征与所述目标声纹特征匹配,但所述第一语义信息与所述目标语义信息不匹配,确定所述隐患级别为第三级别。
在一种可能的实现方式中,所述基于所述隐患级别对应的预警措施信息,对所述通话进行预警,包括:
基于所述第一语义信息,确定所述通话的隐患类型;
获取所述隐患类型对应的行为信息和应对信息,所述行为信息用于表示制造隐患的过程,所述应对信息用于表示应对所述隐患的方式;
基于所述隐患级别,向所述通话的第二通话对象输出所述隐患类型、所述行为信息和所述应对信息。
在一种可能的实现方式中,所述基于所述隐患级别,向所述通话的第二通话对象输出所述隐患类型、所述行为信息和所述应对信息,包括:
若所述隐患级别为第一级别,则控制切断所述通话,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第二级别,则在所述通话结束后,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第三级别,则向所述第一终端发送预警信息,所述预警信息中包括所述隐患类型、所述行为信息和所述应对信息。
在一种可能的实现方式中,所述方法还包括:
获取所述通话的第二通话对象的行为意图;
若所述行为意图对所述第二通话对象造成隐患,向第二终端发送提示信息,所述第二终端为隐患事件的服务人员使用的终端,所述提示信息用于提示所述服务人员对所述第二通话对象进行劝阻。
在一种可能的实现方式中,所述方法还包括:
在确定所述通话的隐患类型后,将所述第一通话对象对应的电话号码存储到电话号码数据库中,所述电话号码数据库用于存储造成隐患的电话号码;
基于所述隐患类型,在所述电话号码数据库中对所述电话号码进行标记。
在一种可能的实现方式中,所述目标类型的通话的确定过程包括:
若所述第一通话对象对应的电话号码被标记为隐患电话号码,确定所述通话为目标类型的通话;或者,
若所述第一通话对象对应的电话号码不是实名制的电话号码,确定所述通话为目标类型的通话;或者,
获取所述通话的第二音频数据,确定所述第二音频数据对应的第二语义信息和所述第一通话对象的第一声纹特征,若所述第二语义信息和所述第一声纹特征中的至少一项满足预设条件,确定所述通话为目标类型的通话,所述预设条件为造成隐患的条件。
在一种可能的实现方式中,所述第一声纹特征是否满足预设条件的确定过程包括:
分别确定所述第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,所述第二声纹特征为造成隐患的对象的声纹特征;
确定多个相似度中的数值最大的目标数量个相似度;
若所述目标数量个相似度均大于预设阈值,确定所述第一声纹特征满足预设条件。
在一种可能的实现方式中,所述分别确定所述第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,包括:
对于每个第二声纹特征,基于所述第一声纹特征,对所述第二声纹特征进行向量近邻搜索,得到所述第一声纹特征与所述第二声纹特征之间的余弦距离;
对所述余弦距离进行归一化处理,得到所述相似度。
在一种可能的实现方式中,在获取所述通话的第一音频数据之前,所述方法还包括:
若所述通话的第一端和第二端之间的通话次数不大于预设次数;或者,若所述第一通话对象对应的电话号码不在所述通话的第二通话对象的联系人列表中,执行所述获取所述通话的第一音频数据的步骤。
在一种可能的实现方式中,所述第一声纹特征的确定过程包括:
将所述第一音频数据输入声纹识别模型,输出所述第一音频数据对应的第一特征向量,将所述第一特征向量确定为所述第一通话对象的第一声纹特征,所述声纹识别模型用于提取音频数据的第一特征向量。
另一方面,提供了一种通话的预警装置,所述装置包括:
第一获取模块,用于若通话为目标类型的通话,获取所述通话的第一音频数据,所述第一音频数据包括所述通话的第一通话对象的音频数据,所述目标类型为存在隐患的通话类型,所述第一通话对象为造成隐患的通话对象;
第一确定模块,用于确定所述第一音频数据对应的第一语义信息和所述第一通话对象的第一声纹特征;
第二确定模块,用于基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别;
预警模块,用于基于所述隐患级别对应的预警措施信息,对所述通话进行预警。
在一种可能的实现方式中,所述第二确定模块,用于:
若所述第一声纹特征与目标声纹特征匹配,且所述第一语义信息与目标语义信息匹配,确定所述隐患级别为第一级别,所述目标声纹特征和所述目标语义信息分别为所述目标类型的通话所对应的声纹特征和语义信息;
若所述第一声纹特征与所述目标声纹特征不匹配,但所述第一语义信息与所述目标语义信息匹配,确定所述隐患级别为第二级别;
若所述第一声纹特征与所述目标声纹特征匹配,但所述第一语义信息与所述目标语义信息不匹配,确定所述隐患级别为第三级别。
在一种可能的实现方式中,所述预警模块,包括:
第一确定单元,用于基于所述第一语义信息,确定所述通话的隐患类型;
第一获取单元,用于获取所述隐患类型对应的行为信息和应对信息,所述行为信息用于表示制造隐患的过程,所述应对信息用于表示应对所述隐患的方式;
输出单元,用于基于所述隐患级别,向所述通话的第二通话对象输出所述隐患类型、所述行为信息和所述应对信息。
在一种可能的实现方式中,所述输出单元,用于:
若所述隐患级别为第一级别,则控制切断所述通话,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第二级别,则在所述通话结束后,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第三级别,则向所述第一终端发送预警信息,所述预警信息中包括所述隐患类型、所述行为信息和所述应对信息。
在一种可能的实现方式中,所述装置还包括:
第二获取模块,用于获取所述通话的第二通话对象的行为意图;
发送模块,用于若所述行为意图对所述第二通话对象造成隐患,向第二终端发送提示信息,所述第二终端为隐患事件的服务人员使用的终端,所述提示信息用于提示所述服务人员对所述第二通话对象进行劝阻。
在一种可能的实现方式中,所述装置还包括:
存储模块,用于在确定所述通话的隐患类型后,将所述第一通话对象对应的电话号码存储到电话号码数据库中,所述电话号码数据库用于存储造成隐患的电话号码;
标记模块,用于基于所述隐患类型,在所述电话号码数据库中对所述电话号码进行标记。
在一种可能的实现方式中,所述第一获取模块,包括:
第二确定单元,用于若所述第一通话对象对应的电话号码被标记为隐患电话号码,确定所述通话为目标类型的通话;
第三确定单元,用于若所述第一通话对象对应的电话号码不是实名制的电话号码,确定所述通话为目标类型的通话;
第二获取单元,用于获取所述通话的第二音频数据,确定所述第二音频数据对应的第二语义信息和所述第一通话对象的第一声纹特征,若所述第二语义信息和所述第一声纹特征中的至少一项满足预设条件,确定所述通话为目标类型的通话,所述预设条件为造成隐患的条件。
在一种可能的实现方式中,所述第二获取单元,包括:
第一确定子单元,用于分别确定所述第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,所述第二声纹特征为造成隐患的对象的声纹特征;
第二确定子单元,用于确定多个相似度中的数值最大的目标数量个相似度;
第三确定子单元,用于若所述目标数量个相似度均大于预设阈值,确定所述第一声纹特征满足预设条件。
在一种可能的实现方式中,所述第一确定子单元,用于:
对于每个第二声纹特征,基于所述第一声纹特征,对所述第二声纹特征进行向量近邻搜索,得到所述第一声纹特征与所述第二声纹特征之间的余弦距离;
对所述余弦距离进行归一化处理,得到所述相似度。
在一种可能的实现方式中,所述装置还包括:
执行模块,用于若所述通话的第一端和第二端之间的通话次数不大于预设次数;或者,若所述第一通话对象对应的电话号码不在所述通话的第二通话对象的联系人列表中,执行所述获取所述通话的第一音频数据的步骤。
在一种可能的实现方式中,所述第一确定模块,用于:
将所述第一音频数据输入声纹识别模型,输出所述第一音频数据对应的第一特征向量,将所述第一特征向量确定为所述第一通话对象的第一声纹特征,所述声纹识别模型用于提取音频数据的第一特征向量。
另一方面,提供了一种服务器,所述服务器包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述至少一条指令由所述一个或多个处理器加载并执行以实现上述任一实现方式所述的通话的预警方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储至少一条指令,所述至少一条指令由处理器加载并执行,以实现上述任一实现方式所述的通话的预警方法所执行的操作。
另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条指令,所述至少一条指令由服务器加载并执行,以实现上述任一实现方式所述的通话的预警方法所执行的操作。
本申请实施例提供的技术方案的有益效果至少包括:
本申请实施例提供了一种通话的预警方法,该方法能够在通话存在隐患的情况下,基于该通话中造成隐患的通话对象的第一音频数据和第一声纹特征确定该通话的隐患级别;这样,由于先确定了通话的隐患级别,进而再基于该隐患级别对应的预警措施信息,对该通话进行预警,就能够实现对该通话的针对性预警,从而能够提高对造成隐患的通话进行预警的有效性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种目标类型的通话的确定方法的流程图;
图3是本申请实施例提供的一种通话的预警方法的流程图;
图4是本申请实施例提供的一种通话的预警装置的框图;
图5是本申请实施例提供的一种终端的框图;
图6是本申请实施例提供的一种服务器的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
本申请实施例提供了一种通话的预警方法的实施环境,参见图1,该实施环境包括终端10和服务器20。在一些实施例中,终端10为进行通话的设备;该终端10可以为通话的接听端和拨出端,为手机、座机和智能手表等能够通话的设备中的至少一种;且该终端10用于将当前通话的通话信息发送给服务器20。
在一些实施例中,服务器20为运营商或相关部门的服务器20,服务器20可以为一台服务器20、由多台服务器20组成的服务器集群、云服务器、云计算平台和虚拟化中心中的至少一种。服务器20用于获取当前通话的通话信息,且用于确定该通话是否为存在隐患的通话,在确定该通话为存在隐患的通话的情况下,对该通话进行预警。
本申请实施例提供了一种目标类型的通话的确定方法,参见图2,方法包括:
步骤201:服务器获取通话的第二音频数据。
其中,第二音频数据包括第二通话对象的音频数据和第一通话对象的音频数据,第一通话对象为造成隐患的通话对象,第二通话对象为被造成隐患的通话对象。
步骤202:服务器确定第二音频数据对应的第二语义信息和第一通话对象的第一声纹特征。
其中,第二语义信息的确定过程包括:服务器通过音频识别模块识别第二音频数据对应的文本信息;服务器通过语义理解模块中配置的自然语言处理库,对该文本信息进行分词,得到包括多个词的第二语义信息。
其中,第一声纹特征的确定过程包括:服务器将第一音频数据输入声纹识别模型,输出第一音频数据对应的第一特征向量,将第一特征向量确定为第一通话对象的第一声纹特征。其中,声纹识别模型用于提取音频数据的第一特征向量,第一音频数据包括第一通话对象的音频数据。
可选的,第一特征向量为i-vector(一种特征向量)向量;需要说明的是,传统的进行向量特征提取的联合因子分析建立声纹识别模型时主要基于由本征音空间矩阵定义的说话人空间和由本征信空间定义的信道空间这两个不同的空间。Dehak(代哈克)受联合因子分析理论的启发,从高斯混合模型均值超矢量中提取了一个更紧凑的矢量,称为i-vector向量,i代表身份的意思,i-vector向量相当于说话人的标识。i-vector向量采用一个空间来代替两个空间,这个新的空间可以成为全局差异空间,它既包含了说话者之间的声纹差异,又包含了信道间的差异。所以i-vector向量的建模过程在高斯混合模型中不严格区分说话者的影响和信道的影响。该建模的方法来源于Dehak的研究理论“JFA(Jointfactor analysis,联合因子分析)建模后的信道因子不仅包含了信道效应也夹杂着说话人的信息”。其中,i-vector向量是通过高斯超向量基于因子分析而得到的,基于单一信道的跨信道算法得到的i-vector向量的空间既包括说话人空间的信息也包括信道空间信息,相当于利用因子分析方法将音频数据从高维空间投影到低维。一般情况下i-vector向量的维度在400-600之间,该i-vector向量可以代表说话人的身份,具有较强的区分性,而且维度相对较低,可以大幅减少计算量,进而提高了获取第一声纹特征的效率。
步骤203:若第二语义信息和第一声纹特征中的至少一项满足预设条件,服务器确定通话为目标类型的通话。
其中,预设条件为造成隐患的条件,目标类型为存在隐患的通话类型。
第二语义信息是否满足预设条件的确定过程包括:服务器对比第二语义信息和预设的多个关键词,多个关键词为存在隐患的词;若第二语义信息中包括的关键词数量超过预设值,确定该第二语义信息满足预设条件。可选的,多个关键词为“上当了”、“有损失”、“我相信了”、“汇款了”、“转钱了”等。
在一种实现方式中,第一声纹特征是否满足预设条件的确定过程包括以下步骤(1)-(3):
(1)服务器分别确定第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,第二声纹特征为造成隐患的对象的声纹特征。
在一种实现方式中,服务器对于每个第二声纹特征,基于第一声纹特征,对第二声纹特征进行向量近邻搜索,得到第一声纹特征与第二声纹特征之间的余弦距离;服务器对余弦距离进行归一化处理,得到相似度。在一种实现方式中,服务器基于Faiss(一种索引工具)对第二声纹特征进行向量近邻搜索。
(2)服务器确定多个相似度中的数值最大的目标数量个相似度。
其中,目标数量可以根据需要进行设定并更改,在此不做具体限定。
(3)若目标数量个相似度均大于预设阈值,服务器确定第一声纹特征满足预设条件。
其中,预设阈值可以根据需要进行设置并更改,在此不做具体限制。在本申请实施例中,通过向量近邻搜索法来确定第一声纹特征与第二声纹特征之间的相似度,由于向量近邻搜索法思想简单、理论成熟,且训练复杂度较低,准确度较高,进而提高了确定第一声纹特征是否满足预设条件的效率。
本申请实施例提供了一种目标类型的通话的确定方法,该方法通过语义信息和声纹特征来确定通话是否为目标类型的通话,由于语义信息和声纹特征能分别用于表示是否为隐患的语义和是否为造成隐患的对象的声纹特征,这样,通过语义信息和声纹特征来确定通话是否为目标类型的通话,能够提高确定目标类型的通话的准确性。
本申请实施例提供了一种通话的预警方法,参见图3,方法包括:
步骤301:服务器获取当前通话的通话信息,基于该通话信息确定该通话是否为目标类型的通话。
在一些实施例中,通话的接听端将该通话的通话信息发送给服务器,且在该接听端接收到该通话的来电时就开始将该通话的通话信息发送给服务器。通话信息包括通话的接听端和拨出端的电话号码、电话号码的标记、通话过程中的音频数据等。其中,电话号码的标记包括位置标记、联系人标记、来电类型标记等,例如,可以分别为“**省**市”、“爸爸”、“快递送餐”、“骚扰电话”、“隐患电话号码”、“广告推销”等标记。在一些实施例中,通话的拨出端将该通话的通话信息发送给服务器,且在该拨号端拨打电话时就开始将该通话的通话信息发送给服务器。
在一种实现方式中,若第一通话对象对应的电话号码被标记为隐患电话号码,服务器确定该通话为目标类型的通话。
其中,第一通话对象为造成隐患的通话对象。由于电话号码的标记在来电时可直接显示,使得服务器能够直接获取该电话号码的标记,并基于该标记确定通话是否为目标类型的通话,进而提高了服务器确定通话为目标类型的通话的效率。
在另一种实现方式中,若第一通话对象对应的电话号码不是实名制的电话号码,服务器确定该通话为目标类型的通话。
需要说明的是,实名制的电话号码包括多种固定的电话号码格式;例如,手机号码为1开头的11位电话号码,座机号码为区号开头的12位电话号码,银行号码为952开头的5位电话号码。可选的,一些不是实名制的电话号码为00开头的虚拟电话号码,以952开头的8位的电话号码等。这样,通过电话号码的格式确定该通话是否为目标类型的通话,提高了服务器确定通话为目标类型的通话的效率。
在另一种实现方式中,服务器确定目标类型的通话通过步骤201-203来实现,在此不在赘述。需要说明的是,上述几种实现方式无执行的先后顺序,服务器可通过任一实现方式来确定目标类型的通话。
需要说明的是,若服务器确定通话是目标类型的通话,则执行步骤302;若服务器确定通话不是目标类型的通话,则结束该次预警。
步骤302:若通话为目标类型的通话,服务器获取通话的第一音频数据。
其中,第一音频数据包括通话的第一通话对象的音频数据,目标类型为存在隐患的通话类型,第一通话对象为造成隐患的通话对象。
在一种实现方式中,服务器在获取通话的第一音频数据之前,若通话的第一端和第二端之间的通话次数不大于预设次数,服务器执行获取通话的第一音频数据的步骤。
其中,第一端和第二端分别为通话的接听端和拨出端;预设次数可以根据需要进行设置并更改;可选的,预设次数为1次。在该实现方式中,由于造成隐患的第一通话对象不会频繁的对第二通话对象进行通话,这样,仅获取通话次数少的通话的第一音频数据,避免了对每个通话的第一音频数据进行获取造成的资源浪费。
在另一种实现方式中,服务器在获取通话的第一音频数据之前,若第一通话对象对应的电话号码不在通话的第二通话对象的联系人列表中,服务器执行获取通话的第一音频数据的步骤。
其中,联系人列表包括对电话号码进行命名的电话号码列表;例如,某一电话号码标记“爸爸”,则该电话号码在联系人列表中。在该实现方式中,由于联系人列表中存储的是认识的通话对象的电话号码,为第一通话对象的电话号码的概率较小;这样,仅获取电话号码不在联系人列表中的通话的第一音频数据,避免了对每个通话的第一音频数据进行获取造成的资源浪费。
步骤303:服务器确定第一音频数据对应的第一语义信息和第一通话对象的第一声纹特征。
需要说明的是,该步骤中的第一通话对象的第一声纹特征与步骤202确定的第一通话对象的第一声纹特征中相同,在该步骤中服务器可以直接获取步骤202中确定的第一声纹特征。该步骤中服务器确定第一音频数据对应的第一语义信息与步骤202中服务器确定第二音频数据对应的第二语义信息的过程相同,在此不在赘述。
步骤304:服务器基于第一语义信息和第一声纹特征,确定通话对应的隐患级别。
在该步骤中,若第一声纹特征与目标声纹特征匹配,且第一语义信息与目标语义信息匹配,服务器确定隐患级别为第一级别。若第一声纹特征与目标声纹特征不匹配,但第一语义信息与目标语义信息匹配,服务器确定隐患级别为第二级别。若第一声纹特征与目标声纹特征匹配,但第一语义信息与目标语义信息不匹配,服务器确定隐患级别为第三级别。
其中,目标声纹特征和目标语义信息分别为目标类型的通话所对应的声纹特征和语义信息。目标声纹特征包括事先存储的声纹数据库中的造成隐患的对象的声纹特征。在一种实现方式中,第一声纹特征与目标声纹特征是否匹配的确定过程与步骤203中第一声纹特征是否满足预设条件的确定过程相同,在一种实现方式中,若步骤203中服务器确定第一声纹特征满足预设条件,则确定第一声纹特征与目标声纹特征匹配。若步骤203中服务器确定第一声纹特征不满足预设条件,则确定第一声纹特征与目标声纹特征不匹配。
其中,目标语义信息包括事先存储的多个关键词;在一种实现方式中,第一语义信息与目标语义信息是否匹配的过程包括:服务器对比第一语义信息和预设的多个关键词,多个关键词为存在隐患的词;若第一语义信息中包括的关键词数量超过预设值,确定该第一语义信息与目标语义信息匹配。可选的,多个关键词为“上当了”、“有损失”、“我相信了”、“汇款了”、“转钱了”等。
在本申请实施例中,通过第一声纹特征和第一语义信息确定该通话的隐患级别,能够确定该通话将要对被造成隐患的通话对象的危险程度,进而便于基于该通话的隐患类型,对通话采取不同的预警措施,使得预警具有针对性和目的性,从而能够提高预警的有效性。
步骤305:服务器基于隐患级别对应的预警措施信息,对通话进行预警。
其中,预警措施信息包括服务器切断电话、拨打预警电话、发送预警信息等中的至少一项。该步骤包括以下步骤(1)-(3):
(1)服务器基于第一语义信息,确定通话的隐患类型。
其中,隐患类型包括低价购物隐患、办理信用卡隐患、刷卡消费隐患、引诱转账隐患等。可选的,服务器在第一语义信息中包括“信用卡”的情况下,确定通话的隐患类型为办理信用卡隐患。服务器在第一语义信息中包括“转账”的情况下,确定通话的隐患类型为引诱转账隐患。
在一些实施例中,服务器在确定通话的隐患类型后,将第一通话对象对应的电话号码存储到电话号码数据库中,电话号码数据库用于存储造成隐患的电话号码。服务器基于隐患类型,在电话号码数据库中对电话号码进行标记。这样,在该电话号码来电时,能够基于标记直接确定该电话号码对应的通话为目标类型的通话,且能够直接确定通话的隐患类型,进而能够对该通话进行有效的预警。
(2)服务器获取隐患类型对应的行为信息和应对信息,行为信息用于表示制造隐患的过程,应对信息用于表示应对隐患的方式。
在一种实现方式中,服务器事先获取多个隐患类型对应的行为信息和应对信息;并关联存储每个隐患类型和该隐患类型对应的行为信息和应对信息,进而服务器基于该隐患类型,可直接获取其对应的行为信息和应对信息。
可选的,对于隐患类型引诱转账隐患,其对应的行为信息包括为冒充银行的工作人员,以给银行卡升级为由,提供所谓的安全账户,引诱将资金汇入指定的账户等;其对应的应对信息包括挂断通话、将该通话的电话号码加入黑名单、举报该通话的电话号码等。
(3)服务器基于隐患级别,向通话的第二通话对象输出隐患类型、行为信息和应对信息。
该步骤包括以下几种实现方式:
A1:若隐患级别为第一级别,则服务器控制切断通话,与通话的第二通话对象使用的第一终端建立预警通话,服务器通过该预警通话向第二通话对象输出隐患类型、行为信息和应对信息。
需要说明的是,在服务器是运营商的服务器的情况下,则服务器直接控制切断通话。在服务器不是运营商的服务器的情况下,则服务器通过预警模块向运营商使用的第三终端发送警报信息,该警报信息用于提示运营商切断该通话。
其中,服务器通过外呼模块与第一终端建立预警通话;服务器控制切断通话后,则触发外呼模块自动向第二通话对象使用的第一终端拨打电话,并通过事先训练好的智能语音向第二通话对象输出隐患类型、行为信息和应对信息。在该实现方式中,由于隐患级别为第一级别,隐患级别较高,这样通过控制切断通话的预警措施,能够及时避免造成的隐患,且通过建立预警通话向第二通话对象输出隐患类型、行为信息和应对信息,使得第二通话对象能够及时预防隐患,进一步避免了造成隐患的情况,从而提高了预警的有效性。
A2:若隐患级别为第二级别,则在通话结束后,与通话的第二通话对象使用的第一终端建立预警通话,通过预警通话向第二通话对象输出隐患类型、行为信息和应对信息。
在该实现方式中,服务器接收到通话结束的信息后,即触发外呼模块自动向第二通话对象使用的第一终端拨打电话,并通过事先训练好的智能语音向第二通话对象输出隐患类型、行为信息和应对信息。在该实现方式中,由于隐患级别为第二级别,隐患级别也较高,这样在通话结束后,通过建立预警通话向第二通话对象输出隐患类型、行为信息和应对信息,使得第二通话对象能够及时预防隐患,避免了造成隐患的情况,从而提高了预警的有效性。
A3:若隐患级别为第三级别,则向第一终端发送预警信息,预警信息中包括隐患类型、行为信息和应对信息。
在一种实现方式中,服务器在确定隐患级别为第三级别后,即向第一终端发送预警信息。在另一种实现方式中,服务器在通话结束后,向第一终端发送预警信息。可选的,预警信息以短信的形式发送。在该实现方式中,由于隐患级别为第三级别,隐患级别较低,这样,仅通过向第一终端发送预警信息,避免了切断通话对第二通话对象带来的不便,且通过向第一终端发送预警信息,使得第二通话对象能够及时预防隐患,避免了造成隐患的情况,从而提高了预警的有效性。
步骤306:服务器获取通话的第二通话对象的行为意图;若行为意图对第二通话对象造成隐患,服务器向第二终端发送提示信息。
其中,第二终端为隐患事件的服务人员使用的终端,提示信息用于提示服务人员对第二通话对象进行劝阻。在一种实现方式中,服务人员通过第二终端与通话的第二通话对象使用的第一终端建立劝阻通话,进而便于服务人员对第二通话对象进行劝阻。
在一种实现方式中,服务器基于第二通话对象的第二语义信息确定第二通话对象的行为意图。例如,第二语义信息中包括“我相信你”、“我马上转账”等信息,则服务器确定该第二通话对象的行为意图为将要进行转账行为,即该行为意图为第二通话对象将被造成隐患。
在另一种实现方式中,服务器基于预警通话中第二服务对象的第三语义信息确定第二通话对象的行为意图。例如,第三语义信息中包括“我不相信你”、“不要打电话了”等信息,则服务器确定该第二通话对象的行为意图为相信第一通话对象,不相信该预警通话,即该行为意图为第二通话对象将被造成隐患。
在本申请实施例中,通过在第二通话对象的行为意图对第二通话对象造成隐患时,通过服务人员对该第二通话对象进行劝阻,进一步加强了对该通话的预警,能够有效避免对第二通话对象造成隐患,进而提高了对该通话进行预警的有效性。
本申请实施例提供了一种通话的预警方法,该方法能够在通话存在隐患的情况下,基于该通话中造成隐患的通话对象的第一音频数据和第一声纹特征确定该通话的隐患级别;这样,由于先确定了通话的隐患级别,进而再基于该隐患级别对应的预警措施信息,对该通话进行预警,就能够实现对该通话的针对性预警,从而能够提高对造成隐患的通话进行预警的有效性。
本申请实施例还提供了一种通话的预警装置,参见图4,装置包括:
第一获取模块401,用于若通话为目标类型的通话,获取通话的第一音频数据,第一音频数据包括通话的第一通话对象的音频数据,目标类型为存在隐患的通话类型,第一通话对象为造成隐患的通话对象;
第一确定模块402,用于确定第一音频数据对应的第一语义信息和第一通话对象的第一声纹特征;
第二确定模块403,用于基于第一语义信息和第一声纹特征,确定通话对应的隐患级别;
预警模块404,用于基于隐患级别对应的预警措施信息,对通话进行预警。
在一种可能的实现方式中,第二确定模块403,用于:
若第一声纹特征与目标声纹特征匹配,且第一语义信息与目标语义信息匹配,确定隐患级别为第一级别,目标声纹特征和目标语义信息分别为目标类型的通话所对应的声纹特征和语义信息;
若第一声纹特征与目标声纹特征不匹配,但第一语义信息与目标语义信息匹配,确定隐患级别为第二级别;
若第一声纹特征与目标声纹特征匹配,但第一语义信息与目标语义信息不匹配,确定隐患级别为第三级别。
在一种可能的实现方式中,预警模块404,包括:
第一确定单元,用于基于第一语义信息,确定通话的隐患类型;
第一获取单元,用于获取隐患类型对应的行为信息和应对信息,行为信息用于表示制造隐患的过程,应对信息用于表示应对隐患的方式;
输出单元,用于基于隐患级别,向通话的第二通话对象输出隐患类型、行为信息和应对信息。
在一种可能的实现方式中,输出单元,用于:
若隐患级别为第一级别,则控制切断通话,与通话的第二通话对象使用的第一终端建立预警通话,通过预警通话向第二通话对象输出隐患类型、行为信息和应对信息;
若隐患级别为第二级别,则在通话结束后,与通话的第二通话对象使用的第一终端建立预警通话,通过预警通话向第二通话对象输出隐患类型、行为信息和应对信息;
若隐患级别为第三级别,则向第一终端发送预警信息,预警信息中包括隐患类型、行为信息和应对信息。
在一种可能的实现方式中,装置还包括:
第二获取模块,用于获取通话的第二通话对象的行为意图;
发送模块,用于若行为意图对第二通话对象造成隐患,向第二终端发送提示信息,第二终端为隐患事件的服务人员使用的终端,提示信息用于提示服务人员对第二通话对象进行劝阻。
在一种可能的实现方式中,装置还包括:
存储模块,用于在确定通话的隐患类型后,将第一通话对象对应的电话号码存储到电话号码数据库中,电话号码数据库用于存储造成隐患的电话号码;
标记模块,用于基于隐患类型,在电话号码数据库中对电话号码进行标记。
在一种可能的实现方式中,第一获取模块401,包括:
第二确定单元,用于若第一通话对象对应的电话号码被标记为隐患电话号码,确定通话为目标类型的通话;
第三确定单元,用于若第一通话对象对应的电话号码不是实名制的电话号码,确定通话为目标类型的通话;
第二获取单元,用于获取通话的第二音频数据,确定第二音频数据对应的第二语义信息和第一通话对象的第一声纹特征,若第二语义信息和第一声纹特征中的至少一项满足预设条件,确定通话为目标类型的通话,预设条件为造成隐患的条件。
在一种可能的实现方式中,第二获取单元,包括:
第一确定子单元,用于分别确定第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,第二声纹特征为造成隐患的对象的声纹特征;
第二确定子单元,用于确定多个相似度中的数值最大的目标数量个相似度;
第三确定子单元,用于若目标数量个相似度均大于预设阈值,确定第一声纹特征满足预设条件。
在一种可能的实现方式中,第一确定子单元,用于:
对于每个第二声纹特征,基于第一声纹特征,对第二声纹特征进行向量近邻搜索,得到第一声纹特征与第二声纹特征之间的余弦距离;
对余弦距离进行归一化处理,得到相似度。
在一种可能的实现方式中,装置还包括:
执行模块,用于若通话的第一端和第二端之间的通话次数不大于预设次数;或者,若第一通话对象对应的电话号码不在通话的第二通话对象的联系人列表中,执行获取通话的第一音频数据的步骤。
在一种可能的实现方式中,第一确定模块402,用于:
将第一音频数据输入声纹识别模型,输出第一音频数据对应的第一特征向量,将第一特征向量确定为第一通话对象的第一声纹特征,声纹识别模型用于提取音频数据的第一特征向量。
图5示出了本申请一个示例性实施例提供的终端500的结构框图。该终端500可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端500包括有:处理器501和存储器502。
处理器501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的通话的预警方法。
在一些实施例中,终端500还可选包括有:外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地,外围设备包括:射频电路504、显示屏505、摄像头组件506、音频电路507、定位组件508和电源509中的至少一种。
外围设备接口503可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中,处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上;在一些其他实施例中,处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时,显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时,显示屏505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏505可以为一个,设置在终端500的前面板;在另一些实施例中,显示屏505可以为至少两个,分别设置在终端500的不同表面或呈折叠设计;在另一些实施例中,显示屏505可以是柔性显示屏,设置在终端500的弯曲表面上或折叠面上。甚至,显示屏505还可以设置成非矩形的不规则图形,也即异形屏。显示屏505可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件506用于采集图像或视频。可选地,摄像头组件506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器501进行处理,或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路507还可以包括耳机插孔。
定位组件508用于定位终端500的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件508可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源509用于为终端500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于:加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。
加速度传感器511可以检测以终端500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号,控制显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器512可以检测终端500的机体方向及转动角度,陀螺仪传感器512可以与加速度传感器511协同采集用户对终端500的3D动作。处理器501根据陀螺仪传感器512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器513可以设置在终端500的侧边框和/或显示屏505的下层。当压力传感器513设置在终端500的侧边框时,可以检测用户对终端500的握持信号,由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在显示屏505的下层时,由处理器501根据用户对显示屏505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器514用于采集用户的指纹,由处理器501根据指纹传感器514采集到的指纹识别用户的身份,或者,由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置在终端500的正面、背面或侧面。当终端500上设置有物理按键或厂商Logo时,指纹传感器514可以与物理按键或厂商Logo集成在一起。
光学传感器515用于采集环境光强度。在一个实施例中,处理器501可以根据光学传感器515采集的环境光强度,控制显示屏505的显示亮度。具体地,当环境光强度较高时,调高显示屏505的显示亮度;当环境光强度较低时,调低显示屏505的显示亮度。在另一个实施例中,处理器501还可以根据光学传感器515采集的环境光强度,动态调整摄像头组件506的拍摄参数。
接近传感器516,也称距离传感器,通常设置在终端500的前面板。接近传感器516用于采集用户与终端500的正面之间的距离。在一个实施例中,当接近传感器516检测到用户与终端500的正面之间的距离逐渐变小时,由处理器501控制显示屏505从亮屏状态切换为息屏状态;当接近传感器516检测到用户与终端500的正面之间的距离逐渐变大时,由处理器501控制显示屏505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图5中示出的结构并不构成对终端500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图6是本公开实施例提供的一种服务器的框图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)601和一个或一个以上的存储器602,其中,存储器602用于存储可执行指令,处理器601被配置为执行上述可执行指令,以实现上述各个方法实施例提供的通话的预警方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器602,上述指令可由服务器600的处理器601执行以完成上述业务请求的方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储至少一条指令,至少一条指令由处理器加载并执行,以实现上述任一实现方式的通话的预警方法所执行的操作。
本申请实施例还提供了一种计算机程序产品,计算机程序产品包括至少一条指令,至少一条指令由服务器加载并执行,以实现上述任一实现方式的通话的预警方法所执行的操作。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个服务器上执行,或者在位于一个地点的多个服务器上执行,又或者,在分布在多个地点且通过通信网络互连的多个服务器上执行,分布在多个地点且通过通信网络互连的多个服务器可以组成区块链系统。
本申请实施例提供了一种通话的预警方法,该方法能够在通话存在隐患的情况下,基于该通话中造成隐患的通话对象的第一音频数据和第一声纹特征确定该通话的隐患级别;这样,由于先确定了通话的隐患级别,进而再基于该隐患级别对应的预警措施信息,对该通话进行预警,就能够实现对该通话的针对性预警,从而能够提高对造成隐患的通话进行预警的有效性。
以上仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种通话的预警方法,其特征在于,所述方法包括:
若通话为目标类型的通话,获取所述通话的第一音频数据,所述第一音频数据包括所述通话的第一通话对象的音频数据,所述目标类型为存在隐患的通话类型,所述第一通话对象为造成隐患的通话对象;
确定所述第一音频数据对应的第一语义信息和所述第一通话对象的第一声纹特征;
基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别;
基于所述隐患级别对应的预警措施信息,对所述通话进行预警。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别,包括:
若所述第一声纹特征与目标声纹特征匹配,且所述第一语义信息与目标语义信息匹配,确定所述隐患级别为第一级别,所述目标声纹特征和所述目标语义信息分别为所述目标类型的通话所对应的声纹特征和语义信息;
若所述第一声纹特征与所述目标声纹特征不匹配,但所述第一语义信息与所述目标语义信息匹配,确定所述隐患级别为第二级别;
若所述第一声纹特征与所述目标声纹特征匹配,但所述第一语义信息与所述目标语义信息不匹配,确定所述隐患级别为第三级别。
3.根据权利要求1所述的方法,其特征在于,所述基于所述隐患级别对应的预警措施信息,对所述通话进行预警,包括:
基于所述第一语义信息,确定所述通话的隐患类型;
获取所述隐患类型对应的行为信息和应对信息,所述行为信息用于表示制造隐患的过程,所述应对信息用于表示应对所述隐患的方式;
基于所述隐患级别,向所述通话的第二通话对象输出所述隐患类型、所述行为信息和所述应对信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述隐患级别,向所述通话的第二通话对象输出所述隐患类型、所述行为信息和所述应对信息,包括:
若所述隐患级别为第一级别,则控制切断所述通话,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第二级别,则在所述通话结束后,与所述通话的第二通话对象使用的第一终端建立预警通话,通过所述预警通话向所述第二通话对象输出所述隐患类型、所述行为信息和所述应对信息;
若所述隐患级别为第三级别,则向所述第一终端发送预警信息,所述预警信息中包括所述隐患类型、所述行为信息和所述应对信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
获取所述通话的第二通话对象的行为意图;
若所述行为意图对所述第二通话对象造成隐患,向第二终端发送提示信息,所述第二终端为隐患事件的服务人员使用的终端,所述提示信息用于提示所述服务人员对所述第二通话对象进行劝阻。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在确定所述通话的隐患类型后,将所述第一通话对象对应的电话号码存储到电话号码数据库中,所述电话号码数据库用于存储造成隐患的电话号码;
基于所述隐患类型,在所述电话号码数据库中对所述电话号码进行标记。
7.根据权利要求1所述的方法,其特征在于,所述目标类型的通话的确定过程包括:
若所述第一通话对象对应的电话号码被标记为隐患电话号码,确定所述通话为目标类型的通话;或者,
若所述第一通话对象对应的电话号码不是实名制的电话号码,确定所述通话为目标类型的通话;或者
获取所述通话的第二音频数据,确定所述第二音频数据对应的第二语义信息和所述第一通话对象的第一声纹特征,若所述第二语义信息和所述第一声纹特征中的至少一项满足预设条件,确定所述通话为目标类型的通话,所述预设条件为造成隐患的条件。
8.根据权利要求7所述的方法,其特征在于,所述第一声纹特征是否满足预设条件的确定过程包括:
分别确定所述第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,所述第二声纹特征为造成隐患的对象的声纹特征;
确定多个相似度中的数值最大的目标数量个相似度;
若所述目标数量个相似度均大于预设阈值,确定所述第一声纹特征满足预设条件。
9.根据权利要求8所述的方法,其特征在于,所述分别确定所述第一声纹特征与声纹数据库中的多个第二声纹特征之间的相似度,包括:
对于每个第二声纹特征,基于所述第一声纹特征,对所述第二声纹特征进行向量近邻搜索,得到所述第一声纹特征与所述第二声纹特征之间的余弦距离;
对所述余弦距离进行归一化处理,得到所述相似度。
10.根据权利要求1所述的方法,其特征在于,在获取所述通话的第一音频数据之前,所述方法还包括:
若所述通话的第一端和第二端之间的通话次数不大于预设次数;或者,若所述第一通话对象对应的电话号码不在所述通话的第二通话对象的联系人列表中,执行所述获取所述通话的第一音频数据的步骤。
11.根据权利要求1-4任一项所述的方法,其特征在于,所述第一声纹特征的确定过程包括:
将所述第一音频数据输入声纹识别模型,输出所述第一音频数据对应的第一特征向量,将所述第一特征向量确定为所述第一通话对象的第一声纹特征,所述声纹识别模型用于提取音频数据的第一特征向量。
12.一种通话的预警装置,其特征在于,所述装置包括:
第一获取模块,用于若通话为目标类型的通话,获取所述通话的第一音频数据,所述第一音频数据包括所述通话的第一通话对象的音频数据,所述目标类型为存在隐患的通话类型,所述第一通话对象为造成隐患的通话对象;
第一确定模块,用于确定所述第一音频数据对应的第一语义信息和所述第一通话对象的第一声纹特征;
第二确定模块,用于基于所述第一语义信息和所述第一声纹特征,确定所述通话对应的隐患级别;
预警模块,用于基于所述隐患级别对应的预警措施信息,对所述通话进行预警。
13.一种服务器,其特征在于,所述服务器包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述至少一条指令由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求11任一项所述的通话的预警方法所执行的操作。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行,以实现如权利要求1至权利要求11任一项所述的通话的预警方法所执行的操作。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括至少一条指令,所述至少一条指令由服务器加载并执行,以实现如权利要求1至权利要求11任一项所述的通话的预警方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111305193.8A CN114125153A (zh) | 2021-11-05 | 2021-11-05 | 通话的预警方法、装置、服务器、存储介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111305193.8A CN114125153A (zh) | 2021-11-05 | 2021-11-05 | 通话的预警方法、装置、服务器、存储介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114125153A true CN114125153A (zh) | 2022-03-01 |
Family
ID=80380799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111305193.8A Pending CN114125153A (zh) | 2021-11-05 | 2021-11-05 | 通话的预警方法、装置、服务器、存储介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114125153A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105516989A (zh) * | 2015-11-27 | 2016-04-20 | 努比亚技术有限公司 | 一种识别不良通话的方法和装置 |
CN106657690A (zh) * | 2016-12-09 | 2017-05-10 | 北京奇虎科技有限公司 | 一种防止电话诈骗的方法、装置及移动终端 |
US20170134574A1 (en) * | 2014-06-18 | 2017-05-11 | Katia Sa | Method and system for filtering undesirable incoming telephone calls |
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN107360576A (zh) * | 2017-07-25 | 2017-11-17 | 上海思依暄机器人科技股份有限公司 | 一种识别诈骗信息的方法及系统、电子设备、服务器 |
CN110636505A (zh) * | 2019-10-24 | 2019-12-31 | 王恩惠 | 一种保护账号安全的方法及系统 |
CN112802482A (zh) * | 2021-04-15 | 2021-05-14 | 北京远鉴信息技术有限公司 | 一种声纹串并的识别方法、单兵系统及存储介质 |
-
2021
- 2021-11-05 CN CN202111305193.8A patent/CN114125153A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170134574A1 (en) * | 2014-06-18 | 2017-05-11 | Katia Sa | Method and system for filtering undesirable incoming telephone calls |
CN105516989A (zh) * | 2015-11-27 | 2016-04-20 | 努比亚技术有限公司 | 一种识别不良通话的方法和装置 |
CN106657690A (zh) * | 2016-12-09 | 2017-05-10 | 北京奇虎科技有限公司 | 一种防止电话诈骗的方法、装置及移动终端 |
CN107197463A (zh) * | 2017-07-10 | 2017-09-22 | 北京亿赛通网络安全技术有限公司 | 一种电话诈骗的检测方法、存储介质及电子设备 |
CN107360576A (zh) * | 2017-07-25 | 2017-11-17 | 上海思依暄机器人科技股份有限公司 | 一种识别诈骗信息的方法及系统、电子设备、服务器 |
CN110636505A (zh) * | 2019-10-24 | 2019-12-31 | 王恩惠 | 一种保护账号安全的方法及系统 |
CN112802482A (zh) * | 2021-04-15 | 2021-05-14 | 北京远鉴信息技术有限公司 | 一种声纹串并的识别方法、单兵系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111462742B (zh) | 基于语音的文本显示方法、装置、电子设备及存储介质 | |
US11386586B2 (en) | Method and electronic device for adding virtual item | |
CN111062824B (zh) | 群组成员处理方法、装置、计算机设备及存储介质 | |
CN111027490A (zh) | 人脸属性识别方法及装置、存储介质 | |
CN111343346B (zh) | 基于人机对话的来电代接方法、装置、存储介质及设备 | |
CN111613213A (zh) | 音频分类的方法、装置、设备以及存储介质 | |
CN111931712B (zh) | 人脸识别方法、装置、抓拍机及系统 | |
CN111862972B (zh) | 语音交互服务方法、装置、设备及存储介质 | |
CN114547429A (zh) | 数据推荐方法、装置、服务器及存储介质 | |
CN114201738A (zh) | 解锁方法及电子设备 | |
CN110837557A (zh) | 摘要生成方法、装置、设备及介质 | |
CN114093360A (zh) | 呼叫方法、装置、电子设备及存储介质 | |
CN114125153A (zh) | 通话的预警方法、装置、服务器、存储介质及产品 | |
CN114595019A (zh) | 应用程序的主题设置方法、装置、设备及存储介质 | |
CN114222302A (zh) | 针对异常通话的呼叫方法、装置、电子设备及存储介质 | |
CN113408809A (zh) | 汽车的设计方案评价方法、装置及计算机存储介质 | |
CN112866470A (zh) | 来电处理方法、装置、电子设备及介质 | |
CN110798572A (zh) | 点亮屏幕的方法、装置、电子设备及介质 | |
CN111898488A (zh) | 视频图像的识别方法、装置、终端及存储介质 | |
CN111858983A (zh) | 图片类别的确定方法、装置、电子设备及存储介质 | |
CN114189574B (zh) | 反诈骗预警过程中的呼叫转移识别方法、装置、终端及存储介质 | |
CN111444289A (zh) | 关联关系建立方法 | |
CN111369995A (zh) | 通话的方法、装置、电子设备及介质 | |
CN112990424A (zh) | 神经网络模型训练的方法和装置 | |
CN112749583A (zh) | 人脸图像分组方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |