CN107343077B - 识别恶意电话及建立识别模型的方法、装置、设备 - Google Patents
识别恶意电话及建立识别模型的方法、装置、设备 Download PDFInfo
- Publication number
- CN107343077B CN107343077B CN201610278825.9A CN201610278825A CN107343077B CN 107343077 B CN107343077 B CN 107343077B CN 201610278825 A CN201610278825 A CN 201610278825A CN 107343077 B CN107343077 B CN 107343077B
- Authority
- CN
- China
- Prior art keywords
- sample
- call
- call event
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012549 training Methods 0.000 claims description 213
- 230000006399 behavior Effects 0.000 claims description 37
- 238000004891 communication Methods 0.000 claims description 25
- 239000000126 substance Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/66—Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
- H04M1/663—Preventing unauthorised calls to a telephone set
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种识别恶意电话及建立识别模型的方法、装置、设备,其中所述识别恶意电话的方法包括:获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;输出所述第一通话事件的识别结果。
Description
技术领域
本发明涉及通信领域,尤其涉及一种识别恶意电话及建立识别模型的方法、装置、设备。
背景技术
通讯技术的高速发展,给人们的工作和日常生活带来了很多的便利,但随之也带来了很多的烦恼,在日常生活中,越来越多的不法分子借助于手机或固定电话等通讯工具进行恶意行为,例如,对他人进行电话诈骗,给他人带来了经济损失等;因此,当用户与陌生电话进行通话时,需要识别陌生电话是否为恶意电话,从而避免用户的经济受到损失。
现有技术中恶意电话的识别方法主要是利用黑名单技术,其流程主要包括:获取当前通话的电话号码,判断该电话号码是否存在预设的黑名单,如果存在,则确定当前通话为恶意电话。但是,随着号码隐藏服务及网络改号技术的出现,应用上述方法进行识别恶意电话的准确性降低。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的至少一个问题而提供了一种识别恶意电话及建立识别模型的方法、装置、设备,能够大幅提高识别准确率,且响应速度更快。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种识别恶意电话的方法,所述方法包括:
获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;
获取所述识别模型识别出的所述第一通话事件的识别结果;
输出所述第一通话事件的识别结果。
第二方面,本发明实施例提供一种识别恶意电话的方法,所述方法包括:
确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;
获取样本的特征参数,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;
判断所述训练结果是否符合所述样本的样本类型;
如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
第三方面,本发明实施例提供了一种识别恶意电话装置,所述装置包括:第一获取单元、识别单元、第二获取单元、输出单元,其中,
所述第一获取单元,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
所述识别单元,用于根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;
所述第二获取单元,用于获取所述识别模型识别出的所述第一通话事件的识别结果;
所述第一输出单元,用于输出所述第一通话事件的识别结果。
第四方面,本发明实施例提供了一种建立恶意模型装置,所述装置包括:第二确定单元、第三获取单元、训练单元、判断单元、调整单元、第二输出单元,其中,
所述第二确定单元,用于确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;
所述第三获取单元,用于获取样本的特征参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
所述训练单元,用于根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;
所述判断单元,用于判断所述训练结果是否符合所述样本的样本类型;
所述调整单元,用于在所述训练结果不满足所述样本的样本类型时,调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型;
所述第二输出单元,用于将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
第五方面,本发明实施例提供了一种识别恶意电话的设备,所述设备包括:第一处理器和第一外部通信接口,或者,所述设备包括第一处理器和显示屏;,其中,
所述第一处理器,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;通过所述第一外部通信接口输出所述第一通话事件的识别结果,或者通过所述显示屏显示所述第一通话事件的识别结果。
第六方面,本发明实施例提供了一种建立恶意模型的设备,所述设备包括:第二处理器和第二外部通信接口,其中,
所述第二处理器,用于确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;获取样本的特征参数,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,通过所述第二外部通信接口将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
本发明实施例提供了一种识别恶意电话及建立识别模型的方法、装置、设备,其中,识别恶意电话的方法包括:获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;输出所述第一通话事件的识别结果;如此采用描述通话语音特征的参数作为识别标准,由于恶意用户在进行推销和诈骗等恶意通话时的语气和用语不会随意改变,这样就能够准确识别出恶意的通话事件,并输出识别结果来提醒用户免受诈骗,可以极大的减少用户的经济损失;另外,所述识别模型的建立需要不断地对训练模型进行训练,根据训练结果不断调整训练模型的模型参数,使最终的训练模型对样本识别的准召率达到最优,如此提升识别恶意电话的准确性。
附图说明
图1为本发明实施例所涉及一种实施环境的示意图;
图2为本发明实施例一识别恶意电话的方法的实现流程示意图;
图3A为本发明实施例三识别恶意电话的方法的第一种实现流程示意图;
图3B为本发明实施例三识别恶意电话的方法的第二种实现流程示意图;
图3C为本发明实施例三识别恶意电话的方法的第三种实现流程示意图;
图3D为本发明实施例三识别恶意电话的方法的第四中实现流程示意图;
图4为本发明实施例四识别恶意电话的装置的组成结构示意图;
图5为本发明实施例五建立恶意模型的装置的组成结构示意图;
图6为本发明实施例六识别恶意电话的设备的硬件组成结构示意图;
图7为本发明实施例七建立恶意模型的设备的硬件组成结构示意图。
具体实施方式
下面介绍一下本发明实施例所涉及一种实施环境的示意图,如图1所示,该实施环境包括:第一终端11、第二终端12和设置在网络侧的服务器13;第一终端11和第二终端12之间通过网络中设置的服务器进行信息交互,第一终端11和第二终端12之间的信息交互中的一种可以是语音通话。本发明实施例涉及的是终端之间的语音通话场景。
第一终端11或第二终端12可以为移动终端,比如手机、平板电脑等;也可以是固定终端如固定电话等。第一终端11和第二终端12中都运行有具有通话功能的客户端,该客户端还可以记录一段时间内其所在终端的通话行为如双方的通话号码、通话时间等,也可以缓存当前通话的通话语音信息等;如此,第一终端11和第二终端12就可以确定以下实施例中两用户之间通话事件并提取该通话事件的特征参数;这里,该客户端可以是应用程序客户端,也可以是网页客户端。在本发明实施例中,通话的类型包括但不限于:语音通话、视频通话中的任意一种。
服务器13由运营商提供,可以是一台服务器,也可以是多台服务器组成的服务器集群,或者是一个云计算服务中心。服务器13用于承载用于控制用户通话的控制信令,例如呼叫、应答和拒接等信令,并转发第一终端11和第二终端12之间的通话语音信息;如此,第一终端11和第二终端12就可以确定以下实施例中两用户之间通话事件并提取该通话事件的特征参数。第一终端11和第二终端12通过与服务器13之间建立的通信连接,完成第一终端11和第二终端12之间的通话交互。该通信连接通常为TCP/IP(Transmission ControlProtocol/Internet Protocol,传输控制协议/网络互连协议)连接。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
实施例一
为了解决背景技术中存在的问题,本发明实施例提供一种识别恶意电话的方法,应用于计算设备,该识别恶意电话的方法所实现的功能可以通过计算设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算设备至少包括处理器和存储介质。这里,所述计算设备可以是任何具有信息处理能够的计算设备,例如可以是终端、服务器,其中终端可以是平板电脑、手机等具有通话能力的计算设备。
图2为本发明实施例一识别恶意电话的方法的实现流程示意图,如图2所示,该识别恶意电话的方法包括:
步骤S101、获取第一通话事件的特征参数。
这里,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;由于恶意用户进行通话的目的一般都是进行诈骗和推销,故语气和语调通常都很温和,经常用语也很类似,故可以对通话语音进行分析,获得通话语音的特征参数,由描述通话语音特征的参数来进行恶意电话的识别。
在本发明的其他实施例中,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述第一用户的通话行为特征的第二特征参数。
这里,获取第一通话事件的特征参数有以下两种实现方式:
第一种实现方式是:确定第一通话事件;此时,对应地,所述获取第一通话事件的特征参数包括:提取所述第一通话事件的特征参数。这里,所述计算设备可以实现为第一终端11、第二终端12或服务器13,第一终端11与第二终端12通过服务器13进行通话时,第一终端11、第二终端12或服务器13都可以确定第一用户与第二用户之间的第一通话事件,并提取所述第一通话事件的特征参数。
第二种实现方式是:计算设备实现为第一终端,此时,所述计算设备获取第一通话事件的特征参数包括:第一终端接收服务器发送的所述第一通话事件的特征参数,所述第一终端对应第一用户。这里,所述计算设备也可以是第二终端,如果所述计算设备为第一终端或第二终端,为了减轻计算设备的负载,可以在服务器13侧提取所述第一通话事件的特征参数,然后,将所述第一通话事件的特征参数发送给计算设备。
步骤S102、根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数。
这里,所述第一通话事件的特征参数为所述识别模型的输入,所述识别结果为所述识别模型的输出。所述识别模型可以包括各种分类算法的模型,其中所述分类算法包括逻辑回归算法(LR)、支持向量机(SVM)和梯度提升决策树(Gradient Boosting DecisionTree,GBDT)等等。
步骤S103、获取所述识别模型识别出的所述第一通话事件的识别结果。
步骤S104、输出所述第一通话事件的识别结果。
这里,第一终端对应第一用户,第二终端对应第二用户,当计算设备为第一终端或第二终端时,所述输出所述第一通话事件的识别结果可以包括:在所述计算设备的显示界面上显示所述第一通话事件的识别结果;当所述计算设备为服务器时,所述输出所述第一通话事件的识别结果可以包括:所述服务器将所述第一通话事件的识别结果通过通信装置(外部通信接口)发送给第一终端和第二终端。
本发明实施例中,采用描述通话语音特征的参数作为识别标准,由于恶意用户在进行推销和诈骗等恶意通话时的语气和用语不会随意改变,这样就能够准确识别出恶意的通话事件,并输出识别结果来提醒用户免受诈骗,可以极大的减少用户的经济损失。
实施例二
基于前述的实施例,本发明实施例提供一种基于引入机器学习技术而形成一种识别模型,这里,机器学习是指依托概率论,统计学,神经传播等理论,使计算机能够模拟人类的学习行为,以获取新的知识或者技能,重新组织已有知识结构使之不断改善自身的性能。在形成识别模型的初期,需要人工挑选尽可能多的正常通话事件和恶意通话事件作为正负样本供机器学习模型训练。本实施例基于机器学习模型的识别恶意电话,识别逻辑非常复杂,恶意用户无法通过简单的调整通话号码等方式进行探测破解,另外由于模型自身具有进化学习的功能,即使恶意用户变更通话模式,通过简单的重新进行模型训练,即可以识别新的恶意通话模式并进行训练,使恶意用户始终难以绕过识别策略。
机器学习技术在识别恶意电话中的应用可以自由的分享和传播,因为机器学习识别的原理复杂且可以自我进化,不针对特定某种通话模式,因此甚至对恶意用户一样可以公开基于机器学习模型的识别恶意电话的方法。基于前述的实施例,本发明实施例提供一种建立识别模型的方法,应用于计算设备,该建立识别模型的方法所实现的功能可以通过计算设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算设备至少包括处理器和存储介质;所述计算设备可以是任何具有信息处理能够的计算设备,例如可以是终端、服务器,其中终端可以是平板电脑、手机等具有通话能力的计算设备。该建立识别模型的方法包括:
步骤S201、确定所述样本的样本类型。
这里,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本。所述样本类型可以靠人工回访的方式进行确定,示例地,通过统计发现某个用户在预设时间段内拨打陌生电话的个数超过一定阈值,则人工拨打该用户的各对端用户进行回访,确认两用户之间的通话事件是否为属于恶意电话,如果属于恶意电话则将通话事件确定为负样本,如果不属于恶意电话则将通话事件确定为正样本。
这里,正负样本的确定纯靠人工存在样本规模有限且成本高的问题,故本发明实施例还可以采用程序自动化抽取正样本和负样本。正样本的确定可以采用基于规则的确定方式和基于统计的确定方式相结合的方式来确定,基于规则的识别方式用于对大规模的通话事件作为样本做粗略地筛选,其中基于规则的识别方式中,可以预设一定的规则对样本粗略筛选之后,再通过基于统计的识别方式进行筛选,例如选出被标记为恶意电话的次数、和陌生电话的通话次数超过一定阈值(该阈值是统计得出的,因此该筛选方式称为基于统计的识别方式)的用户,然后使用交叉过滤的方法来对样本进行清洗,最终得到正样本和负样本,其中正常通话和恶意通话会存在一定的比例,这个比例即为配置比例,本实施例中得到的正样本和负样本要符合该配置比例。
步骤S202、获取样本的特征参数。
这里,所述特征参数包括用于描述通话语音特征的参数。所述获取样本的特征参数包括:获取样本的通话语音信息;从所述样本的通话语音信息中提取所述特征参数,所述特征参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个。
示例地,获取通话语音的波形特征参数包括:从所述样本的通话语音信息中提取通话语音的波形,所述波形包括时域波形或频域波形;提取所述波形的波形特征参数,所述波形特征参数包括波峰幅度值、波谷幅度值、波形幅度平均值、波峰位置和波谷位置中的至少一个。
示例地,获取通话语音对应的文本中第一关键字的个数或概率包括:对所述样本的通话语音信息进行语音识别,获得通话语音对应的文本;提取所述文本中的文本关键字;比较所述文本关键字与预设的第一关键字,确定所述文本关键字中所述第一关键字的个数或概率。恶意用户进行通话的目的一般都是进行诈骗和推销,故可以统计出诈骗和推销时经常用到的字作为第一关键字如“钱”、“中奖”、“买”、“银行”、“产品”等。
在本发明的其他实施例中,所述用于描述通话语音特征的参数可以记为第一特征参数,所述特征参数还包括用于描述通话行为特征的第二特征参数。这里,可以先判断本样本中通话双方中的可疑用户,如采集所述通话双方的两个用户在第一预设时间段内的第一通话行为;并根据所述两个用户在第一预设时间段内的第一通话行为,确定所述通话双方中的可疑用户;示例地,由于恶意用户通常都会频繁地与陌生电话通话,故可以统计在一天时间内通话双方与陌生电话的通话次数,将与陌生电话的通话次数多的用户为可疑用户。
这里,所述第二特征参数可以是描述非可疑用户的通话行为特征的参数,包括:在第二预设时间段内,与标记为恶意用户的通话次数和通话平均时长、与陌生用户的通话次数、与海外用户的通话次数中的至少一个。所述第二特征参数也可以是描述可疑用户的通话行为特征的参数,包括:在第二预设时间段内,与标记为恶意用户的通话次数和通话平均时长、与陌生用户的通话次数和通话平均时长、与海外用户的通话次数、被标记为恶意用户的次数等等中的至少一个。
示例地,如表1所示为用于训练识别模型的训练集中的一种:
表1
表1中所示的通话行为特征表项下的“与标记为恶意用户的通话次数”“与标记为恶意用户的通话平均时长”“与海外用户的通话次数”“与陌生用户的通话次数”“被标记情况”即为本实施例中所述的第二特征参数的示例;各参数的参数值都是在预设时间段内的统计结果,该预设时间段可以是本次通话事件开始之前的一天。表1中所示的语音特征表项下的“时域波形参数”“频域波形参数”“通话语音对应的文本中第一关键字的个数”等即为本实施例中所述本次通话事件的第一特征参数;这里,所述时域波形参数如上所述可以包括很多种参数(如波峰幅度值、波谷幅度值、波形幅度平均值、波峰位置和波谷位置等),这些参数可以形成参数向量如“向量1”、“向量2”、“向量3”等;频域波形参数如上所述也可以包括很多种参数,这些参数可以形成参数向量如“向量4”、“向量5”、“向量6”等。表1中所示的是否为恶意通话表项中表示本次通话事件是否为恶意电话,如果为“是”则表明该样本为正样本,如果为“否”则表明该样本为负样本,如表1中所示,所述样本1为正样本,所述样本2和样本3为负样本。
步骤S203、根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数。
这里,所述训练模型可以包括各种分类算法的模型,其中所述分类算法包括逻辑回归算法、支持向量机和梯度提升决策树等等。
步骤S204、判断所述训练结果是否符合所述样本的样本类型。
步骤S205、如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
这里,所述训练模型可以有多个,如时域波形训练模型、频域波形训练模型、通话行为训练模型等,可以将所述样本中的时域波形参数作为时域波形训练模型的输入,将频域波形参数作为频域波形训练模型的输入,将通话行为特征作为通话行为训练模型的输入等,得到各个训练模型的训练结果,只要各个训练模型的训练结果都满足所述样本的样本类型,则可以将这些训练模型作为预设的识别模型输出。
本发明实施例中,不管采用何种训练模型,在开始训练之时,该训练模型的输入包括上述的特征参数,将各个样本的特征参数作为训练模型的输入,就可以从所述训练模型获得各个训练结果。
如果训练模型根据各个样本的特征参数得出的各个训练结果都满足该样本的样本类型,即正样本的特征参数输入训练模型后,得出的训练结果表明该特征参数对应的样本为正样本,负样本的特征参数输入训练模型后,得出的训练结果表明该特征参数对应的样本为负样本,则将所述训练结果满足所述样本的样本类型的训练模型。
如果训练模型根据各个样本的特征参数得出的各个样本对应的训练结果存在不满足该样本的样本类型,即正样本的特征参数输入训练模型后,得出的训练结果表明该特征参数对应的样本为负样本,或负样本的特征参数输入训练模型后,得出的训练结果表明该特征参数对应的样本为正样本,则调整所述训练模型的模型参数直至所有样本对应的训练结果都满足该样本的样本类型;然后将调整后的,所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
在本发明的其他实施例中,样本的特征参数中包括用于描述通话语音特征的第一特征参数和用于描述通话行为特征的第二特征参数;所述训练模型包括第一子训练模型和第二子训练模型,此时的建立识别模型的方法:
步骤A1、根据所述第二特征参数和所述第一子训练模型,对所述样本进行识别,所述第一子训练模型以所述第二特征参数为分类参数;获取所述第一子训练模型输出的所述样本的第一训练结果;在所述第一训练结果不满足所述样本的样本类型时,调整所述第一训练模型的模型参数直至所述第一训练结果满足所述样本的样本类型;
步骤A2、根据第三特征参数和所述第二子训练模型,对所述样本进行识别,所述第二子训练模型以所述第三特征参数为分类参数,所述第三特征参数为所述第二特征参数或所述特征参数;获取所述第二子训练模型输出的第二子训练结果;在所述第二子训练结果不满足所述样本的样本类型时,调整所述第二子训练模型的模型参数直至所述第二训练结果满足所述样本的样本类型;
步骤A3、将所述第一训练结果满足所述样本的样本类型的第一子训练模型作为预设的第一子识别模型输出,将所述第二训练结果满足所述样本的样本类型的第二子训练模型作为预设的第二子识别模型输出。
本发明实施例中采用描述描述通话语音特征的第一特征参数来对训练模型进行训练,根据训练结果通过不断调整训练模型的模型参数,使最终的训练模型对样本识别的准召率达到最优,如此提升识别恶意电话的准确性。且本发明实施例采用的识别模型的一个显著特点是模型可以自我进化,根据通话语音或通话行为的变换自动进行模型参数的调整,避免基于规则的人工频繁介入调整参数。
实施例三
基于前述的实施例,本发明实施例提供一种识别恶意电话的方法,应用于计算设备,所述计算设备实现为服务器,该识别恶意电话的方法所实现的功能可以通过服务器中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该服务器至少包括处理器和存储介质。
图3A为本发明实施例一识别恶意电话的方法的实现流程示意图,如图3A所示,该识别恶意电话的方法包括:
步骤S301、服务器确定第一通话事件,提取所述第一通话事件的特征参数。
这里,第一用户通过所述服务器与第二用户建立通信连接,进而实现第一用户和第二用户之间的通话,服务器用于承载用于控制用户通话的控制信令,例如呼叫、应答和拒接等信令,并转发第一终端11和第二终端12之间的通话语音信息。故,所述服务器可以确定所述第一用户与第二用户之间的通话事件以及第一用户和第二用户的通话行为信息。
这里,所述特征参数包括用于描述通话语音特征的第一特征参数和用于描述通话行为特征的第二特征参数。
这里,由于服务器13可以转发第一终端11和第二终端12之间的通话语音信息,第一终端对应第一用户,第二终端对应第二用户;故所述提取所述第一通话事件的第一特征参数可以包括:获取所述第一通话事件的通话语音信息;从所述第一通话事件的通话语音信息中提取所述第一特征参数,所述第一特征参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个。
在本发明的其他实施例中,所述服务器可以从所述第一通话事件的通话语音信息中提取通话语音的波形,所述波形包括时域波形或频域波形;提取所述波形的波形特征参数,所述波形特征参数包括波峰幅度值、波谷幅度值、波形幅度平均值、波峰位置和波谷位置中的至少一个。
所述服务器也可以对所述第一通话事件的通话语音信息进行语音识别,获得通话语音对应的文本;提取所述文本中的文本关键字;比较所述文本关键字与预设的第一关键字,确定所述文本关键字中所述第一关键字的个数或概率。示例地,恶意用户进行通话的目的一般都是进行诈骗和推销,故可以统计出诈骗和推销时经常用到的字作为第一关键字如“钱”、“中奖”、“买”、“银行”、“产品”等。
这里,服务器可以采集所述第一用户和所述第二用户在第一预设时间段内的第一通话行为;根据所述第一用户和第二用户在第一预设时间段内的第一通话行为,确定所述第一用户是否为可疑用户;示例地,由于恶意用户通常都会频繁地与陌生电话通话,故可以统计在一天时间内通话双方(第一用户和第二用户)与陌生电话的通话次数,将与陌生电话的通话次数多的用户为可疑用户。
这里,所述第二特征参数可以是描述非可疑用户的通话行为特征的参数,故如果所述第一用户不是可疑用户,则所述服务器从所述第一用户的通话行为信息中用于描述第一用户的通话行为特征的第二特征参数,所述第二特征参数包括:在第二预设时间段内,与标记为恶意用户的通话次数和通话平均时长、与陌生用户的通话次数、与海外用户的通话次数中的至少一个;所述第二特征参数可以是描述可疑用户的通话行为特征的参数,如果所述第一用户是可疑用户,则所述服务器从所述第一用户的通话行为信息中用于描述第一用户的通话行为特征的第二特征参数,所述第二特征参数包括:在第三预设时间段内,与陌生用户的通话次数和通话平均时长、与海外用户的通话次数中的至少一个。
步骤S302、服务器根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数。
这里,图3A中所示的线上模型即为当前预设的识别模型;所述当前预设的识别模型是由服务器采用实施例二中所述的建立识别模型方法建立的。
这里,所述识别模型包括第一子识别模型和第二子识别模型,则步骤S302包括以下步骤B1-B4:
步骤B1、根据所述第二特征参数和所述第一子识别模型,对所述第一通话事件进行识别,所述第一子识别模型以所述第二特征参数为分类参数。
步骤B2、获取所述第一子识别模型识别出的所述第一通话事件的初始识别结果。
步骤B3、如果所述初始识别结果满足第一预设条件,获取所述第一通话事件的第一特征参数。
如果所述初始识别结果满足第一预设条件,则表明所述第一通话事件可能为恶意事件,需要进行后续步骤对该第一通话事件进一步识别。如果所述初始识别结果不满足第一预设条件,则表明所述第一通话事件不是恶意事件,此时流程结束。
步骤B4、根据所述第一通话事件的特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述特征参数为分类参数;或者,根据所述第一通话事件的第一特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述第一特征参数为分类参数。
相应地,所述获取所述识别模型识别出的所述第一通话事件的识别结果,包括:获取所述第二子识别模型识别出的所述第一通话事件的识别结果。
步骤S303、服务器获取所述识别模型识别出的所述第一通话事件的识别结果,根据所述第一通话事件的识别结果确定所述第一通话事件的提醒指令。
本发明实施例中,服务器在所述第一通话事件的识别结果满足第二预设条件时,确定所述第一通话事件的提醒指令为第一提醒指令,所述第一提醒指令用于指示不向终端输出所述第一通话事件的识别结果;服务器在所述第一通话事件的识别结果满足第三预设条件时,确定所述第一通话事件的提醒指令为第二提醒指令,所述第二提醒指令用于指示向所述第一终端发送短信,所述短信中携带有所述第一通话事件的识别结果;服务器在所述第一通话事件的识别结果满足第四预设条件时,确定所述第一通话事件的提醒指令为第三提醒指令,所述第三提醒指令用于指示向所述第一终端发起通话,并在所述第一终端接听后向所述第一终端通知所述第一通话事件的识别结果。
步骤S304、在所述第一用户不是可疑用户时,服务器根据所述第一通话事件的提醒指令向第一终端输出所述第一通话事件的识别结果。
这里,所述第一终端对应所述第一用户,所述第二终端对应所述第二用户。
示例地,可以假设所述识别模型识别出的识别结果为本次识别的通话事件为恶意电话的概率,所述第二预设条件是[a,b],所述第三预设条件是(b,c],所述第四预设条件是(c,d];假设,a为0,b为10%,c为50%,d为100%。如果所述第一通话事件的识别结果为5%,则服务器判定所述第一通话事件的识别结果满足第二预设条件,表明所述第一通话事件为无风险事件,此时所述服务器可以不提醒用户;如果所述第一通话事件的识别结果为30%,则服务器判定所述第一通话事件的识别结果满足第三预设条件,表明所述第一通话时间为低风险事件,此时所述服务器可以向第一通话事件中的非可疑用户如第一用户发送提醒短信,短信内容可以为“亲爱的用户,您好,与您进行通话的号码为XXXXX的电话可能为恶意电话,请您加强防范”等;如果所述第一通话事件的识别结果为60%,则服务器判定所述第一通话事件的识别结果满足第四预设条件,表明所述第一通话时间为高风险事件,此时所述服务器可以向第一通话事件中的非可疑用户如第一用户发起通话,并在所述第一终端接听后自动向所述第一终端语音播报“亲爱的用户,您好,与您进行通话的号码为XXXXX的电话可能为恶意电话,请您加强防范”。当然,所述服务器也可以同时向两个用户都发起提醒。
这里,所述服务器还可以在所述第一通话事件的识别结果满足第二预设条件或第三预设条件时,将所述第二用户被标注为恶意用户的次数加1,这样当第二用户继续向其他用户发起恶意通话时,服务器可以将第二用户被标注为恶意用户的次数发送给该其他用户,提醒该其他用户注意。
示例地,第二用户为推销人员,其在这一天内与陌生号码通话次数有很多次,当第二用户使用的第二终端拨打第一终端,向第一终端的第一用户推销自己的产品的场景下,由于第二用户为推销人员,其通话过程语气很温和,经常会说“我们这个产品XXX”“我们这个产品很优秀”“原价是XXX”、“现在买可以给你优惠XXX”“买我们的产品不会后悔”等之类的话。所述服务器在第一终端接通后,可以确定第一用户和第二用户之间的通话事件,并按照上述方法对此次的通话事件进行识别,最终识别结果为此次通话事件为低风险,此时,所述服务器就会向第一用户发送提醒短信,第一用户接收到所述提醒短信后,就会慎重考虑自己的行为,决定是否与第二用户继续沟通,进行购买或者向第二用户泄露自己的身份信息等;这样就可以防止第一用户遭受诈骗。
步骤S305、服务器将所述第一通话事件的特征参数发送到服务器中的离线模型建立模块,所述离线模型建立模块将所述第一通话事件的特征参数作为所述样本的特征参数。
这里,服务器在提取到所述第一通话事件的特征参数后就可以进行步骤S305。
这里,如图3A所示,所述离线模型建立模块可以将所述第一通话事件的特征参数加入到训练集中,作为一个样本的特征参数。
步骤S306、服务器确定所述样本的样本类型。
这里,如图3A所示,可以人工或由所述服务器中的离线模型建立模块自动确定该样本(即第一通话事件)的样本类型,确定该样本是正样本还是负样本。
步骤S307、服务器根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,获得所述训练结果满足所述样本的样本类型的训练模型。
步骤S308、服务器将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型。
这里,图3A中所示的离线模型即为满足所述样本的样本类型的训练模型,这样离线模型建立模块可以不断从其所在的服务器中获取通话事件的特征参数,并将该通话事件的特征参数作为样本供机器学习进行模型训练,根据通话语音和通话行为的变换自动进行模型参数的调整,自动进化,避免基于规则的人工频繁介入调整参数。
在本发明的其他实施例中,服务器中当前预设的识别模型也可以是由第一设备采用实施例二中所述的建立识别模型方法建立后,发送给所述服务器的;即服务器中的离线模型建立模块是设置在第一设备中的,所述第一设备是能与服务器进行通信的其他设备(可以是第一终端或第二终端)。所述步骤S305至步骤S308也可以在第一设备中实现,此时步骤S305具体为:服务器将所述第一通话事件的特征参数发送给第一设备,所述第一设备将所述第一通话事件的特征参数作为所述样本的特征参数,然后执行步骤S306和S307,将训练结果满足所述样本的样本类型的训练模型作为当前预设的识别模型输出给服务器。
示例地,所述第一设备为第一终端11,如图3B所示,第一终端11采用实施例二中所述的建立识别模型方法建立识别模型后,发送给所述服务器13;服务器对第一通话事件进行特征提取并根据该识别模型进行恶意电话识别后,将所述第一通话事件的识别结果发送给第一终端和/或第二终端。当然,所述服务器13在对第一通话事件进行特征提取后也会将所述第一通话事件的特征参数发送给第一终端11,所述第一终端11可以将所述第一通话事件的特征参数作为所述样本的特征参数来训练建立当前的识别模型,然后将更新的识别模型发送给服务器。
示例地,所述第一设备不是第一终端和第二终端,而是其他能够与所述服务器13通信的设备,此时如图3C所示,第一设备14采用实施例二中所述的建立识别模型方法建立识别模型后,发送给所述服务器13;服务器13采用本实施例中的方案进行恶意电话识别后,将所述第一通话事件的识别结果发送给第一终端11和/或第二终端12。当然,所述服务器13在对第一通话事件进行特征提取后也会将所述第一通话事件的特征参数发送给第一设备14,所述第一设备14可以将所述第一通话事件的特征参数作为所述样本的特征参数来训练建立当前的识别模型。
在本发明的其他实施例中,所述计算设备也可以实现为第一终端,此时,步骤S304需要替换为:所述第一终端在所述第一终端的显示界面上显示所述第一通话事件的识别结果。当然,所述计算设备也可以实现为第二终端,其实现过程与第一终端相同;示例地,所述计算设备为第一终端11,如图3D所示,所述服务器采用实施例二中所述的建立识别模型方法建立识别模型后,将识别模型发送给第一终端11,所述第一终端11提取第一通话事件的特征参数,根据所述识别模型进行恶意电话识别,并在所述第一终端的显示界面上显示所述第一通话事件的识别结果。当然,所述第一终端11在对第一通话事件进行特征提取后也会将所述第一通话事件的特征参数发送给服务器13,所述服务器13可以将所述第一通话事件的特征参数作为所述样本的特征参数来训练建立当前的识别模型。
本发明实施例中,先通过通话行为特征来做初步识别,初步识别结果满足第一预设条件时,再采用满足第一预设条件的通话事件的第二特征参数来进行识别,如此,可以预先筛除不满足第一预设条件的部分通话事件,可以加快识别速率,且最终对恶意通话事件的识别必然是采用描述语音特征的第二特征参数来识别的,保证了识别恶意通话事件的准确性。
实施例四
基于前述的实施例,本发明实施例提供一种识别恶意电话的装置,该识别恶意电话的装置所包括的各单元,以及各单元所包括的各模块,都可以通过该装置中的处理器来实现,当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图4为本发明实施例四识别恶意电话的装置的组成结构示意图,如图4所示,该装置包括第一获取单元401、识别单元402、第二获取单元403、第一输出单元404,其中:
所述第一获取单元401,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个。
所述识别单元402,用于根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数。
所述第二获取单元403,用于获取所述识别模型识别出的所述第一通话事件的识别结果。
所述第一输出单元404,用于输出所述第一通话事件的识别结果。
这里,所述第一获取单元401包括:获取模块和提取模块,其中所述获取模块,用于获取所述第一通话事件的通话语音信息;所述提取模块,用于从所述第一通话事件的通话语音信息中提取所述特征参数。
这里,所述提取模块,用于从所述第一通话事件的通话语音信息中提取通话语音的波形,所述波形包括时域波形或频域波形;提取所述波形的波形特征参数,所述波形特征参数包括波峰幅度值、波谷幅度值、波形幅度平均值、波峰位置和波谷位置中的至少一个。
这里,所述提取模块,用于对所述第一通话事件的通话语音信息进行语音识别,获得通话语音对应的文本;提取所述文本中的文本关键字;比较所述文本关键字与预设的第一关键字,确定所述文本关键字中所述第一关键字的个数或概率。
这里,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述第一用户的通话行为特征的第二特征参数。
在本发明的其他实施例中,所述装置还包括采集单元和第三确定单元,其中,所述采集单元,用于采集所述第一用户和所述第二用户在第一预设时间段内的第一通话行为;所述第三确定单元,用于根据所述第一用户和第二用户在第一预设时间段内的第一通话行为,确定所述第一用户是否为可疑用户;相应地,如果所述第一用户不是可疑用户,所述第二特征参数包括:在第二预设时间段内,与标记为恶意用户的通话次数和通话平均时长、与陌生用户的通话次数、与海外用户的通话次数中的至少一个;如果所述第一用户是可疑用户,所述第二特征参数包括:在第三预设时间段内,与陌生用户的通话次数和通话平均时长、与海外用户的通话次数中的至少一个。
在本发明的其他实施例中,所述识别模型包括第一子识别模型和第二子识别模型,则所述识别单元包括第一识别模块和第二识别模块,其中,所述第一识别模块,用于根据所述第二特征参数和所述第一子识别模型,对所述第一通话事件进行识别,获取所述第一子识别模型识别出的所述第一通话事件的初始识别结果;所述第一子识别模型以所述第二特征参数为分类参数;所述第二识别模块,用于在所述初始识别结果满足第一预设条件时,根据所述第一通话事件的特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述特征参数为分类参数;或者,根据所述第一通话事件的第一特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述第一特征参数为分类参数;相应地,所述第二获取模块403,用于获取所述第二子识别模型识别出的所述第一通话事件的识别结果。
在本发明的其他实施例中,所述装置还包括:第一确定单元,其中,所述第一确定单元,用于根据所述第一通话事件的识别结果确定所述第一通话事件的提醒指令;相应地,所述第一输出单元,还用于根据所述第一通话事件的提醒指令向终端输出所述第一通话事件的识别结果,所述终端包括对应第一用户的第一终端和对应第二用户的第二终端。
这里,所述第一确定单元,用于在所述第一通话事件的识别结果满足第二预设条件时,确定所述第一通话事件的提醒指令为第一提醒指令,所述第一提醒指令用于指示不向终端输出所述第一通话事件的识别结果;在所述第一通话事件的识别结果满足第三预设条件时,确定所述第一通话事件的提醒指令为第二提醒指令,所述第二提醒指令用于指示向所述终端发送短信,所述短信中携带有所述第一通话事件的识别结果;在所述第一通话事件的识别结果满足第四预设条件时,确定所述第一通话事件的提醒指令为第三提醒指令,所述第三提醒指令用于指示向所述终端发起通话,并在所述终端接听后向所述第一终端通知所述第一通话事件的识别结果;所述终端包括对应第一用户的第一终端和对应第二用户的第二终端;相应地,所述第一输出单元404,用于根据所述第一通话事件的提醒指令向终端输出所述第一通话事件的识别结果。
在本发明的其他实施例中,所述第一输出单元404,还用于在所述第一终端的显示界面上显示所述第一通话事件的识别结果,所述第一终端对应所述第一用户。在本发明的其他实施例中,所述装置还包括第三输出单元,其中,所述第三输出单元,用于将所述第一通话事件的特征参数发送给第一设备。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例五
基于前述的实施例,本发明实施例提供一种建立恶意模型的装置,该建立恶意模型的装置所包括的各单元,以及各单元所包括的各模块,都可以通过该装置中的处理器来实现,当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图5为本发明实施例五建立恶意模型的装置的组成结构示意图,如图5所示,该建立恶意模型的装置包括:第二确定单元501、第三获取单元502、训练单元503、判断单元504、调整单元505、第二输出单元506,其中:
所述第二确定单元501,用于确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本。
所述第三获取单元502,用于获取样本的特征参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个。
所述训练单元503,用于根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数。
所述判断单元504,用于判断所述训练结果是否符合所述样本的样本类型。
所述调整单元505,用于在所述训练结果不满足所述样本的样本类型时,调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型。
所述第二输出单元506,用于将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
在本发明实施例中,所述第一获取单元,还用于接收第一通话事件的特征参数,将所述第一通话事件的特征参数作为所述样本的特征参数。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例六
基于前述的实施例,本发明实施例提供一种识别恶意电话的设备,该设备可以实现为服务器,图6为本发明实施例六服务器的组成结构示意图,如图6所示,该识别恶意电话的设备包括和第一处理器601和第一外部通信接口602,其中:
所述第一处理器601,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;通过所述第一外部通信接口602输出所述第一通话事件的识别结果。
这里,所述识别恶意电话的设备还可以实现为第一终端或第二终端,此时,所述识别恶意电话的设备包括第一处理器和显示屏,其中:所述第一处理器,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;通过所述显示屏显示所述第一通话事件的识别结果。所述显示屏用于显示所述第一通话事件的识别结果。
这里需要指出的是:以上设备实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明设备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
实施例七
基于前述的实施例,本发明实施例提供一种建立恶意模型的设备,所述建立恶意模型的设备可以实现为服务器、第一终端或第二终端,图7为本发明实施例七建立恶意模型的设备的组成结构示意图,如图7所示,该设备包括第二处理器701和第二外部通信接口702,其中:
所述第二处理器701,用于确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;获取样本的特征参数,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,通过所述第二外部通信接口702将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
这里需要指出的是:以上设备实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明设备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (22)
1.一种识别恶意电话的方法,其特征在于,所述方法包括:
获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;
获取所述识别模型识别出的所述第一通话事件的识别结果;
输出所述第一通话事件的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定第一通话事件;
所述获取第一通话事件的特征参数包括:提取所述第一通话事件的特征参数。
3.根据权利要求1所述的方法,其特征在于,所述获取第一通话事件的特征参数包括:
第一终端接收服务器发送的第一所述通话事件的特征参数,所述第一终端对应第一用户。
4.根据权利要求1所述的方法,其特征在于,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述第一用户的通话行为特征的第二特征参数。
5.根据权利要求4所述的方法,其特征在于,所述识别模型包括第一子识别模型和第二子识别模型,则所述根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,包括:
根据所述第二特征参数和所述第一子识别模型,对所述第一通话事件进行识别,所述第一子识别模型以所述第二特征参数为分类参数;
获取所述第一子识别模型识别出的所述第一通话事件的初始识别结果;
在所述初始识别结果满足第一预设条件时,获取所述第一通话事件的第一特征参数;
根据所述第一通话事件的特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述特征参数为分类参数;或者,根据所述第一通话事件的第一特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述第一特征参数为分类参数;
相应地,所述获取所述识别模型识别出的所述第一通话事件的识别结果,包括:获取所述第二子识别模型识别出的所述第一通话事件的识别结果。
6.根据权利要求2所述的方法,其特征在于,所述提取所述第一通话事件的特征参数包括:
获取所述第一通话事件的通话语音信息;
从所述第一通话事件的通话语音信息中提取所述特征参数。
7.根据权利要求6所述的方法,其特征在于,所述从所述第一通话事件的通话语音信息中提取所述特征参数,包括:
从所述第一通话事件的通话语音信息中提取通话语音的波形,所述波形包括时域波形或频域波形;
提取所述波形的波形特征参数,所述波形特征参数包括波峰幅度值、波谷幅度值、波形幅度平均值、波峰位置和波谷位置中的至少一个。
8.根据权利要求6所述的方法,其特征在于,所述从所述第一通话事件的通话语音信息中提取所述特征参数,包括:
对所述第一通话事件的通话语音信息进行语音识别,获得通话语音对应的文本;
提取所述文本中的文本关键字;
比较所述文本关键字与预设的第一关键字,确定所述文本关键字中所述第一关键字的个数或概率。
9.根据权利要求4所述的方法,其特征在于,所述方法还包括:
采集所述第一用户和所述第二用户在第一预设时间段内的第一通话行为;
根据所述第一用户和第二用户在第一预设时间段内的第一通话行为,确定所述第一用户是否为可疑用户;
相应地,如果所述第一用户不是可疑用户,所述第二特征参数包括:在第二预设时间段内,与标记为恶意用户的通话次数和通话平均时长、与陌生用户的通话次数、与海外用户的通话次数中的至少一个;如果所述第一用户是可疑用户,所述第二特征参数包括:在第三预设时间段内,与陌生用户的通话次数和通话平均时长、与海外用户的通话次数中的至少一个。
10.根据权利要求9所述的方法,其特征在于,所述第一用户不是可疑用户时,输出所述第一通话事件的识别结果之前,所述方法还包括:
服务器根据所述第一通话事件的识别结果确定所述第一通话事件的提醒指令;
相应地,所述输出所述识别结果包括:
所述服务器根据所述第一通话事件的提醒指令向第一终端输出所述第一通话事件的识别结果,所述第一终端对应所述第一用户。
11.根据权利要求10所述的方法,其特征在于,所述服务器根据所述第一通话事件的识别结果确定所述第一通话事件的提醒指令,包括:
服务器在所述第一通话事件的识别结果满足第二预设条件时,确定所述第一通话事件的提醒指令为第一提醒指令,所述第一提醒指令用于指示不向终端输出所述第一通话事件的识别结果;
服务器在所述第一通话事件的识别结果满足第三预设条件时,确定所述第一通话事件的提醒指令为第二提醒指令,所述第二提醒指令用于指示向所述第一终端发送短信,所述短信中携带有所述第一通话事件的识别结果;
服务器在所述第一通话事件的识别结果满足第四预设条件时,确定所述第一通话事件的提醒指令为第三提醒指令,所述第三提醒指令用于指示向所述第一终端发起通话,并在所述第一终端接听后向所述第一终端通知所述第一通话事件的识别结果。
12.根据权利要求1至11任一项所述的方法,其特征在于,所述输出所述识别结果,包括:
第一终端在所述第一终端的显示界面上显示所述第一通话事件的识别结果,所述第一终端对应所述第一用户。
13.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
将所述第一通话事件的特征参数发送给第一设备。
14.根据权利要求1至11任一项所述的方法,其特征在于,所述方法还包括:
确定样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;
获取所述样本的特征参数;
根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;
判断所述训练结果是否符合所述样本的样本类型;
如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
15.根据权利要求14所述的方法,其特征在于,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述通话行为特征的第二特征参数;所述训练模型包括第一子训练模型和第二子训练模型,则所述方法还包括:
根据所述第二特征参数和所述第一子训练模型,对所述样本进行识别,所述第一子训练模型以所述第二特征参数为分类参数;获取所述第一子训练模型输出的所述样本的第一训练结果;在所述第一训练结果不满足所述样本的样本类型时,调整所述第一训练模型的模型参数直至所述第一训练结果满足所述样本的样本类型;
根据第三特征参数和所述第二子训练模型,对所述样本进行识别,所述第二子训练模型以所述第三特征参数为分类参数,所述第三特征参数为所述第二特征参数或所述特征参数;获取所述第二子训练模型输出的第二子训练结果;在所述第二子训练结果不满足所述样本的样本类型时,调整所述第二子训练模型的模型参数直至所述第二训练结果满足所述样本的样本类型;
将所述第一训练结果满足所述样本的样本类型的第一子训练模型作为预设的第一子识别模型输出,将所述第二训练结果满足所述样本的样本类型的第二子训练模型作为预设的第二子识别模型输出。
16.一种建立识别模型的方法,其特征在于,所述方法包括:
确定样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;
获取所述样本的特征参数,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;
判断所述训练结果是否符合所述样本的样本类型;
如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
17.一种识别恶意电话的装置,其特征在于,所述装置包括:第一获取单元、识别单元、第二获取单元、第一输出单元,其中,
所述第一获取单元,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
所述识别单元,用于根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;
所述第二获取单元,用于获取所述识别模型识别出的所述第一通话事件的识别结果;
所述第一输出单元,用于输出所述第一通话事件的识别结果。
18.根据权利要求17所述的装置,其特征在于,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述第一用户的通话行为特征的第二特征参数,所述识别模型包括第一子识别模型和第二子识别模型,则所述识别单元包括第一识别模块和第二识别模块,其中,
所述第一识别模块,用于根据所述第二特征参数和所述第一子识别模型,对所述第一通话事件进行识别,获取所述第一子识别模型识别出的所述第一通话事件的初始识别结果;所述第一子识别模型以所述第二特征参数为分类参数;
所述第二识别模块,用于在所述初始识别结果满足第一预设条件时,根据所述第一通话事件的特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述特征参数为分类参数;或者,根据所述第一通话事件的第一特征参数和所述第二子识别模型,对所述第一通话事件进行识别,所述第二子识别模型以所述第一特征参数为分类参数;
相应地,所述第二获取单元,用于获取所述第二子识别模型识别出的所述第一通话事件的识别结果。
19.一种建立恶意模型的装置,其特征在于,所述装置包括:第二确定单元、第三获取单元、训练单元、判断单元、调整单元、第二输出单元,其中,
所述第二确定单元,用于确定样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;
所述第三获取单元,用于获取所述样本的特征参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;
所述训练单元,用于根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;
所述判断单元,用于判断所述训练结果是否符合所述样本的样本类型;
所述调整单元,用于在所述训练结果不满足所述样本的样本类型时,调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型;
所述第二输出单元,用于将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
20.一种识别恶意电话的设备,其特征在于,所述设备包括第一处理器和第一外部通信接口,或者,所述设备包括第一处理器和显示屏;其中,
所述第一处理器,用于获取第一通话事件的特征参数,所述第一通话事件为第一用户与第二用户之间的通话事件,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述第一通话事件的特征参数和当前预设的识别模型,对所述第一通话事件进行识别,所述识别模型以所述特征参数为分类参数;获取所述识别模型识别出的所述第一通话事件的识别结果;通过所述第一外部通信接口输出所述第一通话事件的识别结果,或者通过所述显示屏显示所述第一通话事件的识别结果。
21.根据权利要求20所述的设备,其特征在于,所述用于描述通话语音特征的参数为第一特征参数,所述特征参数还包括用于描述第一用户的通话行为特征的第二特征参数,所述识别模型包括第一子识别模型和第二子识别模型,则,
所述第一处理器,用于根据所述第二特征参数和所述第一子识别模型,对所述第一通话事件进行识别,获取所述第一子识别模型识别出的所述第一通话事件的初始识别结果;所述第一子识别模型以所述第二特征参数为分类参数;在所述初始识别结果满足第一预设条件时,根据所述第一通话事件的特征参数和所述第二子识别模型,对所述第一通话事件进行识别,获取所述第二子识别模型识别出的所述第一通话事件的识别结果,所述第二子识别模型以所述特征参数为分类参数;或者,根据所述第一通话事件的第一特征参数和所述第二子识别模型,对所述第一通话事件进行识别,获取所述第二子识别模型识别出的所述第一通话事件的识别结果,所述第二子识别模型以所述第一特征参数为分类参数。
22.一种建立恶意模型的设备,其特征在于,所述设备包括:第二处理器和第二外部通信接口,其中,
所述第二处理器,用于确定样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于恶意电话的样本,所述负样本为不属于恶意电话的样本;获取所述样本的特征参数,所述特征参数包括用于描述通话语音特征的参数,其中,所述描述通话语音特征的参数包括:通话语音的波形特征参数、通话语音对应的文本中第一关键字的个数和概率中的至少一个;根据所述样本的特征参数和设置的训练模型,得到所述训练模型输出的训练结果,所述训练模型以所述特征参数为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,通过所述第二外部通信接口将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610278825.9A CN107343077B (zh) | 2016-04-28 | 2016-04-28 | 识别恶意电话及建立识别模型的方法、装置、设备 |
PCT/CN2017/074169 WO2017185862A1 (zh) | 2016-04-28 | 2017-02-20 | 识别恶意电话及建立识别模型的方法、装置、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610278825.9A CN107343077B (zh) | 2016-04-28 | 2016-04-28 | 识别恶意电话及建立识别模型的方法、装置、设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107343077A CN107343077A (zh) | 2017-11-10 |
CN107343077B true CN107343077B (zh) | 2019-12-13 |
Family
ID=60160705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610278825.9A Active CN107343077B (zh) | 2016-04-28 | 2016-04-28 | 识别恶意电话及建立识别模型的方法、装置、设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107343077B (zh) |
WO (1) | WO2017185862A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107995370B (zh) * | 2017-12-21 | 2020-11-24 | Oppo广东移动通信有限公司 | 通话控制方法、装置及存储介质和移动终端 |
CN107846493B (zh) * | 2017-12-21 | 2019-10-25 | Oppo广东移动通信有限公司 | 通话联系人控制方法、装置及存储介质和移动终端 |
CN108091324B (zh) * | 2017-12-22 | 2021-08-17 | 北京百度网讯科技有限公司 | 语气识别方法、装置、电子设备和计算机可读存储介质 |
CN110351731A (zh) * | 2018-04-08 | 2019-10-18 | 中兴通讯股份有限公司 | 一种手机号码防欺诈的方法及装置 |
CN110401780B (zh) * | 2018-04-25 | 2021-05-11 | 中国移动通信集团广东有限公司 | 一种识别诈骗电话的方法及装置 |
CN108833720B (zh) * | 2018-05-04 | 2021-11-30 | 北京邮电大学 | 诈骗电话号码识别方法与系统 |
CN109599116B (zh) * | 2018-10-08 | 2022-11-04 | 中国平安财产保险股份有限公司 | 基于语音识别的监管保险理赔的方法、装置和计算机设备 |
CN111124698A (zh) * | 2018-10-30 | 2020-05-08 | 北京奇虎科技有限公司 | 通信事件的识别方法、装置、电子设备及可读存储介质 |
CN109688275A (zh) * | 2018-12-27 | 2019-04-26 | 中国联合网络通信集团有限公司 | 骚扰电话识别方法、装置及存储介质 |
CN111343330A (zh) * | 2019-03-29 | 2020-06-26 | 阿里巴巴集团控股有限公司 | 一种智能手机 |
CN111786802B (zh) * | 2019-04-03 | 2023-07-04 | 北京嘀嘀无限科技发展有限公司 | 一种事件检测的方法及装置 |
CN110113473A (zh) * | 2019-05-10 | 2019-08-09 | 南京硅基智能科技有限公司 | 一种基于云端虚拟手机的智能过滤来电的方法及系统 |
CN110177179B (zh) * | 2019-05-16 | 2020-12-29 | 国家计算机网络与信息安全管理中心 | 一种基于图嵌入的诈骗号码识别方法 |
CN110519466A (zh) * | 2019-08-30 | 2019-11-29 | 北京泰迪熊移动科技有限公司 | 一种快递号码识别方法、设备及计算机存储介质 |
CN110602326B (zh) * | 2019-09-19 | 2021-06-04 | 中国联合网络通信集团有限公司 | 可疑来电识别方法和可疑来电识别系统 |
CN110751553A (zh) * | 2019-10-24 | 2020-02-04 | 深圳前海微众银行股份有限公司 | 潜在风险对象的识别方法、装置、终端设备及存储介质 |
CN111800546B (zh) * | 2020-07-07 | 2021-12-17 | 中国工商银行股份有限公司 | 构建识别模型以及识别的方法、装置、系统和电子设备 |
CN111901554B (zh) * | 2020-07-27 | 2022-11-11 | 中国平安人寿保险股份有限公司 | 基于语义聚类的通话通道构建方法、装置和计算机设备 |
CN112035548A (zh) * | 2020-08-31 | 2020-12-04 | 北京嘀嘀无限科技发展有限公司 | 识别模型的获取方法、识别方法、装置、设备及介质 |
CN113315876B (zh) * | 2021-05-27 | 2023-01-20 | 中国银行股份有限公司 | 电话银行服务控制方法、装置、服务器及存储介质 |
CN113792140A (zh) * | 2021-08-12 | 2021-12-14 | 南京星云数字技术有限公司 | 文本处理方法、装置及计算机可读存储介质 |
CN114125155A (zh) * | 2021-11-15 | 2022-03-01 | 天津市国瑞数码安全系统股份有限公司 | 一种基于大数据分析的骚扰电话检测方法及系统 |
CN114567697A (zh) * | 2022-03-01 | 2022-05-31 | 恒安嘉新(北京)科技股份公司 | 一种异常电话的识别方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103179122A (zh) * | 2013-03-22 | 2013-06-26 | 马博 | 一种基于语音语义内容分析的防电信电话诈骗方法和系统 |
CN104065836A (zh) * | 2014-05-30 | 2014-09-24 | 小米科技有限责任公司 | 监控通话的方法和装置 |
CN104735671A (zh) * | 2015-02-27 | 2015-06-24 | 腾讯科技(深圳)有限公司 | 一种识别恶意电话的方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8510215B2 (en) * | 2005-04-21 | 2013-08-13 | Victrio, Inc. | Method and system for enrolling a voiceprint in a fraudster database |
US8831941B2 (en) * | 2007-05-29 | 2014-09-09 | At&T Intellectual Property Ii, L.P. | System and method for tracking fraudulent electronic transactions using voiceprints of uncommon words |
-
2016
- 2016-04-28 CN CN201610278825.9A patent/CN107343077B/zh active Active
-
2017
- 2017-02-20 WO PCT/CN2017/074169 patent/WO2017185862A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103179122A (zh) * | 2013-03-22 | 2013-06-26 | 马博 | 一种基于语音语义内容分析的防电信电话诈骗方法和系统 |
CN104065836A (zh) * | 2014-05-30 | 2014-09-24 | 小米科技有限责任公司 | 监控通话的方法和装置 |
CN104735671A (zh) * | 2015-02-27 | 2015-06-24 | 腾讯科技(深圳)有限公司 | 一种识别恶意电话的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2017185862A1 (zh) | 2017-11-02 |
CN107343077A (zh) | 2017-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107343077B (zh) | 识别恶意电话及建立识别模型的方法、装置、设备 | |
US11838443B2 (en) | Collaborative phone reputation system | |
US10057419B2 (en) | Intelligent call screening | |
CN110891124B (zh) | 一种人工智能代接来电的系统 | |
US10447838B2 (en) | Telephone fraud management system and method | |
CN106713593B (zh) | 一种陌生号码自动处理方法及装置 | |
CN113557514A (zh) | 用于检测机密信息的暴露的家长控制系统及方法 | |
CN105306657A (zh) | 身份识别方法、装置及通讯终端 | |
CN107995370B (zh) | 通话控制方法、装置及存储介质和移动终端 | |
CN104253899B (zh) | 通讯终端的控制方法和装置 | |
WO2021184837A1 (zh) | 诈骗电话的识别方法、装置、存储介质及终端 | |
CN105827501A (zh) | 一种消息提醒方法及电子设备 | |
CN110290155B (zh) | 社会工程学攻击的防御方法及装置 | |
CN104883299A (zh) | 路由器配置方法、系统及路由器 | |
WO2020124453A1 (zh) | 信息自动回复的方法及相关装置 | |
WO2017172655A1 (en) | Analysis of a facial image to extract physical and emotional characteristics of a user | |
CN105933512A (zh) | 一种安全通话方法、装置和移动终端 | |
CN107844562B (zh) | 智能化咨询服务方法 | |
CN113284500B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN104394258B (zh) | 对通讯对象的联系方式变化进行处理的方法和装置 | |
CN108270925A (zh) | 语音信息的处理方法、装置、终端和计算机可读存储介质 | |
CN109547329A (zh) | 群组信息的显示方法及相关产品 | |
US11917092B2 (en) | Systems and methods for detecting voice commands to generate a peer-to-peer communication link | |
CN104463440A (zh) | 一种网上警务督察方法、装置及系统 | |
KR20180006775A (ko) | 발신 정보 제공 장치 및 사용자 단말 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230620 Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd. Address before: 2, 518000, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |