CN114257687A - 用于处理不需要的电话呼叫的系统和方法 - Google Patents
用于处理不需要的电话呼叫的系统和方法 Download PDFInfo
- Publication number
- CN114257687A CN114257687A CN202111008341.XA CN202111008341A CN114257687A CN 114257687 A CN114257687 A CN 114257687A CN 202111008341 A CN202111008341 A CN 202111008341A CN 114257687 A CN114257687 A CN 114257687A
- Authority
- CN
- China
- Prior art keywords
- call
- unwanted
- attributes
- calls
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 title claims abstract description 33
- 238000013145 classification model Methods 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000011161 development Methods 0.000 claims description 6
- 230000001627 detrimental effect Effects 0.000 claims description 5
- 230000036541 health Effects 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000007477 logistic regression Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 20
- 230000015654 memory Effects 0.000 description 19
- 238000007726 management method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010022998 Irritability Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- RGNPBRKPHBKNKX-UHFFFAOYSA-N hexaflumuron Chemical compound C1=C(Cl)C(OC(F)(F)C(F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F RGNPBRKPHBKNKX-UHFFFAOYSA-N 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1076—Screening of IP real time communications, e.g. spam over Internet telephony [SPIT]
- H04L65/1079—Screening of IP real time communications, e.g. spam over Internet telephony [SPIT] of unsolicited session attempts, e.g. SPIT
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2218—Call detail recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/5307—Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
- H04W12/128—Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/55—Aspects of automatic or semi-automatic exchanges related to network data storage and management
- H04M2203/555—Statistics, e.g. about subscribers but not being call statistics
- H04M2203/556—Statistical analysis and interpretation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Networks & Wireless Communication (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本文公开了用于处理不需要的电话呼叫的系统和方法。一方面,示例性方法包括:拦截从主叫方的终端设备到被叫方的终端设备的呼叫的呼叫请求,生成包含在由被拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录,确定生成的呼叫记录的属性,基于所确定的属性将呼叫分类为不需要的呼叫,其中,分类由对先前收集的不需要的呼叫进行训练的分类器执行,并且其中,当属性属于已知的不需要的呼叫类别时,呼叫被分类为不需要的,并根据呼叫的分类处理该呼叫,该处理至少包括使该呼叫的信息安全。
Description
技术领域
本公开涉及信息安全领域,并且具体地涉及用于处理不需要的电话呼叫的系统和方法,例如,通过提前终止使用欺骗和类似欺诈方案的不需要的呼叫。
背景技术
目前,几乎所有通用移动设备(例如手机、智能手机、平板电脑等)的拥有者都被迫处理来自银行、健康中心、保险公司、美容院和其他在工作中使用电话营销的公司的不需要的电话呼叫、SMS消息、邮件。这些公司大多在合同中隐含地规定通过通信网络分发广告,从而规避法律规范。
电话营销公司积极使用模仿人们交流方式的智能机器人。机器人确定应激性级别,并经常调整对话以掩盖对话的人为起源。此外,欺诈者经常使用通信网络从用户那里获取敏感信息(例如,信用卡数据、社会安全号码等)。
为了对抗所描述的滥用,通信网络使用识别号码的移动应用程序(例如,TrueCaller)。在大多数情况下,会根据垃圾邮件号码的数据库检查来电,该数据库会基于用户的反馈不断更新,如果该数据库中存在垃圾邮件发送者或欺诈者的号码,用户被告知来电者参与了欺诈性通信。
由于现在匿名拨打电话或使用号码欺骗技术伪装电话号码相当容易,因此情况更加恶化。欺诈者越来越多地使用这项技术来通过信贷机构的电话号码呼叫银行客户,并询问他们提取资金所需的信息。
存在用于处理识别自动电话呼叫的任务的已知方法,但是这些已知方法不能对来自欺诈者的呼叫进行分类。此外,在最近的欺诈计划中,号码欺骗对合法订户而不是诈骗者不利。例如,屏蔽此类号码可能会导致银行失去通过电话联系客户的能力。
因此,需要一种处理包括使用欺骗号码的呼叫的不需要的电话呼叫的方法和系统。
发明内容
本公开的方面涉及信息安全,更具体地,涉及处理包括呼叫的不需要的电话呼叫的系统和方法。例如,本公开的方法可用于执行不需要的呼叫的提前终止,例如垃圾呼叫或使用欺骗号码发起的呼叫。
在一个示例性方面,提供了一种用于处理不需要的电话呼叫的方法,该方法包括:拦截用于从主叫方的终端设备到被叫方的终端设备的呼叫的呼叫请求,生成包含在由拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录,确定所生成的呼叫记录的属性,基于所确定的属性将呼叫分类为不需要的呼叫,其中,分类由对先前收集的不需要的呼叫训练的分类器执行,其中,当属性属于已知的不需要的呼叫类别时,将呼叫分类为不需要的,并且依据呼叫的分类处理该呼叫,该处理至少包括使该呼叫的信息安全。
一方面,在指定的时间间隔内生成呼叫记录,其中,基于以下来指定时间间隔:预设值的倍数;和/或等于包含的媒体数据的大小为预设值的倍数的间隔的时间间隔。
一方面,生成的呼叫记录的属性包括以下至少一个:词组;词的向量表示;以及不考虑语法和词序的多组词。
一方面,使用自动语音识别器确定所生成的呼叫记录的属性。
一方面,呼叫的类别至少包括:不需要的呼叫类别;以及真正的呼叫类别。
一方面,当呼叫由主叫方发起以执行以下至少一项时,呼叫被分类为不需要的:欺诈;获取机密信息;以及提供对被叫方的健康和/或发展造成损害的商品。
一方面,分类由使用呼叫分类模型和先前收集的不需要的呼叫训练的分类器执行。
一方面,呼叫分类器的算法至少包括基于以下的算法:贝叶斯分类器;逻辑回归;马尔可夫随机场(MRF)分类器;支持向量机;使用最近邻的方法;以及决策树。
一方面,呼叫分类模型针对任意数量的先前分类的呼叫的属性进行训练,并且其中,先前分类的呼叫的类别已以此方式得到确认,即,后续呼叫比当前呼叫更不可能被错误地分类。
一方面,呼叫至少由以下之一处理:呼叫的提前终止;以及告知被叫方该呼叫属于不需要的呼叫类别。
根据本公开的一方面,提供了一种处理不需要的电话呼叫的系统,该系统包括硬件处理器,该硬件处理器被配置为:拦截从主叫方的终端设备到被叫方的终端设备的呼叫请求,生成包含在被拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录,确定所生成的呼叫记录的属性,基于所确定的属性将呼叫分类为不需要的呼叫,其中,由先前收集的不需要的呼叫进行训练的分类器执行分类,并且其中,当属性属于已知的不需要的呼叫类别时,将呼叫分类为不需要的呼叫,并根据呼叫的分类处理该呼叫,该处理至少包括使该呼叫的信息安全。
在一个示例性方面,提供了一种非暂时性计算机可读介质,其上存储有用于处理不需要的电话呼叫的指令组,其中,该指令组包括指令,用于:拦截从主叫方的终端设备到被叫方的终端设备的呼叫的呼叫请求,生成包含在由拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录,确定所生成的呼叫记录的属性,基于所确定的属性将呼叫分类为不需要的呼叫,其中,分类由对先前收集的不需要的呼叫训练的分类器执行,并且其中,当属性属于已知的不需要的呼叫类别时将呼叫分类为不需要的,并根据呼叫的分类处理呼叫,处理至少包括使呼叫的信息安全。
本公开的方法和系统旨在以更优化和更有效的方式提供信息安全,使来自合法订户的合法呼叫能够继续完成,同时对不需要的呼叫执行提前终止。
附图说明
并入并构成本说明书的部分的附示出了本公开的一个或更多个示例性方面,并且与详细描述一起用于解释它们的原理和实施方式。
图1示出了示例性通信网络。
图2是基于通信网络的智能网络设备的示例的框图。
图3示出了用于处理电话呼叫的呼叫管理系统的框图。
图4示出了处理电话呼叫的方法。
图5呈现了可以在其上实现本公开的方面的通用计算机系统的示例。
具体实施方式
在根据本公开的方面的用于处理不需要的电话呼叫的系统、方法和计算机程序的上下文中描述了示例性方面。本领域的普通技术人员将意识到以下描述仅是说明性的,并不旨在以任何方式进行限制。受益于本公开的本领域技术人员将容易地想到其他方面。现在将详细参考如附图中所示的示例性方面的实现。在附图和以下描述中,将尽可能使用相同的附图标记来指代相同或相似的项。
图1示出了示例性的通信网络100。通信网络100包括任意数量的主叫方终端设备101、被叫方终端设备102、交换节点110和媒体数据111。通信网络100是物理通信信道和至少一个交换节点110的系统,至少一个交换节点110在主叫方的终端设备101和被叫方的终端设备102之间实现媒体数据111传输协议。
一方面,通信网络的示例至少包括:
·计算机网络;
·电话网络;以及
·移动通信网络。
终端设备是指将用户信息转换为媒体数据111以通过通信信道传输并实现反向转换的设备。
呼叫请求是指由主叫方101的终端设备发起的、与被叫方102的终端设备建立连接的尝试。
呼叫或(电话呼叫)是指使用建立的连接在主叫方终端设备101和被叫方终端设备102之间传输媒体数据111的过程。
一方面,媒体数据111至少包括:
·媒体文件;以及
·流数据(以流模式传输的媒体数据)。
例如,主叫方终端设备101和被叫方终端设备102可以是移动网络的订户的移动电话的形式,其中,电话呼叫理解为标准语音呼叫。
图2示出了基于通信网络100的智能网络设备的示例200的框图。例如,图2所示的示例性智能网络设备的框图包括通信网络100,其包括:交换节点110、服务交换模块220、服务管理节点230和分支节点240。一方面,服务交换模块220在交换节点110中实现。
图2的智能网络允许通过升级交换网络100的至少一个交换节点110来提供附加的通信服务。使用不同的交换装备并不重要,因为智能网络的架构独立于通信网络100的类型。
一方面,交换节点110用于执行用于控制基本服务的传递的功能,以及用于装备服务交换模块220的功能。一方面,服务交换模块220用于初始化各种呼叫处理算法,实施由服务管理节点230发起的策略,并监控智能网络中呼叫请求的维护。
一方面,服务管理节点230用于使服务能够跨整个智能网络传递,从而提供用于与网络的其他元件交互的协议。
一方面,智能网络包括分支节点240,其用于将媒体数据111的副本传送到智能网络的其他辅助元件,辅助元件使智能网络服务更加用户友好(例如,语音识别设备)。
一方面,智能网络提供的服务至少包括:
·免费的呼叫服务;
·允许免费获得参考信息的服务;
·电话投票服务,其允许通过呼叫特定号码进行投票;以及
·使用预付卡的电信规定。
图3示出了用于处理电话呼叫的呼叫管理系统300,例如,用于处理不需要的电话呼叫的呼叫管理系统300的框图。
一方面,呼叫管理系统的框图包括通信网络100、主叫方终端设备101、被叫方终端设备102、呼叫处理器310、媒体数据111、呼叫记录器320、呼叫记录321(例如,包含呼叫的媒体数据)、自动语音识别器330、呼叫分类器340、记录的属性341、模型训练器350以及用于对呼叫进行分类的分类模型360。
一方面,呼叫处理器310被设计为:
·拦截通信网络100中的呼叫,其中,该呼叫由主叫方终端设备101发起并且指向被叫方终端设备102,
·将媒体数据111传送到呼叫记录器320,并且
·基于所确定的呼叫的类别处理呼叫。
一方面,通信网络100采用基于公共电话网络的资源的智能网络的形式。例如,主叫方终端设备101发起电话呼叫。在接收到呼叫请求后,交换节点110(见图2)的服务交换模块220(见图2)确定连接需要交换到服务管理节点230(见图2)。交换节点110建立相应的连接。
呼叫处理器310拦截呼叫请求并通知交换节点110所拦截的呼叫需要通过分支节点240(见图2)被路由,分支节点240通过两个不同的通信信道建立连接:具有被叫方102的终端设备的第一信道,以及具有呼叫记录器320的第二信道。
一旦建立连接,来自终端设备101和102中的每一个的媒体数据111通过分支节点240被传输,在分支节点240处对媒体数据111进行复制。一个数据流指向接收方,并且另一个数据流指向呼叫记录器320。然后,执行呼叫记录。例如,形成包含媒体数据的呼叫记录,如321中所示。这一直持续到呼叫完成。
一方面,由于以下原因中的至少一种,交换节点110不能建立到被叫方终端设备102的连接:
·被叫方终端设备102以“忙”信号响应;
·被叫方终端设备102不可用;
·发生连接错误;以及
·被叫方终端设备102通过拒绝接受连接来响应。
当交换节点110无法与被叫方终端设备102建立连接时,呼叫处理器310向交换节点110发送信号,指示需要将被拦截的呼叫路由到呼叫记录器320。
呼叫记录器320被设计成记录在整个连接持续期间传输的媒体数据111,并且将至少一个生成的呼叫记录321引导到自动语音识别器330,在自动语音识别器330中,呼叫记录321呈媒体文件的形式。
一方面,呼叫记录器320用于在指定的时间间隔生成呼叫321的记录,其中,该时间间隔通过以下方法中的至少一种来指定:
·预设值的倍数;以及
·等于包含的媒体数据的大小是预设大小的倍数的值。
在一个示例中,用于呼叫的记录的时间间隔被指定作为预设值的倍数。例如,假设预设值为30秒,则可以将时间间隔设置为30秒的倍数。在另一个示例中,设置媒体数据的预设大小而不是时间间隔的预设值。然后,将时间间隔设置为等于所包含的媒体数据是媒体数据的预设大小的倍数的间隔。
自动语音识别器330被设计成将从呼叫记录器320获得的呼叫记录321转换成适合分析的数字信息(例如,格式化文本)。
一方面,自动语音识别器330对呼叫录音321的转换包括:
·将媒体文件分割成片段;
·对每个片段执行一系列转换以获得描述片段的频率特性的系数;以及
·对于每个片段,基于所获得的系数,以一定的概率确定该片段所属的音素的部分。
一方面,自动语音识别器330另外在预选文本的语料库上被训练以识别可能的音素的序列。一方面,如果有必要,自动语音识别器330基于上下文和可用的统计数据通过它们的含义来恢复未识别的词。然后,将在音素的识别过程中获得的数据和音素的链相结合,自动语音识别器330确定词的最可能的序列。
例如,对于词“rocket”中两个可能等同的音素“a”和“o”,自动语音识别器330将得出结论,词中最有可能使用的音素是“o”,因为在训练过程中经常遇到序列“spacerocket”,很少遇到序列“space racket”。
一方面,在最后阶段,数值被转换成数字,并且放置某些标点符号(例如,连字符)。该转换后的文本是传递到呼叫分类器340的识别的最终结果。
呼叫分类器340被设计成基于由自动语音识别器330使用训练的分类模型360执行的呼叫记录321的内容的分析来决定呼叫记录321是否属于不需要的类别。
一方面,呼叫的类别至少包括:
·“不需要的呼叫类别”,用于对不需要的呼叫进行分类;以及
·“真正的呼叫类别”,用于对需要的呼叫进行分类。
一方面,如果呼叫由主叫方发起以执行以下至少一项,则将呼叫分配给不需要的呼叫类别:
·诈骗;
·获取机密信息;以及
·拨打垃圾呼叫。
呼叫分类器340将由自动语音识别器330处理的呼叫记录321转换成适合分类的属性组341。
一方面,记录的属性341至少包括:
·词组(n-gram);
·词的向量表示(词嵌入);以及
·不考虑语法和词序的多组词(词袋)。
一方面,属于已知呼叫类别(例如,不需要的、未知的,等等)的呼叫的属性被预先收集。基于收集到的数据,分类模型360被训练为使得具有相似属性的呼叫可以被前述分类模型360以大于指定值的准确度分类。
使用分类模型360、呼叫分类器340对由自动语音识别器330处理的呼叫记录321进行分类。
一方面,分类算法包括以下至少一项:
·贝叶斯分类器(朴素贝叶斯分类器);
·逻辑回归;
·马尔可夫随机场(MRF)分类器;
·支持向量机(SVM);
·基于最近邻(k最近邻)的方法;以及
·决策树。
例如,呼叫分类器340的分类模型360在大量欺诈性呼叫记录上训练,其中,攻击者以不同的借口(数据验证、金融交易)请求某些个人信息项,例如银行账号或密码。在这个过程中,每一个欺诈呼叫记录都被表示作为属性组。然后,以属性组的形式出现在由自动语音识别器330处理的呼叫记录321中的诸如“从SMS报告密码”的短语,将允许呼叫分类器340将由自动语音识别器330处理的呼叫记录321以一定概率分配给不需要的类别。
呼叫分类器340将电话呼叫分类作为不需要的并且通知呼叫处理器310。然后可以根据分类来处理呼叫。
一方面,由呼叫处理器310对呼叫的处理至少包括:提前终止呼叫和/或告知被叫方该呼叫属于不需要的呼叫类别。
一方面,呼叫的处理进一步包括通知用户关于呼叫的拦截,并且在其已经被终止之后向用户提供所确定的呼叫类别。例如,通知可以通过诸如Kaspersky Who Calls应用程序之类的应用程序来执行,该应用程序可以用于通知用户关于呼叫的拦截并向用户提供呼叫类别。
一方面,模型训练器350被设计为基于新数据训练分类模型360。例如,如果分类模型360的决定被证明是错误的,则终端设备的用户可以覆盖由系统300确定的呼叫的类别。模型训练器350然后将基于用户反馈训练分类模型360,使得对于使用分类模型360分类的后续呼叫,呼叫类别的正确确定的概率将增加。
图4示出了用于处理不需要的电话呼叫的方法400。一方面,方法400在运营商的网络中经由运营商网络的任意数量的设备来执行。一方面,用于处理呼叫的方法400开始于步骤410。
在步骤410中,方法400拦截从主叫方终端设备101到被叫方终端设备102的呼叫请求。例如,拦截可以在运营商的网络中进行。
在步骤420中,通过呼叫记录器320,方法400生成呼叫记录321。呼叫记录包含在由被拦截的呼叫请求建立的连接内传输的媒体数据。
在步骤430中,通过自动语音识别器330和呼叫分类器340,方法400确定在步骤420中生成的呼叫记录321的属性。
在步骤440中,通过分类器340,方法400基于在步骤430中确定的属性对呼叫进行分类。例如,呼叫可以被分类作为不需要的呼叫。在另一示例中,呼叫可被分类作为真正的呼叫(即,需要的呼叫)。分类由对先前收集的不需要的呼叫进行训练的分类器执行。当属性属于不需要的呼叫类别时,呼叫被分类为不需要的。
一方面,当呼叫由呼叫方发起以执行以下至少一项时,呼叫被归类为不需要的:欺诈;获取机密信息;以及提供对被叫方的健康和/或发展造成损害的商品。例如,可能存在被归类为有害或不受欢迎的商品。例如,商品可能被禁止在网上商店销售,并且不能在网上做广告。此类产品包括例如膳食补充剂(例如,生物活性添加剂)。电话营销被积极地用于分发此类产品。也可能有一类商品不可以或不能被提供给未成年人。
在步骤450中,通过呼叫处理器310,方法400根据呼叫的分类来处理呼叫。一方面,呼叫的处理至少包括使呼叫安全的信息——从而为呼叫提供信息安全。
一方面,在步骤460中,方法400使用模型训练器350训练分类模型360。
一方面,分类模型360被迭代地训练以及再训练以提高分类的精度。因此,后续迭代改进了先前迭代中使用的分类模型的精度。
图5是示出计算机系统20的框图,用于处理不需要的电话呼叫的系统和方法的方面可以在该计算机系统20上实现。计算机系统20可以是多种计算设备的形式,也可以是一种计算设备的形式,例如,台式计算机、笔记本电脑、膝上型电脑、移动计算设备、智能手机、平板电脑,服务器、大型机、嵌入式设备和其他形式的计算设备。
如图所示,计算机系统20包括中央处理单元(CPU)21、系统存储器22和连接各种系统组件的系统总线23,系统组件包括与中央处理单元21相关联的存储器。系统总线23可以包括总线存储器或总线存储器控制器、外围总线和能够与任何其他总线架构交互的本地总线。总线的示例可以包括PCI、ISA、PCI-Express、HyperTransportTM、InfiniBandTM、串行ATA、I2C和其他合适的互连。中央处理单元21(也称作为处理器)可以包括具有单个或多个内核的单组或多组处理器。处理器21可以执行实现本公开的技术的一个或更多个计算机可执行代码。系统存储器22可以是用于存储本文使用的数据和/或由处理器21执行的计算机程序的任何存储器。系统存储器22可以包括易失性存储器,例如随机存取存储器(RAM)25,以及非易失性存储器,例如只读存储器(ROM)24、闪存等,或它们的任何组合。基本输入/输出系统(BIOS)26可以存储用于在计算机系统20的元件之间传输信息的基本程序,例如在使用ROM 24加载操作系统时的那些程序。
计算机系统20可以包括一个或更多个存储设备,例如一个或更多个可移动存储设备27、一个或更多个不可移动存储设备28或其组合。一个或更多个可移动存储设备27和不可移动存储设备28经由存储接口32连接到系统总线23。一方面,存储设备和对应的计算机可读存储介质是独立于电源的模块,用于计算机系统20的计算机指令、数据结构、程序模块和其他数据的存储。系统存储器22、可移动存储设备27以及不可移动存储设备28可以使用多种计算机可读存储介质。计算机可读存储介质的示例包括机器存储器,例如高速缓存、SRAM、DRAM、零电容RAM、双晶体管RAM、eDRAM、EDO RAM、DDR RAM、EEPROM、NRAM、RRAM、SONOS、PRAM;闪存或其他存储技术,例如固态驱动器(SSD)或闪光驱动器;盒式磁带、磁带和磁盘存储器,例如硬盘驱动器或软盘;光存储,例如光盘(CD-ROM)或数字多功能光盘(DVD);以及可用于存储所需的数据并且可由计算机系统20访问的任何其他介质。
计算机系统20的系统存储器22、可移动存储设备27和不可移动存储设备28可用于存储操作系统35、附加程序应用37、其他程序模块38以及程序数据39。计算机系统20可以包括外围接口46,用于从输入设备40,例如键盘、鼠标、触控笔、游戏控制器、语音输入设备、触摸输入设备或其他外围设备,例如经由一个或更多个I/O端口的打印机或扫描仪,例如串行端口、并行端口、通用串行总线(USB)或其他外围接口通信数据。诸如一个或更多个监视器、投影仪或集成显示器之类的显示设备47也可以通过诸如视频适配器之类的输出接口48连接到系统总线23。除了显示设备47之外,计算机系统20可以装备有其他外围输出设备(未示出),例如扬声器和其他视听设备。
使用到一个或更多个远程计算机49的网络连接,计算机系统20可以在网络环境中操作。远程计算机(或多台计算机)49可以是本地计算机工作站或服务器,包括以上在描述计算机系统20的性质中所描述的大多数或所有元件。其他设备也可以存在于计算机网络中,例如但不限于路由器、网络站、对等设备或其他网络节点。计算机系统20可以包括一个或更多个网络接口51或网络适配器,用于通过一个或更多个网络与远程计算机49进行通信,例如局域计算机网络(LAN)50、广域计算机网络(WAN)、内部网和因特网。网络接口51的示例可以包括以太网接口、帧中继接口、SONET接口和无线接口。
本公开的方面可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有用于使处理器执行本公开的方面的计算机可读程序指令的计算机可读存储介质(或介质)。
计算机可读存储介质可以是有形设备,其可以保持和存储指令或数据结构形式的程序代码,该程序代码可以由计算设备(例如计算系统20)的处理器访问。计算机存储介质可以是电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或其任何合适的组合。例如,此类计算机可读存储介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、EEPROM、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、闪存、硬盘、便携式计算机软盘、记忆棒、软盘,甚至是机械编码的设备,例如穿孔卡或刻有指令的凹槽中的凸起结构。如本文所用,计算机可读存储介质不应被解释为瞬态信号本身,例如无线电波或其他自由传播的电磁波、通过波导或传输介质传播的电磁波、或通过电线传输的电信号。
本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算设备或经由网络下载到外部计算机或外部存储设备,例如,因特网、局域网、广域网和/或无线网络。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算设备中的网络接口从网络接收计算机可读程序指令并转发计算机可读程序指令以存储在相应计算设备内的计算机可读存储介质中。
用于执行本公开的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据或以一种或更多种编程语言的任意组合编写的源代码或目标代码,包括面向对象的编程语言和传统的过程编程语言。计算机可读程序指令可以完全在用户的计算机上、部分在用户的计算机上、作为独立软件包、部分在用户的计算机上并且部分在远程计算机上或完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括LAN或WAN)连接到用户的计算机,或者可以连接到外部计算机(例如,通过互联网)。在一些方面,包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以个性化电子电路,以便执行本公开的方面。
在各个方面,本公开中描述的系统和方法可以按照模块来解决。本文使用的术语“模块”是指使用硬件实现的真实设备、组件或组件的布置,例如通过专用集成电路(ASIC)或FPGA,或作为硬件和软件的组合,例如由微处理器系统和实现模块的功能的指令组,这些软件(在执行时)将微处理器系统转换为专用设备。模块也可以实现作为两者的结合,某些功能单独由硬件实现,并且其他功能由硬件和软件结合实现。在某些实施方式中,模块的至少部分,并且在一些情况下,模块的全部,可以在计算机系统的处理器上执行(例如上面图5中更详细描述的那个)。因此,每个模块可以以各种合适的配置来实现,并且不应限于本文示例的任何特定实施方式。
为清楚起见,本文并未公开这些方面的所有常规特征。应当理解的是,在本公开的任何实际实现的开发中,必须做出许多特定于实现方式的决定以实现开发者的特定目标,并且这些特定目标将针对不同实现方式和不同开发者而变化。应当理解的是,此类开发工作可能是复杂且耗时的,但是对于受益于本公开的本领域普通技术人员来说,仍然是工程的例行工作。
此外,应当理解的是,本文使用的措辞或术语是为了描述的目的而非限制性的,使得本说明书的术语或措辞应由本领域技术人员根据本文提出的教导和指导,结合相关领域技术人员的知识来解释。此外,除非明确说明,否则本说明书或权利要求书中的任何术语不打算被赋予不常见或特殊的含义。
本文公开的各个方面包括本文通过说明的方式提及的已知模块的当前和未来已知的等效物。此外,虽然已经示出和描述了方面和应用,但是对于受益于本公开的本领域技术人员而言是显而易见的,在不背离本文公开的发明构思的情况下,可以进行比上述更多的修改。
Claims (20)
1.一种用于处理不需要的电话呼叫的方法,所述方法包括:
拦截从主叫方的终端设备到被叫方的终端设备的呼叫请求;
生成包含在由所拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录;
确定所生成的呼叫记录的属性;
基于所确定的属性将呼叫分类作为不需要的呼叫,其中,所述分类由对先前收集的不需要的呼叫训练的分类器执行,并且其中,当所述属性属于已知的不需要的呼叫类别时,将所述呼叫分类为不需要的;以及
根据所述呼叫的分类处理所述呼叫,所述处理至少包括使所述呼叫的信息安全。
2.根据权利要求1所述的方法,其中,在指定的时间间隔内生成所述呼叫记录,其中,基于以下条件指定所述时间间隔:
预设值的倍数;和/或
等于所包含的媒体数据的大小为所述预设值的倍数的间隔的时间间隔。
3.根据权利要求1所述的方法,其中,所生成的呼叫记录的属性包括以下至少之一:
词组;
词的向量表示;以及
不考虑语法和词序的多组词。
4.根据权利要求1所述的方法,其中,使用自动语音识别器确定所生成的呼叫记录的所述属性。
5.根据权利要求1所述的方法,其中,所述呼叫的类别至少包括:
不需要的呼叫类别;以及
真正的呼叫类别。
6.根据权利要求1所述的方法,其中,当所述呼叫由所述主叫方发起以执行以下至少一项时,所述呼叫被分类为不需要的:
诈骗;
获取机密信息;以及
提供对被叫方的健康和/或发展造成损害的商品。
7.根据权利要求1所述的方法,其中,所述分类由使用呼叫分类模型和所述先前收集的不需要的呼叫训练的所述分类器执行。
8.根据权利要求1所述的方法,其中,所述呼叫分类器的算法至少包括基于以下的算法:
贝叶斯分类器;
逻辑回归;
马尔可夫随机场(MRF)分类器;
支持向量机;
使用最近邻的方法;以及
决策树。
9.根据权利要求1所述的方法,其中,所述呼叫分类模型针对任意数量的先前分类的呼叫的属性进行训练,并且其中,所述先前分类的呼叫的类别已以此类方式得到确认,即后续呼叫被错误分类的可能性低于当前呼叫。
10.根据权利要求1所述的方法,其中,所述呼叫至少由以下之一处理:
提前终止呼叫;以及
告知被叫方所述呼叫属于不需要的呼叫类别。
11.一种用于处理不需要的电话呼叫的系统,包括:
至少一个处理器,被配置为:
拦截主叫方终端设备向被叫方终端设备呼叫的呼叫请求;
生成包含在由所拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录;
确定所生成的呼叫记录的属性;
基于所确定的属性将所述呼叫分类为不需要的呼叫,其中,所述分类由对先前收集的不需要的呼叫训练的分类器执行,并且其中,当所述属性属于已知的不需要的呼叫类别时,将所述呼叫分类为不需要的;以及
根据所述呼叫的分类处理所述呼叫,所述处理至少包括使所述呼叫的信息安全。
12.根据权利要求11所述的系统,其中,在指定的时间间隔内生成所述呼叫记录,其中,基于以下指定所述时间间隔:
预设值的倍数;和/或
等于所包含的媒体数据的大小为所述预设值的倍数的间隔的时间间隔。
13.根据权利要求11所述的系统,其中,所生成的呼叫记录的属性包括以下至少一项:
词组;
词的向量表示;以及
不考虑语法和词序的多组词。
14.根据权利要求11所述的系统,其中,使用自动语音识别器确定所生成的呼叫记录的所述属性。
15.根据权利要求11所述的系统,其中,所述呼叫的类别至少包括:
不需要的呼叫类别;以及
真正的呼叫类别。
16.根据权利要求11所述的方法,其中,当所述呼叫由所述主叫方发起以执行以下至少一项时,所述呼叫被分类为不需要的:
诈骗;
获取机密信息;以及
提供对被叫方的健康和/或发展造成损害的商品。
17.根据权利要求11所述的系统,其中,所述分类由使用呼叫分类模型和所述先前收集的不需要的呼叫训练的所述分类器执行。
18.根据权利要求11所述的系统,其中,所述呼叫分类器的算法至少包括基于以下的算法:
贝叶斯分类器;
逻辑回归;
马尔可夫随机场(MRF)分类器;
支持向量机;
使用最近邻的方法;以及
决策树。
19.根据权利要求11所述的系统,其中,所述呼叫分类模型针对任意数量的先前分类的呼叫的属性进行训练,并且其中,所述先前分类的呼叫的类别已以此类方式得到确认,即后续呼叫被错误分类的可能性低于当前呼叫。
20.一种非暂时性计算机可读介质,其上存储有用于处理不需要的电话呼叫的计算机可执行指令,包括用于以下操作的指令:
拦截从主叫方的终端设备到被叫方的终端设备的呼叫的呼叫请求;
生成包含在由所拦截的呼叫请求建立的连接内传输的媒体数据的呼叫记录;
确定所生成的呼叫记录的属性;
基于所确定的属性将所述呼叫分类为不需要的呼叫,其中,所述分类由对先前收集的不需要的呼叫训练的分类器执行,并且其中,当所述属性属于已知的不需要的呼叫类别时,将所述呼叫分类为不需要的;以及
根据所述呼叫的类别处理所述呼叫,所述处理至少包括使所述呼叫的信息安全。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020131448A RU2766273C1 (ru) | 2020-09-24 | 2020-09-24 | Система и способ определения нежелательного звонка |
RU2020131448 | 2020-09-24 | ||
US17/335,123 | 2021-06-01 | ||
US17/335,123 US11388286B2 (en) | 2020-09-24 | 2021-06-01 | System and method for handling unwanted telephone calls |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114257687A true CN114257687A (zh) | 2022-03-29 |
Family
ID=77774730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111008341.XA Pending CN114257687A (zh) | 2020-09-24 | 2021-08-31 | 用于处理不需要的电话呼叫的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11616879B2 (zh) |
EP (1) | EP3975517B1 (zh) |
CN (1) | CN114257687A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11889019B2 (en) * | 2021-10-12 | 2024-01-30 | T-Mobile Usa, Inc. | Categorizing calls using early call information systems and methods |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7317787B2 (en) * | 2000-11-21 | 2008-01-08 | At&T Knowledge Ventures, L.P. | Voice enhancing for advance intelligent network services |
US7653188B2 (en) * | 2005-07-20 | 2010-01-26 | Avaya Inc. | Telephony extension attack detection, recording, and intelligent prevention |
GB2455505B (en) * | 2007-12-10 | 2010-01-20 | Motorola Inc | Apparatus and method for processing an incoming voice call |
US9553985B2 (en) * | 2012-10-26 | 2017-01-24 | Meir Cohen | Determining and denying call completion based on detection of robocall or unsolicited advertisement |
US10110741B1 (en) * | 2017-07-25 | 2018-10-23 | Teltech Systems, Inc. | Determining and denying call completion based on detection of robocall or telemarketing call |
US10657971B1 (en) * | 2017-12-15 | 2020-05-19 | NortonLifeLock Inc. | Systems and methods for detecting suspicious voice calls |
US10978095B2 (en) * | 2018-11-06 | 2021-04-13 | International Business Machines Corporation | Control of incoming calls |
US11463582B1 (en) * | 2021-07-09 | 2022-10-04 | T-Mobile Usa, Inc. | Detecting scam callers using conversational agent and machine learning systems and methods |
-
2021
- 2021-08-31 CN CN202111008341.XA patent/CN114257687A/zh active Pending
- 2021-09-15 EP EP21196753.4A patent/EP3975517B1/en active Active
-
2022
- 2022-06-07 US US17/834,132 patent/US11616879B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3975517B1 (en) | 2024-02-21 |
US20220303388A1 (en) | 2022-09-22 |
US11616879B2 (en) | 2023-03-28 |
EP3975517A1 (en) | 2022-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10455085B1 (en) | Systems and methods for real-time scam protection on phones | |
US11677781B2 (en) | Automated device data retrieval and analysis platform | |
US20220114593A1 (en) | Probabilistic anomaly detection in streaming device data | |
US11610206B2 (en) | Analysis platform for actionable insight into user interaction data | |
CN113315874B (zh) | 用于呼叫分类的系统和方法 | |
CN112988991B (zh) | 一种通过人机对话进行反欺诈干预的方法和系统 | |
US20190373105A1 (en) | Cognitive telephone fraud detection | |
JP6966357B2 (ja) | 情報処理システム、情報処理装置、情報処理方法及びプログラム | |
CN109614464B (zh) | 用于业务问题识别的方法及装置 | |
US11700250B2 (en) | Voice vector framework for authenticating user interactions | |
US20240089361A1 (en) | Restricting access based on voice communication parameters | |
WO2020123564A1 (en) | System and method for automatic labeling of clusters created by unsupervised machine learning methods | |
EP3873075A1 (en) | System and method for call classification | |
US11616879B2 (en) | System and method for handling unwanted telephone calls through a branching node | |
US20240276225A1 (en) | System and method for classifying incoming events by user's mobile device based on user preferences | |
CN113491141A (zh) | 用于呼叫认证的技术 | |
US11388286B2 (en) | System and method for handling unwanted telephone calls | |
KR20200027090A (ko) | 대화형 금융 거래 처리 방법 및 이를 수행하는 대화형 뱅킹 시스템 | |
US12028479B2 (en) | System and method for protecting subscriber data in the event of unwanted calls | |
CN110943982A (zh) | 单据数据加密的方法、装置、电子设备和存储介质 | |
US20240106854A1 (en) | System and method for creating heuristic rules based on received email messages to identity business email compromise attacks | |
EP4383648A1 (en) | System and method for classifying calls | |
US20240195913A1 (en) | System and method for classifying calls | |
US20230153339A1 (en) | Reducing overcollection of unstructured data | |
KR102707506B1 (ko) | 피싱사기 방지를 위한 장치 및 그 장치의 구동방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |