CN111556207A - 识别骚扰电话的方法、装置、计算机设备和存储介质 - Google Patents

识别骚扰电话的方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111556207A
CN111556207A CN202010224097.XA CN202010224097A CN111556207A CN 111556207 A CN111556207 A CN 111556207A CN 202010224097 A CN202010224097 A CN 202010224097A CN 111556207 A CN111556207 A CN 111556207A
Authority
CN
China
Prior art keywords
answer
incoming call
question
preset
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010224097.XA
Other languages
English (en)
Inventor
陈芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202010224097.XA priority Critical patent/CN111556207A/zh
Publication of CN111556207A publication Critical patent/CN111556207A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • H04M3/4365Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it based on information specified by the calling party, e.g. priority or subject
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Telephone Function (AREA)

Abstract

本申请涉及语义解析技术领域,提供识别骚扰电话的方法、装置、计算机设备和存储介质,包括:检测受话终端是否满足进入防骚扰模式的条件;若满足,则进入防骚扰模式,并在检测到来电终端对受话终端的来电时,查询来电的标注信息是否为预设标注信息;若是,则判定来电为骚扰电话并拦截;若否,则自动接听来电,语音识别得到对应的文本,基于NLP模型对文本进行语义识别,并匹配对应的应答文本反馈至来电终端;接收来电终端针对应答文本反馈得到对应的回答文本;将多个应答文本与对应的回答文本分别组合得到的问答对与预设问答对进行对比,得到总相似度;若总相似度大于阈值,则判定来电为骚扰电话并拦截。本申请识别来电为骚扰电话,并自动拦截。

Description

识别骚扰电话的方法、装置、计算机设备和存储介质
技术领域
本申请涉及语义解析的技术领域,特别涉及一种识别骚扰电话的方法、装置、计算机设备和存储介质。
背景技术
AI电话机器人基于语音识别技术,通过一问一答真人声音和客户交流推销产品,可以针对客户提问有针对性地回答客户问题,自动帮助筛选意向客户信息。基于AI的智能机器人每天可以多至拨打5000个骚扰电话,机器人的“高效”和“低价”被恶意利用,造成了骚扰电话满天飞的情况。
目前用户不方便时,被骚扰电话所打扰时容易引起用户情绪反感,若此时拒接所有电话,又容易造成重要电话被遗漏;因此急需准确识别出来电是否为骚扰电话。
发明内容
本申请的主要目的为提供一种识别骚扰电话的方法、装置、计算机设备和存储介质,准确识别出骚扰电话,克服用户不方便接听电话时被骚扰电话所骚扰的缺陷。
为实现上述目的,本申请提供了一种识别骚扰电话的方法,应用于后台服务器,包括以下步骤:
按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
基于所述语义识别的结果,匹配对应的应答文本;
将所述应答文本转换成语音信息,并反馈至所述来电终端;
接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
进一步地,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤,包括:
获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
判断所述摆放角度是否处于预设角度范围内;
若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
进一步地,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤,包括:
检测当前时间是否为预设的会议时间;其中所述预设的会议时间基于所述受话终端上存储的会议计划所获取;
若为预设的会议时间,检测所述受话终端当前是否处于亮屏状态;
若未处于,则触发所述受话终端的界面显示解锁界面;
若未接收到所述用户针对所述解锁界面触发的解锁指令,则基于所述受话终端采集当前环境在预设时间段内的的环境声音,并将所述环境声音转换成文本;
对所述文本进行关键词识别,以判断所述文本中是否包含会议关键词以及所述会议计划中记录的关键词;
若包含,则判定所述用户处于会议状态中,判定满足进入防骚扰模式的条件。
进一步地,所述将所述应答文本转换成语音信息的步骤,包括:
将所述应答文本转换成拼音文本,以获取所述拼音文本对应的音子及其对应的韵律;
获取每个所述音子对应的帧;
根据每个帧对应的因子及其对应的韵律,获取每个帧对应的线性谱;
按照所述帧的顺序,将每个帧对应的线性谱进行组合,得到所述应答文本对应的语音信息。
进一步地,所述将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度的步骤,包括:
根据每一个所述问答对中的应答文本,在所述自动问答语料库中查询对应的预设问答对;其中所述预设问答对中包括问题文本以及答案文本;
将每一个所述问答对中的回答文本与对应的所述预设问答对中的答案文本进行对比,以获取每一个所述问答对与对应的预设问答对的第一相似度;
按照所有所述问答对的时间顺序,对各个所述问答对对应的第一相似度进行排序;
将各个所述第一相似度按照对应的权重比例进行加权计算,并按照所述第一相似度的排序,依次计算相邻两个第一相似度之间的修正值;计算所述加权计算的结果与所述修正值的求和,作为多个所述问答对与自动问答语料库存储的所述预设问答对的总相似度。
进一步地,所述总相似度的计算公式为:
V=a1×x1+a2×x2+a3×x3+a1×a2+a1×a2×a3+…+an×xn+a1×a2×a3×…an
其中,V为总相似度,a1,a2,…an依次为各个所述问答对对应的第一相似度,所述x1,x2,…xn依次为各个所述问答对对应的第一相似度所占的权重比例;a1×a2×a3×…an为相邻两个第一相似度之间的修正值。
本申请还提供了一种识别骚扰电话的装置,应用于后台服务器,包括:
检测单元,用于按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
查询单元,用于若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
处理单元,用于若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
匹配单元,用于基于所述语义识别的结果,匹配对应的应答文本;
转换单元,用于将所述应答文本转换成语音信息,并反馈至所述来电终端;
识别单元,用于接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
对比单元,用于将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
判定单元,用于判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
进一步地,所述检测单元,包括:
第一获取子单元,用于获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
第二获取子单元,用于若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
第一判断子单元,用于判断所述摆放角度是否处于预设角度范围内;
第一检测子单元,用于若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
第二判断子单元,用于判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
第一判定子单元,用于若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
进一步地,所述检测单元,包括:
第二检测子单元,用于检测当前时间是否为预设的会议时间;其中所述预设的会议时间基于所述受话终端上存储的会议计划所获取;
第三检测子单元,用于若为预设的会议时间,检测所述受话终端当前是否处于亮屏状态;
触发子单元,用于若未处于,则触发所述受话终端的界面显示解锁界面;
采集子单元,用于若未接收到所述用户针对所述解锁界面触发的解锁指令,则基于所述受话终端采集当前环境在预设时间段内的的环境声音,并将所述环境声音转换成文本;
识别子单元,用于对所述文本进行关键词识别,以判断所述文本中是否包含会议关键词以及所述会议计划中记录的关键词;
第二判定子单元,用于若包含,则判定所述用户处于会议状态中,判定满足进入防骚扰模式的条件。
进一步地,所述转换单元,包括:
第一转换子单元,用于将所述应答文本转换成拼音文本,以获取所述拼音文本对应的音子及其对应的韵律;
第三获取子单元,用于获取每个所述音子对应的帧;
第四获取子单元,用于根据每个帧对应的因子及其对应的韵律,获取每个帧对应的线性谱;
组合子单元,用于按照所述帧的顺序,将每个帧对应的线性谱进行组合,得到所述应答文本对应的语音信息。
进一步地,所述对比单元,包括:
查询子单元,用于根据每一个所述问答对中的应答文本,在所述自动问答语料库中查询对应的预设问答对;其中所述预设问答对中包括问题文本以及答案文本;
对比子单元,用于将每一个所述问答对中的回答文本与对应的所述预设问答对中的答案文本进行对比,以获取每一个所述问答对与对应的预设问答对的第一相似度;
排序子单元,用于按照所有所述问答对的时间顺序,对各个所述问答对对应的第一相似度进行排序;
计算子单元,用于将各个所述第一相似度按照对应的权重比例进行加权计算,并按照所述第一相似度的排序,依次计算相邻两个第一相似度之间的修正值;计算所述加权计算的结果与所述修正值的求和,作为多个所述问答对与自动问答语料库存储的所述预设问答对的总相似度。
进一步地,所述计算子单元计算所述总相似度的计算公式为:
V=a1×x1+a2×x2+a3×x3+a1×a2+a1×a2×a3+…+an×xn+a1×a2×a3×…an
其中,V为总相似度,a1,a2,…an依次为各个所述问答对对应的第一相似度,所述x1,x2,…xn依次为各个所述问答对对应的第一相似度所占的权重比例;a1×a2×a3×…an为相邻两个第一相似度之间的修正值。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请提供的识别骚扰电话的方法、装置、计算机设备和存储介质,按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;若满足,则触发受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断是否为预设的标注信息;若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;基于所述语义识别的结果,匹配对应的应答文本;将所述应答文本转换成语音信息,并反馈至所述来电终端;接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截。本申请在用户不方便时,采用NLP模型识别出来电电话是否为骚扰电话,当其为骚扰电话时,自动拦截,使其不会骚扰用户。
附图说明
图1是本申请一实施例中识别骚扰电话的方法步骤示意图;
图2是本申请一实施例中识别骚扰电话的装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例中提供了一种识别骚扰电话的方法,应用于后台服务器,包括以下步骤:
步骤S1,按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
在本实施例中,来电终端拨打电话至受话终端时,需要经过后台服务器的转接,后台服务器则可以提供对上述来电电话的识别;由于上述后台服务器对上述来电电话进行识别时,需要消耗一定的识别时间,可能会消耗用户接听正常电话的时间。因此,本实施例中的识别骚扰电话的方法应用于用户当前不方便接听电话的场景中,如当用户当前情绪较低落、用户在休息、游戏中、或者处于会议当中;当用户不方便接听电话时,则可以开启上述防骚扰模式,从而触发防骚扰电话的功能;采用本方案,可以避免此时用户被骚扰电话打扰,但是又可以避免一些正常电话被遗漏。
具体地,需要先判断当前的受话终端是否需要进入防骚扰模式,若不需要,则无需进行骚扰电话的识别;在本实施例中,按照预先设定的方式检测当前受话终端所处的状态(例如操作状态、当前所处环境状态等)是否满足进入防骚扰模式的条件;优选地,可以通过检测受话终端的各项操作参数以及当前环境信息等进行考虑;上述受话终端上也可以是设置有相应的进入防骚扰模式的功能按钮,当功能按钮被触发时,则受话终端满足进入防骚扰模式的条件。
步骤S2,若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
步骤S3,若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
在本实施例中,接收到来电时,先在大数据库中识别来电的标注信息,如疑似诈骗/骚扰电话/违法犯罪/响一声/广告推荐/房产中介/保险理财/教育培训/招聘猎头等分类,若是预设标注,则直接进行拦截屏蔽,当系统为用户拦截来话时,支持三种拦截通知方式:默认为邮件通知,用户也可以通过短信通知,关注微信公众号并设置公众号提醒方式。若上述来电电话未标注在大数据库中,则自动在后台接听,并发起语音识别请求,对实时媒体流进行识别,获取语音识别结果对应的文本;再利用NLP模型对所述文本发起语义识别请求。
步骤S4,基于所述语义识别的结果,匹配对应的应答文本;
在本实施例中,在语义识别技术模型上增加专属于电话销售场景的筛选规则以及反识别学习技术,规则如:若对方对话中关键词包括:“产品推荐”/“是否需要介绍”等推销性关键词,则不直接挂断电话而是多进行几轮,可随机性模拟真人回复“不需要”/“你介绍下吧”等语句;即根据不同语境,匹配出对应的应答文本。
步骤S5,将所述应答文本转换成语音信息,并反馈至所述来电终端;在本实施例中,将应答文本转换为音频流,并通过后台服务器向来电终端播放该音频流反馈至来电终端。
步骤S6,接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
本实施例中,重复上述步骤S4-S6,则可以得到多个应答文本,以及来电终端针对每个应答文本作出的回答文本;若上述来电终端采用的是人工智能销售终端,则其必然会根据上述应答文本去进行对应回答内容的匹配;其回答内容必然是符合人工智能模型的通用模式;例如,应答文本为;你是……?若对方为人工智能销售终端,则其通常会采用以下回答:我们是……公司/企业,我们提供专业的……等类似语句。因此,在本实施例中,若检测到上述来电终端采用上述回答内容时,则有可能将其列为骚扰电话中。
步骤S7,将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
步骤S8,判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
本实施例中,将每个应答文本以及对应的回答文本分别进行组合得到多个问答对,即一问一答的问答对;在上述动问答语料库存储预先存储有多个预设问答对,该预设问答对中也包括一个问题及其对应的答案;若上述问答对与自动问答语料库存储的预设问答对相似度很高,则可以表明上述来电终端采用的也是人工智能销售终端,则可将来电终端作为骚扰电话。
在本实施例中,识别来电是否为骚扰电话,主要是通过接收来电端针对我方的应答文本所作出的回答文本,并对该回答文本进行关键词识别,识别该回答文本中是否包含有销售用语,或者是骚扰电话中的常用词,例如购买、贷款、保险、房产等;而在数据库中预先存储有主流销售场景的关键词语料库,例如保险销售场景、贷款场景、房产销售场景中主要使用的关键词。
在本实施例中,当识别上述来电为骚扰电话时,则自动拦截所述来电,并通过邮件、短信等提示方式对用户进行提醒,不会在受话终端上拉起来电进程并显示来电界面,即不会给用户造成来电困扰;若上述来电不是骚扰电话时,为了避免用户错过重要电话,则可以将上述来电转接至受话终端,进行来电提醒。
在一实施例中,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤S1,包括:
步骤S11,获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
步骤S12,若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
步骤S13,判断所述摆放角度是否处于预设角度范围内;
步骤S14,若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
步骤S15,判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
步骤S16,若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
本实施例中,主要用于当用户沉浸于游戏状态时,则可以选择触发进入防骚扰模式,避免用户在游戏时被骚扰电话所打扰。
应当理解的是,只有当用户当前正在处于狂热的游戏状态中,此时用户不想被打扰,才需要进入防骚扰模式;而当用户只是打开了游戏界面,或者该游戏本身只是一些休闲类小游戏,其在游戏阶段可以被打断,此时则可以不进入防骚扰模式。
因此,本实施例中,首先检测终端当前前端显示界面是否为游戏界面,若是,则用户可能在游戏,也可能仅仅是打开了游戏,而并没有沉浸于游戏;因此,再检测终端当前的摆放角度;当用户处于游戏时,根据用户习惯,通常是手握持终端,该终端与水平面呈一定角度范围;而若当前终端处于水平状态,则可以表明当前用户并没有沉浸于游戏,或者该游戏不需要用户太投入;当所述摆放角度为预设角度(如30-75度),则表明此时用户正在手持终端,用户可能正在盯着终端界面;
进一步地,再检测在预设时间段内所述终端屏幕被点击的次数以及点击位置;由当前的游戏规律可知,若用户打开游戏界面,其有可能只是打开游戏查看一些信息,并不一定沉浸于游戏中,此时,检测在预设时间段内所述终端屏幕被点击的次数以及点击位置;若点击的次数超过一定的阈值,则表明此时用户在频繁点击屏幕,用户处于狂热的游戏当中;同时,若用户点击屏幕的点击位置处于预设区域内,则表明用户所打开的游戏内容需要关注几个特定的区域,即此时若被打扰,则很可能影响正常游戏,于用户来说,此时显然不想被打扰,因此可以触发进入防骚扰模式。在本实施例中,结合上述各项状态,综合判断当前是否应该智能进入防骚扰模式,无需用户进行手动开启开关按钮等操作,增强了用户的体验。
在一实施例中,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤S1,包括:
步骤S101,检测当前时间是否为预设的会议时间;其中所述预设的会议时间基于所述受话终端上存储的会议计划所获取;
步骤S102,若为预设的会议时间,检测所述受话终端当前是否处于亮屏状态;若亮屏,则表明用户在使用手机,可能不处于会议状态,或者该用户没有沉浸于会议当中;
步骤S103,若未处于,则触发所述受话终端的界面显示解锁界面;
在本实施例中,显示解锁界面并不是真的需要用户进行解锁,只是为了确认用户在看到该解锁界面之后的操作;若用户看到该解锁界面之后随即进行解锁,则表明该用户当前并没有沉浸于会议当中;若用户没有进行解锁,则表明用户可能处于会议中,没有看到;或者用户即便看到了,但是处于会议状态下,不便于解锁。
步骤S104,若未接收到所述用户针对所述解锁界面触发的解锁指令,则基于所述受话终端采集当前环境在预设时间段内的的环境声音,并将所述环境声音转换成文本;
步骤S105,对所述文本进行关键词识别,以判断所述文本中是否包含会议关键词以及所述会议计划中记录的关键词;
步骤S106,若包含,则判定所述用户处于会议状态中,判定满足进入防骚扰模式的条件。若检测到对应的关键词,则可以表明当前正在处于会议状态,不宜被电话所打扰。
在一实施例中,所述将所述应答文本转换成语音信息的步骤S5,包括:
步骤S51,将所述应答文本转换成拼音文本,以获取所述拼音文本对应的音子及其对应的韵律;例如,应答文本为“你是谁”,则其对应的拼音文本为“nishishei”,对应的音子则为n,i,sh,i,sh,ei。上述韵律为上述音子的声调特征。
步骤S52,获取每个所述音子对应的帧;即上述音子n,i,sh,i,sh,ei分别对应一个帧。
步骤S53,根据每个帧对应的因子及其对应的韵律,获取每个帧对应的线性谱;
步骤S54,按照所述帧的顺序,将每个帧对应的线性谱进行组合,得到所述应答文本对应的语音信息。
在一实施例中,所述步骤S7中,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度的步骤,包括:
根据每一个所述问答对中的应答文本,在所述自动问答语料库中查询对应的预设问答对;其中所述预设问答对中包括问题文本以及答案文本;
将每一个所述问答对中的回答文本与对应的所述预设问答对中的答案文本进行对比,以获取每一个所述问答对与对应的预设问答对的第一相似度;
按照所有所述问答对的时间顺序,对各个所述问答对对应的第一相似度进行排序;
将各个所述第一相似度按照对应的权重比例进行加权计算,并按照所述第一相似度的排序,依次计算相邻两个第一相似度之间的修正值;计算所述加权计算的结果与所述修正值的求和,作为多个所述问答对与自动问答语料库存储的所述预设问答对的总相似度。
在本实施例中,不仅仅是考虑了每一组问答对的相似度及其对应的权重比例;还应当考虑到多组问答对都相似时,对最终相似度结果的影响;可以理解的是,若连续多组问答对都很相似时,则其最终的相似度结果应该更大,若仅仅是以各个问答对的相似度进行加权所得,必然造成最终的相似度结果偏小;因此,本实施例中,从第二组问答对开始,在进行加权计算过程中,加入了相邻两个第一相似度之间的修正值计算,以使得最终的计算结果更加贴近相似度结果。
具体地,所述总相似度的计算公式为:
V=a1×x1+a2×x2+a3×x3+a1×a2+a1×a2×a3+…+an×xn+a1×a2×a3×…an
其中,V为总相似度,a1,a2,…an依次为各个所述问答对对应的第一相似度,所述x1,x2,…xn依次为各个所述问答对对应的第一相似度所占的权重比例;a1×a2×a3×…an为相邻两个第一相似度之间的修正值。
参照图2,本申请一实施例中还提供了一种识别骚扰电话的装置,应用于后台服务器,包括:
检测单元10,用于按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
查询单元20,用于若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
处理单元30,用于若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
匹配单元40,用于基于所述语义识别的结果,匹配对应的应答文本;
转换单元50,用于将所述应答文本转换成语音信息,并反馈至所述来电终端;
识别单元60,用于接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
对比单元70,用于将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
判定单元80,用于判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
在一实施例中,所述检测单元10,包括:
第一获取子单元,用于获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
第二获取子单元,用于若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
第一判断子单元,用于判断所述摆放角度是否处于预设角度范围内;
第一检测子单元,用于若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
第二判断子单元,用于判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
第一判定子单元,用于若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
在一实施例中,所述检测单元10,包括:
第二检测子单元,用于检测当前时间是否为预设的会议时间;其中所述预设的会议时间基于所述受话终端上存储的会议计划所获取;
第三检测子单元,用于若为预设的会议时间,检测所述受话终端当前是否处于亮屏状态;
触发子单元,用于若未处于,则触发所述受话终端的界面显示解锁界面;
采集子单元,用于若未接收到所述用户针对所述解锁界面触发的解锁指令,则基于所述受话终端采集当前环境在预设时间段内的的环境声音,并将所述环境声音转换成文本;
识别子单元,用于对所述文本进行关键词识别,以判断所述文本中是否包含会议关键词以及所述会议计划中记录的关键词;
第二判定子单元,用于若包含,则判定所述用户处于会议状态中,判定满足进入防骚扰模式的条件。
在一实施例中,所述转换单元50,包括:
第一转换子单元,用于将所述应答文本转换成拼音文本,以获取所述拼音文本对应的音子及其对应的韵律;
第三获取子单元,用于获取每个所述音子对应的帧;
第四获取子单元,用于根据每个帧对应的因子及其对应的韵律,获取每个帧对应的线性谱;
组合子单元,用于按照所述帧的顺序,将每个帧对应的线性谱进行组合,得到所述应答文本对应的语音信息。
在一实施例中,所述对比单元70,包括:
查询子单元,用于根据每一个所述问答对中的应答文本,在所述自动问答语料库中查询对应的预设问答对;其中所述预设问答对中包括问题文本以及答案文本;
对比子单元,用于将每一个所述问答对中的回答文本与对应的所述预设问答对中的答案文本进行对比,以获取每一个所述问答对与对应的预设问答对的第一相似度;
排序子单元,用于按照所有所述问答对的时间顺序,对各个所述问答对对应的第一相似度进行排序;
计算子单元,用于将各个所述第一相似度按照对应的权重比例进行加权计算,并按照所述第一相似度的排序,依次计算相邻两个第一相似度之间的修正值;计算所述加权计算的结果与所述修正值的求和,作为多个所述问答对与自动问答语料库存储的所述预设问答对的总相似度。
在一实施例中,所述计算子单元计算所述总相似度的计算公式为:
V=a1×x1+a2×x2+a3×x3+a1×a2+a1×a2×a3+…+an×xn+a1×a2×a3×…an
其中,V为总相似度,a1,a2,…an依次为各个所述问答对对应的第一相似度,所述x1,x2,…xn依次为各个所述问答对对应的第一相似度所占的权重比例;a1×a2×a3×…an为相邻两个第一相似度之间的修正值。
在本实施例中,上述单元/子单元的具体实现请参照上述方法实施例中对应部分,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种识别骚扰电话的方法。
上述处理器执行上述识别骚扰电话的的步骤:
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种识别骚扰电话的方法。可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。
综上所述,为本申请实施例中提供的识别骚扰电话的方法、装置、计算机设备和存储介质,按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断是否为预设的标注信息;若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;基于所述语义识别的结果,匹配对应的应答文本;将所述应答文本转换成语音信息,并反馈至所述来电终端;接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截。本申请在用户不方便时,采用NLP模型识别出来电电话是否为骚扰电话,当其为骚扰电话时,自动拦截,使其不会骚扰用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种识别骚扰电话的方法,其特征在于,应用于后台服务器,包括以下步骤:
按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
基于所述语义识别的结果,匹配对应的应答文本;
将所述应答文本转换成语音信息,并反馈至所述来电终端;
接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
2.根据权利要求1所述的识别骚扰电话的方法,其特征在于,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤,包括:
获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
判断所述摆放角度是否处于预设角度范围内;
若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
3.根据权利要求1所述的识别骚扰电话的方法,其特征在于,所述按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件的步骤,包括:
检测当前时间是否为预设的会议时间;其中所述预设的会议时间基于所述受话终端上存储的会议计划所获取;
若为预设的会议时间,检测所述受话终端当前是否处于亮屏状态;
若未处于,则触发所述受话终端的界面显示解锁界面;
若未接收到所述用户针对所述解锁界面触发的解锁指令,则基于所述受话终端采集当前环境在预设时间段内的的环境声音,并将所述环境声音转换成文本;
对所述文本进行关键词识别,以判断所述文本中是否包含会议关键词以及所述会议计划中记录的关键词;
若包含,则判定所述用户处于会议状态中,判定满足进入防骚扰模式的条件。
4.根据权利要求1所述的识别骚扰电话的方法,其特征在于,所述将所述应答文本转换成语音信息的步骤,包括:
将所述应答文本转换成拼音文本,以获取所述拼音文本对应的音子及其对应的韵律;
获取每个所述音子对应的帧;
根据每个帧对应的因子及其对应的韵律,获取每个帧对应的线性谱;
按照所述帧的顺序,将每个帧对应的线性谱进行组合,得到所述应答文本对应的语音信息。
5.根据权利要求1所述的识别骚扰电话的方法,其特征在于,所述将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度的步骤,包括:
根据每一个所述问答对中的应答文本,在所述自动问答语料库中查询对应的预设问答对;其中所述预设问答对中包括问题文本以及答案文本;
将每一个所述问答对中的回答文本与对应的所述预设问答对中的答案文本进行对比,以获取每一个所述问答对与对应的预设问答对的第一相似度;
按照所有所述问答对的时间顺序,对各个所述问答对对应的第一相似度进行排序;
将各个所述第一相似度按照对应的权重比例进行加权计算,并按照所述第一相似度的排序,依次计算相邻两个第一相似度之间的修正值;计算所述加权计算的结果与所述修正值的求和,作为多个所述问答对与自动问答语料库存储的所述预设问答对的总相似度。
6.根据权利要求5所述的识别骚扰电话的方法,其特征在于,所述总相似度的计算公式为:
V=a1×x1+a2×x2+a3×x3+a1×a2+a1×a2×a3+…+
an×xn+a1×a2×a3×…an
其中,V为总相似度,a1,a2,…an依次为各个所述问答对对应的第一相似度,所述x1,x2,…xn依次为各个所述问答对对应的第一相似度所占的权重比例;a1×a2×a3×…an为相邻两个第一相似度之间的修正值。
7.一种识别骚扰电话的装置,其特征在于,应用于后台服务器,包括:
检测单元,用于按照预设方式检测当前受话终端所处状态是否满足进入防骚扰模式的条件;
查询单元,用于若满足,则触发所述受话终端进入防骚扰模式,并在检测到来电终端对所述受话终端的来电时,从大数据库中查询所述来电的标注信息,判断所述来电的标注信息是否为预设的标注信息;
处理单元,用于若是,则判定所述来电为骚扰电话并拦截所述来电;若否,则自动接听所述来电,对所述来电的语音信息进行语音识别,得到对应的文本,并基于NLP模型对所述文本进行语义识别;
匹配单元,用于基于所述语义识别的结果,匹配对应的应答文本;
转换单元,用于将所述应答文本转换成语音信息,并反馈至所述来电终端;
识别单元,用于接收所述来电终端针对所述应答文本反馈的来电语音,并识别所述来电语音得到对应的回答文本;
对比单元,用于将多个所述应答文本与对应的所述回答文本分别进行组合,得到多个问答对,将多个所述问答对与自动问答语料库存储的预设问答对进行对比,得到总相似度;
判定单元,用于判断所述总相似度是否大于阈值,若大于,则判定所述来电为骚扰电话并拦截所述来电。
8.根据权利要求7所述的识别骚扰电话的装置,其特征在于,所述检测单元,包括:
第一获取子单元,用于获取当前受话终端前端显示的界面内容,并判断所述界面内容是否为游戏界面;
第二获取子单元,用于若是,则获取所述受话终端内置的水平传感器所检测到的所述受话终端的摆放角度;
第一判断子单元,用于判断所述摆放角度是否处于预设角度范围内;
第一检测子单元,用于若处于,则检测在预设时间段内所述受话终端屏幕被点击的次数以及点击位置;
第二判断子单元,用于判断所述受话终端屏幕被点击的次数是否达到阈值,以及判断所述受话终端屏幕被点击的点击位置是否均处于预设区域内;其中预设区域至少包括一个;
第一判定子单元,用于若所述终端屏幕被点击的次数达到阈值,且所述终端屏幕被点击的点击位置均处于预设区域内,则判定满足进入防骚扰模式的条件。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010224097.XA 2020-03-26 2020-03-26 识别骚扰电话的方法、装置、计算机设备和存储介质 Pending CN111556207A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010224097.XA CN111556207A (zh) 2020-03-26 2020-03-26 识别骚扰电话的方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010224097.XA CN111556207A (zh) 2020-03-26 2020-03-26 识别骚扰电话的方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN111556207A true CN111556207A (zh) 2020-08-18

Family

ID=72003768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010224097.XA Pending CN111556207A (zh) 2020-03-26 2020-03-26 识别骚扰电话的方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111556207A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953850A (zh) * 2020-08-21 2020-11-17 上海市刑事科学技术研究院 非真人来电呼叫识别方法和装置
CN112651223A (zh) * 2020-12-01 2021-04-13 浙江百应科技有限公司 一种基于ner和nlu的骚扰信息判断方法及系统
CN112671968A (zh) * 2020-12-16 2021-04-16 平安普惠企业管理有限公司 骚扰电话的拦截方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953850A (zh) * 2020-08-21 2020-11-17 上海市刑事科学技术研究院 非真人来电呼叫识别方法和装置
CN111953850B (zh) * 2020-08-21 2021-05-14 上海市刑事科学技术研究院 非真人来电呼叫识别方法和装置
CN112651223A (zh) * 2020-12-01 2021-04-13 浙江百应科技有限公司 一种基于ner和nlu的骚扰信息判断方法及系统
CN112651223B (zh) * 2020-12-01 2023-03-24 浙江百应科技有限公司 一种基于ner和nlu的骚扰信息判断方法及系统
CN112671968A (zh) * 2020-12-16 2021-04-16 平安普惠企业管理有限公司 骚扰电话的拦截方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US11895266B2 (en) System and method for three-way call detection
US11115527B2 (en) System and method for identifying unwanted communications using communication fingerprinting
CN111556207A (zh) 识别骚扰电话的方法、装置、计算机设备和存储介质
US10069966B2 (en) Multi-party conversation analyzer and logger
US7657005B2 (en) System and method for identifying telephone callers
US8144939B2 (en) Automatic identifying
CN1554179A (zh) 来自话音消息的重要信息的摘要提取和预览
CN105827787B (zh) 一种号码标记方法及装置
EP4016355B1 (en) Anonymized sensitive data analysis
JP2010273130A (ja) 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
JP4067481B2 (ja) 電話受付システム
AU2018334203B2 (en) System and method for identifying unwanted communications using communication fingerprinting
Kwong et al. Privacy Pro: Spam Calls Detection Using Voice Signature Analysis and Behavior-Based Filtering
CN116456028B (zh) 一种语音电话防骚扰的方法及系统
CN117935864A (zh) 一种物业投诉电话处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination