CN110225207A - 一种融合语义理解的防骚扰方法、系统、终端及存储介质 - Google Patents

一种融合语义理解的防骚扰方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN110225207A
CN110225207A CN201910355198.8A CN201910355198A CN110225207A CN 110225207 A CN110225207 A CN 110225207A CN 201910355198 A CN201910355198 A CN 201910355198A CN 110225207 A CN110225207 A CN 110225207A
Authority
CN
China
Prior art keywords
user
current sessions
wrecking
harassing
harassment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910355198.8A
Other languages
English (en)
Other versions
CN110225207B (zh
Inventor
邹辉
肖龙源
蔡振华
李稀敏
刘晓葳
谭玉坤
王静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Express Business Information Consulting Co Ltd
Original Assignee
Xiamen Express Business Information Consulting Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Express Business Information Consulting Co Ltd filed Critical Xiamen Express Business Information Consulting Co Ltd
Priority to CN201910355198.8A priority Critical patent/CN110225207B/zh
Publication of CN110225207A publication Critical patent/CN110225207A/zh
Application granted granted Critical
Publication of CN110225207B publication Critical patent/CN110225207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种融合语义理解的防骚扰方法、系统、终端及存储介质,所述方法包括获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单。本发明无需添加验证码的方式进行防骚扰,提升了客户系统的用户体验感,同时解决了客服花大量时间在恶意访问用户上的问题,提升客户系统工作效率;可以有效避免骚扰用户通过技术手段躲避骚扰拦截,有效地辨别升级的骚扰数据,提升骚扰数据的辨别能力,能有效地将恶意骚扰的请求数据拦截。

Description

一种融合语义理解的防骚扰方法、系统、终端及存储介质
技术领域
本发明涉及防骚扰技术应用于客服领域,具体涉及一种融合语义理解的防骚扰方法、系统、终端及存储介质。
背景技术
在客服系统中,经常出现有恶意骚扰、恶意竞争等原因不断调用对话接口的情况。传统的防骚扰技术一般通过统计‘骚扰’关键词出现的次数、通过用户IP访问的次数或频率、验证码等方式来判断是否为恶意用户。如果是恶意用户则关闭此次对话、将IP列入黑名单;否则将对话分配给人工客服,减少人工客服的无效接待时长。
传统的防骚扰技术可以拦截一些简单、有规律的恶意访问数据,然而对于一些稍做升级的骚扰数据则无法拦截。例如恶意访问系统可以收集问题集,使用IP代理,每个IP只从问题集合中抽少数问题、隔一定的合理时间段去访问客服系统,这种情况下通过上述方法并不能把恶意对话给拦截下来,此外,添加验证码的方式将会使得客服系统的用户体验不好,影响用户使用。
发明内容
本发明的目的在于解决的问题,提出一种融合语义理解的防骚扰方法,一方面提升客户体验,另一方面提升防骚扰能力,有效地将恶意骚扰的请求数据进行拦截,解决了客服花大量时间在恶意访问用户上的问题。
为达成上述目的,本发明采用如下技术方案:一种融合语义理解的防骚扰方法,包括如下步骤:
获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户,
所述第一骚扰条件为当前会话用户连续若干次说的话都是一个语法有误的句子,则满足第一骚扰条件;
进一步的,在当前会话用户被判断为异常用户时,关闭当前会话,并将当前会话用户的IP加入黑名单。
进一步的,采用隐马尔科夫算法计算当前会话用户所说的话组成一个符合语法句子的概率,并根据概率值的大小判断当前会话用户所说的话是否有效。
进一步的,在融合语义理解的防骚扰方法中,若不满足第一骚扰条件,则学习当前会话用户所说话的含义,根据当前会话用户所说话的含义返回与当前会话用户所说话的含义相关的问题或术语至当前会话;
获取当前用户针对返回的当前会话用户所说话的含义相关的问题或术语进行回复内容,计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
判断是否满足第二骚扰条件,若满足第二骚扰条件,则判断当前会话用户为异常用户,否则判断当前会话用户为正常用户,进一步的,在当前会话用户被判断为异常用户时,关闭当前会话,并将当前会话用户的IP加入黑名单;
所述第二骚扰条件为连续若干次返回至当前会话用户的问题或术语与当前会话用户回复内容为不相关,则满足第二骚扰条件;当返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度小于或小于等于设定值,则返回至当前会话用户的问题或术语与当前会话用户回复内容为判断为不相关。
进一步的,采用BM25算法计算当前会话用户的问题或术语与当前会话用户回复内容的相关度。
进一步的,在分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率前,还包括:
统计当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率;
根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若满足恶意用户条件,则判断当前会话用户为异常用户,否则获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;进一步的,在当前会话用户被判断为异常用户时,关闭当前会话,并将当前会话用户的IP加入黑名单。
与融合语义理解的防骚扰方法,相应的,本发明还提供融合语义理解的防骚扰系统,包含对话单元、语法分析单元、对话控制单元、异常判断单元;
所述对话单元用于与当前对话用户之间进行对话;
所述语法分析单元用于分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
所述异常判断单元用于根据所述语法分析单元分析的结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元;
所述对话控制单元用于接收异常判断单元的关闭当前会话指令关闭所述对话单元的当前会话。
进一步的所述系统还包括相关度单元,
所述语法分析单元用于分析当会话用户连续若干次说的话分别不能组成一个符合语法句子,所述异常判断单元通知所述对话控制单元发送与当前会话用户所说话的含义相关的问题或术语至对话单元;
所述相关度单元用于计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
所述异常判断单元用于根据所述相关度单元的计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元。
进一步的,所述系统还包括关键词检测单元和/或IP获取单元;
所述关键词检测单元用于从所述对话单元获取对话数据,监测当前会话的‘骚扰’关键词出现的次数;
所述IP获取单元用于监控所述对话单元的当前对话用户IP访问的次数和/或频率;
所述异常判断单元用于根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若所述异常判断单元判断为恶意用户,则所述异常判断单元发送关闭当前会话指令至所述对话控制单元。
另外,本发明还提供了一种终端,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被所述处理器执行时实现上所述的融合语义理解的防骚扰方法的步骤。
另外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被处理器执行时实现上述的融合语义理解的防骚扰方法的步骤。
本发明提供的融合语义理解的防骚扰方法、终端及存储介质,与现有技术相比较,具备如下有益效果:
(1)本发明无需添加验证码的方式进行防骚扰,提升了客户系统的用户体验感,同时解决了客服花大量时间在恶意访问用户上的问题,提升客户系统工作效率;
(2)通过判断当前会话用户所说的话是否是正常的句子,即判断句子的语法是否正常,来判断用户是否为骚扰用户或异常用户,可以有效避免骚扰用户通过技术手段躲避骚扰拦截,有效地辨别升级的骚扰数据;
(3)进一步地通过分析当前会话用户是否能接上系统的问题或术语(例如问诊问题),即当前会话用户回答与系统问句的关联度,从语义上判断用户是否为正常用户,来进一步辨别用户是否为骚扰用户,提升骚扰数据的辨别能力,能有效地将恶意骚扰的请求数据拦截。
附图说明
图1为本发明实施例1的融合语义理解的防骚扰方法的流程步骤图;
图2为本发明实施例2的融合语义理解的防骚扰方法的流程步骤图;
图3为本发明实施例3的融合语义理解的防骚扰方法的流程步骤图;
图4为本发明实施例4的融合语义理解的防骚扰系统的示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
需要说明的是,本发明所指的若干次包含一次或多次。所述多次为两次或两次以上。
实施例1
本发明实施例公开了一种融合语义理解的防骚扰方法,如附图1所示,包括如下步骤:
步骤S11,获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
步骤S12,判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则进入步骤S13,
所述第一骚扰条件为当前会话用户连续若干次说的话都是一个语法有误的句子,则满足第一骚扰条件;在本发明实施例,优选地,采用隐马尔科夫算法计算当前会话用户所说的话组成一个符合语法句子的概率,并根据概率值的大小判断当前会话用户所说的话是否有效;
隐马尔科夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。
是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测序列的过程,隐藏的马尔科夫链随机生成的状态的序列,称为状态序列;每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列。马尔科夫链由初始概率分布、状态转移概率分布以及观测概率分布确定。
句子1‘中华人民共和国’和句子2‘中华人民共共国’为例进一步说明,‘中华人民共’后面接‘和’的概率比接‘共’的概率高很多,后者的概率很低,不是一个正常的句子。而句子‘洒水客单价萨克’成为一个正常语法的句子的概率则更低,如果概率低于一个阈值的时候我们可以把它当作不是一个符合语法的句子。如果连续发送多句无意义的句子,我们就认为这是一个无效用户或者是一个骚扰用户。
步骤S13,学习当前会话用户所说话的含义,根据当前会话用户所说话的含义返回与当前会话用户所说话的含义相关的问题或术语至当前会话;
步骤S14,获取当前用户针对返回的当前会话用户所说话的含义相关的问题或术语进行回复内容,计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
步骤S15,判断是否满足第二骚扰条件,若满足第二骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则判断当前会话用户为正常用户;
所述第二骚扰条件为连续若干次返回至当前会话用户的问题或术语与当前会话用户回复内容为不相关,则满足第二骚扰条件;当返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度小于或小于等于设定值,则返回至当前会话用户的问题或术语与当前会话用户回复内容为判断为不相关。
优选的,本发明实施例采用BM25算法计算当前会话用户的问题或术语与当前会话用户回复内容的相关度;
第二骚扰条件判断,以整形行业为例,学习用户所说话的含义(如用户说“我想做双眼皮”),防骚扰系统根据预先设计好的相关问诊话术(一个项目-问诊话术字典)查找问诊话术(同一个项目有多个备选的不同问诊话术)返回给当前会话用户,使用BM25算法计算问诊话术与用户回复内容的相关度,如果连续三次用户回复内容与系统问诊内容不相关,则判断为骚扰用户,则关闭此次会话,将IP加入黑名单;
BM25算法是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下BM25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词$q_i$,然后单词的分数由3部分组成:单词$q_i$和D之间的相关性、单词$q_i$和D之间的相关性、每个单词的权重,最后对于每个单词的分数我们做一个求和,就得到了query和文档之间的分数。
实施例2
本发明实施例公开了一种融合语义理解的防骚扰方法,如附图2所示,包括如下步骤:
步骤S21,统计当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率;
步骤S22,根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若满足恶意用户条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则进入步骤S23;
步骤S23,获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
步骤S24,判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则判断当前会话用户为正常用户;
所述第一骚扰条件为当前会话用户连续若干次说的话都是一个语法有误的句子,则满足第一骚扰条件;在本发明实施例,优选地,采用隐马尔科夫算法计算当前会话用户所说的话组成一个符合语法句子的概率,并根据概率值的大小判断当前会话用户所说的话是否有效。
实施例3
本发明实施例公开了一种融合语义理解的防骚扰方法,如附图3所示,包括如下步骤:
步骤S31,统计当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率;
步骤S32,根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若满足恶意用户条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则进入步骤S23,
步骤S33,获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
步骤S34,判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则进入步骤S35;
所述第一骚扰条件为当前会话用户连续若干次说的话都是一个语法有误的句子,则满足第一骚扰条件;在本发明实施例,优选地,采用隐马尔科夫算法计算当前会话用户所说的话组成一个符合语法句子的概率,并根据概率值的大小判断当前会话用户所说的话是否有效。
步骤S35,学习当前会话用户所说话的含义,根据当前会话用户所说话的含义返回与当前会话用户所说话的含义相关的问题或术语至当前会话;
步骤S36,获取当前用户针对返回的当前会话用户所说话的含义相关的问题或术语进行回复内容,计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
步骤S37,判断是否满足第二骚扰条件,若满足第二骚扰条件,则判断当前会话用户为异常用户,关闭当前会话,并将当前会话用户的IP加入黑名单,否则判断当前会话用户为正常用户;
所述第二骚扰条件为连续若干次返回至当前会话用户的问题或术语与当前会话用户回复内容为不相关,则满足第二骚扰条件;当返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度小于或小于等于设定值,则返回至当前会话用户的问题或术语与当前会话用户回复内容为判断为不相关。
优选的,本发明实施例中采用BM25算法计算当前会话用户的问题或术语与当前会话用户回复内容的相关度。
实施例4
本发明实施例公开了一种融合语义理解的防骚扰系统,如附图4所示,包括对话单元、语法分析单元、对话控制单元、异常判断单元;
所述对话单元用于与当前对话用户之间进行对话;
所述语法分析单元用于分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
所述异常判断单元用于根据所述语法分析单元分析的结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元;
所述对话控制单元用于接收异常判断单元的关闭当前会话指令关闭所述对话单元的当前会话。
进一步的,所述系统还包括相关度单元,所述语法分析单元用于分析当会话用户连续若干次说的话分别不能组成一个符合语法句子,所述异常判断单元通知所述对话控制单元发送与当前会话用户所说话的含义相关的问题或术语至对话单元;
所述相关度单元用于计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
所述异常判断单元用于根据所述相关度单元的计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元。
进一步的,所述系统还包括关键词检测单元和/或IP获取单元;
所述关键词检测单元用于从所述对话单元获取对话数据,监测当前会话的‘骚扰’关键词出现的次数;
所述IP获取单元用于监控所述对话单元的当前对话用户IP访问的次数和/或频率;
所述异常判断单元用于根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若所述异常判断单元判断为恶意用户,则所述异常判断单元发送关闭当前会话指令至所述对话控制单元。
需要说明的是,本发明所述系统还包括存储单元,用于存储黑名单,用于记录各种异常信息。
实施例5
本发明实施例公开了一种终端,优选地,所述终端为移动终端,如智能手机、电脑、IPAD、笔记本等,所述终端包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被所述处理器执行时实现融合语义理解的防骚扰方法的步骤。
所述融合语义理解的防骚扰方法的具体实施案例与实施例1、2、3的所述融合语义理解的防骚扰方法,在此不再赘述。
本领域技术人员可以理解,所述存储器包括但不限于随机存储器、闪存、只读存储器、可编程只读存储器、易失性存储器、非易失性存储器、串行存储器、并行存储器或寄存器等;所述处理器可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。
实施例6
本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被所述处理器执行时实现融合语义理解的防骚扰方法的步骤。所述融合语义理解的防骚扰方法的具体实施案例与实施例1、2、3的所述融合语义理解的防骚扰方法,在此不再赘述。
所述计算机可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(StaticRandom-Access Memory,SRAM)、只读存储器(Read Only Memory,ROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。
以上所述仅为本发明说明书一个或多个实施例的实施例而已,并不用于限制本发明说明书一个或多个实施例。对于本领域技术人员而言,本发明说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。

Claims (10)

1.一种融合语义理解的防骚扰方法,其特征在于,包括如下步骤:
获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
判断是否满足第一骚扰条件,若满足第一骚扰条件,则判断当前会话用户为异常用户;
所述第一骚扰条件为当前会话用户连续若干次说的话都是一个语法有误的句子,则满足第一骚扰条件。
2.根据权利要求1的所述融合语义理解的防骚扰方法,其特征在于,
采用隐马尔科夫算法计算当前会话用户所说的话组成一个符合语法句子的概率,并根据概率值的大小判断当前会话用户所说的话是否有效。
3.根据权利要求1的所述融合语义理解的防骚扰方法,其特征在于,
若不满足第一骚扰条件,则学习当前会话用户所说话的含义,根据当前会话用户所说话的含义返回与当前会话用户所说话的含义相关的问题或术语至当前会话;
获取当前用户针对返回的当前会话用户所说话的含义相关的问题或术语进行回复内容,计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
判断是否满足第二骚扰条件,若满足第二骚扰条件,则判断当前会话用户为异常用户,否则判断当前会话用户为正常用户;
所述第二骚扰条件为连续若干次返回至当前会话用户的问题或术语与当前会话用户回复内容为不相关,则满足第二骚扰条件;当返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度小于或小于等于设定值,则返回至当前会话用户的问题或术语与当前会话用户回复内容为判断为不相关。
4.根据权利要求3所述的融合语义理解的防骚扰方法,其特征在于,
采用BM25算法计算当前会话用户的问题或术语与当前会话用户回复内容的相关度。
5.根据权利要求1所述的融合语义理解的防骚扰方法,其特征在于,
在分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率前,还包括:
统计当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率;
根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若满足恶意用户条件,则判断当前会话用户为异常用户,否则获取当前会话信息,分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率。
6.一种融合语义理解的防骚扰系统,其特征在于,
所述系统包含对话单元、语法分析单元、对话控制单元、异常判断单元;
所述对话单元用于与当前对话用户之间进行对话;
所述语法分析单元用于分析当会话用户连续若干次说的话分别能组成一个符合语法句子的概率;
所述异常判断单元用于根据所述语法分析单元分析的结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元;
所述对话控制单元用于接收异常判断单元的关闭当前会话指令关闭所述对话单元的当前会话。
7.根据权利要求6所述的融合语义理解的防骚扰系统,其特征在于,
所述系统还包括相关度单元,
所述语法分析单元用于分析当会话用户连续若干次说的话分别不能组成一个符合语法句子,所述异常判断单元通知所述对话控制单元发送与当前会话用户所说话的含义相关的问题或术语至对话单元;
所述相关度单元用于计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度;
所述异常判断单元用于根据所述相关度单元的计算返回至当前会话用户的问题或术语与当前会话用户回复内容的相关度结果判断当前对话用户是否为异常用户;若异常判断单元的判断结果为当前对话用户为异常用户,发送关闭当前会话指令至所述对话控制单元。
8.根据权利要求7所述的融合语义理解的防骚扰系统,其特征在于,
所述系统还包括关键词检测单元和/或IP获取单元;
所述关键词检测单元用于从所述对话单元获取对话数据,监测当前会话的‘骚扰’关键词出现的次数;
所述IP获取单元用于监控所述对话单元的当前对话用户IP访问的次数和/或频率;
所述异常判断单元用于根据当前会话的‘骚扰’关键词出现的次数和/或监控通过用户IP访问的次数和/或频率判断当前会话用户是否为恶意用户,若所述异常判断单元判断为恶意用户,则所述异常判断单元发送关闭当前会话指令至所述对话控制单元。
9.一种终端,其特征在于,
所述终端包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被所述处理器执行时实现如权利要求1至5中任一项所述的融合语义理解的防骚扰方法的步骤。
10.一种计算机可读存储介质,其特征在于,
所述计算机可读存储介质上存储有融合语义理解的防骚扰程序,所述融合语义理解的防骚扰程序被处理器执行时实现如权利要求1至5中任一项所述的融合语义理解的防骚扰方法的步骤。
CN201910355198.8A 2019-04-29 2019-04-29 一种融合语义理解的防骚扰方法、系统、终端及存储介质 Active CN110225207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910355198.8A CN110225207B (zh) 2019-04-29 2019-04-29 一种融合语义理解的防骚扰方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910355198.8A CN110225207B (zh) 2019-04-29 2019-04-29 一种融合语义理解的防骚扰方法、系统、终端及存储介质

Publications (2)

Publication Number Publication Date
CN110225207A true CN110225207A (zh) 2019-09-10
CN110225207B CN110225207B (zh) 2021-08-06

Family

ID=67820335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910355198.8A Active CN110225207B (zh) 2019-04-29 2019-04-29 一种融合语义理解的防骚扰方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN110225207B (zh)

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040225650A1 (en) * 2000-03-06 2004-11-11 Avaya Technology Corp. Personal virtual assistant
CN102456344A (zh) * 2010-10-22 2012-05-16 中国电信股份有限公司 基于语音识别技术分析客户行为特征的系统及方法
CN103226580A (zh) * 2013-04-02 2013-07-31 西安交通大学 一种面向交互文本的话题识别方法
CN103475642A (zh) * 2013-08-22 2013-12-25 北京奇虎科技有限公司 恶意论坛的识别方法及装置
CN103701999A (zh) * 2012-09-27 2014-04-02 中国电信股份有限公司 呼叫中心语音通话的监控方法与系统
CN105389341A (zh) * 2015-10-22 2016-03-09 国网山东省电力公司电力科学研究院 一种客服电话重复来电工单的文本聚类与分析方法
US20160127569A1 (en) * 2014-11-01 2016-05-05 Somos, Inc. Real time, machine-based routing table creation and enhancement for toll-free telecommunications
CN107122394A (zh) * 2017-03-10 2017-09-01 博彦科技股份有限公司 异常数据检测方法和装置
CN107203522A (zh) * 2016-03-16 2017-09-26 北京京东尚科信息技术有限公司 一种恶意订单地址的判定方法和装置
JP2018005818A (ja) * 2016-07-08 2018-01-11 日本電信電話株式会社 異常検知システム及び異常検知方法
CN108121701A (zh) * 2017-12-26 2018-06-05 深圳市海派通讯科技有限公司 一种防骚扰的自动识别方法及其智能终端
CN108304540A (zh) * 2018-01-29 2018-07-20 腾讯科技(深圳)有限公司 一种文本数据识别方法、装置及相关设备
CN108595655A (zh) * 2018-04-27 2018-09-28 福建师范大学 一种基于会话特征相似性模糊聚类的异常用户检测方法
CN108769434A (zh) * 2018-05-24 2018-11-06 郑州村村联网络技术有限公司 来电处理方法、装置及系统
CN109034661A (zh) * 2018-08-28 2018-12-18 腾讯科技(深圳)有限公司 用户识别方法、装置、服务器以及存储介质
CN109255027A (zh) * 2018-08-27 2019-01-22 上海宝尊电子商务有限公司 一种电商评论情感分析降噪的方法和装置
CN109284371A (zh) * 2018-09-03 2019-01-29 平安证券股份有限公司 反欺诈方法、电子装置及计算机可读存储介质
CN109377983A (zh) * 2018-10-18 2019-02-22 深圳壹账通智能科技有限公司 一种基于语音交互的骚扰电话拦截方法及相关设备
CN109618068A (zh) * 2018-11-08 2019-04-12 上海航动科技有限公司 一种基于人工智能的语音业务推送方法、装置与系统
CN109635271A (zh) * 2018-10-22 2019-04-16 阿里巴巴集团控股有限公司 一种用户意图识别方法、客服服务系统、装置及电子设备
CN109658928A (zh) * 2018-12-06 2019-04-19 山东大学 一种家庭服务机器人云端多模态对话方法、装置及系统
CN109688276A (zh) * 2018-12-29 2019-04-26 苏州意能通信息技术有限公司 一种基于人工智能技术的来电过滤系统及其方法

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040225650A1 (en) * 2000-03-06 2004-11-11 Avaya Technology Corp. Personal virtual assistant
CN102456344A (zh) * 2010-10-22 2012-05-16 中国电信股份有限公司 基于语音识别技术分析客户行为特征的系统及方法
CN103701999A (zh) * 2012-09-27 2014-04-02 中国电信股份有限公司 呼叫中心语音通话的监控方法与系统
CN103226580A (zh) * 2013-04-02 2013-07-31 西安交通大学 一种面向交互文本的话题识别方法
CN103475642A (zh) * 2013-08-22 2013-12-25 北京奇虎科技有限公司 恶意论坛的识别方法及装置
US20180027129A1 (en) * 2014-11-01 2018-01-25 Somos, Inc. Toll-tree numbers metadata tagging, analysis and reporting
US20160127569A1 (en) * 2014-11-01 2016-05-05 Somos, Inc. Real time, machine-based routing table creation and enhancement for toll-free telecommunications
CN105389341A (zh) * 2015-10-22 2016-03-09 国网山东省电力公司电力科学研究院 一种客服电话重复来电工单的文本聚类与分析方法
CN107203522A (zh) * 2016-03-16 2017-09-26 北京京东尚科信息技术有限公司 一种恶意订单地址的判定方法和装置
JP2018005818A (ja) * 2016-07-08 2018-01-11 日本電信電話株式会社 異常検知システム及び異常検知方法
CN107122394A (zh) * 2017-03-10 2017-09-01 博彦科技股份有限公司 异常数据检测方法和装置
CN108121701A (zh) * 2017-12-26 2018-06-05 深圳市海派通讯科技有限公司 一种防骚扰的自动识别方法及其智能终端
CN108304540A (zh) * 2018-01-29 2018-07-20 腾讯科技(深圳)有限公司 一种文本数据识别方法、装置及相关设备
CN108595655A (zh) * 2018-04-27 2018-09-28 福建师范大学 一种基于会话特征相似性模糊聚类的异常用户检测方法
CN108769434A (zh) * 2018-05-24 2018-11-06 郑州村村联网络技术有限公司 来电处理方法、装置及系统
CN109255027A (zh) * 2018-08-27 2019-01-22 上海宝尊电子商务有限公司 一种电商评论情感分析降噪的方法和装置
CN109034661A (zh) * 2018-08-28 2018-12-18 腾讯科技(深圳)有限公司 用户识别方法、装置、服务器以及存储介质
CN109284371A (zh) * 2018-09-03 2019-01-29 平安证券股份有限公司 反欺诈方法、电子装置及计算机可读存储介质
CN109377983A (zh) * 2018-10-18 2019-02-22 深圳壹账通智能科技有限公司 一种基于语音交互的骚扰电话拦截方法及相关设备
CN109635271A (zh) * 2018-10-22 2019-04-16 阿里巴巴集团控股有限公司 一种用户意图识别方法、客服服务系统、装置及电子设备
CN109618068A (zh) * 2018-11-08 2019-04-12 上海航动科技有限公司 一种基于人工智能的语音业务推送方法、装置与系统
CN109658928A (zh) * 2018-12-06 2019-04-19 山东大学 一种家庭服务机器人云端多模态对话方法、装置及系统
CN109688276A (zh) * 2018-12-29 2019-04-26 苏州意能通信息技术有限公司 一种基于人工智能技术的来电过滤系统及其方法

Also Published As

Publication number Publication date
CN110225207B (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
Lowe et al. The ubuntu dialogue corpus: A large dataset for research in unstructured multi-turn dialogue systems
CN110020422B (zh) 特征词的确定方法、装置和服务器
Doddington et al. SHEEP, GOATS, LAMBS and WOLVES: a statistical analysis of speaker performance in the NIST 1998 speaker recognition evaluation.
CN108897732B (zh) 语句类型识别方法和装置、存储介质及电子装置
CN113360622B (zh) 用户对话信息的处理方法、装置及计算机设备
CN110149266A (zh) 垃圾邮件识别方法及装置
CN109739961A (zh) 一种人机语言交互方法及装置
CN110287318B (zh) 业务操作的检测方法及装置、存储介质、电子装置
Sandbank et al. Detecting egregious conversations between customers and virtual agents
CN109492221A (zh) 一种基于语义分析的信息回复方法及可穿戴设备
CN112468659A (zh) 应用于电话客服的质量评价方法、装置、设备及存储介质
CN111416728B (zh) 会话结束预测、在线客服服务的方法、系统、设备及介质
CN109697676B (zh) 基于社交群的用户分析及应用方法和装置
CN111061837A (zh) 话题识别方法、装置、设备及介质
CN112446210A (zh) 用户性别预测方法、装置及电子设备
CN111159404A (zh) 文本的分类方法及装置
CN106998336B (zh) 渠道中的用户检测方法和装置
CN113434670A (zh) 话术文本生成方法、装置、计算机设备和存储介质
CN116996325A (zh) 一种基于云计算的网络安全检测方法及系统
CN115238799A (zh) 基于ai随机森林恶意流量检测方法和系统
CN114186040A (zh) 一种智能机器人客服的运作方法
CN110225207A (zh) 一种融合语义理解的防骚扰方法、系统、终端及存储介质
CN113095073B (zh) 语料标签生成方法、装置、计算机设备和存储介质
CN111464687A (zh) 一种陌生呼叫请求的处理方法及装置
CN115563296A (zh) 基于内容语义的融合检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant