CN110276067A - 文本意图确定方法以及装置 - Google Patents

文本意图确定方法以及装置 Download PDF

Info

Publication number
CN110276067A
CN110276067A CN201910376812.9A CN201910376812A CN110276067A CN 110276067 A CN110276067 A CN 110276067A CN 201910376812 A CN201910376812 A CN 201910376812A CN 110276067 A CN110276067 A CN 110276067A
Authority
CN
China
Prior art keywords
text
project
intended
classification
key word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910376812.9A
Other languages
English (en)
Other versions
CN110276067B (zh
Inventor
曹胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910376812.9A priority Critical patent/CN110276067B/zh
Publication of CN110276067A publication Critical patent/CN110276067A/zh
Application granted granted Critical
Publication of CN110276067B publication Critical patent/CN110276067B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供文本意图确定方法以及装置,其中所述文本意图确定方法包括:获取项目成员在参与互助项目的过程中提交的待处理文本,确定待处理文本的文本关键词;将文本关键词与项目关键词库中包含的项目关键词进行匹配;若匹配结果中包含文本关键词匹配的项目关键词所属的意图类别,则将文本关键词所属的意图类别确定为文本意图类别;基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;根据意图评分最高的文本意图类别对应的意图类别确定待处理文本的文本意图;通过所述文本意图确定方法,实现了方便快捷的确定所述项目成员的意图,在所述互助项目中根据所述项目成员的意图进行后续的项目处理具有重要的意义。

Description

文本意图确定方法以及装置
技术领域
本说明书涉及自然语言处理技术领域,特别涉及一种文本意图确定方法。本说明书同时涉及一种文本意图确定装置,一种电子设备,以及一种计算机可读存储介质。
背景技术
随着互联网保险业务的发展,市面上推出了相互制类型的保险项目,在此保险模式中,参保人达到此保险模式规定的准入条件后即可加入到此保险业务中,所述保险模式的参保人在保险业务期间患病或意外将获得理赔,理赔款由其他参保人分摊,通过保险公司进行扣款或由除获得理赔外的其他参保人进行缴费。此保险由于具有缴费金额低,受众规模大,相对更公平公正等优点,广受用户青睐。
现有技术中,在用户参与互助保险项目的过程中,用户提出关于互助保险项目问题的情况下,承载互助保险项目的项目平台获取用户提出的问题文本,根据NLP(naturallanguage processing,自然语言处理)算法,以及预设模型对用户提出的问题进行处理,从而确定用户提出的问题的意图。
然而,由于在互助保险模式下,用户提出的问题的数量较少,无法为预设模型提供大量的样本数据,如果采用预设模型确定用户提出问题的意图的情况下,预设模型输出的问题的意图与用户提出问题的意图存在较大的偏差,从而导致无法准确的描述出用户提出问题的意图。
发明内容
有鉴于此,本说明书实施例提供了一种文本意图确定方法。本说明书同时涉及一种文本意图确定装置,一种电子设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种文本意图确定方法,包括:
获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
可选的,所述基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分,包括:
根据所述匹配结果中包含的所述文本关键词匹配的所述项目关键词对应的关键词权重系数,以及所述文本关键词与所述项目关键词的匹配频次,计算所述文本关键词匹配的所述项目关键词对应的关键词权重系数与所述匹配频次的乘积;
将同一意图类别包含的所述文本关键词对应的关键词权重系数与所述匹配频次的乘积进行求和,作为所述文本意图类别的意图评分。
可选的,所述获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词,包括:
获取所述待处理文本以及所述项目成员的属性信息;
通过分词处理算法对所述待处理文本进行分词处理,根据分词处理结果确定所述待处理文本的待处理文本关键词,以及根据所述项目成员的属性信息确定所述项目成员的属性关键词;
计算所述待处理文本关键词与所述属性关键词的关键词匹配度;
在所述关键词匹配度大于预设关键词匹配度阈值的情况下,将所述待处理文本关键词作为所述文本关键词。
可选的,所述将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配步骤执行之后,还包括:
若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则在所述项目关键词库中添加所述文本关键词,并确定所述文本关键词所属的意图类别。
可选的,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案。
可选的,所述根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
在所述答案评价度小于预设答案评价度阈值的情况下,选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
可选的,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请,所述作答邀请中携带有所述项目问题文本以及作答时间。
可选的,所述根据所述文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请步骤执行之后,还包括:
获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端。
可选的,所述获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
将所述答案评价度与预设满意评价度数据库中的预设评价度进行匹配;
若匹配失败,则选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
可选的,所述项目成员通过如下步骤确定:
接收参与所述互助项目的用户的参与请求,所述参与请求中包含所述用户的属性信息和所述用户的行为信息;
检测所述用户的所述属性信息和所述行为信息是否符合预设审核标准;
若是,将所述用户确定为所述项目成员。
根据本说明书实施例的第二方面,提供了一种文本意图确定装置,包括:
获取模块,被配置为获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
匹配模块,被配置为将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
第一确定模块,被配置为若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
计算模块,被配置为基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
第二确定模块,被配置为根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
根据本说明书实施例的第三方面,提供了一种电子设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述文本意图确定方法的步骤。
与现有技术相比,本说明书具有如下优点:
本说明书提供一种文本意图确定方法,包括:获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
本说明书提供的文本意图确定方法,通过获取所述项目成员提交的待处理文本,根据所述待处理文本确定所述文本关键词,方便了在后续的文本意图的确定过程中确定所述待处理文本的文本意图,通过将所述文本关键词与所述项目关键词进行匹配,确定所述文本关键词的意图类别,基于所述意图类别计算各个意图类别的意图评分,选择意图评分最高的意图类别确定所述待处理文本的文本意图,实现了可以在不需要大量数据样本的情况下,预测所述项目成员提交的待处理文本的文本意图,并且确定所述待处理文本的文本意图的过程方便快捷,提高了确定所述待处理文本的文本意图的效率。
附图说明
图1是本说明书一实施例提供的文本意图确定方法的流程图;
图2是本说明书一实施例提供的文本意图确定方法过程的示意图;
图3是本说明书一实施例提供的文本意图确定装置的结构示意图;
图4是本说明书一实施例提供的电子设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施涉及的名词术语进行解释。
相互保险:具有同质风险保障需求的单位或个人,通过订立合同成为会员,并缴纳保费形成互助基金,由该基金对合同约定的事故发生所造成的损失承担赔偿责任,或者当被保险人死亡、伤残、疾病或者达到合同约定的年龄、期限等条件时承担给付保险金责任的保险活动。
在本说明书中,提供了一种文本意图确定方法,本说明书同时涉及一种文本意图确定装置,一种电子设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一实施例的文本意图确定方法的流程图,包括步骤102至步骤110。
步骤102:获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词。
本说明书一实施例中所述互助项目可以是互助共济项目、扶贫项目或者共享项目,其中,所述项目成员为成功参与所述互助共济项目、扶贫项目或者共享项目的项目成成员,此处,将以所述互助项目为互助共济项目为例,对所述文本意图确定方法进行描述。
基于此,所述互助共济项目是指将具有相同需求的用户,通过一定的筛选标准,将通过所述筛选标准的用户确定为所述互助共济项目中的项目成员,当所有项目成员中任意一名项目成员发生意外或者需要帮助时,只要该项目成员发生的意外或者需要帮助的事件在互助共济项目的受理范围内,参与所述互助共济项目的其他成员会为该项目成员提供一定的互助金或者一定的帮助。
具体实施时,参与所述互助项目的项目成员通过向承载所述互助项目的项目代理平台提交待处理文本,提交自身的问题,所述项目代理平台根据所述项目成员提交的待处理文本进行处理,确定所述项目成员提出问题的中心思想。
在对所述待处理文本进行处理的过程中,为了能够保证准确的确定所述待处理文本的文本意图,通过提取所述待处理文本的文本关键词,并设立项目关键词库,对所述文本关键词进行匹配,确定所述文本关键词的意图类别,若所述项目成员提出的问题存在多个文本关键词的情况下,对每个文本关键词所属的意图类别进行计算,确定每个意图类别的意图评分,选择意图评分最高的意图类别所表达的意思作为所述待处理文本的文本意图,可以准确的确定所述项目成员提出的问题的中心思想。
具体的,所述待处理文本可以是项目成员提出的关于互助项目的问题或者查询的请求。例如,所述项目成员为初次加入所述互助项目的成员,对所述互助项目各项条款不是特别了解,提出查看各项条款的请求的待处理文本,该待处理文本为:“我想要查看互助项目的理赔条款以及互助项目的互助条款”。
在获取所述待处理文本之前,所述项目成员需要通过审核才可以加入所述互助项目,进一步,本实施例的一个或多个实施方式中,所述项目成员的审核,具体实现方式如下所述:
接收参与所述互助项目的用户的参与请求,所述参与请求中包含所述用户的属性信息和所述用户的行为信息;
检测所述用户的所述属性信息和所述行为信息是否符合预设审核标准;
若是,将所述用户确定为所述项目成员。
具体的,在用户请求参与所述互助项目时,需要向承载所述互助项目的项目代理平台提交参与请求,所述参与请求中需要包含所述用户的属性信息以及用户的行为信息,检测所述属性信息以及所述行为信息是否符合预设审核标准,在所述用户的属性信息以及所述用户的行为信息符合预设审核标准的情况下,将所述用户确定为所述项目成员。
其中所述属性信息包括:年龄、住址、性别和国籍等信息,所述行为信息包括:每天运动时间、心率和睡眠等信息,所述预设审核标准包括:用户年龄限制、性别限制、国籍限制和运动时间限制等标准,具体的所述属性信息、所述行为信息以及所述预设审核标准可以根据实际应用场景进行设定,本说明书在此不做任何限定。
在实际应用中,以用户年龄为35,性别为男,每天运动时间为2小时为例,对用户加入互助项目的审核进行描述,其中,互助项目的预设审核标准为年龄在20至50岁之间,性别不限,每天运动时间为1小时以上,对该用户进行审核,根据预设审核标准确定该用户符合参与互助项目的预设审核标准,将该用户确定为互助项目中的项目成员。
本实施例的一个或多个实施方式中,所述获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词,包括:
获取所述待处理文本以及所述项目成员的属性信息;
通过分词处理算法对所述待处理文本进行分词处理,根据分词处理结果确定所述待处理文本的待处理文本关键词,以及根据所述项目成员的属性信息确定所述项目成员的属性关键词;
计算所述待处理文本关键词与所述属性关键词的关键词匹配度;
在所述关键词匹配度大于预设关键词匹配度阈值的情况下,将所述待处理文本关键词作为所述文本关键词。
具体的,通过获取所述待处理文本以及项目成员的属性信息,通过分词处理算法对所述待处理文本进行分词处理,确定所述待处理文本的待处理文本关键词,根据所述用户的属性信息确定所述用户的属性关键词,根据所述属性关键词以及所述待处理文本关键词计算两者的关键词匹配度,在所述关键词匹配度大于所述关键词匹配度阈值的情况下,说明所述待处理文本关键词与所述用户的属性关键词匹配度较高,将所述待处理文本关键词确定为所述待处理文本的文本关键词。
基于此,在所述待处理文本存在多个待处理文本关键词的情况下,分别将所述多个待处理文本关键词与所述用户的属性关键词进行计算关键词匹配度,将计算出的关键词匹配度大于预设关键词匹配度阈值的待处理文本关键词进行排序,选择匹配度最高的待处理文本关键词确定为所述待处理文本的文本关键词。
其中,所述属性关键词可以是用户的职业。所述分词处理算法为自然语言处理技术领域中的一种算法,通过所述分词处理算法可以将一句话划分为多个词句,例如,“坐在海边看日落”,将该语句进行分词处理算法进行分词,可以确定为“坐在”、“海边”、“看”和“日落”。
实际应用中,以所述待处理文本为“我要开车环游世界”,用户的属性信息为职业,该用户的职业是司机为例,对所述获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词进行描述,其中,通过分成处理算法确定“我要开车环游世界”的待处理文本关键词为“我”、“要”、“开车”、“环游”、“世界”,用户的职业为司机,计算这五个待处理文本关键词与属性关键词“司机”的关键词匹配度,根据计算确定“我”对应的关键词匹配度为5%,“要”对应的关键词匹配度为1%,“开车”对应的关键词匹配度为35%,“环游”对应的关键词匹配度为34%,“世界”对应的关键词匹配度为25%,预设关键词匹配度阈值为20%,根据比较确定“开车”、“环游”、“世界”与“司机”的关键词匹配度均大于预设匹配度阈值,将“开车”、“环游”、“世界”确定为待处理文本“我要开车环游世界”的文本关键词。
获取所述项目成员的属性信息,以及所述项目成员提交的待处理文本,通过分词处理算法确定所述待处理文本的待处理文本关键词,并计算所述属性信息对应的属性关键词与所述待处理文本对应的待处理文本关键词两者的关键词匹配度,将关键词匹配度大于预设关键词匹配度阈值的待处理文本关键词确定为所述待处理文本的文本关键词,提高了确定所述待处理文本的文本关键词的准确性。
步骤104:将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别。
具体的,根据上述获取的所述待处理文本,并对所述待处理文本进行分词处理,确定所述待处理文本的文本关键词,基于此,将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库为预设的,并且所述项目关键词库中的项目关键词均与所述互助项目相关,例如,所述互助项目为互助共济项目,则项目关键词库中的项目关键词可以包含“互助共济项目”、“共济”、“互助”、“帮助”等项目关键词。
其中,所述项目关键词中包含所述项目关键词所属的意图类别。仍以所述互助项目为互助共济项目为例进行描述,项目关键词库中包含:“购买”、“索赔”、“赔付金”、“五险一金”、“医保”和“社保”,其中,所述“购买”、“索赔”、“赔付金”所属投保理赔意图类别,所述“五险一金”、“医保”和“社保”所属产品相信信息意图类别。
具体实施时,所述项目关键词库中包含的所述项目关键词可以根据实际应用场景进行设定,本说明在此不做任何限定。
如果所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词匹配的结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则执行下述步骤106;
如果所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词匹配的结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则说明所述预设项目关键词库中不包含与所述文本关键词匹配的项目关键词。
在上述对所述文本关键词与所述项目关键词进行匹配的基础上,进一步,本实施例的一个或多个实施方式中,若未匹配到所述项目关键词的情况下,则执行如下步骤:
若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则在所述项目关键词库中添加所述文本关键词,并确定所述文本关键词所属的意图类别。
具体的,将所述文本关键词与所述预设的项目关键词库中包含的项目关键词进行匹配,若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词添加至所述项目关键词库中,作为所述项目关键词库中的项目关键词,并确定所述文本关键词的所属意图类别。
实际应用中,以所述文本关键词为“互助项目”为例,对所述文本关键词与所述项目关键词匹配的过程进行描述,其中,在所述项目关键词库中包含项目关键词为“互助项目”、“赔付”、“索赔”的情况下,将所述文本关键词“互助项目”与所述项目关键词“互助项目”、“赔付”、“索赔”进行匹配,确定所述文本关键词“互助项目”与所述项目关键词“互助项目”匹配,对所述文本关键词“互助项目”进行后续的确定文本意图处;在所述,项目关键词库中包含项目关键词为“赔付”、“索赔”的情况下,将所述文本关键词“互助项目”与所述项目关键词“赔付”、“索赔”进行匹配,确定所述文本关键词“互助项目”与所述项目关键词未匹配成功,所述项目关键词库中未包含所述文本关键词,将所述文本关键词添加至所述项目关键词库中,所述项目关键词库更新为包含“互助项目”、“赔付”、“索赔”项目关键词的项目关键词库。
具体实施时,所述项目关键词库中包含大量的项目关键词,并所述项目关键词库中的项目关键词实时更新,保证所述项目关键词库中包含的项目关键词与可能出现的文本关键词均可以匹配上。所述项目关键词所属的意图类别包含多种,在所述项目关键词库中的全部项目关键词均有所属的意图类别。
通过将所述文本关键词与所述项目关键词进行匹配,在未与所述项目关键词匹配成功的情况下,将所述文本关键词添加至所述项目关键词库,并确定所述文本关键词的所属意图类别,实现了实时更新所述项目关键词库,提高了所述项目关键词库中的项目关键词的丰富程度。
步骤106:若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别。
具体的,在上述将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配的基础上,进一步,若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将与所述文本关键词匹配的项目关键词的意图类别确定为所述文本关键词的文本意图类别。
具体实施时,所述待处理文本存在多个文本关键词的情况下,所述多个文本关键词均与所述项目关键词库中的项目关键词匹配,并每各文本关键词的所属文本意图类别均不一致,则待处理文本的多个文本关键词对应多个文本意图类别。
例如,所述项目关键词的意图类别为理赔类别,若所述文本关键词与所述项目关键词匹配成功,则将所述项目关键词的意图类别理赔类别确定为所述文本关键词的文本意图类别,则所述文本关键词的文本意图类别为理赔类别。
步骤108:基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分。
具体的,在确定所述文本关键词的文本意图类别的情况下,计算每个文本意图类别的意图评分,提高了确定所述待处理文本的文本意图的准确性。
本实施例的一个或多个实施方式中,计算所述各文本意图类别的意图评分,具体实现方式如下所述:
根据所述匹配结果中包含的所述文本关键词匹配的所述项目关键词对应的关键词权重系数,以及所述文本关键词与所述项目关键词的匹配频次,计算所述文本关键词匹配的所述项目关键词对应的关键词权重系数与所述匹配频次的乘积;
将同一意图类别包含的所述文本关键词对应的关键词权重系数与所述匹配频次的乘积进行求和,作为所述文本意图类别的意图评分。
具体的,所述项目关键词库中的每个项目关键词均有对应的关键词权重系数,在所述文本关键词与所述项目关键词匹配成功的情况下,将与所述文本关键词匹配的项目关键词对应的关键词权重系数赋予所述文本关键词,所述每个匹配成功的关键词均被赋予与项目关键词对应的关键词权重系数,同时确定每个文本关键词与所述项目关键词匹配的频次,可以理解为每个文本关键词在所待处理文本中出现的次数,出现多少次即为与所述项目关键词匹配多少次,将每个文本关键词的匹配频次与每个文本关键词被赋予的关键词权重系数进行乘积,将同一意文本意图类别下的文本关键词对应的乘积结果进行求和,确定为文本意图的意图评分。
具体实施时,所述项目关键词对应的关键词权重系数可以根据所述项目关键词在所述项目关键词库中的重要程度尽心设定,本说明书在此不做任何限定。
实际应用中,以待处理文本为“我有心脏病,我参与互助项目,互助项目会对我提供什么样的互助帮助呢?”为例,对基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分进行描述,通过确定待处理文本的文本关键词为“互助项目”、“帮助”和“心脏病”,其中所述“互助项目”和“帮助”的文本意图类别为帮助意图类别,所述“心脏病”的文本意图类别为疾病意图类别;并所述“互助项目”和“帮助”与项目关键词库中的项目关键词匹配,赋予所述“互助项目”的关键词权重系数为0.4,赋予所述“帮助”的关键词权重系数为0.3,并所述“心脏病”与项目关键词库中的项目关键词匹配,赋予所述“心脏病”的关键词权重系数为0.3;
所述文本关键词“互助项目”与所述项目关键词匹配的频次为2,文本关键词“帮助”与所述项目关键词匹配的频次为1,所述文本关键词“心脏病”与所述项目关键词匹配的频次为1,计算帮助意图类别与疾病意图类别的意图评分,帮助意图类别的意图评分为2*0.4+1*0.1=0.9,疾病意图类别的意图评分为1*0.3=0.3。
通过获取所述文本关键词与所述项目关键词匹配的频次,以及为所述文本关键词赋予对应项目关键词的权重系数,保证了计算所述文本意图的意图评分更真实,在后续确定所述待处理文本的文本意图变得更快捷更准确。
步骤110:根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
具体的,根据上述计算确定每个文本意图类别的意图评分,基于此,将所述每个样本意图的意图评分进行从高到低的顺序进行排列,根据意图评分最高的文本意图对应的意图类别确定所述待处理文本的文本意图。例如,意图评分最高的意图类别为理赔意图类别,将处理文本的文本意图可以确定为理赔。
本实施例的一个或多个实施方式中,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,确定所述项目问题文本的文本意图之后,执行如下步骤:
根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案。
具体的,在所述待处理文本为项目问题文本的情况下,通过所述文本意图确定方法确定所述项问题文本的文本意图,可以理解为确定所述项目问题文本的中心思想,根据所述项目问题的文本意图为所述项目问题匹配项目问题答案,并将所述项目问题答案发送至提出项目问题的项目成员的成员终端。
其中,所述项目问题文本可以是关于所述项目成员参与的互助项目的所有相关问题,所述项目成员的成员终端可以是项目成员的手机、穿戴设备或者电脑等职能设备。
在向所述项目成员的成员终端发送项目问题答案的基础上,进一步,本实施例的一个或多个实施方式中,根据所述项目成员针对所述项目问题答案返回的评价信息确定项目成员是否满意项目问题答案,具体实现方式如下所述:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
在所述答案评价度小于预设答案评价度阈值的情况下,选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
具体的,获取所述项目成员通过成员终端针对所述项目问题答案返回的评价信息,所述评价信息可以是针对所述项目问题答案的评价,采用语义识别算法识别所述评价信息,根据识别结果确定所述评价信息的答案评价度,将所述答案评价度与所述预设答案评价度阈值进行比较,若所述答案评价度大于所述预设答案评价度阈值,则说明所述项目成员比较满意所述项目问题答案;若所述答案评价度小于所述预设答案评价度阈值,则说明所述项目成员对所述项目问题答案比较不满意,可能原因是因为确定所述项目问题文本意图时,确定错误,可以选择低于意图评分最高的问题意图类别对应的意图类别,重新确定所述项目问题文本的问题意图,在针对新的项目问题文本的文本意图匹配新的项目问题答案,重新发送至所述项目成员的成员终端。
实际应用中,仍以上述待处理文本为“我有心脏病,我参与互助项目,互助项目会对我提供什么样的互助帮助呢?”为例,对判断项目成员是否满意项目问题答案进行描述,其中,所述答案评价度阈值为50%,根据上述确定待处理项目问题文本的文本意图为帮助意图类别,获取项目成员返回的评价信息,在所述评价信息为“没用”的情况下,通过语义识别算法识别评价信息“没用”,获得项目问题答案的答案评价度为0%,通过比较确定答案评价度小于预设答案评价度阈值,则说明待处理项目问题文本的文本意图确定错误,重新确定所述待处理项目问题文本的文本意图为疾病意图,向所述项目成员匹配关于疾病的项目问题答案,并发送至项目成员的成员终端,在次获取项目成员返回的评价信息,根据语义识别算法,确定评价信息的答案评价信息为“不错”,确定答案评价度为70%,根据与预设答案评价度阈值比较确定项目成员比较满意匹配的项目问题答案。
本实施例的一个或多个实施方式中,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,还提供了另外一种确定所述项目问题文本意图之后的实施例,具体实现方式如下所述:
根据所述项目问题文本的文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请,所述作答邀请中携带有所述项目问题文本以及作答时间。
具体的,在所述待处理文本为项目问题文本的情况下,通过所述文本意图确定方法确定所述项问题文本的文本意图,可以理解为确定所述项目问题文本的中心思想,根据所述项目问题的文本意图为所述项目问题匹配回答项目问题的作答成员,向所述作答成员发送作答邀请,所述作答邀请中携带有项目问题文本以及作答时间。
通过为所述项目问题匹配作答成员,能够更加准确的针对所述项目问题进行作答,提高了提出所述项目问题文本的项目成员的体验效果。
在上述邀请作答成员对项目问题进行作答的基础上,进一步,本实施例的一个或多个实施方式中,将作答的项目问题答案发送至项目成员的成员终端,具体实现方式如下所述:
获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端。
具体的,在所述作答成员针对所述项目问题答案作出回答的情况下,承载所述互助项目的项目代理平台将所述项目问题答案发送至所述项目成员的成员终端。
在向所述项目成员的成员终端发送项目问题答案的基础上,进一步,本实施例的一个或多个实施方式中,本实施例还提供了另外一种确定项目成员是否满意项目问题答案的实现方式,具体实现方式如下所述
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
将所述答案评价度与预设满意评价度数据库中的预设评价度进行匹配;
若匹配失败,则选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
具体的,在为所述项目问题匹配作答成员的情况下,判断所述项目成员是否满意所述作答成员的作答的项目问题答案描述内容,均可以参见上述为所述项目问题匹配项目问题答案的描述,本说明书在此不再赘述。
本说明提供的文本意图确定方法,通过获取所述项目成员提交的待处理文本,以及项目成员的属性信息,根据所述项目成员属性信息对应的属性关键词对所述待处理问题的待处理文本关键词进行匹配,将匹配度大于预设匹配度阈值的待处理文本关键词作为文本关键词,能够能加准确的确定待处理文本的文本关键词,确定每个文本关键词的所属文本意图类别,计算每个文本意图的意图评分,根据评分最高的文本意图类别对应的意图类别确定待处理文本的文本意图,能够能加准确的确定所述项目成员提交的待处理文本的中心思想,更准确的了解所述项目成员需要的帮助。
下述结合附图2,以本说明书提供的文本意图确定方法在互助共济项目中的应用为例,对所述文本意图确定方法过程进行进一步说明。其中,具体步骤包括步骤202至步骤220。
步骤202:获取项目成员提交的项目问题文本,并确定项目问题文本的文本关键词。
具体的,所述项目成员为参与所述互助共济项目的成员,所述项目问题为“互助共济项目的总项目成员数目是多少?”,根据确定所述项目问题的关键词为“互助共济项目”、“总”、“项目成员”、“数目”、“是”和“多少”。
步骤204:将文本关键词与项目关键词库中的项目关键词进行匹配。
具体的,将“互助共济项目”、“总”、“项目成员”、“数目”、“是”和“多少”与项目关键词库中的项目关键词匹配。
步骤206:确定与项目关键词匹配的文本关键词的意图类别。
具体的,根据“互助共济项目”、“总”、“项目成员”、“数目”、“是”和“多少”与项目关键词库中的项目关键词匹配,确定“互助共济项目”、“总”、“项目成员”、“数目”与项目关键词库中的项目关键词匹配。
基于此,确定每个项目关键词的所述意图类别,“互助共济项目”为产品意图类别,“总”、“项目成员”、“数目”为统计意图类别。
步骤208:计算产品意图类别与统计意图类别的意图评分。
具体的,根据“互助共济项目”对应的关键词权重系数确定产品意图类别的意图评分为0.8,根据“总”、“项目成员”、“数目”对应的关键词权重系数确定统计意图类别的意图评分为0.7。
步骤210:根据产品意图类别确定项目问题文本的文本意图。
具体的,根据比较确定统计意图类别的意图评分小于产品意图类别的意图评分,根据产品意图类别确定项目问题的文本意图,项目问题“互助共济项目的总项目成员数目是多少?”的意图为产品信息。
步骤212:根据产品意图类别为项目问题匹配项目问题答案,并将项目问题答案发送至项目成员的成员终端。
具体的,根据产品意图类别为项目问题匹配项目问题答案,项目问题答案为关于互助共济项目的产品信息,并项目问题答案发送至项目成员的手机设备。
步骤214:获取项目成员返回的针对项目问题答案的评价信息。
步骤216:判断评价信息的评价度与预设满意评价度数据库中的预设评价度是否匹配;若是,执行步骤218;若否,执行步骤220。
步骤218:对项目成员不做任何处理。
步骤220:将统计意图类别确定为项目问题文本的文本意图,重新对项目问题匹配项目问题答案。
具体的,将统计意图类别确定为项目问题文本的文本意图,项目问题的意图为统计,重新匹配项目问题答案为“五千万人”,进一步的,将项目问题答案“五千万人”发送至项目成员的成员终端。
本说明提供的文本意图确定方法,通过获取所述项目成员提交的项目问题文本,确定每个文本关键词的所属文本意图类别,计算每个文本意图的意图评分,根据评分最高的文本意图类别对应的意图类别确定项目问题文本的文本意图,能够能加准确的确定所述项目成员提交的待处理文本的中心思想,更准确的了解所述项目成员需要的帮助,即使在确定项目问题文本的文本意图确定错误的情况下,可以根据项目成员反馈的评价信息重新对项目成员匹配项目问题答案,提高了项目成员的体验效果。
与上述方法实施例相对应,本说明书还提供了文本意图确定装置实施例,
图3示出了本说明书一实施例的文本意图确定装置的结构示意图。如图3所示,该装置包括:
获取模块302,被配置为获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
匹配模块304,被配置为将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
第一确定模块306,被配置为若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
计算模块308,被配置为基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
第二确定模块310,被配置为根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
一个可选的实施例中,所述计算模块308,包括:
第一计算单元,被配置为根据所述匹配结果中包含的所述文本关键词匹配的所述项目关键词对应的关键词权重系数,以及所述文本关键词与所述项目关键词的匹配频次,计算所述文本关键词匹配的所述项目关键词对应的关键词权重系数与所述匹配频次的乘积;
第二计算单元,被配置为将同一意图类别包含的所述文本关键词对应的关键词权重系数与所述匹配频次的乘积进行求和,作为所述文本意图类别的意图评分。
一个可选的实施例中,其特征在于,所述获取模块302,包括:
获取单元,被配置为获取所述待处理文本以及所述项目成员的属性信息;
确定单元,被配置为通过分词处理算法对所述待处理文本进行分词处理,根据分词处理结果确定所述待处理文本的待处理文本关键词,以及根据所述项目成员的属性信息确定所述项目成员的属性关键词;
计算匹配度单元,被配置为计算所述待处理文本关键词与所述属性关键词的关键词匹配度;
在所述关键词匹配度大于预设关键词匹配度阈值的情况下,运行文本关键词单元;
所述文本关键词单元,被配置为将所述待处理文本关键词作为所述文本关键词。
一个可选的实施例中,所述文本意图确定装置,还包括:
添加文本关键词模块,被配置为若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则在所述项目关键词库中添加所述文本关键词,并确定所述文本关键词所属的意图类别。
一个可选的实施例中,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述文本意图确定装置,还包括:
第一发送模块,被配置为根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案。
一个可选的实施例中,所述文本意图确定装置,还包括:
第一获取模块,被配置为获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
第一识别模块,被配置为采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
在所述答案评价度小于预设答案评价度阈值的情况下,运行第一选择模块;
所述第一选择模块,被配置为选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
一个可选的实施例中,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述文本意图确定装置,还包括:
第二发送模块,被配置为根据所述项目问题文本的文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请,所述作答邀请中携带有所述项目问题文本以及作答时间。
一个可选的实施例中,所述文本意图确定装置,还包括:
发送项目问题答案模块,被配置为获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端。
一个可选的实施例中,所述文本意图确定装置,还包括:
第二获取模块,被配置为获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
第二识别模块,被配置为采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
匹配模块,被配置为将所述答案评价度与预设满意评价度数据库中的预设评价度进行匹配;
若匹配失败,运行第二选择模块;
所述第二选择模块,被配置为选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
一个可选的实施例中,所述项目成员通过如下步骤确定:
接收参与所述互助项目的用户的参与请求,所述参与请求中包含所述用户的属性信息和所述用户的行为信息;
检测所述用户的所述属性信息和所述行为信息是否符合预设审核标准;
若是,将所述用户确定为所述项目成员。
本说明书提供的文本意图确定装置,通过获取所述项目成员提交的待处理文本,以及项目成员的属性信息,根据所述项目成员属性信息对应的属性关键词对所述待处理问题的待处理文本关键词进行匹配,将匹配度大于预设匹配度阈值的待处理文本关键词作为文本关键词,能够能加准确的确定待处理文本的文本关键词,确定每个文本关键词的所属文本意图类别,计算每个文本意图的意图评分,根据评分最高的文本意图类别对应的意图类别确定待处理文本的文本意图,能够能加准确的确定所述项目成员提交的待处理文本的中心思想,更准确的了解所述项目成员需要的帮助。
上述为本实施例的一种文本意图确定装置的示意性方案。需要说明的是,该文本意图确定装置的技术方案与上述的文本意图确定方法的技术方案属于同一构思,文本意图确定装置的技术方案未详细描述的细节内容,均可以参见上述文本意图确定方法的技术方案的描述。
图4示出了根据本说明书一实施例的电子设备400的结构框图。该电子设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
电子设备400还包括接入设备440,接入设备440使得电子设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,电子设备400的上述以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的电子设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
电子设备400可以是任何类型的静止或移动电子设备,包括移动计算机或移动电子设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的电子设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止电子设备。电子设备400还可以是移动式或静止式的服务器。
其中,处理器420用于执行如下计算机可执行指令:
获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
可选的,所述基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分,包括:
根据所述匹配结果中包含的所述文本关键词匹配的所述项目关键词对应的关键词权重系数,以及所述文本关键词与所述项目关键词的匹配频次,计算所述文本关键词匹配的所述项目关键词对应的关键词权重系数与所述匹配频次的乘积;
将同一意图类别包含的所述文本关键词对应的关键词权重系数与所述匹配频次的乘积进行求和,作为所述文本意图类别的意图评分。
可选的,所述获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词,包括:
获取所述待处理文本以及所述项目成员的属性信息;
通过分词处理算法对所述待处理文本进行分词处理,根据分词处理结果确定所述待处理文本的待处理文本关键词,以及根据所述项目成员的属性信息确定所述项目成员的属性关键词;
计算所述待处理文本关键词与所述属性关键词的关键词匹配度;
在所述关键词匹配度大于预设关键词匹配度阈值的情况下,将所述待处理文本关键词作为所述文本关键词。
可选的,所述将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配步骤执行之后,还包括:
若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则在所述项目关键词库中添加所述文本关键词,并确定所述文本关键词所属的意图类别。
可选的,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案。
可选的,所述根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
在所述答案评价度小于预设答案评价度阈值的情况下,选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
可选的,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请,所述作答邀请中携带有所述项目问题文本以及作答时间。
可选的,所述根据所述文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请步骤执行之后,还包括:
获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端。
可选的,所述获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
将所述答案评价度与预设满意评价度数据库中的预设评价度进行匹配;
若匹配失败,则选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
可选的,所述项目成员通过如下步骤确定:
接收参与所述互助项目的用户的参与请求,所述参与请求中包含所述用户的属性信息和所述用户的行为信息;
检测所述用户的所述属性信息和所述行为信息是否符合预设审核标准;
若是,将所述用户确定为所述项目成员。
上述为本实施例的一种电子设备的示意性方案。需要说明的是,该电子设备的技术方案与上述的文本意图确定方法的技术方案属于同一构思,电子设备的技术方案未详细描述的细节内容,均可以参见上述文本意图确定方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述文本意图确定方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的文本意图确定方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述文本意图确定方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (13)

1.一种文本意图确定方法,其特征在于,包括:
获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
2.根据权利要求1所述的文本意图确定方法,其特征在于,所述基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分,包括:
根据所述匹配结果中包含的所述文本关键词匹配的所述项目关键词对应的关键词权重系数,以及所述文本关键词与所述项目关键词的匹配频次,计算所述文本关键词匹配的所述项目关键词对应的关键词权重系数与所述匹配频次的乘积;
将同一意图类别包含的所述文本关键词对应的关键词权重系数与所述匹配频次的乘积进行求和,作为所述文本意图类别的意图评分。
3.根据权利要求1所述的文本意图确定方法,其特征在于,所述获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词,包括:
获取所述待处理文本以及所述项目成员的属性信息;
通过分词处理算法对所述待处理文本进行分词处理,根据分词处理结果确定所述待处理文本的待处理文本关键词,以及根据所述项目成员的属性信息确定所述项目成员的属性关键词;
计算所述待处理文本关键词与所述属性关键词的关键词匹配度;
在所述关键词匹配度大于预设关键词匹配度阈值的情况下,将所述待处理文本关键词作为所述文本关键词。
4.根据权利要求1所述的文本意图确定方法,其特征在于,所述将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配步骤执行之后,还包括:
若匹配结果中不包含所述文本关键词匹配的所述项目关键词所属的意图类别,则在所述项目关键词库中添加所述文本关键词,并确定所述文本关键词所属的意图类别。
5.根据权利要求1所述的文本意图确定方法,其特征在于,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案。
6.根据权利要求5所述的文本意图确定方法,其特征在于,所述根据所述项目问题文本的文本意图为所述项目问题匹配项目问题答案,并向所述项目成员的成员终端发送所述项目问题答案步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
在所述答案评价度小于预设答案评价度阈值的情况下,选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
7.根据权利要求1所述的文本意图确定方法,其特征在于,所述待处理文本为所述项目成员在参与所述互助项目的过程中提交的项目问题对应的项目问题文本情况下,
相应的,所述根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图步骤执行之后,还包括:
根据所述项目问题文本的文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请,所述作答邀请中携带有所述项目问题文本以及作答时间。
8.根据权利要求7所述的文本意图确定方法,其特征在于,所述根据所述文本意图为所述项目问题匹配作答成员,并向所述作答成员的成员终端发送作答邀请步骤执行之后,还包括:
获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端。
9.根据权利要求8所述的文本意图确定方法,其特征在于,所述获取所述作答成员针对所述项目问题作答的项目问题答案,并将所述项目问题答案发送至所述项目成员的成员终端步骤执行之后,还包括:
获取所述项目成员通过所述成员终端针对所述项目问题答案提交的评价信息;
采用语义识别算法识别所述评价信息,获得所述项目成员针对所述项目问题答案的答案评价度;
将所述答案评价度与预设满意评价度数据库中的预设评价度进行匹配;
若匹配失败,则选择所述意图评分低于所述意图评分最高的所述文本意图类别对应的意图类别,确定所述项目问题文本的文本意图。
10.根据权利要求1所述的文本意图确定方法,其特征在于,所述项目成员通过如下步骤确定:
接收参与所述互助项目的用户的参与请求,所述参与请求中包含所述用户的属性信息和所述用户的行为信息;
检测所述用户的所述属性信息和所述行为信息是否符合预设审核标准;
若是,将所述用户确定为所述项目成员。
11.一种文本意图确定装置,其特征在于,包括:
获取模块,被配置为获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
匹配模块,被配置为将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
第一确定模块,被配置为若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
计算模块,被配置为基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
第二确定模块,被配置为根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
12.一种电子设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取项目成员在参与互助项目的过程中提交的待处理文本,并确定所述待处理文本的文本关键词;
将所述文本关键词与所述互助项目预设的项目关键词库中包含的项目关键词进行匹配,所述项目关键词库中包含所述项目关键词所属的意图类别;
若匹配结果中包含所述文本关键词匹配的所述项目关键词所属的意图类别,则将所述文本关键词所属的意图类别确定为文本意图类别;
基于各文本意图类别包含的文本关键词计算各文本意图类别的意图评分;
根据所述意图评分最高的文本意图类别对应的意图类别确定所述待处理文本的文本意图。
13.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1至10任意一项所述文本意图确定方法的步骤。
CN201910376812.9A 2019-05-07 2019-05-07 文本意图确定方法以及装置 Active CN110276067B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910376812.9A CN110276067B (zh) 2019-05-07 2019-05-07 文本意图确定方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910376812.9A CN110276067B (zh) 2019-05-07 2019-05-07 文本意图确定方法以及装置

Publications (2)

Publication Number Publication Date
CN110276067A true CN110276067A (zh) 2019-09-24
CN110276067B CN110276067B (zh) 2022-11-22

Family

ID=67959692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910376812.9A Active CN110276067B (zh) 2019-05-07 2019-05-07 文本意图确定方法以及装置

Country Status (1)

Country Link
CN (1) CN110276067B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737698A (zh) * 2019-10-15 2020-01-31 重庆浪尖至简物联网科技有限公司 一种基于问题描述的问题相关信息推荐方法
CN111078855A (zh) * 2019-12-19 2020-04-28 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN111159546A (zh) * 2019-12-24 2020-05-15 腾讯科技(深圳)有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
CN111325037A (zh) * 2020-03-05 2020-06-23 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN112201250A (zh) * 2020-09-30 2021-01-08 中移(杭州)信息技术有限公司 一种语义分析方法、装置、电子设备及存储介质
CN112885348A (zh) * 2021-01-25 2021-06-01 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN113515940A (zh) * 2021-07-14 2021-10-19 上海芯翌智能科技有限公司 一种用于文本搜索的方法及设备
CN114254624A (zh) * 2021-12-01 2022-03-29 马上消费金融股份有限公司 一种确定网站类型的方法及其系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062482A1 (en) * 2013-11-01 2015-05-07 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN108875067A (zh) * 2018-06-29 2018-11-23 北京百度网讯科技有限公司 文本数据分类方法、装置、设备及存储介质
CN109614608A (zh) * 2018-10-26 2019-04-12 平安科技(深圳)有限公司 电子装置、文本信息检测方法及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062482A1 (en) * 2013-11-01 2015-05-07 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN108875067A (zh) * 2018-06-29 2018-11-23 北京百度网讯科技有限公司 文本数据分类方法、装置、设备及存储介质
CN109614608A (zh) * 2018-10-26 2019-04-12 平安科技(深圳)有限公司 电子装置、文本信息检测方法及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737698A (zh) * 2019-10-15 2020-01-31 重庆浪尖至简物联网科技有限公司 一种基于问题描述的问题相关信息推荐方法
CN111078855A (zh) * 2019-12-19 2020-04-28 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN111159546A (zh) * 2019-12-24 2020-05-15 腾讯科技(深圳)有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
CN111159546B (zh) * 2019-12-24 2023-10-24 深圳市雅阅科技有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备
CN111325037A (zh) * 2020-03-05 2020-06-23 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN111325037B (zh) * 2020-03-05 2022-03-29 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN112201250A (zh) * 2020-09-30 2021-01-08 中移(杭州)信息技术有限公司 一种语义分析方法、装置、电子设备及存储介质
CN112201250B (zh) * 2020-09-30 2024-03-19 中移(杭州)信息技术有限公司 一种语义分析方法、装置、电子设备及存储介质
CN112885348A (zh) * 2021-01-25 2021-06-01 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN112885348B (zh) * 2021-01-25 2024-03-08 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN113515940A (zh) * 2021-07-14 2021-10-19 上海芯翌智能科技有限公司 一种用于文本搜索的方法及设备
CN114254624A (zh) * 2021-12-01 2022-03-29 马上消费金融股份有限公司 一种确定网站类型的方法及其系统

Also Published As

Publication number Publication date
CN110276067B (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN110276067A (zh) 文本意图确定方法以及装置
CN110612525B (zh) 通过使用交流话语树启用修辞分析
WO2020107806A1 (zh) 一种推荐方法及装置
CN110349033A (zh) 项目案件初审方法以及装置
CN109599187A (zh) 一种在线问诊的分诊方法、服务器、终端、设备及介质
CN110209774A (zh) 处理会话信息的方法、装置及终端设备
US20230252224A1 (en) Systems and methods for machine content generation
CN110322216A (zh) 基于知识图谱的案件审核方法以及装置
CN110084705A (zh) 一种项目推荐方法及装置、一种电子设备及存储介质
Plotnick et al. Better child support enforcement: Can it reduce teenage premarital childbearing?
US20230222409A1 (en) Apparatus for Determining Role Fitness While Eliminating Unwanted Bias
CN111402072B (zh) 信息处理方法及装置
US20220156862A1 (en) System and method for analyzing grantability of a legal filing
Gao et al. PersonalitySensing: A multi-view multi-task learning approach for personality detection based on smartphone usage
CN108388944A (zh) Lstm神经网络芯片及其使用方法
US20220148699A1 (en) Systems and methods for hosting wellness programs
CN110197196A (zh) 问题处理方法、装置、电子设备以及存储介质
CN110288485A (zh) 基于位置的审核成员筛选方法以及装置
CN110399473A (zh) 为用户问题确定答案的方法和装置
Terzian et al. Simplicity of what? A case study from generative linguistics
CN109712645A (zh) 自主通话系统和自主通话方法
CN110232148A (zh) 项目推荐系统、方法以及装置
CN113434651B (zh) 话术推荐方法、装置及相关设备
CN111612321B (zh) 员工工作配置方法及装置
CN114902230A (zh) 改进的话语解析

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200930

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant