CN111080448B - 一种基于会话的意图分析方法 - Google Patents

一种基于会话的意图分析方法 Download PDF

Info

Publication number
CN111080448B
CN111080448B CN201911216352.XA CN201911216352A CN111080448B CN 111080448 B CN111080448 B CN 111080448B CN 201911216352 A CN201911216352 A CN 201911216352A CN 111080448 B CN111080448 B CN 111080448B
Authority
CN
China
Prior art keywords
intention
user
session
sequence
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911216352.XA
Other languages
English (en)
Other versions
CN111080448A (zh
Inventor
徐雷洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suoxinda Data Technology Co ltd
Original Assignee
Shenzhen Suoxinda Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Suoxinda Data Technology Co ltd filed Critical Shenzhen Suoxinda Data Technology Co ltd
Priority to CN201911216352.XA priority Critical patent/CN111080448B/zh
Publication of CN111080448A publication Critical patent/CN111080448A/zh
Application granted granted Critical
Publication of CN111080448B publication Critical patent/CN111080448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于会话的意图分析方法,涉及数据处理技术领域,解决目前用户意图的界定基于粗的统计粒度分析存在意图实现成功率通常是偏高,降低了其他失败的真实意图在分析结果上的比重;细的粒度统计粒度分析存在无法保证用户一个意图的完整性的技术不足;方案包括如下步骤:构建基于交易场景、用户、会话、交易结果和会话起止时间的源数据集;在交易场景下基于用户抽样源数据集;基于样本集中意图的定义统计其意图持续时间并有短到长排序,取其序列的95%分位值为源数据集意图持续时间阈值;通过在会话序列上标记用户意图的起始和结束标志界定了用户在交易场景下每一个意图的整体,在此意图粒度基础上进行的数据分析能保证数据的规范性和完整性。

Description

一种基于会话的意图分析方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于会话的意图分析方法。
背景技术
随着大数据技术的发展,描述产品或用户的数据日渐丰富和多维。分析和了解用户行为进而迎合用户需求是各平台吸引用户并留住用户的重要途径。其中用户意图分析,包括用户意图的识别,用户意图的实现状况,用户意图的持续时长以及用户实现意图的尝试次数等,是分析和了解用户行为的重要工具。而准确和合理的用户意图分析的基础在于用户的一个意图的界定。
目前技术对用户意图的界定多是基于或粗或细的统计粒度进行的。
其中粗的粒度如用户在一段固定时间内(一个小时或一天等)的行为,或用户一次在某网站或应用从进入到退出的全部行为被认为是用户一个意图的实现过程。在上述粗粒度统计分析下无法排除用户在一个该粒度下的多个意图相互交织穿插,从而无法区分用户的那些意图实现了而哪些没有,那些意图更强烈而哪些更弱。如在一次进入和退出某银行手机银行应用的粗粒度下,整个过程可能包括多个理财产品的购买,多次充话费或缴电费等的尝试,因为缺少在更细粒度上的切分,分析的结论可能只包括用户有付费需求,整个粗粒度是用户支付意图的实现过程,而无法把其中每个真实支付意图的实现过程单独抽取出来进一步分析用户实现这些真实意图过程中遇到的困难或在哪些关键步骤中用户的流失情况。在粗粒度下统计分析的意图实现成功率通常是偏高的,因为一个粗粒度下可能包括多个真实意图,其中的任一个真实意图的实现结果为成功通常被判定为该粒度的一个实现结果为成功,降低了其他失败的真实意图在分析结果上的比重。而真实的意图实现成功率应该是能体现该粗粒度下每一个真实意图的实现成功或失败。
细的粒度如用户的一次会话。在上述细粒度统计分析下无法保证用户一个意图的完整性,如在理财平台购买产品时可能因为余额不足和密码错误等问题发起多个会话,这些会话组合起来才是用户一个完整的购买一款理财产品的意图实现。按照细粒度分析方法,该用户有多次理财意图并且多次结果为失败,而实际上该用户的多个会话是同一个理财意图的持续过程,在该过程中因为余额不足或密码错之类的问题导致了多个会话的切换。在细粒度下统计分析的意图实现成功率通常是偏低的,因为一个真实意图的成功实现可能会包括多个细粒度(如会话)的失败尝试,而这些失败的会话增加了分析结果上意图实现失败的比重。
发明内容
综上所述,本发明所要解决的技术问题是目前用户意图的界定基于粗的统计粒度分析存在意图实现成功率通常是偏高,降低了其他失败的真实意图在分析结果上的比重;细的粒度统计粒度分析存在无法保证用户一个意图的完整性的技术不足,而提出一种基于会话的意图分析方法。
为解决本发明所提出的技术问题,采用的技术方案为:
一种基于会话的意图分析方法,其特征在于所述方法包括如下步骤:
步骤S1,将预设日期内收集的用户会话信息,设定为待进行意图分析的数据集,并构建基于交易场景、用户、会话、交易结果和会话起止时间的源数据集;
步骤S2,源数据集中在选取其中一种类型的交易场景,并基于用户抽样获得样本集,以计算出用户一个意图的持续时间分布,为后续判定用户一个意图是否已经结束提供依据;
步骤S3,将样本集中交易场景下同一用户的会话按时间排序,作为第一序列;
步骤S4,将第一序列中的第一个会话标记为交易场景下该用户的第一个意图的起始;
步骤S5,将第一序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束;
步骤S6,将第一序列中最后一个会话标记为交易场景下该用户最后一个意图结束;
步骤S7,将第一序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始,用户一个意图结束后如果有新的会话,则标志着用户在一个意图实现之后又产生了新的意图;
步骤S8,将样本集中在交易场景下用户会话的第一序列由上述的意图起止标志分割为样本集中交易场景下用户意图的序列,作为第二序列;
步骤S9,将第二序列中一个意图的最后一个会话的结束时间和其第一个会话的开始时间求差取得该意图的持续时间,从而得到用户每一个意图的持续时间;将第二序列中的意图按持续时间由小到达的排序,作为第三序列;取其预设分位值作为源数据集意图分析的意图持续时间阈值,即第一特征值。
作为本发明的进一步改进的方案还包括有如下步骤:
步骤S10,将所述的第一特征值作为源数据集中交易场景下用户同一意图的会话时间范围的关联,即用户在一个意图的一个会话后的第一特征值时间内如果没有发起新的会话,则认为这个意图已经被用户中止,这个意图结束,并将源数据集中交易场景下同一用户的会话按时间排序作为第四序列;
步骤S11,将第四序列的第一个会话标记为交易场景下该用户的第一个意图的起始;
步骤S12,将第四序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束;
步骤S13,将第四序列中交易结果为交易失败且第一特征值时间值内没有下一个会话的会话标记为交易场景下该用户的一个意图的结束;
步骤S14,将第四序列中最后一个会话标记为交易场景下该用户最后一个意图结束;
步骤S15,将第四序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始;
步骤S16,将第四序列由上述的意图起止标志分割为意图的序列,即为用户在该场景下的意图分析结果。
所述的预设分位值为:95%分位值。
本发明的有益效果为:本发明的基于会话的意图分析方法,将用户在交易场景下的一个意图所细分的多个会话串联起来作为一个整体体现,此切分粒度介于上述粗细粒度之间,即将粗粒度下的进行细粒度会话切分,将每一个真实意图的实现过程包括的会话规整到一起,以确保每一个真实意图的实现结果和过程能在意图分析的结果中体现出来;本发明通过在会话序列上标记用户意图的起始和结束标志界定了用户在交易场景下每一个意图的整体,在此意图粒度基础上进行的数据分析能保证数据的规范性和完整性。
附图说明
图1为本发明流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用来限定本发明。
参照图1中所示,本发明一种基于会话的意图分析方法,包括如下步骤:
步骤S1,将预设日期内收集的用户会话信息,设定为待进行意图分析的数据集,并构建基于交易场景、用户、会话、交易结果和会话起止时间的源数据集;比如:收集一个月内用户的会话信息,设定为待进行意图分析的数据集。
以下以表1中的源数据集为例进行说明。应当理解,此处所描述的实例仅仅用以解释本发明流程,并不用来限定本发明。实际应用中的源数据集的数据量通常远远大于该实例所能展示的范围。
表1
步骤S2,源数据集中在选取其中一种类型的交易场景,并基于用户抽样获得样本集,以计算出用户一个意图的持续时间分布,为后续判定用户一个意图是否已经结束提供依据;
从示例表1中的源数据集中在交易场景“理财”下基于用户抽样获得样本集如下表2所示:
表2
姓名 交易场景 会话编号 交易结果 起始时间 结束时间
张三 理财 S0001 失败 11:30:05 11:35:02
张三 理财 S0002 成功 11:36:28 11:45:22
王五 理财 S0008 成功 11:31:15 11:35:33
张三 理财 S0003 成功 11:50:05 11:55:02
李四 理财 S0007 成功 11:42:22 11:45:27
张三 理财 S0004 失败 11:55:05 11:57:02
王五 理财 S0010 失败 11:50:05 11:57:02
张三 理财 S0005 成功 11:58:05 11:59:02
李四 理财 S0006 成功 11:29:01 11:35:12
王五 理财 S0009 失败 11:40:05 11:45:02
步骤S3,将样本集中交易场景下同一用户的会话按时间排序,作为第一序列;
将表2的示例样本集中同一用户的会话按时间排序可得到如下表3所示的会话序列1:
表3
姓名 交易场景 会话编号 交易结果 起始时间 结束时间
张三 理财 S0001 失败 11:30:05 11:35:02
张三 理财 S0002 成功 11:36:28 11:45:22
张三 理财 S0003 成功 11:50:05 11:55:02
张三 理财 S0004 失败 11:55:05 11:57:02
张三 理财 S0005 成功 11:58:05 11:59:02
李四 理财 S0006 成功 11:29:01 11:35:12
李四 理财 S0007 成功 11:42:22 11:45:27
王五 理财 S0008 成功 11:31:15 11:35:33
王五 理财 S0009 失败 11:40:05 11:45:02
王五 理财 S0010 失败 11:50:05 11:57:02
步骤S4,将第一序列中的第一个会话标记为交易场景下该用户的第一个意图的起始;
在会话序列1中一个用户的第一个会话标记为该用户第一个意图的起始如下表4所示:
表4
步骤S5,将第一序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束,交易结果为失败的会话由于尚未实现用户的交易意图,后续有可能发起新的会话去实现该意图;
在会话序列1中一个用户的交易结果为成功的会话标记为该用户的一个意图的结束如下表5所示:
表5
步骤S6,将第一序列中最后一个会话标记为交易场景下该用户一个意图的结束。
在会话序列1中一个用户的最后一个会话标记为该用户的一个意图的结束如下表6所示:
表6
步骤S7,将第一序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始,用户一个意图结束后如果有新的会话,则标志着用户在一个意图实现之后又产生了新的意图。
在会话序列1中一个用户的一个意图结束标志会话的下一个会话标记为该用户的下一个意图的起始,如下表7所示:
表7
步骤S8,将样本集中在交易场景下用户会话的第一序列由上述的意图起止标志分割为样本集中交易场景下用户意图的序列,作为第二序列。
将会话序列1根据意图起止标志分割,一个意图的起始时间为起始标志会话的起始时间,一个意图的结束时间为结束标志会话的结束时间,一个意图的结果为该意图的最后一个会话的交易结果,获得意图序列1如下表8所示:
表8
步骤S9,将第二序列中一个意图的最后一个会话的结束时间和其第一个会话的开始时间求差取得该意图的持续时间,从而得到用户每一个意图的持续时间;将第二序列中的意图按持续时间由小到达的排序,作为第三序列;取其95%分位值作为源数据集意图分析的意图持续时间阈值,即第一特征值。
在意图序列1中,由小到大排序意图持续时间如下表9所示,取其95%分位值为00:16:57为源数据集表1的意图持续时间阈值。
表9
意图编号 起始时间 结束时间 持续时间
L002 11:42:22 11:45:27 00:03:05
Z003 11:55:05 11:59:02 00:03:57
W001 11:31:15 11:35:33 00:04:18
Z002 11:50:05 11:55:02 00:04:57
L001 11:29:01 11:35:12 00:06:11
Z001 11:30:05 11:45:22 00:15:17
W002 11:40:05 11:57:02 00:16:57
步骤S10,将所述的第一特征值作为源数据集中交易场景下用户同一意图的会话时间范围的关联,即用户在一个意图的一个会话后的第一特征值时间内如果没有发起新的会话,则认为这个意图已经被用户中止,这个意图结束,并将源数据集中交易场景下同一用户的会话按时间排序作为第四序列。
从示例表1中的源数据集中,在交易场景下基于用户按时间顺序将会话排序。因为本发明在交易场景下一个用户的意图分析步骤相似,为更清晰简洁解释之后实施步骤,以下实例中之节选交易场景“理财”里姓名为“钱七”的会话序列4作为示例,如下表10所示:
表10
姓名 交易场景 会话编号 交易结果 起始时间 结束时间
钱七 理财 S0001 成功 11:30:05 11:35:02
钱七 理财 S0002 失败 11:36:05 11:45:02
钱七 理财 S0003 失败 11:50:05 11:55:02
钱七 理财 S0004 失败 11:56:05 11:59:02
钱七 理财 S0005 失败 12:40:05 12:45:02
钱七 理财 S0006 成功 12:55:05 12:57:02
钱七 理财 S0007 失败 13:50:05 13:57:02
钱七 理财 S0008 失败 13:58:05 13:59:02
步骤S11,将第四序列的第一个会话标记为交易场景下该用户的第一个意图的起始。
在会话序列4中一个用户的第一个会话标记为该用户第一个意图的起始如下表11所示:
表11
步骤S12,将第四序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束。
在会话序列4中交易结果为成功的会话标记为该用户的一个意图的结束如下表12所示:
表12
步骤S13,将第四序列中交易结果为交易失败且第一特征值内没有下一个会话的会话标记为交易场景下该用户的一个意图的结束。
在会话序列4中,将交易结果为失败且会话结束后在步骤9中所得交易场景为“理财”的意图持续时间阈值00:16:57的范围内没有下一个会话的会话标记为一个意图的结束,如下表13所示:
表13
步骤S14,将第四序列中最后一个会话标记为交易场景下该用户一个意图的结束;
在会话序列4中,将最后一个会话标记为一个意图的结束,如表14所示:
表14
步骤S15,将第四序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始。
在会话序列4中,将一个意图结束标志会话的下一个会话标记为该用户的下一个意图的起始,如下表15所示
表15
步骤S16,将第四序列由上述的意图起止标志分割为意图的序列,即为用户在该场景下的意图分析结果。
将会话序列4根据意图起止标志分割,一个意图的起始时间为起始标志会话的起始时间,一个意图的结束时间为结束标志会话的结束时间,一个意图的结果为该意图的最后一个会话的交易结果,获得意图序列2如下表16所示:
通过在会话序列上标记用户意图的起始和结束标志界定了用户在交易场景下每一个意图的整体,在此意图粒度基础上进行的数据分析能保证数据的规范性和完整性。
表16
本发明通过构建基于交易场景、用户、会话、交易结果和会话起止时间的源数据集;在交易场景下基于用户抽样源数据集;基于样本集中意图的定义统计其意图持续时间并有短到长排序,取其序列的95%分位值为源数据集意图持续时间阈值;将交易场景下同一用户的会话按时间顺序排序并标记其中第一个会话为该用户在该交易场景下的第一个意图的起始;将交易场景内一个用户会话序列中交易结果为交易成功的会话或交易结果为交易失败且意图持续阈值内没有下一个会话的会话标记为一个意图的结束;将交易场景内一个用户的一个意图结束后的下一个会话标记为该用户在交易场景内下一个意图的起始。通过在会话序列上标记用户意图的起始和结束标志界定了用户在交易场景下每一个意图的整体,在此意图粒度基础上进行的数据分析能保证数据的规范性和完整性。

Claims (1)

1.一种基于会话的意图分析方法,其特征在于所述方法包括如下步骤:
步骤S1,将预设日期内收集的用户会话信息,设定为待进行意图分析的数据集,并构建基于交易场景、用户、会话、交易结果和会话起止时间的源数据集;
步骤S2,源数据集中在选取其中一种类型的交易场景,并基于用户抽样获得样本集,以计算出用户一个意图的持续时间分布,为后续判定用户一个意图是否已经结束提供依据;
步骤S3,将样本集中交易场景下同一用户的会话按时间排序,作为第一序列;
步骤S4,将第一序列中的第一个会话标记为交易场景下该用户的第一个意图的起始;
步骤S5,将第一序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束;
步骤S6,将第一序列中最后一个会话标记为交易场景下该用户最后一个意图结束;
步骤S7,将第一序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始,用户一个意图结束后如果有新的会话,则标志着用户在一个意图实现之后又产生了新的意图;
步骤S8,将样本集中在交易场景下用户会话的第一序列由上述的意图起止标志分割为样本集中交易场景下用户意图的序列,作为第二序列;
步骤S9,将第二序列中一个意图的最后一个会话的结束时间和其第一个会话的开始时间求差取得该意图的持续时间,从而得到用户每一个意图的持续时间;将第二序列中的意图按持续时间由小到达的排序,作为第三序列;取其预设分位值作为源数据集意图分析的意图持续时间阈值,即第一特征值;
步骤S10,将所述的第一特征值作为源数据集中交易场景下用户同一意图的会话时间范围的关联,即用户在一个意图的一个会话后的第一特征值时间内如果没有发起新的会话,则认为这个意图已经被用户中止,这个意图结束,并将源数据集中交易场景下同一用户的会话按时间排序作为第四序列;
步骤S11,将第四序列的第一个会话标记为交易场景下该用户的第一个意图的起始;
步骤S12,将第四序列中交易结果为交易成功的会话标记为交易场景下该用户的一个意图的结束;
步骤S13,将第四序列中交易结果为交易失败且第一特征值时间值内没有下一个会话的会话标记为交易场景下该用户的一个意图的结束;
步骤S14,将第四序列中最后一个会话标记为交易场景下该用户最后一个意图结束;
步骤S15,将第四序列中一个意图的结束标志会话的下一个会话标记为交易场景下该用户下一个意图的起始;
步骤S16,将第四序列由上述的意图起止标志分割为意图的序列,即为用户在该场景下的意图分析结果;
所述的预设分位值为:95%分位值。
CN201911216352.XA 2019-12-02 2019-12-02 一种基于会话的意图分析方法 Active CN111080448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911216352.XA CN111080448B (zh) 2019-12-02 2019-12-02 一种基于会话的意图分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911216352.XA CN111080448B (zh) 2019-12-02 2019-12-02 一种基于会话的意图分析方法

Publications (2)

Publication Number Publication Date
CN111080448A CN111080448A (zh) 2020-04-28
CN111080448B true CN111080448B (zh) 2024-03-26

Family

ID=70312420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911216352.XA Active CN111080448B (zh) 2019-12-02 2019-12-02 一种基于会话的意图分析方法

Country Status (1)

Country Link
CN (1) CN111080448B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112017629B (zh) * 2020-07-15 2021-12-21 马上消费金融股份有限公司 语音机器人的会话控制方法及设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402980A (zh) * 2017-07-06 2017-11-28 北京亿赛通网络安全技术有限公司 一种基于网络环境下的大数据的处理方法和系统
CN109873745A (zh) * 2017-12-01 2019-06-11 腾讯科技(深圳)有限公司 通信控制方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589905B (zh) * 2014-12-26 2019-06-18 中国银联股份有限公司 用户兴趣数据分析和收集系统及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402980A (zh) * 2017-07-06 2017-11-28 北京亿赛通网络安全技术有限公司 一种基于网络环境下的大数据的处理方法和系统
CN109873745A (zh) * 2017-12-01 2019-06-11 腾讯科技(深圳)有限公司 通信控制方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
带时间特性的自动信任协商;杨秋伟;周洁;唐卓;刘玲;;计算机应用研究;20100615(06);全文 *

Also Published As

Publication number Publication date
CN111080448A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN108446341B (zh) 业务状态查询方法、装置、计算机设备和存储介质
CN107391772B (zh) 一种基于朴素贝叶斯的文本分类方法
CN101350869B (zh) 基于索引和散列的电信计费去重方法及设备
CN104077407B (zh) 一种智能数据搜索系统及方法
CN102542474A (zh) 查询结果排序方法及装置
CN107609121A (zh) 基于LDA和word2vec算法的新闻文本分类方法
CN104731977B (zh) 电话号码数据的发现与分类方法
CN110119948B (zh) 基于时变权重动态组合的电力用户信用评价方法及系统
CN104317784A (zh) 一种跨平台用户识别方法和系统
CN107248023B (zh) 一种对标企业名单的筛选方法和装置
CN111080448B (zh) 一种基于会话的意图分析方法
CN108829676A (zh) 基于文本分析技术的人才专业能力评估方法
CN109918645A (zh) 深度分析文本的方法、装置、计算机设备和存储介质
CN101441663B (zh) 一种基于lzw压缩算法的中文文本分类特征词典生成方法
CN109684447A (zh) 一种基于文本挖掘的电网调度运行日志故障信息分析方法
CN112148852A (zh) 一种智能客服方法、装置、存储介质及计算机设备
CN109214445A (zh) 一种基于人工智能的多标签分类方法
CN106933919A (zh) 数据表的连接方法及装置
CN102521713A (zh) 数据处理装置和数据处理方法
CN110569237A (zh) 实现实时数据清洗处理的系统及其方法
CN106776542B (zh) 用户反馈信息的关键词处理方法、装置及服务器
CN107633006A (zh) 一种词典格式生成方法及电子设备
CN104731978B (zh) 中文姓名数据的发现与分类方法
CN112784040B (zh) 基于语料库的垂直行业文本分类方法
CN113538011A (zh) 一种电力系统中非在册联系信息与在册用户的关联方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant