CN109993649A - 一种先导式纳税咨询服务推送方法 - Google Patents
一种先导式纳税咨询服务推送方法 Download PDFInfo
- Publication number
- CN109993649A CN109993649A CN201910190270.6A CN201910190270A CN109993649A CN 109993649 A CN109993649 A CN 109993649A CN 201910190270 A CN201910190270 A CN 201910190270A CN 109993649 A CN109993649 A CN 109993649A
- Authority
- CN
- China
- Prior art keywords
- taxpayer
- tax
- pilot
- consulting
- payment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
Abstract
本发明公开了一种先导式纳税咨询服务推送方法。该方法包括:构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像;在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋;基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型;运用预判分析模型,为纳税人提供先导式精准信息推送以及个性化办税、缴费引导。本方法通过对纳税人咨询行为进行分析,结合基础信息画像,利用时间相关文本序列构建预判分析模型,提前预判纳税人咨询需求,为纳税人提供更为先导式的纳税咨询服务。
Description
技术领域
本发明涉及税务大数据融合计算领域,特别是涉及一种先导式纳税咨询服务推送方法。
背景技术
自“12366”纳税服务热线上线以来,越来越多的纳税人通过12366纳税服务平台进行纳税咨询,了解办税指南,办税更加便捷。目前12366智能咨询建设方面主要从模糊分析技术入手,对纳税人咨询过的问题进行模糊匹配可能相关的问题进行推荐,这样一来不具备时效、时序性,无法对纳税人接下来的咨询需求做出预判;二来模糊匹配结果不尽人意,纳税人查看推荐结果后发现与自己咨询问题无关,进一步影响纳税人咨询体验。
如若能够预判纳税人的咨询需求,提前将纳税人咨询的问题及解答进行推送,则可大幅减少12366咨询量,不仅提供纳税人办事效率,更能节省12366热线坐席人员的人工成本。
发明内容
针对上述问题,有必要提供一种先导式纳税咨询服务推送方法,以实现提前预判纳税人咨询需求,为纳税人提供更为先导式的纳税咨询服务。
为实现上述目的,本发明提供了如下方案:
一种先导式纳税咨询服务推送方法,所述方法包括:
构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像;
在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋;
基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型;
运用预判分析模型,为纳税人提供先导式精准信息推送以及个性化办税、缴费引导。
进一步的,所述构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像包括:
根据纳税人涉税信息、咨询行为数据,提炼出纳税人特征,将自然人与纳税人进行关联,抽象出标签化的纳税人模型。
进一步的,所述在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋包括:
Step1:从数据库中获取纳税人的咨询问题及税局人员的答复内容,按天进行分组,将同一纳税人同一天内咨询的多个问题进行合并,合并后的所有咨询问题及其答复内容构成模型语料库;
Step2:对语料库数据进行分词,去除停用词以及在文中仅出现一次的词语,并为处理后的语料库中各个不同的词语分配一个唯一的整数ID;
Step3:遍历整个语料库,得到语料库中词语与ID的映射关系,构建出词典;
Step4:统计语料库每个词语出现的次数,并按照[(id1,wordcount1),(id2,wordcount2),…]的形式返回结果,构建出词袋;
进一步的,所述基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型包括:
将构建好的词典和词袋按天划定时间切片,使用K分量主题模型对每个时间切片的文档建模,进行DTM分析;
在纳税人咨询问题后,通过计算Hellinger距离衡量该咨询问题与模型语料库中的记录之间的内容相似度,结合DTM分析结果,预判纳税人接下来可能会咨询的相关问题。
进一步的,所述的DTM分析包括:
Step1:由βt,k|βt-1,k~Ν(βt-1,k,σ2I)得到βt,k,其中βt,k表示切片t中主题k的自然参数的V向量,即βt,k是主题k在切片t时的单词分布;
Step2:由αt|αt-1~N(αt-1,δ2I)得到αt,其中αt是切片t时每篇文档的主题分布;
Step3:对于每个文档,由ηt,d~N(αt,a2I)得到ηt,d,其中ηt,d是文档d在切片t时的主题分布;对于每个单词,由Zt,d,n~Mult(π(ηt,d))得到Zt,d,n,其中Zt,d,n是在切片t时文档d中第n个单词的主题;由得到Wt,d,n,其中Wt,d,n是在切片t时文档d中第n个单词;其中,π将多项自然参数映射成平均参数,其表达式为:
Step4:重复Step3直至遍历整个语料库中的每一个单词,得到各个时间切片之间的主题演变情况以及同一时间切片内主题的分布情况。
所述的先导式精准信息推送包括:选取咨询问题与模型语料库中的内容相似度大的记录,将相应的咨询问题及答复内容推送给纳税人;将纳税人接下来一定时间区间内可能咨询的其他问题及相关答复推送给该纳税人。
作为本发明的一种优选方式,本发明的方法设置反馈机制,根据纳税人对推送问题的反馈情况不断优化预判分析模型。
与现有技术相比,本发明具有以下技术效果:本发明通过对纳税人咨询行为进行分析,结合基础信息画像,利用时间相关文本序列构建预判分析模型,提前预判纳税人咨询需求,为纳税人提供更为先导式的纳税咨询服务。
附图说明
图1为本发明实施例一种先导式纳税咨询服务推送方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例一种先导式纳税咨询服务推送方法的流程图。如图1所示,一种先导式纳税咨询服务推送方法包括:
步骤101:构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像。
步骤102:在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋:历史时间区间可以根据已有的数据情况进行选择。
Step1:从数据库中获取纳税人咨询问题及税局人员答复内容,按天进行分组,如纳税人同一天内咨询多个问题,则合并相关内容。所有咨询记录构成模型语料库;
Step2:对语料库数据进行分词、去除停用词以及在文中仅出现一次的词语等处理,并为处理后的语料库中各个不同的词语分配一个唯一的整数ID;
Step3:扫描整个语料库,得到语料库中词语与ID的映射关系,即词典;
Step4:统计语料库中每个词语出现的次数,并按照[(id1,wordcount1),(id2,wordcount2),…]的形式返回结果,即词袋。
步骤103:基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型:
将构建好的词典和词袋按天划定时间切片,假定相邻时间片上整个咨询问题的主题分布以及主题内容都是随时间演化的,各时间片下的主题概率分布和词语概率分布均依赖于前一个时间片的状态。使用K分量主题模型对每个切片的文档建模,进行DTM(动态主题模型)分析:
Step1:由βt,k|βt-1,k~Ν(βt-1,k,σ2I)得到βt,k,其中βt,k表示切片t中主题k的自然参数的V向量,即βt,k是主题k在切片t时的单词分布;
Step2:由αt|αt-1~N(αt-1,δ2I)得到αt,其中αt是切片t时每篇文档的主题分布;
Step3:对于每个文档,由ηt,d~N(αt,a2I)得到ηt,d,其中ηt,d是文档d在切片t时的主题分布;对于每个单词,由Zt,d,n~Mult(π(ηt,d))得到Zt,d,n,其中Zt,d,n是在切片t时文档d中第n个单词的主题;由得到Wt,d,n,其中Wt,d,n是在切片t时文档d中第n个单词;其中,π将多项自然参数映射成平均参数,其表达式为:
Step4:重复Step3直至遍历整个语料库中的每一个单词,得到各个时间片之间的主题演变情况以及同一时间片内主题的分布情况。
在纳税人咨询问题后,通过计算Hellinger距离衡量该咨询记录与模型语料库中记录之间的内容相似度,结合DTM(动态主题模型)分析结果,预判纳税人接下来可能会咨询的相关问题。
其中,Hellinger距离被用来度量两个概率分布的相似度,取值范围为[0,1],其值越接近0则意味着他们更相似。假设P和Q是两个概率测度,且对于概率测度λ绝对连续,则P和Q的Hellinger距离的平方被定义如下:
式中dP/dλ和dQ/dλ分别是P和Q的Radon–Nikodym微分,其定义与λ无关,因此用另外一个概率测度替换λ时,只要P和Q关于它绝对连续,那么上式就不变。为了简单起见,通常把上式改写为:
步骤104:运用预判分析模型,选取咨询问题与模型语料库中的内容相似度大的记录,将相应的咨询问题及答复内容推送给纳税人;将纳税人当天接下来可能咨询的其他问题及相关答复推送给该纳税人。以及个性化办税、缴费引导。
步骤105:设置反馈机制,根据纳税人对推送问题的反馈情况不断优化预判分析模型。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本方法通过对纳税人咨询行为进行分析,结合基础信息画像,利用时间相关文本序列构建预判分析模型,提前预判纳税人咨询需求,为纳税人提供更为先导式的纳税咨询服务。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种先导式纳税咨询服务推送方法,其特征在于,包括:
构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像;
在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋;
基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型;
运用预判分析模型,为纳税人提供先导式精准信息推送以及个性化办税、缴费引导。
2.根据权利要求1所述的先导式纳税咨询服务推送方法,其特征在于,所述构建基于涉税信息为特征的企业基础画像和基于咨询行为习惯为特征的自然人个人咨询行为画像包括:
根据纳税人涉税信息、咨询行为数据,提炼出纳税人特征,将自然人与纳税人进行关联,抽象出标签化的纳税人模型。
3.根据权利要求2所述的先导式纳税咨询服务推送方法,其特征在于,所述在一定历史时间区间内,基于时间切片将纳税咨询行为以及咨询问题数据进行处理,构建词典、词袋包括:
Step1:从数据库中获取纳税人的咨询问题及税局人员的答复内容,按天进行分组,将同一纳税人同一天内咨询的多个问题进行合并,合并后的所有咨询问题及其答复内容构成模型语料库;
Step2:对语料库数据进行分词,去除停用词以及在文中仅出现一次的词语,并为处理后的语料库中各个不同的词语分配一个唯一的整数ID;
Step3:遍历整个语料库,得到语料库中词语与ID的映射关系,构建出词典;
Step4:统计语料库每个词语出现的次数,并按照[(id1,wordcount1),(id2,wordcount2),…]的形式返回结果,构建出词袋。
4.根据权力要求3所述的先导式纳税咨询服务推送方法,其特征在于,所述基于画像分析以及基于时间相关文本序列的咨询行为分析,构建预判分析模型包括:
将构建好的词典和词袋按天划定时间切片,使用K分量主题模型对每个时间切片的文档建模,进行DTM分析;
在纳税人咨询问题后,通过计算Hellinger距离衡量该咨询问题与模型语料库中的记录之间的内容相似度,结合DTM分析结果,预判纳税人接下来可能会咨询的相关问题。
5.根据权利要求4所述的先导式纳税咨询服务推送方法,其特征在于,所述的DTM分析包括:
Step1:由βt,k|βt-1,k~Ν(βt-1,k,σ2I)得到βt,k,其中βt,k表示切片t中主题k的自然参数的V向量,即βt,k是主题k在切片t时的单词分布;
Step2:由αt|αt-1~N(αt-1,δ2I)得到αt,其中αt是切片t时每篇文档的主题分布;
Step3:对于每个文档,由ηt,d~N(αt,a2I)得到ηt,d,其中ηt,d是文档d在切片t时的主题分布;对于每个单词,由Zt,d,n~Mult(π(ηt,d))得到Zt,d,n,其中Zt,d,n是在切片t时文档d中第n个单词的主题;由得到Wt,d,n,其中Wt,d,n是在切片t时文档d中第n个单词;其中,π将多项自然参数映射成平均参数,其表达式为:
Step4:重复Step3直至遍历整个语料库中的每一个单词,得到各个时间切片之间的主题演变情况以及同一时间切片内主题的分布情况。
6.根据权利要求5所述的先导式纳税咨询服务推送方法,其特征在于,所述的先导式精准信息推送包括:选取咨询问题与模型语料库中的内容相似度大的记录,将相应的咨询问题及答复内容推送给纳税人;将纳税人接下来一定时间区间内可能咨询的其他问题及相关答复推送给该纳税人。
7.根据权利要求1-6任一项所述的先导式纳税咨询服务推送方法,其特征在于,设置反馈机制,根据纳税人对推送问题的反馈情况不断优化预判分析模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910190270.6A CN109993649A (zh) | 2019-03-13 | 2019-03-13 | 一种先导式纳税咨询服务推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910190270.6A CN109993649A (zh) | 2019-03-13 | 2019-03-13 | 一种先导式纳税咨询服务推送方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109993649A true CN109993649A (zh) | 2019-07-09 |
Family
ID=67129621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910190270.6A Pending CN109993649A (zh) | 2019-03-13 | 2019-03-13 | 一种先导式纳税咨询服务推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993649A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339257A (zh) * | 2020-02-29 | 2020-06-26 | 重庆百事得大牛机器人有限公司 | 法律咨询用户的个性化用户画像识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN105981053A (zh) * | 2013-10-28 | 2016-09-28 | 英特尔公司 | 用于使用分布式关联记忆库确定数据相关及其中的收敛的方法、系统和计算机程序产品 |
CN106131203A (zh) * | 2016-07-21 | 2016-11-16 | 四川易想电子商务有限公司 | 一种电子商务自动客服系统 |
CN106649561A (zh) * | 2016-11-10 | 2017-05-10 | 复旦大学 | 面向税务咨询业务的智能问答系统 |
CN107784092A (zh) * | 2017-10-11 | 2018-03-09 | 深圳市金立通信设备有限公司 | 一种推荐热词的方法、服务器及计算机可读介质 |
CN108182605A (zh) * | 2018-01-11 | 2018-06-19 | 厦门快商通信息技术有限公司 | 一种基于用户画像的用户行为预测方法及系统 |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN109165284A (zh) * | 2018-08-22 | 2019-01-08 | 重庆邮电大学 | 一种基于大数据的金融领域人机对话意图识别方法 |
CN109389418A (zh) * | 2018-08-17 | 2019-02-26 | 国家电网有限公司客户服务中心 | 基于lda模型的供电服务客户诉求识别方法 |
-
2019
- 2019-03-13 CN CN201910190270.6A patent/CN109993649A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN105981053A (zh) * | 2013-10-28 | 2016-09-28 | 英特尔公司 | 用于使用分布式关联记忆库确定数据相关及其中的收敛的方法、系统和计算机程序产品 |
CN106131203A (zh) * | 2016-07-21 | 2016-11-16 | 四川易想电子商务有限公司 | 一种电子商务自动客服系统 |
CN106649561A (zh) * | 2016-11-10 | 2017-05-10 | 复旦大学 | 面向税务咨询业务的智能问答系统 |
CN107784092A (zh) * | 2017-10-11 | 2018-03-09 | 深圳市金立通信设备有限公司 | 一种推荐热词的方法、服务器及计算机可读介质 |
CN108182605A (zh) * | 2018-01-11 | 2018-06-19 | 厦门快商通信息技术有限公司 | 一种基于用户画像的用户行为预测方法及系统 |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN109389418A (zh) * | 2018-08-17 | 2019-02-26 | 国家电网有限公司客户服务中心 | 基于lda模型的供电服务客户诉求识别方法 |
CN109165284A (zh) * | 2018-08-22 | 2019-01-08 | 重庆邮电大学 | 一种基于大数据的金融领域人机对话意图识别方法 |
Non-Patent Citations (1)
Title |
---|
曹丽娜等: "基于主题模型的BBS话题演化趋势分析", 《管理科学学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339257A (zh) * | 2020-02-29 | 2020-06-26 | 重庆百事得大牛机器人有限公司 | 法律咨询用户的个性化用户画像识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kiviaho et al. | The co‐movement dynamics of European frontier stock markets | |
Kyobe | Investigating the key factors influencing ICT adoption in South Africa | |
US20070244785A1 (en) | Method and system for analysis of a stock portfolio | |
Islam et al. | Extreme gradient boosting (XGBoost) method in making forecasting application and analysis of USD exchange rates against rupiah | |
CN109241516A (zh) | 一种基于改进遗传算法的智能组卷方法 | |
Megill | Exploration economics: chapter 10: part III. Economic aspects of the business | |
Kleinsorge et al. | Evaluating logistics decisions | |
Đurek et al. | Digital maturity of higher education institution: A meta model of the analytical network process (ANP) and decision expert (DEX) | |
Scott | Policy process in higher education | |
CN109993649A (zh) | 一种先导式纳税咨询服务推送方法 | |
Bunnak et al. | Applying Data Mining Techniques and Extened RFM Model in Customer Loyalty Measurement | |
Abebe | Leadership characteristics of declining firms attempting turnaround: An empirical examination | |
CN107798137B (zh) | 一种基于可加模型的多源异构数据融合架构系统 | |
CN108717445A (zh) | 一种基于历史数据的在线社交平台用户兴趣推荐方法 | |
CN115600966A (zh) | 团队讨论语料分析方法及装置 | |
Train | Simulation methods for probit and related models based on convenient error partitioning | |
Trang | Competitive strength and its impact toward achieving company’s performance based on Balanced Scorecard approach in the furniture industry in central Minahasa regency | |
zu Selhausen | Exploring and controlling a bank's interest risk: Sensitivity analysis of an asset and liability co-ordination model | |
Wu et al. | Spatial data quality and its evaluation | |
Supriatna et al. | Designing academic advising information system using prototyping method | |
Josselin et al. | Combining L1 and L2 Norms for a more Robust Spatial Analysis: the Meadian Attitude | |
Song et al. | Sparse Bayesian Model and Artificial Intelligence in Enterprise Goodwill Evaluation and Dynamic Management | |
CN109003142A (zh) | 多目标驱动的产品形态基因网络模型构建方法 | |
Zhang | Visual Intelligent Recognition System Based on Visual Thinking | |
Septiana et al. | Prediction of study period and information on judiciary in higher education using the c5. 0 algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190709 |
|
RJ01 | Rejection of invention patent application after publication |