CN111508494B - 一种智能纳税语音咨询方法和系统 - Google Patents
一种智能纳税语音咨询方法和系统 Download PDFInfo
- Publication number
- CN111508494B CN111508494B CN202010312877.XA CN202010312877A CN111508494B CN 111508494 B CN111508494 B CN 111508494B CN 202010312877 A CN202010312877 A CN 202010312877A CN 111508494 B CN111508494 B CN 111508494B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- module
- platform
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 54
- 238000012545 processing Methods 0.000 claims abstract description 37
- 230000011218 segmentation Effects 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 description 12
- 239000013598 vector Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/123—Tax preparation or submission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本发明提出了一种智能纳税语音咨询方法和系统,包括咨询平台、语音平台和数据处理器,咨询平台包括语音处理模块、用户意图分析模块和语音答案集生成模块;语音处理模块,用于接收咨询平台发送的用户语音,将用户语音发送至语音平台,并接收语音平台识别后的语音内容,根据语音内容提取关键词生成词集并发送至用户意图分析模块;用户意图分析模块,用于将词集与语义库的数据信息进行对应,输出用户意图并发送至语音答案集生成模块;语音答案集生成模块,根据用户意图在纳税知识库中调取相匹配的答案集,将答案集发送至语音平台。本发明采用这种方式扩充了纳税人关于纳税知识的存储量,进一步减少信息不对称现象,同时缩短纳税业务办理的时间长度。
Description
技术领域
本发明涉及网络技术领域,尤其是涉及一种智能纳税语音咨询方法和系统。
背景技术
随着经济多元化发展、社会分工进一步细化、互联网技术日渐成熟,纳税人的经营范围越来越广泛,经济形态越来越复杂,仅仅依靠传统的纳税服务模式和手段,显然跟不上纳税服务科学化、管理精细化的形势要求,也无法满足纳税人日益增长的个性化、多样化的涉税需求。现如今纳税业务办理与人们的生活息息相关。一般地,人们在办理业务的过程中,需要电子化办税或者在业务网点办税。由于互联网纳税服务平台建设功能不够强大,电子化办税范围过窄,因此大部分的税务办理仍然需要提前到达业务网点,再按照到达的时间顺序进行取号排队。然而,由于各种原因,用户没有带齐办理业务所需的材料,导致在叫到号开始办理时,才发现材料不全只能先去准备缺少的材料信息,从而导致时间上的浪费,造成业务办理的效率低。
同时由于关于税务问题的专业性,往往需由专业人员进行解答,由于专业人才的稀缺性导致咨询工作的开展更加困难,因此需要提供一个智能纳税语音咨询系统来处理咨询的问题,这样避免了纳税人的时间浪费,同时提供咨询服务,增强了社会满意度,也让专业人士发挥更大的社会价值。
发明内容
针对现有技术的不足,本发明提出一种智能纳税语音咨询方法和系统,解决纳税人不能进行语音咨询关于纳税的问题。
本发明的技术方案是这样实现的:第一方面,一种智能纳税语音咨询系统,包括咨询平台、语音平台和数据处理器,咨询平台包括语音处理模块、用户意图分析模块和语音答案集生成模块;
语音处理模块,用于接收咨询平台发送的用户语音,将用户语音发送至语音平台,并接收语音平台识别后的语音内容,根据语音内容提取关键词生成词集并发送至用户意图分析模块;
用户意图分析模块,用于将词集与语义库的数据信息进行对应,输出用户意图并发送至语音答案集生成模块;
语音答案集生成模块,根据用户意图在纳税知识库中调取相匹配的答案集,将答案集发送至语音平台;
语音平台,用于接收用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块;接收到答案集,根据答案集合成答复语音并输出;
数据处理器,用于存放语义库和纳税知识库的数据信息。
优选的,语音处理模块包括语音接收子模块和语音分析子模块;
语音接收子模块,用于接收用户语音并将用户语音发送至语音平台,语音平台进行语音识别,同时将识别后的语音内容发送至语音分析子模块;
语音分析子模块,用于将接收到的语音内容进行分割,生成词集并发送至用户意图分析模块。
优选的,语音分析子模块包括语音内容分割单元和词集生成单元;
语音内容分割单元,用于将接收到的语音内容按照用户问句进行分割生成若干用户问句,将用户问句组成问句集并发送至词集生成单元;
词集生成单元,用于将接收到的用户问句逐个进行相似度匹配生成若干关键词,将关键词组成词集并发送至用户意图分析模块。
优选的,词集生成单元进行相似度匹配是通过语音相似度匹配子单元、上下文相似度匹配子单元和整体相似度子单元来计算:其中,
语音相似度匹配子单元,用于根据读音匹配出若干词汇并发送至整体相似度子单元;
上下文相似度匹配子单元,用于根据上下文匹配出若干词汇并发送至整体相似度子单元;
整体相似度子单元,用于将接收到的词汇逐个进行相似度计算,计算后相似度结果数值最高的词汇匹配为关键词。
优选的,用户意图分析模块包括语义集生成单元和用户意图生成单元;
语义集生成单元,用于接收词集,调取语义库的数据将接收到的词集中的关键词进行匹配生成若干语义,并将语义组成语义集并发送用户意见生成子单元;
用户意图生成单元,用于接收语义集,将语义集的内容按照语义库的数据生成用户意见,并形成用户意见集,将用户意见集的内容按照出现次数进行统计,将统计后出现次数最多的用户意见标记为用户意图并发送至语音答案集生成模块。
优选的,语音平台包括语音识别模块和语音合成模块;
语音识别模块,接收用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块;
语音合成模块,接收到答案集,根据答案集合成答复语音并输出。
优选的,语义库包括语义数据模块和语义更新模块;纳税知识库包括纳税知识数据模块和纳税知识更新模块。
第二方面,一种智能纳税语音咨询方法,包括如下步骤:
语音处理模块接收到咨询平台发送的用户语音,将用户语音发送至语音平台;
语音平台将接收到的用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块;
语音处理模块根据语音内容提取生成词集并发送至用户意图分析模块;
用户意图分析模块将接收到的词集与语义库的数据信息进行对应,输出用户意图,并发送至语音答案集生成模块;
语音答案集生成模块根据用户意图在纳税知识库中调取相匹配的答案集,将答案集发送至语音平台;
语音平台接收到答案集,根据答案集合成答复语音并输出。
优选的,语音处理模块根据语音内容提取生成词集并发送至用户意图分析模块步骤包括如下子步骤:
语音处理模块的语音内容分割单元将接收到的语音内容按照用户问句进行分割生成若干用户问句,将用户问句组成问句集并发送至词集生成单元;
词集生成单元将接收到的用户问句集逐个进行相似度匹配生成若干关键词,将关键词组成词集并发送至用户意图分析模块。
与现有技术相比,本发明具有以下优点:相较于传统的纳税咨询而言(如上网查找相关信息、打税务部门的人工咨询电话等),本申请提供了一种智能纳税语音咨询系统;根据用户语音进行识别分析出用户所需要了解的纳税知识信息以及具体的办税流程并通过语音的形式输出。采用这种方式扩充了纳税人关于纳税知识的存储量,进一步减少了信息不对称现象,同时缩短纳税业务办理的时间长度,增进了纳税人对于政府服务的满意度,提高纳税人关于办理纳税流程的体验感。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种智能纳税语音咨询系统的组成示意图;
图2为本发明一种智能纳税语音咨询系统的词集生成单元组成示意图;
图3为本发明一种智能纳税语音咨询方法的流程示意图;
图4为本发明一种智能纳税语音咨询系统的识别用户意图的流程示意图;
图5为本发明一种智能纳税语音咨询系统的答案集的流程节点与用户意图关系示意图;
图中:
1、咨询平台;11、语音处理模块;12、用户意图分析模块;13、语音答案集生成模块;2、语音平台;21、语音识别模块;22、语音合成模块;3、数据处理器;31、语义库;32、纳税知识库。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示,本实施例中提供一种智能纳税语音咨询系统,包括咨询平台1、语音平台2和数据处理器3,其中,咨询平台1与语音平台2进行数据交互,咨询平台1与数据处理器3进行数据交互。
咨询平台1包括语音处理模块11、用户意图分析模块12和语音答案集生成模块13;语音处理模块11与用户意图分析模块12进行数据交互,用户意图分析模块12与语音答案集生成模块13进行数据交互。语音处理模块11,用于接收咨询平台1发送的用户语音,将用户语音发送至语音平台2,并接收语音平台2识别后的语音内容,根据语音内容提取关键词生成词集并发送至用户意图分析模块12;用户意图分析模块12,用于将词集与语义库31的数据信息进行对应,输出用户意图并发送至语音答案集生成模块13;语音答案集生成模块13,根据用户意图在纳税知识库32中调取相匹配的答案集,将答案集发送至语音平台2。语音平台2,用于接收用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块11;接收到答案集,根据答案集合成答复语音并发送至用户数据处理器3,用于存放语义库31和纳税知识库32的数据信息。数据处理器3,用于存放语义库31和纳税知识库32的数据信息。
具体的,语音处理模块11包括语音接收子模块和语音分析子模块。其中,语音接收子模块与语音平台2进行数据交互,语音平台2与语音分析子模块进行数据交互;语音接收子模块,用于接收用户语音并将用户语音发送至语音平台2,语音平台2进行语音识别,同时将识别后的语音内容发送至语音分析子模块;语音分析子模块,用于将接收到的语音内容进行分割,生成词集并发送至用户意图分析模块12。
具体的,语音分析子模块包括语音内容分割单元和词集生成单元;语音内容分割单元与词集生成单元进行数据交互;语音内容分割单元,用于将接收到的语音内容按照用户问句进行分割生成若干用户问句,将用户问句组成问句集并发送至词集生成单元;词集生成单元,用于将接收到的用户问句逐个执行关键词提取生成若干关键词,将关键词组成词集并发送至用户意图分析模块12。如图4所示,为生成用户意图的分析过程,当用户进行线上咨询时,通常不仅仅是一个问题就都可以完成清楚的表达出问题点,因此需要语音内容分割单元对用户问句进行拆分,拆分成若干短句,这样便于系统进行精确分析;同时当拆分出若干短句时,对每一个短句中的关键词进行提取,在正常沟通交流的逻辑中,一个问句的关键词可能只有2~3个,因此需要词集生成单元对语音内容分割单元分割出来的每一个问句进行关键词的提取,并将提取出来的所有关键词组成一个词集,并发送至用户意图分析模块12,为后续用户意图分析提供素材。
具体的,词集生成单元中进行相似度匹配是通过语音相似度匹配子单元、上下文相似度匹配子单元和整体相似度子单元来计算:其中,如图2所示
语音相似度匹配子单元,用于根据读音匹配出若干词汇并发送至整体相似度子单元;
上下文相似度匹配子单元,用于根据上下文匹配出若干词汇并发送至整体相似度子单元;
整体相似度子单元,用于将接收到的词汇逐个进行相似度计算,计算后相似度结果数值最高的词汇匹配为关键词。在一具体的实施例中,相似度匹配指的是利用读音相似度以及上下文相似度将找不到的登录词替换成语义库31中与之相似度最高的词,以此修正语音识别误差与改善未登录词等问题。语音相似度匹配子单元根据读音匹配出若干词汇,上下文相似度匹配子单元根据上下文匹配出若干词汇,将这些词汇逐个代入整体相似度公式中进行计算;具体公式为:
其中,S1为读音相似度,S2为上下文相似度,各权重值为w1=w2=0.05,w3=0.9。由于整体相似度存在读音相似度与上下文相似度的联立项以及两者之间的乘积项,因此,采用的相似度匹配方法为带乘积项的读音相似度与上下文相似度联立匹配法。当两个词之间读音相似度以及上下文相似度均较高时,两者的整体相似度应较高,而其中某一项相似度较低时,整体相似度应较低。当同一个词语对应若干个词汇时,将这些词汇逐个代入整体相似度公式中,并将词汇对应的整体相似度结果进行比较,其中整体相似度数值最高的词汇匹配为其相应的关键词。
具体的,用户意图分析模块12包括语义集生成单元和用户意图生成生成单元。语义集生成单元与用户意图生成生成单元进行数据交互;语义集生成单元,用于接收词集,调取语义库31的数据将接收到的词集中的关键词进行匹配生成若干语义,并将语义组成语义集并发送用户意见生成子单元;用户意图生成单元,用于接收语义集,将语义集的内容按照语义库31的数据生成用户意见,并形成用户意见集,将用户意见集的内容按照出现次数进行统计,将统计后出现次数最多的用户意见标记为用户意图并发送至语音答案集生成模块13。其中,用户意图用于控制办税流程指引的进度,每个用户意图的执行效果应为使用者人为设置;语义与用户意图间的关系可采用自动分析获取的方式初步获得,只需要将用户意图的文本切分成词的集合,将集合中的每一串文本作为与该用户意图相关的语义,即可获得语义与用户意图间的关系,然后可以通过人工检查的方式,删除错误及冗余的关系,补充缺少的关系,即可完成语义与用户意图的连接。
用户意图出现次数统计方法指的是将用户问句中匹配到的所有关键词关联到的用户意图后,将所有的用户意图根据出现的次数进行统计,并将出现次数最高的用户意图作为用户意图识别的结果的方法。如图4所示,已知一个关键词的语义可对应若干个用户意图,由于用户询问的待解答问题中的关键词必然都与该问题的真实用户意图存在关联,即用户意图存在重复出现现象,出现次数越高,代表该用户意图越突出,越能表达用户问句中包含的真实用户意图。通过统计每个用户意图的出现次数,选取出现次数最高的用户意图作为识别结果,这种既提高了关键词匹配的灵活性,也保证了语义库31的可拓展性,而且能更好地配合相似度匹配方法,改善用户意图识别的效果。
具体的,语音答案集生成模块13,根据用户意图在纳税知识库32中调取相匹配的答案集,将答案集发送至语音平台2;在一具体的实施例中,为满足办税流程指引的需要,纳税知识库32中的答案集采用图(Graph)模型来描述的办税指引流程结构,如图5所示,答案集中的结点P代表一个办税流程结点,具体内容包括流程分支、流程节点的税务指引信息和下一流程节点的地址信息。答案集中的结点P以三元组的形式表示,即:P=(Cn,Br,Nx);其中,Cn为当前流程结点的税务指引信息,Br为流程分支,Nx为办税流程下一结点的地址信息。答案集表示为图中的一个流程树T={P1,P2,…,Pn},用户意图I包括获得答案的根结点P1、获取下一流程结点Pi的信息等。
具体的,语音平台2包括语音识别模块21和语音合成模块22,语音识别模块21与语音处理模块11进行数据交互,语音合成模块22与语音答案集生成模块13进行数据交互;语音识别模块21,接收用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块11;语音合成模块22,接收到答案集,根据答案集合成答复语音并输出。其中,语音识别与语音合成是智能纳税语音平台2的基本功能,是增强现实智能办税指引系统的重要人机交互方式之一,为达到良好的交互效果,本申请利用SDK来进行语音识别及语音合成等功能的执行。
具体的,数据处理器3包括语义库31和纳税知识库32。语义库31包括语义数据模块和语义更新模块;纳税知识库32包括纳税知识数据模块和纳税知识更新模块。
其中,语义数据模块用于存储词汇及其对应的语义信息,该语义信息将用于分析、获取用户意图。为满足用户问句分析的需要,语义库31中的语义知识也采用三元组K=(W,M,I)表示,其中,W为词汇,M为W的语义,标志其所属的词类,I为用户意图。由于词W具有一个或多个含义,而语义M标志的词类与用户意图I联系紧密,M与I之间呈多对一或一对一关系,即一个词可能包含多个用户意图,因此,引入语义来为用户意图提供分析依据是用户意图识别技术的必然要求。
语义更新模块为智能纳税语音咨询技术中的一个关键性难点。其中,语义库31中的近义词需要利用语义理解技术来实现自动拓展,同一语义的近义词数量较多,通过人工方式填充语义库31效率低下、工作量大,而且容易产生遗漏。因此本申请采用从税务部门官网用调取大规模文本通过机器学习方式来训练获得词向量(词向量是词的数学表示方式,以向量形式表示词的各项属性;词的属性包括词性、读音、含义等,词向量的形成方式是指把词的按照属性抽象出来并给各个属性赋予一定的权重,从而以数字向量的形式表达出来),并计算词间距离(两个词向量之间的角度余弦值;词向量确定的是方向数据,因此两个词的词间距离通过角度余弦值表示)的大小,若两个词的词间距离在0.4~0.6之间,则定义为相互的近义词。当词间距离数值越大,准确度越高,拓展率则越低。因此在实际的语义更新模块中,语义的更新拓展按照实际的拓展需求进行词间距离的限定。通过该方式实现语义库31的自动拓展,减少语义库31搭建与维护的工作量。
其中,纳税知识数据模块用于存储纳税知识数据;纳税知识更新模块用于将现有的纳税知识数据实时更新在系统中,由于目前缺乏线上办税指导手册,无法通过分析文本的方式自动获得准确可靠的办税流程信息及其操作指引信息,而且增强现实智能办税指引系统对办税指引流程及相关信息的要求极高,因此,税务知识库的更新必须采用人工方式进行构建以及维护。
实施例二
如图2所示,本实施例中提供一种智能纳税语音咨询方法。
本实施例中提供一种用于上述智能纳税语音咨询系统的一种智能纳税语音咨询方法,包括如下步骤:
S10步骤:语音处理模块11接收到咨询平台1发送的用户语音,将用户语音发送至语音平台2;其中,语音处理模块11的语音接收子模块接收用户语音并将用户语音发送至语音平台2。
S20步骤:语音平台2将接收到的用户语音并进行语音识别,生成语音内容并将语音内容发送至语音处理模块11;其中,语音平台2进行语音识别,同时将识别后的语音内容发送至语音处理模块11的语音分析子模块。
S30步骤:语音处理模块11根据语音内容提取生成词集并发送至用户意图分析模块12;
S301步骤:语音处理模块11的语音分析子模块将接收到的语音内容进行分割,生成词集并发送至用户意图分析模块12。
S3011步骤:语音分析子模块将接收到的语音内容发送至语音内容分割单元,语音内容分割单元将接收到的语音内容按照用户问句进行分割生成若干用户问句,将用户问句组成问句集并发送至词集生成单元;
S3012步骤:词集生成单元将接收到的用户问句逐个进行相似度匹配生成若干关键词,将关键词组成词集并发送至用户意图分析模块12。其中,相似度匹配的步骤为:
S30121步骤:词集生成单元将接收到的用户问句集逐个发送至语音相似度匹配子单元和上下文相似度匹配子单元;
S30122a步骤:语音相似度匹配子单元将接收到的用户问句集根据读音匹配出若干词汇并发送至整体相似度子单元;
S30122b步骤:上下文相似度匹配子单元将接收到的用户问句根据上下文匹配出若干词汇并发送至整体相似度子单元;
S30123步骤:整体相似度子单元将接收到的词汇进行相似度计算,计算后相似度结果数值最高的词汇匹配为关键词。
S40步骤:用户意图分析模块12将接收到的词集与语义库31的数据信息进行对应,输出用户意图,并发送至语音答案集生成模块13;
S401步骤:用户意图分析模块12的语义集生成单元接收到词集后,调取语义库31的数据将接收到的词集中的关键词进行匹配生成若干语义,并将语义组成语义集并发送用户意见生成子单元;
S402步骤:用户意图生成生成单元接收到语义集后,将语义集的内容按照语义库31的数据生成用户意见,并形成用户意见集,将用户意见集的内容按照出现次数进行统计,将统计后出现次数最多的用户意见标记为用户意图并发送至语音答案集生成模块13。
S50步骤:语音答案集生成模块13根据用户意图在纳税知识库32中调取相匹配的答案集,将答案集发送至语音平台2;其中,答案集的内容包括流程分支、流程节点的税务指引信息和下一流程节点的地址信息。
S60步骤:语音平台2接收到答案集,根据答案集合成答复语音并输出。
综上,本发明相较于传统的纳税咨询而言(如上网查找相关信息、打税务部门的人工咨询电话等),本申请提供了一种智能纳税语音咨询系统;根据用户语音进行识别分析出用户所需要了解的纳税知识信息以及具体的办税流程并通过语音的形式输出。采用这种方式扩充了纳税人关于纳税知识的存储量,进一步减少了信息不对称现象,同时缩短纳税业务办理的时间长度,增进了纳税人对于政府服务的满意度,提高纳税人关于办理纳税流程的体验感。
Claims (5)
1.一种智能纳税语音咨询系统,其特征在于,包括咨询平台、语音平台和数据处理器,所述咨询平台包括语音处理模块、用户意图分析模块和语音答案集生成模块;
所述语音处理模块,用于接收所述咨询平台发送的用户语音,将所述用户语音发送至所述语音平台,并接收语音平台识别后的语音内容,根据语音内容提取关键词生成词集并发送至所述用户意图分析模块;
所述用户意图分析模块,用于将词集与语义库的数据信息进行对应,输出用户意图并发送至所述语音答案集生成模块;
所述语音答案集生成模块,根据用户意图在纳税知识库中调取相匹配的答案集,将所述答案集发送至语音平台;
所述语音平台,用于接收用户语音并进行语音识别,生成语音内容并将语音内容发送至所述语音处理模块;接收到所述答案集,根据所述答案集合成答复语音并输出;
所述数据处理器,用于存放语义库和纳税知识库的数据信息;所述语音处理模块包括语音接收子模块和语音分析子模块;
所述语音接收子模块,用于接收用户语音并将所述用户语音发送至语音平台,所述语音平台进行语音识别,同时将识别后的语音内容发送至语音分析子模块;
所述语音分析子模块,用于将接收到的语音内容进行分割,生成词集并发送至所述用户意图分析模块;所述语音分析子模块包括语音内容分割单元和词集生成单元;
所述语音内容分割单元,用于将接收到的语音内容按照用户问句进行分割生成若干用户问句,将所述用户问句组成问句集并发送至所述词集生成单元;
所述词集生成单元,用于将接收到的用户问句逐个进行相似度匹配生成若干关键词,将所述关键词组成词集并发送至所述用户意图分析模块;
所述词集生成单元进行相似度匹配是通过语音相似度匹配子单元、上下文相似度匹配子单元和整体相似度子单元来计算:其中,
所述语音相似度匹配子单元,用于根据读音匹配出若干词汇并发送至整体相似度子单元;
所述上下文相似度匹配子单元,用于根据上下文匹配出若干词汇并发送至整体相似度子单元;
所述整体相似度子单元,用于将接收到的词汇逐个进行相似度计算,计算后相似度结果数值最高的词汇匹配为关键词;
所述用户意图分析模块包括语义集生成单元和用户意图生成单元;
所述语义集生成单元,用于接收词集,调取所述语义库的数据将接收到的词集中的关键词进行匹配生成若干语义,并将所述语义组成语义集并发送用户意见生成子单元;
所述用户意图生成单元,用于接收语义集,将语义集的内容按照语义库的数据生成用户意见,并形成用户意见集,将所述用户意见集的内容按照出现次数进行统计,将统计后出现次数最多的用户意见标记为用户意图并发送至所述语音答案集生成模块。
2.如权利要求1所述的一种智能纳税语音咨询系统,其特征在于,所述语音平台包括语音识别模块和语音合成模块;
所述语音识别模块,接收用户语音并进行语音识别,生成语音内容并将语音内容发送至所述语音处理模块;
所述语音合成模块,接收到所述答案集,根据所述答案集合成答复语音并输出。
3.如权利要求1所述的一种智能纳税语音咨询系统,其特征在于,所述语义库包括语义数据模块和语义更新模块;所述纳税知识库包括纳税知识数据模块和纳税知识更新模块。
4.一种基于权利要求1-3任一项所述的智能纳税语音咨询系统的智能纳税语音咨询方法,其特征在于,包括如下步骤:
所述语音处理模块接收到咨询平台发送的用户语音,将所述用户语音发送至所述语音平台;
所述语音平台将接收到的用户语音并进行语音识别,生成语音内容并将语音内容发送至所述语音处理模块;
所述语音处理模块根据语音内容提取生成词集并发送至所述用户意图分析模块;
所述用户意图分析模块将接收到的词集与语义库的数据信息进行对应,输出用户意图,并发送至所述语音答案集生成模块;
所述语音答案集生成模块根据用户意图在纳税知识库中调取相匹配的答案集,将所述答案集发送至语音平台;
所述语音平台接收到所述答案集,根据所述答案集合成答复语音并输出。
5.如权利要求4所述的一种智能纳税语音咨询方法,其特征在于,所述语音处理模块根据语音内容提取生成词集并发送至所述用户意图分析模块步骤包括如下子步骤:
所述语音处理模块的语音内容分割单元将接收到的语音内容按照用户问句进行分割生成若干用户问句,将所述用户问句组成问句集并发送至所述词集生成单元;
所述词集生成单元将接收到的用户问句集逐个进行相似度匹配生成若干关键词,将所述关键词组成词集并发送至所述用户意图分析模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010312877.XA CN111508494B (zh) | 2020-04-20 | 2020-04-20 | 一种智能纳税语音咨询方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010312877.XA CN111508494B (zh) | 2020-04-20 | 2020-04-20 | 一种智能纳税语音咨询方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111508494A CN111508494A (zh) | 2020-08-07 |
CN111508494B true CN111508494B (zh) | 2023-03-07 |
Family
ID=71864232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010312877.XA Active CN111508494B (zh) | 2020-04-20 | 2020-04-20 | 一种智能纳税语音咨询方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111508494B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015062482A1 (en) * | 2013-11-01 | 2015-05-07 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
CN106357942A (zh) * | 2016-10-26 | 2017-01-25 | 广州佰聆数据股份有限公司 | 基于上下文对话语义识别的智能应答方法及系统 |
CN106682977A (zh) * | 2015-11-10 | 2017-05-17 | 南京华设科技股份有限公司 | 财税人工智能系统 |
CN107123042A (zh) * | 2017-04-26 | 2017-09-01 | 山东浪潮商用系统有限公司 | 一种智能语音办税方法、装置及系统 |
WO2017156893A1 (zh) * | 2016-03-18 | 2017-09-21 | 深圳Tcl数字技术有限公司 | 语音控制方法及智能电视 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN107918634A (zh) * | 2017-06-27 | 2018-04-17 | 上海壹账通金融科技有限公司 | 智能问答方法、装置及计算机可读存储介质 |
CN109871543A (zh) * | 2019-03-12 | 2019-06-11 | 广东小天才科技有限公司 | 一种意图获取方法及系统 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN110489527A (zh) * | 2019-08-13 | 2019-11-22 | 南京邮电大学 | 基于语音交互的银行业务智能咨询以及办理方法和系统 |
-
2020
- 2020-04-20 CN CN202010312877.XA patent/CN111508494B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015062482A1 (en) * | 2013-11-01 | 2015-05-07 | Tencent Technology (Shenzhen) Company Limited | System and method for automatic question answering |
CN106682977A (zh) * | 2015-11-10 | 2017-05-17 | 南京华设科技股份有限公司 | 财税人工智能系统 |
WO2017156893A1 (zh) * | 2016-03-18 | 2017-09-21 | 深圳Tcl数字技术有限公司 | 语音控制方法及智能电视 |
CN106357942A (zh) * | 2016-10-26 | 2017-01-25 | 广州佰聆数据股份有限公司 | 基于上下文对话语义识别的智能应答方法及系统 |
CN107123042A (zh) * | 2017-04-26 | 2017-09-01 | 山东浪潮商用系统有限公司 | 一种智能语音办税方法、装置及系统 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN107918634A (zh) * | 2017-06-27 | 2018-04-17 | 上海壹账通金融科技有限公司 | 智能问答方法、装置及计算机可读存储介质 |
CN109871543A (zh) * | 2019-03-12 | 2019-06-11 | 广东小天才科技有限公司 | 一种意图获取方法及系统 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN110489527A (zh) * | 2019-08-13 | 2019-11-22 | 南京邮电大学 | 基于语音交互的银行业务智能咨询以及办理方法和系统 |
Non-Patent Citations (1)
Title |
---|
智能服务机器人语音交互的设计与实现;杨国庆等;《科技视界》;20200331;第129-131页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111508494A (zh) | 2020-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3176868A1 (en) | Intent identifying method and device for application to intelligent customer service robot | |
US8165887B2 (en) | Data-driven voice user interface | |
CA3011397A1 (en) | Natural expression processing method, processing and response method, device and system | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN111324708A (zh) | 一种基于人机交互的自然语言处理系统 | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN113326367B (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN111651572A (zh) | 一种多领域任务型对话系统、方法和终端 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN114841128B (zh) | 基于人工智能的业务交互方法、装置、设备、介质及产品 | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN117112595A (zh) | 一种信息查询方法、装置、电子设备及存储介质 | |
CN114020888A (zh) | 文本生成的方法、装置、设备以及存储介质 | |
JP5574842B2 (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
CN118364916A (zh) | 一种基于大语言模型和知识图谱的新闻检索方法及系统 | |
CN114528840A (zh) | 融合上下文信息的中文实体识别方法、终端及存储介质 | |
CN111508494B (zh) | 一种智能纳税语音咨询方法和系统 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN114880994B (zh) | 一种直白文本到反讽文本的文本风格转换方法及装置 | |
CN113850290B (zh) | 文本处理及模型训练方法、装置、设备和存储介质 | |
CN113015002B (zh) | 一种主播视频数据的处理方法和装置 | |
CN112560466B (zh) | 链接实体关联方法、装置、电子设备和存储介质 | |
CN115691503A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN115623134A (zh) | 会议音频处理方法、装置、设备及存储介质 | |
CN110851572A (zh) | 会话标注方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |