CN110489527A - 基于语音交互的银行业务智能咨询以及办理方法和系统 - Google Patents

基于语音交互的银行业务智能咨询以及办理方法和系统 Download PDF

Info

Publication number
CN110489527A
CN110489527A CN201910744377.0A CN201910744377A CN110489527A CN 110489527 A CN110489527 A CN 110489527A CN 201910744377 A CN201910744377 A CN 201910744377A CN 110489527 A CN110489527 A CN 110489527A
Authority
CN
China
Prior art keywords
text information
keyword
matching
banking
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910744377.0A
Other languages
English (en)
Inventor
李晓飞
丁朔
黄尔俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910744377.0A priority Critical patent/CN110489527A/zh
Publication of CN110489527A publication Critical patent/CN110489527A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/143Termination or inactivation of sessions, e.g. event-controlled end of session
    • H04L67/145Termination or inactivation of sessions, e.g. event-controlled end of session avoiding end of session, e.g. keep-alive, heartbeats, resumption message or wake-up for inactive or interrupted session
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • H04L67/5683Storage of data provided by user terminals, i.e. reverse caching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于语音交互的银行业务智能咨询以及办理方法和系统,方法包括以下过程:收集用户的语音信息;根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;将答案进行语音合成反馈给用户。本系统中,银行数据管理人员可通过数据管理软件查看并管理相关数据,包括记录访客信息,对问题进行分类,查看实时监控,定期更新数据等;本发明能够快速吸收和利用知识,为用户反馈最满意并且最符合人类交流习惯的答案,并且能够有效减轻银行业务受理人员的工作负担,为用户提供全方位的智能化体验。

Description

基于语音交互的银行业务智能咨询以及办理方法和系统
技术领域
本发明涉及业务数据分析及处理技术领域,具体涉及一种基于语音交互的银行业务智能咨询以及办理方法和系统。
背景技术
语音交互一直都是人工智能领域发展的重中之重,一种智能设备的智能化程度,从某种程度而言,往往取决于语音交互时系统对用户意图的了解程度。随着语音识别技术的成熟,语音交互已经广泛应用于汽车、手机、智能家居等相关领域,当然,这些都属于聊天机器人范畴。
目前,对于国内的各大银行机构,银行业务办理大厅都设有人工询问业务办理的窗口和数量不一的业务办理窗口。在业务办理高峰期的时候,常常容易出现排号过多,造成大量业务咨询或者办理人员排队等候的局面。据统计,在中国,目前银行业金融机构法人共有4000多家,而银行网点就有20多万个,可以看出数量极其庞大,而且数量每年也都在上涨,如果把咨询人员和银行业务受理部分人员用智能语音终端来代替的话,一方面缓解了银行人员的工作负担,另一方面也能使用户能够得到更好的体验,业务办理效率也会随之提高,并且也可以在后台记录用户咨询的问题并进行分类统计,经过大数据分析之后银行相关人员能够对银行的业务模式和经营模式进行适当调整,从而吸引到更多的客户。
发明内容
本发明的目的在于克服现有技术中的不足,提出了一种基于语音交互的银行业务智能咨询以及办理方法和系统,与用户进行语音交互来解决用户的咨询及办理业务。
为解决上述技术问题,本发明提供了一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,包括以下过程:
收集用户的语音信息;
根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;
将答案进行语音合成反馈给用户。
进一步的,根据语音信息从QA语料库中查找到相匹配的问题的具体过程包括:
将语音信息转为文本信息;
将文本信息与QA语料库中各问题进行匹配,获取与文本信息相匹配的问题。
进一步的,将文本信息与QA语料库中各问题进行匹配获取与文本信息相匹配的问题的具体过程包括:
1)对文本信息进行分词以及词性标注,根据词性选出有效词,所述有效词包括名词、动词、形容词和副词;
2)将有效词组成的语句分别与QA语料库中各问题计算相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作;
3)从文本信息中提取关键词,通过基于关键词的文本自动生成模型将文本信息进行同义表示,将同义表示后的文本信息重新进行新一轮的匹配。
进一步的,从文本信息中提取关键词包括:
采用基于图排序的TextRank算法从文本信息中提取关键词。
进一步的,通过基于关键词的文本自动生成模型将文本信息进行同义表示的过程为:
a)根据输入的关键词从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求;
c)如果满足要求,则根据同义语句集合对语句进行同义词替换。
进一步的,对文本信息进行分词包括:
采用AC-DoubleArrayTrie算法对文本信息进行分词。
进一步的,相似度为拼音相似度计算和纯文本相似度的加权平均值。
相应的,本发明还提供了一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,包括语音采集模块、问题分析模块和答案交互模块;
语音采集模块,用于收集用户的语音信息;
问题分析模块,用于根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;
答案交互模块,用于将答案进行语音合成反馈给用户。
进一步的,问题分析模块中,根据语音信息从QA语料库中查找到相匹配的问题的具体过程包括:
将语音信息转为文本信息;
将文本信息与QA语料库中各问题进行匹配,获取与文本信息相匹配的问题。
进一步的,问题分析模块中,将文本信息与QA语料库中各问题进行匹配获取与文本信息相匹配的问题的具体过程包括:
1)对文本信息进行分词以及词性标注,根据词性选出有效词,所述有效词包括名词、动词、形容词和副词;
2)将有效词组成的语句分别与QA语料库中各问题计算相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作;
3)从文本信息中提取关键词,通过基于关键词的文本自动生成模型将文本信息进行同义表示,将同义表示后的文本信息重新进行新一轮的匹配。
进一步的,问题分析模块中,从文本信息中提取关键词包括:
采用基于图排序的TextRank算法从文本信息中提取关键词。
进一步的,问题分析模块中,通过基于关键词的文本自动生成模型将文本信息进行同义表示的过程为:
a)根据输入的关键词从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求;
c)如果满足要求,则根据同义语句集合对语句进行同义词替换。
进一步的,问题分析模块中,对文本信息进行分词包括:
采用AC-DoubleArrayTrie算法对文本信息进行分词。
进一步的,问题分析模块中,相似度为拼音相似度计算和纯文本相似度的加权平均值。
与现有技术相比,本发明所达到的有益效果是:
(1)本发明的银行业务咨询以及办理方式,引入了智能语音终端的交互方式,通过唤醒词加阈值的形式作为音频收集方式,并且摒弃了传统的按键式操作,使得用户在业务办理的时候可以直接获取想要的结果,而不用按步骤去选择负债业务、资产业务、中间业务等;
(2)本发明的银行业务咨询以及办理方式,通过云端服务器,为用户提供更精准,更快捷,更智能的操作反馈减轻了银行业务受理人员的工作压力,为用户提供了更加优质、更加高效、更加便利的服务;
(3)本发明的银行业务咨询以及办理方式,通过对文本信息的多特征融合算法进行相似度计算,并且具备独有的文本生成系统,使得整个交互方式更加智能,更加切合人类交流方式;
(4)本发明的银行业务咨询以及办理方式,后台数据管理软件可以对用户访问数据进行记录并分析,可以远程监控终端操作人员的行为动态,可以与数据库系统做数据交互,使银行工作人员以及行情分析人员直观地看到各种数据,可以对业务类问题进行分类统计,从而能够使银行工作人员对银行的业务模式和经营模式及时进行适当调整
附图说明
图1是本发明实施例中的结构示意图;
图2是本发明实施例中的音频采集模块流程图;
图3是本发明实施例中的文本信息处理流程图;
图4是本发明实施例中的文本自动生成模型流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的一种基于语音交互的银行业务智能咨询以及办理系统,参见图1所示,包括以下步骤:
步骤S1,音频数据采集,各个咨询终端利用具有声源定位、噪声抑制的六阵列麦克风作为音频收集设备,收集用户的语音信息。
音频数据采集过程如图2所示,包括以下过程:
首先要唤醒咨询终端:用户输入包含唤醒词的语音信息,通过具有声源定位和噪声抑制的六阵列麦克风采集此语音并将其发送到咨询终端。咨询终端接收此语音进行语音识别,获取其对应的文本信息,然后判断此语音信息是否为唤醒词,唤醒词即作为触发信号,如没有检测到唤醒词(触发信号),则继续进行检测;如终端检测到触发信号,则开始进行音频采集准备。
持续进行音频采集(即收集用户的语音信息),并设定音频采集结束信号为:语音信号幅度低于阈值1秒之后。如果检测到音频结束信号,则结束本次音频的采集,并进行下一轮触发;否则,继续检测直至检测到音频结束信号。这里需要说明的是,下一轮触发会在每一次音频采集结束10秒之后,如超过10秒,系统会提示重新输入唤醒词,如未超过10秒,则可以直接进行下一个语音操作环节,这样做的目的主要是为了防止用户频繁输入唤醒词,影响体验。
步骤S2,语音识别:各个咨询终端将收集到的语音信息识别为文本信息,并将文本信息显示在终端屏幕上(方便用户查看),文本信息经缓存后提交至云端服务器中的中心管理服务器。
经过语音识别之后,终端将请求经缓存系统后发送至中心管理服务器,这里,缓存系统将文本信息以队列的形式进行存储,防止中心管理服务器因某一时刻接收请求过多而造成拥堵。
步骤S3,中心管理服务器将收到的文本信息推送至算法服务器,算法服务器将接收到的文本信息与QA语料库中各问题进行匹配,获取与语音信息匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案。
这里,算法服务器对文本信息的处理方法如图3所示:
1)对文本信息进行分词以及词性标注,随后根据词性选出有效词,这里的有效词主要指的是名词,动词,形容词,副词等,这也为之后的关键词提取提高准确率。
这里,分词方法采用现有技术中的AC-DoubleArrayTrie(双数组AC自动机)算法,该算法由AC自动机算法和DoubleArrayTrie算法组成,其中有三个核心参数,index数组,base数组和check数组,index数组用来存放词典中每个字符对应的数字编号,base数组用来存储词语前后的关联关系,如果遇到词语的结尾,此时需要返回到之前已经匹配的那个字符继续进行匹配,而check数组则用来存储该字符。获得这三个数组之后,对输入的字符串进行逐个扫描,直至完成所有的匹配。该分词方式结合了DoubleArrayTrie高速单串匹配和AC自动机高速多模式匹配的优点,得到了一种近乎完美的分词处理,在高并发场景下能够有效提高系统运行速度。
2)经过上一步的分词以及提取有效词之后,将处理后的有效词组成的语句分别与QA语料库中各问题进行相似度计算,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作。
本发明采用拼音相似度和纯文本相似度进行结合。对于拼音相似度的计算,首先提取有效词以及QA语料库中问题的拼音,之后计算有效词与QA语料库中各问题的余弦距离,纯文本相似度则是通过编辑距离来确定。两种相似度在经过加权平均后得到最终相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题。然后判断该问题是咨询业务指令还是办理业务指令,如为办理业务指令,比如:查询余额指令,此时就可以直接提示用户手动输入密码,验证通过后,直接显示余额,用户无需手动操作即可,办理过程中,系统会语音提示相关办理信息,如果当前系统不支持用户所提业务的办理,则语音提示不能办理,并且将该业务种类进行存储;如为咨询业务指令,则直接语音反馈QA语料库中此问题对应的答案。
如专家库中没有匹配到相关问题,即相似度小于阈值,则提取该问题的关键词,经过文本生成模型,将问题以不同的表达方式一样的意思重新进行新一轮的匹配。具体过程如下。
3)从文本信息中提取关键词,经过关键词提取后,通过一种基于关键词的文本自动生成模型,该模型通过关键词将文本信息进行同义表示,即相同语义不同表达方式,比如“免运费”和“包邮”就是两种不同的表达方式,但意思却是一样的。将问题以不同的表达方式一样的意思重新进行新一轮的匹配。
这里,关键词提取方法为:
采用基于图排序的TextRank算法,该算法通过把文本分割为若干组成单元并建立图排序,利用投票机制对文本中的重要词进行排序,重要词即关键词。在本发明所涉及的场景下,该算法能够起到比TF-IDF(词频-逆文件频率)更好的提取效果,因为当输入只有一句话的时候,基于TF-IDF算法的所有关键词的重要度都为0,无法达到提取关键词的效果。
TextRank算法主要计算公式如下:
其中,d代表阻尼系数,表示在图模型中,一个参数从某一个指定的顶点到任意一个其他顶点的概率,Vi表示图中的任一节点,In(Vi)表示指向顶点Vi的所有顶点集合,|Out(Vj)|表示由顶点Vj连接出去的所有顶点的集合个数,WS(Vi)表示顶点Vi的最终排序权重,由于本发明所在的场景是一句话,故计算的是单个词的重要性,所以上述计算公式也可以看做PageRank(谷歌公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法)的一种特殊情况。
通过一文本自动生成模型,将问题进行同义表示以将问题以不同的表达方式一样的意思重新进行新一轮的匹配。具体过程如图4所示,包括以下过程:
a)根据输入的关键词,然后从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求,即:集合中的语句数量是否超过指定的数量;
c)如果未达到指定数量要求,则直接结束,进行下一轮业务问题匹配;
d)如果超出指定数量要求,根据同义语句集合,对语句进行同义词替换,直至在QA语料库中查找到相匹配的问题。
经过以上文本生成处理之后,仍未匹配到合适的问题,此时则可以语音输出未搜索到合适答案,并且将该问题进行记录。
4)根据问题查找得到QA语料库中与此问题对应的答案。
步骤S4,算法服务器将查找到的答案结果反馈至管理服务器,管理服务器将结果推送到对应的终端界面,咨询终端将该结果进行语音合成并输出(即将答案转为语音信息反馈给用户);
步骤S5,银行数据管理人员通过数据管理软件查看并管理相关数据,包括访客记录,问题分类,实时监控,数据更新等,其中终端与数据管理客户端的数据交互通过转发服务器来实现。
用户在整个业务咨询以及办理过程中,咨询终端可实时监控用户的行为,并将画面传至后台客户端,即数据管理软件(后台客户端),银行数据管理人员通过数据管理软件查看并管理相关数据,主要对用户提出的系统无法回答的业务咨询类问题进行完善,并及时更新到系统中,另外可以通过后台客户端对终端前用户举止行为进行实时监控。客户端可以对用户的各种操作行为数据进行记录,并将统计分类好的数据呈献给银行数据管理人员。其中终端与数据管理客户端的数据交互通过转发服务器来实现。
这里,终端与后台客户端的通信靠转发服务器来实现,关于转发服务器通信协议的主要内容为:
1)终端(或客户端)首先向转发服务器发送注册信息,如果转发服务器没有回应(以2秒为准)或回应错误,则10秒后终端(或客户端)重新发送注册信息。
2)如果转发服务器收到注册信息后,回应注册成功信息,表示双方完成握手。
3)握手成功后,终端(或客户端)每二十秒向转发服务器发送一个心跳包,如果在2秒内终端(或客户端)没有收到转发服务器的回应,则从下一次心跳开始,终端(或客户端)则以2秒每次发送一个心跳包,直到成功收到回应包后改为20秒一次。如果在45秒内终端(或客户端)都没有收到转发服务器的心跳回应包,那么终端(或客户端)重新开始注册,此认为转发服务器断开与终端(或客户端)的连接。
4)心跳包从终端(或客户端)到转发服务器,同时转发服务器也有心跳包到终端(或客户端),其处理过程同上。
相应的,本发明还提供了一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,包括语音采集模块、问题分析模块和答案交互模块;
语音采集模块,用于收集用户的语音信息;
问题分析模块,用于根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;
答案交互模块,用于将答案进行语音合成反馈给用户。
进一步的,问题分析模块中,根据语音信息从QA语料库中查找到相匹配的问题的具体过程包括:
将语音信息转为文本信息;
将文本信息与QA语料库中各问题进行匹配,获取与文本信息相匹配的问题。
进一步的,问题分析模块中,将文本信息与QA语料库中各问题进行匹配获取与文本信息相匹配的问题的具体过程包括:
1)对文本信息进行分词以及词性标注,根据词性选出有效词,所述有效词包括名词、动词、形容词和副词;
2)将有效词组成的语句分别与QA语料库中各问题计算相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作;
3)从文本信息中提取关键词,通过基于关键词的文本自动生成模型将文本信息进行同义表示,将同义表示后的文本信息重新进行新一轮的匹配。
进一步的,问题分析模块中,从文本信息中提取关键词包括:
采用基于图排序的TextRank算法从文本信息中提取关键词。
进一步的,问题分析模块中,通过基于关键词的文本自动生成模型将文本信息进行同义表示的过程为:
a)根据输入的关键词从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求;
c)如果满足要求,则根据同义语句集合对语句进行同义词替换。
进一步的,问题分析模块中,对文本信息进行分词包括:
采用AC-DoubleArrayTrie算法对文本信息进行分词。
进一步的,问题分析模块中,相似度为拼音相似度计算和纯文本相似度的加权平均值。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (10)

1.一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,包括以下过程:
收集用户的语音信息;
根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;
将答案进行语音合成反馈给用户。
2.根据权利要求1所述的一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,根据语音信息从QA语料库中查找到相匹配的问题的具体过程包括:
将语音信息转为文本信息;
将文本信息与QA语料库中各问题进行匹配,获取与文本信息相匹配的问题。
3.根据权利要求2所述的一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,将文本信息与QA语料库中各问题进行匹配获取与文本信息相匹配的问题的具体过程包括:
1)对文本信息进行分词以及词性标注,根据词性选出有效词,所述有效词包括名词、动词、形容词和副词;
2)将有效词组成的语句分别与QA语料库中各问题计算相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作;
3)从文本信息中提取关键词,通过基于关键词的文本自动生成模型将文本信息进行同义表示,将同义表示后的文本信息重新进行新一轮的匹配。
4.根据权利要求3所述的一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,从文本信息中提取关键词包括:
采用基于图排序的TextRank算法从文本信息中提取关键词。
5.根据权利要求3所述的一种基于语音交互的银行业务智能咨询以及办理方法,其特征是,通过基于关键词的文本自动生成模型将文本信息进行同义表示的过程为:
a)根据输入的关键词从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求;
c)如果满足要求,则根据同义语句集合对语句进行同义词替换。
6.一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,包括语音采集模块、问题分析模块和答案交互模块;
语音采集模块,用于收集用户的语音信息;
问题分析模块,用于根据语音信息从QA语料库中查找到相匹配的问题,根据问题查找得到QA语料库中与此问题对应的答案;
答案交互模块,用于将答案进行语音合成反馈给用户。
7.根据权利要求6所述的一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,问题分析模块中,根据语音信息从QA语料库中查找到相匹配的问题的具体过程包括:
将语音信息转为文本信息;
将文本信息与QA语料库中各问题进行匹配,获取与文本信息相匹配的问题。
8.根据权利要求7所述的一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,问题分析模块中,将文本信息与QA语料库中各问题进行匹配获取与文本信息相匹配的问题的具体过程包括:
1)对文本信息进行分词以及词性标注,根据词性选出有效词,所述有效词包括名词、动词、形容词和副词;
2)将有效词组成的语句分别与QA语料库中各问题计算相似度,将计算得到的最大相似度与设定阈值相比较,若该相似度大于设定阈值,则认为匹配成功,选取相似度大于设定阈值对应的问题作为与文本信息最匹配的问题,即认为语音信息指令为此问题;如果匹配不成功,进行下一步操作;
3)从文本信息中提取关键词,通过基于关键词的文本自动生成模型将文本信息进行同义表示,将同义表示后的文本信息重新进行新一轮的匹配。
9.根据权利要求8所述的一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,问题分析模块中,从文本信息中提取关键词包括:
采用基于图排序的TextRank算法从文本信息中提取关键词。
10.根据权利要求8所述的一种基于语音交互的银行业务智能咨询以及办理系统,其特征是,问题分析模块中,通过基于关键词的文本自动生成模型将文本信息进行同义表示的过程为:
a)根据输入的关键词从同义词词库中选择关键词作为输入关键词的同义语句集合;
b)判断同义语句集合大小是否满足要求;
c)如果满足要求,则根据同义语句集合对语句进行同义词替换。
CN201910744377.0A 2019-08-13 2019-08-13 基于语音交互的银行业务智能咨询以及办理方法和系统 Pending CN110489527A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910744377.0A CN110489527A (zh) 2019-08-13 2019-08-13 基于语音交互的银行业务智能咨询以及办理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910744377.0A CN110489527A (zh) 2019-08-13 2019-08-13 基于语音交互的银行业务智能咨询以及办理方法和系统

Publications (1)

Publication Number Publication Date
CN110489527A true CN110489527A (zh) 2019-11-22

Family

ID=68550781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910744377.0A Pending CN110489527A (zh) 2019-08-13 2019-08-13 基于语音交互的银行业务智能咨询以及办理方法和系统

Country Status (1)

Country Link
CN (1) CN110489527A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145014A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种业务办理方法及装置
CN111508494A (zh) * 2020-04-20 2020-08-07 广东工业大学 一种智能纳税语音咨询方法和系统
CN111738013A (zh) * 2020-06-16 2020-10-02 中国建设银行股份有限公司 语音交互方法、装置、自助设备、服务器和介质
CN112071436A (zh) * 2020-09-24 2020-12-11 上海依图网络科技有限公司 针对疫情的智能交互方法、装置及存储介质
CN112131365A (zh) * 2020-09-22 2020-12-25 平安科技(深圳)有限公司 一种数据处理方法、装置、设备及介质
CN112259090A (zh) * 2020-09-10 2021-01-22 北京百度网讯科技有限公司 基于语音交互的业务办理方法、装置和电子设备
CN112580637A (zh) * 2020-12-31 2021-03-30 苏宁金融科技(南京)有限公司 文本信息识别方法、提取方法、装置及系统
CN112599125A (zh) * 2020-12-02 2021-04-02 一汽资本控股有限公司 一种语音办公处理方法、装置、终端及存储介质
CN112785416A (zh) * 2021-01-21 2021-05-11 中国工商银行股份有限公司 业务处理方法和装置
CN113657912A (zh) * 2021-08-20 2021-11-16 中国银行股份有限公司 一种自动转呼方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107315766A (zh) * 2017-05-16 2017-11-03 广东电网有限责任公司江门供电局 一种集合智能与人工问答的语音问答方法及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN107315766A (zh) * 2017-05-16 2017-11-03 广东电网有限责任公司江门供电局 一种集合智能与人工问答的语音问答方法及其装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145014A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种业务办理方法及装置
CN111508494B (zh) * 2020-04-20 2023-03-07 广东工业大学 一种智能纳税语音咨询方法和系统
CN111508494A (zh) * 2020-04-20 2020-08-07 广东工业大学 一种智能纳税语音咨询方法和系统
CN111738013A (zh) * 2020-06-16 2020-10-02 中国建设银行股份有限公司 语音交互方法、装置、自助设备、服务器和介质
CN112259090A (zh) * 2020-09-10 2021-01-22 北京百度网讯科技有限公司 基于语音交互的业务办理方法、装置和电子设备
CN112131365A (zh) * 2020-09-22 2020-12-25 平安科技(深圳)有限公司 一种数据处理方法、装置、设备及介质
CN112071436A (zh) * 2020-09-24 2020-12-11 上海依图网络科技有限公司 针对疫情的智能交互方法、装置及存储介质
CN112599125A (zh) * 2020-12-02 2021-04-02 一汽资本控股有限公司 一种语音办公处理方法、装置、终端及存储介质
CN112580637A (zh) * 2020-12-31 2021-03-30 苏宁金融科技(南京)有限公司 文本信息识别方法、提取方法、装置及系统
CN112580637B (zh) * 2020-12-31 2023-05-12 苏宁金融科技(南京)有限公司 文本信息识别方法、提取方法、装置及系统
CN112785416A (zh) * 2021-01-21 2021-05-11 中国工商银行股份有限公司 业务处理方法和装置
CN113657912A (zh) * 2021-08-20 2021-11-16 中国银行股份有限公司 一种自动转呼方法、装置、电子设备及存储介质
CN113657912B (zh) * 2021-08-20 2024-02-02 中国银行股份有限公司 一种自动转呼方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110489527A (zh) 基于语音交互的银行业务智能咨询以及办理方法和系统
CN103699625B (zh) 基于关键词进行检索的方法及装置
WO2023273170A1 (zh) 一种迎宾机器人对话方法
CN107135247A (zh) 一种人与人工智能协同工作的服务系统及方法
CN107220295A (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN109815314A (zh) 一种意图识别方法、识别设备及计算机可读存储介质
CN109978020B (zh) 一种基于多维特征的社交网络账号马甲身份辨识方法
WO2020087774A1 (zh) 基于概念树的意图识别方法、装置及计算机设备
KR20150096295A (ko) 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법
CN104484336B (zh) 一种中文评论分析方法及其系统
WO2021159902A1 (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN111694940A (zh) 一种用户报告的生成方法及终端设备
CN109634994A (zh) 一种简历与职位的匹配推送方法及计算机设备和存储介质
CN106557558A (zh) 一种数据分析方法及装置
CN108491421A (zh) 一种生成问答的方法、装置、设备和计算存储介质
US20230032728A1 (en) Method and apparatus for recognizing multimedia content
CN110489747A (zh) 一种图像处理方法、装置、存储介质及电子设备
CN111061837A (zh) 话题识别方法、装置、设备及介质
CN109376288A (zh) 一种实现语义搜索的云计算平台及其均衡方法
US11176209B2 (en) Dynamically augmenting query to search for content not previously known to the user
CN106446051A (zh) Eagle媒资深度搜索方法
CN112528638A (zh) 异常对象识别方法及装置、电子设备、存储介质
CN110019763B (zh) 文本过滤方法、系统、设备及计算机可读存储介质
CN109697676A (zh) 基于社交群的用户分析及应用方法和装置
CN114003600A (zh) 数据处理方法、系统、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191122

RJ01 Rejection of invention patent application after publication