CN113095852B - 一种通过智能语音进行自助分发和服务系统 - Google Patents
一种通过智能语音进行自助分发和服务系统 Download PDFInfo
- Publication number
- CN113095852B CN113095852B CN202110365178.6A CN202110365178A CN113095852B CN 113095852 B CN113095852 B CN 113095852B CN 202110365178 A CN202110365178 A CN 202110365178A CN 113095852 B CN113095852 B CN 113095852B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- service
- customer service
- intelligent customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 38
- 230000008569 process Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 25
- 238000013519 translation Methods 0.000 claims description 19
- 238000005516 engineering process Methods 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 208000025174 PANDAS Diseases 0.000 claims description 4
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims description 4
- 240000004718 Panda Species 0.000 claims description 4
- 235000016496 Panda oleosa Nutrition 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 6
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42136—Administration or customisation of services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种通过智能语音自助分发和服务系统,其包括:(1)将获取到的数据库信息进行数据预处理;(2)智能客服接收用户输入的语音信息;(3)将语音信息翻译成文字信息,根据翻译后的文字信息解析查询意图;(4)智能客服通过分发模块将其分发给114查号、114移车、优报、114总机等业务平台。本发明是一个综合的信息服务系统,通过智能语音的文本分析实现了多种业务融合和业务分发功能;通过本系统,实现了用户请求的零等待,提高了服务效率,降低了人力成本,查号准确率和用户体验也相应提升。
Description
技术领域
本发明属于人工智能技术与电信综合信息服务相结合的领域,具体涉及一种通过智能语音自助分发和服务系统。
背景技术
近十年来,现代生活节奏的加快,各行各业寻找一种方便快捷、准确有效的方式对用户进行服务的意愿越来越强烈,以往的电信查号系统不能满足目前所需的承载量,所需要的人力成本也在持续增加,随着互联网和人工智能技术的不断发展,电信企业也在寻求一种智能化的语音服务来帮助解决这类问题。
在人际交往中,言语是最自然并且最直接的方式之一。随着技术的进步,越来越多的人们也期望计算机能够具备与人进行言语沟通的能力,因此,语音识别这一技术也越来越受到关注。尤其,随着深度学习技术应用在语音识别技术中,使得语音识别的性能得到了显著提升,也使得语音识别技术的普及成为了现实。语音识别技术就是让智能设备听懂人类的语言,它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学,这项技术可以提供比如语音客服、自动语音翻译、命令控制、语音验证码等多项应用。
随着社会的发展,人力成本也在不断增加,以往的电信查号系统采用的都是人工方式,且话务员通过培训后才可以上岗,这种方式目前存在成本高,招聘难的特点,同时,随着用户需求的不断增加,只有自助服务能够满足用户多样化且快捷有效的需求,电信需要一个业务转发和综合信息服务系统,于是如何在一个综合信息服务系统中实现业务智能转发以及智能服务的技术已成为电信领域需要解决的问题之一。
发明内容
本发明的目的在于提供一种通过智能语音自助分发和服务系统,用于解决如何实现一个综合信息服务查询系统中的业务智能转发,以及如何提升智能服务中信息的准确率和用户交互体验等问题。
本发明采取的技术方案是:一种通过智能语音自助分发和服务系统,其包括如下步骤:
(1)将获取到的数据库信息进行数据预处理;
(2)智能客服接收用户输入的语音信息;
(3)将语音信息翻译成文字信息,根据翻译后的文字信息解析查询意图;
(4)智能客服通过分发模块将其分发下面业务平台。
进一步的,所述步骤(4)中,智能客服通过分发模块将其分发给114查号、114移车、优报、114总机业务平台。
进一步的,所述系统包括语音分发业务平台,该语音分发业务平台包括:
接收模块:智能客服用于接收用户所述的语音信息;
翻译生成模块:智能客服对用户所述语音信息进行翻译生成文字信息;
业务生成模块:智能客服对翻译生成的文字信息进行停用词筛选,实体抽取以生成初始查询需求;
业务转发模块:通过关键词命中结果确定语音信息是否属于业务需求,如果确定文字信息属于所述业务需求,则转发到相应的业务平台,如果确定所述文字信息不属于任何业务的需求,则提醒用户重新阐述,多次之后如没有识别,可将其挂断。
进一步的,所述所述步骤(4)中业务平台包括语音进行自助查号平台,当分发到查号平台,其具体包含如下步骤:
步骤401,预先收集单位信息数据库,通过python调用第三方numpy库和pandas库解析相关地址信息,存储在服务器中;
步骤402,智能客服接收用户输入的语音信息;
步骤403,智能客服调用翻译引擎接口实现语音转文字;
步骤404,智能客服将文字进行语义解析以生成查询需求;
步骤405,智能客服将用户分发到所需查询业务;
步骤406,智能客服调用后台技术生成用户初始查号意图;
步骤407,智能客服调用智力规则处理后生成最终查号意图;
步骤408,智能客服获取匹配度最高的单位名称及对应号码反馈给用户。
更进一步的,所述步骤401具体包含如下步骤:
步骤401.1,收集各个地市的地址信息,生成对应的地址库,将单位名称和地址信息中的地址进行解析和正则匹配,通过python语言调用第三方模块numpy、pandas解析地址信息中单位所在的市、区、街道、镇、路信息,然后将这些信息放入各个类别的库信息中;
步骤401.2,生成的地址信息在之后的初始查号意图进行单位索引中,作为第一步筛选操作和未登记逻辑处理模块中对应的地址校验,以避免查询单位所在的地址不符合用户所述。
更进一步的,所述步骤404中,智能客服对用户的文字信息进行停用词去除,语义解析,关键词命中,正则匹配,得到用户需求;所述步骤405中,智能客服对用户的需求进行分发路由,分发到的业务平台对其进行后续处理;所述步骤406、407中,智能客服进一步对用户查询需求进行第一次停用词处理,BERT命名实体识别,第二次停用词处理,之后进入别称库匹配,直报库映射,如果没有命中直报库,将筛选出的地址信息与地址库中各级地址信息进行匹配,如果命中,就将其筛选出来;所述步骤408中,将智能客服查询的结果反馈给所述用户,具体包括:通过语音播放形式和短信形式将所查询的结果反馈给拨打用户。
更进一步的,所述步骤407中,进入ES搜索前,首先去除用户所说的冗余信息,规范用户表述的单位信息,然后通过之前所匹配的各级地址信息和单位实体信息进行ES搜索库初筛,初筛完成之后,对排名靠前的650个单位信息中去除冗余信息后进行LCS算法和拼音二次匹配,将满足预设的匹配条件的至少一个检索结果作为至少一个相似查号结果;同时在步骤7中,使用BERT相似度算法进行用户查询意图识别,智能客服和用户之间进行三次有效的交互,用户表述上下文交互逻辑处理,查询未登记逻辑的处理,从而大幅度提高查询的准确率。
更进一步的,所述自助查号平台的系统结构包括:
接收模块:智能客服用于接收用户所述的语音信息;
翻译生成模块:智能客服对用户所述语音信息进行翻译生成文字信息;
初始查询需求生成模块:智能客服对翻译生成的文字信息进行停用词筛选,实体抽取以生成初始查询需求;
最终查询需求生成模块:将初始查询需求对预先处理的各级地址信息的库进行遍历,获取准确的地址信息,使用ES库联合单位信息和地址信息加权方式进行模糊查找,去除查找后的用户和单位名称中一致的冗余信息,然后通过LCS算法与拼音匹配相结合的算法匹配,匹配后进行未登记逻辑处理后确定最终查询结果;
查询模块:用于上述最终查询需求生成模块返回的结果去预先建立的号码存储库进行查找以获得最终的查号结果;
反馈模块:将查询到的结果通过语音和短信反馈给拨打用户,将查询到的结果通过语音合成并播放,对回答中的非固定内容,无固定录音文件的,则在语音平台上以TTS合成后再做播放。
进一步的,所述业务平台包括移车平台,当分发到移车平台,具体包含如下步骤:
步骤411,智能客服接收用户输入的语音信息;
步骤412,智能客服调用翻译引擎接口实现语音转文字;
步骤413,智能客服对文字信息进行处理,获取车牌号和移车地址;
步骤414,智能客服自动拨打车主电话并通知移车;
步骤415,智能客服对文字信息处理获取车主移车意向;
步骤416,智能客服通过语音和短信方式将车主移车意向反馈给用户。
更进一步的,所述步骤413中,智能客服对用户所述的文字信息进行停用词处理,语义解析,并通过地址纠正、拼音匹配、调用数据库、车牌校正后获得最终车主手机号;所述步骤414、415中,智能客服拨打车主电话,与车主进行简单交互后,停用词筛选,关键词匹配,BERT相似度匹配获得车主移车意向;所述步骤416中,智能客服将车主移车意向通过电话和短信方式反馈给用户。
本发明相对现有技术而言,所具有的优点和效果如下:
(1)本发明是一个综合信息服务系统,通过智能语音的文本分析实现了多种业务融合和业务分发功能;
(2)本发明中智能语音查号平台,通过前端系统的数据管理和展示以及对历史记录分析得出:智能客服和用户的三次有效交互,BERT命名实体识别和BERT相似度算法判断用户意图识别,可以有效地优化查号逻辑和提升查号准确率;
(3)本发明中智能语音查号平台,预先对单位和地址信息进行处理,细化各级地址信息,后端对用户冗余信息和数据库冗余信息的处理,以及联系用户交互的上下文信息,从而提高了查号准确率;
(4)本发明中智能语音查号平台,整理相关的别称库、直报库和简称库,针对各个地市进行定制,灵活性强,可操作性强;
(5)本发明中智能语音查号平台,对文字进行LCS+拼音匹配,查号准确率有效提高;
(6)本发明中智能语音移车平台,通过三通电话实现了移车业务全自助流程,节省用户等待时间。
附图说明
图1是本发明设计实施例的通过语音进行自助分发和服务系统流程示意图;
图2是本发明设计实施例中的一种智能语音进行查号的平台流程示意图;
图3是本发明设计实施例中的一种智能语音实现查号的平台的结构示意图;
图4是本发明设计实施例中语音查转系统总体结构示意图;
图5是本发明设计实施例中智能语音查号前端系统架构图;
图6是本发明设计实施例中智能语音进行查号交互逻辑流程图;
图7是本发明设计实施例中数据预处理流程示意图;
图8是本发明设计实施例中BERT训练命名实体识别图(BERT相似度匹配类似);
图9是本发明设计实施例中的一种智能语音进行移车的平台流程示意图;
图10是本发明设计实施例中智能语音机器人业务平台示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
如图1所示,一种通过智能语音自助分发和服务系统,具体包括:
(1)智能客服接收用户的语音信息,获取该通电话的标识ID、主叫号码、被叫号码等信息将其存入后台数据库以进行后续分析处理。
具体的,用户拨打电话,通过华为智能呼叫中心进行交互,应当理解,华为智能呼叫中心系统为现有系统,具体实现流程在此不再赘述。
(2)智能客服调用翻译引擎接口实现语音转文字。
具体地,可通过现有的语音识别技术对语音信息进行翻译以生成文字信息。应当理解,语音识别技术为现有技术,通过现有的语音识别技术将语音信息转换为文字信息的过程在此不再赘述。
(3)智能客服对文字进行语义解析以生成查询需求。
具体地,在本发明的实施例中,主要通过关键词命中和正则解析方法来对文字进行语义解析以生成查询需求。在本发明的实施例中,如果确定语音信息属于查询需求,则将其分发到所属平台,如果确定语音信息不属于查询需求,则可确定该语音信息为非查询需求。查询需求关键词如:移车、查号、总机查询等,查询需要正则解析的语句如:苏B-QG512,需要使用正则解析,从而得到用户移车需求。非查询需求可包括但不限于问候语,无意义需求、旅游和天气信息等。使用关键词对用户文字信息进行遍历以及正则解析,从而发现其是否是查询需求。其中,本发明针对不同的非查号需求的类型给出对应的相应措施的具体实现过程这里不在叙述。
(4)智能客服将用户分发到所需业务服务平台;包括114查号、114移车、优报、114总机等业务平台。
如图2所示,当用户需要进行查号服务时,将进入查号平台,当用户等待接听时间超过30s后,自动进入智能客服交互流程。智能客服按照预先设定的话术与用户进行交互,询问查号需求。语音实现翻译和前面所述一致,这里不再赘述。智能语音进行查号的方法如下:
(1)智能客服调用后台技术生成用户初始查号意图。
具体地,在本发明的实施例中,当用户到达查号平台时,采用两次去除停用词和BERT命名实体识别的方式对文字信息进行语义解析以生成初始查号意图。其中,去除停用词使用的是哈工大停用词表,以及使用图4中的前端系统进行历史信息查询,提取出现频率较高的无实际意义的词语,将这些词语加入停用词表,停用词表的长度不一,需按照从长到短的顺序进行排序,以避免无法彻底去除停用词信息。同时使用Google的BERT框架,并标注智能查号历史查询数据中的命名实体,对BERT框架进行fine-tune,作为查号场景下的命名实体抽取算法,因为用户表述中可能出现重复,所以当抽取的重复命名实体进行去重。例如:用户输入语音信息为“我要查那个人民路的常州教育局的电话号码,对,是教育局。”,首先,通过停用词去除无效信息后,剩下“人民路常州教育局,对,常州教育局”,然后通过BERT命名实体识别,变成【“人民路常州教育局”,“常州教育局”】,之后我们通过逻辑处理去除列表中后面的常州教育局,得到信息较为准确且完整的用户信息,通过以上方法将得到用户的初始查号意图。
(2)初始用户查号意图进行智力规则处理,后台判断逻辑处理生成最终查号意图。
具体地,当初始用户查号意图生成后,为简化和提高查号准确率,根据历史日志分析得出用户查询部分号码可直接推送相关客服电话的单位名称,如供电局维修、微信、快递、中国电信、淘宝等,命中则直接推送相关客服电话;当直接报号库没有命中时,将去别称库进行匹配,因查号库中存储的数据均为官方标准名称,用户查询习惯用简单或口语化方式描述信息,如中行、省人医、社保局、工商局等,当命中该信息时需将其补全,后期需人工维护,以避免信息不充分而导查询失败;同时由于不同的地方对单位名称会有不同的称呼或者历史原因用户仍习惯表述为老称呼或原称呼,如供销社等名称,则需将该信息替换,后期需人工维护。经过ES搜索前的预处理,若用户描述的信息进过实体抽取后在别称库、直报号库中命中,智能客服则直接将信息推送给用户,不需用户确认流程。若没有命中,将用户的对话信息中包含地址信息的文字对预先处理的各级地址库进行遍历,获得准确地址信息,形成市、区、街道、镇、路的列表,然后和数据库中单位信息对应的地址进行匹配,将地址匹配成功后获取的相关单位名称信息使用ES引擎分析器根据查询条件进行分析,根据分析的结构,重新构造查询,以搜索倒排索引,完成全文搜索请求,在ES库中推送前650条数据进入到识别算法模块。在这过程中,我们将数据送入ES搜索前,我们进行了如下处理:将用户查询频次较高的数据,比如派出所,人力资源和社会保障局,进行了一个冗余信息的处理和位置排列。例如:用户表述进入BERT命名实体识别为“派出所,武进区湖塘”,而库里信息只有“湖塘派出所”,所以我们需要的有效信息只有“湖塘派出所”,所以当命中派出所或者公安局的时候,我们需要将“湖塘派出所”给提炼出来,“湖塘”是武进区的一个镇,在地址处理过程中,已经作为我们的地址库,可以提取出来,所以我们通过判断语句将其表述规整后变成“湖塘派出所”进入库里查询,从而可以提高查询准确率。这个也可以适用于用户表述“常州市武进市公安局湖塘派出所”而库里只有“湖塘派出所”从而推荐其他派出所的场景。所以,针对用户查询频次较高的数据,我们分为两类,第一类为政府等职能类,当用户表述库里没有,或者表述单位范围过小时,我们推荐市级别的单位名称,让用户有途径去咨询。第二类为企业等单位,因为企业类的公司名称较为规范,比如:“江苏号百信息服务有限公司”,单位名称中有效关键信息为“号百”两字,为了降低误推率,即用户表述问题或者库里不存在的信息,我们对用户发送未登记话术,例如:用户表述“号码公司”,而我们ES筛选后的第一个推荐为“江苏号百信息服务有限公司”,这时因为“号码”和“号百”公司名称的不一致,我们就会给用户推未登记信息,这样我们可以提高用户的感知,规范用户的表述。我们识别算法模块目前采用最长公共子序算法+拼音匹配算法,查号中用户表述的信息中不仅是字的信息重要,同样也需将语句的顺序作为信息进行匹配,另外用户表述的信息中,经过语音引擎翻译后可能存在,拼音正确但是汉字错误,所以我们采用最长公共子序算法(LCS)+拼音匹配处理信息,将信息的顺序、关系、拼音等属性纳入匹配关键信息中,将处理后的用户表述信息采取文字和拼音共同计算权重值的方式,得出命中连续的且字数多的为最佳匹配信息。其中计分规则为最长公共子序列的长度*2+拼音匹配命中的长度。然后将得分最高的信息推送给用户,若用户确认不是想要的信息且表述后的话术与第一次相同,则将第一次匹配的结果排序第二且跟第一不相同的信息推送给用户,若确认失败则转接人工。
(3)查找单位信息数据库获得对应号码并反馈给用户。
将查询到的结果通过语音和短信反馈给拨打用户,将查询到的结果通过语音合成并播放,对回答中的非固定内容,无固定录音文件的,则在语音平台上以TTS合成后再做播放。
查号过程中其他有效的逻辑处理。
根据查号版本的迭代和用户交互历史数据的分析,我们得出当用户第三次表述查询的实体时,表述的信息较为准确和完整,所以我们在整个交互过程中,给予用户三次有效的交互,通过此方式,可以提高整体查询准确率。在对历史数据进行分析的过程中,我们发现,当用户表述不准确的时候,我们也推荐不准确,当下一次表述的时候,用户往往只会说一些地址信息,这样导致我们的查询无法进行。比如:用户表述:“人社局”,经过别称库替换等等处理之后,我们推荐用户的为“常州市人力资源和社会保障局”,而接下来用户会表述:“不是,是溧阳市的”,所以,我们需要将用户查询历史数据保存到数据库中,当用户的意图表示为“不是”,且有地址信息时,我们将其地址信息提取出来,做一个同级地址替换,变成为“溧阳市人力资源和社会保障局”,进库查询后,即为用户所需要的查询结果。
在整个过程中,当用户表述的名称信息进入ES筛选并推荐后,之后进行的交互过程,我们使用BERT进行用户的语义意图识别,用户表述的话术大致分为三种:1.不是,2.是,3.不是,并说出新的公司名称。我们通过训练BERT相似度匹配模型进行用户语义意图识别,当用户表述意图为“不是”,智能客服表述让用户重新再说一次的话术,当用户表述意图为“不是,有公司名称”,智能客服会进入查号的逻辑进行查询,重新推荐新的名称信息,当用户表述意图为“是”,智能客服会推荐名称,并报号。当用户表述为“不是”,且只带地址信息时,查询逻辑回到[0056]中的查询逻辑进行处理。
在整个过程中,对于冗余信息的处理,我们主要在两方面进行:第一个方面:用户表述中产生的冗余信息,因为库中的信息较为规范,而用户表述的信息冗余且不准确,尤其对用户表述的公司名称进行冗余信息的剔除,例如,用户表述“无锡人民医院总务科”,但是库里信息只有“无锡人民医院”,用户表述的实体名称中,“无锡人民医院”是关键信息,所以我们需要将“总务科”去除,从而可以查询准确。第二个方面:在ES进行筛选后,进行LCS+拼音匹配中产生的冗余信息,比如:用户表述“号百有限公司”,而库里查询靠前的数据中“XX有限公司”的匹配程度会更高,这时我们需要将用户表述的“有限公司”和库里中的单位名称中的“有限公司”冗余信息去除,这样查询到的是正确的结果。
对于用户查询公司等名称信息时的未登记情况逻辑处理,我们整理了相应的公司名称后缀库,公司名称后缀库的数据信息长度也是从长到短进行排列,并不断进行更新。当ES筛选后排名第一的公司名称,我们会进库剔除其对应的后缀名称以及各级别地址信息,并去除用户表述的冗余信息以及地址信息,并使用LCS进行最长公共序列的匹配,通过历史数据的分析,当连续信息长度大于等于2个的时候,用户表述和库里查询的基本正确,通过这样,可以提升用户体验,规范用户的表述,减少用户投诉。
为了实现上述实施例,本发明还提出了一种通过语音进行查号的平台结构。
图3是根据本发明实施例的通过语音进行查号的平台的结构示意图。如图3所示,通过语音进行查号的平台结构包括:接收模块、翻译生成模块、初始查询需求生成模块、最终查询需求生成模块、查询模块、以及反馈模块。各个模块的具体内容已在上面查号流程中阐述,初始查询需求模块和最终查询需求生成模块的相似度匹配和筛选是本平台结构的关键之处,通过此流程,可以很好的解决查询号码不准确问题,从而避免给用户带来不好的体验。
为了实现上述实施例,也为了让本发明能够逐渐完善和迭代,本发明还设计了语音查转系统总体结构示意图以及查号功能架构图,如图4和图5所示,语音查转系统实现了查号交互记录查询,查号交互行为标记,智能总机查转配置,智能报表展示与下载,查号功能框架图实现了系统管理,录音管理,统计管理,内容管理四大业务功能。
为了更形象的说明本发明中一种智能语音进行查号的实施例,本发明设计了一种智能语音进行查号交互逻辑流程图,如图6所示,该流程实现了流程中的识别问题和确认机制问题,构建了一种有效且可实施的框架。
为了提高本发明中一种智能语音进行查号的方法的准确性,本发明使用数据预处理技术对原始数据信息进行提炼以及对BERT训练命名实体识别和意图识别,如图7所示,原始数据信息中包含单位信息以及所在地址信息,首先python使用正则解析和遍历方法获取地址信息,并整理各级别的地址库数据。当用户的文字信息进行实体抽取后,这些地址信息与地址库数据进行匹配,单位名称信息和地址信息进入ES库进行搜索时,单位名称信息和地址信息分别加以不同的权重;如图8所示,BERT训练符合查号场景下的命名实体识别和意图识别,通过这种方式,提高用户的搜索体验以及查号准确性。
如图9所示,当用户需要进行移车服务时,将进入移车平台,图中用户和智能客服交互的话术以及语音翻译文字,语义解析等这里不再赘述。整个过程分为三通电话,第一通是用户呼叫114移车平台,与智能客服进行对话;第二通是智能客服获取车主手机号,拨打电话给车主,询问车主移车意向;第三通是智能客服将车主移车意向反馈给用户,实现移车整个流程。具体如下:
(1)当用户说出所需移车的车牌号,智能客服使用拼音匹配对其纠正,并在后台调用数据库查询,当获取到对应车牌号后,智能客服询问移车地址以及移车原因,并获取车牌号对应的手机号。
(2)当智能客服获取手机号之后,会自动拨打电话给车主,通过与车主进行对话交互,获取车主移车的意向,移车意向可根据用户的回复信息中通过关键词命中的方式解析。
(3)当获取用户移车意向后,智能客服会自动拨打给用户进行反馈。当流程结束后,整个过程中相关文字信息以及录音将保存在服务器中。
为了实现本发明中智能客服电话机器人的相关功能,图10是根据本发明中查号和移车平台实现的智能客服电话机器人。智能客服电话机器人的主要技术在于业务逻辑和技术实现,技术实现是智能客服能够与客户进行对话的一个重要步骤,因为当客户说出自己的需求,需要智能客服能理解并立即做出语音回应。本发明中智能客服电话机器人底层的服务主要搭建三个服务:FreeSwitch服务,Django服务以及Unimrcp服务。它们的工作逻辑是是输入语音到FreeSwitch的mod_Unimrcp模块,之后将语音流传输给Unimrcp服务器,服务器通过翻译引擎翻译出文字,之后将文字传输给FreeSwitch,FreeSwitch发送HTTP请求到Django服务器端口,该服务器端口进行相应的业务逻辑处理后将文字返回FreeSwitch,并由FreeSwitch转换成语音发送出去,这便是一个完整的人与智能客服对话的过程。
以上显示和描述了本发明的基本原理、主要特征和优点。本领域的普通技术人员应该了解,上述实施例不以任何形式限制本发明的保护范围,凡采用等同替换等方式所获得的技术方案,均落于本发明的保护范围内。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
Claims (5)
1.一种通过智能语音自助分发和服务系统,其特征在于包括如下步骤:
(1)将获取到的数据库信息进行数据预处理;
(2)智能客服接收用户输入的语音信息;
(3)将语音信息翻译成文字信息,根据翻译后的文字信息解析查询意图;
(4)智能客服通过分发模块将其分发给下面业务平台;
所述步骤(4)中,智能客服通过分发模块将其分发给114查号、114移车、优报、114总机业务平台;
当分发到查号平台,其具体包含如下步骤:
步骤401,预先收集单位信息数据库,通过python调用第三方numpy库和pandas库解析相关地址信息,存储在服务器中;
步骤402,智能客服接收用户输入的语音信息;
步骤403,智能客服调用翻译引擎接口实现语音转文字;
步骤404,智能客服将文字进行语义解析以生成查询需求;
步骤405,智能客服将用户分发到所需查询业务;
步骤406,智能客服调用后台技术生成用户初始查号意图;
步骤407,智能客服调用智力规则处理后生成最终查号意图;
步骤408,智能客服获取匹配度最高的单位名称及对应号码反馈给用户;
所述步骤401具体包含如下步骤:
步骤401.1,收集各个地市的地址信息,生成对应的地址库,将单位名称和地址信息中的地址进行解析和正则匹配,通过python语言调用第三方模块numpy、pandas解析地址信息中单位所在的市、区、街道、镇、路信息,然后将这些信息放入各个类别的库信息中;
步骤401.2,生成的地址信息在之后的初始查号意图进行单位索引中,作为第一步筛选操作和未登记逻辑处理模块中对应的地址校验,以避免查询单位所在的地址不符合用户所述;
所述步骤404中,智能客服对用户的文字信息进行停用词去除,语义解析,关键词命中,正则匹配,得到用户需求;所述步骤405中,智能客服对用户的需求进行分发路由,分发到的业务平台对其进行后续处理;所述步骤406、407中,智能客服进一步对用户查询需求进行第一次停用词处理,BERT命名实体识别,第二次停用词处理,之后进入别称库匹配,直报库映射,如果没有命中直报库,将筛选出的地址信息与地址库中各级地址信息进行匹配,如果命中,就将其筛选出来;所述步骤408中,将智能客服查询的结果反馈给所述用户,具体包括:通过语音播放形式和短信形式将所查询的结果反馈给拨打用户;
所述步骤407中,进入ES搜索前,首先去除用户所说的冗余信息,规范用户表述的单位信息,然后通过之前所匹配的各级地址信息和单位实体信息进行ES搜索库初筛,初筛完成之后,对排名靠前的650个单位信息中去除冗余信息后进行LCS算法和拼音二次匹配,将满足预设的匹配条件的至少一个检索结果作为至少一个相似查号结果;同时在步骤7中,使用BERT相似度算法进行用户查询意图识别,智能客服和用户之间进行三次有效的交互,用户表述上下文交互逻辑处理,查询未登记逻辑的处理,从而大幅度提高查询的准确率。
2.根据权利要求1所述的一种通过智能语音自助分发和服务系统,其特征在于,所述系统包括语音分发业务平台,该语音分发业务平台包括:
接收模块:智能客服用于接收用户所述的语音信息;
翻译生成模块:智能客服对用户所述语音信息进行翻译生成文字信息;
业务生成模块:智能客服对翻译生成的文字信息进行停用词筛选,实体抽取以生成初始查询需求;
业务转发模块:通过关键词命中结果确定语音信息是否属于业务需求,如果确定文字信息属于所述业务需求,则转发到相应的业务平台,如果确定所述文字信息不属于任何业务的需求,则提醒用户重新阐述,多次之后如没有识别,可将其挂断。
3.根据权利要求1所述的一种通过智能语音自助分发和服务系统,其特征在于,所述查号平台的系统结构包括:
接收模块:智能客服用于接收用户所述的语音信息;
翻译生成模块:智能客服对用户所述语音信息进行翻译生成文字信息;
初始查询需求生成模块:智能客服对翻译生成的文字信息进行停用词筛选,实体抽取以生成初始查询需求;
最终查询需求生成模块:将初始查询需求对预先处理的各级地址信息的库进行遍历,获取准确的地址信息,使用ES库联合单位信息和地址信息加权方式进行模糊查找,去除查找后的用户和单位名称中一致的冗余信息,然后通过LCS算法与拼音匹配相结合的算法匹配,匹配后进行未登记逻辑处理后确定最终查询结果;
查询模块:用于上述最终查询需求生成模块返回的结果去预先建立的号码存储库进行查找以获得最终的查号结果;
反馈模块:将查询到的结果通过语音和短信反馈给拨打用户,将查询到的结果通过语音合成并播放,对回答中的非固定内容,无固定录音文件的,则在语音平台上以TTS合成后再做播放。
4.根据权利要求1所述的一种通过智能语音自助分发和服务系统,其特征在于,所述业务平台包括移车平台,当分发到移车平台,具体包含如下步骤:
步骤411,智能客服接收用户输入的语音信息;
步骤412,智能客服调用翻译引擎接口实现语音转文字;
步骤413,智能客服对文字信息进行处理,获取车牌号和移车地址;
步骤414,智能客服自动拨打车主电话并通知移车;
步骤415,智能客服对文字信息处理获取车主移车意向;
步骤416,智能客服通过语音和短信方式将车主移车意向反馈给用户。
5.根据权利要求4所述的一种通过智能语音自助分发和服务系统,其特征在于,所述步骤413中,智能客服对用户所述的文字信息进行停用词处理,语义解析,并通过地址纠正、拼音匹配、调用数据库、车牌校正后获得最终车主手机号;所述步骤414、415中,智能客服拨打车主电话,与车主进行简单交互后,停用词筛选,关键词匹配,BERT相似度匹配获得车主移车意向;所述步骤416中,智能客服将车主移车意向通过电话和短信方式反馈给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365178.6A CN113095852B (zh) | 2021-04-06 | 2021-04-06 | 一种通过智能语音进行自助分发和服务系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365178.6A CN113095852B (zh) | 2021-04-06 | 2021-04-06 | 一种通过智能语音进行自助分发和服务系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113095852A CN113095852A (zh) | 2021-07-09 |
CN113095852B true CN113095852B (zh) | 2024-05-07 |
Family
ID=76673554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110365178.6A Active CN113095852B (zh) | 2021-04-06 | 2021-04-06 | 一种通过智能语音进行自助分发和服务系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095852B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125161B (zh) * | 2021-11-29 | 2024-06-28 | 阳光保险集团股份有限公司 | 一种业务办理的方法及系统 |
CN114221920B (zh) * | 2021-12-13 | 2023-06-23 | 中国平安财产保险股份有限公司 | 基于人工智能的自动接触方法、装置、计算机设备及介质 |
CN114913514A (zh) * | 2021-12-23 | 2022-08-16 | 号百信息服务有限公司 | 一种智能识别异常的移车系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6584179B1 (en) * | 1997-10-21 | 2003-06-24 | Bell Canada | Method and apparatus for improving the utility of speech recognition |
CN1984189A (zh) * | 2006-04-07 | 2007-06-20 | 华为技术有限公司 | 电话查号的实现方法 |
CN104469029A (zh) * | 2014-11-21 | 2015-03-25 | 科大讯飞股份有限公司 | 通过语音进行查号的方法及装置 |
CN111143525A (zh) * | 2019-12-17 | 2020-05-12 | 广东广信通信服务有限公司 | 车辆信息获取方法、装置和智能移车系统 |
CN111653262A (zh) * | 2020-08-06 | 2020-09-11 | 上海荣数信息技术有限公司 | 一种智能语音交互系统及方法 |
-
2021
- 2021-04-06 CN CN202110365178.6A patent/CN113095852B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6584179B1 (en) * | 1997-10-21 | 2003-06-24 | Bell Canada | Method and apparatus for improving the utility of speech recognition |
CN1984189A (zh) * | 2006-04-07 | 2007-06-20 | 华为技术有限公司 | 电话查号的实现方法 |
CN104469029A (zh) * | 2014-11-21 | 2015-03-25 | 科大讯飞股份有限公司 | 通过语音进行查号的方法及装置 |
CN111143525A (zh) * | 2019-12-17 | 2020-05-12 | 广东广信通信服务有限公司 | 车辆信息获取方法、装置和智能移车系统 |
CN111653262A (zh) * | 2020-08-06 | 2020-09-11 | 上海荣数信息技术有限公司 | 一种智能语音交互系统及方法 |
Non-Patent Citations (1)
Title |
---|
人工智能技术在114查号中的应用;林建基;石玉坤;单菊梅;;电信科学;20200430(S1);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113095852A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113095852B (zh) | 一种通过智能语音进行自助分发和服务系统 | |
CN109658939B (zh) | 一种电话录音未接通原因识别方法 | |
US7103553B2 (en) | Assistive call center interface | |
CN110825858A (zh) | 一种应用于客户服务中心的智能交互机器人系统 | |
CN107273359A (zh) | 一种文本相似度确定方法 | |
CN110955762A (zh) | 一种智能问答平台 | |
CN110990544A (zh) | 一种用于法务咨询的智能问答平台 | |
CN104462600A (zh) | 实现来电原因自动分类的方法及装置 | |
US20010053977A1 (en) | System and method for responding to email and self help requests | |
CN113821621B (zh) | 一种基于深度学习的开放式智能客服系统 | |
CN112527983A (zh) | 一种个性化政务人机自然交互服务系统 | |
CN106603792B (zh) | 一种号码查找设备 | |
CN114818649A (zh) | 基于智能语音交互技术的业务咨询处理方法及装置 | |
KR20110048675A (ko) | 음성인식과 태깅을 이용한 콜센터 상담 방법 및 상담 시스템 | |
CN117952777A (zh) | 一种基于大语言模型的电力运维系统及方法 | |
KR100803900B1 (ko) | 음성 인식 ars 서비스 방법 및 시스템 | |
US20050240409A1 (en) | System and method for providing rules-based directory assistance automation | |
WO2023090380A1 (ja) | プログラム、情報処理システム及び情報処理方法 | |
CN116450799A (zh) | 一种应用于交通管理服务的智能对话方法及设备 | |
CN116340482A (zh) | 基于企业微信结合nlp引擎的多技能客服辅助产品 | |
CN201130994Y (zh) | 一种文字咨询自动应答的系统 | |
JP3450250B2 (ja) | 通話音声認識による電話対応情報の自動登録/検索/集計装置 | |
CN117349425B (zh) | 知识条目的生成方法、装置、设备和存储介质 | |
CN113918690B (zh) | 对话方法以及装置 | |
TWI722715B (zh) | 智能語音助理之模組化系統及其運作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Country or region after: China Address after: 210006 No. 501 Zhongshan South Road, Nanjing, Jiangsu Province Applicant after: Jiangsu Haobai Technology Co.,Ltd. Address before: No. 501, Zhongshan South Road, Nanjing, Jiangsu 210037 Applicant before: JIANGSU BEST TONE INFORMATION SERVICE CO.,LTD. Country or region before: China |
|
GR01 | Patent grant | ||
GR01 | Patent grant |