CN112652297A - 基于通讯的用户信息维护方法、装置、电子设备及存储介质 - Google Patents
基于通讯的用户信息维护方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112652297A CN112652297A CN202011502204.7A CN202011502204A CN112652297A CN 112652297 A CN112652297 A CN 112652297A CN 202011502204 A CN202011502204 A CN 202011502204A CN 112652297 A CN112652297 A CN 112652297A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- user information
- voice
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 97
- 238000012423 maintenance Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000000605 extraction Methods 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 23
- 230000009466 transformation Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
- G10L15/144—Training of HMMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及数据更新技术,揭露一种基于通讯的用户信息维护方法,包括:从用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息,若所述用户信息为所述待维护用户信息,采集用户第二语音并将所述用户第二语音转化为用户第二文本,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。本发明还揭露基于通讯的用户信息维护装置、电子设备以及存储介质。本发明可解决采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
Description
技术领域
本发明涉及数据更新领域,尤其涉及一种基于通讯的用户信息维护方法、装置、电子设备及计算机可读存储介质。
背景技术
伴随大数据发展,目前各行各业需不断更新维护所收集的用户信息,以满足业务需求。
目前常用的用户信息维护方法主要有两种,一、人工采集用户信息,并手工录用至数据库;二、人工采集用户信息,并基于数据库语言如SQL等构建存储程序,将用户信息存储至数据库中。两种方法都可实现用户信息维护,但采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
发明内容
本发明提供一种基于通讯的用户信息维护方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
为实现上述目的,本发明提供的一种基于通讯的用户信息维护方法,包括:
接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
可选地,所述预训练完成的信息提取模型,包括:
步骤A:利用BERT模型构建特征转化层,将所述特征转化层与预设的概率计算函数结合,得到所述信息提取模型;
步骤B:接收训练文本集与所述训练文本集对应的关键字标签集;
步骤C:利用所述特征转化层对所述训练文本集执行特征转化,得到训练特征集,利用所述概率计算函数,计算得到所述训练特征集的关键字预测集;
步骤D:计算所述关键字标签集与所述关键字预测集的差值,判断所述差值是否大于预设阈值;
步骤E:当所述差值大于或等于预设阈值时,调整所述信息提取模型的内部参数,并返回步骤C,直至所述差值小于所述预设阈值,执行步骤F:得到训练完成的所述信息提取模型。
可选地,所述当用户的所述通讯设备接通时,之前包括:
当用户的所述通讯设备未接通时,根据预设的拨打次数,继续拨打用户的所述通讯设备;
直至大于所述拨打次数时,停止拨打用户的所述通讯设备,并重新接收用户信息。
可选地,所述从所述用户信息扫描件中提取用户号码,包括:
对所述用户信息扫描件执行字符切割,得到用户信息字符集;
对所述用户信息字符集执行特征提取,得到用户信息特征集;
利用预构建的分类器,对所述用户信息特征集执行分类,得到所述用户号码。
可选地,所述利用所述用户号码拨打用户的通讯设备,包括:
利用预构建的智能呼叫系统生成主叫号码,以所述主叫号码与所述用户号码为基础,建立呼叫关联数据;
利用所述呼叫关联数据,拨打用户的通讯设备。
可选地,所述将所述用户第一语音转化为用户第一文本,包括:
对所述用户第一语音执行静音切除,得到非静音语音;
对所述非静音语音执行声音分帧,得到分帧语音集;
从所述分帧语音集中提取梅尔倒谱系数特征,基于预构建的隐马尔科夫模型,对所述梅尔倒谱系数特征执行文本预测,得到所述用户第一文本。
可选地,所述从所述分帧语音集中提取梅尔倒谱系数特征,包括:
对所述分帧语音集执行傅里叶变换,得到语音变换集;
计算所述语音变换集的梅尔能量集,对所述梅尔能量集执行离散余弦变换,得到所述梅尔倒谱系数特征。
为了解决上述问题,本发明还提供一种基于通讯的用户信息维护装置,所述装置包括:
用户号码提取模块,用于接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
用户信息判断模块,用于当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
关键字提取模块,用于若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的基于通讯的用户信息维护方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现上述中任意一项所述的基于通讯的用户信息维护方法。
本发明实施例利用用户信息扫描件提取出用户号码,并基于用户号码拨打用户的通讯设备,当用户的通讯设备接通时,采集用户第一语音,并将用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息,相比于背景技术中人工采集用户信息来说,本发明实施例利用通讯设备及语音转文本技术,获取得到用户第一文本,通过用户第一文本判断出用户信息是否有进一步的维护需求,因此相比于人工采集用户信息来说,智能化程度提高,也缩减人力投入。另外,若所述用户信息为所述待维护用户信息,利用预训练完成的信息提取模型提取出关键信息,将关键信息存储至数据库中,相比于背景技术中,人工使用数据库语言构建存储程序,将用户信息存储至数据库的方法来说,本发明实施例的关键信息,是利用预训练完成的信息提取模型提取得到,不需要人工干预,进一步提高用户信息的智能化程度。因此本发明提出的基于通讯的用户信息维护方法、装置及计算机可读存储介质,可以解决采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
附图说明
图1为本发明一实施例提供的基于通讯的用户信息维护方法的流程示意图;
图2为本发明一实施例提供的基于通讯的用户信息维护方法中S2的流程示意图;
图3为本发明一实施例提供的基于通讯的用户信息维护装置的模块示意图;
图4为本发明一实施例提供的实现基于通讯的用户信息维护方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于通讯的用户信息维护方法,所述基于通讯的用户信息维护方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于通讯的用户信息维护方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的基于通讯的用户信息维护方法的流程示意图。在本实施例中,所述基于通讯的用户信息维护方法包括:
S1、接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备。
本发明所述用户信息扫描件是预先收集并扫描至电脑中的用户信息数据,如政府人口普查部门需全面开展对本市的人口普查,预先在各市区交通路口、校门口及办公楼出入口等地,发放人口普查方式的意向调查问卷,所述意向调查问卷的主要目的是采集各市民,希望政府人员执行上门方式还是电话方式执行人口普查,其中所述意向调查问卷包括市民姓名、电话、住址等信息。进一步地,当得到意向调查问卷后,工作人员将意向调查问卷扫描至电脑中,得到所述用户信息扫描件。
进一步地,所述从所述用户信息扫描件中提取用户号码,包括:对所述用户信息扫描件执行字符切割,得到用户信息字符集;对所述用户信息字符集执行特征提取,得到用户信息特征集;利用预构建的分类器,对所述用户信息特征集执行分类,得到所述用户号码。
本发明实施例中,在执行字符切割之前还包括:灰度化、降噪所述用户信息扫描件,其中灰度化是将所述用户信息扫描件由彩色数据变为灰度数据,降噪是去除所述用户信息扫描件的部分噪点,本发明实施例中,采用高斯低通滤波去噪法执行降噪处理。
进一步地,本发明实施例中,利用字符串模糊匹配算法执行字符切割得到所述用户信息字符集。
本发明实施例中,利用卷积神经网络提取每个用户信息字符的字符特征,得到所述用户信息特征集,并利用softmax分类器,执行分类得到用户号码、用户地址等分类数据。
详细地,所述利用所述用户号码拨打用户的通讯设备,包括:利用预构建的智能呼叫系统生成主叫号码,以所述主叫号码与所述用户号码为基础,建立呼叫关联数据;利用所述呼叫关联数据,拨打用户的通讯设备。
本发明实施例中,所述智能呼叫系统是基于智能算法模拟出主动拨打用户通讯设备的智能系统,其中所述智能算法可生成所述主叫号码,其中主叫号码是拨打方的号码。
进一步地,所述呼叫关联数据包括所述智能呼叫系统的系统版本号、所述主叫号码与所述用户号码的信道、通信编码格式、所述用户的通讯设备的设备号等,本发明实施根据所述呼叫关联数据及运营商的呼叫中心系统,拨打用户的通讯设备。
S2、当所述用户的通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息。
由于用户的通讯设备不能保证每次均被接通,因此本发明实施例中,所述当用户的所述通讯设备接通时,之前包括:当用户的所述通讯设备未接通时,根据预设的拨打次数,继续拨打用户的所述通讯设备;直至大于所述拨打次数时,停止拨打用户的所述通讯设备,并重新接收用户信息。
如上述政府人口普查部门在开展本市人口普查时,设定拨打次数为3,即利用智能呼叫系统拨打每个用户的通讯设备最多三次,若三次均显示无人接听,则拨打下一个用户的通讯设备。
进一步地,所述当所述用户的通讯设备接通时,采集用户第一语音,包括:利用所述智能语音系统,播放预构建的话术模板,采集用户根据所述话术模板回复的所述用户第一语音。
如上述政府人口普查部门在开展本市人口普查时,利用智能呼叫系统拨打用户的通讯设备,待用户的通讯设备接通时,播放“您好,现在需要进行人口普查,请您根据自身情况,回复选择语音人口普查还是上门人口普查?”,则用户会根据所述话术模板,进行回复得到所述用户第一语音。
本发明实施例中,参阅图2所示,所述将所述用户第一语音转化为用户第一文本,包括:
S21、对所述用户第一语音执行静音切除,得到非静音语音;
S22、对所述非静音语音执行声音分帧,得到分帧语音集;
S23、从所述分帧语音集中提取梅尔倒谱系数特征,基于预构建的隐马尔科夫模型,对所述梅尔倒谱系数特征执行文本预测,得到所述用户第一文本。
由于采集到的所述用户第一语音,可能会存在静音部分的语音,因此为了减轻计算压力,需要执行静音切除。本发明实施例中,利用波形检测算法检测所述用户第一语音,去除无波动区域所对应的语音片段,得到所述非静音语音。
由于整段语音直接转化为文本时极容易出现错误,因此需要将所述非静音语音切开成多段分帧语音,本发明实施例中,利用移动窗函数执行声音分帧,得到所述分帧语音集,其中所述移动窗函数包括汉宁窗函数、三角窗函数。
进一步地,所述从所述分帧语音集中提取梅尔倒谱系数特征,包括:对所述分帧语音集执行傅里叶变换,得到语音变换集;计算所述语音变换集的梅尔能量集,对所述梅尔能量集执行离散余弦变换,得到所述梅尔倒谱系数特征。
本发明实施例中,利用Mel滤波器组(mel banks)计算所述语音变换集的梅尔能量集。
进一步地,当得到所述梅尔倒谱系数特征后,利用所述隐马尔科夫模型,可实现语音至文本的转换,得到所述用户第一文本。
当得到所述用户第一文本后,本发明实施例需要进一步根据所述用户第一文本,判断所述用户信息是否有进一步维护的必要,如上述政府人口普查部门在开展本市人口普查时,利用智能呼叫系统拨打每个用户的通讯设备,判断用户是否执行语音形式的人口普查。
详细地,所述利用所述用户第一文本,判断所述用户信息是否为待维护用户信息,包括:将所述用户第一文本与预构建的关键字词典进行匹配,若所述用户第一文本与所述关键字词典匹配失败,则去除所述用户第一文本,并重新接收用户信息,若所述用户第一文本与所述关键字词典匹配成功,则所述用户信息为所述待维护用户信息。
本发明实施例中,所述关键字词典需根据实际应用场景构建,如上述政府人口普查部门利用智能呼叫系统拨打用户的通讯设备,播放“您好,现在需要进行人口普查,请您根据自身情况,回复选择语音人口普查还是上门人口普查?”,得到用户回复的所述用户第一文本为:“由于我经常加班,时常不在家,我选择语音人口普查”,则所述关键字词典包括“我选择语音人口普查”、“同意上门人口普查”等,由此匹配成功后,则所述用户第一文本对应的所述用户信息被判断为所述待维护用户信息,即表明该用户信息需要进一步的利用语音进行跟进维护。
S3、若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成所述用户信息的维护。
如用户选择语音人口普查,则政府人口普查部门需基于语音形式采集用户更详细的信息,其中普查部门与用户的语音通话中,用户的回复即为所述用户第二语音。
本发明实施例中,与上述S2相同,利用与S3对应的话术模板,采集得到所述用户第二语音,其中S3中的话术模板包括:“您的户籍地是哪里”、“您的性别是”、“您目前的居住地址”等。
同样地,所述将所述用户第二语音转化为用户第二文本,与上述S2相同,在此不再赘述。
本发明实施例中,所述利用预训练完成的信息提取模型之前,还包括构建及训练所述所述信息提取模型,详细地,所述预训练完成的信息提取模型,包括:
步骤A:利用BERT模型构建特征转化层,将所述特征转化层与预设的概率计算函数结合,得到所述信息提取模型;
步骤B:接收训练文本集与所述训练文本集对应的关键字标签集;
步骤C:利用所述特征转化层对所述训练文本集执行特征转化,得到训练特征集,利用所述概率计算函数,计算得到所述训练特征集的关键字预测集;
步骤D:计算所述关键字标签集与所述关键字预测集的差值,判断所述差值是否大于预设阈值;
步骤E:当所述差值大于或等于预设阈值时,调整所述信息提取模型的内部参数,并返回步骤C,直至所述差值小于所述预设阈值,执行步骤F,得到训练完成的所述信息提取模型。
所述BERT模型(Bidirectional Encoder Representations from Transformers)是一种可实现文本信息提取的模型,如本发明实施例中,将训练文本集输入至BERT模型中,可得到与所述训练文本集对应的训练特征集,其中训练特征集是由若干矩阵组成。其中所述训练文本集是利用爬虫等手段,预先从网络中爬取并人工清理得到的文本数据,可实现对所述信息提取模型的训练功能。所述关键字标签集记录了所述训练文本集中每个训练文本对应的关键字,如训练文本集中包括训练文本A:“我出生在合肥市蜀山区,祖籍安徽合肥”,在所述关键字标签集中记录了所述训练文本A的关键字为:“祖籍:安徽合肥”。
本发明实施例中,所述概率计算函数可采用softmax函数,通过softmax函数可预测出每个训练文本对应的关键字,汇总得到所述关键字预测集。
进一步地,本发明实施例中,采用平方差误差函数,计算所述关键字预测集与所述关键字标签集的差值,进而根据所述差值大小,调整所述信息提取模型的内部参数,得到训练完成的所述信息提取模型,进一步的,如将用户第二文本输入至训练完成的所述信息提取模型,得到与所述用户第二文本对应的关键信息,如用户第二文本包括“我祖籍湖北武汉,来深圳六年了,目前居住在深圳市龙华区”,则得到关键信息包括:“祖籍湖北武汉,先居地深圳龙华区”,并将所述关键信息存储至数据库中,完成用户的信息维护。
本发明实施例利用用户信息扫描件提取出用户号码,并基于用户号码拨打用户的通讯设备,当用户的通讯设备接通时,采集用户第一语音,并将用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息,相比于背景技术中人工采集用户信息来说,本发明实施例利用通讯设备及语音转文本技术,获取得到用户第一文本,通过用户第一文本判断出用户信息是否有进一步的维护需求,因此相比于人工采集用户信息来说,智能化程度提高,也缩减人力投入。另外,若所述用户信息为所述待维护用户信息,利用预训练完成的信息提取模型提取出关键信息,将关键信息存储至数据库中,相比于背景技术中,人工使用数据库语言构建存储程序,将用户信息存储至数据库的方法来说,本发明实施例的关键信息,是利用预训练完成的信息提取模型提取得到,不需要人工干预,因此进一步提高用户信息的智能化程度。因此本发明提出的基于通讯的用户信息维护方法、装置及计算机可读存储介质,可以解决采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
如图3所示,是本发明基于通讯的用户信息维护装置的模块示意图。
本发明所述基于通讯的用户信息维护装置100可以安装于电子设备中。根据实现的功能,所述基于通讯的用户信息维护装置可以包括用户号码提取模块101、用户信息判断模块102及关键字提取模块103。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述用户号码提取模块101,用于接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
所述用户信息判断模块102,用于当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
所述关键字提取模块103,用于若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
本发明实施例所提供的基于通讯的用户信息维护装置100中的各个模块能够在使用时基于与上述的基于通讯的用户信息维护方法采用相同的手段,具体地实施步骤在此不再赘述,关于各模块/单元的功能所产生技术效果与上述的基于通讯的用户信息维护方法的技术效果相同的,即解决采集并录入用户信息时,人工参与过多,智能化程度不高,造成用户信息维护耗时耗力的问题。
如图4所示,是本发明实现基于通讯的用户信息维护方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于通讯的用户信息维护程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于通讯的用户信息维护程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于通讯的用户信息维护程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于通讯的用户信息维护程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于通讯的用户信息维护方法,其特征在于,所述方法包括:
接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
2.如权利要求1所述的基于通讯的用户信息维护方法,其特征在于,所述预训练完成的信息提取模型,包括:
步骤A:利用BERT模型构建特征转化层,将所述特征转化层与预设的概率计算函数结合,得到所述信息提取模型;
步骤B:接收训练文本集与所述训练文本集对应的关键字标签集;
步骤C:利用所述特征转化层对所述训练文本集执行特征转化,得到训练特征集,利用所述概率计算函数,计算得到所述训练特征集的关键字预测集;
步骤D:计算所述关键字标签集与所述关键字预测集的差值,判断所述差值是否大于预设阈值;
步骤E:当所述差值大于或等于预设阈值时,调整所述信息提取模型的内部参数,并返回步骤C,直至所述差值小于所述预设阈值,执行步骤F:得到训练完成的所述信息提取模型。
3.如权利要求1所述的基于通讯的用户信息维护方法,其特征在于,所述当用户的所述通讯设备接通时,之前包括:
当用户的所述通讯设备未接通时,根据预设的拨打次数,继续拨打用户的所述通讯设备;
直至大于所述拨打次数时,停止拨打用户的所述通讯设备,并重新接收用户信息。
4.如权利要求1所述的基于通讯的用户信息维护方法,其特征在于,所述从所述用户信息扫描件中提取用户号码,包括:
对所述用户信息扫描件执行字符切割,得到用户信息字符集;
对所述用户信息字符集执行特征提取,得到用户信息特征集;
利用预构建的分类器,对所述用户信息特征集执行分类,得到所述用户号码。
5.如权利要求1所述的基于通讯的用户信息维护方法,其特征在于,所述利用所述用户号码拨打用户的通讯设备,包括:
利用预构建的智能呼叫系统生成主叫号码,以所述主叫号码与所述用户号码为基础,建立呼叫关联数据;
利用所述呼叫关联数据,拨打用户的通讯设备。
6.如权利要求1所述的基于通讯的用户信息维护方法,其特征在于,所述将所述用户第一语音转化为用户第一文本,包括:
对所述用户第一语音执行静音切除,得到非静音语音;
对所述非静音语音执行声音分帧,得到分帧语音集;
从所述分帧语音集中提取梅尔倒谱系数特征,基于预构建的隐马尔科夫模型,对所述梅尔倒谱系数特征执行文本预测,得到所述用户第一文本。
7.如权利要求1至6中任意一项所述的基于通讯的用户信息维护方法,其特征在于,所述从所述分帧语音集中提取梅尔倒谱系数特征,包括:
对所述分帧语音集执行傅里叶变换,得到语音变换集;
计算所述语音变换集的梅尔能量集,对所述梅尔能量集执行离散余弦变换,得到所述梅尔倒谱系数特征。
8.一种基于通讯的用户信息维护装置,其特征在于,所述装置包括:
用户号码提取模块,用于接收用户信息扫描件,从所述用户信息扫描件中提取用户号码,利用所述用户号码拨打用户的通讯设备;
用户信息判断模块,用于当用户的所述通讯设备接通时,采集用户第一语音,将所述用户第一语音转化为用户第一文本,利用所述用户第一文本,判断所述用户信息是否为待维护用户信息;
关键字提取模块,用于若所述用户信息为所述待维护用户信息,采集用户第二语音,并将所述用户第二语音转化为用户第二文本,利用预训练完成的信息提取模型,从所述用户第二文本中提取得到关键信息,将所述关键信息存储至数据库中,完成用户的信息维护。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于通讯的用户信息维护方法。
10.一种计算机可读存储介质,包括存储数据区和存储程序区,其特征在于,所述存储数据区存储创建的数据,所述存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于通讯的用户信息维护方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502204.7A CN112652297A (zh) | 2020-12-18 | 2020-12-18 | 基于通讯的用户信息维护方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011502204.7A CN112652297A (zh) | 2020-12-18 | 2020-12-18 | 基于通讯的用户信息维护方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112652297A true CN112652297A (zh) | 2021-04-13 |
Family
ID=75354881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011502204.7A Pending CN112652297A (zh) | 2020-12-18 | 2020-12-18 | 基于通讯的用户信息维护方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112652297A (zh) |
-
2020
- 2020-12-18 CN CN202011502204.7A patent/CN112652297A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325116B (zh) | 一种基于深度学习的城市事件自动分类派发方法及装置 | |
CN110619568A (zh) | 风险评估报告的生成方法、装置、设备及存储介质 | |
CN112447189A (zh) | 语音事件检测方法、装置、电子设备及计算机存储介质 | |
CN113903363B (zh) | 基于人工智能的违规行为检测方法、装置、设备及介质 | |
CN112397047A (zh) | 语音合成方法、装置、电子设备及可读存储介质 | |
CN113205814B (zh) | 语音数据标注方法、装置、电子设备及存储介质 | |
CN113807103B (zh) | 基于人工智能的招聘方法、装置、设备及存储介质 | |
CN113064994A (zh) | 会议质量评估方法、装置、设备及存储介质 | |
CN113420556A (zh) | 基于多模态信号的情感识别方法、装置、设备及存储介质 | |
CN113706291A (zh) | 欺诈风险预测方法、装置、设备及存储介质 | |
CN113327586A (zh) | 一种语音识别方法、装置、电子设备以及存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN114155832A (zh) | 基于深度学习的语音识别方法、装置、设备及介质 | |
CN114420168A (zh) | 情绪识别方法、装置、设备及存储介质 | |
CN113918704A (zh) | 基于机器学习的问答方法、装置、电子设备及介质 | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN113033912A (zh) | 问题解决人推荐方法及装置 | |
CN112489628A (zh) | 语音数据选择方法、装置、电子设备及存储介质 | |
CN116542783A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
CN111985231B (zh) | 无监督角色识别方法、装置、电子设备及存储介质 | |
CN112652297A (zh) | 基于通讯的用户信息维护方法、装置、电子设备及存储介质 | |
CN115631748A (zh) | 基于语音对话的情感识别方法、装置、电子设备及介质 | |
CN114186028A (zh) | 咨诉工单处理方法、装置、设备及存储介质 | |
CN113902404A (zh) | 基于人工智能的员工晋升分析方法、装置、设备及介质 | |
CN113704430A (zh) | 智能辅助催收方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |