CN111177353B - 文本记录生成方法、装置、计算机设备及存储介质 - Google Patents
文本记录生成方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111177353B CN111177353B CN201911378520.5A CN201911378520A CN111177353B CN 111177353 B CN111177353 B CN 111177353B CN 201911378520 A CN201911378520 A CN 201911378520A CN 111177353 B CN111177353 B CN 111177353B
- Authority
- CN
- China
- Prior art keywords
- text
- target user
- database
- personal
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种文本记录生成方法、装置、计算机设备及存储介质,通过将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;将每一目标用户对应的文本信息发送至目标用户对应的终端;接收移动终端返回的对文本信息的反馈信息;根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。以机器与人工校对进行结合,并且实时的信息交互,提高了语音数据转换成文本信息的效率和准确率,并将目标用户对文本信息的修改同步到个人文本数据库中,再根据个人文本数据库转换文本信息,提高了个人的语音数据转换准确率,生成的文本记录是不用再次进行修改的,节省了用户的时间。
Description
技术领域
本发明涉及计算机识别领域,尤其涉及一种文本记录生成方法、装置、计算机设备及存储介质。
背景技术
随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,其中,语音数据识别受到了人们越来越多的重视。目前,已有多种语音识别处理记录方法,能够记录语音数据并转换成文本数据。但是在语音数据转换成文本数据时,由于语言的差异或者用户发音的差异而导致语音识别技术准确性受到制约,造成转换准确率较低。
发明内容
本发明实施例提供一种文本记录生成方法、装置、计算机设备及存储介质,以解决语音数据转换成文本数据准确率较低问题。
一种文本记录生成方法,包括:
将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;
将每一目标用户对应的文本信息发送至目标用户对应的终端;
接收终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改;
根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。
一种文本记录生成装置,包括:
转换模块,用于将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;
发送模块,用于将每一目标用户对应的文本信息发送至目标用户对应的终端;
第一接收模块,用于接收终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改;
信息整合模块,用于根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文本记录生成方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文本记录生成方法的步骤。
上述文本记录生成方法、装置、计算机设备及存储介质,通过将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;将每一目标用户对应的文本信息发送至目标用户对应的终端;接收移动终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改;根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。以机器与人工校对进行结合,并且实时的信息交互,提高了语音数据转换成文本信息的效率和准确率,并将目标用户对文本信息的修改同步到个人文本数据库中,再根据个人文本数据库转换文本信息,提高了个人的语音数据转换准确率,同时,生成的文本记录是不需要再次进行修改的,节省了用户的时间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中文本记录生成方法的一应用环境示意图;
图2是本发明一实施例中文本记录生成方法的一流程图;
图3是本发明一实施例中文本记录生成方法的另一流程图;
图4是本发明一实施例中文本记录生成方法的另一流程图;
图5是本发明一实施例中文本记录生成装置的一原理框图;
图6是本发明一实施例中文本记录生成装置的另一原理框图;
图7是本发明一实施例中文本记录生成装置的另一原理框图
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的文本记录生成方法,该文本记录生成方法可应用如图1所示的应用环境中。具体地,该文本记录生成方法应用在文本记录生成系统中,该文本记录生成系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决语音数据转换成文本数据准确率较低问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种文本记录生成方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S11:将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息。
具体地,可以通过一个数据采集终端实时对语音数据进行采集,再将采集到的语音数据发送至服务端,在服务端中,将接收到的语音数据进行身份识别,得到目标用户和每一目标用户对应的语音部分,再将每一目标用户对应的语音部分进行文本识别,将每一目标用户对应的语音部分转换成每一目标用户对应的文本信息,即得到文本数据。
可选地,该数据采集终端可以为移动终端、智能会议设备、蓝牙音箱或者其他具有语音数据采集功能的设备。该实时采集为对当前正在产生的语音数据的采集,示例性地,在会议过程中,该数据采集终端采集各个参与会议的人员的发言(语音数据),并发送至服务端。
S12:将每一目标用户对应的文本信息发送至目标用户对应的终端。
具体地,在将每一目标用户对应的语音部分转换成每一目标用户对应的文本信息之后,将每一目标用户对应的文本信息发送至目标用户对应的终端中,供目标用户对与自身对应的文本信息进行检查。目标用户对应的终端可以为但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
S13:接收终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改。
具体地,由于在服务端中,将每一目标用户对应的语音部分转换成每一用户对应的文本信息时,会由于目标用户的发言(语音数据)带有地方口音、服务端识别错误或者遇到一些无法识别的语音字词或字段,造成由每一目标用户对应的语音部分转换得到的每一用户对应的文本信息出现错误。因此,在目标用户对应的终端接收到每一目标用户对应的文本信息之后,目标用户可以对文本信息进行检查判断,当文本信息出现错误的时候,目标用户通过终端将修改后的文本信息发送至服务端;
在一具体实施方法中,当文本信息没有出现错误的时候,目标用户将不需要修改文本信息的指令通过终端发送至服务端,或者,当文本信息没有出现错误的时候,即目标用户没有修改文本信息时,服务端默认该文本信息为正确,将该文本信息进行存储。
S14:根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。
其中,所述文本记录指的是,根据所述反馈信息,对每一目标用户对应的文本信息进行修改,得到反馈后的每一目标用户对应的文本信息,将所有反馈后的每一目标用户对应的文本信息结合生成的记录。
具体地,在接收到目标用户对应的终端返回的对文本信息的反馈信息之后,根据所述反馈信息,对所述反馈信息对应的每一目标用户对应的文本信息进行修改,并将修改的字词或者字段存储至所述目标用户对应的个人文本数据库中,在每一目标用户对应的文本信息修改完成后,按照一定的方式(例如,语音数据中每一目标用户的发言顺序),将修改完成后的每一目标用户对应的文本信息进行排序整合,得到文本记录。
在一实施例中,在得到所述文本记录之后,所述文本记录生成方法还包括:
将所述文本记录发送至每一目标用户对应的终端。
示例性地,在会议结束后,常常需要将会议记录上传或者发送给其他人员,此时,记录会议的人员需要对会议记录再一次进行整理以及校对。而在该实施例中,在将每一目标用户对应的文本信息发送至目标用户对应的终端之后,目标用户就会实时对文本信息进行修改判断,若目标用户对文本信息进行修改,则将反馈信息发送至服务端,服务端则会根据反馈信息对每一目标用户对应的文本信息进行修改,并将修改后的每一目标用户对应的文本信息进行整合,得到文本记录,服务端只需要将得到的文本记录发送至每一目标用户对应的终端即可,目标用户得到的文本记录不需要再进行整理和校对,极大节省了用户的时间。
在本实施例中,通过将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;将每一目标用户对应的文本信息发送至目标用户对应的终端;接收移动终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改;根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。以机器与人工校对进行结合,并且实时的信息交互,提高了语音数据转换成文本信息的效率和准确率,并将目标用户对文本信息的修改同步到个人文本数据库中,再根据个人文本数据库转换文本信息,提高了个人的语音数据转换准确率,同时,生成的文本记录是不需要再次进行修改的,节省了用户的时间。
在一实施例中,如图3所示,所述将实时采集目标用户的语音数据转换成文本数据,包括:
S111:对实时采集的语音数据进行身份识别,得到目标用户和每一目标用户对应的语音部分。
其中,由于语音数据发声的用户可能不止一个。示例性地,在会议过程中的实时语音采集,可能会涉及到多个用户的发言。因此,在该步骤中,需要对实时采集的语音数据进行身份识别,分辨出目标用户和每一目标用户对应的语音部分。具体地,可以对实时采集的语音数据进行声纹识别,再和预设的声纹数据库进行匹配,以确定目标用户;通过语音匹配系统,从语音数据中分割出不同用户的语音部分,以确定每一目标用户对应的语音部分。
S112:对每一目标用户对应的语音部分进行文本识别,得到每一目标用户对应的文本信息。
具体地,在对实时采集的语音数据进行身份识别,得到每一目标用户对应的语音部分之后,需要将语音部分的数据转换成文本数据,因此可以采用语音识别方法对每一目标用户对应的语音部分进行文本识别,从而得到每一目标用户对应的文本信息。可选地,语音识别方法包括:基于语言学和声学的方法、随机模型法、人工神经网络的方法和概率语法分析等。
在本实施例中,通过对实时采集的语音数据进行身份识别,得到目标用户和每一目标用户对应的语音部分;对每一目标用户对应的语音部分进行文本识别,得到每一目标用户对应的文本信息。通过声纹识别,能够识别出目标用户,通过语音匹配系统能够将每一目标用户的语音部分从语音数据中分割出来,通过语音识别方法将语音部分转换为文本信息,便于后续步骤中将文本信息发送给对应的用户,方便对应的用户对自身的文本信息进行修改或者标识,从而提高效率和准确率。
在一实施例中,所述对每一目标用户对应的语音部分进行文本识别,包括:
根据所述目标用户的个人文本数据库对所述语音部分进行识别,所述目标用户的个人文本数据库用于生成所述该目标用户对应的文本信息。
其中,所述目标用户的个人文本数据库为针对该目标用户建立的专属数据库。由于不同用户之间发音或者地域的差异,会导致文本数据库的无法通用。因此,可以针对不同的目标用户建立个人文本数据库,以更好地进行语音的识别。可选地,该个人文本数据库包含了目标用户对文本信息中进行修改了的文本元素和所述文本元素的权重,所述文本元素为所述该目标用户对应的文本信息中的字词或者字段。
具体地,在对每一目标用户的语音部分进行识别的过程中,除了利用语音识别方法进行识别之外,在该实施例中,还加入了通过目标用户的个人文本数据库的方法。由于目标用户的个人文本数据库中包含了目标用户对文本信息中进行修改的文本元素和所述文本元素的权重,因此可以通过所述文本数据库自动识别出以往语音识别方法中出错的文本元素,并在识别过程中直接进行替换,进而更准确地生成该目标用户对应的文本信息。
在本实施例中,通过根据所述目标用户的个人文本数据库对所述语音部分进行识别,所述目标用户的个人文本数据库用于生成所述该目标用户对应的文本信息。在服务端中加入目标用户的个人文本数据库,对每一目标用户来说,都有个人的文本数据库,更好的针对了每一用户的发声习惯,对采集到的语音数据能更好的识别,进而提高了转换成文本信息的准确率,同时也提高了转换的效率。
在一实施例中,在所述接收移动终端返回的对文本信息的反馈信息之后,所述语音转换处理方法还包括:
根据所述反馈信息调整所述目标用户的个人文本数据库中对应文本元素的权重,所述文本元素包括修改前的字词或字段和/或修改后的字词或字段。
其中,该反馈信息为目标用户通过终端接收到文本信息之后,通过终端发送至服务端的信息。该反馈信息指示所述目标用户对所述文本信息进行了修改,即对服务端发送的文本信息的校对做一个反馈。
文本元素为个人文本数据库中的组成要素,文本元素包括修改前的字词或字段和/或修改后的字词或字段。示例性地,在初次识别某一目标用户的语音部分时,该目标用户的个人文本数据库中暂无文本元素,当多次识别该目标用户的语音部分时,同时也多次接收了该目标用户的反馈信息,假设反馈信息中多次对某个文本元素的修改,则根据所述反馈信息调整所述目标用户的个人文本数据库中该文本元素的权重,当所述文本元素的权重达到预设的阈值,则在下次识别该目标用户的语音部分时,若该语音部分包含了该文本元素,则服务端会提取该目标用户的个人文本数据库中该文本元素的修改后的字词或字段,采用该文本元素的修改后的字词或字段对该文本元素的修改前的字词或字段直接进行替代,进而提高了准确率,也降低了目标用户对同一字词或者字段反复修改的复杂性。
进一步地,在每次接收到反馈信息之后,根据目标用户的反馈信息来调整目标用户的个人文本数据库中对应文本元素的权重,以根据不同的用户调整该用户对应的个人文本数据库,以确定适合不同用户的个人文本数据库。
在一实施例中,所述根据所述反馈信息调整所述目标用户的个人文本数据库中对应文本元素的权重,包括:
减少所述目标用户的个人文本数据库中修改前的字词或字段的权重;和/或,增加所述目标用户的个人文本数据库中修改后的字词或字段的权重。
在该实施例中,当服务端接收到终端发送的反馈信息之后,若是初次接收到该文本元素修改的反馈信息,服务端会将该文本元素存储至目标用户的个人文本数据库中,并初始该文本元素的权重,如果不是初次接收到该文本元素修改反馈信息,服务端会减少所述目标用户的个人文本数据库中修改前的字词或字段的权重;和/或,增加所述目标用户的个人文本数据库中修改后的字词或字段的权重。根据目标用户的反馈信息对该目标用户的个人文本数据库中对应文本元素的权重进行调整,以更好地为不同的用户指定不同的个人文本数据库,从而确定不同的文本元素,以更好地判断是否需要将文本元素直接在文本信息中替换,提高了每一目标用户的语音部分转换成文本信息的准确率和效率。
在一实施例中,如图4所述,所述对每一目标用户对应的语音部分进行文本识别还包括:
S1121:判断所述目标用户是否具有对应的个人文本数据库;
具体地,在得到目标用户和每一目标用户对应的语音部分之后,服务端会判断该目标用户是否为新目标用户,对于新目标用户,新目标用户是不具有对应的个人文本数据库的,对于非新目标用户,非新目标用户是具有对应的个人文本数据库的。
S1122:根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别,所述通用的文本数据库用于生成该不具有对应的个人文本数据库的目标用户对应的文本信息;
其中,所述通用的文本数据库为默认数据库,即普适的文本数据库,用于生成通用的文本信息,或者生成新目标用户的文本信息,即生成不具有对应的个人文本数据库的目标用户对应的文本信息。
示例性地,若在得到目标用户和每一目标用户对应的语音部分之后,服务端判断该目标用户为新目标用户,即该目标用户不具有对应的个人文本数据库,由于该目标用户的发言可能也存在发言中带有地方口音、服务端识别错误或者遇到一些无法识别的语音字词或字段,因此,在对该目标用户对应的语音部分进行文本识别的过程中,若该语音部分中某个文本元素在通用的文本数据库中也存在,则服务端会提取通用的文本数据库中该文本元素的修改后的字词或字段,采用该文本元素的修改后的字词或字段对该文本元素的修改前的字词或字段直接进行替代。其中,所述文本元素包括修改前的字词或字段和/或修改后的字词或字段。
S1123:根据对应的个人文本数据库对具有对应的个人文本数据库的目标用户的语音部分进行识别。
示例性地,若在得到目标用户和每一目标用户对应的语音部分之后,服务端判断该目标用户为非新目标用户,即该目标用户具有对应的个人文本数据库,在对该目标用户对应的语音部分进行文本识别的过程中,若该语音部分中某个文本元素在该目标用户对应的个人文本数据库中存在,则采用个人文本数据库该文本元素的修改后的字词或字段对该文本元素的修改前的字词或字段直接进行替代。其中,所述文本元素包括修改前的字词或字段和/或修改后的字词或字段。
在本实施例中,通过判断所述目标用户是否具有对应的个人文本数据库;根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别,所述通用的文本数据库用于生成该目标用户对应的文本信息;根据对应的个人文本数据库对具有对应的个人文本数据库的目标用户的语音部分进行识别。采用通用的文本数据库和个人文本数据库分开的方式,在保证具有个人文本数据库的目标用户能够提高语音转换准确率的同时,提供通用的文本数据库给不具有个人文本数据库的新目标用户使用,达到新目标用户也可能从通用的文本数据库中获取到有用的文本元素,进一步提高了整个方法的准确率。
在一实施例中,在根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别之后,所述文本记录生成方法还包括:
接收对应目标用户的校对指令,所述校对指令指示所述目标用户对对应的文本信息进行校对。
其中,该校对指令为目标用户通过终端接收到文本信息之后,通过终端发送至服务端的校对信息。所述校对指令指示所述目标用户对所述文本信息进行校对。
具体地,在根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别之后,得到该目标用户对应的文本信息,将所述文本信息发送至该目标用户对应的终端,该目标用户对所述文本信息进行校对,并将校对指令发送至服务端。可选地,该校对指令可以包括第一指令、第二指令和第三指令,第一指令指示用户认同所述文本信息是正确的,第二指令指示用户对文本信息中错误的字词或字段进行修改且该字词或字段是通过通用的文本数据库中的文本元素进行替换的,第三指令为用户对文本信息中错误的字词或字段进行修改且该字词或字段不是通过通用的文本数据库中的文本元素进行替换的。
根据所述校对指令,在通用的文本数据库中调整对应文本元素的权重。
具体地,若校对指令为第一指令,则增加通用的文本数据库中对应文本元素的权重;若校对指令为第二指令,则减少通用的文本数据库中对应文本元素的权重,并生成该目标用户的个人文本数据库,将该目标用户修改后的字词或字段存储至该目标用户的个人文本数据库中;若校对指令为第三指令,则增加通用的文本数据库中对应文本元素的权重,并生成该目标用户的个人文本数据库,将该目标用户修改后的字词或字段存储至该目标用户的个人文本数据库中。
在本实施例中,接收对应目标用户的校对指令;根据所述校对指令,在通用的文本数据库中调整对应文本元素的权重。通过目标用户的校对指令,在通用的文本数据库中调整对应文本元素的权重,在提供通用的文本数据库给新目标用户的语音部分进行文本识别的同时,也让新目标用户对生成的文本信息进行校对,更好的完善通用的文本数据库,进一步提高通用的文本数据库的准确性,扩大了通用的文本数据库的适用范围。
在一实施例中,所述校对指令包括认同指令,在接收对应目标用户的校对指令之后,所述文本记录生成方法还包括:
在接收到预设数量的目标用户的校对指令之后,对所述校对指令进行统计,若所述认同指令的数量不符合预设的阈值,则在通用的文本数据库中减少对应文本元素的权重,所述认同指令指示所述目标用户认同根据通用的文本数据库中文本元素的修改后的字词或字段替换对应文本信息的字词或字段;
若所述认同指令的数量符合预设的阈值,则在通用的文本数据库中增加对应文本元素的权重,或者,不调整对应文本元素的权重。
在该实施例中,若所述目标用户认同根据通用的文本数据库中文本元素的修改后的字词或字段替换对应文本信息的字词或字段,即所述校对指令为认同指令,则在通用的文本数据库中增加对应文本元素的权重,即在一个用户通过终端发送校对指令至服务端之后,判断该校对指令是否为认同指令,若该校对指令为认同指令,则根据该校对调整通用的文本数据库中对应文本元素的权重。并且,在根据通用的文本数据库的文本元素生成文本信息并将所述文本信息发送至目标用户对应的终端后,提取对应用户的状态指令。即在其他用户的后续使用过程中,若存在根据该文本元素生成文本信息并将该文本信息发送至目标用户对应的终端后,则提取对应用户通过终端发送的状态指令。并且,在接收到预设数量的用户的状态指令之后,对所述状态指令进行统计。该预设数量可以根据实际应用需求进行预先设置,示例性地,根据实际使用用户的数量来设置该预设量。对所述状态指令进行统计,统计的方法可以为统计状态指令中认同指令的数量或者比例。
进一步地,若所述状态指令中认同指令的数量不符合预设的阈值,则在通用的文本数据库中减少对应文本元素的权重。该预设的阈值可以为一个比例值或者具体的数值。示例性地,若认同指令的数量少于整体校对指令的三分之二,或者四分之三,则在通用的文本数据库中减少对应文本元素的权重。即认定该文本元素只对目标用户使用,不是一个普适的影响因素。
在一具体实施方式中,若所述校对指令中认同指令的数量符合预设的阈值,则在通用的文本数据库中增加对应文本元素的权重,或者,不调整对应文本元素的权重。
在本实施例中,在接收到预设数量的目标用户的校对指令之后,对所述校对指令进行统计,若所述认同指令的数量不符合预设的阈值,则在通用的文本数据库中减少对应文本元素的权重,所述认同指令指示所述目标用户认同根据通用的文本数据库中文本元素的修改后的字词或字段替换对应文本信息的字词或字段;若所述认同指令的数量符合预设的阈值,则在通用的文本数据库中增加对应文本元素的权重,或者,不调整对应文本元素的权重。通过上述方式可以对通用的文本数据库中的文本元素的权重进行实时性的优化和调整,在便于对新用户的语音部分进行转换的同时,提高了语音部分转换成文本信息的效率和准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种文本记录生成装置,该文本记录生成装置与上述实施例中文本记录生成方法一一对应。如图5所示,该文本记录生成装置包括转换模块11、发送模块12、第一接收模块13和信息整合模块14。各功能模块详细说明如下:
转换模块11,用于将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息。
发送模块12,用于将每一目标用户对应的文本信息发送至目标用户对应的终端。
第一接收模块13,用于接收终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改。
信息整合模块14,用于根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录。
优选地,如图6所示,所述转换模块11包括第一识别模块111和第二识别模块112。
第一识别模块,用于对实时采集的语音数据进行身份识别,得到目标用户和每一目标用户对应的语音部分。
第二识别模块,用于对每一目标用户对应的语音部分进行文本识别,得到每一目标用户对应的文本信息。
优选地,所述第二识别模块112包括第三识别模块。
第三识别模块,用于根据所述目标用户的个人文本数据库对所述语音部分进行识别,所述目标用户的个人文本数据库用于生成该目标用户对应的文本信息。
优选地,所述文本记录生成装置还包括第一调整模块。
第一调整模块,用于根据所述反馈信息调整所述目标用户的个人文本数据库中对应文本元素的权重,所述文本元素包括修改前的字词或字段和/或修改后的字词或字段。
优选地,所述第一调整模块包括第二调整模块。
第二调整模块,用于减少所述目标用户的个人文本数据库中所述文本信息的字词或字段的权重;和/或,增加所述目标用户的个人文本数据库中对所述文本信息的字词或字段修改后的字词或字段的权重。
优选地,如图7所示,所述第二识别模块112还包括判断模块1121、第四识别模块1122和第五识别模块1123。
判断模块1121,用于判断所述目标用户是否具有对应的个人文本数据库。
第四识别模块1122,用于根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别,所述通用的文本数据库用于生成该目标用户对应的文本信息。
第五识别模块1123,用于根据对应的个人文本数据库对具有对应的个人文本数据库的目标用户的语音部分进行识别。
优选地,所述文本记录生成装置还包括第二接收模块和第三调整模块。
第二接收模块,用于接收对应目标用户的校对指令,所述校对指令指示所述目标用户对对应的文本信息进行校对。
第三调整模块,用于根据所述校对指令,在通用的文本数据库中调整对应文本元素的权重。
优选地,所述文本记录生成装置还包括第一统计模块和第二统计模块。
第一统计模块,用于在接收到预设数量的目标用户的校对指令之后,对所述校对指令进行统计,若所述认同指令的数量不符合预设的阈值,则在通用的文本数据库中减少对应文本元素的权重,所述认同指令指示所述目标用户认同根据通用的文本数据库中文本元素的修改后的字词或字段替换对应文本信息的字词或字段。
第二统计模块,用于在所述认同指令的数量符合预设的阈值时,在通用的文本数据库中增加对应文本元素的权重,或者,不调整对应文本元素的权重。
关于文本记录生成装置的具体限定可以参见上文中对于文本记录生成方法的限定,在此不再赘述。上述文本记录生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例文本记录生成方法中使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文本记录生成方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的文本记录生成方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的文本记录生成方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (9)
1.一种文本记录生成方法,其特征在于,包括:
将实时采集的语音数据转换成文本数据,所述文本数据包括目标用户和每一目标用户对应的文本信息;
将每一目标用户对应的文本信息发送至目标用户对应的终端;
接收终端返回的对文本信息的反馈信息,所述反馈信息指示所述目标用户对所述文本信息进行了修改;
根据所述反馈信息,将所述反馈信息和每一目标用户对应的文本信息进行整合,得到文本记录;
所述接收终端返回的对文本信息的反馈信息之后,还包括:
根据所述反馈信息调整所述目标用户的个人文本数据库中对应文本元素的权重,所述文本元素包括修改前的字词或字段和/或修改后的字词或字段;
当所述文本元素的权重达到预设的阈值,则在下次识别该目标用户的语音部分时,若该语音部分包含了该文本元素,则提取目标用户的个人文本数据库中该文本元素的修改后的字词或字段,采用该文本元素的修改后的字词或字段对该文本元素的修改前的字词或字段直接进行替代。
2.如权利要求1所述的文本记录生成方法,其特征在于,所述将实时采集目标用户的语音数据转换成文本数据,包括:
对实时采集的语音数据进行身份识别,得到目标用户和每一目标用户对应的语音部分;
对每一目标用户对应的语音部分进行文本识别,得到每一目标用户对应的文本信息。
3.如权利要求2所述的文本记录生成方法,其特征在于,所述对每一目标用户对应的语音部分进行文本识别,包括:
根据所述目标用户的个人文本数据库对所述语音部分进行识别,所述目标用户的个人文本数据库用于生成该目标用户对应的文本信息。
4.如权利要求1所述的文本记录生成方法,其特征在于,所述根据所述反馈信息调整所述目标用户的个人文本数据库中对应文本元素的权重,包括:
减少所述目标用户的个人文本数据库中修改前的字词或字段的权重;和/或,增加所述目标用户的个人文本数据库中修改后的字词或字段的权重。
5.如权利要求2所述的文本记录生成方法,其特征在于,所述对每一目标用户对应的语音部分进行文本识别还包括:
判断所述目标用户是否具有对应的个人文本数据库;
根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别,所述通用的文本数据库用于生成该目标用户对应的文本信息;
根据对应的个人文本数据库对具有对应的个人文本数据库的目标用户的语音部分进行识别。
6.如权利要求5所述的文本记录生成方法,其特征在于,在根据通用的文本数据库对不具有对应的个人文本数据库的目标用户的语音部分进行识别之后,所述文本记录生成方法还包括:
接收对应目标用户的校对指令,所述校对指令指示所述目标用户对对应的文本信息进行校对;
根据所述校对指令,在通用的文本数据库中调整对应文本元素的权重。
7.如权利要求6所述的文本记录生成方法,其特征在于,所述校对指令包括认同指令,在接收对应目标用户的校对指令之后,所述文本记录生成方法还包括:
在接收到预设数量的目标用户的校对指令之后,对所述校对指令进行统计,若所述认同指令的数量不符合预设的阈值,则在通用的文本数据库中减少对应文本元素的权重,所述认同指令指示所述目标用户认同根据通用的文本数据库中文本元素的修改后的字词或字段替换对应文本信息的字词或字段;
若所述认同指令的数量符合预设的阈值,则在通用的文本数据库中增加对应文本元素的权重,或者,不调整对应文本元素的权重。
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述文本记录生成方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文本记录生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911378520.5A CN111177353B (zh) | 2019-12-27 | 2019-12-27 | 文本记录生成方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911378520.5A CN111177353B (zh) | 2019-12-27 | 2019-12-27 | 文本记录生成方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111177353A CN111177353A (zh) | 2020-05-19 |
CN111177353B true CN111177353B (zh) | 2023-06-09 |
Family
ID=70654180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911378520.5A Active CN111177353B (zh) | 2019-12-27 | 2019-12-27 | 文本记录生成方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111177353B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111756930A (zh) * | 2020-06-28 | 2020-10-09 | 维沃移动通信有限公司 | 通信控制方法、通信控制装置、电子设备和可读存储介质 |
CN113113016B (zh) * | 2021-04-08 | 2022-10-11 | 百度在线网络技术(北京)有限公司 | 音频的处理方法和装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6219638B1 (en) * | 1998-11-03 | 2001-04-17 | International Business Machines Corporation | Telephone messaging and editing system |
US7200555B1 (en) * | 2000-07-05 | 2007-04-03 | International Business Machines Corporation | Speech recognition correction for devices having limited or no display |
US9947313B2 (en) * | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
CN109285548A (zh) * | 2017-07-19 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 信息处理方法、系统、电子设备、和计算机存储介质 |
CN110444196B (zh) * | 2018-05-10 | 2023-04-07 | 腾讯科技(北京)有限公司 | 基于同声传译的数据处理方法、装置、系统和存储介质 |
CN108922538B (zh) * | 2018-05-29 | 2023-04-07 | 平安科技(深圳)有限公司 | 会议信息记录方法、装置、计算机设备及存储介质 |
CN108847241B (zh) * | 2018-06-07 | 2022-09-13 | 平安科技(深圳)有限公司 | 将会议语音识别为文本的方法、电子设备及存储介质 |
CN109599115B (zh) * | 2018-12-24 | 2022-03-22 | 思必驰科技股份有限公司 | 用于音频采集设备和用户终端的会议记录方法和装置 |
CN109361527B (zh) * | 2018-12-28 | 2021-02-05 | 苏州思必驰信息科技有限公司 | 语音会议记录方法及系统 |
CN110335612A (zh) * | 2019-07-11 | 2019-10-15 | 招商局金融科技有限公司 | 基于语音识别的会议记录生成方法、装置及存储介质 |
-
2019
- 2019-12-27 CN CN201911378520.5A patent/CN111177353B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111177353A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10957339B2 (en) | Speaker recognition method and apparatus, computer device and computer-readable medium | |
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
CN112492111B (zh) | 一种智能语音外呼方法、装置、计算机设备和存储介质 | |
CN109063217B (zh) | 电力营销系统中的工单分类方法、装置及其相关设备 | |
CN112037799B (zh) | 语音中断处理方法、装置、计算机设备和存储介质 | |
CN111177353B (zh) | 文本记录生成方法、装置、计算机设备及存储介质 | |
CN113192516B (zh) | 语音角色分割方法、装置、计算机设备及存储介质 | |
CN110930989B (zh) | 语音意图识别方法、装置、计算机设备和存储介质 | |
CN111126233B (zh) | 基于距离值的通话通道构建方法、装置和计算机设备 | |
CN109815489A (zh) | 催收信息生成方法、装置、计算机设备和存储介质 | |
CN111883140A (zh) | 基于知识图谱和声纹识别的认证方法、装置、设备及介质 | |
CN110047469B (zh) | 语音数据情感标注方法、装置、计算机设备及存储介质 | |
CN111243596A (zh) | 基于语音识别的保险信息获取方法、装置、设备及存储介质 | |
CN110689881A (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN114120978A (zh) | 情绪识别模型训练、语音交互方法、装置、设备及介质 | |
CN112766319A (zh) | 对话意图识别模型训练方法、装置、计算机设备及介质 | |
CN113709313B (zh) | 客服通话数据智能质检方法、装置、设备及介质 | |
CN111062221A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN113873088A (zh) | 语音通话的交互方法、装置、计算机设备和存储介质 | |
CN113223532A (zh) | 客服通话的质检方法、装置、计算机设备及存储介质 | |
CN110362592B (zh) | 裁决指引信息推送方法、装置、计算机设备和存储介质 | |
CN110533381B (zh) | 案件管辖权审核方法、装置、计算机设备和存储介质 | |
CN112397052A (zh) | Vad断句测试方法、装置、计算机设备及存储介质 | |
CN112102547A (zh) | 门限语言匹配方法、装置、存储介质及智能设备 | |
CN110415689B (zh) | 语音识别装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210630 Address after: 341000 dehuida science and Technology Park, Huoyanshan Road, Anyuan County, Ganzhou City, Jiangxi Province Applicant after: GANZHOU DEHUIDA TECHNOLOGY Co.,Ltd. Address before: 518000 Room 501, building 25, 121 Xikeng Road, Xikeng community, Fucheng street, Longhua District, Shenzhen City, Guangdong Province Applicant before: Lacknold (Shenzhen) Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |