CN110110133A - 一种智能语音数据生成方法及装置 - Google Patents
一种智能语音数据生成方法及装置 Download PDFInfo
- Publication number
- CN110110133A CN110110133A CN201910315208.5A CN201910315208A CN110110133A CN 110110133 A CN110110133 A CN 110110133A CN 201910315208 A CN201910315208 A CN 201910315208A CN 110110133 A CN110110133 A CN 110110133A
- Authority
- CN
- China
- Prior art keywords
- field
- list
- label
- weight
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 238000013507 mapping Methods 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract 1
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种智能语音数据生成方法及装置。所述方法包括根据接收到的用户标识和对象标识,从数据库中获取标签列表和字段列表;在标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的更新算法,更新字段权重;根据更新后的字段列表,从语料库中提取与每对字段和字段权重对应的语料;根据提取的语料,通过语音生成规则,得到语音数据并发送给终端,本发明实施例通过对所述将获取的标签列表的标签和字段列表中的字段进行匹配,并根据得到的对应关系,更新所述字段列表,再提取出相应的语料以得到所述讲解对象的语音数据,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
Description
技术领域
本发明涉及语音数据技术领域,尤其涉及一种智能语音数据生成方法及装置。
背景技术
现有的房源语音讲解内容多是由房产编辑、房源经纪人、业主本人等产出的,是单向的信息传递,每个用户在听取到的房源介绍都大同小异,且往往没有得到自身最为关注的问题。
现有技术中的语音讲解内容单一,不够灵活。
发明内容
本发明实施例提供一种智能语音数据生成方法及装置,用以解决现有技术中的语音讲解内容单一,不够灵活的问题。
第一方面,本发明实施例提供了一种智能语音数据生成方法,包括:
根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
第二方面,本发明实施例提供了一种用于智能语音数据生成的装置,包括:
信息获取模块,用于根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
权重计算模块,用于在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
语料获取模块,用于根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
语音生成模块,用于根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
第三方面,本发明实施例还提供了一种电子设备,包括:
处理器、存储器、通信接口和通信总线;其中,
所述处理器、存储器、通信接口通过所述通信总线完成相互间的通信;
所述通信接口用于该电子设备的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的计算机程序指令,所述处理器调用所述程序指令能够执行如下方法:
根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:
根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
本发明实施例提供的智能语音数据生成方法及装置,通过对所述将获取的用户的标签列表的标签和讲解对象的字段列表中的字段进行匹配,并根据得到的对应关系,更新所述字段列表中所述字段的字段权重,再根据更新后的字段列表,提取出相应语料库中的语料以得到所述讲解对象的语音数据,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的智能语音数据生成方法流程图;
图2为本发明实施例的另一智能语音数据生成方法流程图;
图3为本发明实施例的用于智能语音数据生成的装置结构示意图;
图4示例了一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例的智能语音数据生成方法流程图,如图1所示,所述方法包括:
步骤S01、根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重。
当用户通过终端登陆到应用,选定讲解对象时,终端将向服务器发送所述用户的用户标识和讲解对象的对象标识。
所述服务器根据接收到的用户标识从数据库中获取与所述用户标识对应的标签列表,所述标签列表包括所述用户的所有标签。所述标签由所述服务器根据每个用户在应用中产生的历史数据,例如,输入信息和行为数据等,通过分析每个用户的特性从预存的标签库中选取,例如“精装”、“地铁房”、“新房”等。同时,所述服务器根据接收到的对象标识从数据库中获取到与所述对象标识对应的字段列表,所述字段列表包括所述讲解对象的所有字段,以及每个字段的字段权重。所述字段由服务器根据对讲解对象的描述性语言或特性数据的分析,从所述预存的字段库中选取,所述字段可以是结构化字段例如“楼龄”、“电梯房”、“地铁房”、“是不装修”等,还可以是非结构化字段,例如,“客厅宽敞明亮”、“适合风需人群”等。而所述字段权重则是由所述服务器通过对讲解对象特点的分析预先设置的参数值。所述字段权重根据实际的需要可以为不同类型的字段设定为不同的数值类型,例如,布尔值、浮点数或者小于1的小数,在此不作具体限定,但为了简便起见,在下面的实施例中都仅以浮点数为例进行举例说明。
步骤S02、在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重。
所述服务器根据标签与字段的相关性,将标签库中的所有标签与字段库中所有字段进行关联,得到字段映射表。所述字段映射表中,每个标签可以对应一个或多个字段,而每个字段也可以对应一个或多个标签。
根据所述字段映射表,所述服务器将得到的标签列表和字段列表中的标签和字段进行比对,找出所述标签列表中与每个字段相对应的标签。然后,再根据预设的,更新存在对应关系的字段的字段权重。例如,所述标签列表为{a1,a2,a3},所述字段列表为{e1,f1;e2,f2;e3,f3;e4,f4;e5,f5},其中所述e1、e2、e3、e4、e5为字段,所述f1、f2、f3、f4、f5为与字段对应的字段权重,根据所述字段映射表,存在对应关系的标签和字段包括:a1:e2、a1:e3、a2:e1、a3:e2,则根据预设的更新算法,分别更新所述e1、e2、e3的字段权重f1、f2、f3。
所述更新算法,可以根据实际的需要来进行设定,可根据所述字段权重的数值类型的不同,分别设定不同的更新算法;甚至,还可以为每个字段分别设定对应的更新算法,在此不作具体限定,但为了简便起见,在下面的实施例中都以对每个字段采用统一的更新算法为例进行举例说明。例如,所述更新算法可以为将存在对应关系的字段的字段权重增加预设的权重增量d,此时,所述f1’=f1+d,f2’=f2+2d,f3’=f3+d;或者所述更新算法为将存在对应关系的字段提高相应的比例值,例如10%,此时,如果不考虑对应关系的数量,则所述f1’=1.1f1,f2’=1.1f2,f3’=1.1f3。更新后的字段列表为{e1,f1′;e2,f2′;e3,f3′;e4,f4;e5,f5}。
通过对存在对应关系的字段的字段权重的更新,所述服务器得到了更新后的字段列表。
步骤S03、根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料。
所述服务器的数据库中还保存有一个包含大量语料的语料库,并预先将字段库中的每个字段与语料库中的语料进行关联,得到所述字段与语料的对应关系,其中每个字段至少对应于一段语料,而对应于同一字段的多个语料又通过字段权重范围的不同而加以区分,从而使每对字段与字段权重至少对应于一段语料。根据一般的应用习惯,其中权重范围越大所对应的语料包含的内容也将更加详细、丰富。例如,所述字段b1,对应的语料为y1,y2,y3,y4,其中,所述y1对应的字段权重范围为<0.5,所述y2,y3对应的字段权重范围为≥0.5,所述y4对应的字段权重范围为≤0.3。
因此,所述服务器在得到更新的字段列表后,就可以通过当前字段列表中每对字段和字段权重,在所述语料库中找到对应的语料,并提取。若所述语料库中存在多段与所述字段与字段权重对应的语料,则从中随机提取一个语料即可。
步骤S04、根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
将所有提取出来的语料,根据预设的语音生成规则,通过对所有语料的排列、组合、编辑,得到所述讲解对象的语音数据。所述语音生成规则可以根据实际的需要来进行设定,可以通过进一步结合所述讲解对象的其他客观信息,如具体参数值、讲解重点等,再结合自然语言规律和语言逻辑的排序来得到所述语音数据。
所述服务器将得到的所述语音数据发送给所述终端,此时,所述用户就可以通过终端收听到所述语音数据的具体内容。
本发明实施例通过对所述将获取的用户的标签列表的标签和讲解对象的字段列表中的字段进行匹配,并根据得到的对应关系,更新所述字段列表中所述字段的字段权重,再根据更新后的字段列表,提取出相应语料库中的语料以得到所述讲解对象的语音数据,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
图2为本发明实施例的另一智能语音数据生成方法流程图,如图2所示,所述标签列表还包括每个标签的标签权重;相应地,所述步骤S02具体为:
步骤S021、在所述标签列表和字段列表中,根据所述字段映射表,若判定任一字段存在对应的标签,则根据预设的更新算法和与所述字段对应的标签的标签权重,更新所述字段的字段权重。
在所述服务器根据历史数据为每个用户选定标签时,还可以进一步根据历史数据为每个标签设定相应的标签权重,从而获取与所述用户标识对应的标签列表包括用户的标签和每个标签的标签权重。
此时,所述更新算法,可以进一步加入标签权重对字段权重更新的影响度。在根据预设的字段映射表得到所述标签列表和字段列表中所有的标签和字段的对应关系后,将存在对应关系的字段,根据更新算法和对应的标签权重,来更新该字段的字段权重。
进一步地,所述更新算法具体为:
对所述字段的字段权重、与所述字段对应的标签的标签权重进行加权求和,得到所述字段新的字段权重。
所述更新算法,根据实际的需要来进行设定,在此仅给出其中的一种举例说明。
在根据字段映射表,得到与所述字段对应的标签后,将所述字段的字段权重和对应的标签的标签权重进行加权求和,来更新该字段的字段权重。
例如,所述标签列表为{a1,b1;a2,b2;a3,b3},所述字段列表为{e1,f1;e2,f2;e3,f3;e4,f4;e5,f5},其中,所述a1、a2、a3为标签,所述b1、b2、b3为与标签对应的标签权重,所述e1、e2、e3、e4、e5为字段,所述f1、f2、f3、f4、f5为与字段对应的字段权重,根据映射表,存在对应关系的标签和字段对包括:a1:e2、a1:e3、a2:e1、a3:e2,则根据更新算法,分别更新所述e1、e2、e3的权重值f1’=f1+αb2、f2’=f2+α(b1+b3)、f3’=f3+αb2,所述α为预设的加权系数。从而,更新后的字段列表为:{e1,f1′;e2,f2′;e3,f3′;e4,f4;e5,f5}。
所述更新算法的设定可根据实际的需要进行,可以分别考虑每个字段的字段类型或者字段权重的数值类型等,在此不作具体限定。
本发明实施例通过在所述标签列表中加入每个标签的标签权重,从而在根据所述更新算法对所述字段列表进行更新时,需要进一步考虑每个标签权重对字段权重的影响度,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
基于上述实施例,进一步地,所述步骤S03;具体为:
若所述字段列表包含的字段数量超过了预设的第一阈值,则根据每个字段的字段权重,由高到低保留所述字段列表中所述第一阈值数量的字段;
根据新的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料。
为了能够让用户通过语音数据更快得了解所述讲解对象,因此,需要对所述语音数据的长度进行相应地限定。为此,可以通过对字段列表中第一阈值的限定,来控制提取出来的语料数量,进而限定得到的语音数据的长度。
所述服务器先根据实际的需要设定第一阈值。然后,在所述字段列表,根据更新算法进行更新后。若更新后的字段列表包含的字段数量没有超过所述第一阈值,则保留所述字段列表中所有的字段;而若包含的字段数量超过了所述第一阈值,需要比较每个字段的字段权重,在字段列表中仅保留下数值最高的第一阈值数量的字段。例如,预设的字段列表为:{e1,0.5;e2,0.3;e3,0.2;e4,0.4;e5,0.8},根据更新算法得到的更新后的字段列表为:{e1,0.6;e2,0.7;e3,0.9;e4,0.4;e5,0.8},所述第一阈值设为4,则通过筛选保留下来的字段列表为{e1,0.6;e2,0.7;e3,0.9;e5,0.8}。
然后,再根据保留下的字段列表中的字段和字段权重,从语料库中提取出对应的语料。再进一步,根据语音生成规则得到语音数据,从而控制了所述语音数据的长度。
本发明实施例通过设定的第一阈值限制所述字段列表的长度,进而控制语音数据的长度,从而使所述语音数据更好得适用于每个用户的特征,使用户更快得了解所述讲解对象,增加语音讲解的适用性。
基于上述实施例,进一步,所述方法还包括:
若所述标签列表中包含的标签数量超过预设的第二阈值,则根据每个标签的标签权重,由高到低保留所述标签列表中所述第二阈值数量的标签。
根据每个用户对应用使用的频率和时间,每个用户的标签列表中标签的数量也会有有所不同。而过多的标签数量会使得在后续根据更新算法进行字段列表的更新时过于复杂,反而不能够突出用户最关注的问题。因此,所述服务器可以预先设定第二阈值,例如3,则在获取到与用户标识对应的标签队列表时,只保留所述标签权重最大的第二阈值数量的标签。
本发明实施例通过设定第二阈值,减少标签列表中的标签数量,从而在更新所述字段列表时更能突出用户的关注点,使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
基于上述实施例,进一步地,在所述步骤S02后,所述方法还包括:
若更新后的字段权重大于预设的讲解重点阈值,则将所述字段标识为讲解重点;
相应地,所述方法还包括:
将根据标识为讲解重点的字段提取的语料作为讲解重点语料;相应地,所述方法还包括:
将提取到的讲解重点语料,作为所述语音数据的优先讲解内容。
在得到语音数据时,可以根据所述讲解对象的突出特点或突出优势作为讲解重点,在所述语音数据中优先播放。所述讲解重点可以是预先设定的,也可以根据所述字段的字段权重大小来进行设定。
所述服务器预先设定讲解重点阈值,将所述字段权重超过所述讲解重点阈值的字段标识为讲解重点。
从而,在根据所述标识为讲解重点的字段提取出相应的语料时,可以将该语料作为讲解重点语料。
而所述讲解重点语料相较与其它语料,将作为得到的语音数据中的优先讲解内容。
本发明实施例通过将字段权重超过所述讲解重点阈值的字段标记为讲解重点,并将得到的对应的语料作为讲解重点语料,从而在所述语音数据中被优先讲解,突出用户的关注点,使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
图3为本发明实施例的用于智能语音数据生成的装置结构示意图,如图3所示,所述装置包括:信息获取模块10、权重计算模块11、语料获取模块12和语音生成模块13,其中,
所述信息获取模块10用于根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;所述权重计算模块11用于在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;所述语料获取模块12用于根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;所述语音生成模块13用于根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。具体地:
当用户通过终端登陆到应用,选定讲解对象时,终端将向信息获取模块10发送所述用户的用户标识和讲解对象的对象标识。
所述信息获取模块10根据接收到的用户标识从数据库中获取与所述用户标识对应的标签列表,所述标签列表包括所述用户的所有标签。所述标签为根据每个用户在应用中产生的历史数据,例如,输入信息和行为数据等,通过分析每个用户的特性从预存的标签库中选取。同时,所述信息获取模块10根据接收到的对象标识从数据库中获取到与所述对象标识对应的字段列表,所述字段列表包括所述讲解对象的所有字段,以及每个字段的字段权重。所述字段为根据对讲解对象的描述性语言或特性数据的分析,从所述预存的字段库中选取,所述字段可以是结构化字段,还可以是非结构化字段。而所述字段权重则是通过对讲解对象特点的分析预先设置的参数值。所述字段权重根据实际的需要可以为不同类型的字段设定为不同的数值类型。
所述信息获取模块10将获取标签列表和字段列表发送给所述权重计算模块11。
所述权重计算模块11根据标签与字段的相关性,将标签库中的所有标签与字段库中所有字段进行关联,得到字段映射表。所述字段映射表中,每个标签可以对应一个或多个字段,而每个字段也可以对应一个或多个标签。
根据所述字段映射表,所述权重计算模块11将得到的标签列表和字段列表中的标签和字段进行比对,找出所述标签列表中与每个字段相对应的标签。然后,再根据预设的更新算法,更新存在对应关系的字段的字段权重。
所述更新算法,可以根据实际的需要来进行设定,可根据所述字段权重的数值类型的不同分别设定不同的更新算法;甚至,还可以为每个字段分别设定对应的更新算法,在此不作具体限定。例如,所述更新算法可以为将存在对应关系的字段的字段权重增加预设的权重增量d;或者所述更新算法为将存在对应关系的字段提高相应的比例值,例如10%。
通过对存在对应关系的字段的字段权重的更新,所述权重计算模块11得到了更新后的字段列表并发送给语料获取模块12。
所述语料获取模块12保存有一个包含大量语料的语料库,并预先将字段库中的每个字段与语料库中的语料进行关联,得到所述字段与语料的对应关系,其中每个字段至少对应于一段语料,而对应于同一字段的多个语料又通过字段权重范围的不同而加以区分,从而使每对字段与字段权重至少对应于一段语料。
因此,所述语料获取模块12在得到更新的字段列表后,就可以通过当前字段列表中每对字段和字段权重,在所述语料库中找到对应的语料,并提取。若所述语料库中存在多段与所述字段与字段权重对应的语料,则从中随机提取一个语料即可。所述语料获取模块12将所有提取的语料发送给所述语音生成模块13。
所述语音生成模块13将所有接收到的语料,根据预设的语音生成规则,通过对所有语料的排列、组合、编辑,得到所述讲解对象的语音数据。所述语音生成规则可以根据实际的需要来进行设定,可以通过进一步结合所述讲解对象的其他客观信息,如具体参数值、讲解重点等,再结合自然语言规律和语言逻辑的排序来得到所述语音数据。
所述语音生成模块13将得到的所述语音数据发送给所述终端,此时,所述用户就可以通过终端收听到所述语音数据的具体内容。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。本发明实施例通过对所述将获取的用户的标签列表的标签和讲解对象的字段列表中的字段进行匹配,并根据得到的对应关系,更新所述字段列表中所述字段的字段权重,再根据更新后的字段列表,提取出相应语料库中的语料以得到所述讲解对象的语音数据,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
基于上述实施例,进一步地,所述标签列表还包括每个标签的标签权重;相应地,所述权重更新模块具体用于:
在所述标签列表和字段列表中,根据所述字段映射表,若判定任一字段存在对应的标签,则根据预设的更新算法和与所述字段对应的标签的标签权重,更新所述字段的字段权重。
在所述信息获取模块根据历史数据为每个用户选定标签时,还可以进一步根据历史数据为每个标签设定相应的标签权重,从而获取与所述用户标识对应的标签列表包括用户的标签和每个标签的标签权重。
此时,所述权重计算模块设定的更新算法,可以进一步加入标签权重对字段权重更新的影响度。在根据预设的字段映射表得到所述标签列表和字段列表中所有的标签和字段的对应关系后。将存在对应关系的字段,根据更新算法和对应的标签权重,来更新该字段的字段权重。
进一步地,所述更新算法具体为:
对所述字段的字段权重、与所述字段对应的标签的标签权重进行加权求和,得到所述字段新的字段权重。
所述权重计算模块的更新算法,根据实际的需要来进行设定,在此仅给出其中的一种举例说明。
在根据字段映射表,得到与所述字段对应的标签后,将所述字段的字段权重和对应的标签的标签权重进行加权求和,来更新该字段的字段权重。
所述更新算法的设定可根据实际的需要进行,可以分别考虑每个字段的字段类型或者字段权重的数值类型等,在此不作具体限定。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。本发明实施例通过在所述标签列表中加入每个标签的标签权重,从而在根据所述更新算法对所述字段列表进行更新时,需要进一步考虑每个标签权重对字段权重的影响度,从而使所述语音数据更好得适用于每个用户的特征,增加语音讲解的适用性。
图4示例了一种电子设备的实体结构示意图,如图4所示,该服务器可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
进一步地,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
本领域普通技术人员可以理解:此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种智能语音数据生成方法,其特征在于,包括:
根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
2.根据权利要求1所述的智能语音数据生成方法,其特征在于,所述标签列表还包括每个标签的标签权重;相应地,所述在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;具体为:
在所述标签列表和字段列表中,根据所述字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法和与所述字段对应的标签的标签权重,更新所述字段的字段权重。
3.根据权利要求2所述的智能语音数据生成方法,其特征在于,所述更新算法具体为:
对所述字段的字段权重、与所述字段对应的标签的标签权重进行加权求和,得到所述字段新的字段权重。
4.根据权利要求2所述的智能语音数据生成方法,其特征在于,所述根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料,具体为:
若所述字段列表包含的字段数量超过了预设的第一阈值,则根据每个字段的字段权重,由高到低保留所述字段列表中所述第一阈值数量的字段;
根据新的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料。
5.根据权利要求3或4所述的智能语音数据生成方法,其特征在于,所述方法还包括:
若所述标签列表中包含的标签数量超过预设的第二阈值,则根据每个标签的标签权重,由高到低保留所述标签列表中所述第二阈值数量的标签。
6.根据权利要求5所述的智能语音数据生成方法,其特征在于,所述方法还包括:
若更新后的字段权重大于预设的讲解重点阈值,则将所述字段标识为讲解重点;
相应地,所述方法还包括:
将根据标识为讲解重点的字段提取的语料作为讲解重点语料;相应地,所述方法还包括:
将提取到的讲解重点语料,作为所述语音数据的优先讲解内容。
7.一种用于智能语音数据生成的装置,其特征在于,包括:
信息获取模块,用于根据接收到由终端发送的用户标识和对象标识,从数据库中获取与所述用户标识对应的标签列表和与所述对象标识对应的字段列表;所述标签列表包括至少一个标签,所述字段列表包括至少一个字段和预设的每个字段的字段权重;
权重计算模块,用于在所述标签列表和字段列表中,根据预存的字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法,更新所述字段的字段权重;
语料获取模块,用于根据更新后的字段列表,从预存的语料库中提取与每对字段和字段权重对应的语料;其中,所述语料库包括与每对字段和字段权重对应的至少一段语料;
语音生成模块,用于根据提取的所有语料,通过预设的语音生成规则,得到语音数据并发送给所述终端。
8.根据权利要求7所述的用于智能语音数据生成的装置,其特征在于,所述标签列表还包括每个标签的标签权重;相应地,所述权重更新模块具体用于:
在所述标签列表和字段列表中,根据所述字段映射表,若判定任一字段存在对应的标签,则根据预设的与所述字段对应的更新算法和与所述字段对应的标签的标签权重,更新所述字段的字段权重。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述智能语音数据生成方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述智能语音数据生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910315208.5A CN110110133B (zh) | 2019-04-18 | 2019-04-18 | 一种智能语音数据生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910315208.5A CN110110133B (zh) | 2019-04-18 | 2019-04-18 | 一种智能语音数据生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110133A true CN110110133A (zh) | 2019-08-09 |
CN110110133B CN110110133B (zh) | 2020-08-11 |
Family
ID=67485756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910315208.5A Active CN110110133B (zh) | 2019-04-18 | 2019-04-18 | 一种智能语音数据生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110133B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5471677A (en) * | 1992-06-24 | 1995-11-28 | Matsushita Electric Industrial Co., Ltd. | Data retrieval using user evaluation of data presented to construct interference rules and calculate range of inputs needed for desired output and to formulate retrieval queries |
US20050044073A1 (en) * | 2003-08-18 | 2005-02-24 | International Business Machines Corporation | Frequent pattern mining apparatus, frequent pattern mining method, and program and recording medium therefor |
WO2006087854A1 (ja) * | 2004-11-25 | 2006-08-24 | Sharp Kabushiki Kaisha | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
CN103177093A (zh) * | 2013-03-13 | 2013-06-26 | 北京开心人信息技术有限公司 | 一种基于对象标签的通用推荐方法及系统 |
CN103198155A (zh) * | 2013-04-27 | 2013-07-10 | 俞志晨 | 一种基于移动终端的智能问答交互系统及方法 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答系统 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN105989040A (zh) * | 2015-02-03 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 智能问答的方法、装置及系统 |
CN106844400A (zh) * | 2015-12-07 | 2017-06-13 | 南京中兴新软件有限责任公司 | 智能应答方法及装置 |
CN108986910A (zh) * | 2018-07-04 | 2018-12-11 | 平安科技(深圳)有限公司 | 线上问答方法、装置、计算机设备和存储介质 |
CN109189897A (zh) * | 2018-07-27 | 2019-01-11 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN109410913A (zh) * | 2018-12-13 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种语音合成方法、装置、设备及存储介质 |
-
2019
- 2019-04-18 CN CN201910315208.5A patent/CN110110133B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5471677A (en) * | 1992-06-24 | 1995-11-28 | Matsushita Electric Industrial Co., Ltd. | Data retrieval using user evaluation of data presented to construct interference rules and calculate range of inputs needed for desired output and to formulate retrieval queries |
US20050044073A1 (en) * | 2003-08-18 | 2005-02-24 | International Business Machines Corporation | Frequent pattern mining apparatus, frequent pattern mining method, and program and recording medium therefor |
WO2006087854A1 (ja) * | 2004-11-25 | 2006-08-24 | Sharp Kabushiki Kaisha | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
CN103177093A (zh) * | 2013-03-13 | 2013-06-26 | 北京开心人信息技术有限公司 | 一种基于对象标签的通用推荐方法及系统 |
CN103198155A (zh) * | 2013-04-27 | 2013-07-10 | 俞志晨 | 一种基于移动终端的智能问答交互系统及方法 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答系统 |
CN105989040A (zh) * | 2015-02-03 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 智能问答的方法、装置及系统 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106844400A (zh) * | 2015-12-07 | 2017-06-13 | 南京中兴新软件有限责任公司 | 智能应答方法及装置 |
CN108986910A (zh) * | 2018-07-04 | 2018-12-11 | 平安科技(深圳)有限公司 | 线上问答方法、装置、计算机设备和存储介质 |
CN109189897A (zh) * | 2018-07-27 | 2019-01-11 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN109410913A (zh) * | 2018-12-13 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种语音合成方法、装置、设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
IVÁN CANTADOR: "Content-based recommendation in social tagging systems", 《PROCEEDINGS OF THE FOURTH ACM CONFERENCE ON RECOMMENDER SYSTEMS》 * |
孔欣欣等: "基于标签权重评分的推荐模型及算法研究", 《计算机学报》 * |
雷曼等: "基于标签权重的协同过滤推荐算法", 《计算机应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110110133B (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112650854B (zh) | 基于多知识图谱的智能答复方法、装置及计算机设备 | |
CN109948160B (zh) | 短文本分类方法及装置 | |
CN105960674A (zh) | 信息处理装置 | |
CN113722438A (zh) | 基于句向量模型的句向量生成方法、装置及计算机设备 | |
CN112417121A (zh) | 客户意图识别方法、装置、计算机设备及存储介质 | |
CN113094478B (zh) | 表情回复方法、装置、设备及存储介质 | |
CN115640398A (zh) | 评论生成模型训练方法、评论生成方法、设备及存储介质 | |
CN114373444B (zh) | 一种基于蒙太奇的语音合成方法、系统及设备 | |
CN110728983A (zh) | 一种信息显示方法、装置、设备及可读存储介质 | |
CN110532448B (zh) | 基于神经网络的文档分类方法、装置、设备及存储介质 | |
CN117312641A (zh) | 智能获取信息的方法、装置、设备及存储介质 | |
CN110110133B (zh) | 一种智能语音数据生成方法及装置 | |
CN113220828A (zh) | 意图识别模型处理方法、装置、计算机设备及存储介质 | |
CN111881293A (zh) | 一种风险内容识别方法及装置、服务器、存储介质 | |
CN109189897B (zh) | 一种基于数据内容匹配的聊天方法及聊天装置 | |
CN107656627B (zh) | 信息输入方法和装置 | |
CN114238593A (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
CN115617974A (zh) | 一种对话处理方法、装置、设备及存储介质 | |
CN112862073B (zh) | 一种压缩数据分析方法、装置、存储介质及终端 | |
CN112905792B (zh) | 基于非文本场景的文本聚类方法、装置、设备及存储介质 | |
CN114254088A (zh) | 自动应答模型的构建方法和自动应答方法 | |
CN114093447A (zh) | 数据资产推荐方法、装置、计算机设备及存储介质 | |
CN114416937B (zh) | 人机交互方法、装置、设备、存储介质及计算机程序产品 | |
CN113473178B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
WO2023084761A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191226 Address after: 100085 Floor 102-1, Building No. 35, West Second Banner Road, Haidian District, Beijing Applicant after: Seashell Housing (Beijing) Technology Co., Ltd. Address before: 300 457 days Unit 5, Room 1, 112, Room 1, Office Building C, Nangang Industrial Zone, Binhai New Area Economic and Technological Development Zone, Tianjin Applicant before: Shell Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |