CN102347060A

CN102347060A - 电子记录装置及方法

Info

Publication number: CN102347060A
Application number: CN2010102450508A
Authority: CN
Inventors: 庄品洋; 徐暹锡; 游银泉
Original assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Current assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Priority date: 2010-08-04
Filing date: 2010-08-04
Publication date: 2012-02-08

Abstract

一种用于电子记录装置的电子记录方法，该电子记录装置包括一输入单元和一存储单元，该输入单元用于输入语音，该存储单元中包括有声纹资料库，该声纹资料库包括用户的声纹模型以及与声纹模型对应的用户的个人信息，该方法还包括接收通过输入单元输入的发言者语音，并将接收的语音存储至存储单元中；从发言者语音中提取出语音特征；判断声纹资料库中是否有与发言者语音匹配的声纹模型，当声纹资料库中有与发言者语音匹配的声纹模型时，根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。本发明还提供一种电子记录装置，可方便查阅发言人对应的发言。

Description

电子记录装置及方法

技术领域

本发明涉及一种电子记录装置及方法，特别涉及一种在会议中记录发言者的发言的装置及方法。

背景技术

目前在开会时，一般采用摄影机拍摄或者录音的方式记录会议的过程。但在会后，当用户查询会议中某个发言者的发言时，需要将所拍摄的整个会议过程从头开始播放以寻找该发言者的发言内容，如此浪费时间。

发明内容

有鉴于此，有必要提供一种电子记录装置及方法，根据发言者的发言语音识别发言者的个人信息，并将该发言者的发言语音与发言者的个人信息关联。

一种电子记录装置，包括一输入单元，一存储单元以及一处理单元，该输入单元用于输入语音，该存储单元中存储有声纹资料库，该声纹资料库包括用户的声纹模型和与用户的声纹模型相对应的个人信息，该处理单元包括一声音接收模块，一特征获取模块，一语音识别模块以及一档案生成模块；该声音接收模块用于接收通过输入单元输入的发言者语音，并将接收的语音存储至存储单元中；该特征获取模块用于从发言语音中提取出语音特征；该语音识别模块判断声纹资料库中是否有与发言者语音匹配的声纹模型；当声纹资料库中有与发言者语音匹配的声纹模型时，档案生成模块根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。

一种用于电子记录装置的电子记录方法，该电子记录装置包括一输入单元和一存储单元，该输入单元用于输入语音，该存储单元中包括有声纹资料库，该声纹资料库包括用户的声纹模型以及与声纹模型对应的用户的个人信息，该方法还包括接收通过输入单元输入的发言者语音，并将接收的语音存储至存储单元中；从发言者语音中提取出语音特征；判断声纹资料库中是否有与发言者语音匹配的声纹模型，当声纹资料库中有与发言者语音匹配的声纹模型时，根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。

该声音接收模块接收发言者语音，该特征获取模块从发言者语音中提取出语音特征。该语音识别模块识别发言者语音对应的声纹模型；该生成模块根据该声纹模型获取对应的个人信息，并将个人信息与对应发言语音进行合成建立索引文件。通过本发明的电子记录装置及方法，可以得知发言人的相关信息及发言人所对应的讲话内容，从而可在日后方便的查询某个参会者的发言。

附图说明

图1是本发明一实施方式中电子记录装置的方框结构示意图。

图2是本发明一实施方式中的电子记录方法的流程图。

图3是本发明一实施方式中的该声纹资料库的建立流程图。

主要元件符号说明

电子记录装置	100
		输入单元	10
存储单元	20
		处理单元	30
声音接收模块	310
		特征获取模块	320
语音识别模块	330
		档案生成模块	340
声纹模型建立模块	350

具体实施方式

请参考图1，该电子记录装置100包括一输入单元10，一存储单元20及一处理单元30。

该输入单元10用于输入语音。在本实施方式中，该输入装置10为一麦克风。

该存储单元20内存储有一声纹资料库，该声纹资料库中存储有用户的声纹模型以及该声纹模型对应用户的个人信息，如姓名，照片，职称等。

该处理单元30包括一声音接收模块310、一特征获取模块320、一语音识别模块330、一档案生成模块340和一声纹模型建立模块350。

该声音接收模块310用于通过输入单元10接受发言者的语音，并将该发言者的语音存储至存储单元20中。

该特征获取模块320从发言者语音中提取发言者的语音特征。在本实施方式中，该特征获取模块320通过梅尔倒频谱系数进行发言者的语音特征的提取。但本发明提取语音特征并不限于上述方式，其他提取语音特征也包括在本发明所揭露的范围之内。

该语音识别模块330判断该声纹资料库中是否有与该发言者的语音特征相匹配的声纹模型。若声纹资料库中有与该发言者的语音特征相匹配的声纹模型，该档案生成模块340直接根据该声纹模型获取该声纹模型对应的发言者的个人信息，记录发言者的发言时间，并获取发言者的语音在存储单元20中的地址，根据以上信息建立一个索引文件并将索引文件存储于存储单元中。例如：若发言者的名字为张三，发言时间为9:00-9:10，在存储单元20中的地址为D：会议信息/2010年7月5日/人力招募，则生成的索引文件即可为：张三：发言时间：9:00-9:10，发言内容：D：会议信息/2010年7月5日/人力招募。其他发言者的信息可依发言的先后顺序添加至该索引文件。

若该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型，则该声纹模型建立模块350根据所提取的该发言者的语音特征建立该发言者的声纹模型，并将使用者输入的该发言者的个人信息与发言者的声纹模型进行关联。然后档案生成模块340将该发言者的发言的索引信息添加至索引文件。则以后可根据该索引文件方便查询发言者的发言内容。在本实施方式中，该声纹模型建立模块350根据高斯混合模型进行声纹模型的建立。但本发明建立声纹模型的方法并不限于上述方法，其他建立声纹模型的方式也包括在本发明所揭露的范围之内。

在该声纹资料库的建立过程中，该声音接收模块310通过该输入单元10接受用户的登记语音，并将该用户的登记语音存储至存储单元20中。该特征获取模块320从用户的登记语音中提取用户的语音特征。该声纹模型建立模块350根据所提取的用户的语音特征建立该用户的声纹模型，获取使用者输入的对应用户的个人信息，并将该用户的声纹模型及个人信息进行关联后存储至该声纹资料库中。

请参考图2，为本发明一实施方式中通过电子记录装置会议记录方法的流程图。步骤S201中，声音接收模块310接收发言者语音，并将该发言者的语音存储至存储单元20中。步骤S202中，特征获取模块320从发言者语音中提取语音特征。步骤S203中，语音识别模块330判断声纹资料库中是否有与发言者语音匹配的声纹模型，当该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型时，执行步骤S204。当声纹资料库中存储有与发言者语音对应的声纹模型时，直接执行步骤S205。步骤S204中，声纹模型建立模块350根据所提取的该发言者的语音特征建立该发言者的声纹模型，并将使用者输入的该发言者的个人信息与发言者的声纹模型进行关联。步骤S205中，档案生成模块340根据该声纹模型获取该声纹模型对应的发言者的个人信息，记录发言者的发言时间，并获取发言者的语音在存储单元20中的地址，根据以上信息建立一个索引文件并将索引文件存储于存储单元20中。

如图3所示，为该声纹资料库的建立流程图。步骤S301中，声音接收模块310接收用户的登记语音，并将该用户的登记语音存储至存储单元20中。步骤S302中，特征获取模块320从登记语音中提取出用户的语音特征。步骤S303中，声纹模型建立模块350根据所提取的用户的语音特征建立该用户的声纹模型，获取使用者输入的对应用户的个人信息，并将该用户的声纹模型及个人信息进行关联后存储至该声纹资料库中。

Claims

1.一种电子记录装置，包括一输入单元，一存储单元以及一处理单元，该输入单元用于输入语音，其特征在于：

该存储单元中存储有声纹资料库，该声纹资料库存储用户的声纹模型和与用户的声纹模型相对应的个人信息，

该处理单元包括一声音接收模块，一特征获取模块，一语音识别模块以及一档案生成模块；

该声音接收模块用于接收通过输入单元输入的发言者语音，并将接收的语音存储至存储单元中；

该特征获取模块用于从发言语音中提取出语音特征；

该语音识别模块用于判断声纹资料库中是否有与发言者语音匹配的声纹模型；

该档案生成模块用于当声纹资料库中有与发言者语音匹配的声纹模型时，根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。

2.如权利要求1所述的电子记录装置，其特征在于：该特征获取模块通过梅尔倒频谱系数进行发言者的语音特征的提取。

3.如权利要求1所述的电子记录装置，其特征在于：该处理单元还包括一声纹模型建立模块，若该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型，则该声纹模型建立模块根据所提取的该发言者的语音特征建立该发言者的声纹模型，并将该发言者的个人信息与发言者的声纹模型进行关联，该档案生成模块根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。

4.如权利要求1所述的电子记录装置，其特征在于：该声纹模型建立模块通过高斯混合模型进行声纹模型的建立。

5.如权利要求1所述的电子记录装置，其特征在于，该声纹资料库的建立过程如下：

声音接收模块接收用户的登记语音，并将该用户的登记语音存储至存储单元中；特征获取模块从登记语音中提取出用户的语音特征；声纹模型建立模块根据所提取的用户的语音特征建立该用户的声纹模型，获取对应的用户的个人信息，并将用户的声纹模型及个人信息进行关联后并存储至该声纹资料库中。

6.一种用于电子记录装置的电子记录方法，该电子记录装置包括一输入单元和一存储单元，该输入单元用于输入语音，该存储单元中存储有声纹资料库，该声纹资料库存储用户的声纹模型以及与声纹模型对应的用户的个人信息，其特征在于，该方法包括：

接收通过输入单元输入的发言者语音，将接收的语音存储至存储单元中；

从发言者语音中提取出语音特征；

判断声纹资料库中是否有与发言者语音匹配的声纹模型；

当声纹资料库中有与发言者语音匹配的声纹模型时，根据该声纹模型获取该声纹模型对应的发言者的个人信息，并获取发言者的语音在存储单元中的地址建立一个索引文件。

7.如权利要求6所述的电子记录方法，其特征在于：该发言者语音特征的提取是通过梅尔倒频谱系数进行提取。

8.如权利要求6所述的电子记录方法，其特征在于，该方法还包括：

当该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型时，根据所提取的该发言者的语音特征建立该发言者的声纹模型，并将该发言者的个人信息与发言者的声纹模型进行关联。

9.如权利要求8所述的电子记录方法，其特征在于：该声纹模型的建立是通过高斯混合模型进行建立。

10.如权利要求6所述的电子记录方法，其特征在于，该声纹资料库的建立步骤包括：

接收用户的登记语音，并将该用户的登记语音存储至存储单元中；

从用户的登记语音中提取出用户的语音特征；

根据所提取的用户的语音特征建立该用户的声纹模型，获取对应的用户的个人信息，并将用户的声纹模型及个人信息进行关联后并存储至该声纹资料库中。