CN102347060A - 电子记录装置及方法 - Google Patents

电子记录装置及方法 Download PDF

Info

Publication number
CN102347060A
CN102347060A CN2010102450508A CN201010245050A CN102347060A CN 102347060 A CN102347060 A CN 102347060A CN 2010102450508 A CN2010102450508 A CN 2010102450508A CN 201010245050 A CN201010245050 A CN 201010245050A CN 102347060 A CN102347060 A CN 102347060A
Authority
CN
China
Prior art keywords
sound
voice
spokesman
groove model
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102450508A
Other languages
English (en)
Inventor
庄品洋
徐暹锡
游银泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2010102450508A priority Critical patent/CN102347060A/zh
Publication of CN102347060A publication Critical patent/CN102347060A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

一种用于电子记录装置的电子记录方法,该电子记录装置包括一输入单元和一存储单元,该输入单元用于输入语音,该存储单元中包括有声纹资料库,该声纹资料库包括用户的声纹模型以及与声纹模型对应的用户的个人信息,该方法还包括接收通过输入单元输入的发言者语音,并将接收的语音存储至存储单元中;从发言者语音中提取出语音特征;判断声纹资料库中是否有与发言者语音匹配的声纹模型,当声纹资料库中有与发言者语音匹配的声纹模型时,根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。本发明还提供一种电子记录装置,可方便查阅发言人对应的发言。

Description

电子记录装置及方法
技术领域
本发明涉及一种电子记录装置及方法,特别涉及一种在会议中记录发言者的发言的装置及方法。
背景技术
目前在开会时,一般采用摄影机拍摄或者录音的方式记录会议的过程。但在会后,当用户查询会议中某个发言者的发言时,需要将所拍摄的整个会议过程从头开始播放以寻找该发言者的发言内容,如此浪费时间。
发明内容
有鉴于此,有必要提供一种电子记录装置及方法,根据发言者的发言语音识别发言者的个人信息,并将该发言者的发言语音与发言者的个人信息关联。
一种电子记录装置,包括一输入单元,一存储单元以及一处理单元,该输入单元用于输入语音,该存储单元中存储有声纹资料库,该声纹资料库包括用户的声纹模型和与用户的声纹模型相对应的个人信息,该处理单元包括一声音接收模块,一特征获取模块,一语音识别模块以及一档案生成模块;该声音接收模块用于接收通过输入单元输入的发言者语音,并将接收的语音存储至存储单元中;该特征获取模块用于从发言语音中提取出语音特征;该语音识别模块判断声纹资料库中是否有与发言者语音匹配的声纹模型;当声纹资料库中有与发言者语音匹配的声纹模型时,档案生成模块根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。
一种用于电子记录装置的电子记录方法,该电子记录装置包括一输入单元和一存储单元,该输入单元用于输入语音,该存储单元中包括有声纹资料库,该声纹资料库包括用户的声纹模型以及与声纹模型对应的用户的个人信息,该方法还包括接收通过输入单元输入的发言者语音,并将接收的语音存储至存储单元中;从发言者语音中提取出语音特征;判断声纹资料库中是否有与发言者语音匹配的声纹模型,当声纹资料库中有与发言者语音匹配的声纹模型时,根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。
该声音接收模块接收发言者语音,该特征获取模块从发言者语音中提取出语音特征。该语音识别模块识别发言者语音对应的声纹模型;该生成模块根据该声纹模型获取对应的个人信息,并将个人信息与对应发言语音进行合成建立索引文件。通过本发明的电子记录装置及方法,可以得知发言人的相关信息及发言人所对应的讲话内容,从而可在日后方便的查询某个参会者的发言。
附图说明
图1是本发明一实施方式中电子记录装置的方框结构示意图。
图2是本发明一实施方式中的电子记录方法的流程图。
图3是本发明一实施方式中的该声纹资料库的建立流程图。
主要元件符号说明
  电子记录装置   100
  输入单元   10
  存储单元   20
  处理单元   30
  声音接收模块   310
  特征获取模块   320
  语音识别模块   330
  档案生成模块   340
  声纹模型建立模块   350
具体实施方式
请参考图1,该电子记录装置100包括一输入单元10,一存储单元20及一处理单元30。
该输入单元10用于输入语音。在本实施方式中,该输入装置10为一麦克风。
该存储单元20内存储有一声纹资料库,该声纹资料库中存储有用户的声纹模型以及该声纹模型对应用户的个人信息,如姓名,照片,职称等。
该处理单元30包括一声音接收模块310、一特征获取模块320、一语音识别模块330、一档案生成模块340和一声纹模型建立模块350。
该声音接收模块310用于通过输入单元10接受发言者的语音,并将该发言者的语音存储至存储单元20中。
该特征获取模块320从发言者语音中提取发言者的语音特征。在本实施方式中,该特征获取模块320通过梅尔倒频谱系数进行发言者的语音特征的提取。但本发明提取语音特征并不限于上述方式,其他提取语音特征也包括在本发明所揭露的范围之内。
该语音识别模块330判断该声纹资料库中是否有与该发言者的语音特征相匹配的声纹模型。若声纹资料库中有与该发言者的语音特征相匹配的声纹模型,该档案生成模块340直接根据该声纹模型获取该声纹模型对应的发言者的个人信息,记录发言者的发言时间,并获取发言者的语音在存储单元20中的地址,根据以上信息建立一个索引文件并将索引文件存储于存储单元中。例如:若发言者的名字为张三,发言时间为9:00-9:10,在存储单元20中的地址为D:会议信息/2010年7月5日/人力招募,则生成的索引文件即可为:张三:发言时间:9:00-9:10,发言内容:D:会议信息/2010年7月5日/人力招募。其他发言者的信息可依发言的先后顺序添加至该索引文件。
若该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型,则该声纹模型建立模块350根据所提取的该发言者的语音特征建立该发言者的声纹模型,并将使用者输入的该发言者的个人信息与发言者的声纹模型进行关联。然后档案生成模块340将该发言者的发言的索引信息添加至索引文件。则以后可根据该索引文件方便查询发言者的发言内容。在本实施方式中,该声纹模型建立模块350根据高斯混合模型进行声纹模型的建立。但本发明建立声纹模型的方法并不限于上述方法,其他建立声纹模型的方式也包括在本发明所揭露的范围之内。
在该声纹资料库的建立过程中,该声音接收模块310通过该输入单元10接受用户的登记语音,并将该用户的登记语音存储至存储单元20中。该特征获取模块320从用户的登记语音中提取用户的语音特征。该声纹模型建立模块350根据所提取的用户的语音特征建立该用户的声纹模型,获取使用者输入的对应用户的个人信息,并将该用户的声纹模型及个人信息进行关联后存储至该声纹资料库中。
请参考图2,为本发明一实施方式中通过电子记录装置会议记录方法的流程图。步骤S201中,声音接收模块310接收发言者语音,并将该发言者的语音存储至存储单元20中。步骤S202中,特征获取模块320从发言者语音中提取语音特征。步骤S203中,语音识别模块330判断声纹资料库中是否有与发言者语音匹配的声纹模型,当该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型时,执行步骤S204。当声纹资料库中存储有与发言者语音对应的声纹模型时,直接执行步骤S205。步骤S204中,声纹模型建立模块350根据所提取的该发言者的语音特征建立该发言者的声纹模型,并将使用者输入的该发言者的个人信息与发言者的声纹模型进行关联。步骤S205中,档案生成模块340根据该声纹模型获取该声纹模型对应的发言者的个人信息,记录发言者的发言时间,并获取发言者的语音在存储单元20中的地址,根据以上信息建立一个索引文件并将索引文件存储于存储单元20中。
如图3所示,为该声纹资料库的建立流程图。步骤S301中,声音接收模块310接收用户的登记语音,并将该用户的登记语音存储至存储单元20中。步骤S302中,特征获取模块320从登记语音中提取出用户的语音特征。步骤S303中,声纹模型建立模块350根据所提取的用户的语音特征建立该用户的声纹模型,获取使用者输入的对应用户的个人信息,并将该用户的声纹模型及个人信息进行关联后存储至该声纹资料库中。

Claims (10)

1.一种电子记录装置,包括一输入单元,一存储单元以及一处理单元,该输入单元用于输入语音,其特征在于:
该存储单元中存储有声纹资料库,该声纹资料库存储用户的声纹模型和与用户的声纹模型相对应的个人信息,
该处理单元包括一声音接收模块,一特征获取模块,一语音识别模块以及一档案生成模块;
该声音接收模块用于接收通过输入单元输入的发言者语音,并将接收的语音存储至存储单元中;
该特征获取模块用于从发言语音中提取出语音特征;
该语音识别模块用于判断声纹资料库中是否有与发言者语音匹配的声纹模型;
该档案生成模块用于当声纹资料库中有与发言者语音匹配的声纹模型时,根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。
2.如权利要求1所述的电子记录装置,其特征在于:该特征获取模块通过梅尔倒频谱系数进行发言者的语音特征的提取。
3.如权利要求1所述的电子记录装置,其特征在于:该处理单元还包括一声纹模型建立模块,若该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型,则该声纹模型建立模块根据所提取的该发言者的语音特征建立该发言者的声纹模型,并将该发言者的个人信息与发言者的声纹模型进行关联,该档案生成模块根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。
4.如权利要求1所述的电子记录装置,其特征在于:该声纹模型建立模块通过高斯混合模型进行声纹模型的建立。
5.如权利要求1所述的电子记录装置,其特征在于,该声纹资料库的建立过程如下:
声音接收模块接收用户的登记语音,并将该用户的登记语音存储至存储单元中;特征获取模块从登记语音中提取出用户的语音特征;声纹模型建立模块根据所提取的用户的语音特征建立该用户的声纹模型,获取对应的用户的个人信息,并将用户的声纹模型及个人信息进行关联后并存储至该声纹资料库中。
6.一种用于电子记录装置的电子记录方法,该电子记录装置包括一输入单元和一存储单元,该输入单元用于输入语音,该存储单元中存储有声纹资料库,该声纹资料库存储用户的声纹模型以及与声纹模型对应的用户的个人信息,其特征在于,该方法包括:
接收通过输入单元输入的发言者语音,将接收的语音存储至存储单元中;
从发言者语音中提取出语音特征;
判断声纹资料库中是否有与发言者语音匹配的声纹模型;
当声纹资料库中有与发言者语音匹配的声纹模型时,根据该声纹模型获取该声纹模型对应的发言者的个人信息,并获取发言者的语音在存储单元中的地址建立一个索引文件。
7.如权利要求6所述的电子记录方法,其特征在于:该发言者语音特征的提取是通过梅尔倒频谱系数进行提取。
8.如权利要求6所述的电子记录方法,其特征在于,该方法还包括:
当该声纹资料库中不存在与该发言者的声纹特征相匹配的声纹模型时,根据所提取的该发言者的语音特征建立该发言者的声纹模型,并将该发言者的个人信息与发言者的声纹模型进行关联。
9.如权利要求8所述的电子记录方法,其特征在于:该声纹模型的建立是通过高斯混合模型进行建立。
10.如权利要求6所述的电子记录方法,其特征在于,该声纹资料库的建立步骤包括:
接收用户的登记语音,并将该用户的登记语音存储至存储单元中;
从用户的登记语音中提取出用户的语音特征;
根据所提取的用户的语音特征建立该用户的声纹模型,获取对应的用户的个人信息,并将用户的声纹模型及个人信息进行关联后并存储至该声纹资料库中。
CN2010102450508A 2010-08-04 2010-08-04 电子记录装置及方法 Pending CN102347060A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102450508A CN102347060A (zh) 2010-08-04 2010-08-04 电子记录装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102450508A CN102347060A (zh) 2010-08-04 2010-08-04 电子记录装置及方法

Publications (1)

Publication Number Publication Date
CN102347060A true CN102347060A (zh) 2012-02-08

Family

ID=45545664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102450508A Pending CN102347060A (zh) 2010-08-04 2010-08-04 电子记录装置及方法

Country Status (1)

Country Link
CN (1) CN102347060A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103594086A (zh) * 2013-10-25 2014-02-19 鸿富锦精密工业(深圳)有限公司 语音处理系统、装置及方法
CN103793641A (zh) * 2014-02-27 2014-05-14 联想(北京)有限公司 一种信息处理方法、装置及电子设备
CN104376477A (zh) * 2013-08-16 2015-02-25 鸿富锦精密工业(深圳)有限公司 电子装置、广告推播系统及方法
CN105427857A (zh) * 2015-10-30 2016-03-23 华勤通讯技术有限公司 生成文字记录的方法及系统
CN105679357A (zh) * 2015-12-29 2016-06-15 惠州Tcl移动通信有限公司 一种移动终端及其基于声纹识别的录音方法
CN105719659A (zh) * 2016-02-03 2016-06-29 努比亚技术有限公司 基于声纹识别的录音文件分离方法及装置
CN106231236A (zh) * 2016-09-26 2016-12-14 江苏天安智联科技股份有限公司 4g网络车载会议系统
CN107274916A (zh) * 2012-12-05 2017-10-20 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置
WO2018094952A1 (zh) * 2016-11-22 2018-05-31 百度在线网络技术(北京)有限公司 一种内容推荐方法与装置
CN108346034A (zh) * 2018-02-02 2018-07-31 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108460535A (zh) * 2018-03-21 2018-08-28 浙江省工程咨询有限公司 一种工程监理中的工序交接监理方法
CN109325737A (zh) * 2018-09-17 2019-02-12 态度国际咨询管理(深圳)有限公司 一种企业智能虚拟助理系统及其方法
CN110047492A (zh) * 2019-03-08 2019-07-23 佛山市云米电器科技有限公司 一种通过声纹识别进行组网的方法及系统
CN110688640A (zh) * 2019-09-03 2020-01-14 深圳市声扬科技有限公司 一种基于声纹识别的数据处理方法、装置、系统及服务器
CN110797029A (zh) * 2019-10-24 2020-02-14 秒针信息技术有限公司 一种基于语音识别的在岗监测的方法、系统及设备
CN110875036A (zh) * 2019-11-11 2020-03-10 广州国音智能科技有限公司 语音分类方法、装置、设备及计算机可读存储介质
CN111179943A (zh) * 2019-10-30 2020-05-19 王东 一种对话辅助设备及获取信息的方法
CN111429914A (zh) * 2020-03-30 2020-07-17 招商局金融科技有限公司 麦克风控制方法、电子装置及计算机可读存储介质
CN112992154A (zh) * 2021-05-08 2021-06-18 北京远鉴信息技术有限公司 一种基于增强型声纹库的语音身份确定方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030236663A1 (en) * 2002-06-19 2003-12-25 Koninklijke Philips Electronics N.V. Mega speaker identification (ID) system and corresponding methods therefor
CN1764943A (zh) * 2003-03-25 2006-04-26 西门子公司 依赖于说话人识别语音的方法和语音识别系统
CN101740031A (zh) * 2010-01-21 2010-06-16 安徽科大讯飞信息科技股份有限公司 一种基于网络动态负载均衡的声纹识别系统及其识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030236663A1 (en) * 2002-06-19 2003-12-25 Koninklijke Philips Electronics N.V. Mega speaker identification (ID) system and corresponding methods therefor
CN1764943A (zh) * 2003-03-25 2006-04-26 西门子公司 依赖于说话人识别语音的方法和语音识别系统
CN101740031A (zh) * 2010-01-21 2010-06-16 安徽科大讯飞信息科技股份有限公司 一种基于网络动态负载均衡的声纹识别系统及其识别方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107274916A (zh) * 2012-12-05 2017-10-20 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置
CN104376477A (zh) * 2013-08-16 2015-02-25 鸿富锦精密工业(深圳)有限公司 电子装置、广告推播系统及方法
CN103594086B (zh) * 2013-10-25 2016-08-17 海菲曼(天津)科技有限公司 语音处理系统、装置及方法
CN103594086A (zh) * 2013-10-25 2014-02-19 鸿富锦精密工业(深圳)有限公司 语音处理系统、装置及方法
CN103793641A (zh) * 2014-02-27 2014-05-14 联想(北京)有限公司 一种信息处理方法、装置及电子设备
CN103793641B (zh) * 2014-02-27 2021-07-16 联想(北京)有限公司 一种信息处理方法、装置及电子设备
CN105427857B (zh) * 2015-10-30 2019-11-08 华勤通讯技术有限公司 生成文字记录的方法及系统
CN105427857A (zh) * 2015-10-30 2016-03-23 华勤通讯技术有限公司 生成文字记录的方法及系统
CN105679357A (zh) * 2015-12-29 2016-06-15 惠州Tcl移动通信有限公司 一种移动终端及其基于声纹识别的录音方法
CN105719659A (zh) * 2016-02-03 2016-06-29 努比亚技术有限公司 基于声纹识别的录音文件分离方法及装置
CN106231236A (zh) * 2016-09-26 2016-12-14 江苏天安智联科技股份有限公司 4g网络车载会议系统
WO2018094952A1 (zh) * 2016-11-22 2018-05-31 百度在线网络技术(北京)有限公司 一种内容推荐方法与装置
CN108346034A (zh) * 2018-02-02 2018-07-31 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108346034B (zh) * 2018-02-02 2021-10-15 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108460535A (zh) * 2018-03-21 2018-08-28 浙江省工程咨询有限公司 一种工程监理中的工序交接监理方法
CN109325737A (zh) * 2018-09-17 2019-02-12 态度国际咨询管理(深圳)有限公司 一种企业智能虚拟助理系统及其方法
CN110047492A (zh) * 2019-03-08 2019-07-23 佛山市云米电器科技有限公司 一种通过声纹识别进行组网的方法及系统
CN110688640A (zh) * 2019-09-03 2020-01-14 深圳市声扬科技有限公司 一种基于声纹识别的数据处理方法、装置、系统及服务器
CN110797029A (zh) * 2019-10-24 2020-02-14 秒针信息技术有限公司 一种基于语音识别的在岗监测的方法、系统及设备
CN111179943A (zh) * 2019-10-30 2020-05-19 王东 一种对话辅助设备及获取信息的方法
CN110875036A (zh) * 2019-11-11 2020-03-10 广州国音智能科技有限公司 语音分类方法、装置、设备及计算机可读存储介质
CN111429914A (zh) * 2020-03-30 2020-07-17 招商局金融科技有限公司 麦克风控制方法、电子装置及计算机可读存储介质
CN112992154A (zh) * 2021-05-08 2021-06-18 北京远鉴信息技术有限公司 一种基于增强型声纹库的语音身份确定方法及系统

Similar Documents

Publication Publication Date Title
CN102347060A (zh) 电子记录装置及方法
CN104078044B (zh) 移动终端及其录音搜索的方法和装置
US8086461B2 (en) System and method for tracking persons of interest via voiceprint
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
TWI413106B (zh) 電子記錄裝置及方法
US8909525B2 (en) Interactive voice recognition electronic device and method
CN105488227B (zh) 一种电子设备及其基于声纹特征处理音频文件的方法
EP2526507A1 (en) Meeting room participant recogniser
CN102404278A (zh) 一种基于声纹识别的点歌系统及其应用方法
CN107507626B (zh) 一种基于语音频谱融合特征的手机来源识别方法
CN103680497A (zh) 基于视频的语音识别系统及方法
CN109346057A (zh) 一种智能儿童玩具的语音处理系统
CN103391347A (zh) 一种自动录音的方法及装置
CN107945806B (zh) 基于声音特征的用户识别方法及装置
CN105376515A (zh) 用于视频通讯的通讯信息的呈现方法、装置及系统
CN101211615B (zh) 一种对特定人的语音进行自动录制的系统
CN103347070B (zh) 推送语音数据的方法、终端、服务器及系统
CN103049192A (zh) 一种应用程序开启方法及装置
CN105897686A (zh) 智能电视语音管理用户账号方法及智能电视
CN103871438A (zh) 留言录制及播放系统及方法
CN109830234A (zh) 一种智能车载信息交互设备及交互方法
KR102714096B1 (ko) 전자 장치 및 그 동작 방법
Zou et al. Automatic cell phone recognition from speech recordings
CN107767862B (zh) 语音数据处理方法、系统及存储介质
CN205595069U (zh) 具有远程录音和云端转写控制的记录装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120208