CN109474797B - 基于全景摄像头和麦克风阵列的会议转录系统 - Google Patents

基于全景摄像头和麦克风阵列的会议转录系统 Download PDF

Info

Publication number
CN109474797B
CN109474797B CN201910007767.XA CN201910007767A CN109474797B CN 109474797 B CN109474797 B CN 109474797B CN 201910007767 A CN201910007767 A CN 201910007767A CN 109474797 B CN109474797 B CN 109474797B
Authority
CN
China
Prior art keywords
module
processing module
electrically connected
sound
microphone array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910007767.XA
Other languages
English (en)
Other versions
CN109474797A (zh
Inventor
袁斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuaiyu Electronics Co ltd
Original Assignee
Beijing Kuaiyu Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuaiyu Electronics Co ltd filed Critical Beijing Kuaiyu Electronics Co ltd
Priority to CN201910007767.XA priority Critical patent/CN109474797B/zh
Publication of CN109474797A publication Critical patent/CN109474797A/zh
Application granted granted Critical
Publication of CN109474797B publication Critical patent/CN109474797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

本发明涉及庭审会议转录设备技术领域,尤其涉及一种基于全景摄像头和麦克风阵列的会议转录系统;包括多个全景摄像头、多个麦克风阵列、图像处理模块、声音处理模块以及音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频模块与存储模块电连接。本发明所公开的基于全景摄像头和麦克风阵列的会议转录系统,通过分别设置图像处理模块和声音处理模块,能够结合人脸检测和麦克风阵列定位算法,综合两者的优势,互补两者的缺点,实现会议中提高信噪比,寻找有效音源、且按身份进行转录。

Description

基于全景摄像头和麦克风阵列的会议转录系统
技术领域
本发明涉及庭审会议转录设备技术领域,尤其涉及一种基于全景摄像头和麦克风阵列的会议转录系统。
背景技术
现在法院、检察院庭审会议中普遍需要将实时的会议记录、转录做成庭审证据,这里面的记录包含了视频的记录、音频的记录,另外还包括转录成文字形式的类似口供证据的记录,对于这些庭审记录,如何在会议当中实时的记录、分类以及整理,最终形成有效的材料,减少工作人员的后期处理工作量,是非常重要的。这类的需求往往一般有下面几个具体要求:1、对于视频全程记录,包括法官、检察官、犯罪嫌疑人的录像;2、对于音频的记录,包括在确定的时间内确定说话人的身份,即一个时间内是谁在说,特别是法官和嫌疑人的话语需要身份确认区分,确定那段话是谁说的;3、对于文字的记录,庭审文本的记录形成,期望庭审结束,文字材料自动形成,包括时间点、发言人(讲述人)的名字、发言人的身份,发言人具体内容。然而,现有的庭审会议记录只是简单的记录庭审现场的语音和视频,后续还需人工进行整体、分类,费事费力。
因此,为了解决上述问题,急需发明一种新的基于全景摄像头和麦克风阵列的会议转录系统。
发明内容
本发明的目的在于:提供一种基于全景摄像头和麦克风阵列的会议转录系统,实现会议中按身份进行转录。
本发明提供了下述方案:
一种基于全景摄像头和麦克风阵列的会议转录系统,包括用于获取视频数据的一个全景摄像头、用于获取音频数据的多个麦克风组成的阵列、用于对视频数据进行预处理的图像处理模块、用于对音频数据进行预处理的声音处理模块以及用于对预处理后的视频数据和音频数据进行匹配的音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频模块与存储模块电连接。
优选地,所述图像处理模块包括用于对全景摄像头获取的视频数据进行校正处理的图像校正模块和用于进行人脸检测的人脸检测定位模块,所述图像校正模块与所述人脸检测定位模块电连接,所述图像校正模块分别与各全景摄像头电连接,所述人脸检测定位模块与所述音视频处理模块电连接。
优选地,所述声音处理模块包括声源定位模块和有效声源提取模块,所述声源定位模块和所述有效声源提取模块电连接,所述声源定位模块分别与各麦克风阵列电连接,所述有效声源提取模块与所述音视频处理模块电连接。
优选地,所述音视频处理模块包括人物声音匹配模块和图像声音对齐矫正剪辑模块,所述人物声音匹配模块和所述图像声音对齐矫正剪辑模块电连接,所述人物声音匹配模块分别与所述人脸检测定位模块和所述有效声源提取模块电连接,所述图像声音对齐矫正剪辑模块与所述存储模块电连接。
优选地,所述存储模块包括视频存储单元和文本编辑存储单元,所述视频存储单元和所述文本编辑存储单元分别与所述图像声音对齐矫正剪辑模块电连接。
优选地,所述图像处理模块采用MCU。
优选地,所述声音处理模块采用MCU。
优选地,所述音视频处理模块采用MCU。
优选地,所述存储模块采用RAID高速存储硬盘【正确】。
优选地,所述麦克风阵列采用自适应降噪麦克风阵列【正确】。
本发明产生的有益效果:
1、本发明所公开的基于全景摄像头和麦克风阵列的会议转录系统,包括用于获取视频数据的多个全景摄像头、用于获取音频数据的多个麦克风阵列、用于对视频数据进行预处理的图像处理模块、用于对音频数据进行预处理的声音处理模块以及用于对预处理后的视频数据和音频数据进行匹配的音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频模块与存储模块电连接;通过分别设置图像处理模块和声音处理模块,能够结合人脸检测和麦克风阵列定位算法,综合两者的优势,互补两者的缺点,实现会议中按身份进行转录;
2、所述图像处理模块包括用于对全景摄像头获取的视频数据进行校正处理的图像校正模块和用于进行人脸检测的人脸检测定位模块,所述图像校正模块与所述人脸检测定位模块电连接,所述图像校正模块分别与各全景摄像头电连接,所述人脸检测定位模块与所述音视频处理模块电连接;通过设置所述图像校正模块与所述人脸检测定位模块,在进行处理时只需要人脸检测定位算法,不需要人脸识别算法,不需要耗资源的模型库来实现,识别快速高效;
3、所述声音处理模块包括声源定位模块和有效声源提取模块,所述声源定位模块和所述有效声源提取模块电连接,所述声源定位模块分别与各麦克风阵列电连接,所述有效声源提取模块与所述音视频处理模块电连接;通过设置声源定位模块和有效声源提取模块,只需要定位算法,不需要声音分类算法,较为高效,易于前端实现。
附图说明
图1为本发明的基于全景摄像头和麦克风阵列的会议转录系统的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
参见图1所示,一种基于全景摄像头和麦克风阵列的会议转录系统,包括用于获取视频数据的多个全景摄像头、用于获取音频数据的多个麦克风阵列、用于对视频数据进行预处理的图像处理模块、用于对音频数据进行预处理的声音处理模块以及用于对预处理后的视频数据和音频数据进行匹配的音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频模块与存储模块电连接。所述图像处理模块包括用于对全景摄像头获取的视频数据进行校正处理的图像校正模块和用于进行人脸检测的人脸检测定位模块,所述图像校正模块与所述人脸检测定位模块电连接,所述图像校正模块分别与各全景摄像头电连接,所述人脸检测定位模块与所述音视频处理模块电连接。所述声音处理模块包括声源定位模块和有效声源提取模块,所述声源定位模块和所述有效声源提取模块电连接,所述声源定位模块分别与各麦克风阵列电连接,所述有效声源提取模块与所述音视频处理模块电连接。所述音视频处理模块包括人物声音匹配模块和图像声音对齐矫正剪辑模块,所述人物声音匹配模块和所述图像声音对齐矫正剪辑模块电连接,所述人物声音匹配模块分别与所述人脸检测定位模块和所述有效声源提取模块电连接,所述图像声音对齐矫正剪辑模块与所述存储模块电连接。所述存储模块包括视频存储单元和文本编辑存储单元,所述视频存储单元和所述文本编辑存储单元分别与所述图像声音对齐矫正剪辑模块电连接。
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统,所述图像处理模块采用MCU。所述声音处理模块采用MCU。所述音视频处理模块采用MCU。图像和声音处理模块都放在一个MCU里面,型号是:ARM Cortex-A9多核处理器,实际中,我们采用三个CPU的核来进行人脸的图像处理,一个核专门做声音处理。所述存储模块采用RAID高速存储硬盘。所述麦克风阵列采用自适应降噪麦克风阵列。
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统,包括用于获取视频数据的多个全景摄像头、用于获取音频数据的多个麦克风阵列、用于对视频数据进行预处理的图像处理模块、用于对音频数据进行预处理的声音处理模块以及用于对预处理后的视频数据和音频数据进行匹配的音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频模块与存储模块电连接;通过分别设置图像处理模块和声音处理模块,能够结合人脸检测和麦克风阵列定位算法,综合两者的优势,互补两者的缺点,实现会议中按身份进行转录;
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统,所述图像处理模块包括用于对全景摄像头获取的视频数据进行校正处理的图像校正模块和用于进行人脸检测的人脸检测定位模块,所述图像校正模块与所述人脸检测定位模块电连接,所述图像校正模块分别与各全景摄像头电连接,所述人脸检测定位模块与所述音视频处理模块电连接;通过设置所述图像校正模块与所述人脸检测定位模块,在进行处理时只需要人脸检测定位算法,不需要人脸识别算法,不需要耗资源的模型库来实现,识别快速高效;
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统,所述声音处理模块包括声源定位模块和有效声源提取模块,所述声源定位模块和所述有效声源提取模块电连接,所述声源定位模块分别与各麦克风阵列电连接,所述有效声源提取模块与所述音视频处理模块电连接;通过设置声源定位模块和有效声源提取模块,只需要定位算法,不需要声音分类算法,较为高效,适用于前端实现。
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统的原理及处理过程为:全景摄像头部分采用三个150°广角的摄像头,摄像头之间有相互重叠的部分,三个摄像头单元夹角为120°,经过图像校正拼接可以获得全景效果;经过人脸检测,能够将每个人脸的中心位置区分开来;麦克风阵列使用了三个mic的,采用DOA(位置估计算法)取两个备选音源位置,采用的算法是SRP-PHAT;大概拾取到设备周围三米以内会议参加者,它需要分辨的角度是15度(假定一个会议者的占据座位的宽度是75cm),这个对于3个mic的阵列是可以达到的。我们可以大概按照15°角度的分辨区间来区分,落在一个区间的,可以认为是同一个人发声,同时确定他的位置,这种考虑主要是结合摄像头人脸检测和阵列定位的现存不足和各自的优势:采用的是人脸检测而非人脸识别,人脸检测需要的算法复杂度没有那么高,不需要很大的模型,我们最后用说话人的位置(比如角度信息)来给说话人做一个ID号,后面在庭审记录中,只要替换对应的与会者身份或者名字就可以了;麦克风阵列和定位算法受到阵列的尺寸和单元个数的影响,不可能做非常精确的定位,你比如下面的这种庭审中,两个审讯人坐的位置相对比较接近,如果只用阵列,是非常难定位是左边还是右边的审问官在审问,如果结合人脸位置,我们就可以调整srp值的阈值使得DOA的判断结果更为准确;阵列只是提供DOA(位置估计)算法和指向性拾音,并不对声音做分类判断,基于现在的人声和其他噪声的分类判断算法还不是能做的非常精确,所以引入人脸检测做辅助结合判断,比如现在的会议室,很多地方都配有电脑,扫描仪器,这些仪器也发出来噪声,这些噪声会干扰DOA的对位置的估计。但引入人脸检测,问题就非常好解决了。对于同时有三个人发声的情况我们将忽略,这种一般都是大家一起鼓掌,或者一起大笑造成的,这种做文字转录成文本也没有意义。
本实施例中所述基于全景摄像头和麦克风阵列的会议转录系统,结合人脸检测和麦克风阵列定位算法,综合两者的优势,互补两者的缺点,使得会议中按身份做转录成为可能;只需要定位算法,不需要声音分类算法,较为高效,适用于前端实现;只需要人脸检测定位算法,不需要人脸识别算法,不需要耗资源的模型库来实现。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种基于全景摄像头和麦克风阵列的会议转录系统,其特征在于:包括用于获取视频数据的多个全景摄像头、用于获取音频数据的多个麦克风阵列、用于对视频数据进行预处理的图像处理模块、用于对音频数据进行预处理的声音处理模块以及用于对预处理后的视频数据和音频数据进行匹配的音视频处理模块,各所述全景摄像头分别与所述图像处理模块电连接,各所述麦克风阵列分别与所述声音处理模块电连接,所述声音处理模块和所述图像处理模块分别与所述音视频处理模块电连接,所述音视频处理模块与存储模块电连接;所述麦克风阵列采用自适应降噪麦克风阵列;所述存储模块采用RAID高速存储硬盘;
所述图像处理模块包括用于对全景摄像头获取的视频数据进行校正处理的图像校正模块和用于进行人脸检测的人脸检测定位模块,所述图像校正模块与所述人脸检测定位模块电连接,所述图像校正模块分别与各全景摄像头电连接,所述人脸检测定位模块与所述音视频处理模块电连接;所述人脸检测定位模块通过人脸检测定位算法将每个人脸的中心位置区分开来,对人物进行定位,得到人物位置;
所述声音处理模块包括声源定位模块和有效声源提取模块,所述声源定位模块和所述有效声源提取模块电连接,所述声源定位模块分别与各麦克风阵列电连接,所述有效声源提取模块与所述音视频处理模块电连接;所述声源定位模块通过麦克风阵列定位算法确定说话人的位置,得到声音位置;
所述音视频处理模块包括人物声音匹配模块和图像声音对齐矫正剪辑模块,所述人物声音匹配模块和所述图像声音对齐矫正剪辑模块电连接,所述人物声音匹配模块分别与所述人脸检测定位模块和所述有效声源提取模块电连接,所述图像声音对齐矫正剪辑模块与所述存储模块电连接;所述人物声音匹配模块用于对预处理后的视频数据及音频数据进行匹配,将人脸检测定位算法和麦克风阵列定位算法相结合。
2.根据权利要求1所述的基于全景摄像头和麦克风阵列的会议转录系统,其特征在于:所述存储模块包括视频存储单元和文本编辑存储单元,所述视频存储单元和所述文本编辑存储单元分别与所述图像声音对齐矫正剪辑模块电连接。
3.根据权利要求2所述的基于全景摄像头和麦克风阵列的会议转录系统,其特征在于:所述图像处理模块采用MCU。
4.根据权利要求3所述的基于全景摄像头和麦克风阵列的会议转录系统,其特征在于:所述声音处理模块采用MCU。
5.根据权利要求4所述的基于全景摄像头和麦克风阵列的会议转录系统,其特征在于:所述音视频处理模块采用MCU。
CN201910007767.XA 2019-01-04 2019-01-04 基于全景摄像头和麦克风阵列的会议转录系统 Active CN109474797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910007767.XA CN109474797B (zh) 2019-01-04 2019-01-04 基于全景摄像头和麦克风阵列的会议转录系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910007767.XA CN109474797B (zh) 2019-01-04 2019-01-04 基于全景摄像头和麦克风阵列的会议转录系统

Publications (2)

Publication Number Publication Date
CN109474797A CN109474797A (zh) 2019-03-15
CN109474797B true CN109474797B (zh) 2023-12-08

Family

ID=65677611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910007767.XA Active CN109474797B (zh) 2019-01-04 2019-01-04 基于全景摄像头和麦克风阵列的会议转录系统

Country Status (1)

Country Link
CN (1) CN109474797B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232925A (zh) * 2019-06-28 2019-09-13 百度在线网络技术(北京)有限公司 生成会议记录的方法、装置和会议终端
CN110620852A (zh) * 2019-09-29 2019-12-27 深圳市旗华科技有限公司 一种ai全景视频会议摄像头系统及工作方法
CN110933254B (zh) * 2019-12-11 2021-09-07 杭州叙简科技股份有限公司 一种基于图像分析的声音过滤系统及其声音过滤方法
CN111163281A (zh) * 2020-01-09 2020-05-15 北京中电慧声科技有限公司 一种基于语音跟踪的全景视频录制方法及装置
CN111263106B (zh) * 2020-02-25 2021-11-30 厦门亿联网络技术股份有限公司 一种视频会议的画面追踪方法及装置
CN111698402A (zh) * 2020-04-27 2020-09-22 杨方能 一种庭审速记工作的辅助装置
CN114666454A (zh) * 2020-12-23 2022-06-24 沈阳新松机器人自动化股份有限公司 一种智能会议系统
CN113312985B (zh) * 2021-05-10 2023-05-26 中国地质大学(武汉) 一种视听双模态的360度全方位说话人定位方法
CN115331688A (zh) * 2022-08-10 2022-11-11 思必驰科技股份有限公司 音频降噪方法及电子设备和存储介质
CN116489502B (zh) * 2023-05-12 2023-10-31 深圳星河创意科技开发有限公司 基于ai摄像头拓展坞的远程会议方法与ai摄像头拓展坞

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684415A (zh) * 2013-04-04 2016-06-15 大卫·安格莱利虚拟意念公司 球面全景视频拍摄系统
CN105681920A (zh) * 2015-12-30 2016-06-15 深圳市鹰硕音频科技有限公司 一种具有语音识别功能的网络教学方法及系统
CN105915798A (zh) * 2016-06-02 2016-08-31 北京小米移动软件有限公司 视频会议中摄像头的控制方法和控制装置
CN106027919A (zh) * 2016-06-30 2016-10-12 北京和兴宏图科技有限公司 摄像机
CN207443029U (zh) * 2017-11-02 2018-06-01 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备
CN108259801A (zh) * 2018-01-19 2018-07-06 广州视源电子科技股份有限公司 音视频数据显示方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684415A (zh) * 2013-04-04 2016-06-15 大卫·安格莱利虚拟意念公司 球面全景视频拍摄系统
CN105681920A (zh) * 2015-12-30 2016-06-15 深圳市鹰硕音频科技有限公司 一种具有语音识别功能的网络教学方法及系统
CN105915798A (zh) * 2016-06-02 2016-08-31 北京小米移动软件有限公司 视频会议中摄像头的控制方法和控制装置
CN106027919A (zh) * 2016-06-30 2016-10-12 北京和兴宏图科技有限公司 摄像机
CN207443029U (zh) * 2017-11-02 2018-06-01 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备
CN108259801A (zh) * 2018-01-19 2018-07-06 广州视源电子科技股份有限公司 音视频数据显示方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109474797A (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
CN109474797B (zh) 基于全景摄像头和麦克风阵列的会议转录系统
Yoshioka et al. Advances in online audio-visual meeting transcription
CN109873973B (zh) 会议终端和会议系统
US10122972B2 (en) System and method for localizing a talker using audio and video information
Donley et al. Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments
US20190215464A1 (en) Systems and methods for decomposing a video stream into face streams
JP2000125274A (ja) 会議内容に索引付けを行うための方法と装置
CN103581608A (zh) 发言人检测系统、发言人检测方法和音频/视频会议系统
CN113203988B (zh) 声源定位方法及装置
CN107820037B (zh) 音频信号、图像处理的方法、装置和系统
US10922570B1 (en) Entering of human face information into database
JP2020187346A (ja) オーディオビジュアルデータに基づく話者ダイアライゼーション方法および装置
WO2014040429A1 (zh) 视频会议提醒方法、装置和视频会议系统
TWM594202U (zh) 發言人員音訊追蹤系統
TWM594323U (zh) 智能會議記錄系統
JP4451892B2 (ja) 映像再生装置、映像再生方法、及び映像再生プログラム
CN114762039A (zh) 一种会议数据处理方法及相关设备
CN114666454A (zh) 一种智能会议系统
CN113611308A (zh) 一种语音识别方法、装置、系统、服务器及存储介质
CN211788155U (zh) 智能会议记录系统
CN117854507A (zh) 语音识别方法、装置、电子设备及存储介质
CN112348493A (zh) 一种智能会议记录系统及方法
CN107438169A (zh) 定位系统、预定位方法以及实时定位方法
CN110348011A (zh) 一种无纸化会议展示对象确定方法、装置和存储介质
Ronzhin et al. Audiovisual speaker localization in medium smart meeting room

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant