CN111048093A - 会议音箱及会议记录方法、设备、系统和计算机存储介质 - Google Patents

会议音箱及会议记录方法、设备、系统和计算机存储介质 Download PDF

Info

Publication number
CN111048093A
CN111048093A CN201811191316.8A CN201811191316A CN111048093A CN 111048093 A CN111048093 A CN 111048093A CN 201811191316 A CN201811191316 A CN 201811191316A CN 111048093 A CN111048093 A CN 111048093A
Authority
CN
China
Prior art keywords
conference
audio data
text
voice
conference recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811191316.8A
Other languages
English (en)
Inventor
肖昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Haiyi Zhixin Technology Co Ltd
Original Assignee
Shenzhen Haiyi Zhixin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Haiyi Zhixin Technology Co Ltd filed Critical Shenzhen Haiyi Zhixin Technology Co Ltd
Priority to CN201811191316.8A priority Critical patent/CN111048093A/zh
Priority to PCT/CN2019/083243 priority patent/WO2020073633A1/zh
Priority to US16/568,179 priority patent/US20200118569A1/en
Publication of CN111048093A publication Critical patent/CN111048093A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/50Aspects of automatic or semi-automatic exchanges related to audio conference
    • H04M2203/509Microphone arrays

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供了一种会议音箱及会议记录方法、设备、系统和计算机存储介质。该会议记录方法包括:接收由所述会议音箱复制的会议音频数据;将所述会议音频数据发送至语音转文字服务器进行文字转换;接收来自所述语音转文字服务器的文字。由此可见,本发明实施例中的会议音箱及会议记录方法、设备、系统和计算机存储介质能够方便地实现会议语音的文字转换,实现自动会议记录,提高了工作效率,降低了资源浪费。

Description

会议音箱及会议记录方法、设备、系统和计算机存储介质
技术领域
本发明涉及会议记录技术领域,尤其涉及一种会议音箱及会议记录方法、设备、系统和计算机存储介质。
背景技术
当前随着商业和信息技术的发展,商业上利用信息技术的交流越来越频繁。通过语音会议软件(例如Skype等软件)或会议系统进行双方或多方电话/视频会议成为一种常用的交流方式。在会议的过程中,很多情况下需要作会议纪要以便形成文件达成会议决定及共识。在这种场景中,会议纪要一般需要人工记录或是录音记录,然后再进行人工转写。然而这种方式大大降低了信息时代的工作效率,且对资源形成了大量的浪费,不利于环保及绿色办公。
因此提出一种会议音箱及会议记录方法、设备、系统和计算机存储介质,以解决上述问题。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种会议音箱及会议记录方法、设备、系统和计算机存储介质,其能够利用语音转文字的服务器方便地实现会议语音的文字转换以实现自动会议记录,提高了工作效率降低了资源浪费。
根据本发明的第一方面,提供了一种会议音箱,所述会议音箱能够与会议记录装置进行通信,该会议音箱包括:
音频采集模块,所述音频采集模块用于采集会议音频数据;
音频播放模块,所述音频播放模块用于播放会议音频数据;
处理器,所述处理器配置为对所述会议音频数据进行处理,并复制经过处理的所述会议音频数据;
通信接口,所述通信接口配置为将经过处理的所述会议音频数据发送至所述会议记录装置,
其中,所述会议记录装置配置为将经过处理的所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自所述语音转文字服务器的文字以实现会议记录。
在本发明一个实施例中,所述会议音箱与所述会议记录装置通过蓝牙、Wifi或USB进行通信。
根据本发明的第二方面,提供了一种使用根据本发明第一方面的会议音箱的会议记录方法,包括:
接收由所述会议音箱复制的会议音频数据;
将所述会议音频数据发送至语音转文字服务器进行文字转换;
接收来自所述语音转文字服务器的文字。
在本发明一个实施例中,对所述文字进行处理,所述处理包括文字纠错和/或排版。
在本发明一个实施例中,所述处理还包括:对所述文字进行关键字或关键段提取,以获取会议重点内容。
在本发明一个实施例中,还包括:对所述会议音频数据进行分析,以对不同会议参与人的音频数据进行区分和标注。
在本发明一个实施例中,还包括:对不同会议参与人的音频数据转换后的文字进行标注。
根据本发明的第三方面,提供了一种会议记录设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据本发明第二方面所述的会议记录方法。
根据本发明的第四方面,提供了一种会议记录系统,包括:
会议音响,所述会议音响用于采集和播放会议音频数据,以及对所述会议音频数据进行复制;
会议记录设备,所述会议记录设备配置为从所述会议音响接收所述会议音频数据,并将所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自语音转文字服务器的文字以实现会议记录。
根据本发明的第五方面,提供了一种计算机存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据本发明第二方面所述的会议记录方法。
根据本发明的会议音箱及会议记录方法、设备、系统和计算机存储介质,通过将会议音箱复制的会议音频数据上传至语音转文字服务器进行文字转换,利用语音转文字的服务器能够方便地实现会议语音的文字转换以实现会议语音的自动转换和记录,提高了工作效率,降低了资源浪费。
附图说明
以下将结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来对本发明实施例进行进一步的解释,该附图构成说明书的一部分,且与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的附图标记通常代表相同或相似的部件或步骤。
图1是根据本发明一实施例的会议音箱的示意性框图;
图2是根据本发明一实施例的一种会议记录方法的示意性流程图;
图3是根据本发明一实施例的会议记录单元的一个示意性框图;
图4是根据本发明一实施例的会议记录设备的一个示意性框图;
图5是根据本发明实施例的会议记录系统的一个使用情形示意图;
图6是根据本发明实施例的会议记录系统的另一个使用情形示意图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施例可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施例发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,部件、元件等的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
图1是根据本发明一实施例的会议音箱的示意性框图。如图1所示,本实施例提供的会议音箱100包括音频采集模块101、音频播放模块102、处理器103、通信接口104和存储模块105。
音频采集模块101用于采集会议音频数据。示例性地,音频采集模块101可以为各种麦克风或麦克风阵列及相应的电路,其可以包括一个或多个麦克风。并且,当包括多个麦克风时,该多个麦克风布置在会议音箱的不同位置,以实现对不同方向的音频采集或从不同方向进行音频采集,从而可以提高音频采集质量以及便于后续对采集的会议音频数据的处理,例如进行降噪处理、或者进行方位权重判断和加权处理等。
音频播放模块102用于播放会议音频数据。示例性地,音频播放模块102可以为各种扬声器单位及相应的电路,且扬声器单元的数量可以为一个或多个。音频播放模块102可以播放从其它设备,例如会议系统或其它运行语音会议软件的设备接收的会议音频数据。应当理解,在本实施例中,会议音频数据包括参与会议的各方所形成的会议音频数据,即包括会议音箱采集的会议音频数据,也包括传输至会议音箱的其它会议参与方的会议音频数据。
处理器103配置为对所述会议音频数据进行处理。示例性地,会议音频数据的处理包括波束成形处理、降噪处理、增强放大处理等各种需要的音频数据处理。此外,所述处理器103还对经过会议音箱的会议音频数据进行复制,复制操作可以在会议音频数据处理之前,也可以在会议音频数据处理之后。优选地,处理器103在完成对所述会议音频数据的处理后,对其进行复制。处理器103能够以若干不同的方式来实施。例如,处理器201能够包括一个或多个嵌入式处理器、处理器核心、微型处理器、逻辑电路、硬件有限状态机(FSM)、数字信号处理器(DSP)或它们的组合。
通信接口104用于实现会议音箱与其他设备,例如会议记录装置/设备、会议装置/系统的通信和数据传输。例如,在本实施例中,通信接口104配置为接收和发送会议音频数据,以及为将经过处理的所述会议音频数据发送至所述会议记录装置。通信接口104能够包括一个或多个有线或无线通信接口。例如,通信接口网络接口卡、无线调制解调器或有线调制解调器。在一种应用中,通信接口104能够是WiFi调制解调器。在另一些应用中,通信接口104能够是3G调制解调器、4G调制解调器、LTE调制解调器、蓝牙组件、射频接收器、USB接口、天线或它们的组合。
存储模块105能够存储软件、数据、日志或它们的组合。示例性地,存储模块105配置为用于存储所述处理器103复制的所述会议音频数据。存储模块105能够是内部存储器或者外部存储器。例如,存储模块105能够是易失性存储器或非易失性存储器,诸如非易失性随机存取存储器(NVRAM)、闪存、磁盘存储器的非易失性存储器,或者是诸如静态随机存取存储器(SRAM)的易失性存储器。
进一步地,本实施例提供的会议音箱够与会议记录装置进行通信,所述会议记录装置配置为将经过处理的所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自所述语音转文字服务器的文字以实现会议记录。
示例性地,所述会议音箱100与所述会议记录装置通过蓝牙、Wifi或USB进行通信。
根据本实施例的会议音箱,通过与会议记录装置通信,可以将复制的会议音频数据发送至会议记录装置,以便会议记录装置进行后续处理以实现会议记录。
本发明还提供一种使用根据本实施例的会议音箱的会议记录方法。下面结合图2对根据本发明实施例的会议记录方法进行描述。图2是根据本发明一实施例的一种会议记录方法的示意性流程图。图2所述的会议记录方法可以包括:
步骤S201,接收由所述会议音箱复制的会议音频数据。示例性地,通过与会议音箱进行通信连接,来接收由所述会议音箱复制的会议音频数据。示例性地,所述会议音箱复制的会议音频数据通过SPP(蓝牙串行端口协议)、USB(通用串行总线)或Wifi(无线保真)进行传输。
步骤S202,将所述会议音频数据发送至语音转文字服务器进行文字转换。
当接收到所述会议音箱复制的会议音频数据后,将所述会议音频数据发送至语音转文字服务器进行文字转换。示例性地,可以通过有线网络、无线网络、移动通信网络等各种网络通信方式将将所述会议音频数据发送至语音转文字服务器进行文字转换。示例性地,所述语音转文字服务器可以在本地部署,也可以在云端部署。示例性地,所述语音转文字服务器基于ASR(自动语音识别技术)引擎实现。通过所述语音转文字服务器可以将所述会议音箱复制的会议音频数据转换为文字。进一步地,所述语音转文字服务器还可以对转换后的文字进行处理,例如纠错、排版、标注(重点)等。
步骤S203,接收来自所述语音转文字服务器的文字。通过与语音转文字服务器的通信接收来自语音转文字服务器的文字。
步骤S204,对所述文字进行处理。
作为示例,所述处理包括文字纠错和/或排版。所述文字纠错和/或排版可以基于本地文字处理引擎或第三方文字处理引擎实现。作为另一示例,所述处理还可以为对所述文字进行关键字或关键段提取,以获取会议重点内容。所述关键字或关键段可以通过人为和/或自动操作实现,例如关键字可以由用户输入,而关键字和关键段的提取为自动进行。
并且,应当理解,当所述语音转文字服务器实施了部分文字处理后,例如排版或纠错,步骤S204可以不包括这些处理,例如仅执行对所述文字进行关键字或关键段提取,以获取会议重点内容的处理。当然,也可以再次执行文字纠错和/或排版。
进一步地,根据本实施例的会议记录方法还可以包括对所述会议音频数据进行分析,以对不同会议参与人的音频数据进行区分和标注,以及对不同会议参与人的音频数据转换后的文字进行标注。示例性地,通过对所述音频数据进行声纹、声频等分析,可以对所述会议音频数据中每一段音频是否属于同一会议参与人进行区别,然后对每一段音频进行标注,当该段音频转换成文字后,同样对该段文字进行标注,从而便于用户区分不同会议参与人的发言。应当理解,该处理可以在实施会议记录方法的设备实现,也可以由语音转文字服务器实现。
进一步地,根据本实施例的会议记录方法还可以包括实时显示来自所述语音转文字服务器的文字。当接收所述语音转文字服务器的文字后,可以对其进行实时显示。示例性地,可以将来自所述语音转文字服务器的文字显示在显示单元的全部或部分区域,以便会议参与方查看转换后的文字和/或对转换后的文字进行编辑、纠错等。
进一步地,根据本实施例的会议记录方法还可以包括对来自所述语音转文字服务器的文字进行存储,该存储操作可以在与实时显示同时进行,也可以在实时显示前或后进行,并且还可以在会议参与方对对转换后的文字进行编辑、纠错等操作后进行存储。
由此可见,根据本实施例的会议记录方法,通过接收所述会议音箱复制的会议音频数据,并将其传输至语音转文字服务器进行文字转换并接收转换后的文字从而实现会议音频数据的自动转换和记录,大大提高了工作效率,降低了资源浪费。
图3是根据本发明一实施例的会议记录单元的一个示意性框图。图3所示的会议记录装置300包括第一接收模块301、发送模块302、第二接收模块303和处理模块304。
第一接收模块301用于接收由所述会议音箱复制的会议音频数据。所述第一接收模块301能够与会议音箱进行通信,从而接收由所述会议音箱复制的会议音频数据。示例性地,所述会议音箱复制的会议音频数据通过SPP、USB或Wifi进行传输。
发送模块302用于将所述会议音频数据发送至语音转文字服务器进行文字转换。发送模块302通过与语音转文字服务器进行通信,从而将所述会议音频数据发送至语音转文字服务器进行文字转换。示例性地,所述语音转文字服务器可以在本地部署,也可以在云端部署。示例性地,所述语音转文字服务器基于ASR(自动语音识别技术)引擎实现。通过所述语音转文字服务器可以将所述会议音箱复制的会议音频数据转换为文字。进一步地,所述语音转文字服务器还可以对转换后的文字进行处理,例如纠错、排版、标注(重点)等。
第二接收模块303用于接收来自所述语音转文字服务器的文字。第二接收模块303可以通过与语音转文字服务器进行通信,从而接收来自所述语音转文字服务器的文字。
处理模块304用于对从语音转文字服务器接收的文字进行处理。作为示例,所述处理包括文字纠错和/或排版。所述文字纠错和/或排版可以基于本地文字处理引擎或第三方文字处理引擎实现。作为另一示例,所述处理还可以为对所述文字进行关键字或关键段提取,以获取会议重点内容。所述关键字或关键段可以通过人为和/或自动操作实现,例如关键字可以由用户输入,而关键字和关键段的提取为自动进行。
并且,应当理解,当所述语音转文字服务器实施了部分文字处理后,例如排版或纠错,处理模块304可以不包括这些处理,例如仅执行对所述文字进行关键字或关键段提取,以获取会议重点内容的处理。当然,处理模块304也可以再次执行文字纠错和/或排版。
进一步地,处理模块304还可以用于对所述会议音频数据进行分析,以对不同会议参与人的音频数据进行区分和标注,以及对不同会议参与人的音频数据转换后的文字进行标注。示例性地,通过对所述音频数据进行声纹、声频等分析,可以对所述会议音频数据中每一段音频是否属于同一会议参与人进行区别,然后对每一段音频进行标注,当该段音频转换成文字后,同样对该段文字进行标注,从而便于用户区分不同会议参与人的发言。
图3所示的会议记录单元能够用于实现前述图2所示的方法,为避免重复,这里不再赘述。
由此可见,根据本实施例的会议记录单元,通过接收所述会议音箱复制的会议音频数据,并将其传输至语音转文字服务器进行文字转换并接收转换后的文字从而实现会议音频数据的自动转换和记录,大大提高了工作效率,降低了资源浪费。
图4是根据本发明一实施例的会议记录设备的一个示意性框图。图4所示的会议记录设备400包括处理器401、存储器402、通信接口403和显示器。
处理器401能够包括一个或多个中央处理单元(CPU)、图形处理单元(GPU)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或它们的组合。处理器401能够执行存储在存储器402中的软件或计算机可读指令或程序代码以执行本文描述的会议记录方法或会议记录装置的各模块及其操作。处理器401能够以若干不同的方式来实施。例如,处理器401能够包括一个或多个嵌入式处理器、处理器核心、微型处理器、逻辑电路、硬件有限状态机(FSM)、数字信号处理器(DSP)或它们的组合。
存储器402能够存储软件、数据、日志或它们的组合,以及各种能被处理器401执行或应用的各种软件或计算机程序。存储器402能够是内部存储器或者外部存储器。例如,存储器能够是易失性存储器或非易失性存储器,诸如非易失性随机存取存储器(NVRAM)、闪存、磁盘存储器的非易失性存储器,或者是诸如静态随机存取存储器(SRAM)的易失性存储器。
通信接口403用于实现与其它设备的通信,例如实现与会议音箱或语音转文字服务器的通信,从而与诸如会议音箱或语音转文字服务器的其它设备进行数据传输等通信。示例性地,在本实施例中,通信接口可以配置为接收由所述会议音箱复制的会议音频数据;将所述会议音频数据发送至语音转文字服务器进行文字转换;以及接收来自所述语音转文字服务器的文字。通信接口403能够包括一个或多个有线或无线通信接口。例如,通信接口网络接口卡、无线调制解调器或有线调制解调器。在一种应用中,通信接口403能够是WiFi调制解调器。在另一些应用中,通信接口能够是3G调制解调器、4G调制解调器、LTE调制解调器、蓝牙组件、射频接收器、USB接口、天线或它们的组合。
显示器404可以为各种显示设备,其用于显示从语音转文字服务器接收的文字。
图4所示的会议记录设备能够用于实现前述图2所示的方法和/或图3所示的会议记录装置及其各组成模块,为避免重复,这里不再赘述。
另外,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序。当所述计算机程序由处理器执行时,可以实现前述图2所示的方法或图3所示的会议记录装置中的各组成模块。例如,所述计算机存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
另外,本发明实施例还提供了一种会议记录系统,其包括根据本发明实施例的会议音箱和会议记录设备,所述会议音响用于采集和播放会议音频数据,以及对所述会议音频数据进行复制;所述会议记录设备配置为从所述会议音响接收所述会议音频数据,并将所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自语音转文字服务器的文字以实现会议记录。当然该会议记录系统还可以包括语音转文字服务器,用于实现语音文字的转换。示例性地,会议记录设备实现为智能终端,例如智能手机或平板,或计算机,例如个人PC。语音转文字服务器可以实现为云服务器。
下面结合图5和图6对根据本发明实施的会议记录系统的使用情形进行描述。
图5是根据本发明实施例的会议记录系统的一个使用情形示意图。如图5所示,在本实施例中,会议记录系统包括会议音箱501、会议记录设备502和语音转文字服务器503。
会议音箱501可以实现会议音频数据的采集和播放,其包括例如麦克风阵列、扬声器、通信接口以及处理器等。作为示例,会议音箱501可以通过蓝牙实现与会议记录设备502的通信连接和数据传输。会议音箱501可以将经过其的会议音频数据进行复制,并发送至会议记录设备502。
会议记录设备502可以为包括存储器和处理器的各种电子设备。示例性地,在本实施例中,会议记录设备502为智能手机,其具备诸如蓝牙的无线通信功能。会议记录设备502可以运行其上存储的程序来实现前述图2所示的方法和/或图3所示的会议记录装置及其各组成模块。示例性地,在本实施例中,会议记录设备502运行其上的应用程序(APP)来实现图3所示的会议记录装置的功能。此外,会议记录设备502还可以运行其上存储的程序来实现语音会议功能,从而与其他可以实现语音会议的设备504进行语音会议。
语音转文字服务器503用于将会议记录设备502上传的会议音频数据转换为文字,再下发给会议记录设备502以实现会议音频数据的自动转换和记录。示例性地,在本实施例中,语音转文字服务器503为部署在云端的服务器,其可以通过有线或无线网络实现与会议记录设备502的通信和数据传输。示例性地,语音转文字服务器503为基于ASR引擎的服务器。
在图5所示的会议记录系统或会议记录设备使用情形中,会议记录设备502通过蓝牙与会议音箱501通信,其上运行的语音会议软件通过HFP协议实现与会议音箱501的会议语音数据传输,并且其上运行的用于实现会议记录的应用程序通过SPP来接收会议音箱501复制的会议音频数据,然后再其上传至语音转文字服务器503进行文字转换,然后接收转换后的文字并进行实时显示,以便会议参与方实现会议自动记录。
图6是根据本发明实施例的会议记录系统的另一个使用情形示意图。在本实施例中,会议记录系统包括会议音箱601、会议记录设备602和语音转文字服务器603。
会议音箱601可以实现会议音频数据的采集和播放,其包括例如麦克风阵列、扬声器、通信接口以及处理器等。作为示例,会议音箱601可以通过USB接口与会议记录设备602的通信连接和数据传输。会议音箱601可以将经过其的会议音频数据进行复制,并发送至会议记录设备602。
会议记录设备602可以为包括存储器和处理器的各种电子设备。示例性地,在本实施例中,会议记录设备602为电脑,例如使用windos或mac系统的各种PC,其具备USB连接功能。会议记录设备602可以运行其上存储的程序来实现前述图2所示的方法和/或图3所示的会议记录装置及其各组成模块。示例性地,在本实施例中,会议记录设备602运行其上的客户端来实现图3所示的会议记录装置的功能。此外,会议记录设备602还可以运行其上存储的程序来实现语音会议功能,从而与其他可以实现语音会议的设备604进行语音会议。
语音转文字服务器603用于将会议记录设备602上传的会议音频数据转换为文字,再下发给会议记录设备602以实现会议音频数据的自动转换和记录。示例性地,在本实施例中,语音转文字服务器603为部署在云端的服务器,其可以通过有线或无线网络实现与会议记录设备602的通信和数据传输。示例性地,语音转文字服务器603为基于ASR引擎的服务器。
在图6所示的会议记录系统或会议记录设备使用情形中,会议记录设备602通过USB与会议音箱601通信,其上运行的语音会议软件通过USB实现与会议音箱601的会议语音数据传输,并且其上运行的用于实现会议记录的客户端通过USB来接收会议音箱601复制的会议音频数据,然后再其上传至语音转文字服务器603进行文字转换,然后接收转换后的文字并进行实时显示,以便会议参与方实现会议自动记录。
应当理解,图5或图6所示的会议记录系统的使用情形仅是示例性的,例如会议记录设备不限于智能手机或PC,而可以是其它具备处理器和存储器的各种电子设备,例如平板电脑、各种音视频会议系统等。并且会议记录设备与会议音箱的通信也不限于蓝牙或USB,还可以为其它方式,例如wifi、移动通信(3G或4G等)以及其它合适的数据通信传输技术。
还应当理解,根据本发明实施例的会议记录系统不限于上述使用情形,例如也可以用于使用音视频会议系统进行会议的情形,此时不再是通过语音会议软件进行会议,也即图5或6中所示的会议记录设备仅用于会议记录。又例如,根据本发明实施例的会议记录系统也可以用于本地会议,即没有通过会议系统或语音会议软件参与会议的远程方,此时,会议音响用于采集和播放本地会议参与人的会议语音数据,并将该会议语音数据复制后发送至会议记录设备进行后续操作。根据本发明实施例的会议音箱及会议记录方法、设备、系统和计算机存储介质,通过将会议音箱复制的会议音频数据上传至语音转文字服务器进行文字转换,利用语音转文字的服务器能够方便地实现会议语音的文字转换以实现会议语音的自动转换和记录,提高了工作效率,降低了资源浪费。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种会议音箱,所述会议音箱能够与会议记录装置进行通信,其特征在于,包括:
音频采集模块,所述音频采集模块用于采集会议音频数据;
音频播放模块,所述音频播放模块用于播放会议音频数据;
处理器,所述处理器配置为对所述会议音频数据进行处理,并复制经过处理的所述会议音频数据;
通信接口,所述通信接口配置为将经过处理的所述会议音频数据发送至所述会议记录装置,
其中,所述会议记录装置配置为将经过处理的所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自所述语音转文字服务器的文字以实现会议记录。
2.根据权利要求1所述的会议音箱,其特征在于,所述会议音箱与所述会议记录装置通过蓝牙、Wifi或USB进行通信。
3.一种使用权利要求1或2所述的会议音箱的会议记录方法,其特征在于,包括:
接收由所述会议音箱复制的会议音频数据;
将所述会议音频数据发送至语音转文字服务器进行文字转换;
接收来自所述语音转文字服务器的文字。
4.根据权利要求3所述的会议记录方法,其特征在于,还包括:
对所述文字进行处理,所述处理包括文字纠错和/或排版。
5.根据权利要求4所述的会议记录方法,其特征在于,所述处理还包括:
对所述文字进行关键字或关键段提取,以获取会议重点内容。
6.根据权利要求3所述的会议记录方法,其特征在于,还包括:
对所述会议音频数据进行分析,以对不同会议参与人的音频数据进行区分和标注。
7.根据权利要求6所述的会议记录方法,其特征在于,还包括:
对不同会议参与人的音频数据转换后的文字进行标注。
8.一种会议记录设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求3-7中任一所述的会议记录方法。
9.一种会议记录系统,其特征在于,包括:
会议音响,所述会议音响用于采集和播放会议音频数据,以及对所述会议音频数据进行复制;
会议记录设备,所述会议记录设备配置为从所述会议音响接收所述会议音频数据,并将所述会议音频数据发送至语音转文字服务器进行文字转换,并接收来自语音转文字服务器的文字以实现会议记录。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求3至7中任一项所述的会议记录方法。
CN201811191316.8A 2018-10-12 2018-10-12 会议音箱及会议记录方法、设备、系统和计算机存储介质 Withdrawn CN111048093A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811191316.8A CN111048093A (zh) 2018-10-12 2018-10-12 会议音箱及会议记录方法、设备、系统和计算机存储介质
PCT/CN2019/083243 WO2020073633A1 (zh) 2018-10-12 2019-04-18 会议音箱及会议记录方法、设备、系统和计算机存储介质
US16/568,179 US20200118569A1 (en) 2018-10-12 2019-09-11 Conference sound box and conference recording method, apparatus, system and computer storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811191316.8A CN111048093A (zh) 2018-10-12 2018-10-12 会议音箱及会议记录方法、设备、系统和计算机存储介质

Publications (1)

Publication Number Publication Date
CN111048093A true CN111048093A (zh) 2020-04-21

Family

ID=70159789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811191316.8A Withdrawn CN111048093A (zh) 2018-10-12 2018-10-12 会议音箱及会议记录方法、设备、系统和计算机存储介质

Country Status (3)

Country Link
US (1) US20200118569A1 (zh)
CN (1) CN111048093A (zh)
WO (1) WO2020073633A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350834A (zh) * 2020-09-28 2021-02-09 深圳市奋达科技股份有限公司 一种ai语音带屏会议系统及方法
CN112651240A (zh) * 2020-12-30 2021-04-13 广东电力信息科技有限公司 业务会议信息处理系统、方法、电子设备及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201918314D0 (en) * 2019-12-12 2020-01-29 Issured Ltd MEA: connexus - a platform agnostic video interview platform that uses blockchain for retention of evidential integrity
CN112183107A (zh) * 2020-09-04 2021-01-05 华为技术有限公司 音频的处理方法和装置
CN112820292B (zh) * 2020-12-29 2023-07-18 平安银行股份有限公司 生成会议纪要的方法、装置、电子装置及存储介质
CN112786045B (zh) * 2021-01-04 2024-03-12 上海明略人工智能(集团)有限公司 用于会议记录的设备、服务器、方法及系统
CN116996337B (zh) * 2023-08-03 2024-01-26 恩平市新盈科电声科技有限公司 基于物联网及麦克风切换技术的会议数据管理系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100165071A1 (en) * 2007-05-16 2010-07-01 Yamaha Coporation Video conference device
CN105810207A (zh) * 2014-12-30 2016-07-27 富泰华工业(深圳)有限公司 会议记录装置及其自动生成会议记录的方法
CN105895134A (zh) * 2016-05-10 2016-08-24 安徽声讯信息技术有限公司 具有远程录音和云端转写控制的记录装置及其实现方法
CN106487531A (zh) * 2015-08-26 2017-03-08 重庆西线科技有限公司 一种具有自动纠错功能的语音自动记录方法
CN107610699A (zh) * 2017-09-06 2018-01-19 深圳金康特智能科技有限公司 一种具有会议记录功能的智能穿戴装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101587496A (zh) * 2008-05-21 2009-11-25 北京帮助在线信息技术有限公司 一种可由人工或系统自动进行会议记录的实现方法和设备
CN102436812B (zh) * 2011-11-01 2013-05-01 展讯通信(上海)有限公司 会议记录装置及利用该装置对会议进行记录的方法
CN104301557A (zh) * 2014-09-30 2015-01-21 成都英博联宇科技有限公司 一种带即时显示功能的智能会议系统
CN105810206A (zh) * 2014-12-30 2016-07-27 富泰华工业(深圳)有限公司 会议记录装置及其自动生成会议记录的方法
WO2017124294A1 (zh) * 2016-01-19 2017-07-27 王晓光 一种视频网络会议的会议记录方法及系统
CN106098065A (zh) * 2016-06-02 2016-11-09 安徽声讯信息技术有限公司 一种用于会议记录的语音速记装置
CN106057193A (zh) * 2016-07-13 2016-10-26 深圳市沃特沃德股份有限公司 基于电话会议的会议记录生成方法和装置
CN107911646B (zh) * 2016-09-30 2020-09-18 阿里巴巴集团控股有限公司 一种会议分享、生成会议记录的方法及装置
CN106600212B (zh) * 2016-11-24 2021-02-09 南京九致信息科技有限公司 会议记录系统及自动生成会议记录的方法
CN106802885A (zh) * 2016-12-06 2017-06-06 乐视控股(北京)有限公司 一种会议纪要自动记录方法、装置和电子设备
CN107689225B (zh) * 2017-09-29 2019-11-19 福建实达电脑设备有限公司 一种自动生成会议记录的方法
CN108335697A (zh) * 2018-01-29 2018-07-27 北京百度网讯科技有限公司 会议记录方法、装置、设备及计算机可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100165071A1 (en) * 2007-05-16 2010-07-01 Yamaha Coporation Video conference device
CN105810207A (zh) * 2014-12-30 2016-07-27 富泰华工业(深圳)有限公司 会议记录装置及其自动生成会议记录的方法
CN106487531A (zh) * 2015-08-26 2017-03-08 重庆西线科技有限公司 一种具有自动纠错功能的语音自动记录方法
CN105895134A (zh) * 2016-05-10 2016-08-24 安徽声讯信息技术有限公司 具有远程录音和云端转写控制的记录装置及其实现方法
CN107610699A (zh) * 2017-09-06 2018-01-19 深圳金康特智能科技有限公司 一种具有会议记录功能的智能穿戴装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350834A (zh) * 2020-09-28 2021-02-09 深圳市奋达科技股份有限公司 一种ai语音带屏会议系统及方法
CN112350834B (zh) * 2020-09-28 2023-04-07 深圳市奋达科技股份有限公司 一种ai语音带屏会议系统及方法
CN112651240A (zh) * 2020-12-30 2021-04-13 广东电力信息科技有限公司 业务会议信息处理系统、方法、电子设备及存储介质

Also Published As

Publication number Publication date
US20200118569A1 (en) 2020-04-16
WO2020073633A1 (zh) 2020-04-16

Similar Documents

Publication Publication Date Title
CN111048093A (zh) 会议音箱及会议记录方法、设备、系统和计算机存储介质
US10045140B2 (en) Utilizing digital microphones for low power keyword detection and noise suppression
WO2020063146A1 (en) Data transmission method and system, and bluetooth headphone
CN103327181B (zh) 可提高用户获知语音信息效率的语音聊天方法
CN105245355A (zh) 智能语音速记会议系统
US11587560B2 (en) Voice interaction method, device, apparatus and server
CN113129917A (zh) 基于场景识别的语音处理方法及其装置、介质和系统
CN107527623A (zh) 传屏方法、装置、电子设备及计算机可读存储介质
US11650790B2 (en) Centrally controlling communication at a venue
JP2013546282A (ja) 会議情報を提供するためのシステムおよび方法
WO2016187910A1 (zh) 一种语音文字的转换方法及设备、存储介质
CN107240396B (zh) 说话人自适应方法、装置、设备及存储介质
CN103347070B (zh) 推送语音数据的方法、终端、服务器及系统
CN104575579A (zh) 语音管理方法及语音管理系统
CN106982286A (zh) 一种录音方法、设备和计算机可读存储介质
CN107733876A (zh) 一种流媒体字幕显示方法、移动终端及存储装置
WO2018166367A1 (zh) 一种实时对话中的实时提醒方法、装置、存储介质及电子装置
CN103338330A (zh) 一种图像处理方法、装置和终端
US8957987B2 (en) Still image sound annotation system
CN107910012B (zh) 音频数据处理方法、装置及系统
US10497368B2 (en) Transmitting audio to an identified recipient
US20200184973A1 (en) Transcription of communications
CN113689855A (zh) 一种会议记录生成系统、方法、装置、存储介质
JP7017755B2 (ja) 放送波受信装置、放送受信方法、及び、放送受信プログラム
CN101778151A (zh) 电子记事装置及电子记事的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200421

WW01 Invention patent application withdrawn after publication