CN205647778U - 一种智能会议系统 - Google Patents
一种智能会议系统 Download PDFInfo
- Publication number
- CN205647778U CN205647778U CN201620280017.1U CN201620280017U CN205647778U CN 205647778 U CN205647778 U CN 205647778U CN 201620280017 U CN201620280017 U CN 201620280017U CN 205647778 U CN205647778 U CN 205647778U
- Authority
- CN
- China
- Prior art keywords
- data
- audio
- equipment
- text data
- transcription
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013518 transcription Methods 0.000 claims abstract description 84
- 230000035897 transcription Effects 0.000 claims abstract description 84
- 238000012546 transfer Methods 0.000 claims description 21
- 238000013519 translation Methods 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 230000011664 signaling Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本实用新型公开了一种智能会议系统。包括:音频输入设备、转写设备和输出设备;其中,所述转写设备用于对用户通过音频输入设备获取的音频数据进行转写,得到文本数据;输出设备,用于展示所述转写设备得到的文本数据。本实用新型通过转写设备对音频输入设备获取的音频数据进行转写,得到文本数据,然后通过输出设备展示转写设备得到的文本数据。现有技术中由人工进行转写,效率低下。具不完全统计,全国每年企业视频会议约有17万场,总时长约1687h,本实用新型能够通过转写设备实现机器转写,进而大幅降低人力成本,提高转写效率。
Description
技术领域
本实用新型实施例涉及音视频处理技术,尤其涉及一种智能会议系统。
背景技术
在会议过程中参会人员会各抒己见,为了将会议内容进行记录或者将参会人员所说的话转换为文字,需要将语音信息转换为文本信息(又称为转写)。
通常由人工进行转写,并通过键盘将人工转写后的文本数据输入到视频会议系统中。
然而,人工转写存在耗时长、成本高、消息滞后的问题,导致现场参会人员无法实时看到转写结果。如果对端说话人语速快声音小,角色变换多,或者语言不通,那么参会人员无法明确了解说话人的意图。对于音频的后续处理时间长,过程繁琐,无法进行文本与内容的对应,相关行业人员无法快速完成转写工作。
实用新型内容
本实用新型提供一种智能会议系统,以实现由机器进行快速转写,提高转写效率。
本实用新型实施例提供了一种智能会议系统,包括:音频输入设备、转写设备和输出设备;
其中,所述转写设备用于对用户通过音频输入设备获取的音频数据进行转写,得到文本数据;
输出设备,用于展示所述转写设备得到的文本数据。
进一步的,所述智能会议系统还包括存储设备,所述存储设备能够存储音频输入设备接收到的音频数据;
所述转写设备与所述存储设备相连,所述转写设备用于从所述存储设备的第一端口上读取预存的音频数据进行转写;或者,所述转写设备用于所述从存储设备的第二端口上实时读取音频数据进行转写。
进一步的,所述输出设备为投影设备,所述投影设备用于将得到的文本数据投影到视频屏幕或文本屏幕上;或者,
所述输出设备为显示器,所述显示器通过背光元件输出所述文本数据;或者,
所述输出设备为直播设备,所述直播设备用于将得到的文本数据直播到电视或网络媒体。
进一步的,所述智能会议系统还包括文字输入设备和文字编辑设备;
所述文字输入设备用于接收用户输入的字符编辑信号;所述文字编辑设备用于根据文字输入设备接收到的字符编辑信号对转写设备得到的文本数据进行编辑。
进一步的,所述智能会议系统还包括声纹识别设备,
所述声纹识别设备用于从所述音频数据中查找目标用户对应的音频子数据;
所述转写设备还用于,根据所述声纹识别设备的识别结果,为音频子数据对应的文本数据添加标识,所述标识用于表示所述目标用户。
进一步的,所述转写设备还用于,从存储设备中读取预设音频数据与预设文本数据的映射关系;检查所述音频数据中是否包含所述预设音频数据;当所述音频数据中包含所述预设音频数据时,所述转写设备根据读取的映射关系确定所述预设音频数据对应的预设文本数据。
进一步的,所述预设音频数据为敏感词语对应的音频数据,所述预设文本数据为预设符号;
或者,所述预设音频数据为关键词语对应的音频数据,所述预设文本数据为所述关键词语对应的文本数据。
进一步的,所述智能会议系统还包括翻译设备,所述翻译设备用于将所述转写设备得到的第一语言的文本数据翻译为第二语言的文本数据。
进一步的,所述智能会议系统还包括音频合成设备和音频播放设备,所述音频合成设备用于将所述翻译设备得到的第二语言的文本数据合成为音频数据信号;所述音频播放设备用于播放所述音频合成设备得到的所述音频数据信号。
进一步的,所述智能会议系统还包括控制信令输入设备和数据查找设备,所述控制信令输入设备用于接收用户输入的时间信息,所述数据查找设备用于根据所述音频数据或所述文本数据的时间戳查找与所述时间信息对应的目标数据。
进一步的,所述智能会议系统还包括可识别标志生成设备和数据收发设备,所述输出设备用于展示所述可识别标志生成设备生成的可识别标志,以便用户根据所述可识别标志向智能会议系统发送访问请求,所述访问请求用于访问智能会议系统中的音频数据和/或文本数据;所述数据收发设备用于接收用户设备发送的数据访问请求,并向所述用户设备发送由所述转写设备查找的所述数据访问请求对应的音频数据和/或文本数据。
进一步的,所述智能会议系统还包括加密设备,所述加密设备用于对所述智能会议系统的程序文档、所述音频数据以及所述文本数据中的一种或多种进行加密。
进一步的,所述智能会议系统还包括数据导出设备,所述数据导出设备用于所述数据导出设备上的预设接口与外部设备进行连接,以便导出所述音频数据和/或文本数据。
进一步的,所述智能会议系统还包括路由器。
进一步的,所述智能会议系统为设置有外壳内的一体机。
本实用新型通过转写设备对音频输入设备获取的音频数据进行转写,得到文本数据,然后通过输出设备展示转写设备得到的文本数据。现有技术中由人工进行转写,效率低下。具不完全统计,全国每年企业视频会议约有17万场,总时长约1687h,本实用新型能够通过转写设备实现机器转写,进而大幅降低人力成本,提高转写效率。
附图说明
图1是本实用新型实施例一中的智能会议系统的结构示意图;
图2是本实用新型实施例二中的智能会议系统的结构示意图;
图3是本实用新型实施例三中的智能会议系统的结构示意图;
图4是本实用新型实施例四中的智能会议系统的结构示意图;
图5是本实用新型实施例五中的智能会议系统的结构示意图;
图6是本实用新型实施例六中的智能会议系统的结构示意图。
具体实施方式
下面结合附图和实施例对本实用新型作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本实用新型,而非对本实用新型的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本实用新型相关的部分而非全部结构。
实施例一
图1为本实用新型实施例一提供的智能会议系统的结构示意图,包括:音频输入设备1、转写设备2和输出设备3;
其中,所述转写设备2用于对用户通过音频输入设备1获取的音频数据进行转写,得到文本数据;
输出设备3,用于展示所述转写设备2得到的文本数据。
在一种实现方式中,智能会议系统是一种提供实时语音转写功能的系统。可选的,音频输入设备1用于获取本地用户输入的音频数据。具体的,音频输入设备1可以为麦克风。可选的,音频输入设备1用于获取其他参与方传输到本地的音频数据,此时音频输入设备1可以为数据读取设备。
在另一种实现方式中,对于公检法等庭审现场使用智能会议系统进行对会议进行记录,此时智能会议系统中存储有庭审过程中各方输入的音频数据。在会议结束后,语音输入设备从存储设备4中读取存储的音频数据。
音频输入设备1将获取的音频数据发送到转写设备2。转写设备2通过转写器件对音频数据进行转写,得到音频数据对应的文本数据。可选的,转写器件包括比较器和计数器。通过计数器对音频数据进行分片,得到音频帧数据,通过比较器将分片得到的音频帧数据与存储器中存储的预设音频帧数据进行比较,当存在匹配的预设音频帧数据时,读取预设音频帧数据对应的文本数据,将该文本数据作为音频帧数据对应的文本数据。进而通过转写设备2中的比较器和计数器实现转写功能。
进一步的,所述智能会议系统还包括存储设备4,所述存储设备4能够存储音频输入设备1接收到的音频数据;
所述转写设备2与所述存储设备4相连,所述转写设备2用于从所述存储设备4的第一端口上读取预存的音频数据进行转写;或者,所述转写设备2用于所述从存储设备4的第二端口上实时读取音频数据进行转写。
存储设备4可以将用户通过麦克风输入的音频数据进行存储。可选的,将用户通过麦克风输入的音频数据存储到缓存区,以便转写设备2从缓存区中快速读取到用户输入的音频数据,实现实时转写。可选的,将用户通过麦克风输入的音频数据存储到非缓存区,以便在会议结束后,将会议中的全部音频数据进行统一的导出和转写。其中,缓存区可以设置在高速缓冲存储器(Cache)或随机存储器(RAM)等内存中,缓存区也可设置在硬盘中。非缓存区可设置在硬盘中,也可以将非缓存区设置在随机存储器(RAM)中。转写设备2可以通过第一端口从缓存区中读取音频数据;转写设备2也可以通过第二端口从非缓存区中读取音频数据。当缓存区和非缓存区均设置在随机存储器(RAM)或硬盘中时,第一端口和第二端口可以为同一个端口。
通过存储设备4对音频数据进行存储,实现实时或非实时的转写功能。此外,由于存储设备4能够对音频数据以及转写得到的文本数据进行存储,因此存储设备4还为对于音频数据以及转写得到的文本数据进行进一步优化处理提供了硬件基础,使智会议系统的功能更加丰富。
进一步的,所述输出设备3为投影设备,所述投影设备用于将得到的文本数据投影到视频屏幕或文本屏幕上;或者,所述输出设备3为显示器,所述显示器通过背光元件输出所述文本数据。
可选的,在一个使用场景下,参与方A通过投影仪将参与方B发送的视频帧画面(或者本地保存的参与方A的视频帧画面)以及转写的得到的文本数据投影到视频屏幕上,其中视频帧画面包括参与方B的摄像头获取到的视频帧画面。在另一个使用场景下,参与方A通过投影仪a将参与方B发送的视频帧画面(或者本地保存的参与方A的视频帧画面)投影到视频屏幕上;同时,通过投影仪b将转写得到的文本数据投影到文本屏幕上。
可选的,参与方A还可能仅通过一个个人电脑(PC机)接收参与方B发送的视频帧画面(或者读取本地保存的参与方A的视频帧画面),并通过个人电脑上配置的显示器显示接收到的视频帧画面和转写得到的文本数据。
进一步的,所述输出设备3为直播设备,所述直播设备用于将得到的文本数据直播到电视或网络媒体。
直播设备根据时间戳将转写得到的文本数据直播到音视频文件中,实现视频帧画面、音频帧数据与转写得到的文本数据的绑定,使用户能够接收到直播的携带有字幕的音视频数据。优选的,直播设备为网络直播设备,具体可以为服务器、个人计算机或笔记本电脑等。示例性的,在直播设备上搭载“微吼”应用,然后使用直播设备进行直播。
可选的,转写设备2可以通过静音抑制(VAD)端点检测、特征提取、声学计算等模块实现转写。可选的,转写设备2还可通过调用转写引擎实现转写。此外,在建立音频向文字数据进行转换的声学模型时,可分为通用和定制两种。通用声学模型适用于大多人的发音,无特殊发音习惯的普通话均适用。定制声学模型为特定发音人音频数据训练而成,可满足个性化发音习惯的识别,效果比通用更佳。
本实用新型通过转写设备2对音频输入设备1获取的音频数据进行转写,得到文本数据,然后通过输出设备3展示转写设备2得到的文本数据。现有技术中由人工进行转写,效率低下。具不完全统计,全国每年企业视频会议约有17万场,总时长约1687h,本实用新型能够通过转写设备实现机器转写,进而大幅降低人力成本,提高转写效率。此外,具不完全统计,全国每年记者采访时长约10200h;音视频节目11750h;培训28000h;另外每年公检法庭审时长约1964小时。在录制好音频数据后,由智能会议系统代替人工进行转写,可以大幅降低人力成本,提高转写效率。
实施例二
通过机器进行转写时,对于一些同音异义词可能存在转写错误的情况,基于此,本实用新型实施例还提供了一种智能会议系统,图2为本实用新型实施例二提供的一种智能会议系统的结构示意图,其中,智能会议系统还包括文字输入设备5和文字编辑设备6;
所述文字输入设备5用于接收用户输入的字符编辑信号;所述文字编辑设备6用于根据文字输入设备5接收到的字符编辑信号对转写设备2得到的文本数据进行编辑。
其中,文字输入设备5可以为键盘、鼠标或触摸屏等。当输出设备3输出文本数据后,如果用户发现转写得到的文本数据存在错误,则可通过文字输入设备5输入字符编辑信号。字符编辑信号包括:删除信号、插入的字符信号。字符信号包括字符信号(如“a”、“b”“c”。。。“z”、“0”、“1”“2”。。。“9”。文字编辑设备6具备输入法功能,用户可通过文字编辑设备6将输入的字符信号转换为文本数据。
本实施例提供的智能会议系统能够使用户可以通过文字输入设备5对显示的文本数据中的错误进行更正和修改,提高转写功能的可用性。
实施例三
本实用新型实施例还提供了一种智能会议系统,当某个参与方由多人参加时,会出现不同人员输入的音频数据。在某些会话场景下,需要对不同的人员进行区分。如图3所示,所述智能会议系统还包括声纹识别设备7,
所述声纹识别设备7用于从所述音频数据中查找目标用户对应的音频子数据;
所述转写设备2还用于,根据所述声纹识别设备7的识别结果,为音频子数据对应的文本数据添加标识,所述标识用于表示所述目标用户。
声纹识别(Voiceprint Recognition,VPR),也称为说话人识别(SpeakerRecognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
通过声纹识别设备7从音频数据中找到不同的人员分别对应的音频子数据,然后由转写设备2在进行转写后,为不同人员对应的音频子数据配置相应标识,进而区分不同人员的说话内容。声纹识别设备7可以对音频子数据中包含的不同的声波信息进行筛选,得到多个音色对应的音频子数据,进而得到属于同一个音色的每个音频子数据。转写设备2为属于同一个音色的音频子数据对应的文本数据添加标识,该标志可以为用户的姓名。进一步的,可以通过改变文本数据的颜色体现不同用户对应的文本数据。
本实施例能够通过声纹识别设备7从音频数据中查找到属于不同使用者的音频子数据,并通过转写设备2为音频子数据对应的文本数据添加标识,进而区分不同的用户输入的语音数据对应的文本数据,使得转写后的文本数据能够更加清楚的体现会议时的情景,提高转写效率,改善用户体验。
进一步的,所述转写设备2还用于,从所述文本数据中查找标点符号,根据标点符号得到至少一个分句;所述输出设备3用于分别输出所述至少一个分句。
本实施例通过转写设备2对文本数据进行分句,能够在用户连续的说出了一端语音后,将一端语音转换为多个语句进行显示,提高转写的准确性。
进一步的,所述转写设备2还用于,通过所述转写设备2对每个分句中的字数进行计数,得到至少一个字幕数据,所述字幕数据不包含标点符号且文字数量小于预设字幕文字数量。
预设字幕文字数量可以为14个字。标点符号可以为逗号和句号。通过删除标点符号,可以实现听过字幕的方式,将转写得到的文字数据快速简洁的进行显示,改善用户体验。
进一步的,所述转写设备2还用于,从存储设备4中读取预设音频数据与预设文本数据的映射关系;检查所述音频数据中是否包含所述预设音频数据;当所述音频数据中包含所述预设音频数据时,所述转写设备2根据读取的映射关系确定所述预设音频数据对应的预设文本数据。
具体的,所述预设音频数据为敏感词语对应的音频数据,所述预设文本数据为预设符号;
或者,所述预设音频数据为关键词语对应的音频数据,所述预设文本数据为所述关键词语对应的文本数据。
敏感词汇可以为一些特定的词语,例如竞争厂商的名称、不文明词语等。预设符号可以为“*”、“#”等。关键词语可以为会议中多次出现的技术词汇,例如“某某技术”“某某公司”“某某案件”等。
本实施例转系设备能够在音频数据中识别出预设音频数据,并直接根据存储设备4中存储的映射关系确定预设文本数据,进而避免在出现同音异议词时,无法准确进行准转写的问题,提高转写的准确性和转写速率。
实施例四
在一些大型的国际会议中,参会人员通常掌握不同的语言,例如参会人员A掌握汉语、参会人员B掌握德语、参会人员C掌握法语,当参会人员A发言时,如果仅将其汉语翻译为汉语的文本数据,则由于参会人员B和参会人员C不懂得汉语,因此造成参会人员B和参会人员C的理解障碍。基于此,本实用新型实施例还提供了一种智能视频会议系统,如图4所示,所述智能会议系统还包括翻译设备8,所述翻译设备8用于将所述转写设备2得到的第一语言的文本数据翻译为第二语言的文本数据。
翻译设备8可以通过搭载现有的翻译软件实现翻译。根据搭载的输入法的可翻译语种,第一语言可以为下述语种中的任意一种:汉语、维语、英语、日语、韩语、德语等。第二语言为上述语种中除第一语言以外的任意一种语言。
本实施例能够通过翻译设备8将第一语言的文本数据翻译为第二语言的文本数据,进而使不同国家的人们能够根据各自的使用需求选择相应的翻译语种,进一步提高智能会议系统的可用性。
进一步的,所述智能会议系统还包括音频合成设备9和音频播放设备10,所述音频合成设备9用于将所述翻译设备8得到的第二语言的文本数据合成为音频数据信号;所述音频播放设备10用于播放所述音频合成设备9得到的所述音频数据信号。
在得到第二语言的文本数据之后,可通过音频合成设备9将文本数据转换为相应的音频数据。转换时可使用语音合成技术实现文本到音频数据的转换。语音合成是通过机械的、电子的方法产生人造语音的技术。示例性的,使用文语转换技术(TTS技术)进行转换。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力。
本实施例能够通过音频合成设备9得到第二语言的文本数据对应的音频数据,并通过音频播放设备10播放得到的音频数据,使得使用不同语种的人们不仅可以看到自己知晓的语言文字的字幕,还可听到相应的翻译音频,实现同声翻译,提高用户体验。
实施例五
本实用新型实施例还提供了一种智能会议系统,如图5所示,所述智能会议系统还包括控制信令输入设备11和数据查找设备12,所述控制信令输入设备11用于接收用户输入的时间信息,所述数据查找设备12用于根据所述音频数据或所述文本数据的时间戳查找与所述时间信息对应的目标数据。输出设备3用于输出所述数据查找设备12查找到的目标数据。
控制信令输入设备11可以为鼠标或触摸屏,用于接收用户输入的时间信息。数据查找设备12根据时间信息查找相应的目标数据。目标数据可以是文本数据也可以是音频数据。
本实施例能够根据用户通过控制信令输入设备11输入的时间信息,调取相应的目标数据,进而实现回拨,使得用户可以在会议结束后,查看用户指定的时间点对应的目标数据,提高智能会议系统的易用性。
进一步的,所述智能会议系统还包括可识别标志生成设备13和数据收发设备14,所述输出设备3用于展示所述可识别标志生成设备13生成的可识别标志,以便用户根据所述可识别标志向智能会议系统发送访问请求,所述访问请求用于访问智能会议系统中的音频数据和/或文本数据;所述数据收发设备14用于接收用户设备发送的数据访问请求,并向所述用户设备发送由所述转写设备2查找的所述数据访问请求对应的音频数据和/或文本数据。
其中,可识别标志可以为条形码、二维码或三维码等。
可识别标志生成设备13用于将智能会系统中存储的音频数据或文本数据对应的统一资源定位符(Uniform Resource Locator,URL)生成为一个可识别标志。用户操作智能手机或平板电脑扫描可识别标志后,可访问到音频数据或文本数据。进而实现从移动终端访问音频数据或视频数据,是用户能够更为便捷的查阅音频数据或文本数据,提高用户体验。
实施例六
本实用新型实施例还提供了一种智能会议系统,如图6所示,所述智能会议系统还包括加密设备15,所述加密设备15用于对所述智能会议系统的程序文档、所述音频数据以及所述文本数据中的一种或多种(至少两种)进行加密。
解密设备通常通过智能会议系统的即插即用接口与连接到智能会议系统,通过加密设备15中搭载的加密算法实现对智能会议系统的程序文档、所述音频数据或所述文本数据的加密保护作用。示例性的,加密设备15为加密狗。
进一步的,所述智能会议系统还包括数据导出设备16,所述数据导出设备16用于所述数据导出设备16上的预设接口与外部设备进行连接,以便导出所述音频数据和/或文本数据。
数据导出设备16可以为一个接口集成设备,该设备包括USB接口、蓝牙接口、红外接口、WiFi接口等至少一个接口。通过数据导出设备16能够将智能会议系统中的数据导出到其他设备中。例如通过WiFi端口将音频数据和视频数据导出到网络端的存储服务器中。又例如,通过USB接口将数据导出到USB闪存中。
本实施例能够通过数据导出设备16将智能会议系统中的数据导出到其他设备中,以便其他设备进行备份或进一步处理,提高智能会议系统的可扩展性。
可选的,如图3所示,所述智能会议系统还包括路由器。
该路由器可以为有线路由器或者无线路由器。路由器能够支撑一个智能会议系统内部局域网。当智能会议系统中的各个设备在进行数据交互时,可已通过路由器进行转发,实现数据交互。
本实施例能够通过路由器实现各设备之间的数据交互,进而可以在路由器的负载范围以及覆盖范围内,将不同的设备放置于不同的房间内,使智能会议系统的安装更加灵活。
可选的,所述智能会议系统为设置有外壳内的一体机。
智能会议系统的各个设备位于一个外壳内,通过数据总线进行数据交互。由于一体机移动方便,因此可以提高智能会议系统的可移动性。外壳可以为塑料外壳也可以为金属外壳。
比如,在庭审时,可以将一体机移动到庭审现场A进行录制,然后再将一体机移动到庭审现场B进行录制。最后,将一体机移动到办公室,通过导出功能将转换的文本数据导出到电脑,或者导出到打印机进行打印等。
示例性的,表1给出了一种一体机的配置方案:
表1
序号 | 名称 | 功能 |
1 | 移动工作站/服务器 | 识别、翻译等引擎及模型资源部署 |
2 | 智能会议系统PC端 | 主控客户端 |
3 | 展板PC端 | 展板客户端 |
4 | 路由器 | 局域网 |
5 | 声卡 | 音频处理 |
6 | 麦克风 | 收音设备 |
7 | 加密狗 | 保障数据和服务安全 |
其中,识别、翻译等引擎以及模型资源可存储在存储设备4中,通过移动工作站执行转写设备2的功能。智能会议系统PC端为用户可操作的能够向移动工作站发送转写请求的设备,展板PC用于展示移动工作站返回的文本数据以及音视频数据。
注意,上述各实施例可以进行组合实施。且上述仅为本实用新型的较佳实施例及所运用技术原理。本领域技术人员会理解,本实用新型不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本实用新型的保护范围。因此,虽然通过以上实施例对本实用新型进行了较为详细的说明,但是本实用新型不仅仅限于以上实施例,在不脱离本实用新型构思的情况下,还可以包括更多其他等效实施例,而本实用新型的范围由所附的权利要求范围决定。
Claims (14)
1.一种智能会议系统,其特征在于,包括:音频输入设备、转写设备和输出设备;
其中,所述转写设备用于对用户通过音频输入设备获取的音频数据进行转写,得到文本数据;
输出设备,用于展示所述转写设备得到的文本数据;
所述智能会议系统还包括存储设备,所述存储设备能够存储音频输入设备接收到的音频数据;
所述转写设备与所述存储设备相连,所述转写设备用于从所述存储设备的第一端口上读取预存的音频数据进行转写。
2.根据权利要求1所述的智能会议系统,其特征在于,所述输出设备为投影设备,所述投影设备用于将得到的文本数据投影到视频屏幕或文本屏幕上;或者,
所述输出设备为显示器,所述显示器通过背光元件输出所述文本数据;或者,
所述输出设备为直播设备,所述直播设备用于将得到的文本数据直播到电视或网络媒体。
3.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括文字输入设备和文字编辑设备;
所述文字输入设备用于接收用户输入的字符编辑信号;所述文字编辑设备用于根据文字输入设备接收到的字符编辑信号对转写设备得到的文本数据进行编辑。
4.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统 还包括声纹识别设备,
所述声纹识别设备用于从所述音频数据中查找目标用户对应的音频子数据;
所述转写设备还用于,根据所述声纹识别设备的识别结果,为音频子数据对应的文本数据添加标识,所述标识用于表示所述目标用户。
5.根据权利要求1所述的智能会议系统,其特征在于,所述转写设备还用于,从存储设备中读取预设音频数据与预设文本数据的映射关系;检查所述音频数据中是否包含所述预设音频数据;当所述音频数据中包含所述预设音频数据时,所述转写设备根据读取的映射关系确定所述预设音频数据对应的预设文本数据。
6.根据权利要求5所述的智能会议系统,其特征在于,所述预设音频数据为敏感词语对应的音频数据,所述预设文本数据为预设符号;
或者,所述预设音频数据为关键词语对应的音频数据,所述预设文本数据为所述关键词语对应的文本数据。
7.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括翻译设备,所述翻译设备用于将所述转写设备得到的第一语言的文本数据翻译为第二语言的文本数据。
8.根据权利要求7所述的智能会议系统,其特征在于,所述智能会议系统还包括音频合成设备和音频播放设备,所述音频合成设备用于将所述翻译设备得到的第二语言的文本数据合成为音频数据信号;所述音频播放设备用于播放所述音频合成设备得到的所述音频数据信号。
9.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括控制信令输入设备和数据查找设备,所述控制信令输入设备用于接收用 户输入的时间信息,所述数据查找设备用于根据所述音频数据或所述文本数据的时间戳查找与所述时间信息对应的目标数据。
10.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括可识别标志生成设备和数据收发设备,所述输出设备用于展示所述可识别标志生成设备生成的可识别标志,以便用户根据所述可识别标志向智能会议系统发送访问请求,所述访问请求用于访问智能会议系统中的音频数据和/或文本数据;所述数据收发设备用于接收用户设备发送的数据访问请求,并向所述用户设备发送由所述转写设备查找的所述数据访问请求对应的音频数据和/或文本数据。
11.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括加密设备,所述加密设备用于对所述智能会议系统的程序文档、所述音频数据以及所述文本数据中的一种或多种进行加密。
12.根据权利要求1所述的智能会议系统,其特征在于,所述智能会议系统还包括数据导出设备,所述数据导出设备用于所述数据导出设备上的预设接口与外部设备进行连接,以便导出所述音频数据和/或文本数据。
13.根据权利要求1-12中任一项所述的智能会议系统,其特征在于,所述智能会议系统还包括路由器。
14.根据权利要求1-12中任一项所述的智能会议系统,其特征在于,所述智能会议系统为设置有外壳内的一体机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201620280017.1U CN205647778U (zh) | 2016-04-01 | 2016-04-01 | 一种智能会议系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201620280017.1U CN205647778U (zh) | 2016-04-01 | 2016-04-01 | 一种智能会议系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN205647778U true CN205647778U (zh) | 2016-10-12 |
Family
ID=57067294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201620280017.1U Active CN205647778U (zh) | 2016-04-01 | 2016-04-01 | 一种智能会议系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN205647778U (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106653002A (zh) * | 2016-12-15 | 2017-05-10 | 咪咕数字传媒有限公司 | 一种文字直播方法及平台 |
CN106919561A (zh) * | 2017-04-25 | 2017-07-04 | 安徽声讯信息技术有限公司 | 智能会议速记机 |
CN107257448A (zh) * | 2017-08-09 | 2017-10-17 | 成都全云科技有限公司 | 一种带字体交流的视频会议系统 |
CN107749313A (zh) * | 2017-11-23 | 2018-03-02 | 郑州大学第附属医院 | 一种自动转写与生成远程医疗会诊记录的方法 |
CN108335693A (zh) * | 2017-01-17 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 一种语种识别方法以及语种识别设备 |
CN108416565A (zh) * | 2018-01-25 | 2018-08-17 | 北京云知声信息技术有限公司 | 会议记录方法 |
CN108566558A (zh) * | 2018-04-24 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 视频流处理方法、装置、计算机设备及存储介质 |
CN108737845A (zh) * | 2018-05-22 | 2018-11-02 | 北京百度网讯科技有限公司 | 直播处理方法、装置、设备以及存储介质 |
CN109213466A (zh) * | 2017-06-30 | 2019-01-15 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
WO2019029073A1 (zh) * | 2017-08-07 | 2019-02-14 | 广州视源电子科技股份有限公司 | 传屏方法、装置、电子设备及计算机可读存储介质 |
CN109920428A (zh) * | 2017-12-12 | 2019-06-21 | 杭州海康威视数字技术股份有限公司 | 一种笔录录入方法、装置、电子设备及存储介质 |
CN110019923A (zh) * | 2017-07-18 | 2019-07-16 | 北京国双科技有限公司 | 语音消息的查找方法及装置 |
CN111863043A (zh) * | 2020-07-29 | 2020-10-30 | 安徽听见科技有限公司 | 音频转写文件生成方法、相关设备及可读存储介质 |
CN112735384A (zh) * | 2020-12-28 | 2021-04-30 | 科大讯飞股份有限公司 | 应用于说话人分离的转折点检测方法、装置以及设备 |
CN113299279A (zh) * | 2021-05-18 | 2021-08-24 | 上海明略人工智能(集团)有限公司 | 用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质 |
CN113327619A (zh) * | 2021-02-26 | 2021-08-31 | 山东大学 | 一种基于云—边缘协同架构的会议记录方法及系统 |
CN115293138A (zh) * | 2022-08-03 | 2022-11-04 | 北京中科智加科技有限公司 | 一种文本纠错方法及计算机设备 |
-
2016
- 2016-04-01 CN CN201620280017.1U patent/CN205647778U/zh active Active
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106653002A (zh) * | 2016-12-15 | 2017-05-10 | 咪咕数字传媒有限公司 | 一种文字直播方法及平台 |
CN108335693B (zh) * | 2017-01-17 | 2022-02-25 | 腾讯科技(深圳)有限公司 | 一种语种识别方法以及语种识别设备 |
CN108335693A (zh) * | 2017-01-17 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 一种语种识别方法以及语种识别设备 |
CN106919561A (zh) * | 2017-04-25 | 2017-07-04 | 安徽声讯信息技术有限公司 | 智能会议速记机 |
CN109213466B (zh) * | 2017-06-30 | 2022-03-25 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
CN109213466A (zh) * | 2017-06-30 | 2019-01-15 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
CN110019923A (zh) * | 2017-07-18 | 2019-07-16 | 北京国双科技有限公司 | 语音消息的查找方法及装置 |
WO2019029073A1 (zh) * | 2017-08-07 | 2019-02-14 | 广州视源电子科技股份有限公司 | 传屏方法、装置、电子设备及计算机可读存储介质 |
CN107257448A (zh) * | 2017-08-09 | 2017-10-17 | 成都全云科技有限公司 | 一种带字体交流的视频会议系统 |
CN107749313A (zh) * | 2017-11-23 | 2018-03-02 | 郑州大学第附属医院 | 一种自动转写与生成远程医疗会诊记录的方法 |
CN107749313B (zh) * | 2017-11-23 | 2019-03-01 | 郑州大学第一附属医院 | 一种自动转写与生成远程医疗会诊记录的方法 |
CN109920428A (zh) * | 2017-12-12 | 2019-06-21 | 杭州海康威视数字技术股份有限公司 | 一种笔录录入方法、装置、电子设备及存储介质 |
CN108416565A (zh) * | 2018-01-25 | 2018-08-17 | 北京云知声信息技术有限公司 | 会议记录方法 |
CN108566558A (zh) * | 2018-04-24 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 视频流处理方法、装置、计算机设备及存储介质 |
US11252444B2 (en) | 2018-04-24 | 2022-02-15 | Tencent Technology (Shenzhen) Company Limited | Video stream processing method, computer device, and storage medium |
CN108566558B (zh) * | 2018-04-24 | 2023-02-28 | 腾讯科技(深圳)有限公司 | 视频流处理方法、装置、计算机设备及存储介质 |
US10743038B2 (en) | 2018-05-22 | 2020-08-11 | Beijing Baidu Netcom Science Technology Co., Ltd. | Live broadcast processing method, apparatus, device, and storage medium |
CN108737845A (zh) * | 2018-05-22 | 2018-11-02 | 北京百度网讯科技有限公司 | 直播处理方法、装置、设备以及存储介质 |
CN111863043A (zh) * | 2020-07-29 | 2020-10-30 | 安徽听见科技有限公司 | 音频转写文件生成方法、相关设备及可读存储介质 |
CN111863043B (zh) * | 2020-07-29 | 2022-09-23 | 安徽听见科技有限公司 | 音频转写文件生成方法、相关设备及可读存储介质 |
CN112735384A (zh) * | 2020-12-28 | 2021-04-30 | 科大讯飞股份有限公司 | 应用于说话人分离的转折点检测方法、装置以及设备 |
CN113327619A (zh) * | 2021-02-26 | 2021-08-31 | 山东大学 | 一种基于云—边缘协同架构的会议记录方法及系统 |
CN113327619B (zh) * | 2021-02-26 | 2022-11-04 | 山东大学 | 一种基于云—边缘协同架构的会议记录方法及系统 |
CN113299279A (zh) * | 2021-05-18 | 2021-08-24 | 上海明略人工智能(集团)有限公司 | 用于关联语音数据和检索语音数据的方法、装置、电子设备和可读存储介质 |
CN115293138A (zh) * | 2022-08-03 | 2022-11-04 | 北京中科智加科技有限公司 | 一种文本纠错方法及计算机设备 |
CN115293138B (zh) * | 2022-08-03 | 2023-06-09 | 北京中科智加科技有限公司 | 一种文本纠错方法及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN205647778U (zh) | 一种智能会议系统 | |
US11227129B2 (en) | Language translation device and language translation method | |
US9715873B2 (en) | Method for adding realism to synthetic speech | |
TWI536365B (zh) | 聲紋辨識 | |
US7739118B2 (en) | Information transmission system and information transmission method | |
CN108847214B (zh) | 语音处理方法、客户端、装置、终端、服务器和存储介质 | |
US20060173859A1 (en) | Apparatus and method for extracting context and providing information based on context in multimedia communication system | |
TW201926079A (zh) | 雙向語音翻譯系統、雙向語音翻譯方法和電腦程式產品 | |
CN110728976B (zh) | 语音识别的方法、装置及系统 | |
CN107527623B (zh) | 传屏方法、装置、电子设备及计算机可读存储介质 | |
JP6987124B2 (ja) | 通訳装置及び方法(device and method of translating a language) | |
WO2016119370A1 (zh) | 一种实现录音的方法、装置和移动终端 | |
CN104157171A (zh) | 一种点读系统及其方法 | |
US20130253932A1 (en) | Conversation supporting device, conversation supporting method and conversation supporting program | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
CN108073572B (zh) | 信息处理方法及其装置、同声翻译系统 | |
CN108960158A (zh) | 一种智能手语翻译的系统和方法 | |
CN111048093A (zh) | 会议音箱及会议记录方法、设备、系统和计算机存储介质 | |
JP2021067830A (ja) | 議事録作成システム | |
CN106847256A (zh) | 一种语音转化聊天方法 | |
US20030009342A1 (en) | Software that converts text-to-speech in any language and shows related multimedia | |
US20190121860A1 (en) | Conference And Call Center Speech To Text Machine Translation Engine | |
CN112581965A (zh) | 转写方法、装置、录音笔和存储介质 | |
CN110460798B (zh) | 视频访谈服务处理方法、装置、终端与存储介质 | |
JP2000207170A (ja) | 情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |