CN111626061A - 会议记录生成方法、装置、设备及可读存储介质 - Google Patents
会议记录生成方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN111626061A CN111626061A CN202010464020.XA CN202010464020A CN111626061A CN 111626061 A CN111626061 A CN 111626061A CN 202010464020 A CN202010464020 A CN 202010464020A CN 111626061 A CN111626061 A CN 111626061A
- Authority
- CN
- China
- Prior art keywords
- conference
- information
- mobile terminal
- generating
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000005236 sound signal Effects 0.000 claims abstract description 103
- 238000001914 filtration Methods 0.000 claims description 13
- 238000013475 authorization Methods 0.000 claims description 12
- 230000000694 effects Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种会议记录生成方法、装置、设备及可读存储介质,所述会议记录生成方法应用于会议系统,所述会议系统基于添加到会议中的多个移动终端形成,所述方法包括:接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。本发明通过将多个移动终端作为收音设备形成会议系统,在避免改造会议系统的同时确保了收音效果;并且针对多份文本信息进行语义识别,自动生成用户观点信息和会议主题信息,提升了会议记录生成的智能性。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种会议记录生成方法、装置、设备及可读存储介质。
背景技术
随着金融科技(Fintech),尤其是互联网科技金融的不断发展,越来越多的技术(如人工智能、大数据、云存储等)应用在金融领域,但金融领域也对各类技术提出了更高的要求,如要求提高会议系统的智能性。
当前会议系统主要以两种模式存在,其一为使用单个收音设备进行收音,通过移动该收音设备进行收音,收音效果较差,且不便于使用;其二为使用多个收音设备进行收音,但多个收音设备需要增加大量额外的硬件对会议系统进行改造,改造成本高。并且无论是单收音设备还是多收音设备的会议系统,均通过将会议系统记录的音频数据转换为文本信息存储,来形成会议记录供后续查看。但该会议记录是对音频数据的简单转换,会议相关的内容依赖人为查找添加,会议记录生成的过程不够智能。
因此,如何低成本的形成高智能性的会议系统是当前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种会议记录生成方法、装置、设备及可读存储介质,旨在解决现有技术中如何低成本的形成高智能性的会议系统的技术问题。
为实现上述目的,本发明提供一种会议记录生成方法,所述会议记录生成方法应用于会议系统,所述会议系统基于添加到会议中的多个移动终端形成,所述会议记录生成方法包括以下步骤:
接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
可选地,所述对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息的步骤包括:
基于预设主题模型,对多份所述文本信息进行语义识别,生成所述会议主题信息;
根据各所述声音信号对应的用户标识,对多份所述文本信息进行归类,生成与各所述移动终端分别对应的归类文本信息;
基于预设主题模型,对各所述归类文本信息进行语义识别,生成与各所述移动终端分别对应的用户观点信息。
可选地,所述接收会议中各移动终端采集的声音信号的步骤之后,所述方法还包括:
从各所述移动终端采集的声音信号中分别提取出待识别声纹信息,并根据与各所述移动终端关联的声纹信息,判断各所述待识别声纹信息是否有效;
若各所述待识别声纹信息有效,则根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤,以更新各所述声音信号。
可选地,所述判断各所述待识别声纹信息是否有效的步骤之后,所述方法还包括:
若各所述待识别声纹信息中存在无效的待识别声纹信息,则查找与无效的所述待识别声纹信息对应的目标移动终端;
判断所述目标移动终端是否携带有授权标识,若携带有授权标识,则执行根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤的步骤;
若未携带有授权标识,则将所述目标移动终端移出会议。
可选地,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤包括:
根据多份所述文本信息对应的时间信息,对多份所述文本信息进行排列;
将各所述用户观点信息及所述会议主题信息添加到排列后的多份所述文本信息中,生成为会议记录。
可选地,所述接收会议中各移动终端采集的声音信号的步骤之前,所述方法还包括:
基于各所述移动终端,采集各所述移动终端持有者的声纹信息;
将各所述移动终端与各所述移动终端持有者的声纹信息形成关联关系,并将各所述关联关系添加到声纹数据库存储。
可选地,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤之后,所述方法还包括:
将所述会议记录发送到各所述移动终端展示。
进一步地,为实现上述目的,本发明还提供一种会议记录生成装置,所述会议记录生成装置包括:
接收模块,用于接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
识别模块,用于对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
生成模块,用于将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
进一步地,为实现上述目的,本发明还提供一种会议系统,所述会议系统包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的会议记录生成程序,所述会议记录生成程序被所述处理器执行时实现如上述所述的会议记录生成方法的步骤。
进一步地,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有会议记录生成程序,所述会议记录生成程序被处理器执行时实现如上所述的会议记录生成方法的步骤。
本发明的会议记录生成方法,装置、设备即计算机可读存储介质,所述会议记录生成方法应用于将多个移动终端添加到会议中所形成的会议系统,通过各个移动终端进行收音,采集各移动终端持有者的声音信号。会议系统在接收到会议中各移动终端采集的声音信号后,对各个声音信号进行识别转换,得到多份文本信息;并且对多份文本信息进行语义识别,得到表征各移动终端持有者观点的用户观点信息,以及该次会议的会议主题信息;进而将多份文本信息、各用户观点信息和会议主题信息生成为会议记录。通过将多个移动终端作为收音设备形成会议系统,一方面避免了会议系统因单个收音设备所存在的收音效果差,使用不便的问题;另一方面避免了多个收音设备对会议系统改造所存在的成本高问题;并且针对多份文本信息进行语义识别,自动生成用户观点信息和会议主题信息,避免了人为查找添加,提升了会议记录生成的效率和智能性。因此,实现了以低成本形成高智能性的会议系统。
附图说明
图1为本发明会议系统实施例方案涉及的设备硬件运行环境的结构示意图;
图2为本发明会议记录生成方法第一实施例的流程示意图;
图3为本发明会议记录生成装置较佳实施例的功能模块示意图;
图4为本发明会议记录生成方法所应用会议系统的架构图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种会议系统,参照图1,图1为本发明会议系统实施例方案涉及的设备硬件运行环境的结构示意图。
如图1所示,该会议系统可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
本领域技术人员可以理解,图1中示出的会议系统的硬件结构并不构成对会议系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及会议记录生成程序。其中,操作系统是管理和控制会议系统与软件资源的程序,支持网络通信模块、用户接口模块、会议记录生成程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1004;用户接口模块用于管理和控制用户接口1003。
在图1所示的会议系统硬件结构中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;处理器1001可以调用存储器1005中存储的会议记录生成程序,并执行以下操作:
接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
进一步地,所述对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息的步骤包括:
基于预设主题模型,对多份所述文本信息进行语义识别,生成所述会议主题信息;
根据各所述声音信号对应的用户标识,对多份所述文本信息进行归类,生成与各所述移动终端分别对应的归类文本信息;
基于预设主题模型,对各所述归类文本信息进行语义识别,生成与各所述移动终端分别对应的用户观点信息。
进一步地,所述接收会议中各移动终端采集的声音信号的步骤之后,处理器1001可以调用存储器1005中存储的会议记录生成程序,并执行以下操作:
从各所述移动终端采集的声音信号中分别提取出待识别声纹信息,并根据与各所述移动终端关联的声纹信息,判断各所述待识别声纹信息是否有效;
若各所述待识别声纹信息有效,则根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤,以更新各所述声音信号。
进一步地,所述判断各所述待识别声纹信息是否有效的步骤之后,处理器1001可以调用存储器1005中存储的会议记录生成程序,并执行以下操作:
若各所述待识别声纹信息中存在无效的待识别声纹信息,则查找与无效的所述待识别声纹信息对应的目标移动终端;
判断所述目标移动终端是否携带有授权标识,若携带有授权标识,则执行根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤的步骤;
若未携带有授权标识,则将所述目标移动终端移出会议。
进一步地,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤包括:
根据多份所述文本信息对应的时间信息,对多份所述文本信息进行排列;
将各所述用户观点信息及所述会议主题信息添加到排列后的多份所述文本信息中,生成为会议记录。
进一步地,所述接收会议中各移动终端采集的声音信号的步骤之前,处理器1001可以调用存储器1005中存储的会议记录生成程序,并执行以下操作:
基于各所述移动终端,采集各所述移动终端持有者的声纹信息;
将各所述移动终端与各所述移动终端持有者的声纹信息形成关联关系,并将各所述关联关系添加到声纹数据库存储。
进一步地,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤之后,处理器1001可以调用存储器1005中存储的会议记录生成程序,并执行以下操作:
将所述会议记录发送到各所述移动终端展示。
本发明会议系统的具体实施方式与下述会议记录生成方法各实施例基本相同,在此不再赘述。
本发明还提供一种会议记录生成方法。
参照图2,图2为本发明会议记录生成方法第一实施例的流程示意图。
本发明实施例提供了会议记录生成方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。具体地,本实施例中的会议记录生成方法应用于会议系统,会议系统基于添加到会议中的多个移动终端形成,该会议记录生成方法包括:
步骤S10,接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
本实施例中的会议记录生成方法应用于会议系统,并且,会议系统由添加到会议中的多个移动终端形成。移动终端为手机、平板电脑等会议参与者使用的智能终端。先在移动终端内安装可接入会议的客户端软件,通过软件接入到服务器,形成为会议系统。请参照图4,图4示出了会议系统的架构。图4中会议系统的服务器形成服务层,各移动终端通过网络层接入到服务层。网络层可以通过外网云端调用形成,也可以通过内网私有化部署形成。服务层向接入的移动终端提供算法服务和后台系统的管理服务。提供的算法服务包括但不限于语音识别、声纹识别等,后台系统的关联服务则至少包括会议处理、会议管理和用户管理等。其中会议处理主要为生成会议记录,会议管理主要为预约召集会议,用户管理主要为将用户接入会议系统。
当需要通过会议系统召开会议时,由会议组织者或者会议系统管理员申请启动会议系统,得到会议号反馈到各个会议参与者,各个会议参与者通过会议号申请加入会议系统,会议参与者所持有的移动终端作为会议中的收音设备,采集声音信号传输到会议系统的服务器进行处理,以此避免额外增加收音设备,并且各会议参与者均使用各自的移动终端进行收音,保障了会议参与者各自的收音效果。
可理解地,会议的参会者众多,并且会议参与者在会议中可能是逐一发言,也可能是分团体讨论式的同时发言。对于逐一发言会议中可能存在环境噪音,导致由发言者移动终端采集的声音信号中包含有噪音;对于同时发言,则多个发言者的移动终端不可避免的采集到其他发言者的声音信号,互相形成各移动终端采集声音信号中的噪音。因此会议系统通过各移动终端收音,接收到各移动终端采集的声音信号之后,对各个声音信号进行区分,以区分出各个会议参与者在会议中的发言内容,转换为实时的文字信息显示到各移动终端供各会议参与者查看。并且,本实施例通过预先设定的与移动终端绑定的声纹信息,对各个声音信号进行区分。先查找与移动终端绑定的声纹信息,再对移动终端采集的声音信号进行分析,确定与声纹信息匹配的声音信号,提取该声音信号作为移动终端持有者在会议中的发言内容。
进一步地,在区分出各移动终端采集的声音信号之后,则对各声音信号进行转换识别,转换为文本信息按照各声音信号的采集时间,和会议参与者的用户名逐一显示在各移动终端,实现边采集边转换,供会议参与者实时查看。具体地,会议系统的服务器中预先设置有对声音信号进行识别转换的语音识别算法,会议系统在接收到各移动终端采集的声音信号后,调用该识别算法对各声音信号进行识别,将各声音信号转换为各自的文本信息,得到多份文本信息。进而依据各声音信号的采集时间,将多份文本信息和各自的声音信号逐条对应显示,便于各会议参与者查看。
步骤S20,对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
更进一步地,会议系统的服务器中预先设定有用于分析主题的预设主题模型,如概率主题模型。在识别各声音信号,得到多份文本信息显示的同时,还通过预设主题模型对多份文本信息进行语义识别,得到多份文本信息各自反映的主题,以及多份文本信息整体所反映的主题。其中,多份文本信息各自反映的主题体现了各会议参与者的观点,为与各移动终端对应的用户观点信息;整体反映的主题体现了会议整体上的主题议题,为会议主题信息。
步骤S30,将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
进一步地,在将会议中各移动终端采集的声音信号转换为多份文本信息,并从多份文本信息中提取出各会议参与者的用户观点信息和会议主题信息之后,则将多份文本信息、各用户观点信息和会议主题信息形成为会议记录,便于后续对会议内容的查看。具体地,将多份文本信息、各用户观点信息以及会议主题信息生成为会议记录的步骤包括:
步骤S31,根据多份所述文本信息对应的时间信息,对多份所述文本信息进行排列;
步骤S32,将各所述用户观点信息及所述会议主题信息添加到排列后的多份所述文本信息中,生成为会议记录。
更进一步地,预先针对不同的会议主题设定不同的会议记录模板,在生成会议记录的过程中,先调用与会议主题信息匹配的会议记录模板。并且,查找生成多份文本信息的各声音信号的采集时间,并将该采集时间作为与多份文本信息对应的时间信息。进而依据该时间信息,将多份文本信息添加到会议记录模板中排列;时间信息在前的文本信息排列在前,时间信息在后的文本信息排列在后,形成依据时间顺序排列的多份文本信息,体现各会议参与者在时间先后顺序上的发言内容。此后,将各用户观点信息和会议主题信息添加到排列后的多份文本信息中,添加的位置可以是会议记录模板中预先设定的为位置,也可以是自定义的位置。以此,形成最终的会议记录发送到各移动终端进行可视化展示,体现会议参与者在会议中具体发言内容的同时,便于快速查看各会议参与者的观点和会议的主题;避免人工添加会议主题,会议系统的智能性更高。
本发明的会议记录生成方法,应用于将多个移动终端添加到会议中所形成的会议系统,通过各个移动终端进行收音,采集各移动终端持有者的声音信号。会议系统在接收到会议中各移动终端采集的声音信号后,对各个声音信号进行识别转换,得到多份文本信息;并且对多份文本信息进行语义识别,得到表征各移动终端持有者观点的用户观点信息,以及该次会议的会议主题信息;进而将多份文本信息、各用户观点信息和会议主题信息生成为会议记录。通过将多个移动终端作为收音设备形成会议系统,一方面避免了会议系统因单个收音设备所存在的收音效果差,使用不便的问题;另一方面避免了多个收音设备对会议系统改造所存在的成本高问题;并且针对多份文本信息进行语义识别,自动生成用户观点信息和会议主题信息,避免了人为查找添加,提升了会议记录生成的效率和智能性。因此,实现了以低成本形成高智能性的会议系统。
进一步地,基于本发明会议记录生成方法的第一实施例,提出本发明会议记录生成方法第二实施例。
所述会议记录生成方法第二实施例与所述会议记录生成方法第一实施例的区别在于,所述对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息的步骤包括:
步骤S21,基于预设主题模型,对多份所述文本信息进行语义识别,生成所述会议主题信息;
步骤S22,根据各所述声音信号对应的用户标识,对多份所述文本信息进行归类,生成与各所述移动终端分别对应的归类文本信息;
步骤S23,基于预设主题模型,对各所述归类文本信息进行语义识别,生成与各所述移动终端分别对应的用户观点信息。
本实施例通过预设主题模型,来生成用户观点信息和会议主题信息。具体地,预先用大量训练文本对初始模型进行训练,直到初始模型可准确识别大量训练文本的语义,抽取其中的主题信息后,将初始模型生成为预设主题模型。对于经转换得到多份文本信息,调用该预设主题模型对其进行语义识别,抽取其中的主题词,并计算各个主题词的分值,将分值最大的主题词确定为会议主题信息,以表征会议主题。需要说明的是,对于多个主题词均具有较高的分值,且各分值相差不大的情况,说明会议可能具有多个主题。此时,可将该多个主题词一并设定为主题信息,体现会议在多个方面的主题。
可理解地,多份文本信息依据会议参与者的发言时间顺序生成,同一会议参与者在不同时间具有不同的发言内容,使得同一会议参与者在多份文本信息中不止一份文本信息。因此,为了准确生成用户观点信息,本实施例针对同一会议参与者的发言内容进行归类。具体地,每个会议参与者均通过各自的移动终端收集声音信号,所收集的声音信号中携带有表征其来源移动终端的标识,经声音信号转换得到的文本信息也携带该移动终端的标识,从而可依据各文本信息所携带的标识进行归类。将各声音信号所携带的标识作为与各声音信号对应的用户标识,并根据各用户标识,对多份文本信息进行归类,将相同用户标识的文本信息归为同一类,而将不同用户标识的文本信息归为不同类。归类完成后,所得到的归类数量与移动终端的数量一致,各类文本信息形成为与各移动终端对应的归类文本信息。
进一步地,通过预设主题模型对各归类文本信息分别进行语义识别,针对每一归类文本信息抽取各自的主题词,并计算各自主题词的分值,将各自分值最大的主题词确定为各类文本信息的目标主题词。该各目标主题词体现了各会议参与者发言的核心观点,因而将其生成为与各移动终端对应的用户观点信息。同样地,对于某归类文本信息,若其生成的多个主题词均具有较高的分值,且各分值相差不大,则说明其对应的会议参与者具有多个核心观点,故而将该多个主题词一并生成为与其移动终端对应的用户观点信息,以体现在多个方面的观点。
本实施例通过预设主题模型,从多份文本信息中抽取出会议主题信息,体现会议主题,避免依赖会议组织者确定会议主题,会议系统的智能性更高。并且,通过将多份文本信息归类来生成各移动终端对应的用户观点信息,有利于准确反映各会议参与者的观点。
进一步地,基于本发明会议记录生成方法的第一或第二实施例,提出本发明会议记录生成方法第三实施例。
所述会议记录生成方法第三实施例与所述会议记录生成方法第一或第二实施例的区别在于,所述接收会议中各移动终端采集的声音信号的步骤之前,还包括:
步骤a1,基于各所述移动终端,采集各所述移动终端持有者的声纹信息;
步骤a2,将各所述移动终端与各所述移动终端持有者的声纹信息形成关联关系,并将各所述关联关系添加到声纹数据库存储。
本实施例预先将移动终端和移动终端持有者的声纹信息进行绑定,以通过绑定的声纹信息对各个声音信号进行提取。具体地,通过各移动终端采集各移动终端持有者的音频信号,并对音频信号进行特征提取,形成各移动终端持有者的声纹信息;其中,所提取的特征包括但不限于共振峰的数量、走向及其频率等。进而将各移动终端和各移动终端持有者的声纹信息形成为关联关系,并将各关联关系添加到与会议系统对接的声纹数据库中存储。并且,关联关系可以是key_value键值对的形式存在,key作为移动终端,value作为移动终端持有者的声纹信息。
进一步地,在接收到各移动终端采集的声音信号后,即可通过声纹数据库中绑定的关联关系,将各声音信号中的噪音去除,提取其中有效的声音信号,以此更新各移动终端采集的声音信号进行识别,转换为文本信息。
更进一步地,考虑到会议中某些参与者可能存在冒名顶替的情况,如某些有资质的参与者不想或者没有时间参与会议,而让其他没有资质的参与者冒用其移动终端参与。因此,为了避免该类情况的发生,本实施例设置有验证机制,在接收到各移动终端采集的声音信号后即启动验证机制;具体地,接收会议中各移动终端采集的声音信号的步骤之后,还包括:
步骤b1,从各所述移动终端采集的声音信号中分别提取出待识别声纹信息,并根据与各所述移动终端关联的声纹信息,判断各所述待识别声纹信息是否有效;
步骤b2,若各所述待识别声纹信息有效,则根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤,以更新各所述声音信号。
进一步地,从各移动终端采集的声音信号中分别提取各自的待识别声纹信息,并查找各移动终端在声纹数据库的关联关系,并将各关联关系中绑定的声纹信息作为与各移动终端关联的声纹信息。进而针对每一移动终端,将其关联的声纹信息和从该移动终端采集的声音信号中提取的待识别声纹信息对比。判断声纹信息和待识别声纹信息是否一致,或者相似度大于预设阈值,若一致或者相似度大于预设阈值,则判定待识别声纹信息有效,说明会议参与者和移动终端匹配。进而根据移动终端关联的声纹信息,对声音信号进行过滤,将该声音信号中其他会议参与者所形成的噪音去除,保留移动终端匹配会议参与者的声音信号进行提取,得到有效的更新声音信号进行识别转换。
可理解地,在判断待识别声纹信息有效性的过程中,可能出现经判断无效的情况,此时说明会议参与者出现冒名顶替的情况,需要进行进一步的授权判定。具体地,判断各待识别声纹信息是否有效的步骤之后,还包括:
步骤b3,若各所述待识别声纹信息中存在无效的待识别声纹信息,则查找与无效的所述待识别声纹信息对应的目标移动终端;
步骤b4,判断所述目标移动终端是否携带有授权标识,若携带有授权标识,则执行根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤的步骤;
步骤b5,若未携带有授权标识,则将所述目标移动终端移出会议。
进一步地,若经对比确定各待识别声纹信息中存在任意一项无效的待识别声纹信息,即某一待识别声纹信息和其对应声纹信息之间的相似度小于预设阈值,表征两者具有较大差异性时,则判定待识别声纹信息无效;通过移动终端采集的待识别声纹信息不是与移动终端绑定的声纹信息,当前使用移动终端参与会议的参与者不是移动终端的持有者。此时,先依据待识别声纹信息所来源声音信号携带的移动终端的标识,确定与待识别声纹信息对应的目标移动终端,即冒用的移动终端。再检测该目标移动终端是否携带有授权标识。其中,授权标识为使用移动终端参与会议的参与者与移动终端的持有者不一致时,由移动终端的持有者向会议系统申请而形成的标识。在会议开始前,移动终端的持有者通过其移动终端向会议系统发起会议代替申请,会议系统将该代替申请发送到管理者或者会议组织者;会议管理者或者会议组织者根据代替申请中的代替人信息,向会议系统返回同意申请或者不同意申请的指令。会议系统在接收到同意申请指令后,向发起会议代替申请的移动终端分配授权标识,使得该移动终端携带有授权标识。
更进一步地,若经确定目标终端携带有授权标识,则说明虽然使用移动终端参与会议的参与者与移动终端的持有者不一致,但是该会议参与者得到有效授权具有参与会议的资格,故根据移动终端关联的声纹信息,对声音信号进行过滤。反之,若经确定目标移动终端未携带有授权标识,表征会议不能由其他使用移动终端的使用者代替移动终端持有者参与会议,或者移动终端持有者未发起会议代替申请。此时,将目标移动终端移出会议,以禁止非移动终端持有者参与会议,避免会议内容的泄露。
需要说明的是,因会议参与者与终端持有者不一致,使得关联的声纹信息与移动终端所采集声音信号中的声纹信息不一致,此时若仍然用移动终端原始关联的声纹信息对声音信号进行过滤,会将经移动终端采集的所有声音信号过滤掉。因此,在移动终端持有者申请会议代替的同时,通过移动终端采集使用移动终端参与会议的参与者的音频信号上传到会议系统,会议系统在接收到同意申请指令后,从该音频信号中提取出声纹信息和移动终端形成新的关联关系传输到声纹数据库保存,并且针对该新的关联关系添加临时标识,以便于在该次会议结束后对具有临时标识表征非移动终端持有者声纹信息的关联关系删除。如此,对于会议参与者与终端持有者不一致的情况,在根据移动终端关联的声纹信息,对声音信号过滤的过程中,通过新的关联关系,确定与移动终端关联的新声纹信息,以依据该新声纹信息,对声音信号过滤,避免将移动终端采集的所有声音信号过滤,确保提取到准确的声音信号进行识别转换。
本实施例将移动终端和移动终端持有者的声纹信息绑定形成关联关系,通过移动终端采集声音信号中声纹信息与绑定声纹信息的一致性,来判定使用移动终端参与会议的参与者是否存在冒名顶替的情况,确保会议参与者具有参与资质,避免会议内容的泄密。同时对于需要代替参会的清洗,设置授权机制,在确保会议安全的同时不失灵活性。
本发明还提供一种会议记录生成装置。
参照图3,图3为本发明会议记录生成装置第一实施例的功能模块示意图。
所述会议记录生成装置包括:
接收模块10,用于接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
识别模块20,用于对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
生成模块30,用于将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
进一步地,所述识别模块20还包括:
识别单元,用于基于预设主题模型,对多份所述文本信息进行语义识别,生成所述会议主题信息;
归类单元,用于根据各所述声音信号对应的用户标识,对多份所述文本信息进行归类,生成与各所述移动终端分别对应的归类文本信息;
生成单元,用于基于预设主题模型,对各所述归类文本信息进行语义识别,生成与各所述移动终端分别对应的用户观点信息。
进一步地,所述会议记录生成装置还包括:
提取模块,用于从各所述移动终端采集的声音信号中分别提取出待识别声纹信息,并根据与各所述移动终端关联的声纹信息,判断各所述待识别声纹信息是否有效;
过滤模块,用于若各所述待识别声纹信息有效,则根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤,以更新各所述声音信号。
进一步地,所述会议记录生成装置还包括:
查找模块,用于若各所述待识别声纹信息中存在无效的待识别声纹信息,则查找与无效的所述待识别声纹信息对应的目标移动终端;
判断模块,用于判断所述目标移动终端是否携带有授权标识,若携带有授权标识,则执行根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤的步骤;
移出模块,用于若未携带有授权标识,则将所述目标移动终端移出会议。
进一步地,所述生成模块30还包括:
排列单元,用于根据多份所述文本信息对应的时间信息,对多份所述文本信息进行排列;
添加单元,用于将各所述用户观点信息及所述会议主题信息添加到排列后的多份所述文本信息中,生成为会议记录。
进一步地,所述会议记录生成装置还包括:
采集模块,用于基于各所述移动终端,采集各所述移动终端持有者的声纹信息;
添加模块,用于将各所述移动终端与各所述移动终端持有者的声纹信息形成关联关系,并将各所述关联关系添加到声纹数据库存储。
进一步地,所述会议记录生成装置还包括:
展示模块,用于将所述会议记录发送到各所述移动终端展示。
本发明会议记录生成装置具体实施方式与上述会议记录生成方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种可读存储介质。
可读存储介质上存储有会议记录生成程序,会议记录生成程序被处理器执行时实现如上所述的会议记录生成方法的步骤。
本发明可读存储介质可以是计算机可读存储介质,其具体实施方式与上述会议记录生成方法各实施例基本相同,在此不再赘述。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。
Claims (10)
1.一种会议记录生成方法,其特征在于,所述会议记录生成方法应用于会议系统,所述会议系统基于添加到会议中的多个移动终端形成,所述会议记录生成方法包括以下步骤:
接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
2.如权利要求1所述的会议记录生成方法,其特征在于,所述对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息的步骤包括:
基于预设主题模型,对多份所述文本信息进行语义识别,生成所述会议主题信息;
根据各所述声音信号对应的用户标识,对多份所述文本信息进行归类,生成与各所述移动终端分别对应的归类文本信息;
基于预设主题模型,对各所述归类文本信息进行语义识别,生成与各所述移动终端分别对应的用户观点信息。
3.如权利要求1所述的会议记录生成方法,其特征在于,所述接收会议中各移动终端采集的声音信号的步骤之后,所述方法还包括:
从各所述移动终端采集的声音信号中分别提取出待识别声纹信息,并根据与各所述移动终端关联的声纹信息,判断各所述待识别声纹信息是否有效;
若各所述待识别声纹信息有效,则根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤,以更新各所述声音信号。
4.如权利要求3所述的会议记录生成方法,其特征在于,所述判断各所述待识别声纹信息是否有效的步骤之后,所述方法还包括:
若各所述待识别声纹信息中存在无效的待识别声纹信息,则查找与无效的所述待识别声纹信息对应的目标移动终端;
判断所述目标移动终端是否携带有授权标识,若携带有授权标识,则执行根据各所述移动终端关联的声纹信息,对各所述声音信号进行过滤的步骤;
若未携带有授权标识,则将所述目标移动终端移出会议。
5.如权利要求1-4任一项所述的会议记录生成方法,其特征在于,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤包括:
根据多份所述文本信息对应的时间信息,对多份所述文本信息进行排列;
将各所述用户观点信息及所述会议主题信息添加到排列后的多份所述文本信息中,生成为会议记录。
6.如权利要求1-4任一项所述的会议记录生成方法,其特征在于,所述接收会议中各移动终端采集的声音信号的步骤之前,所述方法还包括:
基于各所述移动终端,采集各所述移动终端持有者的声纹信息;
将各所述移动终端与各所述移动终端持有者的声纹信息形成关联关系,并将各所述关联关系添加到声纹数据库存储。
7.如权利要求1-4任一项所述的会议记录生成方法,其特征在于,所述将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录的步骤之后,所述方法还包括:
将所述会议记录发送到各所述移动终端展示。
8.一种会议记录生成装置,其特征在于,所述会议记录生成装置包括:
接收模块,用于接收会议中各移动终端采集的声音信号,并分别识别各所述声音信号,获得多份文本信息;
识别模块,用于对多份所述文本信息进行语义识别,生成与各所述移动终端对应的用户观点信息,以及会议主题信息;
生成模块,用于将多份所述文本信息、各所述用户观点信息以及所述会议主题信息生成为会议记录。
9.一种会议系统,其特征在于,所述会议系统基于添加到会议中的多个移动终端形成,所述会议系统包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的会议记录生成程序,所述会议记录生成程序被所述处理器执行时实现如权利要求1-7中任一项所述的会议记录生成方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有会议记录生成程序,所述会议记录生成程序被处理器执行时实现如权利要求1-7中任一项所述的会议记录生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464020.XA CN111626061A (zh) | 2020-05-27 | 2020-05-27 | 会议记录生成方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464020.XA CN111626061A (zh) | 2020-05-27 | 2020-05-27 | 会议记录生成方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111626061A true CN111626061A (zh) | 2020-09-04 |
Family
ID=72272263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464020.XA Pending CN111626061A (zh) | 2020-05-27 | 2020-05-27 | 会议记录生成方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626061A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112053679A (zh) * | 2020-09-08 | 2020-12-08 | 安徽声讯信息技术有限公司 | 一种基于移动终端的角色分离会议速记系统及方法 |
CN112686006A (zh) * | 2021-01-04 | 2021-04-20 | 深圳前海微众银行股份有限公司 | 音频的识别文本校正方法、音频识别设备、装置和介质 |
CN116708709A (zh) * | 2023-08-01 | 2023-09-05 | 深圳市海域达赫科技有限公司 | 一种基于云服务的通讯系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022583A (zh) * | 2017-11-17 | 2018-05-11 | 平安科技(深圳)有限公司 | 会议纪要生成方法、应用服务器及计算机可读存储介质 |
CN108132995A (zh) * | 2017-12-20 | 2018-06-08 | 北京百度网讯科技有限公司 | 用于处理音频信息的方法和装置 |
CN108198547A (zh) * | 2018-01-18 | 2018-06-22 | 深圳市北科瑞声科技股份有限公司 | 语音端点检测方法、装置、计算机设备和存储介质 |
CN108595645A (zh) * | 2018-04-26 | 2018-09-28 | 深圳市鹰硕技术有限公司 | 会议发言管理方法以及装置 |
CN109388701A (zh) * | 2018-08-17 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、装置、设备和计算机存储介质 |
CN110134756A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、电子装置及存储介质 |
CN110322872A (zh) * | 2019-06-05 | 2019-10-11 | 平安科技(深圳)有限公司 | 会议语音数据处理方法、装置、计算机设备和存储介质 |
-
2020
- 2020-05-27 CN CN202010464020.XA patent/CN111626061A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022583A (zh) * | 2017-11-17 | 2018-05-11 | 平安科技(深圳)有限公司 | 会议纪要生成方法、应用服务器及计算机可读存储介质 |
CN108132995A (zh) * | 2017-12-20 | 2018-06-08 | 北京百度网讯科技有限公司 | 用于处理音频信息的方法和装置 |
CN108198547A (zh) * | 2018-01-18 | 2018-06-22 | 深圳市北科瑞声科技股份有限公司 | 语音端点检测方法、装置、计算机设备和存储介质 |
CN108595645A (zh) * | 2018-04-26 | 2018-09-28 | 深圳市鹰硕技术有限公司 | 会议发言管理方法以及装置 |
CN109388701A (zh) * | 2018-08-17 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、装置、设备和计算机存储介质 |
CN110134756A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 会议记录生成方法、电子装置及存储介质 |
CN110322872A (zh) * | 2019-06-05 | 2019-10-11 | 平安科技(深圳)有限公司 | 会议语音数据处理方法、装置、计算机设备和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112053679A (zh) * | 2020-09-08 | 2020-12-08 | 安徽声讯信息技术有限公司 | 一种基于移动终端的角色分离会议速记系统及方法 |
CN112686006A (zh) * | 2021-01-04 | 2021-04-20 | 深圳前海微众银行股份有限公司 | 音频的识别文本校正方法、音频识别设备、装置和介质 |
CN116708709A (zh) * | 2023-08-01 | 2023-09-05 | 深圳市海域达赫科技有限公司 | 一种基于云服务的通讯系统及方法 |
CN116708709B (zh) * | 2023-08-01 | 2024-03-08 | 深圳市海域达赫科技有限公司 | 一种基于云服务的通讯系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111883123B (zh) | 基于ai识别的会议纪要生成方法、装置、设备及介质 | |
CN110853646B (zh) | 会议发言角色的区分方法、装置、设备及可读存储介质 | |
CN110517689B (zh) | 一种语音数据处理方法、装置及存储介质 | |
CN111626061A (zh) | 会议记录生成方法、装置、设备及可读存储介质 | |
WO2020220546A1 (zh) | 一种基于人脸识别的会议管理方法、系统和可读存储介质 | |
US20040064322A1 (en) | Automatic consolidation of voice enabled multi-user meeting minutes | |
CN109474763A (zh) | 一种基于语音、语义的ai智能会议系统及其实现方法 | |
WO2021169171A1 (zh) | 事故信息快速采集方法、装置、计算机设备及存储介质 | |
CN109671438A (zh) | 一种利用语音提供辅助服务的装置及方法 | |
CN109560941A (zh) | 会议记录方法、装置、智能终端及存储介质 | |
CN112468665A (zh) | 一种会议纪要的生成方法、装置、设备及存储介质 | |
CN112653902A (zh) | 说话人识别方法、装置及电子设备 | |
CN109271503A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN110188364B (zh) | 基于智能眼镜的翻译方法、设备及计算机可读存储介质 | |
CN111062221A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN110782341A (zh) | 业务催收方法、装置、设备及介质 | |
CN114125494A (zh) | 内容审核辅助处理方法、装置及电子设备 | |
CN114240342A (zh) | 一种会议控制的方法和装置 | |
CN112562677A (zh) | 会议语音转写方法、装置、设备及存储介质 | |
CN107196979A (zh) | 基于语音识别的叫号预提醒系统 | |
CN113573029B (zh) | 一种基于iot的多方音视频交互方法及系统 | |
CN113259620B (zh) | 视频会议数据同步方法及装置 | |
CN112367494B (zh) | 基于ai的在线会议通讯方法、装置及计算机设备 | |
CN111970295B (zh) | 基于多终端的通话事务管理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |