CN113517002A - 信息处理方法、装置以及系统、会议端、服务器 - Google Patents

信息处理方法、装置以及系统、会议端、服务器 Download PDF

Info

Publication number
CN113517002A
CN113517002A CN202010219959.XA CN202010219959A CN113517002A CN 113517002 A CN113517002 A CN 113517002A CN 202010219959 A CN202010219959 A CN 202010219959A CN 113517002 A CN113517002 A CN 113517002A
Authority
CN
China
Prior art keywords
conference
information
target user
identity information
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010219959.XA
Other languages
English (en)
Inventor
张守闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nail Holding Cayman Co ltd
Dingtalk Holding Cayman Ltd
Original Assignee
Nail Holding Cayman Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nail Holding Cayman Co ltd filed Critical Nail Holding Cayman Co ltd
Priority to CN202010219959.XA priority Critical patent/CN113517002A/zh
Publication of CN113517002A publication Critical patent/CN113517002A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例提供一种信息处理方法、装置以及系统、会议端、服务器,所述方法包括:会议端确定其所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。本申请实施例提高会议记录的生成效率。

Description

信息处理方法、装置以及系统、会议端、服务器
技术领域
本申请涉及电子设备领域,尤其涉及一种信息处理方法以及系统、会议端、服务器。
背景技术
会议记录是指将会议的组织情况以及会议过程中关键内容记录下来所形成的文档或文件,以便于查看会议的具体内容。
现有技术中,可以在会议过程中由参会人员手工记录。或者可以采用录音笔、手机等终端上的录音笔功能、录音设备等会议端采集会议过程中的会议录音,并在会议结束之后,由人工手工记录会议过程中的会议内容。
但是,采用手工记录的方式,工作量大且记录效率比较低,目前并没有一种有效手段可以解决该技术问题。
发明内容
有鉴于此,本发明实施例提供一种信息处理方法、装置以及系统、会议端、服务器,用以解决现有技术中采用手工对会议内容进行记录,导致会议记录的工作量比较大且行工作效率低的技术问题。
于是,在本发明的一个实施例中,提供了一种信息处理方法。该方法包括:
会议端确定其所在室内空间中至少一个参会用户中的目标用户;
采集所述目标用户的语音信息;
确定所述目标用户的身份信息;
为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;
将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本发明的又一个实施例中,提供了一种信息处理方法,包括:
服务端接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;
根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本发明的又一个实施例中,提供一种信息处理方法,包括:
第一会议端确定其所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
采集所述第一目标用户的语音信息;
确定所述第一目标用户的身份信息;
为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;
根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
在本发明的又一个实施例中,提供一种信息处理方法,包括:
第一会议端确定其所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
采集所述第一目标用户的语音信息;
确定所述第一目标用户的身份信息;
为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;
根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
在本申请的一个实施例中,提供一种信息处理装置,该信息处理装置可以应用于会议端,所述装置包括:
目标确定模块,用于确定所述会议端所在室内空间中至少一个参会用户中的目标用户;
语音采集模块,用于采集所述目标用户的语音信息;
身份识别模块,用于确定所述目标用户的身份信息;
关联建立模块,用于为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;
信息发送模块,用于将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本申请的又一个实施例中,提供一种信息处理装置,应用于服务端,包括:
信息接收模块,用于接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;
记录生成模块,用于根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本申请的又一个实施例中,提供一种信息处理装置,应用于第一会议端,包括:
第一确定模块,用于确定所述第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
第一采集模块,用于采集所述第一目标用户的语音信息;
第一识别模块,用于确定所述第一目标用户的身份信息;
第一建立模块,用于为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
第一接收模块,用于接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;
第一生成模块,用于根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
在本申请的一个实施例中,提供一种会议端,该会议端包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
确定会议端所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本申请的又一个实施例中,提供一种服务器,该服务器包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
在本发明的又一个实施例中,提供一种会议端,第一会议端可以包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
确定所述第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;采集所述第一目标用户的语音信息;确定所述第一目标用户的身份信息;为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
在本申请的一个实施例中,提供一种信息处理系统,该系统可以包括:至少一个会议端以及服务器;
所述至少一个会议端分别用于:确定其所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至所述服务器;
所述服务器用于:接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
本发明实施例提供的技术方案,会议端确定其所在室内空间中的至少一个参会用户中目标用户。目标用户为正在发言的用户,可以采集目标用户的语音信息,并确定目标用户的身份信息,目标用户的身份信息可以明确用户的身份,将目标用户的身份信息与语音信息建立关联关系之后,可以将存在关联关系的语音信息以及身份信息发送至服务端,服务端可以获取至少一个会议端发送的语音信息,以及每个语音信息关联的身份信息,并基于从至少一个会议端接收的语音信息以及每个语音信息关联的身份信息,生成会议记录。通过建立语音信息与身份信息的关联关系可以使得每个语音信息均与用户的身份信息相对应,进而可以明确每个语音信息的发言用户,通过关联的身份信息以及语音信息自动生成会议记录,提高会议记录的生成效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息处理方法的一个实施例的流程图;
图2为本发明实施例提供的一种信息处理方法的又一个实施例的流程图;
图3为本发明实施例提供的一种信息处理方法的又一个实施例的流程图;
图4为本发明实施例提供的一种信息处理方法的又一个实施例的流程图;
图5为本发明实施例提供的一种信息处理方法的示例图;
图6为本发明实施例提供的一种信息处理装置的一个实施例的结构示意图;
图7为本发明实施例提供的一种信息处理设备的一个实施例的结构示意图;
图8为本发明实施例提供的一种信息处理装置的又一个实施例的结构示意图;
图9为本发明实施例提供的一种信息处理设备的又一个实施例的结构示意图;
图10为本发明实施例提供的一种信息处理装置的又一个实施例的结构示意图;
图11为本发明实施例提供的一种信息处理设备的又一个实施例的结构示意图;
图12为本发明实施例提供的一种信息处理系统的一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于识别”。类似地,取决于语境,短语“如果确定”或“如果识别(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当识别(陈述的条件或事件)时”或“响应于识别(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
本申请实施例可以应用于多人会议场景中,在会议进行过程中,将各个用户的发言形成的语音信息以及发言用户的身份信息进行绑定,以在会议进行过程中,或者会议结束之后,利用已帮定的用户身份信息以及语音信息自动生成会议记录,提高会议记录的获取效率。
现有技术中,会议进行过程中,可以采用语音或者视频等方式将会议内容进行存储,并使用人工记录会议的具体内容或者关键内容,以获得会议记录。采用人工方式获取会议记录,工作量较大且工作效率较低。
为了解决上述技术问题,本申请实施例中,会议进行过程中,会议端可以确定其所在室内空间中至少一个参会用户中的目标用户,以采集目标用户的语音信息,并确定目标用户的身份信息,将目标用户的身份信息与语音信息建立关联关系之后,可以将存在关联关系的语音信息以及身份信息发送至服务端,服务端可以获取至少一个会议端发送的语音信息,每个语音信息可以关联有身份信息,并基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。通过建立语音信息与身份信息的关联关系可以使得每个语音信息均与用户的身份信息相对应,进而可以明确每个语音信息的发言用户,通过关联的身份信息以及语音信息自动生成会议记录,提高会议记录的生成效率。另外,在生成会议记录的过程中,将每个用户的身份信息以及语音信息关联起来,可以提高会议记录中的会议内容与用户的身份信息的关联性,从而可以降低记录中对不同用户的发言出现记录误差的可能性,提高会议记录的准确度以及有效性。
下面将结合附图对本申请实施例进行详细描述。
如图1所示,为本申请实施例提供的一种信息处理方法的一个实施例的流程图,所述方法可以包括以下几个步骤:
101:会议端确定其所在室内空间中至少一个参会用户中的目标用户。
102:采集目标用户的语音信息。
本申请实施例可以应用于会议端中,会议端可以为用户提供会议环境,通常,会议端可以指为用户提供本地服务的应用程序,会议端可以配置于包括计算机、智能终端、手机、平板、增强现实(Augmented Reality,AR)或虚拟现实(Virtual Reality,VR)设备、笔记本电脑、数字个人助理、智能音箱、可穿戴设备等电子设备中。本申请实施例对会议端所对应的电子设备的具体类型不作任何限制。
用户可以通过会议端实现诸如网络视频会议、现场会议或者网络电话会议等不同的通讯类型的会议。会议端可以包括至少一个,每个会议端均可以执行本申请实施例所述的信息处理方法。每个会议端可以对应至少一个参会用户,参会用户可以包括会议端所在室内空间中参加会议的用户。目标用户可以指会议端所在室内空间中参加会议的至少一个参会用户中发言的用户,每个参会用户均可以发言,发言的参会用户即为目标用户。
发言的目标用户可以按照发言时间的先后顺序进行采集。会议端可以采集任一个用户在进行一次发言时的语音信息。可以用个麦克风采集目标用户的语音信息,麦克风可以与会议端是一体设备,可以与会议端分离。在会议进行过程中,一个用户可能多次发言,可以针对用户每次的发言进行采集,获得该用户对应的语音信息。
可选地,可以在会议进行过程中,采集目标用户的语音信息。目标用户为会议进行过程中发言的参会用户。
103:确定目标用户的身份信息。
可选地,任一个参会用户的身份信息可以区别于其他参会用户,每个参会用户的身份信息不同。任一个用户的身份信息可以包括该用户的名字、身份标识、账号和/或手机号等信息。
104:为目标用户对应的身份信息以及语音信息建立关联关系。
将每个用户的语音信息以及身份信息关联起来,并可以基于关联的语音信息以及身份信息确定会议记录。
为目标用户对应的身份信息以及语音信息建立关联关系可以包括,以目标用户的身份信息为基础,按照预设的命名规则确定语音信息的语音名称,以此语音名称为该语音信息命名。为了避免重复命名,可以为不同的会议端设置会议端编号,并结合用户的身份信息以及已命名的语音信息的数量,按照一定的命名规则对语音信息进行命名。例如,可以标记一个会议端M1,该会议端已命名25个语音,用户的身份信息为“jone”,此时语音信息可以被命名为“M10025jone”。该关联方式仅仅是示例性的,并不构成对本申请关联方式的限定。
在一些实施例中,会议端在采集语音信息时,可以为采集的任一个语音信息随机生成一字符串作为语音名称,在建立目标用户的身份信息以及语音信息的关联关系时可以将目标用户的身份信息以及语音信息的名称对应存储到数据表或者数据库中,每个数据,例如,建立数据库时,可以将目标用户的身份信息以及语音信息的名称为字段内容以生成一个记录,并形成多个记录构成的数据库,从而可以通过数据库中查找语音信息对应的用户信息。
105:将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
其中,服务端可以指能够提供资源、数据处理或者信息处理等功能的计算设备,例如可以包括计算机等设备构成的服务器或者云服务器(Elastic Compute Service,ECS),本申请实施例对服务端的具体存在形式不作出过多限定。
可选地,任一会议端可以将存在关联关系的语音信息以及身份信息发送至服务端。服务端可以接收至少一个会议端发送的语音信息,以及每个语音信息关联的身份信息。在会议结束时,服务端接收到获取多个语音信息以及每个语音信息关联的身份信息,以基于从至少一个会议端接收的语音信息以及每个语音信息关联的身份信息生成会议记录。
会议端每采集到目标用户的语音信息,即可以确定目标用户的身份信息以及为目标用户对应的语音信息以及身份信息建立关联关系。在将存在关联关系的语音信息以及身份信息发送至服务端时,可以在会议进行过程中将采集获得的语音信息以及每个语音信息关联的身份信息发送至服务端,也可以在会议结束时,将所有存在关联关系的语音信息以及身份信息发送至服务端,或者还可以按照一定的时间间隔,将每个时间段内获得的存在关联关系的语音信息以及身份信息发送至服务端。本申请实施例对存在关联关系的语音信息以及身份信息的发送形式以及发送频率不作过多限定。
采集的语音信息可以被会议端发送至服务端,由服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息完成会议记录的生成过程。
本申请实施例中,会议进行过程中,会议端可以确定其所在室内空间中至少一个参会用户中的目标用户,以采集目标用户的语音信息,在确定目标用户的身份信息之后,可以将目标用户的身份信息与语音信息建立关联关系。将存在关联关系的语音信息以及身份信息发送至服务端,服务端可以基于至少一个会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。通过建立语音信息与身份信息的关联关系可以使得每个语音信息均与用户的身份信息相对应,进而可以明确每个语音信息的发言用户,通过关联的身份信息以及语音信息自动生成会议记录,提高会议记录的生成效率。
另外,在生成会议记录的过程中,将每个用户的身份信息以及语音信息关联起来,可以提高会议记录中的会议内容与用户的身份信息的关联性,从而可以降低记录中对不同用户的发言出现记录误差的可能性,提高会议记录的准确度以及有效性。
作为一个实施例,会议端确定其所在室内空间中至少一个参会用户中的目标用户可以包括:
所述会议端确定其所在室内空间中至少一个参会用户中处于发言状态的目标用户。
会议端位于某个室内空间中,而该室内空间中有至少一个参会用户参加会议。在会议进行过程中,任一个参会用户可以发言,发言时,该参会用户即为处于发言状态的参会用户。
如图2所示,为本申请实施例提供的一种信息处理方法的又一个实施例的流程图,所述方法可以包括:
201:会议端采集其所在室内空间中的至少一个参会用户分别对应的第一图像。
202:按照采集频率,多次采集至少一个参会用户分别对应的第二图像。
203:基于至少一个参会用户分别对应的第一图像以及多个第二图像,确定至少一个参会用户中的目标用户。
204:采集目标用户的语音信息。
205:确定目标用户的身份信息。
可选地,所述对所述目标用户的头像进行人脸识别处理,获得所述目标用户的身份信息可以包括:利用人脸识别算法对所述目标用户的头像进行人脸识别处理,获得目标用户的身份信息。
206:为目标用户的语音信息以及身份信息建立关联关系。
207:将存在关联关系的语音信息以及身份信息发送至少服务端,以供所述服务端获取至少一个语音信息以及每个语音信息关联的身份信息,并基于至少一个语音信息以及每个语音信息关联的身份信息,生成会议记录。
用户在发言时,口型会发生变化,如果检测到任一个用户在预设的时间间隔内口型发生变化,可以确定该用户为目标用户。
第一图像可以在检测到任一个用户开始发言时开始采集。采集频率可以指单位时间内采集第二图像的数量,单位时间可以为一秒,采集频率可以根据对用户的口型进行分析时的误差需求而确定,误差需求越高,采集频率越高,误差需求越低,采集频率越低。一般情况下为了正常采集,采集频率可以大于等于1。通常,由于视频的帧率一般为25~30帧/秒,也就是1秒内存在25~30张图像时,即可以形成连续的视频,为了减少复杂度,可以设置采集频率小于30。例如,可以将采集频率设置为2,也即1秒内采集室内空间内所有用户的两个第二图像。
可选地,第一图像中可以包括室内空间中所有用户的图像,室内空间中每个用户可以对应一个第一子图像,第二图像中可以包括室内空间中所有用户的图像,室内空间中每个用户可以对应一个第二子图像。
所述基于所述第一图像以及所述至少一个第二图像,确定所述室内空间的所有用户中存在口型变化的用户为所述目标用户包括:
确定所述室内空间的所有用户各自对应的第一子图像以及至少一个第二子图像;
遍历所述至少一个用户,针对任一个用户的第一子图像以及至少一个第二子图像,确定所述用户是否存在口型变化;如果是,确定存在口型变化的所述用户为存在发言的目标用户;如果否,确定所述用户不为目用户。
在采集到所有用户的图像之后,作为一个实施例,所述确定目标用户的头像信息可以包括:
基于所述第一图像和/或任一个第二图像,提取所述目标用户头部所在区域的局部图像获得所述头像信息。
本申请实施例的部分步骤与图1所示的实施例相同,在此不再赘述。
作为一种可能的实现方式,在确定目标用户的身份信息时,可以利用采集获得的图像提取至少一个参会用户的头像信息,从而确定目标用户的头像信息。所述确定目标用户的身份信息可以包括:
采集目标用户的头像信息;对目标用户的头像信息进行人脸识别处理,获得目标用户的身份信息。
进一步,可选地,为了减少采集次数,提高处理效率,可以从目标用户的第一图像或者第二图像中确定目标用户的头像信息。所述采集目标用户的头像信息可以包括:基于目标用户对应的第一图形或者任一个第二图像,可以提取目标用户头部所在区域的局部图形,获得目标用户的头像信息。
本申请实施例中,采用提取目标用户的头像信息,并通过人脸识别算法识别用户的身份信息,可以提高用户身份信息的识别的有效性以及准确度。
作为一个实施例,所述对所述目标用户的头像信息进行人脸识别处理,获得所述目标用户的身份信息可以包括:
针对目标用户的头像信息,提取人脸特征;
从人脸特征库中查找与人脸特征相匹配的目标人脸特征;其中,人脸特征库中关联存储至少一个人脸特征以及每个人脸特征对应的身份信息;
确定目标人脸特征关联的目标身份信息为目标用户的身份信息。
针对目标用户的头像信息提取人脸特征可以包括:利用人脸识别算法,提取目标用户的头像信息的人脸特征。人脸特征具体可以指可以表达人脸特征形态的特征向量或者特征矩阵。人脸识别算法可以包括:LBP(Local Binary Patterns,局部二值模式),LFA(Local Face Analysis,局部特征分析方法),PCA(Principal Components Analysis,主成分分析)等算法。本申请实施例所提供的人脸识别算法仅是示例性的,对采用的人脸识别算法的具体类型不作过多限定。
人脸特征库中可以预先建立,关联存储至少一个人脸特征,每个人脸特征可以对应一个身份信息。每个人脸特征可以基于用户确认的头像使用人脸识别算法预先提取。每个人脸特征对应的身份信息也可以是用户确认的。
人脸特征库可以被封装为第三方识别软件,会议端可以向第三方识别软件发起第一识别请求,其中,第一识别请求中可以包括针对目标用户的头像信息提取获得的人脸特征,第三方识别软件可以响应于会议端的第一识别请求,确定与人脸特征相匹配的目标人脸特征,并获取与目标人脸特征对应的身份信息,发送目标人脸特征对应的身份信息至会议端。此时,会议端可以接收第三方识别软件发送的目标人脸特征对应的身份信息,从而确定目标人脸特征关联的目标身份信息为目标用户的身份信息。
当用户使用其个人会议端参加会议时,可以使用其个人账号等信息登陆会议端。由于会议端仅有一个用户使用其用户账号登陆以参加会议,此时,可以直接通过用户的个人账号确定用户的身份信息。
作为一个实施例,确定目标用户的身份信息可以包括:
确定目标用户参与会议时使用的个人账号;
根据目标用户的个人账号,确定目标用户的身份信息。
在实际应用中,用户在会议端注册个人账户时,可以自定义编辑个人账号以完成注册,注册过程中需要输入手机号等通讯账号以完成注册验证。在一些实施例中,用户的个人账号可以与手机号等通讯账号相同。
作为一种可能的实现方式,用户的个人账号与用户的身份信息可以预先关联,此时,通过用户的个人账号可以确定用户的身份信息。用户的身份信息可以包括用户名字、职位、可以区别于任一用户的身份标识和/或工作领域等。
在一些实施例中,为了便于管理,用户可以加入组织架构,以便于获知其所在公司内部的各个管理部门或者管理机构等信息,通过用户所在的组织架构可以确定用户的身份信息。作为一种可能的实现方式,所述根据目标用户的个人账号,确定目标用户的身份信息可以包括:
获取所述目标用户对应个人账号关联的至少一个组织架构;
基于所述至少一个组织架构,确定所述目标用户的身份信息。
组织架构可以指一个组织整体的结构,是指因企业管理要求、管控定位、管理模式等多因素影响下,在企业内部各层机构设置、职责权限、人员编制、工作程序和工作职能的制度安排。
用户在参加会议时需要使用其个人账号登录其所使用的会议端。用户通过会议端可以加入一定的组织架构,用户加入会议架构时,可以将用户的员工编号、工作邮箱、姓名、工作职能以及所在工作部门等身份信息与其所在的会议架构进行关联。用户参会过程中,可以通过用户使用的个人账号确定该用户所在的至少一个组织架构,通过其所在会议架构可以获得用户的在加入该会议架构时添加的身份信息,从而可以通过用户所在的至少一个会议架构,确定目标用户的身份信息。
在用户所在的至少一个会议架构中,可以确定用户的职位信息,该职位信息对于参会用户而言提示作用较高,因此,可以直接将用户的职位信息作为一种用户的身份信息。
在一种可能的设计中,可以将目标用户的职位信息作为目标用户的一种身份信息。所述基于所述至少一个组织架构,确定所述目标用户的身份信息可以包括:
基于所述至少一个组织架构,确定目标用户的职位信息;
根据所述目标用户的职位信息,确定所述目标用户的身份信息。
目标用户的职位信息可以作为目标用户的身份信息的一种,以提供更全面的目标用户的身份信息。
当然,在又一些可能的设计中,用户的身份信息还可以包含用户的姓名、员工编号等信息,与前述职位信息的获取过程以及作用相同,在此不再赘述。
由于不同用户的五官以及形态差异很大,所以不同人的声纹图谱存在差异,因此,在一般情况下,可以利用不同用户的声音辨别不同的用户身份。作为一个实施例,所述确定目标用户的身份信息可以包括:
对语音信息进行声纹识别处理,获得目标用户的身份信息。
对语音信息进行声纹识别处理可以获取目标用户的声纹特征,可以利用目标用户的声纹特征进行身份辨别。作为一种可能的实现方式,对语音信息进行声纹识别处理,获得目标用户的身份信息可以包括:
提取语音信息中的第一声纹特征;
从声纹特征库中查找与第一声纹特征库相匹配的目标声纹特征。
其中,声纹特征库中存储至少一个声纹特征以及每个声纹特征对应的身份信息。
确定目标声纹特征对应的身份信息为目标用户的身份信息。
声纹特征库可以预先建立,可以预先采集参加会议的用户的语音,并提取采集的用户的声纹特征,从而建立用户的声纹特征与用户身份关联存储的声纹特征库。
声纹特征库可以被封装为第三方识别程序,会议端可以向所述第三方识别程序发起第二识别请求,其中,第二识别请求中可以包括第一声纹特征,第三方识别程序可以响应于会议端的第二识别请求,确定与第一声纹特征相匹配的目标声纹特征,并获取与目标声纹特征对应的身份信息,发送目标声纹特征对应的身份信息至会议端,此时,会议端可以接收第三方识别程序发送的目标声纹特征对应的身份信息,从而可以确定目标声纹特征对应的身份信息为目标用户的身份特征。
在某些实施例中,从声纹特征库中查找与声纹特征相匹配的目标声纹特征可以包括:
确定至少一个会议端分别对应的至少一个参会用户,以获得所有参会用户构成的多个参会用户;
从声纹特征库中查找多个参会用户分别对应的参考声纹特征,获得参考特征集合;
从参考特征集合中查找与第一声纹特征相匹配的目标声纹特征。
任一个会议端对应的室内空间中存在至少一个用户参加会议,任一个会议端可以对应至少一个参会用户,至少一个会议端分别对应有至少一个参会用户,参会的共有多个参会用户。
任一个参会用户可以对应一个声纹特征,声纹特征可以表示用户的声音特性。声纹特征库包括至少一个声纹特征以及每个声纹特征对应的身份信息。其中,参考特征集合包括多个参加会议的用户,也即所有参会用户分别对应的声纹特征的集合,每个声纹特征依然与对应的身份信息相关联。通过预先从声纹特征库中查找所有参会用户的声纹特征以构成参考特征集合,可以缩小声纹特征库的查找范围,提高声纹匹配效率以及准确度。
参加会议的多个参会用户的身份信息可以在会议开始之前确定,具体地,确认参加会议的用户可以在各自的会议端上报参会请求至服务端,服务端可以获得参会用户的名单,从而可以确定至少一个用户对应的总体身份信息。在一些实施例中,还可以通过会议组织用户将参加会议的用户的名单上传至服务端,服务端可以基于参会用户的名单,确定至少一个用户对应的总体身份信息。
在一些实施例中,同一个会议可能由不同室内空间或者会议地的用户参加,其中,部分会议地的用户的身份信息可能是已确定的,或者可以使用其他识别方式确定的,为了确保识别的完整性,可以采用声纹识别方式识别未确定身份信息的用户。所述从参考声纹特征中查找与第一声纹特征相匹配的目标声纹特征可以包括:
获取至少一个会议端分别对应的参会用户中未确定身份信息的参会用户;
确定参考特征集合中未确定身份信息的参会用户分别对应的参考声纹特征,获得候选特征集合;
从候选特征集合中查找与第一声纹特征相匹配的目标声纹特征。
所述获取至少一个会议端分别对应的参会用户中未确定身份信息的参会用户可以包括:获取至少一个会议端分别对应的参会用户中除已确定的身份信息之外的参会用户,获得未确定身份信息的参会用户。
至少一个会议端分别对应的参会用户构成所有参会用户。若任一参会用户的身份信息已识别,且已经与相应的身份信息建立关联关系,为了提高识别效率,可以从候选特征集合中获得除已识别身份信息的参会用户之外的未识别身份信息的参会用户,从而获得未关联身份信息的参会用户对应的身份信息。
任一参会用户可以使用手机等个人会议端参加会议时,可以直接获取参会用户所使用的会议端中已配置的身份信息。
在一种可能的设计中,不同的室内空间可以采用不同的身份识别方式,可以先确定不同室内空间对应至少一个参会用户的身份信息。例如,所述获取至少一个会议端分别对应的参会用户中未确定身份信息的参会用户可以包括:确定至少一个会议端分别对应的参会用户中已通过人脸识别方式识别的参会用户,获得未识别的参会用户。
作为又一个实施例,在采集目标用户的语音信息之后,所述方法还可以包括:
为目标用户的语音信息增加时间戳,以在将存在关联关系的语音信息以及身份信息发送至服务端之后,供服务端基于至少一个会议端分别发送的语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
通过为语音信息增加时间戳可以明确语音信息的采集时间,以根据采集时间的先后顺序生成会议记录,会议记录中包括时间信息,可以对会议的具体内容进行精准的提示。
服务端接收到至少一个会议端发送的语音信息以及每个语音信息关联的身份信息之后,可以生成会议记录。如图3所示,为本申请实施例提供的一种信息处理方法的又一个实施例的流程图,所述方法可以包括:
301:服务端接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得语音信息以及每个语音信息关联的身份信息。
其中,任一个会议端发送的语音信息为该会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,该语音信息关联的身份信息为该会议端确定其对应的目标用户的身份信息后为所述语音信息关联的。
其中,服务端可以在会议进行过程中,依次接收至少一个会议端各自发送的目标用户的语音信息以及每个语音信息关联的身份信息。服务端可以在会议结束时,获得多个语音信息以及每个语音信息关联的身份信息。
本申请实施例提供的信息处理方法可以应用于服务端。服务端可以接收至少一个会议端发送的存在关联关系的语音信息以及身份信息。
302:根据多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
每个语音信息可以是对应的会议端针对用户每次执行的发言采集获得。
本申请实施例中,服务端可以接收至少一个会议端分别发送的语音信息,以及每个语音信息关联的身份信息。并可以基于至少一个语音信息以及每个语音信息关联的身份信息,生成会议记录。通过服务端生成会议记录,可以减少会议端的处理压力,提高会议记录的生成效率。并且,由于服务端可以将会议记录进行存储,以在任一个用户有查看需求时,可以随时查看存储的会议记录,从而可以提高信息的利用效率以及查看的便利性。特别是在服务端为云服务器时,用户可以随时随地查看会议记录,进一步提高了信息的查看便利性。
作为一个实施例,所述根据多个语音信息以及每个语音信息关联的身份信息,生成会议记录可以包括:
将多个语音信息依次转换为文字信息,获得多个文字信息;
根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息;
利用多个文字信息以及每个文字信息关联的身份信息,生成会议记录。
作为又一个实施例,所述将多个语音信息依次转换为文字信息,获得多个文字信息可以包括:
利用语音识别算法,将多个语音信息转换为文字信息,获得至少一个文字信息。
进一步,可选地,所述利用语音识别算法将多个语音信息转换为文字信息,获得多个文字信息具体可以包括:识别任一个语音信息的源语言;将每个语音信息从源语言转换为目标语音对应的文字信息,获得多个语音信息分别对应的文字信息。
在一些会议进行过程中,同一用户可能使用不同语言发言,不同用户也可能使用不同语言发言,在进行语音识别过程中,可以识别语音信息的源语言,并将其转换为目标语言对应的文字信息。例如,用户A使用英语发言时,采集到的目标用户A的语音信息为源语言为英语,在进行语音识别时,可以将源语言为英语的语音信息转换为目标语言为中文的文字信息。
作为又一个实施例,在利用语音识别算法,将多个语音信息依次转换为文字信息,获得多个文字信息之后,所述方法还可以包括:
确定多个文字信息组合行成的会议内容;
提取会议内容中的关键信息,以生成会议内容的提示信息。
将多个文字信息组合行成会议内容具体可以是将多个文字信息按照对应语音信息的时间戳构成的时间先后顺序,以将多个文字信息以及其对应语音信息关联的身份信息进行顺序排列,以形成会议内容。
作为一种可能的实现方式,所述提取会议内容中的关键信息,以生成会议内容的提示信息可以包括:
对会议内容进行语义识别处理,以获得会议内容中的关键信息;
将会议内容中的关键信息进行语句生成处理,获得会议内容的摘要信息;
根据会议内容的摘要信息,生成会议内容的提示信息。
可以采用语义识别处理算法,对会议内容进行语义识别处理,以获得会议内容中的关键信息。语义识别处理算法可以是训练好的机器学习模型,例如RNN(RecurrentNeural Network,循环神经网络)等机器学习模型。对会议内容进行语义识别处理具体可以是基于语义识别处理,获得会议内容中的关键词、主题、关键内容等构成的关键信息。
进一步,可选地,根据会议内容的摘要信息,生成会议内容的提示信息可以包括:根据内容提示模板,将会议内容的摘要信息增加到该内容提示模板对应的提示区域中,获得会议内容的提示信息。
内容提示模板可以预先设置,例如,可以包括标题区域以及正文区域,从而可以将摘要信息对应的标题填充到标题区域以及文字内容填充到正文区域,以获得内容提示信息。
作为又一个实施例,在利用语音识别算法,将多个语音信息依次转换为文字信息,获得多个文字信息之后,所述方法还可以包括:
确定多个文字信息组合行成的会议内容;
提取会议内容中的会议任务;
根据会议内容中的会议任务,生成任务提示信息。
多个文字信息即为语音信息的内容,可以将多个文字信息按照其对应语音信息的时间戳,组合行成会议内容。提取会议内容中的会议任务可以是使用语义识别处理算法识别会议内容中的会议任务。获得会议任务之后,可以对会议任务进行提示,通过任务提示信息可以提示会议过程中所产生的任务,以提示各个用户查看会议任务。
作为一种可能的实现方式,所述方法还可以包括:
将多个文字信息分别对应语音信息关联的身份信息与其进行关联。
在提取会议内容中的会议任务之后,所述方法还可以包括:
确定会议任务对应的文字信息关联的身份信息;
所述根据会议内容中的会议任务,生成任务提示信息包括:
根据会议内容中的会议任务,生成以身份信息为任务发起者的任务提示信息。
在会议进行过程中,可以针对某些参会用户布置的任务,因此,可以获取布置该会议任务的参会用户的身份信息,从而在生成任务提示信息时,可以将任务发起者的任务提示信息,以提示发起任务的参会用户。
进一步,可选地,所述方法还可以包括:
确定执行会议任务的任务执行对象;
发送任务提示信息至任务执行对象的用户端,以供任务提示对象的用户端提示信息任务执行对象执行该会议任务。
执行会议任务的任务执行对象可以通过会议内容中提取,会议进行过程中,如果发布会议任务,可以一并发布任务的执行者,以会议内容中获取会议内容对应的任务执行对象,以对任务执行对象进行针对性提示,实现会议任务的提示的有效性。
任一个用户可以通过会议端发起记录查看请求,作为一个实施例,所述方法还可以包括:
响应于任一用户发起的记录查看请求,发送所述会议记录至所述用户。
用户可以通过可以与服务端进行数据通信的用户端发起记录查看请求,还可以通过会议端发起记录查看请求。所述记录查看请求可以是通过会议端或者用户端发送至服务端的,服务端发送会议记录至用户可以是发送至用户使用的会议端或者用户端。
所述用户端可以指可以具有记录查看权限的用户所使用的应用程序,用户可以通过登陆用户端从而发起记录查看请求。所述用户端可以配置于手机、个人计算机、平板电脑等电子设备。
作为又一个实施例,服务端接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息,之后,所述方法还包括:
确定多个语音信息分别对应的时间戳;其中,任一个语音信息对应的时间戳为发送所述语音信息的会议端在采集到所述语音信息之后为所述语音信息增加的。
作为一种可能的实现方式,所述根据多个语音信息以及每个语音信息关联的身份信息,生成会议记录可以包括:
根据多个语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
会议端每采集一个语音信息,可以为采集的语音信息生成时间戳。时间戳可以是语音信息的时间参数。利用对语音信息进行处理时,通过时间戳可以明确各个语音信息的先后顺序,使得语音信息的处理有效性更高。
在一些应用场景中,可能同时存在多个目标用户同时发言的情况,可以将每个目标用户的发言进行分离,以获得多个目标用户同时发言时,每个目标用户的语音信息,所述获取至少一个目标用户分别对应的语音信息还可以包括:
采集所述至少一个目标用户同时发言时的语音信息。
基于所述语音信息,分离每个目标用户的语音信息,获得至少一个目标用户分别对应的语音信息。
作为一种可能的实现方法,所述基于所述语音信息,分离每个目标用户的语音信息,获得至少一个目标用户分别对应的语音信息之后,所述确定每个目标用户的身份信息包括:
针对任一个目标用户语音信息,利用声纹识别算法,识别所述目标用户的身份信息。
为了降低会议系统的复杂性,提高会议端的利用率,可以由会议端生成会议记录,以供参加会议的用户或者组织者及时查看会议记录。如图4所示,为本申请实施例提供的一种信息处理方法又一个实施例的流程图,应用于第一会议端,所述方法可以包括:
401:第一会议端确定其所在第一室内空间中的至少一个第一参会用户中的第一目标用户。
402:采集第一目标用户的语音信息。
可选地,会议端可以在会议进行过程中,采集目标用户的语音信息。
403:确定第一目标用户的身份信息。
404:为第一目标用户的身份信息以及语音信息建立关联关系。
405:接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。
其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的。
406:根据第一会议端采集的语音信息以及至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
本申请实施例中所提供的第一会议端以及第二会议端与前述实施例中的会议端是相同的,“第一”“第二”的区别仅用于区分不同的会议端,不具备数量、顺序等内容。第一会议端可以在会议进行过程中不断接受其他会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。
在会议结束时,第一用户端可以根据第一目标用户以及至少一个第二目标用户各自的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
可选地,所述第一目标用户可以包括至少一个,所述第二目标用户可以包括至少一个。第一会议端以及第二会议端对第一目标用户以及第二目标用户的身份识别过程与图1所示实施例的步骤相同,在此不再赘述。
所述根据第一目标用户以及第二目标用户各自的语音信息以及每个语音信息关联的身份信息,生成会议记录包括:
将第一目标用户以及第二目标用户各自的语音信息依次转换为文字信息,获得至少一个文字信息;根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息;利用至少一个文字信息以及每个文字信息关联的身份信息,生成会议记录。
所述将第一目标用户以及第二目标用户各自的语音信息依次转换为文字信息,获得至少一个文字信息可以包括:利用语音识别算法将所述第一目标用户以及所述第二目标用户各自的语音信息转换为文字信息,获得至少一个文字信息。
本申请实施例中,第一用户端可以采集第一目标用户的身份信息,并可以确定第一目标用户的身份信息,从而可以将第一目标用户的身份信息以及语音信息建立关联关系,此外,还可以接收其他会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。此时第一用户端可以根据第一目标用户以及第二目标用户各自的语音信息以及每个语音信息关联的身份信息,生成会议记录。第一用户端可以采集并接收语音信息,并同时可以生成会议记录,以提高会议端的利用率,降低会议系统的复杂度。
在一些实施例中,目标用户可以包括至少一个,可以针对任一个目标用户,采集该目标用户的语音信息,确定所述目标用户的身份信息以及为所述目标用户对应的语音信息以及身份信息建立关联关系,并将所述存在关联关系的语音信息以及身份信息发送至服务端。
本申请实施例所述的会议可以包括商务会议、技术会议、庭审会议、协商会议等不同类型的会议。随着科技的发展,网络会议的应用越来越广泛,因此,位于不同会议地点或者室内空间的用户可以通过网络参加同一个会议,每个室内空间或者会议地可以对应一个会议端。室内空间中可以包括至少一个参加会议的用户,任一个位于会议地的用户可以使用其对应的会议端参加会议。本申请实施例所述的至少一个用户可以指位于不同的会议地点或者室内空间中参加同一场会议的用户。
在一个会议场景中,会议端可以配置于电子设备中,所述电子设备可以通过麦克风等音频采集组件采集当前正在发言的用户的语音信息,并发送至会议端。所述音频采集组件可以与所述电子设备是一体式结构,属于电子设备的部分硬件。所述音频采集组件也可以与电子设备相互独立,音频采集组件与电子设备属于分体式设备。
如图5所示的一个会议分布场景中,可以包括室内空间501、会议端所在室内空间502以及室内空间503,以室内空间501中的会议端为计算机504,会议地502的会议端为手机505,以及室内空间503的会议端为智能音箱506为例。计算机504、手机505以及智能音箱506均可以与服务端507之间建立通信连接以进行数据或指令的传输。
假设在室内空间501中包括5个参与会议的参会用户A~E,计算机504被置于室内空间501中,计算机504中的音频采集组件(图中未示出)可以针对参会用户A~参会用户E中的任一个正在发言的用户,也即目标用户进行采集,获得目标用户的语音信息。并可以确定所述目标用户的身份信息,并关联目标用户的身份信息以及语音信息,发送所述存在关联关系的语音信息以及身份信息至服务端507。
在会议地502包括一个参与会议的参会用户F,参会用户F使用手机506参加会议时,该参会用户F为目标用户。手机505可以对目标用户F的发言进行采集,获得目标用户F的语音信息,识别目标用户的身份信息,以关联目标用户的身份信息以及语音信息,发送所述存在关联关系的语音信息以及身份信息至服务端507。
在室内空间503中包括两个参与会议的参会用户M以及参会用户N,假设参会用户M以及参会用户N使用智能音箱506参加会议,智能音箱506可以针对参会用户M以及参会用户N中的任一发言的用户进行语音信息的采集,获得目标用户的语音信息。之后,识别目标用户的身份信息并关联目标用户的身份信息以及语音信息,发送所述存在关联关系的语音信息以及身份信息至服务端507。
服务端507按照发送时间的先后顺序,依次可以接收室内空间501中的电子设备504发送的关联关系的语音信息以及身份信息,可以接收会议地502对应的手机505发送的存在关联关系的语音信息以及身份信息,还可以接收室内空间503中的智能音箱506发送的存在关联关系的语音信息以及身份信息,以最终获得至少一个语音信息以及每个语音信息关联的身份信息,并基于所述至少一个语音信息以及每个语音信息关联的身份信息,生成会议记录。
如图6所示,为本申请实施例提供的一种信息处理装置的一个实施例的结构示意图,应用于会议端,所述装置可以包括:
目标确定模块601:用于确定会议端所在室内空间中至少一个参会用户中的目标用户。
语音采集模块602:用于采集目标用户的语音信息。
身份识别模块603:用于确定目标用户的身份信息。
关联建立模块604:用于为目标用户对应的所述身份信息以及语音信息建立关联关系。
信息发送模块605:用于将存在关联关系的语音信息以及身份信息发送至服务端,以供服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
作为一个实施例,所述目标确定模块可以包括:
第一确定单元,用于确定会议端所在室内空间中至少一个参会用户中处于发言状态的目标用户。
作为一种可能的实现方式,所述第一确定单元可以包括:
第一采集子单元,用于采集会议端所在室内空间中的至少一个参会用户分别对应的第一图像。
第二采集子单元,用于按照采集频率,多次采集所述至少一个参会用户分别对应的第二图像。
第一确定子单元,用于基于所述至少一个参会用户分别对应的第一图像以及多个第二图像,确定所述至少一个参会用户中的目标用户。
在某些实施例中,所述身份识别模块可以包括:
头像采集单元,用于采集所述目标用户的头像信息。
第一识别单元,用于对所述目标用户的头像信息进行人脸识别处理,获得所述目标用户的身份信息。
作为一种可能的实现方式,所述第一识别单元可以包括:
特征提取子单元,用于针对目标用户的头像信息,提取人脸特征。
特征查找子单元,用于从人脸特征库中查找与所述人脸特征相匹配的目标人脸特征。
其中,所述人脸特征库中关联存储至少一个人脸特征以及每个人脸特征对应的身份信息。
身份确定子单元,用于确定所述目标人脸特征关联的目标身份信息为所述目标用户的身份信息。
在一种可能的设计中,所述头像采集单元可以包括:
头像提取子单元,用于基于所述目标用户对应的第一图像或者任一个所述第二图像,提取所述目标用户头部所在区域的局部图像获得所述目标用户的头像信息。
作为又一个实施例,所述身份识别模块可以包括:
账户确定单元,用于确定所述目标用户参与会议时使用的个人账号。
第二识别单元,用于根据所述目标用户的个人账号,确定所述目标用户的身份信息。
作为一种可能的实现方式,所述第二识别单元可以包括:
架构确定子模块,用于获取所述目标用户对应个人账号关联的至少一个组织架构;
架构身份子模块,用于基于所述至少一个组织架构,确定所述目标用户的身份信息。
在一种可能的设计中,所述架构身份子模块可以包括:
职位确定模块,用于基于所述至少一个组织架构,确定所述目标用户的职位信息;
身份确定模块,用于根据所述目标用户的职位信息,确定所述目标用户的身份信息。
在某些实施例中,所述身份识别模块可以包括:
第三识别模块,用于对所述语音信息进行声纹识别处理,获得所述目标用户的身份信息。
作为一种可能的实现方式,所述第三识别模块可以包括:
第一提取单元,用于提取所述语音信息中的第一声纹特征。
第一查找单元,用于从声纹特征库中查找与所述第一声纹特征相匹配的目标声纹特征。
其中,所述声纹特征库中存储至少一个声纹特征以及每个声纹特征对应的身份信息。
第二确定单元,用于确定所述目标声纹特征对应的身份信息为所述目标用户的身份信息。
作为一种可能的实现方式,所述第一查找单元可以包括:
用户确定子单元,用于确定所述至少一个会议端分别对应的至少一个参会用户,以获得所有参会用户构成的多个参会用户。
第一查找子单元,用于从所述声纹特征库中查找所述多个参会用户分别对应的参考声纹特征,获得参考特征集合。
第二查找子单元,用于从所述参考特征集合中查找与所述第一声纹特征相匹配的目标声纹特征。
进一步,可选地,所述第二查找子单元具体可以用于:
获取所述至少一个会议端分别对应的参会用户中未确定身份信息的参会用户;确定所述参考特征集合中所述未确定身份信息的参会用户分别对应的参考声纹特征,获得候选特征集合;从所述候选特征集合中查找与所述第一声纹特征相匹配的目标声纹特征。
作为又一个实施例,所述装置还可以包括:
时间标记模块,用于为所述目标用户的语音信息增加时间戳,以在将所述存在关联关系的语音信息以及身份信息发送至服务端之后,供所述服务端基于所述至少一个会议端分别发送的语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
在实际应用场景中,图6所示的实施例可以配置为一会议端。如图7所示,为本申请实施例提供的一种信息处理设备的一个实施例的结构示意图,所述设备可以包括:存储组件701与处理组件702;所述存储组件701用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件702调用;
所述处理组件702用于:
确定会议端所在室内空间中至少一个参会用户中的目标用户;采集目标用户的语音信息;确定目标用户的身份信息;为目标用户对应的身份信息以及语音信息建立关联关系;将存在关联关系的语音信息以及身份信息发送至服务端,以供服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
作为一个实施例,所述处理组件确定会议端所在室内空间中至少一个参会用户中的目标用户具体可以是:
确定会议端所在室内空间中至少一个参会用户中处于发言状态的目标用户。
在某些实施例中,所述处理组件确定会议端所在室内空间中至少一个参会用户中处于发言状态的目标用户可以包括:
采集会议端所在室内空间中的至少一个参会用户分别对应的第一图像;
按照采集频率,多次采集所述至少一个参会用户分别对应的第二图像;
基于所述至少一个参会用户分别对应的第一图像以及多个第二图像,确定所述至少一个参会用户中的目标用户。
在一种可能的设计中,所述确定目标用户的身份信息可以包括:
采集目标用户的头像信息;
对目标用户的头像信息进行人脸识别处理,获得目标用户的身份信息。
作为一种可能的实现方式,所述处理组件对所述目标用户的头像信息进行人脸识别处理,获得所述目标用户的身份信息具体可以是:
采集目标用户的头像信息,提取人脸特征;
从人脸特征库中查找与所述人脸特征相匹配的目标人脸特征;其中,所述人脸特征库中关联存储至少一个人脸特征以及每个人脸特征对应的身份信息;
确定所述目标人脸特征关联的目标身份信息为所述目标用户的身份信息。
进一步,可选地,所述处理组件采集目标用户的头像信息可以是:
基于目标用户对应第一图像或者任一个第二图像,提取所述目标用户头部所在区域的局部图像获得所述目标对象的头像信息。
作为又一个实施例,所述处理组件确定目标用户的身份信息可以是:
确定目标用户参与会议时使用的个人账号;
根据目标用户的个人账号,确定目标用户的身份信息。
作为一种可能的实现方式,所述处理组件根据所述目标用户的个人账号,确定所述目标用户的身份信息可以包括:
获取所述目标用户对应个人账号关联的至少一个组织架构;
基于所述至少一个组织架构,确定所述目标用户的身份信息。
在一种可能的设计中,所述处理组件基于所述至少一个组织架构,确定所述目标用户的身份信息可以包括:
基于所述至少一个组织架构,确定所述目标用户的职位信息;
根据所述目标用户的职位信息,确定所述目标用户的身份信息。
在某些实施例中,所述处理组件确定目标用户的身份信息可以是:
对语音信息进行声纹识别处理,获得目标用户的身份信息。
在一种可能的设计中,所述处理组件对语音信息进行声纹识别处理,获得目标用户的身份信息具体可以是:
提取语音信息中的第一声纹特征;
从声纹特征库中查找与所述第一声纹特征相匹配的目标声纹特征;其中,所述声纹特征库中存储至少一个声纹特征以及每个声纹特征对应的身份信息;
确定目标声纹特征对应的身份信息为目标用户的身份信息。
在某些实施例中,所述处理组件从声纹特征库中查找与所述第一声纹特征相匹配的目标声纹特征可以是:
确定所述至少一个会议端分别对应的至少一个参会用户,以获得所有参会用户构成的多个参会用户;
从所述声纹特征库中查找所述多个参会用户分别对应的参考声纹特征,获得参考特征集合;
从所述参考特征集合中查找与所述第一声纹特征相匹配的目标声纹特征。
进一步,可选地,所述处理组件从所述参考特征集合中查找与所述第一声纹特征相匹配的目标声纹特征具体可以是:
获取至少一个会议端分别对应的参会用户中未确定身份信息的参会用户;
确定参考特征集合中未确定身份信息的参会用户分别对应的参考声纹特征,获得候选特征集合;
从候选特征集合中查找与第一声纹特征相匹配的目标声纹特征。
作为又一个实施例,所述处理组件还可以用于:
为目标用户的语音信息增加时间戳,以在将存在关联关系的语音信息以及身份信息发送至服务端之后,供服务端基于至少一个会议端分别发送的语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
图7所述的信息处理设备可以执行图1以及图2所示实施例所述的信息处理方法,其实现原理和技术效果不再赘述。对于上述实施例中的信息处理设备其中的处理组件所执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
如图8所示,为本申请实施例提供的一种信息处理装置的一个实施例的结构示意图,所述装置可以配置于服务端,所述装置可以包括以下几个模块:
信息接收模块801,用于接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息。
其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的。
记录生成模块802,用于根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
作为一个实施例,所述记录生成模块可以包括:
第一转换单元,用于将所述多个语音信息依次转换为文字信息,获得多个文字信息。
第三确定单元,用于根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息。
第一生成单元,用于利用所述多个文字信息以及每个文字信息关联的身份信息,生成会议记录。
作为一种可能的实现方式,所述第一转换单元可以包括:
第一转换子单元,用于利用语音识别算法,将所述多个语音信息依次转换文字信息,获得多个文字信息。
在一种可能的设计中,所述记录生成模块还可以包括:
第四确定单元,用于确定所述多个文字信息组合行成的会议内容。
信息提取单元,用于提取所述会议内容中的关键信息,以生成所述会议内容的提示信息。
作为一种可能的实现方式,所述信息提取单元可以包括:
第一识别子单元,用于对所述会议内容进行语义识别处理,以获得所述会议内容中的关键信息。
第一处理子单元,用于将所述会议内容中的关键信息进行语句生成处理,获得所述会议内容的摘要信息。
第一生成子单元,用于根据所述会议内容的摘要信息,生成所述会议内容的提示信息。
在某些实施例中,所述记录生成模块还可以包括:
第五确定单元,用于确定所述多个文字信息组合行成的会议内容。
任务提取单元,用于提取所述会议内容中的会议任务。
任务处理单元,用于根据所述会议内容中的会议任务,生成任务提示信息。
在一些可能的设计中,所述记录生成模块还可以包括:
第一关联单元,用于将所述多个文字信息分别对应语音信息关联的身份信息与其进行关联。
第六确定单元,用于确定所述会议任务对应的文字信息关联的身份信息。
所述任务处理单元具体可以用于:
根据所述会议内容中的会议任务,生成以所述身份信息为任务发起者的任务提示信息。
在又一种可能的设计中,所述记录生成模块还可以包括:
第七确定单元,用于确定执行所述会议任务的任务执行对象。
提示发送单元,用于发送所述任务提示信息至所述任务执行对象的用户端,以供所述任务提示对象的用户端提示所述信息任务执行对象执行所述会议任务。
作为又一个实施例,所述装置还可以包括:
第一响应模块,用于响应于任一用户发起的记录查看请求,发送所述会议记录至所述用户。
作为又一个实施例,所述装置还可以包括:
时间确定模块,用于确定所述多个语音信息分别对应的时间戳。
其中,任一个语音信息对应的时间戳为发送所述语音信息的会议端在采集到所述语音信息之后为所述语音信息增加的。
进一步,可选地,所述记录生成模块可以包括:
第二生成单元,用于根据所述多个语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
如图9所示,为本申请实施例提供的一种服务器的一个实施例的结构示意图图,该服务器可以包括:存储组件901与处理组件902;所述存储组件901用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件902调用;
所述处理组件902用于:
接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
作为一个实施例,所述处理组件根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录可以是:
将所述多个语音信息依次转换为文字信息,获得多个文字信息;
根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息;
利用多个文字信息以及每个文字信息关联的身份信息,生成会议记录。
作为又一个实施例,所述将多个语音信息依次转换为文字信息,获得多个文字信息可以是:
利用语音识别算法,将所述多个语音信息依次转换文字信息,获得多个文字信息。
作为一种可能的实现方式,所述处理组件还可以用于:
确定所述多个文字信息组合行成的会议内容;
提取所述会议内容中的关键信息,以生成所述会议内容的提示信息。
在一种可能的设计中,所述处理组件提取所述会议内容中的关键信息,以生成所述会议内容的提示信息具体可以是:
对所述会议内容进行语义识别处理,以获得所述会议内容中的关键信息;
将所述会议内容中的关键信息进行语句生成处理,获得所述会议内容的摘要信息;
根据所述会议内容的摘要信息,生成所述会议内容的提示信息。
作为又一个实施例,所述处理组件还可以用于:
确定所述多个文字信息组合行成的会议内容;
提取所述会议内容中的会议任务;
根据所述会议内容中的会议任务,生成任务提示信息。
在某些实施例中,所述处理组件还可以用于:
将所述多个文字信息分别对应语音信息关联的身份信息与其进行关联;
确定所述会议任务对应的文字信息关联的身份信息;
所述处理组件根据所述会议内容中的会议任务,生成任务提示信息具体可以是:
根据所述会议内容中的会议任务,生成以所述身份信息为任务发起者的任务提示信息。
在某些实施例中,所述处理组件还可以用于:
确定执行所述会议任务的任务执行对象;
发送所述任务提示信息至所述任务执行对象的用户端,以供所述任务提示对象的用户端提示所述信息任务执行对象执行所述会议任务。
在某些实施例中,所述处理组件还可以用于:
响应于任一用户发起的记录查看请求,发送所述会议记录至所述用户。
作为又一个实施例,所述处理组件还可以用于:
确定所述多个语音信息分别对应的时间戳。
其中,任一个语音信息对应的时间戳为发送所述语音信息的会议端在采集到所述语音信息之后为所述语音信息增加的。
作为一种可能的实现方式,所述处理组件根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录具体可以是:
根据所述多个语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
图9所述的信息处理设备可以执行图3所示实施例所述的信息处理方法,其实现原理和技术效果不再赘述。对于上述实施例中的信息处理设备其中的处理组件所执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
如图10所示,为本申请实施例提供的一种信息处理装置的一个实施例的结构示意图,该装置可以应用于第一会议端,包括:
第一确定模块1001,用于确定所述第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
第一采集模块1002,用于采集所述第一目标用户的语音信息;
第一识别模块1003,用于确定所述第一目标用户的身份信息;
第一建立模块1004,用于为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
第一接收模块1005,用于接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。
其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为其关联的。
第一生成模块,用于根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
如图11所示,为本申请实施例提供的一种信息处理设备的一个实施例的结构示意图,应用于第一用户端,所述设备可以包括:存储组件1101与处理组件1102;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件1102调用;
所述处理组件1102用于:
确定第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;采集第一目标用户的语音信息;确定第一目标用户的身份信息;为第一目标用户的身份信息以及语音信息建立关联关系;接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,该语音信息关联的身份信息为第二会议端确定第二目标用户的身份信息后为其关联的;根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
第一会议端可以在会议进行过程中不断接受其他会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。
在会议结束时,第一用户端可以根据第一目标用户以及第二目标用户各自的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
可选地,所述第一目标用户可以包括至少一个,所述第二目标用户可以包括至少一个。第一会议端以及第二会议端对第一目标用户以及第二目标用户的身份识别过程与图1所示实施例的步骤相同,在此不再赘述。
所述处理组件根据第一目标用户以及第二目标用户各自的语音信息以及每个语音信息关联的身份信息,生成会议记录具体是:
将第一目标用户以及第二目标用户各自的语音信息依次转换为文字信息,获得至少一个文字信息;根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息;利用至少一个文字信息以及每个文字信息关联的身份信息,生成会议记录。
所述处理组件将第一目标用户以及第二目标用户各自的语音信息依次转换为文字信息,获得至少一个文字信息具体可以是:利用语音识别算法将所述第一目标用户以及所述第二目标用户各自的语音信息转换为文字信息,获得至少一个文字信息。
本申请实施例中,第一用户端可以采集第一目标用户的身份信息,并可以确定第一目标用户的身份信息,从而可以将第一目标用户的身份信息以及语音信息建立关联关系,此外,还可以接收其他会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息。此时第一用户端可以根据第一目标用户以及第二目标用户各自的语音信息以及每个语音信息关联的身份信息,生成会议记录。第一用户端可以采集并接收语音信息,并同时可以生成会议记录,以提高会议端的利用率,降低会议系统的复杂度。
图11所述的信息处理设备可以执行图4所示实施例所述的信息处理方法,其实现原理和技术效果不再赘述。对于上述实施例中的信息处理设备其中的处理组件所执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序;所述计算机程序使计算机执行时实现上述实施例中任一项所述的信息处理方法。
如图12所示,为本申请实施例提供的一种信息处理系统的一个实施例的结构示意图,所述系统包括:至少一个会议端1201以及服务器1202;
所述至少一个会议端1201分别用于:确定其所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至所述服务器。
所述服务器1202用于:接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
所述会议端可以是视频电话、视频电视、手机、智能音箱、平板、计算机、虚拟现实设备、增强现实设备等电子设备,图9所示的电子设备仅是示例性的,并不构成对电子设备的具体限定,本申请实施例对电子设备的具体类型不作过多限定。
作为一个实施例,所述会议端可以还包括音频采集组件、身份识别组件;
所述会议端采集目标用户的语音信息具体是:通过音频采集组件采集目标用户的语音信息;
所述会议端确定所述目标用户的身份信息具体是:通过身份识别组件识别用户目标用户的身份信息。
其中,所述身份识别组件以及音频采集组件可以与对应的电子设备分离。
作为一个实施例,所述身份识别组件包括:人脸识别组件;
所述身份识别组件识别每个用户的身份信息具体是:
确定每个用户的图像信息;
基于人脸识别算法,利用每个用户的图像信息识别每个用户的身份信息。
作为又一个实施例,所述身份识别组件包括:声纹识别组件;
所述身份识别设备识别每个用户的身份信息具体是:
针对任一个用户的语音信息,利用声纹识别算法,识别所述用户的身份信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和程序结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (33)

1.一种信息处理方法,其特征在于,包括:
会议端确定其所在室内空间中至少一个参会用户中的目标用户;
采集所述目标用户的语音信息;
确定所述目标用户的身份信息;
为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;
将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
2.根据权利要求1所述的方法,其特征在于,所述会议端确定其所在室内空间中至少一个参会用户中的目标用户包括:
所述会议端确定其所在室内空间中至少一个参会用户中处于发言状态的目标用户。
3.根据权利要求2所述的方法,其特征在于,所述会议端确定其所在室内空间中至少一个参会用户中处于发言状态的目标用户包括:
所述会议端采集其所在室内空间中的至少一个参会用户分别对应的第一图像;
按照采集频率,多次采集所述至少一个参会用户分别对应的第二图像;
基于所述至少一个参会用户分别对应的第一图像以及多个第二图像,确定所述至少一个参会用户中的目标用户。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标用户的身份信息包括:
采集所述目标用户的头像信息;
对所述目标用户的头像信息进行人脸识别处理,获得所述目标用户的身份信息。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标用户的头像信息进行人脸识别处理,获得所述目标用户的身份信息包括:
针对目标用户的头像信息,提取人脸特征;
从人脸特征库中查找与所述人脸特征相匹配的目标人脸特征;其中,所述人脸特征库中关联存储至少一个人脸特征以及每个人脸特征对应的身份信息;
确定所述目标人脸特征关联的目标身份信息为所述目标用户的身份信息。
6.根据权利要求4所述的方法,其特征在于,所述采集所述目标用户的头像信息包括:
基于所述目标用户对应的第一图像或者任一个所述第二图像,提取所述目标用户头部所在区域的局部图像获得所述目标用户的头像信息。
7.根据权利要求1所述的方法,其特征在于,所述确定所述目标用户的身份信息包括:
确定所述目标用户参与会议时使用的个人账号;
根据所述目标用户的个人账号,确定所述目标用户的身份信息。
8.根据权利要求7所述的方法,其特征在于,所述根据所述目标用户的个人账号,确定所述目标用户的身份信息包括:
获取所述目标用户对应个人账号关联的至少一个组织架构;
基于所述至少一个组织架构,确定所述目标用户的身份信息。
9.根据权利要求8所述的方法,其特征在于,所述基于所述至少一个组织架构,确定所述目标用户的身份信息包括:
基于所述至少一个组织架构,确定所述目标用户的职位信息;
根据所述目标用户的职位信息,确定所述目标用户的身份信息。
10.根据权利要求1所述的方法,其特征在于,所述确定所述目标用户的身份信息包括:
对所述语音信息进行声纹识别处理,获得所述目标用户的身份信息。
11.根据权利要求10所述的方法,其特征在于,所述对所述语音信息进行声纹识别处理,获得所述目标用户的身份信息包括:
提取所述语音信息中的第一声纹特征;
从声纹特征库中查找与所述第一声纹特征相匹配的目标声纹特征;其中,所述声纹特征库中存储至少一个声纹特征以及每个声纹特征对应的身份信息;
确定所述目标声纹特征对应的身份信息为所述目标用户的身份信息。
12.根据权利要求11所述的方法,其特征在于,所述从声纹特征库中查找与所述第一声纹特征相匹配的目标声纹特征包括:
确定所述至少一个会议端分别对应的至少一个参会用户,以获得所有参会用户构成的多个参会用户;
从所述声纹特征库中查找所述多个参会用户分别对应的参考声纹特征,获得参考特征集合;
从所述参考特征集合中查找与所述第一声纹特征相匹配的目标声纹特征。
13.根据权利要求12所述的方法,其特征在于,所述从所述参考特征集合中查找与所述第一声纹特征相匹配的目标声纹特征包括:
获取所述至少一个会议端分别对应的参会用户中未确定身份信息的参会用户;
确定所述参考特征集合中所述未确定身份信息的参会用户分别对应的参考声纹特征,获得候选特征集合;
从所述候选特征集合中查找与所述第一声纹特征相匹配的目标声纹特征。
14.根据权利要求1所述的方法,其特征在于,所述采集所述目标用户的语音信息之后,还包括:
为所述目标用户的语音信息增加时间戳,以在将所述存在关联关系的语音信息以及身份信息发送至服务端之后,供所述服务端基于所述至少一个会议端分别发送的语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
15.一种信息处理方法,其特征在于,包括:
服务端接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;
根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
16.根据权利要求15所述的方法,其特征在于,所述根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录包括:
将所述多个语音信息依次转换为文字信息,获得多个文字信息;
根据每个语音信息关联的身份信息,确定每个文字信息关联的身份信息;
利用所述多个文字信息以及每个文字信息关联的身份信息,生成会议记录。
17.根据权利要求16所述的方法,其特征在于,所述将所述多个语音信息依次转换为文字信息,获得多个文字信息包括:
利用语音识别算法,将所述多个语音信息依次转换文字信息,获得多个文字信息。
18.根据权利要求16所述的方法,其特征在于,还包括:
确定所述多个文字信息组合行成的会议内容;
提取所述会议内容中的关键信息,以生成所述会议内容的提示信息。
19.根据权利要求18所述的方法,其特征在于,所述提取所述会议内容中的关键信息,以生成所述会议内容的提示信息包括:
对所述会议内容进行语义识别处理,以获得所述会议内容中的关键信息;
将所述会议内容中的关键信息进行语句生成处理,获得所述会议内容的摘要信息;
根据所述会议内容的摘要信息,生成所述会议内容的提示信息。
20.根据权利要求16所述的方法,其特征在于,还包括:
确定所述多个文字信息组合行成的会议内容;
提取所述会议内容中的会议任务;
根据所述会议内容中的会议任务,生成任务提示信息。
21.根据权利要求20所述的方法,其特征在于,还包括:
将所述多个文字信息分别对应语音信息关联的身份信息与其进行关联;
所述提取所述会议内容中的会议任务之后,还包括:
确定所述会议任务对应的文字信息关联的身份信息;
所述根据所述会议内容中的会议任务,生成任务提示信息包括:
根据所述会议内容中的会议任务,生成以所述身份信息为任务发起者的任务提示信息。
22.根据权利要求20所述的方法,其特征在于,所述方法还包括:
确定执行所述会议任务的任务执行对象;
发送所述任务提示信息至所述任务执行对象的用户端,以供所述任务提示对象的用户端提示所述信息任务执行对象执行所述会议任务。
23.根据权利要求15所述的方法,其特征在于,还包括:
响应于任一用户发起的记录查看请求,发送所述会议记录至所述用户。
24.根据权利要求15所述的方法,其特征在于,所述服务端接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息,之后,所述方法还包括:
确定所述多个语音信息分别对应的时间戳;其中,任一个语音信息对应的时间戳为发送所述语音信息的会议端在采集到所述语音信息之后为所述语音信息增加的。
25.根据权利要求24所述的方法,其特征在于,所述根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录包括:
根据所述多个语音信息以及每个语音信息关联的身份信息和时间戳,生成会议记录。
26.一种信息处理方法,其特征在于,包括:
第一会议端确定其所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
采集所述第一目标用户的语音信息;
确定所述第一目标用户的身份信息;
为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;
根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
27.一种信息处理装置,其特征在于,应用于会议端,包括:
目标确定模块,用于确定所述会议端所在室内空间中至少一个参会用户中的目标用户;
语音采集模块,用于采集所述目标用户的语音信息;
身份识别模块,用于确定所述目标用户的身份信息;
关联建立模块,用于为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;
信息发送模块,用于将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
28.一种信息处理装置,其特征在于,应用于服务端,包括:
信息接收模块,用于接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;
记录生成模块,用于根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
29.一种信息处理装置,其特征在于,应用于第一会议端,包括:
第一确定模块,用于确定所述第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;
第一采集模块,用于采集所述第一目标用户的语音信息;
第一识别模块,用于确定所述第一目标用户的身份信息;
第一建立模块,用于为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;
第一接收模块,用于接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为所述第二语言信息关联的;
第一生成模块,用于根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
30.一种会议端,其特征在于,包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
确定会议端所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至服务端,以供所述服务端基于至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,生成会议记录。
31.一种服务器,其特征在于,包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;其中,任一个会议端发送的语音信息为所述会议端采集其所在室内空间中至少一个参会用户中的目标用户获得的,所述语音信息关联的身份信息为所述会议端确定所述目标用户的身份信息后为所述语音信息关联的;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
32.一种会议端,其特征在于,第一会议端包括:存储组件与处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用;
所述处理组件用于:
确定所述第一会议端所在第一室内空间中的至少一个第一参会用户中的第一目标用户;采集所述第一目标用户的语音信息;确定所述第一目标用户的身份信息;为所述第一目标用户的所述身份信息以及所述语音信息建立关联关系;接收至少一个第二会议端发送的第二目标用户的语音信息以及每个语音信息关联的身份信息;其中,任一个第二会议端发送的语音信息为所述第二会议端采集其所在第二室内空间中的至少一个第二参会用户中的第二目标用户获得的,所述语音信息关联的身份信息为所述第二会议端确定所述第二目标用户的身份信息后为其关联的;根据所述第一会议端采集的语音信息以及所述至少一个第二会议端发送的语音信息,以及每个语音信息关联的身份信息,生成会议记录。
33.一种信息处理系统,其特征在于,包括:至少一个会议端以及服务器;
所述至少一个会议端分别用于:确定其所在室内空间中至少一个参会用户中的目标用户;采集所述目标用户的语音信息;确定所述目标用户的身份信息;为所述目标用户对应的所述身份信息以及所述语音信息建立关联关系;将所述存在关联关系的语音信息以及身份信息发送至所述服务器;
所述服务器用于:接收至少一个会议端发送的语音信息以及每个语音信息关联的身份信息,获得多个语音信息以及每个语音信息关联的身份信息;根据所述多个语音信息以及每个语音信息关联的身份信息,生成会议记录。
CN202010219959.XA 2020-03-25 2020-03-25 信息处理方法、装置以及系统、会议端、服务器 Pending CN113517002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010219959.XA CN113517002A (zh) 2020-03-25 2020-03-25 信息处理方法、装置以及系统、会议端、服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010219959.XA CN113517002A (zh) 2020-03-25 2020-03-25 信息处理方法、装置以及系统、会议端、服务器

Publications (1)

Publication Number Publication Date
CN113517002A true CN113517002A (zh) 2021-10-19

Family

ID=78060153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010219959.XA Pending CN113517002A (zh) 2020-03-25 2020-03-25 信息处理方法、装置以及系统、会议端、服务器

Country Status (1)

Country Link
CN (1) CN113517002A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114745213A (zh) * 2022-04-11 2022-07-12 深信服科技股份有限公司 一种会议记录生成方法、装置及电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137988A1 (en) * 2009-12-08 2011-06-09 International Business Machines Corporation Automated social networking based upon meeting introductions
CN102572372A (zh) * 2011-12-28 2012-07-11 中兴通讯股份有限公司 会议纪要的提取方法和装置
EP2677743A1 (en) * 2012-06-19 2013-12-25 BlackBerry Limited Method and apparatus for identifying an active participant in a conferencing event
CN104038354A (zh) * 2014-04-25 2014-09-10 西北工业大学 一种基于智能手机的会议交互方法
CN107862071A (zh) * 2017-11-22 2018-03-30 三星电子(中国)研发中心 生成会议记录的方法和装置
CN107911646A (zh) * 2016-09-30 2018-04-13 阿里巴巴集团控股有限公司 一种会议分享、生成会议记录的方法及装置
CN109817245A (zh) * 2019-01-17 2019-05-28 深圳壹账通智能科技有限公司 会议纪要的生成方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137988A1 (en) * 2009-12-08 2011-06-09 International Business Machines Corporation Automated social networking based upon meeting introductions
CN102572372A (zh) * 2011-12-28 2012-07-11 中兴通讯股份有限公司 会议纪要的提取方法和装置
EP2677743A1 (en) * 2012-06-19 2013-12-25 BlackBerry Limited Method and apparatus for identifying an active participant in a conferencing event
CN104038354A (zh) * 2014-04-25 2014-09-10 西北工业大学 一种基于智能手机的会议交互方法
CN107911646A (zh) * 2016-09-30 2018-04-13 阿里巴巴集团控股有限公司 一种会议分享、生成会议记录的方法及装置
CN107862071A (zh) * 2017-11-22 2018-03-30 三星电子(中国)研发中心 生成会议记录的方法和装置
CN109817245A (zh) * 2019-01-17 2019-05-28 深圳壹账通智能科技有限公司 会议纪要的生成方法、装置、计算机设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114745213A (zh) * 2022-04-11 2022-07-12 深信服科技股份有限公司 一种会议记录生成方法、装置及电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN107911646B (zh) 一种会议分享、生成会议记录的方法及装置
US6687671B2 (en) Method and apparatus for automatic collection and summarization of meeting information
US8204759B2 (en) Social analysis in multi-participant meetings
CN109474763A (zh) 一种基于语音、语义的ai智能会议系统及其实现方法
CN112037791B (zh) 会议纪要转录方法、设备和存储介质
WO2020007129A1 (zh) 基于语音交互的上下文获取方法及设备
CN110853646A (zh) 会议发言角色的区分方法、装置、设备及可读存储介质
US10699709B2 (en) Conference call analysis and automated information exchange
CN109560941A (zh) 会议记录方法、装置、智能终端及存储介质
CN108920640B (zh) 基于语音交互的上下文获取方法及设备
US20160189107A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN108257594A (zh) 一种会议系统及其信息处理方法
JP2024026295A (ja) 音声映像ストリームからのプライバシーに配慮した会議室でのトランスクリプション
WO2024032159A1 (zh) 多人机交互场景下的说话对象检测
CN111223487B (zh) 一种信息处理方法及电子设备
CN112100357A (zh) 引导语的生成方法及装置、电子设备、计算机存储介质
CN111626061A (zh) 会议记录生成方法、装置、设备及可读存储介质
Muthumari et al. Smart and multi-way attendance tracking system using an image-processing technique
CN113517002A (zh) 信息处理方法、装置以及系统、会议端、服务器
CN114240342A (zh) 一种会议控制的方法和装置
CN112634879B (zh) 语音会议管理方法、装置、设备及介质
WO2021159734A1 (zh) 一种数据处理方法、装置、设备及介质
KR102291113B1 (ko) 회의록 작성 장치 및 방법
WO2021134720A1 (zh) 一种会议数据处理方法及相关设备
CN116991808B (zh) 用于企业会议的数据智能存储方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211019