CN112765334A - 一种信息处理方法及设备 - Google Patents

一种信息处理方法及设备 Download PDF

Info

Publication number
CN112765334A
CN112765334A CN202110104281.5A CN202110104281A CN112765334A CN 112765334 A CN112765334 A CN 112765334A CN 202110104281 A CN202110104281 A CN 202110104281A CN 112765334 A CN112765334 A CN 112765334A
Authority
CN
China
Prior art keywords
information
semantic
preset
similarity
semantic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110104281.5A
Other languages
English (en)
Inventor
刘磊
洪铮楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202110104281.5A priority Critical patent/CN112765334A/zh
Publication of CN112765334A publication Critical patent/CN112765334A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种信息处理方法,该方法包括:获取多人讨论的待处理音频信息的语义信息;对语义信息进行分析,得到语义信息对应的主题信息;确定主题信息与预设主题信息的第一相似度;若第一相似度大于或等于第一预设相似度,确定语义进度信息;发送语义进度信息、主题信息和第一相似度至第二电子设备。本申请实施例同时还公开了一种第一电子设备。

Description

一种信息处理方法及设备
技术领域
本申请涉及信息处理领域,尤其涉及一种信息处理方法及设备。
背景技术
在教学过程中,教师常常会让学生针对某个主题(问题)进行分组讨论,但是教师往往无法掌握每个小组的讨论情况,目前,教师通过巡视方式了解每个小组的讨论情况。但是,这种通过巡视来获取小组的讨论情况的方法效率较低。
发明内容
本申请实施例期望提供一种信息处理方法及设备,解决了通过巡视来获取小组的讨论情况的方法效率较低的问题,提高了获取小组的讨论情况的效率。
为达到上述目的,本申请的技术方案是这样实现的:
一种信息处理方法,所述方法包括:
获取多人讨论的待处理音频信息的语义信息;
对所述语义信息进行分析,得到所述语义信息对应的主题信息;
确定所述主题信息与预设主题信息的第一相似度;
若所述第一相似度大于或等于第一预设相似度,确定语义进度信息;
发送所述语义进度信息、所述主题信息和所述第一相似度至第二电子设备。
上述方案中,所述获取多人讨论的待处理音频信息的语义信息,包括:
获取所述待处理音频信息;
对所述待处理音频信息进行声纹识别,得到所述待处理音频信息中每个人的个体音频信息;
对所述个体音频信息进行语义识别,得到所述个体音频信息对应的个体语义信息;
对多个所述个体语义信息进行处理,得到所述待处理音频信息的语义信息。
上述方案中,所述对多个所述个体语义信息进行处理,得到所述待处理音频信息的语义信息,包括:
获取多个所述个体音频信息在所述待处理音频信息中的时间;
基于所述时间对所述多个个体语义信息进行处理,生成所述待处理音频信息的语义信息。
上述方案中,所述对所述语义信息进行分析,得到所述语义信息对应的主题信息,包括:
基于预设时间参数和预设语句属性参数,从所述语义信息中提取待分析语义信息;
对所述待分析语义信息进行分析,得到所述主题信息。
上述方案中,所述基于预设时间参数和预设语句属性参数,从所述语义信息中提取待分析语义信息,包括:
从所述语义信息中提取第一预设时长内的音频信息对应的基础语义信息;
若所述基础语义信息中的语句数量小于或等于预设语句数量,确定所述基础语义信息为所述待分析语义信息;
若所述基础语义信息中的语句数量大于所述预设语句数量,从所述基础语义信息中获取所述基础语义信息对应的音频信息的时长满足第二预设时长,且所述基础语义信息的语句数量满足所述预设语句数量的语义信息,得到所述待分析语义信息;其中,所述第二预设时长小于所述第一预设时长。
上述方案中,所述若所述第一相似度大于或等于第一预设相似度,确定语义进度信息,包括:
若所述第一相似度大于或等于所述第一预设相似度,基于预设语义信息和所述语义信息生成所述语义进度信息。
上述方案中,所述方法还包括:
获取所述语义信息对应的所述待处理音频信息的音频时长;
基于所述音频时长确定所述语义信息的语义时长;
发送所述语义时长至所述第二电子设备。
上述方案中,所述方法还包括:
若所述第一相似度小于所述第一预设相似度,发送所述第一相似度和所述主题信息至所述第二电子设备。
上述方案中,所述方法还包括:
接收所述第二电子设备发送的用于对所述多人讨论的讨论情况进行评价的反馈信息;
输出所述反馈信息。
一种第一电子设备,所述第一电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的通信连接;
所述处理器用于执行所述存储器中存储的信息处理程序,以实现以下步骤:
获取多人讨论的待处理音频信息的语义信息;
对所述语义信息进行分析,得到所述语义信息对应的主题信息;
确定所述主题信息与预设主题信息的第一相似度;
若所述第一相似度大于或等于第一预设相似度,确定语义进度信息;
发送所述语义进度信息、所述主题信息和所述第一相似度至第二电子设备。
一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述的信息处理方法的步骤。
本申请实施例所提供的信息处理方法及设备,对多人讨论的待处理音频信息的语义信息进行处理,将处理得到语义进度信息、主题信息和第一相似度发送至第二电子设备,无需通过巡视的方式获取语义进度信息、主题信息和第一相似度,提高了获取语义进度信息、主题信息和第一相似度的效率。
附图说明
图1为本申请实施例提供的一种信息处理方法的流程示意图;
图2为本申请实施例提供的一种信息处理方法的流程示意图;
图3为本申请实施例提供的一种第一电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请实施例提供一种信息处理方法,该方法应用于第一电子设备,如图1所示,该方法包括以下步骤:
S101、获取多人讨论的待处理音频信息的语义信息。
其中,待处理音频信息的语义信息可以是多人组成的讨论组进行讨论问题(指定主题)时生成的音频信息对应的语义信息。
在本申请实施例中,第一电子设备可以为具有音频采集和处理功能的设备;在一种可行的实现方式中,第一电子设备可以为智能助教设备;其中,多人讨论的待处理音频信息可以为教学场景下多个学生对某个问题进行小组讨论时,智能助教设备实时采集的讨论时生成的音频信息。
需要说明的是,待处理音频信息的语义信息可以是对实时采集的音频信息进行实时处理后的信息,还可以是对实时采集的音频信息在预设时间间隔之后进行处理得到的信息。
S102、对语义信息进行分析,得到语义信息对应的主题信息。
其中,主题信息用于表征待处理音频信息的语义信息的内容。
在本申请实施例中,第一电子设备可以通过对语义信息中每个关键词进行分析确定每个关键词的出现频率,并对每个关键词的出现频率进行排序,之后根据排序结果获取预设数量的关键词,并对预设数量的关键词进行组合得到主题信息。在一种可行的实现方式中,第一电子设备获取语义信息中的每个关键词的出现频率后,可以按照从大到小的顺序对语义信息中所有关键词的出现频率进行排序;若预设数量为5,则可以获取排序前5的关键词,并对获取的5个关键词进行组合得到主题信息。
需要说明的是,主题信息可以是待处理音频信息的语义信息中全部语义信息对应的主题信息,还可以是待处理音频信息的语义信息中部分语义信息对应的主题信息。
S103、确定主题信息与预设主题信息的第一相似度。
其中,预设主题信息可以是多人在讨论前已经指定即将讨论的主题信息。
在本申请实施例中,第一电子设备可以通过将主题信息与预设主题信息进行匹配,根据匹配结果得到第一相似度;在一种可行的实现方式中,可以通过比较主题信息所指代的内容与预设主题信息所指代的内容之间的相似度来确定第一相似度。
S104、若第一相似度大于或等于第一预设相似度,确定语义进度信息。
其中,语义进度信息指的是多人进行小组(讨论组)讨论时的讨论进度。
在本申请实施例中,若第一相似度大于或等于第一预设相似度,说明当前多人讨论的主题信息与预设主题信息是相关的,也就表明当前小组讨论的主题没有偏离预设主题,此时第一电子设备可以确定语义进度信息以便知道小组讨论的讨论进度。
需要说明的是,第一电子设备通过确定主题信息与预设主题信息的第一相似度,可以判断多人组成的讨论组进行讨论时所讨论的主题信息是否偏离预设主题信息;在一种可行的实现方式中,在教学场景下,通过判断主题信息与预设主题信息的相似度可以判断学生是否有针对指定的主题信息进行讨论,以此来监控学生的讨论情况。
在本申请实施例中,第一电子设备可以对多人讨论的待处理音频信息的语义信息进行分析处理,得到语义进度信息。
S105、发送语义进度信息、主题信息和第一相似度至第二电子设备。
在本申请实施例中,第二电子设备可以是教师所持有的用于监控每个讨论组讨论情况的设备;第二电子设备接收到第一电子设备发送的语义进度信息、主题信息和第一相似度后。教师可以通过第二电子设备查看多人进行讨论时的语义进度信息、主题信息和第一相似度,不需要教师自己去巡视来了解每一讨论组的语义进度信息、主题信息和第一相似度,节省了大量的时间,提高了获取每个小组的讨论进度的效率,同时还可以避免教师无法获取未巡视的小组的语义进度信息、主题信息和第一相似度的问题。
另外,教师对每个小组进行巡视的时间有限,并不能参与每个小组进行讨论的全部讨论过程,当教师巡视到某一讨论组时,若某些内容该讨论组在前一时间段已经讨论过了,教师在巡视时该组学生并没有讨论该内容,教师会认为该组的学生还未讨论该内容,导致教师获取该组的语义进度信息、主题信息和第一相似度的准确率并不高;而且教师在巡视过程中若通过询问来获取每个小组的讨论情况,讨论组的讨论者会存在向教师虚报语义进度信息、主题信息和第一相似度的情况,导致教师获取该组的语义进度信息、主题信息和第一相似度的准确率不高。
而本申请实施例所提供的信息处理方法,第一电子设备获取的是讨论组进行讨论时讨论过程的音频信息,该音频信息是从讨论组开始讨论的时刻开始采集并生成的,基于该音频信息分析得到讨论组的语义进度信息、主题信息和第一相似度,分析过程并不会漏掉讨论组讨论时的讨论内容,且避免了讨论组的讨论者虚报语义进度信息、主题信息和第一相似度的情况,提高了获取的语义进度信息、主题信息和第一相似度的准确率。
本申请实施例所提供的信息处理方法,对多人讨论的待处理音频信息的语义信息进行处理,将处理得到语义进度信息、主题信息和第一相似度发送至第二电子设备,无需通过巡视的方式获取语义进度信息、主题信息和第一相似度,提高了获取语义进度信息、主题信息和第一相似度的效率。
基于前述实施例,本申请的实施例提供一种信息处理方法,参照图2所示,该方法包括以下步骤:
S201、第一电子设备获取多人讨论的待处理音频信息。
其中,多人讨论的待处理音频信息是第一电子设备在多人讨论时实时采集生成的音频信息;还可以是历史采集生成的音频信息。下述通过示例,对获取多人讨论的待处理音频信息的方式进行详细的解释说明。
在一种可行的实现方式中,在教学场景下,每个讨论组进行讨论指定主题的过程中,智能助教设备对每个讨论组讨论时参与讨论的成员的发言进行实时采集,以生成多人讨论的待处理音频信息;其中,多人讨论的待处理音频信息可以为智能助教设备的开始采集时刻至当前采集时刻之间的音频信息(讨论过程还未结束时,获取的部分讨论过程的音频信息)。
在另一种可行的实现方式中,智能助教设备可以从智能助教设备的存储器中获取历史采集的每个讨论组进行讨论时的音频信息作为多人讨论的待处理音频信息。其中,该多人讨论的待处理音频信息为智能助教设备的开始采集时刻至采集结束时刻之间的音频信息(即讨论过程已经结束,获取的讨论组进行讨论时整个讨论过程的音频信息)。
S202、第一电子设备对多人讨论的待处理音频信息进行声纹识别,得到多人讨论的待处理音频信息中每个人的个体音频信息。
在本申请实施例中,第一电子设备可以采用声纹识别技术将多人讨论的待处理音频信息进行拆解,以得到多人讨论的待处理音频信息中每个人的个体音频信息。其中,个体音频信息指的是多人讨论的待处理音频信息中每个人的声音所对应的音频信息。个体音频信息可以是多个不连续的音频信息组成的音频信息,也可以是一个连续的音频信息。
在一种可行的实现方式中,第一电子设备可以通过声纹识别模型对多人讨论的待处理音频信息进行声纹识别处理,以确定多人讨论的待处理音频信息中包括哪几个人的声音,根据每个人的声音对多人讨论的待处理音频信息进行拆解,以从多人讨论的待处理音频信息中获取每个人所对应的音频信息。其中,声纹识别模型是第一电子设备预先采集多个人的声音进行训练得到的,多个人的声音中至少包括讨论组中每个人的声音。
S203、第一电子设备对个体音频信息进行语义识别,得到个体音频信息对应的个体语义信息。
在本申请实施例中,第一电子设备可以对每个个体音频信息进行分析后,将每一个体音频信息进行语义转文字处理,进而可以得到多个个体语义信息。
S204、第一电子设备对多个个体语义信息进行处理,得到多人讨论的待处理音频信息的语义信息。
在本申请实施例中,多人讨论的待处理音频信息的语义信息可以是按照预设次序对多个个体语义信息进行排序,并对排序后的个体语义信息进行组合得到的。
在本申请实施例中,S204可以通过S204a和S204b来实现。
S204a、第一电子设备获取多个个体音频信息在多人讨论的待处理音频信息中的时间。
在本申请实施例中,第一电子设备可以将个体音频信息与多人讨论的待处理音频信息进行匹配,基于匹配结果,从多人讨论的待处理音频信息的时间中获取个体音频信息在多人讨论的待处理音频信息中对应的时间。
S204b、第一电子设备基于时间对多个个体语义信息进行处理,生成多人讨论的待处理音频信息的语义信息。
在本申请实施例中,第一电子设备可以依据个体语义信息在多人讨论的待处理音频信息中的时间,按照时间的先后顺序对多个个体语义信息进行排序,将排序后的多个个体语义信息作为多人讨论的待处理音频信息的语义信息。
需要说明的是,本申请实施例中第一电子设备还可以对多人讨论的待处理音频信息的语义信息进行拆解,以得到多人讨论的待处理音频信息的语义信息对应的每条语句信息;第一电子设备可以对每条语句信息进行标记,以得到每条语句对应的语句标识;其中,语句标识用于表征每条语句对应的发言者。如此,第一电子设备便可以得到标记后的多人讨论的待处理音频信息的语义信息,并可以将标记后的多人讨论的待处理音频信息的语义信息发送至第二电子设备。在教学场景下,教师通过第二电子设备可以查看标记后的多人讨论的待处理音频信息的语义信息,通过语义信息中每条语句的标识,教师可以详细的知晓在讨论过程中每个人的讨论情况。
可选的,第一电子设备还可以对多人讨论的待处理音频信息的语义信息中的语句标识进行统计,得到多人讨论过程中每个人的语句数量,以便对多人讨论过程中每个人的发言情况进行监测。在一种可行的实现方式中,第一电子设备可以统计待处理音频信息的语义信息的语句标识,假设参加讨论的人数为5,则可以通过对语句标识进行统计,得到5个人中每个人参与讨论时的语句数量;第一电子设备可以基于每个人参与讨论的语句数量分析每个人参加讨论过程的活跃度。
S205、第一电子设备获取语义信息对应的待处理音频信息的音频时长。
其中,语义信息对应的待处理音频信息的音频时长指的是采集待处理音频信息的起始时刻和采集待处理音频信息的当前时刻之间的时长。
在一种可行的实现方式中,若多人讨论时的开始时刻为A时刻,则第一电子设备可以从A时刻开始采集音频信息,若当前时刻(B时刻)需要获取语义信息,则可以将A时刻到B时刻之间的音频信息作为待处理音频信息,该待处理音频信息对应的语义信息为待处理音频信息的语义信息,A时刻与B时刻之间的时长便可以作为语义信息对应的待处理音频信息的音频时长。
S206、第一电子设备基于音频时长确定语义信息的语义时长。
在本申请实施例中,第一电子设备可以将待处理音频信息的音频时长作为语义信息的语义时长。
需要说明的是,本申请实施例不限于步骤之间的条件,获取语义时长的步骤可以在得到主题信息之前,还可以是在获取主题信息之后。
S207、第一电子设备基于预设时间参数和预设语句属性参数,从语义信息中提取待分析语义信息。
其中,预设时间参数是用于表征某一时间段的参数;预设语句属性用于表征语句的数量;语义信息可以是第一电子设备采集多人讨论过程中的当前采集时刻与开始采集时刻之间的多人讨论的待处理音频信息的语义信息;待分析语义信息可以是多人讨论的待处理音频信息的语义信息中的部分语义信息。
在本申请实施例中,第一电子设备基于预设时间参数从语义信息中提取满足预设时间参数对应的语义信息,之后从满足预设时间参数对应的语义信息中提取满足预设语句属性参数的语义信息得到待分析语义信息。
需要说明的是,提取待分析语义信息时,必须要在满足预设时间参数的前提下,基于预设语句属性参数提取待分析语义信息;在本申请实施例中,可以基于预设时间参数和预设语句属性参数多次从语义信息中提取待分析语义信息,以便后续过程对每次提取的待分析语义信息进行处理。
其中,S207还可以通过S207a、S207b和S207c实现;
S207a、第一电子设备从语义信息中提取第一预设时长内的音频信息对应的基础语义信息。
其中,若当前采集时刻为终点时刻,当前采集时刻之前的某一时刻为起始时刻,那么第一预设时长可以是起始时刻与终点时刻之间的时长。
在本申请实施例中,第一预设时长是预先设置的,如可以是2分钟或3分钟,第一预设时长具体可以根据实际应用场景进行设置,本申请实施例对第一预设时长的具体值不作限定。在一种可行的实现方式中,若多人进行讨论时的起始时刻为A时刻,当前时刻为B时刻,其中,B时刻下多人对某个问题的讨论还正在进行,此时第一预设时长可以为B时刻之前前2分钟的时长,其中,B时刻之前2分钟对应的时刻为C时刻,则第一预设时长对应的时间段可以为C时刻与B时刻之间的时间段,基础语义信息为C时刻与B时刻之间的时间段所对应的语义信息。
需要说明的是,第一电子设备可以从语义信息中提取第一预设时长内的音频信息对应的基础语义信息,并通过对基础语义信息进行分析来判断该第一预设时长对应的时间段中,多人对指定主题进行讨论时的讨论情况;通过第一预设时长来确定基础语义信息,避免时间过短或过长时,影响第一电子设备对多人讨论的讨论情况进行分析的准确率。
S207b、若基础语义信息中的语句数量小于或等于预设语句数量,第一电子设备确定基础语义信息为待分析语义信息。
在本申请实施例中,第一电子设备可以对基础语义信息中的语句数量进行统计,得到基础语义信息中的语句数量,之后将基础语义信息的语句数量与预设语句数量进行比较,若基础语义信息中的语句数量小于或等于预设语句数量,则将基础语义信息作为待分析语义信息。在一种可行的实现方式中,若预设语句数量为20,若基础语义信息中的语句数量小于20或等于20时,第一电子设备可以将基础语义信息作为待分析语义信息。
需要说明的是,基于基础语义信息和预设语句数量来确定待分析语义信息,避免在第一预设时长之内得到的基于语义信息的语句数量过少,影响对第一预设时长对应的时间段中多人讨论的讨论情况进行分析的准确率,因此,需要通过预设语句数量来保证待分析语义信息的有效性。
S207c、若基础语义信息中的语句数量大于预设语句数量,第一电子设备从基础语义信息中获取基础语义信息对应的音频信息的时长满足第二预设时长,且基础语义信息的语句数量满足预设语句数量的语义信息,得到待分析语义信息。
其中,第二预设时长小于第一预设时长,第一预设时长对应的时间段包括第二预设时长对应的时间段。
在本申请实施例中,若基础语义信息中的语句数量大于预设语句数量,第一电子设备可以确定第二预设时长对应的时间段的语义信息的语句数量是否大于或等于预设语句数量;若第二预设时长对应的时间段的语义信息的语句数量大于或等于预设语句数量,则可以确定第二预设时长对应的时间段的语义信息为待分析语义信息。其中,第二预设时长对应的时间段可以是从第一预设时长对应的时间段中选择的时间段,该时间段可以是以第一预设时长中的起始时刻开始到之后某一时刻之间的时间段,或第一预设时长中终点时刻开始到之前的某一时刻之间的时间段,或第一预设时长对应的时间段中除起始时刻和终点时刻之外,之间的某两个时刻之间的时间段。
在一种可行的实现方式中,若第一预设时长为C时刻到B时刻之间的时长;其中,B时刻为当前采集时刻,C时刻在B时刻之前。若第一预设时长为1分钟,C时刻和B时刻之间的某一时刻记为D时刻,则第一预设时长对应的时间段可以是C时刻到D时刻之间的时间,其中,C时刻到D时刻之间的时长为1分钟;第一预设时长对应的时间段也可以是B时刻到D时刻之间的时间,其中,B时刻到D时刻之间的时间为1分钟;第一预设时长对应的时间段还可以是B时刻和C时刻之间的时间段中,D时刻和E时刻之间对应的时间段,其中,D时刻和E时刻之间的时长为1分钟。若预设语句数量为20,则判断第二预设时长对应的时间段的语义信息的语句数量是否大于等于20,若大于等于20则将第二预设时长对应的时间段的语义信息作为待分析语义信息。
在本申请实施例中,若第二预设时长对应的时间段的语义信息的语句数量小于预设语句数量,则从待分析基础语义信息中获取预设语句数量对应的语义信息,且该预设语句数量对应的语义信息的音频信息的时长大于等于第二预设时长的语义信息为待分析语义信息。在一种可行的实现方式中,以预设语句数量为20为例,若第二预设时长中对应的时间段的语义信息的语句数量小于20,且第一预设时长中对应的时间段的语义信息的语句数量大于20,则可以从第一预设时长中对应的时间段的语义信息中提取预设语句数量对应的语义信息,且满足预设语句数量对应的语义信息的时长大于等于第二预设时长。
需要说明的是,通过第一预设时长、第二预设时长以及预设语句数量,可以更准确的从语义信息中提取待分析语义信息,保证了获取的待分析语义信息的有效性。
S208、第一电子设备对待分析语义信息进行分析,得到主题信息。
在本申请实施例中,第一电子设备可以采用预设主题生成模型对待分析语义信息进行分析,以得到主题信息。在一种可行的实现方式中,第一电子设备可以采用文档主题生成模型(Latent Dirichlet Allocation,LDA)对待分析语义信息进行分析,具体可以将待分析语义信息输入至文档主题生成模型中,文档主题生成模型可以输出该待分析语义信息对应的主题信息。
其中,第一电子设备可以对每次提取的待分析语义信息进行分析;需要说明的是,每一次提取的待分析语义信息可以不相同。
在一种可行的实现方式中,若小组讨论的开始时刻为A时刻,智能助教设备可以在A时刻开始采集小组讨论的待处理音频信息,在A时刻之后的多个时刻第一电子设备可以从实时采集的待处理音频信息的语义信息中提取多个待分析语义信息,并对每一个待分析语义信息进行分析,得到每个待分析语义信息对应的主题信息;如此,便可以监控多人讨论过程中每一个时间段内讨论的主题信息是否与预设主题信息相关。
S209、第一电子设备确定主题信息与预设主题信息的第一相似度。
其中,预设主题信息为在多人讨论前存储在第一电子设备中的主题信息。
在本申请实施例中,第一电子设备基于预设主题信息,采用语义相似度模型对主题信息进行处理,得到主题信息与预设主题信息的第一相似度。
具体地,第一电子设备可以将预设主题信息和主题信息输入至语义相似度模型中,通过语义相似度模型对预设主题信息和主题信息进行分析后,输出主题信息与预设主题信息的第一相似度。
S210、若第一相似度大于或等于第一预设相似度,第一电子设备基于预设语义信息和语义信息生成语义进度信息。
在本申请实施例中,当第一相似度大于第一预设相似度时,第一电子设备可以基于语义相似度模型对预设语义信息和语义信息进行分析得到预设语义信息和语义信息的第二相似度,并基于第二相似度得到语义进度信息。
S211、第一电子设备发送语义进度信息、主题信息、第一相似度和语义时长至第二电子设备。
需要说明的是,第二电子设备接收第一电子设备发送的语义时长,教师可以通过第二电子设备掌握整个讨论过程的时间。
S212、若第一相似度小于第一预设相似度,第一电子设备发送第一相似度、主题信息和语义时长至第二电子设备。
在本申请实施例中,若第一相似度小于第一预设相似度,则表明多人讨论的主题信息与预设的主题信息不相关,此时不需要监控多人讨论的进度信息;第一电子设备可以将第一相似度、语义时长和主题信息发送至第二电子设备。
需要说明的是,第一电子设备还可以将待处理音频信息的语义信息以及待分析语义信息发送至第二电子设备,在教学场景下,教师可以通过第二电子设备查看学生的讨论情况以及可以查看多人进行讨论时每个人的讨论情况,进一步的实现了对多人讨论的讨论过程进行监控。
在一种可行的实现方式中,第一电子设备在多人讨论过程中已经多次判断多个时间段中多人讨论的主题信息与预设主题信息的关联关系,若上一次第一电子设备判断多人讨论的主题信息与预设主题信息相关,此次判断多人讨论的主题信息与预设主题信息不相关,则语义进度信息仍然为上一次判断多人讨论的主题信息与预设主题信息相关时得到的语义进度信息;该语义进度信息第一电子设备已经在之前发送至第二电子设备,因此,在此次判断多人讨论的主题信息与预设主题信息不相关时,不需要再发送语义进度信息至第二电子设备。
基于前述实施例,在本申请的其他实施例中,该方法还可以包括以下步骤:
S213、第一电子设备接收第二电子设备发送的用于对多人讨论的讨论情况进行评价的反馈信息。
其中,反馈信息包括但不限于:对讨论组的讨论情况进行打分、针对讨论组当前的讨论情况给予建议,或对每个人的讨论情况进行点评。
在本申请实施例中,教师可以通过第二电子设备查看第一电子设备发送的多人讨论的相关讨论信息,并基于相关讨论信息给予反馈,并发送反馈信息至第一电子设备。其中,相关讨论信息至少包括:语义时长、主题信息、第一相似度;当然,相关讨论信息还可以包括语义进度信息。在一种可行的实现方式中,若教师通过第二电子设备查看某一讨论组讨论的主题信息与预设主题信息不相关时,则可以通过第二电子设备发送提示信息,以提示该讨论组的学生不要讨论与指定主题无关的主题(话题)。
S214、第一电子设备输出反馈信息。
在本申请实施例中,进行多人讨论的讨论组中的每个人可以从第一电子设备上获取反馈信息,并基于反馈信息可以调整当前的讨论。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本申请实施例所提供的信息处理方法,对多人讨论的待处理音频信息的语义信息进行处理,将处理得到语义进度信息、主题信息和第一相似度发送至第二电子设备,无需通过巡视的方式获取语义进度信息、主题信息和第一相似度,提高了获取语义进度信息、主题信息和第一相似度的效率。
基于前述实施例,本申请的实施例提供一种第一电子设备,该第一电子设备可以应用于图1~图2对应的实施例提供的信息处理方法中,参照图3所示,该第一电子设备3包括:处理器32、存储器31和通信总线33;
通信总线33用于实现处理器32和存储器31之间的通信连接;
处理器32用于执行存储器31中存储的信息处理程序,以实现以下步骤:
获取多人讨论的待处理音频信息的语义信息;
对语义信息进行分析,得到语义信息对应的主题信息;
确定主题信息与预设主题信息的第一相似度;
若第一相似度大于或等于第一预设相似度,确定语义进度信息;
发送语义进度信息、主题信息和第一相似度至第二电子设备。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
获取多人讨论的待处理音频信息;
对多人讨论的待处理音频信息进行声纹识别,得到多人讨论的待处理音频信息中每个人的个体音频信息;
对个体音频信息进行语义识别,得到个体音频信息对应的个体语义信息;
对多个个体语义信息进行处理,得到多人讨论的待处理音频信息的语义信息。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
获取多个个体音频信息在多人讨论的待处理音频信息中的时间;
基于时间对多个个体语义信息进行处理,生成多人讨论的待处理音频信息的语义信息。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
基于预设时间参数和预设语句属性参数,从语义信息中提取待分析语义信息;
对待分析语义信息进行分析,得到主题信息。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
从语义信息中提取第一预设时长内的音频信息对应的基础语义信息;
若基础语义信息中的语句数量小于或等于预设语句数量,确定基础语义信息为待分析语义信息;
若基础语义信息中的语句数量大于预设语句数量,从基础语义信息中获取基础语义信息对应的音频信息的时长满足第二预设时长,且基础语义信息的语句数量满足预设语句数量的语义信息,得到待分析语义信息;其中,第二预设时长小于第一预设时长。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
若第一相似度大于或等于第一预设相似度,基于预设语义信息和语义信息生成语义进度信息。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
获取语义信息对应的多人讨论的待处理音频信息的音频时长;
基于音频时长确定语义信息的语义时长;
发送语义时长至第二电子设备。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
若第一相似度小于第一预设相似度,发送第一相似度和主题信息至第二电子设备。
在本申请的其他实施例中,处理器32,用于执行存储器31中存储的可执行指令,以实现以下步骤:
接收第二电子设备发送的用于对多人讨论的讨论情况进行评价的反馈信息;
输出反馈信息。
需要说明的是,本申请实施例中处理器所执行的步骤的具体实现过程,可以参照图1~图2对应的实施例提供的信息处理方法中的实现过程,此处不再赘述。
本申请实施例所提供的第一电子设备,对多人讨论的待处理音频信息的语义信息进行处理,将处理得到语义进度信息、主题信息和第一相似度发送至第二电子设备,无需通过巡视的方式获取语义进度信息、主题信息和第一相似度,提高了获取语义进度信息、主题信息和第一相似度的效率。
基于前述实施例,本申请的实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现图1~图2对应的实施例提供的信息处理方法中的步骤。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,上述计算机可读存储介质可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所描述的方法。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种信息处理方法,所述方法应用于第一电子设备,所述方法包括:
获取多人讨论的待处理音频信息的语义信息;
对所述语义信息进行分析,得到所述语义信息对应的主题信息;
确定所述主题信息与预设主题信息的第一相似度;
若所述第一相似度大于或等于第一预设相似度,确定语义进度信息;
发送所述语义进度信息、所述主题信息和所述第一相似度至第二电子设备。
2.根据权利要求1所述的方法,其特征在于,所述获取多人讨论的待处理音频信息的语义信息,包括:
获取所述待处理音频信息;
对所述待处理音频信息进行声纹识别,得到所述待处理音频信息中每个人的个体音频信息;
对所述个体音频信息进行语义识别,得到所述个体音频信息对应的个体语义信息;
对多个所述个体语义信息进行处理,得到所述待处理音频信息的语义信息。
3.根据权利要求2所述的方法,其特征在于,所述对多个所述个体语义信息进行处理,得到所述待处理音频信息的语义信息,包括:
获取多个所述个体音频信息在所述待处理音频信息中的时间;
基于所述时间对所述多个个体语义信息进行处理,生成所述待处理音频信息的语义信息。
4.根据权利要求1所述的方法,其特征在于,所述对所述语义信息进行分析,得到所述语义信息对应的主题信息,包括:
基于预设时间参数和预设语句属性参数,从所述语义信息中提取待分析语义信息;
对所述待分析语义信息进行分析,得到所述主题信息。
5.根据权利要求4所述的方法,其特征在于,所述基于预设时间参数和预设语句属性参数,从所述语义信息中提取待分析语义信息,包括:
从所述语义信息中提取第一预设时长内的音频信息对应的基础语义信息;
若所述基础语义信息中的语句数量小于或等于预设语句数量,确定所述基础语义信息为所述待分析语义信息;
若所述基础语义信息中的语句数量大于所述预设语句数量,从所述基础语义信息中获取所述基础语义信息对应的音频信息的时长满足第二预设时长,且所述基础语义信息的语句数量满足所述预设语句数量的语义信息,得到所述待分析语义信息;其中,所述第二预设时长小于所述第一预设时长。
6.根据权利要求1所述的方法,其特征在于,所述若所述第一相似度大于或等于第一预设相似度,确定语义进度信息,包括:
若所述第一相似度大于或等于所述第一预设相似度,基于预设语义信息和所述语义信息生成所述语义进度信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述语义信息对应的所述待处理音频信息的音频时长;
基于所述音频时长确定所述语义信息的语义时长;
发送所述语义时长至所述第二电子设备。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一相似度小于所述第一预设相似度,发送所述第一相似度和所述主题信息至所述第二电子设备。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述第二电子设备发送的用于对所述多人讨论的讨论情况进行评价的反馈信息;
输出所述反馈信息。
10.一种第一电子设备,其特征在于,所述第一电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的通信连接;
所述处理器用于执行所述存储器中存储的信息处理程序,以实现以下步骤:
获取多人讨论的待处理音频信息的语义信息;
对所述语义信息进行分析,得到所述语义信息对应的主题信息;
确定所述主题信息与预设主题信息的第一相似度;
若所述第一相似度大于或等于第一预设相似度,确定语义进度信息;
发送所述语义进度信息、所述主题信息和所述第一相似度至第二电子设备。
CN202110104281.5A 2021-01-26 2021-01-26 一种信息处理方法及设备 Pending CN112765334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110104281.5A CN112765334A (zh) 2021-01-26 2021-01-26 一种信息处理方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110104281.5A CN112765334A (zh) 2021-01-26 2021-01-26 一种信息处理方法及设备

Publications (1)

Publication Number Publication Date
CN112765334A true CN112765334A (zh) 2021-05-07

Family

ID=75707424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110104281.5A Pending CN112765334A (zh) 2021-01-26 2021-01-26 一种信息处理方法及设备

Country Status (1)

Country Link
CN (1) CN112765334A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090271438A1 (en) * 2008-04-24 2009-10-29 International Business Machines Corporation Signaling Correspondence Between A Meeting Agenda And A Meeting Discussion
CN102006176A (zh) * 2009-08-31 2011-04-06 夏普株式会社 会议中继装置以及会议系统
CN102843543A (zh) * 2012-09-17 2012-12-26 华为技术有限公司 视频会议提醒方法、装置和视频会议系统
CN108257594A (zh) * 2016-12-28 2018-07-06 中国移动通信有限公司研究院 一种会议系统及其信息处理方法
CN111415128A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 控制会议的方法、系统、装置、设备和介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090271438A1 (en) * 2008-04-24 2009-10-29 International Business Machines Corporation Signaling Correspondence Between A Meeting Agenda And A Meeting Discussion
CN102006176A (zh) * 2009-08-31 2011-04-06 夏普株式会社 会议中继装置以及会议系统
CN102843543A (zh) * 2012-09-17 2012-12-26 华为技术有限公司 视频会议提醒方法、装置和视频会议系统
CN108257594A (zh) * 2016-12-28 2018-07-06 中国移动通信有限公司研究院 一种会议系统及其信息处理方法
CN111415128A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 控制会议的方法、系统、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN110704682B (zh) 一种基于视频多维特征智能推荐背景音乐的方法及系统
CN112365894B (zh) 基于ai的复合语音交互方法、装置及计算机设备
CN109960723B (zh) 一种用于心理机器人的交互系统及方法
CN110263854B (zh) 直播标签确定方法、装置及存储介质
CN111739558B (zh) 监控系统、方法、装置、服务器及存储介质
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN108536668B (zh) 唤醒词评估方法及装置、存储介质、电子设备
CN109065051B (zh) 一种语音识别处理方法及装置
CN109326285A (zh) 语音信息处理方法、装置及非暂态计算机可读存储介质
CN108257594A (zh) 一种会议系统及其信息处理方法
CN113129927B (zh) 语音情绪识别方法、装置、设备及存储介质
CN109002515A (zh) 一种智能应答的方法和装置
CN110111011B (zh) 一种教学质量监管方法、装置及电子设备
CN111192170B (zh) 题目推送方法、装置、设备和计算机可读存储介质
CN114155853A (zh) 一种拒识方法、装置、设备及存储介质
CN111970471A (zh) 基于视频会议的参会人员评分方法、装置、设备及介质
CN110556098B (zh) 语音识别结果测试方法、装置、计算机设备和介质
CN115394318A (zh) 一种音频检测方法和装置
CN115050372A (zh) 一种音频片段的聚类方法、装置、电子设备和介质
CN111223487A (zh) 一种信息处理方法及电子设备
CN111210818B (zh) 匹配情感极性的词语采集方法、装置、电子设备
CN115829533B (zh) 一种智能化线上面试方法、系统、设备及存储介质
CN113763962A (zh) 音频处理方法、装置、存储介质及计算机设备
CN112765334A (zh) 一种信息处理方法及设备
CN113190660A (zh) 问卷调查的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination