CN113315979A - 数据处理方法、装置、电子设备和存储介质 - Google Patents

数据处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113315979A
CN113315979A CN202010798049.1A CN202010798049A CN113315979A CN 113315979 A CN113315979 A CN 113315979A CN 202010798049 A CN202010798049 A CN 202010798049A CN 113315979 A CN113315979 A CN 113315979A
Authority
CN
China
Prior art keywords
information
data
determining
target object
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010798049.1A
Other languages
English (en)
Inventor
林居颖
卢孩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010798049.1A priority Critical patent/CN113315979A/zh
Publication of CN113315979A publication Critical patent/CN113315979A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种数据处理方法、装置、电子设备和存储介质,所述的方法包括:从直播数据中提取第一用户的语音数据;对所述语音数据进行识别,确定目标对象对应的特征信息;依据所述特征信息,确定目标对象和对应的描述信息;依据所述目标对象和所述描述信息,确定目标对象的展示信息;能够方便用户操作。

Description

数据处理方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备和一种存储介质。
背景技术
“网络直播”大致分两类,一类是在网上提供电视信号的观看,例如各类体育比赛和文艺活动的直播,这类直播原理是将电视(模拟)信号通过采集,转换为数字信号输入电脑,实时上传网站供人观看,相当于“网络电视”;另一类是人们所了解的“网络直播”,是在现场架设独立的信号采集设备(音频+视频)导入导播端(导播设备或平台),再通过网络上传至服务器,发布至网址供人观看。
直播过程中,主播通常会手动输入一些信息来完成与观众的互动,例如输入红包的各类信息来发送红包给观看直播的观众来提升活跃度、编辑开播内容并发送开播提醒给已订阅的观众、编辑商品信息以将商品推荐给观众等操作。以红包的发布为例,现有的红包发布方式是主播在直播间输入红包对应的信息(如红包金额、红包个数等),来生成红包,以提供给直播间的观众领取。
但是采用这种方式,用户在直播过程中,还需要手动输入各种信息,用户操作十分麻烦。
发明内容
本申请实施例提供了一种数据处理方法,方便用户的操作。
相应的,本申请实施例还提供了一种数据处理装置、一种电子设备和一种存储介质,用以保证上述系统的实现及应用。
为了解决上述问题,本申请实施例公开了一种数据处理方法,所述的方法包括:从直播数据中提取第一用户的语音数据;对所述语音数据进行识别,确定目标对象对应的特征信息;依据所述特征信息,确定目标对象和对应的描述信息;依据所述目标对象和所述描述信息,确定目标对象的展示信息。
为了解决上述问题,本申请实施例公开了一种数据处理方法,包括:从直播数据中提取第一用户的语音数据;对所述语音数据进行识别,确定虚拟交互对象对应的特征信息;依据所述特征信息,确定所述虚拟交互对象对应的描述信息,所述描述信息包括对象数量和对象资源;调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息;将所述虚拟交互对象添加到所述直播数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理方法,包括:从直播数据中提取第一用户的语音数据;对所述语音数据进行识别,确定商品对象对应的特征信息;依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息;依据所述目标商品对象和描述信息,确定目标商品对象的链接信息;将所述目标商品对象的链接信息添加到所述直播数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理方法,包括:从视频会议的数据中提取目标用户的语音数据;对所述语音数据进行识别,确定目标对象对应的特征信息;依据所述特征信息,确定目标对象和对应的描述信息;依据所述目标对象和所述描述信息,确定目标对象的展示信息;将所述展示信息添加到视频会议的数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理方法,包括:从教学直播的数据中提取目标用户的语音数据;对所述语音数据进行识别,确定目标对象对应的特征信息;依据所述特征信息,确定目标对象和对应的描述信息;依据所述目标对象和所述描述信息,确定目标对象的展示信息;将所述展示信息添加到教学直播的数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理装置,包括:语音数据提取模块,用于从直播数据中提取第一用户的语音数据;特征信息提取模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;特征信息筛选模块,用于依据所述特征信息,确定目标对象和对应的描述信息;展示信息提取模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息。
为了解决上述问题,本申请实施例公开了一种数据处理装置,包括:语音数据获取模块,用于从直播数据中提取第一用户的语音数据;特征信息获取模块,用于对所述语音数据进行识别,确定虚拟交互对象对应的特征信息;特征信息处理模块,用于依据所述特征信息,确定所述虚拟交互对象对应的描述信息,所述描述信息包括对象数量和对象资源;交互对象生成模块,用于调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息;交互对象显示模块,用于将所述虚拟交互对象添加到所述直播数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理装置,包括:语音数据确定模块,用于从直播数据中提取第一用户的语音数据;特征信息确定模块,用于对所述语音数据进行识别,确定商品对象对应的特征信息;商品信息筛选模块,用于依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息;链接信息确定模块,用于依据所述目标商品对象和描述信息,确定目标商品对象的链接信息;链接信息展示模块,用于将所述目标商品对象的链接信息添加到所述直播数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理装置,包括:语音数据获得模块,用于从视频会议的数据中提取目标用户的语音数据;特征信息获得模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;特征信息筛分模块,用于依据所述特征信息,确定目标对象和对应的描述信息;展示信息获得模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息;展示信息输出模块,用于将所述展示信息添加到视频会议的数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种数据处理装置,包括:语音数据筛选模块,用于从教学直播的数据中提取目标用户的语音数据;特征信息识别模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;对象信息筛分模块,用于依据所述特征信息,确定目标对象和对应的描述信息;对象信息处理模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息;展示信息发送模块,用于将所述展示信息添加到教学直播的数据中,以进行显示。
为了解决上述问题,本申请实施例公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如上述实施例中一个或多个所述的方法。
为了解决上述问题,本申请实施例公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如上述实施例中一个或多个所述的方法。
与现有技术相比,本申请实施例包括以下优点:
在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定对应的特征信息,然后依据特征信息,确定目标对象和描述信息,并依据目标对象和描述信息,确定对应的展示信息。本申请实施例能够根据第一用户的语音数据,生成对应的展示信息,无需用户手动输入对应的数据,方便用户的操作。
附图说明
图1是本申请一个实施例的数据处理系统的结构示意图;
图2是本申请一个实施例的数据处理方法的流程示意图;
图3是本申请一个实施例的红包在第二终端的显示示意图;
图4是本申请另一个实施例的数据处理方法的流程示意图;
图5是本申请再一个实施例的数据处理方法的流程示意图;
图6是本申请再一个实施例的数据处理方法的流程示意图;
图7是本申请再一个实施例的数据处理方法的流程示意图;
图8是本申请再一个实施例的数据处理方法的流程示意图;
图9是本申请一个实施例的数据处理装置的结构示意图;
图10是本申请另一个实施例的数据处理装置的结构示意图;
图11是本申请再一个实施例的数据处理装置的结构示意图;
图12是本申请再一个实施例的数据处理装置的结构示意图;
图13是本申请再一个实施例的数据处理装置的结构示意图;
图14是本申请一个实施例提供的示例性装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例可应用于直播领域,具体可应用在基于自动语音识别技术(Automatic Speech Recognition,ASR)和自然语言处理(Natural Language Processing,NLP)对直播过程中的语音数据进行识别的场景,其中,ASR是一种将人的语音转换为文本的技术。ASR对语音数据的处理过程可以包括:将语音数据转换为波形音频,并对音频进行切分(例如按帧切分,得到音频帧),然后确定切分的音频对应状态,依据至少一个状态来确定音素(phone),并将音素确定字词,以将字词组成文本信息。NLP是计算机科学、人工智能和语言学的交叉领域,目的是让计算机处理或“理解”自然语言。NLP对文本信息的处理过程可以包括:获取文本信息,对文本信息进行数据清洗处理(例如对文本信息进行去重、标记、降噪、对齐等处理),之后对处理后的数据进行分词,并提取分词的特征,以确定词向量,其中,分词的特征与分词和分词前后的词的特征相关;确定了词向量之后,基于词向量,确定分词的语义。
举例来说,本申请实施例可以应用于基于ASR和NLP对直播数据中语音数据的识别场景,如图1所示,在该场景中,直播的第一用户通过第一终端将直播数据传递给服务端,服务端将直播数据分发给观看直播的第二用户的第二终端。其中,第一用户可以理解为进行直播的主播,第二用户可以理解为观看直播的观众,第一终端和第二终端可以为手机、电脑等电子设备。
在直播过程中,第一用户可能会将一些红包或者产品分发给观看直播的第二用户,以提升第二用户的活跃度。本申请实施例可以通过识别用户的语音数据来完成红包的发送。具体来说,第一用户在直播时可以说“我们来发一个88元的发财红包,看哪五个人能抽到”,本申请实施例的处理端可以基于ASR将第一用户直播时的语音数据转换为文本信息,并基于NLP对文本信息进行语义识别,以确定对应的目标对象信息(如文本信息中包含的“红包”)和描述信息(如文本信息中包含的“五个”和“88元”等),其中,目标对象信息用于确定目标对象,描述信息用于确定目标对象的属性信息,目标对象可以为用于完成用户之间交互的交互对象,如应用程序、插件、链接等,具体可依据场景设定,例如在直播场景中,目标对象可以为红包插件、商品对象的链接信息等,对应的描述信息可以为红包大小、红包金额、商品售价和商品数量等。在确定了目标对象和描述信息之后,确定对应的展示信息(如红包),并展示给观看直播的第二用户。本申请实施例通过对第一用户的语音数据进行识别,确定对应的目标对象和描述信息,然后确定目标对象的展示信息,并添加到直播数据中进行显示,直播的用户无需手动输入红包的各种信息,方便了第一用户的操作。其中,本申请实施例的处理端可以为第一终端,也可以为服务端。
下面以将本申请应用在直播过程中红包发布的场景中为例,对本申请实施例的数据处理方法进行描述,本申请实施例的数据处理方法,可以通过处理端来执行,如图2所示,该方法包括:步骤202、从直播数据中提取第一用户的语音数据。第一用户可以理解为进行直播的主播,第一用户可以为一个或一个以上。在处理端为第一终端的情况下,第一终端可以提取声音采集设备采集的音频作为第一用户的语音数据。在处理端为第二终端的情况下,第二终端可以对直播数据进行解析,以得到直播数据中的视频数据和音频数据等,并提取音频数据作为第一用户的语音数据。另外,直播数据中可能包含有除第一用户之外的其他用户的语音数据,处理端可以对语音数据进行声纹(Voiceprint)识别,识别出第一用户的语音数据,其中,声纹,是用电声学仪器显示的携带言语信息的声波频谱,通过识别语音数据中的声纹,来确定用户的身份是否为主播(第一用户)。
步骤204、对所述语音数据进行识别,确定目标对象对应的特征信息。特征信息为描述目标对象的特征的信息,例如,特征信息可以包括目标对象的名称(如红包)以及描述目标对象的属性的信息。处理端在确定了语音数据之后,可以将语音数据转换为文本信息,并对文本信息进行语义识别,确定目标对象对应的特征词。具体的,在一个可选的实施例中,所述对所述语音数据进行识别,确定目标对象对应的特征信息,包括:对所述语音数据进行语音识别,确定对应的文本信息;对所述文本信息进行语义分析,确定目标对象对应的特征信息。特征信息可以理解为文本信息中与目标对象的特征词,目标对象的特征词可以包括目标对象的对应目标对象信息的对象特征词和对应描述信息的描述特征词,在处理端可以预先设置包含有多个目标对象对应的特征词库,处理端可以基于ASR将语音数据转换为文本信息,并基于NLP将文本信息中的词语特征词库中的特征词进行匹配,以确定目标对象对应的特征词。
在确定了目标对象对应的特征信息之后,处理端可以在步骤206、依据所述特征信息,确定目标对象和对应的描述信息。处理端可以依据特征词和目标对象的对应关系、特征词和描述信息的对应关系,来筛选出与任务相关的特征词。具体的,在一个可选的实施例中,所述依据所述特征信息,确定目标对象和对应的描述信息,包括:识别所述特征信息中的第一特征词,以确定目标对象;识别所述特征信息中的第二特征词,以确定所述目标对象对应的描述信息。第一特征词还可以称为对象特征词,第二特征词还可以称为描述特征词。处理端的特征词库可以划分为包含对象特征词的第一词库和包含有描述特征词的第二词库,处理端可以将文本信息中的特征词与第一词库和第二词库中的特征词进行匹配,来确定对象特征词和描述特征词,以确定目标对象和描述信息。需要说明的是,一个目标对象可以对应多个特征词,一个描述信息可以对应多个特征词。例如对应红包(目标对象)的对象特征词可以包括“红包”、“发财红包”等;对应红包数量的描述特征词可以包括“5个红包”、“5位用户”等。
在确定了目标对象和描述信息之后,处理端在步骤208、依据所述目标对象和所述描述信息,确定目标对象的展示信息。描述信息用于设置目标对象的属性信息,处理端可以调用目标对象的插件,并依据描述信息,设置目标对象的属性信息,来确定目标对象对应的展示信息。具体的,在一个可选的实施例中,依据所述目标对象和所述描述信息,确定目标对象的展示信息,包括:依据所述描述信息设置所述目标对象的属性信息;依据所述目标对象和属性信息,确定所述目标对象的展示信息。在确定了目标对象之后,可以调取目标对象对应的插件,其中,目标对象对应的插件用于设定目标对象的属性信息。依据描述信息对目标对象的属性信息进行配置,以确定目标对象的展示信息。举例来说,直播场景中的目标对象可以理解为对应的红包插件等,本申请实施例可以调用对应的红包插件等,并结合描述信息(红包金额和红包个数等),来设置目标对象的属性信息,以确定展示信息。需要说明的是,本申请实施例中目标对象的奖品除了可以为红包之外,还可以为优惠券、金币、或者礼品等。
在确定了展示信息之后,处理端可以将展示信息添加到直播数据中,以进行显示。处理端可以将展示信息添加到直播数据中,并传递给第二终端,以供第二终端的第二用户领取。具体的,在处理端为第一终端的情况下,第一终端将展示信息添加到直播数据中,传递给服务端,服务端将直播数据传递给第二终端。在处理端为服务端的情况下,服务端将展示信息添加到直播数据中,并传递给第二终端。
本申请实施例的展示信息还可以定向的发给部分观看直播的观众,具体的,在一个可选的实施例中,所述将所述展示信息添加到所述直播数据中,以进行显示,包括:获取第二用户的权限等级;确定符合权限条件的第二用户;将所述展示信息添加到符合权限条件的第二用户相关的直播数据中,以将所述展示信息显示给符合权限条件的第二用户。权限条件用于对第二用户进行筛选,以确定接收展示信息的用户。在一个示例中,权限条件可以根据第一用户的语音设置,具体的,描述信息还可以包括权限条件,处理端按照权限条件,获取第二用户的权限等级,以对第二用户进行筛选,并将展示信息定向的发送给筛选出的第二用户。举例来说,权限等级可以为用户等级,权限条件可以为等级条件(如三级),处理端可以获取第二用户的用户等级,并筛选出用户等级达到三级的第二用户,以将展示信息添加到筛选出的第二用户相关的直播数据中。在另一个示例中,权限条件还可以为在处理端预先设置的条件,以便根据权限条件筛选出符合权限的第二用户,来接收展示信息。
在如图3所示的示例中,展示信息(如红包)发送给第二终端的第二用户,第二用户的用户可以对展示信息进行操作(如点击“開”),以领取对应的红包。具体的,处理端可以接收第二用户针对所述展示信息的操作数据;对所述操作数据进行分析,确定目标用户;将所述展示信息对应的目标对象,分配给所述目标用户。第二终端可以接收第二用户的操作数据,并传送给服务端,以进行处理。在一个可选的示例中,描述信息中可以包括领取规则,第二用户可以根据领取规则进行对应的操作,处理端(服务端或第一终端)接收到操作数据之后,可以按照领取规则对操作数据进行分析,来确定目标用户,并将目标对象分配给对应的目标用户。例如领取规则可以为发送指定的词语或句子,通过确定第二用户是否发送指定的词语或句子,来确定目标用户,以分配对应的红包给目标用户。此外,领取规则还可以为其他规则,例如时间规则,处理端可以按照操作数据的时间信息,对第二用户进行排序,并筛选出排名符合描述信息条件的第二用户作为目标用户,以分配对应的红包给目标用户。领取规则还可以为第二用户是否分享直播间、第二用户是否送出了指定的礼品、第二用户的用户等级是否达到预设等级等规则,此处不做限制。
在生成了对应的展示信息之后,还可以将展示信息发送给第一用户进行修正,具体的,在一个可选的实施例中,处理端可以展示所述展示信息;接收第一用户对展示信息的修改操作,以确定修改后的展示信息;将修改后的展示信息添加到直播数据中以进行显示。在确定了展示信息之后,可以将展示信息展示给第一用户,并接收第一用户对展示信息的修改,如修改红包的金额和红包的个数,以确定修改后的展示信息,并将修改后的展示信息展示给第二用户。
在将展示信息添加到直播数据之前,还可以获取第一用户的确认指令,来确认将展示信息进行展示。具体的,在一个可选的实施例中,处理端可以接收用户对展示信息的确认指令,以依据所述确认指令,将所述展示信息添加到直播数据中进行展示。在一个示例中,确认指令可以通过第一用户的输入信息来确定,处理端可以将展示信息展示给第一用户,并提供确认和取消等控件,第一用户可以通过点击确认控件来完成展示信息的确认,也可以通过取消控件来取消展示信息的展示。在另一个示例中,确认指令可以依据第一用户的语音数据确定,处理端可以将展示信息展示给第一用户,第一用户可以通过语音数据来控制展示信息的发送。例如,第一用户可以说“3,2,1,开始”,来确认发送展示信息,以进行展示。
在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定对应的特征信息,然后依据特征信息,确定目标对象和描述信息,并依据目标对象和描述信息,确定对应的展示信息,之后将展示信息添加到直播数据中进行显示。本申请实施例能够根据第一用户的语音数据,生成对应的展示信息,并添加到直播数据中进行显示,无需用户手动输入对应的数据,方便用户的操作。
在上述实施例的基础上,本申请实施例还公开一种数据处理方法,可以应用在处理端,如图4所示,包括:
步骤402、从直播数据中提取第一用户的语音数据。
步骤404、对所述语音数据进行语音识别,确定对应的文本信息。
步骤406、对所述文本信息进行语义分析,确定目标对象对应的特征信息。
步骤408、识别所述特征信息中的第一特征词,以确定目标对象。
步骤410、识别所述特征信息中的第二特征词,以确定目标对象对应的描述信息。
步骤412、依据所述描述信息设置目标对象的属性信息;
步骤414、依据所述目标对象和属性信息,确定所述目标对象的展示信息。
步骤416、将所述展示信息添加到所述直播数据中,以进行显示。处理端还可以定向的将展示信息展示给符合权限条件的用户,具体的,所述将所述展示信息添加到所述直播数据中,以进行显示,包括:获取第二用户的权限等级;确定符合权限条件的第二用户;将所述展示信息添加到符合权限条件的第二用户相关的直播数据中,以将所述展示信息显示给符合权限条件的第二用户。
步骤418、接收第二用户针对所述展示信息的操作数据。
步骤420、对所述操作数据进行分析,确定目标用户。
步骤422、将所述展示信息对应的目标对象,分配给所述目标用户。
本申请实施例可以应用在对直播过程中第一用户的语音数据进行识别的场景中,具体的,以应用在直播过程中识别第一用户的语音数据,完成红包的发布为例,本申请实施例中,第一用户在直播时可以说出“我们来发一个88元的发财红包,看哪五个人能抽到”。处理端可以提取语音数据,并基于ASR将语音数据转换为文本信息。然后基于NLP确定文本信息中的词,如确定“我们”、“发”、“一个”、“88元”、“发财红包”、“五个人”等词。然后筛选文本信息的词中的对象特征词来确定目标对象,确定描述特征词作为描述信息,如确定“发财红包”为对象特征词,确定“五个人”、“88元”为描述特征词。然后依据目标对象和描述信息,确定展示信息(红包)。确定了展示信息之后,处理端可以将展示信息添加到直播数据中,以发送给第二终端的第二用户,并接收第二用户的操作数据,并依据操作数据,筛选出目标用户。在一个示例中,可以依据第二用户领取红包的时间,对第二用户进行排序,并筛选出排名前五(对应红包个数)的第二用户作为目标用户。之后将目标对象分配给目标用户。在本申请实施例中,根据第一用户的语音数据,能够快速的完成目标对象的展示,并且,第一用户无需手动输入目标对象的各项数据,能够方便第一用户的操作。
在上述实施例的基础上,本申请实施例还公开一种数据处理方法,可以应用在处理端,能够在识别用户在直播时的语音数据,来完成虚拟交互对象的发布,无需用户手动输入虚拟交互对象的各项数据,能够方便用户操作。其中,在红包发布的场景中,虚拟交互对象可以理解为红包,如图5所示,该方法包括:
步骤502、从直播数据中提取第一用户的语音数据。
步骤504、对所述语音数据进行识别,确定虚拟交互对象对应的特征信息。在红包发布场景中,虚拟交互对象可以理解为红包。虚拟交互对象是指能够完成第一用户和第二用户之间信息交互的对象,如应用程序、应用插件等。
步骤506、依据所述特征信息,确定所述虚拟交互对象目对应的描述信息,所述描述信息包括对象数量和对象资源。在红包发布场景中,对象数量可以理解为红包个数,对象资源可以理解为红包金额。
步骤508、调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息。
步骤510、将所述虚拟交互对象添加到所述直播数据中,以进行显示。
本申请实施例的虚拟交互对象可以包括红包以外,还可以包括优惠券、金币等对象,具体的,在一个可选的实施例中,所述虚拟交互对象包括虚拟红包、虚拟优惠券和虚拟金币中的至少一个。本申请实施例的步骤与上述实施例的步骤类似,具体可以参照上述实施例的实施方式,此处不再赘述。
在本申请实施例中,以红包发布场景为例,第一用户在直播时,可以说出“我们来发一个88元的发财红包,看哪五个人能抽到”,处理端可以从直播数据中提取该语音数据,并基于ASR将语音数据转换为文本信息,之后基于NLP对文本信息进行识别,识别虚拟交互对象对应的特征信息。之后依据特征信息,确定虚拟交互对象(如红包)对应的描述信息(如“五个人”和“88元”)。然后调用虚拟交互插件(如红包插件),并依据描述信息对虚拟交互对象的属性信息进行配置。然后将虚拟交互对象添加到直播数据中,显示给第二用户。第二用户可以对虚拟交互对象进行操作,以领取对应的虚拟交互对象。
在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定虚拟交互对象对应的特征信息,然后依据特征信息,确定虚拟交互对象的描述信息,并依据描述信息配置虚拟交互对象的属性信息,然后将虚拟交互对象添加到直播数据中进行显示。本申请实施例能够根据第一用户的语音数据,生成对应的虚拟交互对象,并添加到直播数据中进行显示,无需用户手动输入虚拟交互对象对应的各个属性数据,方便用户的操作。
本申请实施例的数据处理方法除了可以应用在直播过程中红包发布的场景之外,还可以应用在直播过程中商品推荐的场景中,在该场景中,本申请实施例的方式能够识别第一用户的语音数据,并形成商品对应的展示信息展示给第二用户,以供第二用户选购商品,具体的,本申请实施例的数据处理方法,可以应用在处理端,如图6所示,包括:
步骤602、从直播数据中提取第一用户的语音数据。
步骤604、对所述语音数据进行识别,确定商品对象对应的特征信息。
步骤606、依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息。
步骤608、依据目标商品对象和描述信息,确定目标商品对象的链接信息。商品对象的连接信息可以包括商品对象的链接、售价信息和数量信息,商品对象的链接信息可以对应商铺,第二用户可以通过点击链接信息,进入对应的商铺,以完成商品对象的买卖。链接信息除了可以包含有描述信息和商品对象的链接之外,链接信息还可以包含有商品对象对应的图像等数据。在一个示例中,本申请实施例中商品对象的链接信息可以通过展示浮窗进行展示,处理端可以将商品对象的链接、售价信息和数量信息等添加到展示浮窗中进行展示。
步骤610、将所述商品对象的链接信息添加到所述直播数据中,以进行显示。
在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定商品对象对应的特征信息,然后依据特征信息,确定目标商品对象和描述信息;然后获取商品对象的链接,并结合描述信息,确定商品对象的链接信息,之后将链接信息添加到直播数据中进行显示,第二用户可以通过点击商品对象的链接信息,来进入对应的店铺,以购买对应的商品对象。本申请实施例能够根据第一用户的语音数据,生成商品对象的链接信息,并添加到直播数据中进行显示,无需用户手动输入商品对象对应的数据,方便用户的操作。
本申请实施例除了可以应用在主播直播的场景之中,还可以应用在企业的视频会议的场景中,例如,可以应用在企业视频会议的场景中来识别企业的管理者的语音数据,并提取对应的特征信息,以确定目标对象对应的展示信息展示给视频会议中的其他用户。能够方便企业管理者向其他的用户发布资料、发布激励(如红包激励)等。具体的,本申请实施例提供一种数据处理方法,如图7所示,包括:
步骤702、从视频会议的数据中提取目标用户的语音数据。在一个可选的实施例中,视频会议的直播数据可以包括管理者的直播数据和员工的直播数据,处理端可以依据用户的角色信息,从直播数据中筛选出管理者的直播数据,并确定管理者的语音数据。
步骤704、对所述语音数据进行识别,确定目标对象对应的特征信息。
步骤706、依据所述特征信息,确定目标对象和对应的描述信息。
步骤708、依据所述目标对象和所述描述信息,确定目标对象的展示信息。
步骤710、将所述展示信息添加到视频会议的数据中,以进行显示。本申请实施例的步骤与上述实施例的步骤类似,具体可以参照上述实施例的实施方式,此处不再赘述。
在本申请实施例中,以应用在企业的视频会议的直播场景中为例,视频的成员可以包括企业团体的领导、员工等,视频会议的数据可以包括会议的管理用户(如企业主管、领导等)和其他用户的直播数据。本申请实施例能够从视频会议的数据中提取管理用户(目标用户)的直播数据,并提取语音数据,识别语音数据中的特征信息,然后依据特征信息,确定目标对象和描述信息,然后确定目标对象的展示信息给会议中的其他用户(也可以展示给特定的用户或用户群体),例如可以向会议中的某一用户或某一部门的用户发送奖励(如红包奖励)。本申请实施例能够根据管理用户的语音数据,生成对应的展示信息,并进行显示,无需用户手动输入目标对象对应的数据,方便用户的操作。
本申请实施例除了可以应用在主播直播的场景之中,还可以应用在教学直播等场景中。例如,可以应用在教学直播的场景中,以识别教师的语音数据,并提取对应的特征信息,以确定交互对象对应的展示信息给学生。能够方便教师在教学直播的过程中,发出提问(以浮窗形式展示给学生)或者激励(如小红花等)。具体的,本申请实施例提供一种数据处理方法,如图8所示,包括:
步骤802、从教学直播的数据中提取目标用户的语音数据。在一个可选的实施例中,教学直播的数据可以包括教师的直播数据和学生的直播数据,处理端可以依据用户的角色信息,从教学直播的数据中筛选出教师的直播数据,并确定教师的语音数据。
步骤804、对所述语音数据进行识别,确定目标对象对应的特征信息。
步骤806、依据所述特征信息,确定目标对象和对应的描述信息。
步骤808、依据所述目标对象和所述描述信息,确定目标对象的展示信息。
步骤810、将所述展示信息添加到教学直播的数据中,以进行显示。
本申请实施例的步骤与上述实施例的步骤类似,具体可以参照上述实施例的实施方式,此处不再赘述。
以应用在教学直播场景中为例,教学直播的直播成员可以包括教师和学生,教学直播数据可以包括教师和学生的直播数据。本申请实施例能够从教学直播数据中提取教师(目标用户)的语音数据,并识别语音数据中的特征信息,然后依据特征信息,确定目标对象和描述信息,然后确定目标对象的展示信息给学生。例如教师可以通过语音数据向学生发出提问,提问可以以浮窗(展示信息)形式展示给学生,方便学生回答问题。再例如,可以预先设置包含有多个学生标识(如学生头像)的展示浮窗,并依据教师的语音为浮窗内的学生标识添加评价(例如为学生头像添加小红花),并将展示浮窗展示给学生,以对学生进行激励。本申请实施例能够根据教师的语音数据,生成对应的展示信息,并进行显示,无需用户手动输入对应的数据,方便用户的操作。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图9,具体可以包括如下模块:
语音数据提取模块902,用于从直播数据中提取第一用户的语音数据。
特征信息提取模块904,用于对所述语音数据进行识别,确定目标对象对应的特征信息。
特征信息筛选模块906,用于依据所述特征信息,确定目标对象和对应的描述信息。
展示信息提取模块908,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息。
综上,在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定对应的特征信息,然后依据特征信息,确定目标对象和描述信息,并依据目标对象和描述信息,确定对应的展示信息,之后将展示信息添加到直播数据中进行显示。本申请实施例能够根据第一用户的语音数据,生成对应的展示信息,展示信息可以添加到直播数据中进行显示,无需用户手动输入对应的数据,方便用户的操作。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,具体可以包括如下模块:
语音提取模块,用于从直播数据中提取第一用户的语音数据。
语音转换模块,用于对所述语音数据进行语音识别,确定对应的文本信息。
文本识别模块,用于对所述文本信息进行语义分析,确定目标对象对应的特征信息。
对象信息确定模块,用于识别所述特征信息中的第一特征词,以确定目标对象。第一特征词还可以称为对象特征词。
描述信息确定模块,用于识别所述特征信息中的第二特征词,以确定目标对象对应的描述信息。第二特征词还可以称为描述特征词。
目标对象配置模块,用于依据所述描述信息设置目标对象的属性信息;
展示信息生成模块,用于依据所述目标对象和属性信息,确定所述目标对象的展示信息。
展示信息添加模块,用于将所述展示信息添加到所述直播数据中,以进行显示。
操作数据接收模块,用于接收第二用户针对所述展示信息的操作数据。
目标用户筛选模块,用于对所述操作数据进行分析,确定目标用户。
对象分配模块,用于将所述展示信息对应的目标对象,分配给所述目标用户。
本申请实施例可以应用在对直播过程中第一用户的语音数据进行识别的场景中,具体的,以应用在直播过程中识别第一用户的语音数据,完成红包的发布为例,本申请实施例中,第一用户在直播时可以说出“我们来发一个88元的发财红包,看哪五个人能抽到”。处理端可以提取语音数据,并基于ASR将语音数据转换为文本信息。然后基于NLP确定文本信息中的词,如确定“我们”、“发”、“一个”、“88元”、“发财红包”、“五个人”等词。然后筛选文本信息的词中的对象特征词来确定目标对象,确定描述特征词作为描述信息,如确定“发财红包”为对象特征词,确定“五个人”、“88元”为描述特征词。然后依据目标对象和描述信息,确定展示信息(红包)。确定了展示信息之后,处理端可以将展示信息添加到直播数据中,以发送给第二终端的第二用户,并接收第二用户的操作数据,并依据操作数据,筛选出目标用户。在一个示例中,可以依据第二用户领取红包的时间,对第二用户进行排序,并筛选出排名前五(对应红包个数)的第二用户作为目标用户。之后将目标对象分配给目标用户。在本申请实施例中,根据第一用户的语音数据,能够快速的完成目标对象的展示,并且,第一用户无需手动输入目标对象的各项数据,能够方便第一用户的操作。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图10,具体可以包括如下模块:
语音数据获取模块1002,用于从直播数据中提取第一用户的语音数据。
特征信息获取模块1004,用于对所述语音数据进行识别,确定虚拟交互对象对应的特征信息。
特征信息处理模块1006,用于依据所述特征信息,确定所述虚拟交互对象对应的描述信息,所述描述信息包括对象数量和对象资源。
交互对象生成模块1008,用于调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息。
交互对象显示模块1010,用于显示所述虚拟交互对象。可以将虚拟交互对象添加到所述直播数据中,以进行显示。
综上,在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定虚拟交互对象对应的特征信息,然后依据特征信息,确定虚拟交互对象的描述信息,并依据描述信息配置虚拟交互对象的属性信息,然后将虚拟交互对象添加到直播数据中进行显示。本申请实施例能够根据第一用户的语音数据,生成对应的虚拟交互对象,并添加到直播数据中进行显示,无需用户手动输入虚拟交互对象对应的各个属性数据,方便用户的操作。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图11,具体可以包括如下模块:
语音数据确定模块1102,用于从直播数据中提取第一用户的语音数据。
特征信息确定模块1104,用于对所述语音数据进行识别,确定商品对象对应的特征信息。
商品信息筛选模块1106,用于依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息。
链接信息确定模块1108,用于依据所述目标商品对象和描述信息,确定目标商品对象的链接信息。
链接信息展示模块1110,用于显示所述目标商品对象的链接信息。可以将目标商品对象的链接信息添加到所述直播数据中,以进行显示。
综上,在本申请实施例中,能够从直播数据中提取第一用户的语音数据,并对语音数据进行识别,确定商品对象对应的特征信息,然后依据特征信息,确定目标商品对象和描述信息;然后获取商品对象的链接,并结合描述信息,确定商品对象的链接信息,之后将链接信息添加到直播数据中进行显示,第二用户可以通过点击商品对象的链接信息,来进入对应的店铺,以购买对应的商品对象。本申请实施例能够根据第一用户的语音数据,生成商品对象的链接信息,并添加到直播数据中进行显示,无需用户手动输入商品对象对应的数据,方便用户的操作。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图12,具体可以包括如下模块:
语音数据获得模块1202,用于从视频会议的数据中提取目标用户的语音数据。
特征信息获得模块1204,用于对所述语音数据进行识别,确定目标对象对应的特征信息。
特征信息筛分模块1206,用于依据所述特征信息,确定目标对象和对应的描述信息。
展示信息获得模块1208,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息。
展示信息输出模块1210,用于将所述展示信息添加到视频会议的数据中,以进行显示。
在本申请实施例中,以应用在企业的视频会议的直播场景中为例,视频的成员可以包括企业团体的领导、员工等,视频会议的数据可以包括会议的管理用户(如企业主管、领导等)和其他用户的直播数据。本申请实施例能够从视频会议的数据中提取管理用户(目标用户)的直播数据,并提取语音数据,识别语音数据中的特征信息,然后依据特征信息,确定目标对象和描述信息,然后确定目标对象的展示信息给会议中的其他用户(也可以展示给特定的用户或用户群体),例如可以向会议中的某一用户或某一部门的用户发送奖励(如红包奖励)。本申请实施例能够根据管理用户的语音数据,生成对应的展示信息,并进行显示,无需用户手动输入目标对象对应的数据,方便用户的操作。
在上述实施例的基础上,本实施例还提供了一种数据处理装置,参照图13,具体可以包括如下模块:
语音数据筛选模块1302,用于从教学直播的数据中提取目标用户的语音数据。
特征信息识别模块1304,用于对所述语音数据进行识别,确定目标对象对应的特征信息。
对象信息筛分模块1306,用于依据所述特征信息,确定目标对象和对应的描述信息。
对象信息处理模块1308,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息。
展示信息发送模块1310,用于将所述展示信息添加到教学直播的数据中,以进行显示。
综上,以应用在教学直播场景中为例,教学直播的直播成员可以包括教师和学生,教学直播数据可以包括教师和学生的直播数据。本申请实施例能够从教学直播数据中提取教师(目标用户)的语音数据,并识别语音数据中的特征信息,然后依据特征信息,确定目标对象和描述信息,然后确定目标对象的展示信息给学生。例如教师可以通过语音数据向学生发出提问,提问可以以浮窗(展示信息)形式展示给学生,方便学生回答问题。再例如,可以预先设置包含有多个学生标识(如学生头像)的展示浮窗,并依据教师的语音为浮窗内的学生标识添加评价(例如为学生头像添加小红花),并将展示浮窗展示给学生,以对学生进行激励。本申请实施例能够根据教师的语音数据,生成对应的展示信息,并进行显示,无需用户手动输入对应的数据,方便用户的操作。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括服务器、终端设备等设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括服务器(集群)、终端等电子设备。图14示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1400。
对于一个实施例,图14示出了示例性装置1400,该装置具有一个或多个处理器1402、被耦合到(一个或多个)处理器1402中的至少一个的控制模块(芯片组)1404、被耦合到控制模块1404的存储器1406、被耦合到控制模块1404的非易失性存储器(NVM)/存储设备1408、被耦合到控制模块1404的一个或多个输入/输出设备1410,以及被耦合到控制模块1404的网络接口1412。
处理器1402可包括一个或多个单核或多核处理器,处理器1402可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1400能够作为本申请实施例中所述服务端、终端等设备。
在一些实施例中,装置1400可包括具有指令1414的一个或多个计算机可读介质(例如,存储器1406或NVM/存储设备1408)以及与该一个或多个计算机可读介质相合并被配置为执行指令1414以实现模块从而执行本公开中所述的动作的一个或多个处理器1402。
对于一个实施例,控制模块1404可包括任意适当的接口控制器,以向(一个或多个)处理器1402中的至少一个和/或与控制模块1404通信的任意适当的设备或组件提供任意适当的接口。
控制模块1404可包括存储器控制器模块,以向存储器1406提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1406可被用于例如为装置1400加载和存储数据和/或指令1414。对于一个实施例,存储器1406可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1406可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,控制模块1404可包括一个或多个输入/输出控制器,以向NVM/存储设备1408及(一个或多个)输入/输出设备1410提供接口。
例如,NVM/存储设备1408可被用于存储数据和/或指令1414。NVM/存储设备1408可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1408可包括作为装置1400被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1408可通过网络经由(一个或多个)输入/输出设备1410进行访问。
(一个或多个)输入/输出设备1410可为装置1400提供接口以与任意其他适当的设备通信,输入/输出设备1410可以包括通信组件、音频组件、传感器组件等。网络接口1412可为装置1400提供接口以通过一个或多个网络通信,装置1400可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1402中的至少一个可与控制模块1404的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1402中的至少一个可与控制模块1404的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1402中的至少一个可与控制模块1404的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1402中的至少一个可与控制模块1404的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,装置1400可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1400可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1400包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
本申请实施例还提供了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。
本申请实施例还提供了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种数据处理方法、一种数据处理装置、一种电子设备和一种存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (19)

1.一种数据处理方法,其特征在于,所述的方法包括:
从直播数据中提取第一用户的语音数据;
对所述语音数据进行识别,确定目标对象对应的特征信息;
依据所述特征信息,确定目标对象和对应的描述信息;
依据所述目标对象和所述描述信息,确定目标对象的展示信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行识别,确定目标对象对应的特征信息,包括:
对所述语音数据进行语音识别,确定对应的文本信息;
对所述文本信息进行语义分析,确定目标对象对应的特征信息。
3.根据权利要求1所述的方法,其特征在于,所述依据所述特征信息,确定目标对象和对应的描述信息,包括:
识别所述特征信息中的第一特征词,以确定目标对象;
识别所述特征信息中的第二特征词,以确定所述目标对象对应的描述信息。
4.根据权利要求1所述的方法,其特征在于,所述依据所述目标对象和所述描述信息,确定目标对象的展示信息,包括:
依据所述描述信息设置所述目标对象的属性信息;
依据所述目标对象和属性信息,确定所述目标对象的展示信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
将所述展示信息添加到所述直播数据中,以进行显示。
6.根据权利要求5所述的方法,其特征在于,所述将所述展示信息添加到所述直播数据中,以进行显示,包括:
获取第二用户的权限等级;
确定符合权限条件的第二用户;
将所述展示信息添加到符合权限条件的第二用户相关的直播数据中,以将所述展示信息显示给符合权限条件的第二用户。
7.根据权利要求1所述的方法,其特征在于,还包括:
接收第二用户针对所述展示信息的操作数据;
对所述操作数据进行分析,确定目标用户;
将所述展示信息对应的目标对象,分配给所述目标用户。
8.一种数据处理方法,其特征在于,包括:
从直播数据中提取第一用户的语音数据;
对所述语音数据进行识别,确定虚拟交互对象对应的特征信息;
依据所述特征信息,确定所述虚拟交互对象对应的描述信息,所述描述信息包括对象数量和对象资源;
调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息;
将所述虚拟交互对象添加到所述直播数据中,以进行显示。
9.根据权利要求8所述的方法,其特征在于,所述虚拟交互对象包括虚拟红包、虚拟优惠券和虚拟金币中的至少一个。
10.一种数据处理方法,其特征在于,包括:
从直播数据中提取第一用户的语音数据;
对所述语音数据进行识别,确定商品对象对应的特征信息;
依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息;
依据所述目标商品对象和描述信息,确定目标商品对象的链接信息;
将所述目标商品对象的链接信息添加到所述直播数据中,以进行显示。
11.一种数据处理方法,其特征在于,包括:
从视频会议的数据中提取目标用户的语音数据;
对所述语音数据进行识别,确定目标对象对应的特征信息;
依据所述特征信息,确定目标对象和对应的描述信息;
依据所述目标对象和所述描述信息,确定目标对象的展示信息;
将所述展示信息添加到视频会议的数据中,以进行显示。
12.一种数据处理方法,其特征在于,包括:
从教学直播的数据中提取目标用户的语音数据;
对所述语音数据进行识别,确定目标对象对应的特征信息;
依据所述特征信息,确定目标对象和对应的描述信息;
依据所述目标对象和所述描述信息,确定目标对象的展示信息;
将所述展示信息添加到教学直播的数据中,以进行显示。
13.一种数据处理装置,其特征在于,包括:
语音数据提取模块,用于从直播数据中提取第一用户的语音数据;
特征信息提取模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;
特征信息筛选模块,用于依据所述特征信息,确定目标对象和对应的描述信息;
展示信息提取模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息。
14.一种数据处理装置,其特征在于,包括:
语音数据获取模块,用于从直播数据中提取第一用户的语音数据;
特征信息获取模块,用于对所述语音数据进行识别,确定虚拟交互对象对应的特征信息;
特征信息处理模块,用于依据所述特征信息,确定所述虚拟交互对象对应的描述信息,所述描述信息包括对象数量和对象资源;
交互对象生成模块,用于调用虚拟交互插件,并依据所述描述信息配置所述虚拟交互对象的属性信息;
交互对象显示模块,用于将所述虚拟交互对象添加到所述直播数据中,以进行显示。
15.一种数据处理装置,其特征在于,包括:
语音数据确定模块,用于从直播数据中提取第一用户的语音数据;
特征信息确定模块,用于对所述语音数据进行识别,确定商品对象对应的特征信息;
商品信息筛选模块,用于依据所述特征信息,确定目标商品对象和对应的描述信息,所述描述信息包括目标商品对象的售价信息和数量信息;
链接信息确定模块,用于依据所述目标商品对象和描述信息,确定目标商品对象的链接信息;
链接信息展示模块,用于将所述目标商品对象的链接信息添加到所述直播数据中,以进行显示。
16.一种数据处理装置,其特征在于,包括:
语音数据获得模块,用于从视频会议的数据中提取目标用户的语音数据;
特征信息获得模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;
特征信息筛分模块,用于依据所述特征信息,确定目标对象和对应的描述信息;
展示信息获得模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息;
展示信息输出模块,用于将所述展示信息添加到视频会议的数据中,以进行显示。
17.一种数据处理装置,其特征在于,包括:
语音数据筛选模块,用于从教学直播的数据中提取目标用户的语音数据;
特征信息识别模块,用于对所述语音数据进行识别,确定目标对象对应的特征信息;
对象信息筛分模块,用于依据所述特征信息,确定目标对象和对应的描述信息;
对象信息处理模块,用于依据所述目标对象和所述描述信息,确定目标对象的展示信息;
展示信息发送模块,用于将所述展示信息添加到教学直播的数据中,以进行显示。
18.一种电子设备,其特征在于,包括:处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-12中一个或多个所述的方法。
19.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-12中一个或多个所述的方法。
CN202010798049.1A 2020-08-10 2020-08-10 数据处理方法、装置、电子设备和存储介质 Pending CN113315979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010798049.1A CN113315979A (zh) 2020-08-10 2020-08-10 数据处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010798049.1A CN113315979A (zh) 2020-08-10 2020-08-10 数据处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113315979A true CN113315979A (zh) 2021-08-27

Family

ID=77370370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010798049.1A Pending CN113315979A (zh) 2020-08-10 2020-08-10 数据处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113315979A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891166A (zh) * 2021-10-22 2022-01-04 北京达佳互联信息技术有限公司 数据处理方法、装置、计算机设备及介质
CN114827651A (zh) * 2022-04-25 2022-07-29 北京达佳互联信息技术有限公司 信息处理方法、装置、电子设备及存储介质
CN115460449A (zh) * 2022-09-05 2022-12-09 北京达佳互联信息技术有限公司 信息展示方法、发送方法、终端和服务器
WO2023124853A1 (zh) * 2022-01-01 2023-07-06 北京有竹居网络技术有限公司 视频处理方法、视频播放方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109618181A (zh) * 2018-11-28 2019-04-12 网易(杭州)网络有限公司 直播交互方法及装置、电子设备、存储介质
CN110139161A (zh) * 2018-02-02 2019-08-16 阿里巴巴集团控股有限公司 直播中的信息处理方法及装置
CN110446115A (zh) * 2019-07-22 2019-11-12 腾讯科技(深圳)有限公司 直播互动方法、装置、电子设备及存储介质
CN110881134A (zh) * 2019-11-01 2020-03-13 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110139161A (zh) * 2018-02-02 2019-08-16 阿里巴巴集团控股有限公司 直播中的信息处理方法及装置
CN109618181A (zh) * 2018-11-28 2019-04-12 网易(杭州)网络有限公司 直播交互方法及装置、电子设备、存储介质
CN110446115A (zh) * 2019-07-22 2019-11-12 腾讯科技(深圳)有限公司 直播互动方法、装置、电子设备及存储介质
CN110881134A (zh) * 2019-11-01 2020-03-13 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891166A (zh) * 2021-10-22 2022-01-04 北京达佳互联信息技术有限公司 数据处理方法、装置、计算机设备及介质
WO2023124853A1 (zh) * 2022-01-01 2023-07-06 北京有竹居网络技术有限公司 视频处理方法、视频播放方法、装置、电子设备及介质
CN114827651A (zh) * 2022-04-25 2022-07-29 北京达佳互联信息技术有限公司 信息处理方法、装置、电子设备及存储介质
CN114827651B (zh) * 2022-04-25 2023-12-01 北京达佳互联信息技术有限公司 信息处理方法、装置、电子设备及存储介质
CN115460449A (zh) * 2022-09-05 2022-12-09 北京达佳互联信息技术有限公司 信息展示方法、发送方法、终端和服务器

Similar Documents

Publication Publication Date Title
CN113315979A (zh) 数据处理方法、装置、电子设备和存储介质
CN108566565B (zh) 弹幕展示方法及装置
US9621851B2 (en) Augmenting web conferences via text extracted from audio content
WO2019242222A1 (zh) 用于生成信息的方法和装置
US11436863B2 (en) Method and apparatus for outputting data
CN107463700B (zh) 用于获取信息的方法、装置及设备
CN109660744A (zh) 基于大数据的智能双录方法、设备、存储介质及装置
CN111754267B (zh) 基于区块链的数据处理方法及系统
CN109919244B (zh) 用于生成场景识别模型的方法和装置
US11087140B2 (en) Information generating method and apparatus applied to terminal device
US20180315093A1 (en) Method and system for targeted advertising based on natural language analytics
CN112653902B (zh) 说话人识别方法、装置及电子设备
CN112233690B (zh) 双录方法、装置、终端及存储介质
CN113824972B (zh) 直播视频的处理方法、装置、设备及计算机可读存储介质
CN109582825B (zh) 用于生成信息的方法和装置
CN108924598A (zh) 视频字幕显示方法及装置
US20240146979A1 (en) System, method and computer-readable medium for live streaming recommendation
CN117313785A (zh) 一种基于弱势人群的智能数字人交互方法、设备和介质
WO2022022075A1 (zh) 视频及直播处理方法、直播系统、电子设备、终端、介质
US20240267573A1 (en) Livestream with synthetic scene insertion
CN112839237A (zh) 网络直播中的视音频处理方法、计算机设备和介质
CN113761986A (zh) 文本获取、直播方法、设备及存储介质
CN111523343B (zh) 阅读互动方法、装置、设备、服务器及存储介质
CN117009577A (zh) 一种视频数据处理方法、装置、设备及可读存储介质
CN113301362B (zh) 视频元素展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210827

RJ01 Rejection of invention patent application after publication