CN116737936A - 一种基于人工智能的ai虚拟人物语言库分类管理系统 - Google Patents

一种基于人工智能的ai虚拟人物语言库分类管理系统 Download PDF

Info

Publication number
CN116737936A
CN116737936A CN202310742553.3A CN202310742553A CN116737936A CN 116737936 A CN116737936 A CN 116737936A CN 202310742553 A CN202310742553 A CN 202310742553A CN 116737936 A CN116737936 A CN 116737936A
Authority
CN
China
Prior art keywords
anchor
analyzed
live
live broadcast
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310742553.3A
Other languages
English (en)
Other versions
CN116737936B (zh
Inventor
程丹
东方雨
朱嘉慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengfeng Multimedia Technology Shanghai Co ltd
Original Assignee
Shengfeng Multimedia Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengfeng Multimedia Technology Shanghai Co ltd filed Critical Shengfeng Multimedia Technology Shanghai Co ltd
Priority to CN202310742553.3A priority Critical patent/CN116737936B/zh
Publication of CN116737936A publication Critical patent/CN116737936A/zh
Application granted granted Critical
Publication of CN116737936B publication Critical patent/CN116737936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及语言库分类管理技术领域,具体公开一种基于人工智能的AI虚拟人物语言库分类管理系统,该系统包括:真人主播标签分析模块、真人主播划分模块、待分析真人主播分析模块、待分析真人主播交互分析模块、交互数据分析模块、交互数据处理和云数据库,本发明对真人主播互动过程中的观众交互匹配度和观看紧密度进行分析,进而保障真人主播所属自定义标签的准确性,为后续真人主播划分奠定了基础,确保AI虚拟人物对应待分析真人主播分析的精确性,从而保证虚拟人物的语言表达的智能化,本发明筛选待分析真人主播,减少分析数据,进而保障AI虚拟人物语言库的管理效率,从而确保AI虚拟人物语言交互的效率和准确性。

Description

一种基于人工智能的AI虚拟人物语言库分类管理系统
技术领域
本发明涉及语言库分类管理技术领域,具体而言,涉及一种基于人工智能的AI虚拟人物语言库分类管理系统。
背景技术
随着科学和技术的发展,AI虚拟技术的发展也越来越迅速,AI虚拟人物语言库分类管理通过对语言库进行分类管理,可以更快速地找到需要的语言表达,从而提高语言交互的效率和准确性,可以让虚拟人物的语言表达更加有条理和清晰,从而优化用户的语言交互体验,可以让语言库的维护和更新更加方便,更快速地添加、修改和删除语言表达,在众多AI虚拟人物中,AI虚拟主播具有很强烈的互动性和主观性,对AI虚拟主播语言库的要求更为严格,在真实主播互动过程中不断产生新的交流,从中提取真实主播对应的语言组是极其有参考价值的,因此,对真实主播的互动进行分析是十分有必要的。
现有技术中对真实主播的互动分析在一定程度上可以满足当前要求,但是还存在一定的缺陷,其具体体现在以下几个方面:(1)现有技术大多从当前平台所有真实主播的互动过程进行分析,该分析方法较为繁琐,分析数据较为庞大,无法做到精简和针对性得分析,进而影响AI虚拟人物语言库的管理效率,从而影响AI虚拟人物语言交互的效率和准确性,降低语言交互的体验。
(2)现有技术对真实主播互动过程中的观众交互匹配度和观看紧密度的关注度不高,观众的观看行为在一定程度上反映着真实主播播出内容与标签的关联性,现有技术对这一层面的忽视难以保障AI虚拟人物对应待分析真人主播分析的精确性,进而影响后续待分析真人主播交互的分析,从而影响虚拟人物的语言表达的智能化,降低AI虚拟人物的智能化水平。
发明内容
为了克服背景技术中的缺点,本发明实施例提供了一种基于人工智能的AI虚拟人物语言库分类管理系统,能够有效解决上述背景技术中涉及的问题。
本发明的目的可以通过以下技术方案来实现:一种基于人工智能的AI虚拟人物语言库分类管理系统,包括:真人主播标签分析模块,用于从云数据库中提取各真人主播对应各历史直播所属的自定义标签,并从中提取各真人主播对应各历史直播的视频,并据此分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,从而筛选各真人主播所属各历史直播对应的适配标签。
真人主播划分模块,用于基于各真人主播对应各历史直播的适配标签筛选各目标真人主播,进而将各目标真人主播划分为各自定义标签所属的各目标真人主播。
待分析真人主播分析模块,用于获取目标虚拟主播对应的自定义标签,进而筛选各待分析真人主播,并获取各待分析真人主播对应的各历史直播视频。
待分析真人主播交互分析模块,用于依据各待分析真人主播所属各历史直播的视频提取各次交互对应的传达文本和反馈信息,从而筛选各待分析真人主播对应的各组交互。
交互数据分析模块,用于基于各待分析真人主播对应的各组交互分析各待分析真人主播对应的适宜存储信息。
交互数据处理,用于将各待分析真人主播对应的适宜存储信息存储到目标虚拟主播对应的语言库中。
云数据库,用于存储各真人主播对应各历史直播所属的视频和自定义标签,存储各真人主播对应的实际自定义标签,存储各自定义标签对应的关键词集合,并存储各真人直播对应各历史直播所属各观众对应的观看参数。
进一步地,所述反馈信息包括反馈文本和反馈语音,适宜存储信息包括各组交互对应的适宜存储传达文本、适宜存储反馈文本和适宜存储反馈语音。
进一步地,所述各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,其具体分析方法为:从各真人主播对应各历史直播视频中获取各真人主播所属各历史直播对应的语音,并进行语言文本提取,从而得到各真人主播所属各历史直播对应的语音文本。
将各真人主播所属各历史直播对应的语音文本进行分词划分,得到若干词组。
将划分的若干词组与云数据库中存储的各自定义标签对应的关键词集合中的若干关键词进行对比,进而分析各真人主播所属各历史直播对应各次匹配成功所属的待分析自定义标签。
将相同待分析自定义标签标记为目标标签,进而获取各真人主播所属各历史直播对应各目标标签的匹配成功次数Cimj,其中i为各真人主播的编号,i=1,2,...,n,m为各历史直播的编号,m=1,2,...,l,k为各目标标签的编号,k=1,2,...,j。
统计各真人主播所属各历史直播对应各目标标签所属目标词组的数量Simj
分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数
其中λ1、λ2、λ3、λ4分别为预设的匹配成功次数、目标词组数量、文本匹配系数、观看紧密度对应的影响权重因子,ηimj为第i个真人主播所属第m个历史直播与第j个目标标签对应的文本匹配系数,μim为第i个真人主播所属第m个历史直播对应的观看紧密度。
进一步地,所述各真人主播所属各历史直播与各目标标签对应的文本匹配系数,其具体分析方法为:从各真人主播对应各历史直播的视频中获取各真人主播所属各历史直播对应的观众提出文本和主播回复文本。
依据各真人主播所属各历史直播对应的观众提出文本构建文本关键字集合Aim
依据各自定义标签对应的关键词集合获取各目标标签对应的关键词集合,并据此构建各目标标签对应的关键字集合Bj
分析各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数
同理,分析各真人主播所属各历史直播对应主播回复文本关键字与各目标标签对应关键字的匹配系数σimj
分析各真人主播所属各历史直播与各目标标签对应的文本匹配系数
进一步地,所述各真人主播所属各历史直播对应的观看紧密度,其具体分析方法为:从云数据库中提取各真人直播对应各历史直播所属各观众对应的观看参数,其中观看参数包括各次观看对应的观看时长。
统计各真人直播对应各历史直播的观众总数量Lim、总观看次数Fim和总观看时长Tim
分析各真人主播所属各历史直播对应的观看紧密度
其中l为历史直播的次数,γ1、γ2、γ3分别为预设的观众数量、观看次数、观看时长对应的修正因子。
进一步地,所述筛选各目标真人主播,其具体方法为:从云数据库中提取各真人主播对应的实际自定义标签。
将各真人主播对应各历史直播的适配标签进行汇总,进而得到各真人主播所属各适配标签对应的次数,并从中筛选次数最多的适配标签作为各真人主播对应的待分析适配标签。
将各真人主播对应的待分析适配标签与对应的实际自定义标签进行匹配,若匹配成功,则将该真人主播标记为目标真人主播,进而得到各目标真人主播。
进一步地,所述筛选各待分析真人主播对应的各组交互,其具体方法为:将各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度与预定义的相似度阈值进行对比,若某次交互与相邻交互对应的相似度大于或等于相似度阈值,则将该次交互与相邻交互归类为同组交互,以此类推,进而得到各待分析真人主播对应的各组交互。
进一步地,所述各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度,其具体分析方法为:依据各待分析真人主播对应各历史直播所属各次交互的传达文本构建传达文本关键字集合,进而同各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数分析方法一致,分析得到各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的传达文本关键字集合相似系数p为各次交互的编号,p=1,2,...,q-1。
将各待分析真人主播对应各历史直播所属各次交互对应的反馈语音转化成语音文本,进而结合反馈文本构建各待分析真人主播对应各历史直播所属各次交互对应的反馈关键字集合。
同理分析各待分析真人主播对应各历史直播所属各次交互与相邻相互对应的反馈关键字相似系数
分析各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度
进一步地,所述各待分析真人主播对应的适宜存储信息,其具体分析方法为:获取各待分析真人主播所属各组交互对应各传达文本,并获取各待分析真人主播所属各组交互对应各反馈文本和各反馈语音,进而据此构建各待分析真人主播所属各组交互对应的关键字集合Dif和各待分析真人主播所属各组交互对应各传达文本的关键字集合Hifb
分析各待分析真人主播所属各组交互对应各传达文本对应的推荐指数其中SQifb为第i个待分析真人主播所属第f组交互对应第b个传达文本的目标关键字的数量。
依据各待分析真人主播所属各组交互对应各传达文本对应的推荐指数分析各待分析真人主播所属各组交互对应的适宜存储传达文本。
同理,分析各待分析真人主播所属各组交互对应的适宜存储反馈文本。
将各待分析真人主播所属各组交互对应各反馈语音转换成各目标文本。
同理,分析各待分析真人主播所属各组交互对应的适宜目标文本,并将目标文本对应的反馈语音作为各待分析真人主播所属各组交互对应的适宜存储反馈语音。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:(1)本发明在真人主播标签分析模块中对真人主播所属历史直播自定义标签进行分析,对真人主播互动过程中的观众交互匹配度和观看紧密度进行分析,进而保障真人主播所属自定义标签的准确性,为后续真人主播划分奠定了基础,确保AI虚拟人物对应待分析真人主播分析的精确性,从而保证虚拟人物的语言表达的智能化,提高AI虚拟人物的智能化水平。
(2)本发明在真人主播划分模块中依据真人主播所属自定义标签的准确性对各真人主播进行划分,为后续待分析主播的筛选提供了强有力的数据支持。
(3)本发明在待分析真人主播分析模块中依据目标虚拟主播的自定义标签,筛选待分析真人主播,进而为后续真人主播互动过程的分析过滤一些不必要的数据,从而弥补了现有技术中对所有真人主播的互动过程分析的缺陷,保障分析方法的简便性,减少分析数据,做到精简和针对性分析,进而保障AI虚拟人物语言库的管理效率,从而确保AI虚拟人物语言交互的效率和准确性,提高语言交互的体验。
(4)本发明在待分析真人主播交互分析模块筛选待分析真人主播,并获取其对应的历史直播视频,进而分析真人主播对应的各组交互,从而为后续待分析真人主播交互的分析奠定了基础。
(5)本发明在交互数据分析模块中分析待分析真人主播的适宜存储信息,为待分析真人主播对应的适宜存储信息存储到目标虚拟主播对应的语言库中提供了数据支持。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的模块连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,本发明提供一种基于人工智能的AI虚拟人物语言库分类管理系统,包括:真人主播标签分析模块、真人主播划分模块、待分析真人主播分析模块、待分析真人主播交互分析模块、交互数据分析模块、交互数据处理和云数据库。
所述真人主播标签分析模块与真人主播划分模块连接,真人主播划分模块与待分析真人主播分析模块连接,待分析真人主播分析模块与待分析真人主播交互分析模块连接,待分析真人主播交互分析模块与交互数据分析模块连接,交互数据分析模块与交互数据处理连接,云数据库分别与真人主播标签分析模块和真人主播划分模块连接。
真人主播标签分析模块,用于从云数据库中提取各真人主播对应各历史直播所属的自定义标签,并从中提取各真人主播对应各历史直播的视频,并据此分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,从而筛选各真人主播所属各历史直播对应的适配标签。
需要说明的是,筛选各真人主播所属各历史直播对应的适配标签,其具体方法为:基于各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,从中筛选最大适配指数对应的目标标签作为各真人主播所属各历史直播对应的适配标签。
需要说明的是,自定义标签为音乐达人、舞蹈达人和美食达人等。
在本发明的具体实施例中,所述各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,其具体分析方法为:从各真人主播对应各历史直播视频中获取各真人主播所属各历史直播对应的语音,并进行语言文本提取,从而得到各真人主播所属各历史直播对应的语音文本。
将各真人主播所属各历史直播对应的语音文本进行分词划分,得到若干词组。
将划分的若干词组与云数据库中存储的各自定义标签对应的关键词集合中的若干关键词进行对比,进而分析各真人主播所属各历史直播对应各次匹配成功所属的待分析自定义标签。
需要说明的是,将划分的若干词组与云数据库中存储的各自定义标签对应的关键词集合中的若干关键词进行对比,若某真人主播所属历史直播对应的语音文本划分的某词组与某自定义标签对应的某关键词匹配成功,则将该词组标记为目标词组,并将该自定义标签标记为待分析自定义标签,进而得到各真人主播所属各历史直播对应各次匹配成功所属的待分析自定义标签。
将相同待分析自定义标签标记为目标标签,进而获取各真人主播所属各历史直播对应各目标标签的匹配成功次数Cimj,其中i为各真人主播的编号,i=1,2,...,n,m为各历史直播的编号,m=1,2,...,l,k为各目标标签的编号,k=1,2,...,j。
统计各真人主播所属各历史直播对应各目标标签所属目标词组的数量Simj
分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数
其中λ1、λ2、λ3、λ4分别为预设的匹配成功次数、目标词组数量、文本匹配系数、观看紧密度对应的影响权重因子,ηimj为第i个真人主播所属第m个历史直播与第j个目标标签对应的文本匹配系数,μim为第i个真人主播所属第m个历史直播对应的观看紧密度。
在本发明的具体实施例中,所述各真人主播所属各历史直播与各目标标签对应的文本匹配系数,其具体分析方法为:从各真人主播对应各历史直播的视频中获取各真人主播所属各历史直播对应的观众提出文本和主播回复文本。
依据各真人主播所属各历史直播对应的观众提出文本构建文本关键字集合Aim
依据各自定义标签对应的关键词集合获取各目标标签对应的关键词集合,并据此构建各目标标签对应的关键字集合Bj
分析各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数
同理,分析各真人主播所属各历史直播对应主播回复文本关键字与各目标标签对应关键字的匹配系数σimj
分析各真人主播所属各历史直播与各目标标签对应的文本匹配系数
在本发明的具体实施例中,所述各真人主播所属各历史直播对应的观看紧密度,其具体分析方法为:从云数据库中提取各真人直播对应各历史直播所属各观众对应的观看参数,其中观看参数包括各次观看对应的观看时长。
统计各真人直播对应各历史直播的观众总数量Lim、总观看次数Fim和总观看时长Tim
分析各真人主播所属各历史直播对应的观看紧密度
其中l为历史直播的次数,γ1、γ2、γ3分别为预设的观众数量、观看次数、观看时长对应的修正因子。
本发明在真人主播标签分析模块中对真人主播所属历史直播自定义标签进行分析,对真人主播互动过程中的观众交互匹配度和观看紧密度进行分析,进而保障真人主播所属自定义标签的准确性,为后续真人主播划分奠定了基础,确保AI虚拟人物对应待分析真人主播分析的精确性,从而保证虚拟人物的语言表达的智能化,提高AI虚拟人物的智能化水平。
真人主播划分模块,用于基于各真人主播对应各历史直播的适配标签筛选各目标真人主播,进而将各目标真人主播划分为各自定义标签所属的各目标真人主播。
在本发明的具体实施例中,所述筛选各目标真人主播,其具体方法为:从云数据库中提取各真人主播对应的实际自定义标签。
将各真人主播对应各历史直播的适配标签进行汇总,进而得到各真人主播所属各适配标签对应的次数,并从中筛选次数最多的适配标签作为各真人主播对应的待分析适配标签。
将各真人主播对应的待分析适配标签与对应的实际自定义标签进行匹配,若匹配成功,则将该真人主播标记为目标真人主播,进而得到各目标真人主播。
本发明在真人主播划分模块中依据真人主播所属自定义标签的准确性对各真人主播进行划分,为后续待分析主播的筛选提供了强有力的数据支持。
待分析真人主播分析模块,用于获取目标虚拟主播对应的自定义标签,进而筛选各待分析真人主播,并获取各待分析真人主播对应的各历史直播视频。
本发明在待分析真人主播分析模块中依据目标虚拟主播的自定义标签,筛选待分析真人主播,进而为后续真人主播互动过程的分析过滤一些不必要的数据,从而弥补了现有技术中对所有真人主播的互动过程分析的缺陷,保障分析方法的简便性,减少分析数据,做到精简和针对性分析,进而保障AI虚拟人物语言库的管理效率,从而确保AI虚拟人物语言交互的效率和准确性,提高语言交互的体验。
待分析真人主播交互分析模块,用于依据各待分析真人主播所属各历史直播的视频提取各次交互对应的传达文本和反馈信息,从而筛选各待分析真人主播对应的各组交互。
需要说明的是,各待分析真人主播所属各历史直播的视频提取各次交互,其具体为各待分析真人主播在各历史直播中与观看人员的互动。
在本发明的具体实施例中,所述筛选各待分析真人主播对应的各组交互,其具体方法为:将各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度与预定义的相似度阈值进行对比,若某次交互与相邻交互对应的相似度大于或等于相似度阈值,则将该次交互与相邻交互归类为同组交互,以此类推,进而得到各待分析真人主播对应的各组交互。
在本发明的具体实施例中,所述各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度,其具体分析方法为:依据各待分析真人主播对应各历史直播所属各次交互的传达文本构建传达文本关键字集合,进而同各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数分析方法一致,分析得到各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的传达文本关键字集合相似系数p为各次交互的编号,p=1,2,...,q-1。
将各待分析真人主播对应各历史直播所属各次交互对应的反馈语音转化成语音文本,进而结合反馈文本构建各待分析真人主播对应各历史直播所属各次交互对应的反馈关键字集合。
同理分析各待分析真人主播对应各历史直播所属各次交互与相邻相互对应的反馈关键字相似系数
分析各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度
本发明在待分析真人主播交互分析模块筛选待分析真人主播,并获取其对应的历史直播视频,进而分析真人主播对应的各组交互,从而为后续待分析真人主播交互的分析奠定了基础。
交互数据分析模块,用于基于各待分析真人主播对应的各组交互分析各待分析真人主播对应的适宜存储信息。
在本发明的具体实施例中,所述反馈信息包括反馈文本和反馈语音,适宜存储信息包括各组交互对应的适宜存储传达文本、适宜存储反馈文本和适宜存储反馈语音。
在本发明的具体实施例中,所述各待分析真人主播对应的适宜存储信息,其具体分析方法为:获取各待分析真人主播所属各组交互对应各传达文本,并获取各待分析真人主播所属各组交互对应各反馈文本和各反馈语音。
将各待分析真人主播所属各组交互对应各传达文本划分为若干关键字,并将其进行汇总,进而得到各待分析真人主播所属各组交互对应的若干关键字,并构建各待分析真人主播所属各组交互对应的关键字集合Dif
依据各待分析真人主播所属各组交互对应各传达文本划分的若干关键字构建关键字集合Hifb
分析各待分析真人主播所属各组交互对应各传达文本对应的推荐指数其中SQifb为第i个待分析真人主播所属第f组交互对应第b个传达文本的目标关键字的数量。
需要说明的是,将各待分析真人主播所属各组交互对应各传达文本划分的各关键字与各待分析真人主播所属各组交互对应关键字集合中的各关键字进行匹配,若匹配成功,则将关键字标记为目标关键字,进而统计各待分析真人主播所属各组交互对应各传达文本的目标关键字的数量SQifb
依据各待分析真人主播所属各组交互对应各传达文本对应的推荐指数分析各待分析真人主播所属各组交互对应的适宜存储传达文本。
需要说明的是,各待分析真人主播所属各组交互对应的适宜存储传达文本,其具体分析方法为:基于各待分析真人主播所属各组交互对应各传达文本对应的推荐指数,筛选最大推荐指数对应的传达文本作为各待分析真人主播所属各组交互对应的适宜存储传达文本。
同理,分析各待分析真人主播所属各组交互对应的适宜存储反馈文本。
将各待分析真人主播所属各组交互对应各反馈语音转换成各目标文本。
同理,分析各待分析真人主播所属各组交互对应的适宜目标文本,并将目标文本对应的反馈语音作为各待分析真人主播所属各组交互对应的适宜存储反馈语音。
本发明在交互数据分析模块中分析待分析真人主播的适宜存储信息,为待分析真人主播对应的适宜存储信息存储到目标虚拟主播对应的语言库中提供了数据支持。
交互数据处理,用于将各待分析真人主播对应的适宜存储信息存储到目标虚拟主播对应的语言库中。
云数据库,用于存储各真人主播对应各历史直播所属的视频和自定义标签,存储各真人主播对应的实际自定义标签,存储各自定义标签对应的关键词集合,并存储各真人直播对应各历史直播所属各观众对应的观看参数。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本发明所定义的范围,均应属于本发明的保护范围。

Claims (9)

1.一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于,包括:
真人主播标签分析模块,用于从云数据库中提取各真人主播对应各历史直播所属的自定义标签,并从中提取各真人主播对应各历史直播的视频,并据此分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,从而筛选各真人主播所属各历史直播对应的适配标签;
真人主播划分模块,用于基于各真人主播对应各历史直播的适配标签筛选各目标真人主播,进而将各目标真人主播划分为各自定义标签所属的各目标真人主播;
待分析真人主播分析模块,用于获取目标虚拟主播对应的自定义标签,进而筛选各待分析真人主播,并获取各待分析真人主播对应的各历史直播视频;
待分析真人主播交互分析模块,用于依据各待分析真人主播所属各历史直播的视频提取各次交互对应的传达文本和反馈信息,从而筛选各待分析真人主播对应的各组交互;
交互数据分析模块,用于基于各待分析真人主播对应的各组交互分析各待分析真人主播对应的适宜存储信息;
交互数据处理,用于将各待分析真人主播对应的适宜存储信息存储到目标虚拟主播对应的语言库中;
云数据库,用于存储各真人主播对应各历史直播所属的视频和自定义标签,存储各真人主播对应的实际自定义标签,存储各自定义标签对应的关键词集合,并存储各真人直播对应各历史直播所属各观众对应的观看参数。
2.根据权利要求1所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述反馈信息包括反馈文本和反馈语音,适宜存储信息包括各组交互对应的适宜存储传达文本、适宜存储反馈文本和适宜存储反馈语音。
3.根据权利要求2所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述各真人主播所属各历史直播的自定义标签与各目标标签的适配指数,其具体分析方法为:
从各真人主播对应各历史直播视频中获取各真人主播所属各历史直播对应的语音,并进行语言文本提取,从而得到各真人主播所属各历史直播对应的语音文本;
将各真人主播所属各历史直播对应的语音文本进行分词划分,得到若干词组;
将划分的若干词组与云数据库中存储的各自定义标签对应的关键词集合中的若干关键词进行对比,进而分析各真人主播所属各历史直播对应各次匹配成功所属的待分析自定义标签;
将相同待分析自定义标签标记为目标标签,进而获取各真人主播所属各历史直播对应各目标标签的匹配成功次数Cimj,其中i为各真人主播的编号,i=1,2,...,n,m为各历史直播的编号,m=1,2,...,l,k为各目标标签的编号,k=1,2,...,j;
统计各真人主播所属各历史直播对应各目标标签所属目标词组的数量Simj
分析各真人主播所属各历史直播的自定义标签与各目标标签的适配指数
其中λ1、λ2、λ3、λ4分别为预设的匹配成功次数、目标词组数量、文本匹配系数、观看紧密度对应的影响权重因子,ηimj为第i个真人主播所属第m个历史直播与第j个目标标签对应的文本匹配系数,μim为第i个真人主播所属第m个历史直播对应的观看紧密度。
4.根据权利要求3所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述各真人主播所属各历史直播与各目标标签对应的文本匹配系数,其具体分析方法为:
从各真人主播对应各历史直播的视频中获取各真人主播所属各历史直播对应的观众提出文本和主播回复文本;
依据各真人主播所属各历史直播对应的观众提出文本构建文本关键字集合Aim
依据各自定义标签对应的关键词集合获取各目标标签对应的关键词集合,并据此构建各目标标签对应的关键字集合Bj
分析各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数
同理,分析各真人主播所属各历史直播对应主播回复文本关键字与各目标标签对应关键字的匹配系数σimj
分析各真人主播所属各历史直播与各目标标签对应的文本匹配系数
5.根据权利要求3所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述各真人主播所属各历史直播对应的观看紧密度,其具体分析方法为:
从云数据库中提取各真人直播对应各历史直播所属各观众对应的观看参数,其中观看参数包括各次观看对应的观看时长;
统计各真人直播对应各历史直播的观众总数量Lim、总观看次数Fim和总观看时长Tim
分析各真人主播所属各历史直播对应的观看紧密度
其中l为历史直播的次数,γ1、γ2、γ3分别为预设的观众数量、观看次数、观看时长对应的修正因子。
6.根据权利要求1所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述筛选各目标真人主播,其具体方法为:
从云数据库中提取各真人主播对应的实际自定义标签;
将各真人主播对应各历史直播的适配标签进行汇总,进而得到各真人主播所属各适配标签对应的次数,并从中筛选次数最多的适配标签作为各真人主播对应的待分析适配标签;
将各真人主播对应的待分析适配标签与对应的实际自定义标签进行匹配,若匹配成功,则将该真人主播标记为目标真人主播,进而得到各目标真人主播。
7.根据权利要求4所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述筛选各待分析真人主播对应的各组交互,其具体方法为:将各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度与预定义的相似度阈值进行对比,若某次交互与相邻交互对应的相似度大于或等于相似度阈值,则将该次交互与相邻交互归类为同组交互,以此类推,进而得到各待分析真人主播对应的各组交互。
8.根据权利要求7所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度,其具体分析方法为:
依据各待分析真人主播对应各历史直播所属各次交互的传达文本构建传达文本关键字集合,进而同各真人主播所属各历史直播对应观众提出文本关键字与各目标标签对应关键字的匹配系数分析方法一致,分析得到各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的传达文本关键字集合相似系数p为各次交互的编号,p=1,2,...,q-1;
将各待分析真人主播对应各历史直播所属各次交互对应的反馈语音转化成语音文本,进而结合反馈文本构建各待分析真人主播对应各历史直播所属各次交互对应的反馈关键字集合;
同理分析各待分析真人主播对应各历史直播所属各次交互与相邻相互对应的反馈关键字相似系数
分析各待分析真人主播对应各历史直播所属各次交互与相邻交互对应的相似度
9.根据权利要求2所述的一种基于人工智能的AI虚拟人物语言库分类管理系统,其特征在于:所述各待分析真人主播对应的适宜存储信息,其具体分析方法为:
获取各待分析真人主播所属各组交互对应各传达文本,并获取各待分析真人主播所属各组交互对应各反馈文本和各反馈语音,进而据此构建各待分析真人主播所属各组交互对应的关键字集合Dif和各待分析真人主播所属各组交互对应各传达文本的关键字集合Hifb
分析各待分析真人主播所属各组交互对应各传达文本对应的推荐指数其中SQifb为第i个待分析真人主播所属第f组交互对应第b个传达文本的目标关键字的数量;
依据各待分析真人主播所属各组交互对应各传达文本对应的推荐指数分析各待分析真人主播所属各组交互对应的适宜存储传达文本;
同理,分析各待分析真人主播所属各组交互对应的适宜存储反馈文本;
将各待分析真人主播所属各组交互对应各反馈语音转换成各目标文本;
同理,分析各待分析真人主播所属各组交互对应的适宜目标文本,并将目标文本对应的反馈语音作为各待分析真人主播所属各组交互对应的适宜存储反馈语音。
CN202310742553.3A 2023-06-21 2023-06-21 一种基于人工智能的ai虚拟人物语言库分类管理系统 Active CN116737936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310742553.3A CN116737936B (zh) 2023-06-21 2023-06-21 一种基于人工智能的ai虚拟人物语言库分类管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310742553.3A CN116737936B (zh) 2023-06-21 2023-06-21 一种基于人工智能的ai虚拟人物语言库分类管理系统

Publications (2)

Publication Number Publication Date
CN116737936A true CN116737936A (zh) 2023-09-12
CN116737936B CN116737936B (zh) 2024-01-02

Family

ID=87911188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310742553.3A Active CN116737936B (zh) 2023-06-21 2023-06-21 一种基于人工智能的ai虚拟人物语言库分类管理系统

Country Status (1)

Country Link
CN (1) CN116737936B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117319758A (zh) * 2023-10-13 2023-12-29 南京霍巴信息科技有限公司 一种基于云平台的直播方法及直播系统
CN118334254A (zh) * 2024-06-12 2024-07-12 南京上古网络科技有限公司 基于人工智能的交互式ai数字人平台系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111866529A (zh) * 2020-06-05 2020-10-30 江苏遨信科技有限公司 一种在视频直播时混合使用虚拟真人的方法及其系统
CN114025186A (zh) * 2021-10-28 2022-02-08 广州方硅信息技术有限公司 直播间内的虚拟语音互动方法、装置及计算机设备
CN114245155A (zh) * 2021-11-30 2022-03-25 北京百度网讯科技有限公司 直播方法、装置及电子设备
WO2022095380A1 (zh) * 2020-11-03 2022-05-12 平安科技(深圳)有限公司 基于ai的虚拟交互模型生成方法、装置、计算机设备及存储介质
WO2022121601A1 (zh) * 2020-12-11 2022-06-16 北京字跳网络技术有限公司 一种直播互动方法、装置、设备及介质
CN115187704A (zh) * 2022-06-17 2022-10-14 平安科技(深圳)有限公司 虚拟主播生成方法、装置、设备及存储介质
CN115515016A (zh) * 2022-11-04 2022-12-23 广东玄润数字信息科技股份有限公司 一种可实现自交互回复的虚拟直播方法、系统及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111866529A (zh) * 2020-06-05 2020-10-30 江苏遨信科技有限公司 一种在视频直播时混合使用虚拟真人的方法及其系统
WO2022095380A1 (zh) * 2020-11-03 2022-05-12 平安科技(深圳)有限公司 基于ai的虚拟交互模型生成方法、装置、计算机设备及存储介质
WO2022121601A1 (zh) * 2020-12-11 2022-06-16 北京字跳网络技术有限公司 一种直播互动方法、装置、设备及介质
CN114025186A (zh) * 2021-10-28 2022-02-08 广州方硅信息技术有限公司 直播间内的虚拟语音互动方法、装置及计算机设备
CN114245155A (zh) * 2021-11-30 2022-03-25 北京百度网讯科技有限公司 直播方法、装置及电子设备
CN115187704A (zh) * 2022-06-17 2022-10-14 平安科技(深圳)有限公司 虚拟主播生成方法、装置、设备及存储介质
CN115515016A (zh) * 2022-11-04 2022-12-23 广东玄润数字信息科技股份有限公司 一种可实现自交互回复的虚拟直播方法、系统及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李亚铭;李阳;: "AI主播与受众关系的建构", 青年记者, no. 35 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117319758A (zh) * 2023-10-13 2023-12-29 南京霍巴信息科技有限公司 一种基于云平台的直播方法及直播系统
CN117319758B (zh) * 2023-10-13 2024-03-12 南京霍巴信息科技有限公司 一种基于云平台的直播方法及直播系统
CN118334254A (zh) * 2024-06-12 2024-07-12 南京上古网络科技有限公司 基于人工智能的交互式ai数字人平台系统及方法

Also Published As

Publication number Publication date
CN116737936B (zh) 2024-01-02

Similar Documents

Publication Publication Date Title
CN116737936B (zh) 一种基于人工智能的ai虚拟人物语言库分类管理系统
CN106921891B (zh) 一种视频特征信息的展示方法和装置
CN1187982C (zh) 充实视频的屏幕文字触发字
CN110166818B (zh) 待配音视频的生成方法、计算机设备及存储介质
CN110263217A (zh) 一种视频片段标签识别方法及装置
CN113705299A (zh) 一种视频识别的方法、装置及存储介质
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN111626049B (zh) 多媒体信息的标题修正方法、装置、电子设备及存储介质
CN109005451B (zh) 基于深度学习的视频拆条方法
CN112131430A (zh) 视频聚类方法、装置、存储介质和电子设备
CN111930792A (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN111723295A (zh) 一种内容分发方法、装置和存储介质
CN115470344A (zh) 一种基于文本聚类的视频弹幕与评论主题融合的方法
CN114547370A (zh) 一种视频摘要提取方法及系统
CN111177462A (zh) 视频分发时效的确定方法和装置
CN109446522B (zh) 一种试题自动分类系统及方法
US11785299B1 (en) Selecting advertisements for media programs and establishing favorable conditions for advertisements
CN111259245A (zh) 作品推送方法、装置及存储介质
CN117556965A (zh) 基于智慧作业平台的教学课程优化方法、系统及存储介质
CN115883912B (zh) 一种用于互联网交流演示的互动方法及系统
CN115129902A (zh) 媒体数据处理方法、装置、设备及存储介质
CN114584841A (zh) 评论内容生成方法及装置、存储介质及电子设备
CN116628232A (zh) 标签确定方法、装置、设备、存储介质及产品
CN115130453A (zh) 互动信息生成方法和装置
CN114996435A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant