CN110113635A - 一种自动播放推送消息的方法及系统 - Google Patents

一种自动播放推送消息的方法及系统 Download PDF

Info

Publication number
CN110113635A
CN110113635A CN201910337143.4A CN201910337143A CN110113635A CN 110113635 A CN110113635 A CN 110113635A CN 201910337143 A CN201910337143 A CN 201910337143A CN 110113635 A CN110113635 A CN 110113635A
Authority
CN
China
Prior art keywords
message
vocabulary
user
filtered
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910337143.4A
Other languages
English (en)
Other versions
CN110113635B (zh
Inventor
王健
刘卫平
苏战
郑岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhi Co Artificial Intelligence Technology Co Ltd
Original Assignee
Guangzhou Zhi Co Artificial Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Zhi Co Artificial Intelligence Technology Co Ltd filed Critical Guangzhou Zhi Co Artificial Intelligence Technology Co Ltd
Priority to CN201910337143.4A priority Critical patent/CN110113635B/zh
Publication of CN110113635A publication Critical patent/CN110113635A/zh
Application granted granted Critical
Publication of CN110113635B publication Critical patent/CN110113635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/252Processing of multiple end-users' preferences to derive collaborative data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Graphics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种自动播放推送消息的方法及系统,根据预设的敏感词汇数据库,对所述消息进行过滤处理;根据过滤后的消息,获取所述消息对应的标签类型;根据用户需求确定与用户所对应的标签类型优先级数据库;根据预设的标签类型优先级数据库和所述消息对应的标签类型,对所述消息进行优先级从高到低依次排序;将排序后的所述消息转换为语音数据进行依次定时播放。

Description

一种自动播放推送消息的方法及系统
技术领域
本发明涉及自动播放技术领域,特别涉及一种自动播放推送消息的方法及系统。
背景技术
随着互联网技术的快速发展,人们对于消息的获取更加快速和便捷;但目前对于消息的获取,只是通过网络来随机的获取,并不能实现根据用户的喜好来向用户推送消息。
同时由于互联网技术的普及,青少年通过网络获取消息时,不能够深入把握消息的内涵,并不具备辨别消息内容的能力;尤其对于儿童来说,阅读或听取包含有敏感内容的消息时,会对身心健康造成严重影响。
因此,急需一种自动播放推送消息的方法及系统。
发明内容
为解决上述技术问题,本发明提供一种自动播放推送消息的方法及系统,用以实现根据用户的要求进行自动播放消息。
本发明实施例中提供了一种自动播放推送消息的方法,
S1、根据预设的敏感词汇数据库,对消息进行过滤处理;
S2、根据过滤后的消息,获取所述消息对应的标签类型;
S3、根据用户需求确定与用户所对应的标签类型优先级数据库;
S4、根据预设的标签类型优先级数据库和所述消息对应的标签类型,对所述消息进行优先级从高到低依次排序;
S5、将排序后的所述消息转换为语音数据进行依次定时播放。
在一个实施例中,所述步骤S1、根据预设的敏感词汇数据库,对所述消息进行过滤处理之前的步骤,还包括:
对所获取的消息进行预处理;具体包括:
根据预设的繁简对照文字库,将所述消息中的繁体字转换为简体字;并将所述消息中的标点符号去除。
在一个实施例中,所述对所获取的消息进行预处理之前的步骤,还包括:
设置网络爬虫对网络上的消息进行实时获取;
所述消息,包括消息内容和消息链接地址。
在一个实施例中,所述步骤S2、根据过滤后的消息,获取所述消息对应的标签类型;包括如下步骤:
S21、获取所述消息的标题数据和名词数据;
S22、获取所述名词数据中的地名名词,生成消息对应的相关地名标签;
S23、获取所述名词数据中的关键词,基于消息类型数据库进行判断识别,获取所述消息所对应的类型,生成消息对应的内容标签;
S24、获取所述标题数据中的名词,生成消息对应的标题标签;
S25、根据所述相关地名标签、内容标签和标题标签,形成所述消息对应的标签类型。
在一个实施例中,所述消息类型数据库,包括政治类消息数据子库、经济类消息数据子库、科教类消息数据子库、军事类消息数据子库、文艺类消息数据子库和体育类消息数据子库,所述每个消息数据子库中存储有相应类型的关键词。
在一个实施例中,所述标签类型优先级数据库,包括第一优先级、第二优先级和第三优先级;其中,
所述第一优先级为所述消息的地名名词;所述第二优先级为所述消息的标签类型;所述第三优先级为所述消息的标题名词。
在一个实施例中,所述S5、将排序后的所述消息转换为语音数据进行依次定时播放步骤之后,还包括:
获取用户的特征信息;
根据所播放的消息,从问题数据库中查找与所播放消息的内容标签所对应的问题语句;
获取用户的特征信息;
根据所述用户的特征信息,将所述问题语句中的词汇进行修正替换;
将替换后的所述问题语句进行播放;
所述特征信息,包括用户的词汇量数据;所述问题数据库,包括政治类消息问题子库、经济类消息问题子库、科教类消息问题子库、军事类消息问题子库、文艺类消息问题子库和体育类消息问题子库,所述每个消息问题子库中存储有相应消息的问题语句。
在一个实施例中,所述步骤S1根据预设的敏感词汇数据库,对消息进行过滤处理,包括如下步骤:
首先构建一个学习数据库D,所述学习数据库D中有总共S条消息,且被定义为不需被过滤的消息p条,需过滤的消息n条,则不需要被过滤的概率需要被过滤的概率利用公式(1)计算期望信息:
其中I(p,n)为所计算得到的期望信息;
根据敏感词汇数据库中包含的敏感词汇及每个敏感词汇对应的词汇属性,确定学习数据库D中的每一条消息中出现的敏感词汇;根据学习数据库D中的每一条消息中出现的敏感词汇,确定每一条消息在每一种敏感词汇属性下所对应的可能值,所述可能值为敏感词汇的具体内容;假设敏感词汇数据库中包含的词汇属性有T种,其中任一种词汇属性A包含m种可能值分别为{C1,C2,…,Cm},其中,Ci为所述学习数据库D中词汇属性A的第i种可能值,i=1,2,3……m;
在所述S条消息中,包含Ci的所有消息中,有pi条消息不需被过滤,有ni条消息需要被过滤,则词汇属性A的增益信息如公式(2)所示:
其中,I(pi,ni)为将pi和ni带入公式(1)计算得出的期望信息,S为学习数据库D中的消息总条数,E(A)为中间值;
利用下列步骤(A)-(C)进行分类操作:
(A)用公式(2)计算出所述学习数据库D中每种词汇属性的增益信息,选择增益信息最大的词汇属性作为该次分类标准,该增益信息最大的词汇属性中有多少种可能值则分为多少类,假设有Yi种可能值,将每一个可能值看成一类,则可分为Yi类,每一类对应一个叶子节点,每个叶子节点中都包含有对应的消息,该对应的消息是指学习数据库D中包含有该叶子节点对应的那一类所对应的可能值的消息,然后将每个叶子节点中包含的对应的消息作为一个新的学习数据库;
(B)统计所述新的学习数据库中的叶子节点中包含的对应的消息是否需要过滤的结论,判断所述结论是否是该叶子节点中包含的对应的消息都需要过滤、或者该叶子节点中包含的对应的消息都不需要过滤;如果是,则将该叶子节点作为末端叶子节点进行标注,标注的内容为所述结论,分类结束;如果否,则对所述新的学习数据库重复执行步骤(A)-(B);
按照前述操作最终形成一棵分类树,该分类树的每个末端叶子节点都对应有所述标注;
判断需要过滤处理的消息在所述分类树中所属的末端叶子节点;获取该所属的末端叶子节点的标注,按照标注中所显示的是否需要过滤来对所述需要过滤处理的消息进行过滤处理。
一种自动播放推送消息的系统,包括获取模块、敏感词过滤模块、分类模块、优先级排序模块和播放模块;其中,
所述获取模块,用于对消息获取并进行预处理,将所述消息向所述敏感词过滤模块传输;
所述敏感词过滤模块,用于根据预设的敏感词汇数据库,对所述消息进行过滤处理,并将过滤后的消息向所述分类模块传输;
所述分类模块,用于对过滤后的消息进行分类处理,获取所述消息对应的标签类型,并将所述消息和所述消息对应的所述标签类型向所述优先级排序模块传输;
所述优先级排序模块,用于根据预设的标签类型优先级数据库和所述消息对应的标签类型,对所述消息进行优先级从高到低依次排序,并将排序后的消息向所述播放模块传输;
所述播放模块,用于对将排序后的所述消息转换为语音数据进行依次定时播放。
在一个实施例中,所述播放模块,包括TTS单元、定时单元和播放单元;其中,
所述TTS单元,用于将接收的所述消息转换为所述语音数据;所述定时单元,用于用户设置播放所述消息的起止时间段;所述播放单元,用于播放所述消息;
所述播放单元,包括喇叭或者音响中的一种或多种。
在一个实施例中,所述系统,还包括用户自助获取模块;所述用户自助获取模块,包括用户输入单元、存储单元和检索单元;其中,
所述用户输入单元,用于用户输入兴趣信息;所述存储单元,用于向所述优先级排序模块获取排序后的所述消息和所述消息对应的所述标签类型并进行存储;所述检索单元,用于根据用户输入的所述兴趣信息,通过在所述存储单元中检索与所述兴趣信息相匹配的消息,并向所述播放单元传输进行播放;
所述用户输入单元,包括语音输入子单元和语音识别子单元;其中,所述语音输入子单元,用于获取用户的语音信号,并向所述语音识别子单元传输;所述语音识别子单元,用于将所述语音信号转换为文本信息;
所述检索单元,包括特征名词提取子单元、特征名词比对子单元和过滤子单元;其中,所述特征名词提取子单元,用于提取所述兴趣信息中的特征名词,并向所述特征名词比对子单元传输;所述特征名词比对子单元,用于将所述特征名词与所述存储单元内的所述消息进行比对,并将所述消息中与所述特征名词相同的内容标注;所述过滤子单元,用于将所述存储单元中没有标注的消息进行过滤,获取过滤处理后的消息队列。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明所提供一种自动播放推送消息的方法的结构示意图;
图2为本发明所提供一种自动播放推送消息的系统的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种自动播放推送消息的方法,如图1所示,
S1、根据预设的敏感词汇数据库,对消息进行过滤处理;
S2、根据过滤后的消息,获取消息对应的标签类型;
S3、根据用户需求确定与用户所对应的标签类型优先级数据库;
S4、根据预设的标签类型优先级数据库和消息对应的标签类型,对消息进行优先级从高到低依次排序;
S5、将排序后的消息转换为语音数据进行依次定时播放。
上述方法的工作原理在于:通过将所获取的消息与敏感词汇数据库进行比对,将带有敏感词的消息进行过滤处理;并获取过滤处理后消息所对应的标签类型;根据用户需求确定的标签类型数据库对过滤处理后的消息进行排序;并将排序后的消息转换为语音数据进行依次定时播放。
上述方法的有益效果在于:通过步骤S1将消息与敏感词汇数据库比对,实现了将包含有敏感词内容的消息的过滤,解决了传统技术中不能够对包含有敏感词的消息的过滤的缺陷,为青少年通过网络获取消息提供了安全保证,有效地避免了带有敏感词内容的消息向用户的自动推送;并且根据步骤S4实现了根据用户的需求和喜好,对消息进行排序向用户推送,并通过步骤S5进行播放,从而实现了根据用户的需求自动推送播放的功能;综上所述,上述方法不仅能够实现根据用户需求,向用户自动推送播放消息,还能够实现对包含有敏感词内容的消息的自动过滤。
在一个实施例中,步骤S1、根据预设的敏感词汇数据库,对消息进行过滤处理之前的步骤,还包括:
对所获取的消息进行预处理;具体包括:
根据预设的繁简对照文字库,将消息中的繁体字转换为简体字;并将消息中的标点符号去除。上述技术方案在对消息进行敏感词过滤处理前进行预处理,通过繁简对照文字库,将消息中的繁体字转换为简体字,并对消息中的标点符号进行去除;通过上述步骤不仅有效地提高了步骤S1的敏感词过滤处理的效率,同时将标点符号去除有效地避免了步骤S5对消息进行语音播放时,对标点符号的语音播出。
在一个实施例中,对所获取的消息进行预处理之前的步骤,还包括:
设置网络爬虫对网络上的消息进行实时获取;
消息,包括消息内容和消息链接地址。上述技术方案中通过设置网络爬虫实现了对消息的实时获取,从而实现了所述自动播放推送消息方法的消息获取。
在一个实施例中,步骤S2、根据过滤后的消息,获取消息对应的标签类型;包括如下步骤:
S21、获取消息的标题数据和名词数据;
S22、获取名词数据中的地名名词,生成消息对应的相关地名标签;
S23、获取名词数据中的关键词,基于消息类型数据库进行判断识别,获取消息所对应的类型,生成消息对应的内容标签;
S24、获取标题数据中的名词,生成消息对应的标题标签;
S25、根据相关地名标签、内容标签和标题标签,形成消息对应的标签类型。上述技术方案中获取的敏感词过滤处理后的消息中的标题数据和名词数据,根据名词数据中的地名名词生成相关地名标签;将名词数据中的关键词与消息类型数据库进行比对,生成内容标签;根据标题数据中的名词生成标题标签;并将相关地名标签、内容标签、标题标签作为消息的标签类型;从而实现了消息所对应的标签类型的获取。
在一个实施例中,消息类型数据库,包括政治类消息数据子库、经济类消息数据子库、科教类消息数据子库、军事类消息数据子库、文艺类消息数据子库和体育类消息数据子库,每个消息数据子库中存储有相应类型的关键词。上述技术方案中消息类型数据库中包括有多个消息数据子库,每个消息数据子库中存储有相应类型的关键词,将消息的关键词与每个消息数据子库中的关键词进行比对,从而实现了对消息的内容标签的确定。
在一个实施例中,标签类型优先级数据库,包括第一优先级、第二优先级和第三优先级;其中,
第一优先级为消息的地名名词;第二优先级为消息的标签类型;第三优先级为消息的标题名词。上述技术方案中通过将用户输入的地名名词设置为第一优先级;将用户个人偏好的消息类型设置为第二优先级;将用户个人偏好的消息的名词设置为第三优先级;通过上述标签类型优先级数据库的三个优先级与消息的标签类型的相关地名标签、内容标签、标题标签进行比对,将消息的相关地名标签与第一优先级的地名名词比对进行初次排序;当消息的相关地名标签与第一优先级的地名名词一致时,根据第二优先级的用户个人偏好的消息类型进行第二次排序;当消息的内容标签与第二优先级的用户个人偏好的消息类型一致时,根据第三优先级的用户个人偏好的消息的名词进行第三次排序,从而实现了根据标签类型优先级数据库对消息的排序。
在一个实施例中,S5、将排序后的消息转换为语音数据进行依次定时播放步骤之后,还包括:
获取用户的特征信息;
根据所播放的消息,从问题数据库中查找与所播放消息的内容标签所对应的问题语句;
获取用户的特征信息;
根据用户的特征信息,将问题语句中的词汇进行修正替换;
将替换后的问题语句进行播放;
特征信息,包括用户的词汇量数据;问题数据库,包括政治类消息问题子库、经济类消息问题子库、科教类消息问题子库、军事类消息问题子库、文艺类消息问题子库和体育类消息问题子库,每个消息问题子库中存储有相应消息的问题语句。上述技术方案在播放完消息后,根据所播放的信息基于问题数据库查找与所播放消息的内容标签相对应的问题语句;并根据用户输入的特征信息(词汇量数据),对问题语句中的词汇进行替换,形成用户可理解的问题语句,并进行播放;从而实现了自动播放推送消息的方法的根据用户的特征信息的提问功能。
例如,播放为体育类型的消息时,基于问题数据进行查询,从体育类消息问题子库中获取问题语句,“消息中涉及到哪几位体育明星?”;当用户输入的特征信息为“词汇量数据1500”,对上述问题语句进行词汇修改替换为“刚才说的消息中有谁呀?”,并将该语句进行播放。
在一个实施例中,步骤S1根据预设的敏感词汇数据库,对消息进行过滤处理,包括如下步骤:
首先构建一个学习数据库D,学习数据库D中有总共S条消息,且被定义为不需被过滤的消息p条,需过滤的消息n条,则不需要被过滤的概率需要被过滤的概率利用公式(1)计算期望信息:
其中I(p,n)为所计算得到的期望信息;
根据敏感词汇数据库中包含的敏感词汇及每个敏感词汇对应的词汇属性,确定学习数据库D中的每一条消息中出现的敏感词汇;根据学习数据库D中的每一条消息中出现的敏感词汇,确定每一条消息在每一种敏感词汇属性下所对应的可能值,可能值为敏感词汇的具体内容;假设敏感词汇数据库中包含的词汇属性有T种,其中任一种词汇属性A包含m种可能值分别为{C1,C2,…,Cm},其中,Ci为学习数据库D中词汇属性A的第i种可能值,i=1,2,3……m;
在S条消息中,包含Ci的所有消息中,有pi条消息不需被过滤,有ni条消息需要被过滤,则词汇属性A的增益信息如公式(2)所示:
其中,I(pi,ni)为将pi和ni带入公式(1)计算得出的期望信息,S为学习数据库D中的消息总条数,E(A)为中间值;
利用下列步骤(A)-(C)进行分类操作:
(A)用公式(2)计算出学习数据库D中每种词汇属性的增益信息,选择增益信息最大的词汇属性作为该次分类标准,该增益信息最大的词汇属性中有多少种可能值则分为多少类,假设有Yi种可能值,将每一个可能值看成一类,则可分为Yi类,每一类对应一个叶子节点,每个叶子节点中都包含有对应的消息,该对应的消息是指学习数据库D中包含有该叶子节点对应的那一类所对应的可能值的消息,然后将每个叶子节点中包含的对应的消息作为一个新的学习数据库;
(B)统计新的学习数据库中的叶子节点中包含的对应的消息是否需要过滤的结论,判断结论是否是该叶子节点中包含的对应的消息都需要过滤、或者该叶子节点中包含的对应的消息都不需要过滤;如果是,则将该叶子节点作为末端叶子节点进行标注,标注的内容为结论,分类结束;如果否,则对新的学习数据库重复执行步骤(A)-(B);
按照前述操作最终形成一棵分类树,该分类树的每个末端叶子节点都对应有标注;
判断需要过滤处理的消息在分类树中所属的末端叶子节点;获取该所属的末端叶子节点的标注,按照标注中所显示的是否需要过滤来对需要过滤处理的消息进行过滤处理。
通过以上过滤方法,可以方便快速准确地对需要过滤处理的消息进行过滤处理。
一种自动播放推送消息的系统,如图2所示,包括获取模块11、敏感词过滤模块12、分类模块13、优先级排序模块14和播放模块15;其中,
获取模块11,用于对消息获取并进行预处理,将消息向敏感词过滤模块12传输;
敏感词过滤模块12,用于根据预设的敏感词汇数据库,对消息进行过滤处理,并将过滤后的消息向分类模块13传输;
分类模块13,用于对过滤后的消息进行分类处理,获取消息对应的标签类型,并将消息和消息对应的标签类型向优先级排序模块14传输;
优先级排序模块14,用于根据预设的标签类型优先级数据库和消息对应的标签类型,对消息进行优先级从高到低依次排序,并将排序后的消息向播放模块15传输;
播放模块15,用于对将排序后的消息转换为语音数据进行依次定时播放。
上述系统的工作原理在于:通过获取模块11对消息进行获取,并将消息中的繁体字转换简体字、去除标点符号后向敏感词过滤模块12传输;敏感词过滤模块12,用于对获取模块11传输的消息与敏感词汇数据库进行比对,将带有敏感词汇的消息进行过滤,并将过滤后的消息向分类模块13传输;分类模块13获取过滤后的消息所对应的标签类型,并向优先级排序模块14传输;优先级排序模块14用于将根据用户需求确定的标签类型优先级数据库与消息的标签类型比对,对传输的消息的进行排序处理,并将排序后的消息向播放模块15传输;播放模块15,将消息转换为语音数据进行播放。
上述系统的有益效果在于:通过敏感词过滤模块,将消息与敏感词汇数据库比对,实现了将包含有敏感词的消息的过滤,解决了传统技术中不能够对包含有敏感词的消息的过滤的缺陷,为青少年安全地通过网络获取消息提供了保证,有效地避免了带有敏感词内容的消息向用户的推送;并且根据优先级排序模块实现了系统根据用户的需求和喜好,对消息进行排序,并通过播放模块向用户进行播放,从而实现了系统根据用户的需求自动推送播放消息的功能。综上所述,系统不仅能够实现根据用户需求,向用户自动推送播放消息;还能够实现对包含有敏感词内容的消息的自动过滤。
播放模块,包括TTS单元、定时单元和播放单元;其中,
TTS单元,用于将接收的消息转换为语音数据;定时单元,用于用户设置播放消息的起止时间段(例如7:00-9:00);播放单元,用于播放消息;
播放单元,包括喇叭或者音响中的一种或多种。上述技术方案中通过TTS单元实现了将消息转换为语音数据,并根据用户预设的播放消息的起止时间端通过播放单元进行播放,从而实现了系统的自动定时播放功能。
系统,还包括用户自助获取模块;用户自助获取模块,包括用户输入单元、存储单元和检索单元;其中,
用户输入单元,用于用户输入兴趣信息;存储单元,用于向优先级排序模块获取排序后的消息和消息对应的标签类型并进行存储;检索单元,用于根据用户输入的兴趣信息,通过在存储单元中检索与兴趣信息相匹配的消息,并向播放单元传输进行播放;上述技术方案中检索单元用于根据用户输入的兴趣信息从存储单元中获取与兴趣信息相匹配的消息,并通过播放单元播放,从而实现了用户对于消息的自助获取。
用户输入单元,包括语音输入子单元和语音识别子单元;其中,语音输入子单元,用于获取用户的语音信号,并向语音识别子单元传输;语音识别子单元,用于将语音信号转换为文本信息;上述技术方案通过语音输入子单元和语音识别子单元,实现了自助获取模块对于用户输入兴趣信息的语音信号的获取和转换文字的功能。
检索单元,包括特征名词提取子单元、特征名词比对子单元和过滤子单元;其中,特征名词提取子单元,用于提取兴趣信息中的特征名词,并向特征名词比对子单元传输;特征名词比对子单元,用于将特征名词与存储单元内的消息进行比对,并将消息中与特征名词相同的内容标注;过滤子单元,用于将存储单元中没有标注的消息进行过滤,获取过滤处理后的消息队列。上述技术方案中通过特征名词提取子单元实现了对用户输入的兴趣信息中的特征名词的提取,并通过特征名词比对子单元将存储单元中与特征名词相同的消息的内容进行标注,并通过过滤子单元将没有进行标注的消息进行过滤处理,从而实现了用户根据自身兴趣获取相应消息的功能。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种自动播放推送消息的方法,其特征在于,
S1、根据预设的敏感词汇数据库,对消息进行过滤处理;
S2、根据过滤后的消息,获取所述消息对应的标签类型;
S3、根据用户需求确定与用户所对应的标签类型优先级数据库;
S4、根据预设的标签类型优先级数据库和所述消息对应的标签类型,对所述消息进行优先级从高到低依次排序;
S5、将排序后的所述消息转换为语音数据进行依次定时播放。
2.如权利要求1所述的方法,其特征在于,
所述步骤S1、根据预设的敏感词汇数据库,对所述消息进行过滤处理之前的步骤,还包括:
对所获取的消息进行预处理;具体包括:
根据预设的繁简对照文字库,将所述消息中的繁体字转换为简体字;并将所述消息中的标点符号去除。
3.如权利要求2所述的方法,其特征在于,
所述对所获取的消息进行预处理之前的步骤,还包括:
设置网络爬虫对网络上的消息进行实时获取;
所述消息,包括消息内容和消息链接地址。
4.如权利要求1所述的方法,其特征在于,
所述步骤S2、根据过滤后的消息,获取所述消息对应的标签类型;包括如下步骤:
S21、获取所述消息的标题数据和名词数据;
S22、获取所述名词数据中的地名名词,生成消息对应的相关地名标签;
S23、获取所述名词数据中的关键词,基于消息类型数据库进行判断识别,获取所述消息所对应的类型,生成消息对应的内容标签;
S24、获取所述标题数据中的名词,生成消息对应的标题标签;
S25、根据所述相关地名标签、内容标签和标题标签,形成所述消息对应的标签类型。
5.如权利要求4所述的方法,其特征在于,
所述消息类型数据库,包括政治类消息数据子库、经济类消息数据子库、科教类消息数据子库、军事类消息数据子库、文艺类消息数据子库和体育类消息数据子库,所述每个消息数据子库中存储有相应类型的关键词。
6.如权利要求1所述的方法,其特征在于,
所述标签类型优先级数据库,包括第一优先级、第二优先级和第三优先级;其中,
所述第一优先级为所述消息的地名名词;所述第二优先级为所述消息的标签类型;所述第三优先级为所述消息的标题名词。
7.如权利要求1所述的方法,其特征在于,
所述S5、将排序后的所述消息转换为语音数据进行依次定时播放步骤之后,还包括:
获取用户的特征信息;
根据所播放的消息,从问题数据库中查找与所播放消息的内容标签所对应的问题语句;
获取用户的特征信息;
根据所述用户的特征信息,将所述问题语句中的词汇进行修正替换;
将替换后的所述问题语句进行播放;
所述特征信息,包括用户的词汇量数据;所述问题数据库,包括政治类消息问题子库、经济类消息问题子库、科教类消息问题子库、军事类消息问题子库、文艺类消息问题子库和体育类消息问题子库,所述每个消息问题子库中存储有相应消息的问题语句。
8.如权利要求1所述的方法,其特征在于,
所述步骤S1根据预设的敏感词汇数据库,对消息进行过滤处理,包括如下步骤:
首先构建一个学习数据库D,所述学习数据库D中有总共S条消息,且被定义为不需被过滤的消息p条,需过滤的消息n条,则不需要被过滤的概率需要被过滤的概率利用公式(1)计算期望信息:
其中I(p,n)为所计算得到的期望信息;
根据敏感词汇数据库中包含的敏感词汇及每个敏感词汇对应的词汇属性,确定学习数据库D中的每一条消息中出现的敏感词汇;根据学习数据库D中的每一条消息中出现的敏感词汇,确定每一条消息在每一种敏感词汇属性下所对应的可能值,所述可能值为敏感词汇的具体内容;假设敏感词汇数据库中包含的词汇属性有T种,其中任一种词汇属性A包含m种可能值分别为{C1,C2,…,Cm},其中,Ci为所述学习数据库D中词汇属性A的第i种可能值,i=1,2,3……m;
在所述S条消息中,包含Ci的所有消息中,有pi条消息不需被过滤,有ni条消息需要被过滤,则词汇属性A的增益信息如公式(2)所示:
其中,I(pi,ni)为将pi和ni带入公式(1)计算得出的期望信息,S为学习数据库D中的消息总条数,E(A)为中间值;
利用下列步骤(A)-(C)进行分类操作:
(A)用公式(2)计算出所述学习数据库D中每种词汇属性的增益信息,选择增益信息最大的词汇属性作为该次分类标准,该增益信息最大的词汇属性中有多少种可能值则分为多少类,假设有Yi种可能值,将每一个可能值看成一类,则可分为Yi类,每一类对应一个叶子节点,每个叶子节点中都包含有对应的消息,该对应的消息是指学习数据库D中包含有该叶子节点对应的那一类所对应的可能值的消息,然后将每个叶子节点中包含的对应的消息作为一个新的学习数据库;
(B)统计所述新的学习数据库中的叶子节点中包含的对应的消息是否需要过滤的结论,判断所述结论是否是该叶子节点中包含的对应的消息都需要过滤、或者该叶子节点中包含的对应的消息都不需要过滤;如果是,则将该叶子节点作为末端叶子节点进行标注,标注的内容为所述结论,分类结束;如果否,则对所述新的学习数据库重复执行步骤(A)-(B);
按照前述操作最终形成一棵分类树,该分类树的每个末端叶子节点都对应有所述标注;
判断需要过滤处理的消息在所述分类树中所属的末端叶子节点;获取该所属的末端叶子节点的标注,按照标注中所显示的是否需要过滤来对所述需要过滤处理的消息进行过滤处理。
9.一种自动播放推送消息的系统,其特征在于,包括获取模块、敏感词过滤模块、分类模块、优先级排序模块和播放模块;其中,
所述获取模块,用于对消息获取并进行预处理,将所述消息向所述敏感词过滤模块传输;
所述敏感词过滤模块,用于根据预设的敏感词汇数据库,对所述消息进行过滤处理,并将过滤后的消息向所述分类模块传输;
所述分类模块,用于对过滤后的消息进行分类处理,获取所述消息对应的标签类型,并将所述消息和所述消息对应的所述标签类型向所述优先级排序模块传输;
所述优先级排序模块,用于根据预设的标签类型优先级数据库和所述消息对应的标签类型,对所述消息进行优先级从高到低依次排序,并将排序后的消息向所述播放模块传输;
所述播放模块,用于对将排序后的所述消息转换为语音数据进行依次定时播放。
10.如权利要求9所述的系统,其特征在于,
所述播放模块,包括TTS单元、定时单元和播放单元;其中,
所述TTS单元,用于将接收的所述消息转换为所述语音数据;所述定时单元,用于用户设置播放所述消息的起止时间段;所述播放单元,用于播放所述消息;
所述播放单元,包括喇叭或者音响中的一种或多种;
或者
所述系统,还包括用户自助获取模块;所述用户自助获取模块,包括用户输入单元、存储单元和检索单元;其中,
所述用户输入单元,用于用户输入兴趣信息;所述存储单元,用于向所述优先级排序模块获取排序后的所述消息和所述消息对应的所述标签类型并进行存储;所述检索单元,用于根据用户输入的所述兴趣信息,通过在所述存储单元中检索与所述兴趣信息相匹配的消息,并向所述播放单元传输进行播放;
所述用户输入单元,包括语音输入子单元和语音识别子单元;其中,所述语音输入子单元,用于获取用户的语音信号,并向所述语音识别子单元传输;所述语音识别子单元,用于将所述语音信号转换为文本信息;
所述检索单元,包括特征名词提取子单元、特征名词比对子单元和过滤子单元;其中,所述特征名词提取子单元,用于提取所述兴趣信息中的特征名词,并向所述特征名词比对子单元传输;所述特征名词比对子单元,用于将所述特征名词与所述存储单元内的所述消息进行比对,并将所述消息中与所述特征名词相同的内容标注;所述过滤子单元,用于将所述存储单元中没有标注的消息进行过滤,获取过滤处理后的消息队列。
CN201910337143.4A 2019-04-25 2019-04-25 一种自动播放推送消息的方法及系统 Active CN110113635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910337143.4A CN110113635B (zh) 2019-04-25 2019-04-25 一种自动播放推送消息的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910337143.4A CN110113635B (zh) 2019-04-25 2019-04-25 一种自动播放推送消息的方法及系统

Publications (2)

Publication Number Publication Date
CN110113635A true CN110113635A (zh) 2019-08-09
CN110113635B CN110113635B (zh) 2021-05-25

Family

ID=67486565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910337143.4A Active CN110113635B (zh) 2019-04-25 2019-04-25 一种自动播放推送消息的方法及系统

Country Status (1)

Country Link
CN (1) CN110113635B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428077A (zh) * 2020-05-14 2020-07-17 湖南芒果听见科技有限公司 一种资讯信息处理的方法及其终端
CN111444377A (zh) * 2020-04-15 2020-07-24 厦门快商通科技股份有限公司 一种声纹识别的认证方法和装置以及设备
CN111581426A (zh) * 2020-04-30 2020-08-25 厦门快商通科技股份有限公司 一种音频指纹匹配方法和装置以及设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN106098056A (zh) * 2016-06-14 2016-11-09 腾讯科技(深圳)有限公司 一种语音新闻的处理方法、新闻服务器及系统
CN106412282A (zh) * 2016-09-26 2017-02-15 维沃移动通信有限公司 一种实时消息语音提示方法及移动终端
CN106776539A (zh) * 2016-11-09 2017-05-31 武汉泰迪智慧科技有限公司 一种多维度短文本特征提取方法及系统
WO2018103830A1 (en) * 2016-12-06 2018-06-14 Huawei Technologies Co., Ltd. A method and system for searchable encrypted cloud storage of media data
CN108809989A (zh) * 2018-06-14 2018-11-13 北京中油瑞飞信息技术有限责任公司 一种僵尸网络的检测方法及装置
CN109101648A (zh) * 2018-08-22 2018-12-28 歌尔科技有限公司 一种新闻播放方法和装置
CN109359240A (zh) * 2018-09-07 2019-02-19 陈包容 一种自动化搜索的方法
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109657137A (zh) * 2018-11-26 2019-04-19 平安科技(深圳)有限公司 舆情新闻分类模型构建方法、装置、计算机设备和存储介质
CN109670136A (zh) * 2018-12-29 2019-04-23 北京工业大学 一种基于多策略的微博信息优先采集方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN106098056A (zh) * 2016-06-14 2016-11-09 腾讯科技(深圳)有限公司 一种语音新闻的处理方法、新闻服务器及系统
CN106412282A (zh) * 2016-09-26 2017-02-15 维沃移动通信有限公司 一种实时消息语音提示方法及移动终端
CN106776539A (zh) * 2016-11-09 2017-05-31 武汉泰迪智慧科技有限公司 一种多维度短文本特征提取方法及系统
WO2018103830A1 (en) * 2016-12-06 2018-06-14 Huawei Technologies Co., Ltd. A method and system for searchable encrypted cloud storage of media data
CN108809989A (zh) * 2018-06-14 2018-11-13 北京中油瑞飞信息技术有限责任公司 一种僵尸网络的检测方法及装置
CN109101648A (zh) * 2018-08-22 2018-12-28 歌尔科技有限公司 一种新闻播放方法和装置
CN109359240A (zh) * 2018-09-07 2019-02-19 陈包容 一种自动化搜索的方法
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109657137A (zh) * 2018-11-26 2019-04-19 平安科技(深圳)有限公司 舆情新闻分类模型构建方法、装置、计算机设备和存储介质
CN109670136A (zh) * 2018-12-29 2019-04-23 北京工业大学 一种基于多策略的微博信息优先采集方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444377A (zh) * 2020-04-15 2020-07-24 厦门快商通科技股份有限公司 一种声纹识别的认证方法和装置以及设备
CN111581426A (zh) * 2020-04-30 2020-08-25 厦门快商通科技股份有限公司 一种音频指纹匹配方法和装置以及设备
CN111428077A (zh) * 2020-05-14 2020-07-17 湖南芒果听见科技有限公司 一种资讯信息处理的方法及其终端

Also Published As

Publication number Publication date
CN110113635B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN108566565B (zh) 弹幕展示方法及装置
Otheguy et al. Spanish in New York: Language contact, dialectal leveling, and structural continuity
CN110113635A (zh) 一种自动播放推送消息的方法及系统
WO2017132228A1 (en) Digital media content extraction natural language processing system
US10978077B1 (en) Knowledge point mark generation system and method thereof
CN110781668B (zh) 文本信息的类型识别方法及装置
CN109074345A (zh) 通过数字媒体内容提取自动生成和呈现课程
CN109949799B (zh) 一种语义解析方法及系统
CN106649849A (zh) 文本信息库建立方法和装置、以及搜索方法、装置和系统
CN113407842B (zh) 模型训练方法、主题推荐理由的获取方法及系统、电子设备
CN109657096A (zh) 一种基于低学龄教学音视频的辅助统计报告生成方法
CN110852071B (zh) 知识点检测方法、装置、设备及可读存储介质
CN114357022A (zh) 一种基于事件关系发现的媒体内容关联挖掘方法
Schmiedeke et al. Overview of mediaeval 2012 genre tagging task
CN111225235B (zh) 一种网络教学视频的播放方法
CN109543049B (zh) 一种针对写作特点自动推送素材的方法及系统
CN111932964A (zh) 一种在线直播教学方法
CN109002454B (zh) 一种确定目标单词的拼读分区的方法和电子设备
CN105868181A (zh) 基于新型神经网络的自然语言并列结构的自动识别方法
CN112507115B (zh) 一种弹幕文本中情感词的分类方法、装置及存储介质
Haubold Analysis and visualization of index words from audio transcripts of instructional videos
CN111508289B (zh) 基于字词使用频率的语言学习系统
CN113342953A (zh) 一种基于多模型集成的政务问答方法
CN113516984A (zh) 一种手语交互方法、系统、设备及存储介质
JP2019211796A (ja) 学習支援装置及び出題方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510000 Fourth Floor Unit of the First, Second and Third Floors on the Fifth West Side of Guangzhou Avenue South 1383, Haizhu District, Guangzhou City, Guangdong Province (Office only)

Applicant after: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

Address before: Room A, Unit 1902, 374 bis, Beijing Road, Yuexiu District, Guangzhou City, Guangdong Province, 510000

Applicant before: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant