CN105933413B - 一种基于用户声音交互的个性化实时内容推送系统 - Google Patents

一种基于用户声音交互的个性化实时内容推送系统 Download PDF

Info

Publication number
CN105933413B
CN105933413B CN201610250957.0A CN201610250957A CN105933413B CN 105933413 B CN105933413 B CN 105933413B CN 201610250957 A CN201610250957 A CN 201610250957A CN 105933413 B CN105933413 B CN 105933413B
Authority
CN
China
Prior art keywords
content
user
real time
service module
push service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610250957.0A
Other languages
English (en)
Other versions
CN105933413A (zh
Inventor
犹杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHUHAI YUNMAI NETWORK TECHNOLOGY Co.,Ltd.
Original Assignee
Shenzhen Great Number Of Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Great Number Of Technology Co Ltd filed Critical Shenzhen Great Number Of Technology Co Ltd
Priority to CN201610250957.0A priority Critical patent/CN105933413B/zh
Publication of CN105933413A publication Critical patent/CN105933413A/zh
Application granted granted Critical
Publication of CN105933413B publication Critical patent/CN105933413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于用户声音交互的个性化实时内容推送系统,其包括后台服务系统,其包括实时内容推送服务模块、声音合成服务模块、声纹识别服务模块、用户数据库、内容源、内容过滤器和用户偏好计算模块;一用户终端应用,用以和后台服务系统对接,用户终端应用将用户相关特征信息实时传输给内容推动服务模块,内容推送服务模块实时地将用户的当前特征信息存入用户数据库,同时将这些实时特征信息传给内容过滤器,内容过滤器根据从内容推送服务模块传来的当前用户特征信息,从用户偏好计算模块获取用户偏好信息,作为内容过滤的参数,对内容源中的内容进行查询过滤,交互式的交流实现了用户个性化、场景化的需求和内容过滤、匹配和实时推送。

Description

一种基于用户声音交互的个性化实时内容推送系统
技术领域
本发明涉及一种基于用户声音交互的个性化实时内容推送系统。
背景技术
目前从计算机诞生到互联网的崛起,再到移动互联网的昌盛,都离不开数字内容及其技术的发展。从本地文件到Web网页,再到在线音视频、微博微信等新兴媒体的广泛流行,这些不仅包含了多媒体编解码技术、多媒体通信技术的发展还包含了内容分发技术、人机交互技术与互联网大规模应用系统技术的高度发展。当今最流行的媒体平台,无论是Google、Facebook还是微博、微信,都将上述技术发展和应用到了极致。
随着人工智能技术的发展,语音识别和语音合成等技术也得到了快速的发展和广泛的应用。语音合成将文字转化为语音,被广泛应用在教育、客户服务、语音导航等领域;而声纹识别随着其识别度和准确率的逐步提高,与指纹识别、人脸识别一道被广泛应用到安防、信息采集等领域。
可如何设计一个交互简单而自然、满足用户个性化需求和场景化需求的内容过滤、匹配和实时推送应用系统,帮助用户在信息大爆炸的时代更加精准而简单地获取有用内容,已经成为急需解决的问题,也为物联网设备提供内容的分发机制。
发明内容
本发明的目的在于克服现有技术之缺陷,提供了一种基于用户声音交互的个性化实时内容推送系统,其具有交互式,个性化的特性。
本发明是这样实现的:一种基于用户声音交互的个性化实时内容推送系统,其包括:
一后台服务系统,其包括实时内容推送服务模块、声音合成服务模块、声纹识别服务模块、用户数据库、内容源、内容过滤器和用户偏好计算模块;
一用户终端应用,用以和实时内容推送服务模块、声音合成服务模块、声纹识别服务模块通过双向数据通道对接,用户终端应用将用户相关特征信息实时传输给内容推动服务模块,内容推送服务模块实时地将用户的当前特征信息存入用户数据库,同时将这些实时特征信息传给内容过滤器,内容过滤器根据从内容推送服务模块传来的当前用户特征信息,从用户偏好计算模块获取用户偏好信息,作为内容过滤的参数,对内容源中的内容进行查询过滤,若能匹配到内容,则将内容封装成包含相应内容属性的数据结构返回给实时内容推送服务模块模块,实时内容推送服务模块将内容数据实时推送给用户终端应用。
进一步地,当用户通过用户终端应用提交语音内容时,用户终端应用先将语音内容记录为一段音频文件,提交给声纹识别服务模块,并返回一个用户身份唯一标识UID,用户终端应用将用户身份唯一标识UID实时发送给实时内容推送服务用户,并维持会话标识SID与用户身份标识UID的对应关系,直到双向数据通道的会话连接断开,或另外一个用户对用户终端应用说话并将与之对应的新的用户身份标识提交给实时内容推送服务模块。
进一步地,当实时内容推送服务模块将内容数据推送给用户终端应用时,若内容数据中只包含内容生成的时间信息和内容文本,则用户终端应用将时间信息和内容文本数据提交给声音合成服务模块,并将声音合成服务模块返回的音频数据进行播放。
进一步地,用户偏好计算模块为一个离/在线计算模块,定时读取用户数据库,以用户历史特征数据和最新的特征数据为输入参数,为每个用户计算出最新的偏好模型参数f(UID,X),f为一个算子,具体算法根据系统选取的机器学习算法不同而变化,UID为用户的身份唯一标识,X为用户当前场景特征信息矢量。
进一步地,实时内容推送服务模块所推送的内容都为主动式呈现,且以文本、音频的形式呈现给用户终端应用。
进一步地,实时内容推送服务模块所推送的每条内容至少包含两个属性,内容生成的时间、内容文本。
进一步地,实时内容推送服务模块所推送的每条内容还包括内容音频的资源地址URL。
本发明用户终端应用将用户相关特征信息实时传输给内容推动服务模块,内容推送服务模块实时地将用户的当前特征信息存入用户数据库,同时将这些实时特征信息传给内容过滤器,内容过滤器根据从内容推送服务模块传来的当前用户特征信息,从用户偏好计算模块获取用户偏好信息,作为内容过滤的参数,对内容源中的内容进行查询过滤,若能匹配到内容,则将内容封装成包含相应内容属性的数据结构返回给实时内容推送服务模块模块,实时内容推送服务模块将内容数据实时推送给用户终端应用,这种交互式的系统,实现了用户个性化的需求,场景化的需求和内容过滤、匹配和实时推送。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所涉及用户终端应用主界面的一种情况;
图2为本发明所涉及用户终端应用主界面的另一种情况;
图3为本发明所涉及用户终端应用主界面的第三种情况;
图4为本发明实施例提供的系统结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4,本发明实施例提供一种基于用户声音交互的个性化实时内容推送系统,其包括后台服务系统和用户终端应用。
一后台服务系统,其包括实时内容推送服务模块、声音合成服务模块、声纹识别服务模块、用户数据库、内容源、内容过滤器和用户偏好计算模块。
一用户终端应用,用以和实时内容推送服务模块、声音合成服务模块、声纹识别服务模块通过双向数据通道对接,用户终端应用将用户相关特征信息实时传输给内容推动服务模块(通过接口A),内容推送服务模块实时地将用户的当前特征信息存入用户数据库(通过接口D),同时将这些实时特征信息传给内容过滤器(通过接口E),内容过滤器根据从内容推送服务模块传来的当前用户特征信息,从用户偏好计算模块获取用户偏好信息(通过接口G),作为内容过滤的参数,对内容源中的内容进行查询过滤,若能匹配到内容,则将内容封装成包含相应内容属性的数据结构返回给实时内容推送服务模块模块(通过接口E),实时内容推送服务模块将内容数据实时推送给用户终端应用(通过接口A)。
当用户通过用户终端应用提交语音内容时,用户终端应用先将语音内容记录为一段音频文件,提交给声纹识别服务模块(通过接口C),并返回一个用户身份唯一标识UID,用户终端应用将用户身份唯一标识UID实时发送给实时内容推送服务用户(通过接口A),并维持会话标识SID与用户身份标识UID的对应关系,直到双向数据通道的会话连接断开,或另外一个用户对用户终端应用说话并将与之对应的新的用户身份标识提交给实时内容推送服务模块。
当实时内容推送服务模块将内容数据推送给用户终端应用时,若内容数据中只包含内容生成的时间信息和内容文本,则用户终端应用将时间信息和内容文本数据提交给声音合成服务模块(通过接口B),并将声音合成服务模块返回的音频数据进行播放。
用户偏好计算模块为一个离/在线计算模块,定时读取用户数据库,以用户历史特征数据和最新的特征数据为输入参数,为每个用户计算出最新的偏好模型参数f(UID,X),f为一个算子,具体算法根据系统选取的机器学习算法不同而变化,UID为用户的身份唯一标识,X为用户当前场景特征信息矢量。
实时内容推送服务模块所推送的内容都为主动式呈现,且以文本、音频的形式呈现给用户终端应用,实时内容推送服务模块所推送的每条内容至少包含两个属性,内容生成的时间、内容文本,实时内容推送服务模块所推送的每条内容还包括内容音频的资源地址URL。
通过对用户声纹识别获得用户登录信息,通过用户终端应用与后台服务系统实时连接来收集用户场景化信息,并基于用户登录信息和场景信息为用户匹配和实时推送符合其偏好的、符合当前场景的内容,一种简单而自然的方式实现用户的登录与认证,并将内容通过声音合成的方式实时播报给用户,让用户获取内容更加方便而及时;另一方面,通过在用户终端应用(客户端)与服务端(后台服务系统)建立的实时推送通道,让双方实现即时的信息交互,服务端根据用户的实时信息为其匹配应时应景的内容,并即时推送给用户,设计简洁,让人机交互简单而自然,便于和适合在简单的物联设备中实现应用,让用户很自然地实现身份认证与登录,实时记录用户场景信息,通过机器学习为用户或用户终端构建内容偏好模型,在用户使用得越多的情况下越了解用户,能够更加精准地为用户推荐应景内容,在信息大爆炸的年代,有效帮助用户过滤掉无用或无关信息。并且,所有内容都是即时推送给用户终端的,保证了内容的及时性。
该应用系统除了帮助用户有效、即时、精准推送内容外,还为广大的物联网设备提供了一种应用方式和服务,也为内容商增加了更加广阔的发行渠道,有利于促进更多有创意、高质量内容的创作与发布,丰富了互联网内容服务的同时也丰富了人们的生活。
本发明所涉及的用户交互与内容推送终端应用的形式包括运行在各种操作系统上的应用软件App,或基于各种浏览器呈现的HTML5应用,其中所运行的应用软件操作系统包括但不限于Android、iOS、Windows、Linux等,而应用所运行的用户终端设备包括但不限于手机、平板电脑、PC机、电视机、智能手表和其他物联网设备等,推送的内容会以语音的形式自动播报给用户,同时以文本消息的形式显示在终端应用界面上。用户可以通过点击界面上的声音切换按钮来开启或关闭声音模式。用户可以通过长按声音切换按钮来进行语音输入,实现对应用的控制,控制包括但不限于开启/关闭语音模式、设置语音开启/关闭时间、开启/关闭内容自动推送、切换内容主题、选择服务等;同时,长按声音切换键也是用户向服务端发送内容,和实现用户登录和在线识别的接口,用户通过本发明所涉及终端应用界面的内容消息呈现界面的呈现形式包括但不限于矩形、圆形、椭圆等任意形状,而每条内容消息都伴随着该内容生成的时间(如第一次被发布的时间),而时间的呈现形式与具体的软件界面设计有关。而声音切换按钮的形状以及长按时出现交互提示也不限于本发明所提供的界面示例包含的样式,由具体的软件实现而定,本发明不作限制。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于用户声音交互的个性化实时内容推送系统,其特征在于,包括:
一后台服务系统,其包括实时内容推送服务模块、声音合成服务模块、声纹识别服务模块、用户数据库、内容源、内容过滤器和用户偏好计算模块;
一用户终端应用,用以和实时内容推送服务模块、声音合成服务模块、声纹识别服务模块通过双向数据通道对接,用户终端应用将用户相关特征信息实时传输给内容推送服务模块,内容推送服务模块实时地将用户的当前特征信息存入用户数据库,同时将这些实时特征信息传给内容过滤器,内容过滤器根据从内容推送服务模块传来的当前用户特征信息,从用户偏好计算模块获取用户偏好信息,作为内容过滤的参数,对内容源中的内容进行查询过滤,若能匹配到内容,则将内容封装成包含相应内容属性的数据结构返回给实时内容推送服务模块,实时内容推送服务模块将内容数据实时推送给用户终端应用;
当用户通过用户终端应用提交语音内容时,用户终端应用先将语音内容记录为一段音频文件,提交给声纹识别服务模块,并返回一个用户身份唯一标识UID,用户终端应用将用户身份唯一标识UID实时发送给实时内容推送服务模块,并维持会话标识SID与用户身份标识UID的对应关系,直到双向数据通道的会话连接断开,或另外一个用户对用户终端应用说话并将与之对应的新的用户身份标识提交给实时内容推送服务模块。
2.如权利要求1所述的一种基于用户声音交互的个性化实时内容推送系统,其特征在于:当实时内容推送服务模块将内容数据推送给用户终端应用时,若内容数据中只包含内容生成的时间信息和内容文本,则用户终端应用将时间信息和内容文本数据提交给声音合成服务模块,并将声音合成服务模块返回的音频数据进行播放。
3.如权利要求1所述的一种基于用户声音交互的个性化实时内容推送系统,其特征在于:用户偏好计算模块为一个离/在线计算模块,定时读取用户数据库,以用户历史特征数据和最新的特征数据为输入参数,为每个用户计算出最新的偏好模型参数f(UID,X),f为一个算子,具体算法根据系统选取的机器学习算法不同而变化,UID为用户的身份唯一标识,X为用户当前场景特征信息矢量。
4.如权利要求1所述的一种基于用户声音交互的个性化实时内容推送系统,其特征在于:实时内容推送服务模块所推送的内容都为主动式呈现,且以文本、音频的形式呈现给用户终端应用。
5.如权利要求4所述的一种基于用户声音交互的个性化实时内容推送系统,其特征在于:实时内容推送服务模块所推送的每条内容至少包含两个属性,内容生成的时间、内容文本。
6.如权利要求5所述的一种基于用户声音交互的个性化实时内容推送系统,其特征在于:实时内容推送服务模块所推送的每条内容还包括内容音频的资源地址URL。
CN201610250957.0A 2016-04-21 2016-04-21 一种基于用户声音交互的个性化实时内容推送系统 Active CN105933413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610250957.0A CN105933413B (zh) 2016-04-21 2016-04-21 一种基于用户声音交互的个性化实时内容推送系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610250957.0A CN105933413B (zh) 2016-04-21 2016-04-21 一种基于用户声音交互的个性化实时内容推送系统

Publications (2)

Publication Number Publication Date
CN105933413A CN105933413A (zh) 2016-09-07
CN105933413B true CN105933413B (zh) 2019-01-11

Family

ID=56839852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610250957.0A Active CN105933413B (zh) 2016-04-21 2016-04-21 一种基于用户声音交互的个性化实时内容推送系统

Country Status (1)

Country Link
CN (1) CN105933413B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886955B (zh) * 2016-09-29 2021-10-26 百度在线网络技术(北京)有限公司 一种语音会话样本的身份识别方法、装置及设备
CN107395777B (zh) * 2017-09-14 2020-10-23 广州华多网络科技有限公司 一种信息推送的方法、服务器
CN107623614B (zh) 2017-09-19 2020-12-08 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108960934A (zh) * 2018-07-19 2018-12-07 苏州思必驰信息科技有限公司 语音对话过程中的信息推荐方法及系统
CN111225005B (zh) * 2018-11-23 2023-01-31 北京嘀嘀无限科技发展有限公司 推送内容生成方法、装置、电子设备及计算机存储介质
CN109410913B (zh) * 2018-12-13 2022-08-05 百度在线网络技术(北京)有限公司 一种语音合成方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2336905A1 (en) * 2008-08-26 2011-06-22 Huawei Technologies Co., Ltd. A searching method and system
CN102546777A (zh) * 2011-12-27 2012-07-04 广东宇天科技有限公司 移动终端桌面信息推送系统及其方法
CN102567355A (zh) * 2010-12-22 2012-07-11 北京凯思昊鹏软件工程技术有限公司 针对特定用户推送特定内容的方法
CN105243143A (zh) * 2015-10-14 2016-01-13 湖南大学 基于即时语音内容检测的推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2336905A1 (en) * 2008-08-26 2011-06-22 Huawei Technologies Co., Ltd. A searching method and system
CN102567355A (zh) * 2010-12-22 2012-07-11 北京凯思昊鹏软件工程技术有限公司 针对特定用户推送特定内容的方法
CN102546777A (zh) * 2011-12-27 2012-07-04 广东宇天科技有限公司 移动终端桌面信息推送系统及其方法
CN105243143A (zh) * 2015-10-14 2016-01-13 湖南大学 基于即时语音内容检测的推荐方法及系统

Also Published As

Publication number Publication date
CN105933413A (zh) 2016-09-07

Similar Documents

Publication Publication Date Title
CN105933413B (zh) 一种基于用户声音交互的个性化实时内容推送系统
US11792485B2 (en) Systems and methods for annotating video media with shared, time-synchronized, personal reactions
US11720949B2 (en) Method and device for recommending gift and mobile terminal
WO2022121601A1 (zh) 一种直播互动方法、装置、设备及介质
CN102771082B (zh) 具有混合能力的设备和接口之间的通信会话
US11172006B1 (en) Customizable remote interactive platform
US20140351720A1 (en) Method, user terminal and server for information exchange in communications
CN113014732B (zh) 会议记录处理方法、装置、计算机设备和存储介质
EP4099709A1 (en) Data processing method and apparatus, device, and readable storage medium
US20120030232A1 (en) System and method for communicating tags for a media event using multiple media types
CN107294837A (zh) 采用虚拟机器人进行对话交互的方法和系统
CN105554027A (zh) 资源分享方法和装置
CN108847214A (zh) 语音处理方法、客户端、装置、终端、服务器和存储介质
CN104035953B (zh) 用于跨不同装置的无缝内容导航的方法和系统
CN105956009B (zh) 一种实时应景内容匹配与推送的方法
US11558440B1 (en) Simulate live video presentation in a recorded video
CN110198477A (zh) 一种线下弹幕的交互方法、弹幕服务端及交互系统
Lemmon Telematic Music vs. Networked Music: Distinguishing Between Cybernetic Aspirations and Technological Music-Making
US11700426B2 (en) Virtual platform for recording and displaying responses and reactions to audiovisual contents
KR101198091B1 (ko) 학습 콘텐츠 서비스 제공 방법 및 시스템
US20190288973A1 (en) Augmented expression sticker control and management
CN110149528A (zh) 一种过程录制方法、装置、系统、电子设备、及存储介质
Cao When Documentaries Meet New Media: Interactive Documentary Projects in China and the West
CN103491087B (zh) 一种多媒体消息的处理方法和装置
CN109889434A (zh) 基于动态视频海报的社交方法、系统、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Applicant after: Shenzhen great number of Technology Co., Ltd.

Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Applicant before: SHENZHEN QIANHAI DASHUDIAN TECHNOLOGY CO., LTD.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200414

Address after: 519000 Guangdong city of Zhuhai province Hengqin Baohua Road No. 6, room 105 -19744

Patentee after: ZHUHAI YUNMAI NETWORK TECHNOLOGY Co.,Ltd.

Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A (located in Shenzhen Qianhai business secretary Co. Ltd.)

Patentee before: Shenzhen great number of Technology Co.,Ltd.

TR01 Transfer of patent right