CN108366302A - Tts播报指令优化方法、智能电视、系统及存储装置 - Google Patents

Tts播报指令优化方法、智能电视、系统及存储装置 Download PDF

Info

Publication number
CN108366302A
CN108366302A CN201810117510.5A CN201810117510A CN108366302A CN 108366302 A CN108366302 A CN 108366302A CN 201810117510 A CN201810117510 A CN 201810117510A CN 108366302 A CN108366302 A CN 108366302A
Authority
CN
China
Prior art keywords
account
audio
smart television
tts
family
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810117510.5A
Other languages
English (en)
Other versions
CN108366302B (zh
Inventor
曾旻枢
黄海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Skyworth Display Technology Co ltd
Original Assignee
Co Ltd Of Information Technology Research Institute Of Nanjing Skyworth
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Co Ltd Of Information Technology Research Institute Of Nanjing Skyworth filed Critical Co Ltd Of Information Technology Research Institute Of Nanjing Skyworth
Priority to CN201810117510.5A priority Critical patent/CN108366302B/zh
Publication of CN108366302A publication Critical patent/CN108366302A/zh
Application granted granted Critical
Publication of CN108366302B publication Critical patent/CN108366302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4751End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user accounts, e.g. accounts for children

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种TTS播报指令优化方法、智能电视、系统及存储装置,所述方法包括:素材运营服务器为不同的用户提供符合用户兴趣爱好的TTS播报指令;账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息;智能电视客户端向账号服务器申请创建家庭账号,生成TTS播报指令并保存在账号服务器中;智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析;智能电视客户端记录并向素材运营服务器上传音频信息,优化TTS播报指令。本发明通过优化TTS播报指令的内容,为每一位家庭成员推送适合其人群特点的个性化TTS播报指令,让不同的人都能听到自己想要的个性化TTS播报指令。

Description

TTS播报指令优化方法、智能电视、系统及存储装置
技术领域
本发明涉及智能电视应用技术领域,尤其涉及一种TTS播报指令优化方法、智能电视、系统及存储装置。
背景技术
TTS(Text To Speech, 文本转语音) 语音播报是指将文本内容转换为音频内容并播放出来的技术,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流, TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页转换成自然语音输出,被广泛用于帮助视力障碍人士进行阅读或者不适合通过视觉获取信息的场景, TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。
智能电视作为家庭休闲娱乐休闲中心,随着AI(Artificial Intelligence,人工智能)的逐渐普及,作为电视端AI接入端口的语音系统也变得越来越重要,而TTS播报指令更加是语音系统中作为用户体验最重要的方面之一,但是不同的人听到的TTS的播报内容都一样,无法很好的抓住不同人群用户,导致用户流失,向手机转移。
现有的TSS播报指令只是解决了语音系统对于用户语音反馈的基本需求,不能精确的采集用户的年龄和性别等特征信息,不能很好的解决家庭各成员之间不同的需求。现有的一些基于音频识别技术的TTS播报指令方案只是基于设定的一些兴趣点和内容标签进行生硬的一些匹配,不能根据用户在真正使用过程中的行为特性进行进一步的学习优化。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种TTS播报指令优化方法、智能电视、系统及存储装置,旨在通过优化TTS播报指令的内容,为每一位家庭成员推送适合其人群特点的个性化TTS播报指令,让不同的人都能听到自己想要的个性化TTS播报指令。
本发明解决技术问题所采用的技术方案如下:
一种TTS播报指令优化方法,应用于智能电视,其中,所述TTS播报指令优化方法包括:
素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令;
账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器;
智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中;
智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令;
智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令。
所述的TTS播报指令优化方法,其中,所述素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令具体包括:
素材运营服务器提供TTS素材创建、编辑人群分类及兴趣点模型页面,根据用户的年龄和性别特征将人群划分成若干类,并为每一类人群选择符合其特征的TTS素材;
素材运营服务器提供上传和编辑模块运营内容页面,并上传TTS素材,选择所属模块和对应的标签,并发布到运营内容数据库;
素材运营服务器接收智能电视客户端发送的用户音频数据,并进行模型训练,生成TTS播报指令素材并保存在用户音频数据库中;
素材运营服务器定期对用户音频数据进行统计分析,更新人群分类和兴趣点模型,更新对应的标签,用于向智能电视客户端推送TTS播报指令。
所述的TTS播报指令优化方法,其中,所述账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器具体包括:
通过智能电视客户端向账号服务器申请创建家庭账号,账号服务器审核通过之后创建家庭账号,并通知智能电视客户端家庭账号创建成功;
智能电视客户端登录家庭账号之后,选择家庭角色成员并为其录入音频数据信息,将音频数据信息以及音频的属性信息上传到账号服务器中;
账号服务器在家庭账号下为其保存家庭角色成员的子账号,并保存相应的音频数据以及TTS属性信息;
账号服务器将收集到的家庭账号的音频数据传输到素材服务器中。
所述的TTS播报指令优化方法,其中,所述智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中具体包括:
通过智能电视客户端的注册界面向账号服务器申请创建家庭账号;
智能电视客户端登录家庭账号之后,选择家庭角色成员,通过遥控器采集音频数据信息,进行音频检测和属性分析;
将音频数据以及TTS属性信息上传到账号服务器,创建子账号并保存对应的数据;
根据对应的数据进行模型训练,产生TTS播报指令并保存在账号服务器中。
所述的TTS播报指令优化方法,其中,所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令具体包括:
智能电视客户端开启音频登录界面,通过遥控器采集音频信息;
智能电视客户端对采集的音频信息进行属性分析,并向账号服务器验证成员是否为家庭账号下的某一个家庭角色成员;
如果成员已经录入过音频数据信息,则切换为成员的子账号,并通知素材运营服务器返回相关TTS播报指令。
所述的TTS播报指令优化方法,其中,所述智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令具体包括:
当智能电视客户端的音频登录成功之后,智能电视客户端记录并向素材运营服务器上传用户的音频数据;
当素材运营服务器进行数据统计分析之后,优化和更新人群分类和兴趣点模块,并优化TTS播报指令。
所述的TTS播报指令优化方法,其中,所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令还包括:
素材运营服务器将家庭账号切换为成员账号时,根据子账号信息判断成员角色所属的人群类别,提取所属人群类别的TTS播报指令的兴趣点,匹配相对应的TTS播报指令素材,并向智能电视客户端推送;
所述子账号信息包括:角色昵称、性别、年龄以及音频数据。
一种智能电视,其中,所述智能电视包括:处理器、存储器和通信总线;
所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如上所述的TTS播报指令优化方法中的步骤。
一种计算机可读存储介质,其中,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的TTS播报指令优化方法的步骤。
一种TTS播报指令优化系统,其中,包括素材运营服务器和账号服务器,所述TTS播报指令优化系统还包括如上所述的智能电视;所述智能电视包括一用于进行指令播报的智能电视客户端;
所述素材运营服务器根据不同人群的用户使用行为数据,提供符合用户兴趣爱好的TTS播报指令;
所述账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到所述素材运营服务器;
所述智能电视客户端向所述账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在所述账号服务器中;
所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知所述素材运营服务器返回相关TTS播报指令;
所述智能电视客户端记录并向所述素材运营服务器上传音频信息,所述素材运营服务器进行数据统计分析之后,优化TTS播报指令。
本发明提供的一种TTS播报指令优化方法、智能电视、系统及存储装置,所述方法包括:素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令;账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器;智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中;智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令;智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令。本发明通过优化TTS播报指令的内容,使之更加符合不同人群的兴趣爱好,在家庭账号下,录入不同家庭角色成员音频数据信息,为每一位家庭成员推送适合其人群特点的个性化TTS播报指令,真正做到让TTS播报更加符合用户的期望,让不同的人都能听到自己想要的个性化TTS播报指令。
附图说明
图1是本发明TTS播报指令优化方法的较佳实施例的流程图;
图2是本发明TTS播报指令优化方法的较佳实施例中步骤S10的流程图;
图3是本发明TTS播报指令优化方法的较佳实施例中步骤S20的流程图;
图4是本发明TTS播报指令优化方法的较佳实施例中步骤S30的流程图;
图5是本发明TTS播报指令优化方法的较佳实施例中步骤S40的流程图;
图6是本发明TTS播报指令优化方法的较佳实施例中步骤S50的流程图;
图7为本发明智能电视的较佳实施例的运行环境示意图;
图8为本发明TTS播报指令优化程序模块化的较佳实施例的功能模块图;
图9为本发明TTS播报指令优化系统的较佳实施例的功能原理框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的TTS播报指令优化方法,如图1所示,一种TTS播报指令优化方法,其中,所述TTS播报指令优化方法包括以下步骤:
步骤S10、素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令。
具体地,所述素材运营服务器用于初始化人群分类和兴趣点模型,并根据后期大量的用户使用行为数据,不断的更新调整,管理各种不同人群的个性化TTS播报定制,为不同人群的用户提供符合其兴趣爱好的个性化TTS播报指令。
所述素材运营服务器提供TTS素材创建及编辑人群分类和兴趣点模型页面,后台管理人员根据先验知识根据人的年龄和性别特征将人群划分成若干类,并为每一类人群选择符合其特征的个性化TTS。所述素材运营服务器提供上传和编辑模块运营内容页面,后台管理人员上传的行的个性化TTS素材,选择所属模块和对应的标签,并发布到真实的运营内容数据库。所述素材运营服务器接收智能电视客户端发送的用户音频数据,并进行个性化模型训练,产生个性化TTS播报指令素材,并保存在用户音频数据库中。所述素材运营服务器定期对大量的用户音频数据进行统计分析,不断地更新人群分类和兴趣点模型,更新不同人群的分类,更新对应的标签,用于向智能电视客户端推送更加精准的个性化TTS播报指令。
具体过程请参阅图2,其为本发明提供的TTS播报指令优化方法中步骤S10的流程图。
如图2所示,所述步骤S10包括:
S11、素材运营服务器提供TTS素材创建、编辑人群分类及兴趣点模型页面,根据用户的年龄和性别特征将人群划分成若干类,并为每一类人群选择符合其特征的TTS素材;
S12、素材运营服务器提供上传和编辑模块运营内容页面,并上传TTS素材,选择所属模块和对应的标签,并发布到运营内容数据库;
S13、素材运营服务器接收智能电视客户端发送的用户音频数据,并进行模型训练,生成TTS播报指令素材并保存在用户音频数据库中;
S14、素材运营服务器定期对用户音频数据进行统计分析,更新人群分类和兴趣点模型,更新对应的标签,用于向智能电视客户端推送TTS播报指令。
步骤S20、账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器。
具体地,所述账号服务器用于创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换。
用户通过所述智能电视客户端向所述账号服务器申请创建家庭账号,所述账号服务器审核通过之后,为其创建家庭账号A,并通知所述智能电视客户端家庭账号创建成功。所述智能电视客户端登录家庭账号之后,选择家庭角色成员并为其录入音频数据信息,将音频数据信息以及音频的属性信息,一并上传到所述账号服务器中,所述账号服务器会在家庭账号A下为其保存该家庭角色成员的子账号A-X,并保存下相应的音频数据以及TTS属性信息。所述账号服务器对收集到的家庭账号音频数据将其传输到所述素材运营服务器中。
具体过程请参阅图3,其为本发明提供的TTS播报指令优化方法中步骤S20的流程图。
如图3所示,所述步骤S20包括:
S21、通过智能电视客户端向账号服务器申请创建家庭账号,账号服务器审核通过之后创建家庭账号,并通知智能电视客户端家庭账号创建成功;
S22、智能电视客户端登录家庭账号之后,选择家庭角色成员并为其录入音频数据信息,将音频数据信息以及音频的属性信息上传到账号服务器中;
S23、账号服务器在家庭账号下为其保存家庭角色成员的子账号,并保存相应的音频数据以及TTS属性信息;
S24、账号服务器将收集到的家庭账号的音频数据传输到素材服务器中。
步骤S30、智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中。
具体地,所述智能电视客户端增加家庭账号创建以及家庭成员角色音频数据录入。用户通过所述智能电视客户端的注册界面向所述账号服务器申请创建家庭账号,登录家庭账号之后,选择家庭角色成员,通过遥控器采集音频数据信息,进行音频检测和属性分析,并将音频数据以及TTS属性信息一并上传到所述账号服务器,用于创建子账号并保存对应的数据,同时对对应的数据进行个性化模型训练,产生个性化TTS播报指令素材,并保存在所述账号服务器中。
具体过程请参阅图4,其为本发明提供的TTS播报指令优化方法中步骤S30的流程图。
如图4所示,所述步骤S30包括:
S31、通过智能电视客户端的注册界面向账号服务器申请创建家庭账号;
S32、智能电视客户端登录家庭账号之后,选择家庭角色成员,通过遥控器采集音频数据信息,进行音频检测和属性分析;
S33、将音频数据以及TTS属性信息上传到账号服务器,创建子账号并保存对应的数据;
S34、根据对应的数据进行模型训练,产生TTS播报指令并保存在账号服务器中。
步骤S40、智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令。
具体地,用户通过所述智能电视客户端的音频界面进行登录,通过遥控器采集音频信息,对采集的音频信息进行属性分析,并向所述账号服务器验证是否是该家庭账号下的某一个家庭角色成员,如果该成员已经录入过音频数据信息,则切换该成员的子账号,并通知所述素材运营服务器返回相关个性化TTS播报指令素材。
具体过程请参阅图5,其为本发明提供的TTS播报指令优化方法中步骤S40的流程图。
如图5所示,所述步骤S40包括:
S41、智能电视客户端开启音频登录界面,通过遥控器采集音频信息;
S42、智能电视客户端对采集的音频信息进行属性分析,并向账号服务器验证成员是否为家庭账号下的某一个家庭角色成员;
S43、如果成员已经录入过音频数据信息,则切换为成员的子账号,并通知素材运营服务器返回相关TTS播报指令。
步骤S50、智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令。
具体地,当用户通过所述智能电视客户端的音频登录成功之后,所述智能电视客户端会记录并向所述素材运营服务器上传用户的音频数据,用于所述素材运营服务器对大量数据统计分析之后,不断优化更新人群分类和兴趣点模块,并优化个性化TTS播报指令。
具体过程请参阅图6,其为本发明提供的TTS播报指令优化方法中步骤S50的流程图。
如图6所示,所述步骤S50包括:
S51、当智能电视客户端的音频登录成功之后,智能电视客户端记录并向素材运营服务器上传用户的音频数据;
S52、当素材运营服务器进行数据统计分析之后,优化和更新人群分类和兴趣点模块,并优化TTS播报指令。
具体实施方式(举例)如下:
S1:在素材运营服务器管理后台上,根据先验知识初始化人群分类和兴趣点模型,把人群按照性别和年龄划分成多个类别,为每个人群选择预设的个性化TTS素材兴趣点,后面会随着用户的不断操作对大量用户音频数据分析和统计进行模型更新。
S2:素材运营服务器管理TTS素材资源,选择所属模块以及对应标签,并正式发布到素材运营服务器。
S3:智能电视客户端向账号服务器申请创建家庭账号A(这里以A代表家庭账号,A-X代表家庭账号A下的某一个子账号)。
S4:智能电视客户端登录家庭账号A,选择系统预制的每一个家庭成员(爸爸、妈妈、儿子、女儿、男主人、女主人等,也可以新增加其他角色成员)录入对应的音频信息,提取音频的属性,在账号服务器的A账号下,储存对应的子账号信息,包括音频数据、性别、年龄等。
S5:打开智能电视的音频登录界面,按下遥控器采集用户音频数据,向账号服务器验证是否是家庭账号A下的某一个家庭成员子账号,如果是,通知客户端切换到当前子账号A-X下,同时通知素材运营服务器准备个性化TTS播报指令素材。
S6:素材运营服务器收到家庭账号A下切换了成员账号A-X时,根据子账号信息,包括角色昵称、性别、年龄和音频数据,判断该角色所属的人群类别,提取该人群的个性化TTS播报指令兴趣点,匹配相对应的个性化TTS播报指令素材,并向智能电视客户端推送。
S7:智能电视客户端接收到素材运营服务器推送的个性化TTS素材资源后,开始返回个性化TTS播报指令。
S8:智能电视客户端向素材运营服务器发送用户的音频数据,包括常用语、常用语音操作等。
S9:素材运营服务器根据智能电视客户端发过来的音频数据将其存入用户数据库,进行个性化TTS播报模型训练,后台人群分类和兴趣点模型系统对数据库的海量数据进行统计分析,自动更新人群分类和兴趣点模型,用来向不同的用户推送更加适合他们的个性化TTS播报指令。
有益效果如下:
1、从最初的老套僵硬的TTS播报指令,变为个性化定制播报指令,将智能电视转变为更加个人的智能设备,每一个家庭成员都可以拥有自己独立的个性化TTS播报指令;该TTS素材在通过素材运营服务器对用户音频数据进行分析之后进行精准推送,能更有效的在第一时间抓住用户的注意力以及兴趣,提高用户体验和对语音系统的兴趣。
2、解决了冷启动问题,通过了先验数据初始化的人群分类和TTS兴趣点模型,以及通过后期对大量用户音频数据进行统计分析后,不断对个性化TTS模型进行优化和更新,能很好的解决新用户的冷启动问题,新注册的用户只需要通过音频验证登录后,就可以听到为自己音频定制的个性化TTS播报指令了。
3、统计分析用户的常用音频信息,不断的更新人群分类和TTS兴趣点模型,根据先验数据初始化的个性化TTS播报指令,一定程度会有局限性和管理人员主观性而影响模型的准确性,通过个性化TTS播报指令模型训练,不断对模型进行优化和更新,使模型更具备动态可调性,最终做到对每一个用户推送不同的个性化TTS播报指令。
综合以上三点,本发明的基于音频识别以及用户常用音频数据统计分析的个性化TTS播报指令,利用音频识别技术解决了传统语音系统老套僵硬的TTS播报给用户带来的生疏感和厌倦感,可以更加有效的统计分析不同人群的音频信息数据,不断的更新人群分类和个性化TTS兴趣点模型,是一种有效精准的个性化TTS播报指令记忆方法。
如图7所示,基于上述TTS播报指令优化方法,本发明还相应提供了一种智能电视,所述智能电视包括处理器10、存储器20及显示器30。图7仅示出了智能电视的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述智能电视的内部存储单元,例如智能电视的硬盘或内存。所述存储器20在另一些实施例中也可以是所述智能电视的外部存储设备,例如所述智能电视上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所智能电视的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述智能电视的应用软件及各类数据,例如所述安装智能电视的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有TTS播报指令优化程序40,该TTS播报指令优化程序40可被处理器10所执行,从而实现本申请中TTS播报指令优化方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述TTS播报指令优化方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述智能电视的信息以及用于显示可视化的用户界面。所述智能电视的部件10-30通过系统总线相互通信。
请参阅图8,其为本发明TTS播报指令优化程序的系统较佳实施例的功能模块图。在本实施例中,TTS播报指令优化程序的系统可以被分割成一个或多个模块,所述一个或者多个模块被存储于所述存储器20中,并由一个或多个处理器(本实施例为所述处理器10)所执行,以完成本发明。例如,在图8中,TTS播报指令优化程序的系统包括:素材运营服务器、账号服务器以及智能电视客户端。
其中,所述素材运营服务器(是个性化TTS素材运营的后端部分)包括:
分类创建模块11,用于提供后台管理人员根据先验知识创建人群分类和兴趣点添加功能;
素材管理模块12,用于提供后台管理人员上传、编辑、发布、删除运营素材的功能,并为素材指定模块和标签,便于后期根据音频数据信息匹配合适的个性化TTS播报指令;
音频数据训练模块13,用于接收并保存智能电视客户端上报的用户音频数据,并对其进行个性化模型训练;
更新模块14,用于统计分析海量用户音频数据,不断优化和更新模型,使其适应不同的人群的变化。
其中,所述账号服务器(用户创建家庭账号以及家庭角色成员音频数据录入的后端部分)包括:
家庭账号创建管理模块21,用于为用户创建和保存家庭账号;
子账号音频数据录入管理模块22,用于块为家庭账号创建子账号,并保存其对应家庭人员的角色昵称、音频数据以及TTS属性信息。
其中,所述智能电视客户端(用户创建家庭账号,录入家庭角色音频数据,音频登录,个性化TTS定制播报以及用户音频数据上报的前端部分)包括:
家庭账号注册模块31,用于提供向账号服务器申请注册和登录家庭账号的页面和功能;
登录家庭角色成员音频数据模块32,用于提供家庭角色成员音频数据采集、音频检测和音频属性分析以及数据上传的功能;
音频验证登录模块33,用于提供账号登录和切换的页面和功能,账号服务器通过音频验证之后,为其切换到对应的音频的子账号;
统计用户音频数据上报模块34,用于记录用户的音频数据,并上传素材运营服务器,供素材运营服务器优化和更新TTS个性化训练模型和人群分类以及兴趣点模型。
本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的TTS播报指令优化方法的步骤。
基于上述TTS播报指令优化方法和智能电视,本发明还相应提供一种TTS播报指令优化系统,请参阅图9,其包括素材运营服务器102和账号服务器103,所述TTS播报指令优化系统还包括如上所述的智能电视;所述智能电视包括一用于进行指令播报的智能电视客户端101。
其中,所述素材运营服务器102根据不同人群的用户使用行为数据,提供符合用户兴趣爱好的TTS播报指令;所述账号服务器103创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到所述素材运营服务器102;所述智能电视客户端101向所述账号服务器103申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在所述账号服务器103中;所述智能电视客户端101通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知所述素材运营服务器102返回相关TTS播报指令;所述智能电视客户端101记录并向所述素材运营服务器102上传音频信息,所述素材运营服务器102进行数据统计分析之后,优化TTS播报指令。
综上所述,本发明通过优化TTS播报指令的内容,使之更加符合不同人群的兴趣爱好,不再是一家人听到的相同的老套僵硬的TTS指令播报,导致用户对使用语音功能缺乏兴趣,本发明提高了使用语音的粘度,利用音频识别与个性化TTS训练模型,在家庭账号下,录入不同家庭角色成员音频数据信息,为每一位家庭成员推送适合其人群特点的个性化TTS播报指令,真正做到让TTS播报更加符合用户的期望,让不同的人都能听到自己想要的个性化TTS播报指令。同时,系统不断统计分析海量用户的音频数据,不断更新人群分类和兴趣点模型,从而不断提高个性化TTS播报指令的精度和适应度。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种TTS播报指令优化方法,应用于智能电视,其特征在于,所述TTS播报指令优化方法包括:
素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令;
账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器;
智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中;
智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令;
智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令。
2.根据权利要求1所述的TTS播报指令优化方法,其特征在于,所述素材运营服务器获取并分析不同人群的用户使用行为数据,生成符合用户兴趣爱好的TTS播报指令具体包括:
素材运营服务器提供TTS素材创建、编辑人群分类及兴趣点模型页面,根据用户的年龄和性别特征将人群划分成若干类,并为每一类人群选择符合其特征的TTS素材;
素材运营服务器提供上传和编辑模块运营内容页面,并上传TTS素材,选择所属模块和对应的标签,并发布到运营内容数据库;
素材运营服务器接收智能电视客户端发送的用户音频数据,并进行模型训练,生成TTS播报指令素材并保存在用户音频数据库中;
素材运营服务器定期对用户音频数据进行统计分析,更新人群分类和兴趣点模型,更新对应的标签,用于向智能电视客户端推送TTS播报指令。
3.根据权利要求1所述的TTS播报指令优化方法,其特征在于,所述账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到素材运营服务器具体包括:
通过智能电视客户端向账号服务器申请创建家庭账号,账号服务器审核通过之后创建家庭账号,并通知智能电视客户端家庭账号创建成功;
智能电视客户端登录家庭账号之后,选择家庭角色成员并为其录入音频数据信息,将音频数据信息以及音频的属性信息上传到账号服务器中;
账号服务器在家庭账号下为其保存家庭角色成员的子账号,并保存相应的音频数据以及TTS属性信息;
账号服务器将收集到的家庭账号的音频数据传输到素材服务器中。
4.根据权利要求1所述的TTS播报指令优化方法,其特征在于,所述智能电视客户端向账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在账号服务器中具体包括:
通过智能电视客户端的注册界面向账号服务器申请创建家庭账号;
智能电视客户端登录家庭账号之后,选择家庭角色成员,通过遥控器采集音频数据信息,进行音频检测和属性分析;
将音频数据以及TTS属性信息上传到账号服务器,创建子账号并保存对应的数据;
根据对应的数据进行模型训练,产生TTS播报指令并保存在账号服务器中。
5.根据权利要求1所述的TTS播报指令优化方法,其特征在于,所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令具体包括:
智能电视客户端开启音频登录界面,通过遥控器采集音频信息;
智能电视客户端对采集的音频信息进行属性分析,并向账号服务器验证成员是否为家庭账号下的某一个家庭角色成员;
如果成员已经录入过音频数据信息,则切换为成员的子账号,并通知素材运营服务器返回相关TTS播报指令。
6.根据权利要求1所述的TTS播报指令优化方法,其特征在于,所述智能电视客户端记录并向素材运营服务器上传音频信息,素材运营服务器进行数据统计分析之后,优化TTS播报指令具体包括:
当智能电视客户端的音频登录成功之后,智能电视客户端记录并向素材运营服务器上传用户的音频数据;
当素材运营服务器进行数据统计分析之后,优化和更新人群分类和兴趣点模块,并优化TTS播报指令。
7.根据权利要求5所述的TTS播报指令优化方法,其特征在于,所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知素材运营服务器返回相关TTS播报指令还包括:
素材运营服务器将家庭账号切换为成员账号时,根据子账号信息判断成员角色所属的人群类别,提取所属人群类别的TTS播报指令的兴趣点,匹配相对应的TTS播报指令素材,并向智能电视客户端推送;
所述子账号信息包括:角色昵称、性别、年龄以及音频数据。
8.一种智能电视,其特征在于,所述智能电视包括:处理器、存储器和通信总线;
所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如权利要求1-7任意一项所述的TTS播报指令优化方法中的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-7任意一项所述的TTS播报指令优化方法的步骤。
10.一种TTS播报指令优化系统,其特征在于,包括素材运营服务器和账号服务器,所述TTS播报指令优化系统还包括如权利要求8所述的智能电视;所述智能电视包括一用于进行指令播报的智能电视客户端;
所述素材运营服务器根据不同人群的用户使用行为数据,提供符合用户兴趣爱好的TTS播报指令;
所述账号服务器创建家庭账号,录入对应子账号的音频数据以及属性信息,验证账号登录和切换后,将家庭账号的音频数据传输到所述素材运营服务器;
所述智能电视客户端向所述账号服务器申请创建家庭账号,录入家庭成员角色的音频数据,生成TTS播报指令并保存在所述账号服务器中;
所述智能电视客户端通过遥控器采集音频信息,并对采集的音频信息进行属性分析,通知所述素材运营服务器返回相关TTS播报指令;
所述智能电视客户端记录并向所述素材运营服务器上传音频信息,所述素材运营服务器进行数据统计分析之后,优化TTS播报指令。
CN201810117510.5A 2018-02-06 2018-02-06 Tts播报指令优化方法、智能电视、系统及存储装置 Active CN108366302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810117510.5A CN108366302B (zh) 2018-02-06 2018-02-06 Tts播报指令优化方法、智能电视、系统及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810117510.5A CN108366302B (zh) 2018-02-06 2018-02-06 Tts播报指令优化方法、智能电视、系统及存储装置

Publications (2)

Publication Number Publication Date
CN108366302A true CN108366302A (zh) 2018-08-03
CN108366302B CN108366302B (zh) 2020-06-30

Family

ID=63004707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810117510.5A Active CN108366302B (zh) 2018-02-06 2018-02-06 Tts播报指令优化方法、智能电视、系统及存储装置

Country Status (1)

Country Link
CN (1) CN108366302B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
CN110856023A (zh) * 2019-11-15 2020-02-28 四川长虹电器股份有限公司 基于tts实现智能电视自定义播报音的系统及方法
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN110942409A (zh) * 2019-11-27 2020-03-31 南京创维信息技术研究院有限公司 一种用于语音产品功能使用教学的方法及系统
CN112307460A (zh) * 2020-09-21 2021-02-02 北京沃东天骏信息技术有限公司 一种智能设备的控制方法及装置、设备、存储介质
CN112637147A (zh) * 2020-12-13 2021-04-09 青岛希望鸟科技有限公司 一种通过音频创建与连接通信服务的方法、终端、服务端
CN112735375A (zh) * 2020-12-25 2021-04-30 北京百度网讯科技有限公司 语音播报方法、装置、设备以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379391A (zh) * 2001-04-06 2002-11-13 国际商业机器公司 由文本生成个性化语音的方法
CN102693729A (zh) * 2012-05-15 2012-09-26 北京奥信通科技发展有限公司 个性化语音阅读方法、系统及具有该系统的终端
US20120253816A1 (en) * 2005-10-03 2012-10-04 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
CN103516854A (zh) * 2012-06-15 2014-01-15 三星电子株式会社 终端装置及其控制方法
CN103581761A (zh) * 2012-07-30 2014-02-12 三竹资讯股份有限公司 基于应用层智能电视股票看盘个人化语音播报装置与方法
CN103856626A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 个性声音的定制方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379391A (zh) * 2001-04-06 2002-11-13 国际商业机器公司 由文本生成个性化语音的方法
US20120253816A1 (en) * 2005-10-03 2012-10-04 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
CN102693729A (zh) * 2012-05-15 2012-09-26 北京奥信通科技发展有限公司 个性化语音阅读方法、系统及具有该系统的终端
CN103516854A (zh) * 2012-06-15 2014-01-15 三星电子株式会社 终端装置及其控制方法
CN103581761A (zh) * 2012-07-30 2014-02-12 三竹资讯股份有限公司 基于应用层智能电视股票看盘个人化语音播报装置与方法
CN103856626A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 个性声音的定制方法和装置
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
US11475897B2 (en) 2018-08-30 2022-10-18 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for response using voice matching user category
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN110856023A (zh) * 2019-11-15 2020-02-28 四川长虹电器股份有限公司 基于tts实现智能电视自定义播报音的系统及方法
CN110942409A (zh) * 2019-11-27 2020-03-31 南京创维信息技术研究院有限公司 一种用于语音产品功能使用教学的方法及系统
CN112307460A (zh) * 2020-09-21 2021-02-02 北京沃东天骏信息技术有限公司 一种智能设备的控制方法及装置、设备、存储介质
CN112637147A (zh) * 2020-12-13 2021-04-09 青岛希望鸟科技有限公司 一种通过音频创建与连接通信服务的方法、终端、服务端
CN112637147B (zh) * 2020-12-13 2022-08-05 青岛希望鸟科技有限公司 一种通过音频创建与连接通信服务的方法、终端、服务端
CN112735375A (zh) * 2020-12-25 2021-04-30 北京百度网讯科技有限公司 语音播报方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN108366302B (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN108366302A (zh) Tts播报指令优化方法、智能电视、系统及存储装置
CN110235154B (zh) 使用特征关键词将会议与项目进行关联
US11030412B2 (en) System and method for chatbot conversation construction and management
CN112346567B (zh) 基于ai的虚拟交互模型生成方法、装置及计算机设备
CN106874134B (zh) 工单类型的处理方法、装置及系统
CN104731971A (zh) 一种校园个性化掌上服务及用户行为习惯分析的实现方法
CN108347490A (zh) 一种基于生物识别技术的校园应用装置及系统
CN106484622A (zh) 测试方法、装置及系统
CN107580237A (zh) 电视的操作方法、装置、系统和存储介质
CN111368141B (zh) 视频标签的扩展方法、装置、计算机设备和存储介质
CN109903087A (zh) 基于行为特征预测用户属性值的方法、装置及存储介质
CN102592116A (zh) 一种云计算应用方法、系统及终端设备、云计算平台
CN110147930A (zh) 基于大数据分析的数据统计方法、装置及存储介质
CN111027838B (zh) 一种众包任务推送方法、装置、设备及其存储介质
CN112328905B (zh) 线上营销内容推送方法、装置、计算机设备及存储介质
CN110457569A (zh) 用于多个物联网设备的认知引擎
CN109493866A (zh) 智能音箱及其操作方法
US20190197011A1 (en) Network-based machine learning model discovery and benchmarking
CN114339392B (zh) 视频剪辑方法、装置、计算机设备及存储介质
Pesarin et al. Conversation analysis at work: detection of conflict in competitive discussions through semi-automatic turn-organization analysis
CN115034836B (zh) 一种模型训练方法及相关装置
US10397752B2 (en) Real-time discovery of interests of individuals and organizations participating in a physical event
CN109460503A (zh) 答案输入方法、装置、存储介质及电子设备
Zhu Construction and risk analysis of marketing system based on ai
CN108228950A (zh) 一种信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240823

Address after: 518000, A1306, Skyworth Building, No. 008 Gaoxin South 1st Road, Gaoxin Community, Yuehai Street, Nanshan District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Skyworth Display Technology Co.,Ltd.

Country or region after: China

Address before: 1036, 10th floor, 28 ningshuang Road, Yuhuatai District, Nanjing City, Jiangsu Province, 211200

Patentee before: NANJING SKYWORTH INSTITUTE OF INFORMATION TECHNOLOGY Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right