CN109218843B - 基于电视设备的个性化智能语音提示方法 - Google Patents

基于电视设备的个性化智能语音提示方法 Download PDF

Info

Publication number
CN109218843B
CN109218843B CN201811134174.1A CN201811134174A CN109218843B CN 109218843 B CN109218843 B CN 109218843B CN 201811134174 A CN201811134174 A CN 201811134174A CN 109218843 B CN109218843 B CN 109218843B
Authority
CN
China
Prior art keywords
user
weight
statement
utterance
configuration file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811134174.1A
Other languages
English (en)
Other versions
CN109218843A (zh
Inventor
韩亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201811134174.1A priority Critical patent/CN109218843B/zh
Publication of CN109218843A publication Critical patent/CN109218843A/zh
Application granted granted Critical
Publication of CN109218843B publication Critical patent/CN109218843B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo

Abstract

本发明公开了一种基于电视设备的智能语音提示方法,包括:步骤一、从电视终端采集用户行为日志;步骤二、分析用户基本行为;步骤三、生成支持说法配置文件;步骤四、通过配置文件来计算每个用户每种说法的使用次数us和所有用户已会使用的说法的均值gv。步骤五、根据步骤三和步骤四说法均值得到新的权重w1;步骤六、根据步骤五和步骤四中用户各领域下说法使用次数,得到每个用户各领域下每种说法的权重。步骤七、根据领域下说法的权重进行排序,并根据预设定的场景进行语音个性化提示。本发明根据决策算法从配置文件输出语音说法对用户进行个性化语音提示;提升用户体验度以及培养用户使用语音操作电视的习惯,更好的为用户提供个性化服务。

Description

基于电视设备的个性化智能语音提示方法
技术领域
本发明涉及一种智能语音提示方法,具体涉及一种基于电视设备的个性化智能语音提示方法,属于大数据和人工智能技术领域。
背景技术
近几十年来,语音识别技术取得显著进步,开始从实验室走向市场。目前语音识别技术已广泛应用于电视产品中。但是,并不是用户说的所有内容,电视都能执行相应的指令。因为这需要电视去理解语音指令的含义。电视识别语音指令是通过语义理解或关键字触发而执行的相应动作。这就需要用户按电视已支持的说法,去操作电视,电视才能去执行相应的动作。否则,用户杂乱无章的说了很多,但是都识别不到,这样用户的体验度很不好。
目前电视上语音提示比较隐蔽,提示信息没有说明场景,且提示的内容对所有用户一致。这样用户在根据语音提示信息的说法来操作电视时,也达不到很好的体验度。而且如果用户对该说法已经很熟练时,没能根据用户行为去提示用户其他不会的说法,不能个性化提示用户学习其他方法。用户体验度有待提升。
这就需要通过算法,来提醒用户在相应场景下如何通过语音来操作电视。但是电视能够显示的语句有限,这就需要在所有说法中,先提示一部分内容,等用户会说之后,再提示其他内容。但是不同用户的行为偏好不一样,每个用户会使用的说法也就不一样。这就需要根据用户的使用语音行为,结合电视现有的说法,对用户进行个性化语音提示。
发明内容
本发明的目的在于提出一种基于电视设备的智能语音提示方法,用于引导用户在不同场景下去使用电视已支持的语音说法,而且能根据用户行为,引导用户学习各种语音说法,并进行个性化提示。提升用户体验度以及培养用户使用语音操作电视的习惯,更好的为用户提供个性化服务。
为实现上述技术任务,本发明提供的基于电视设备的智能语音提示方法,包括下述步骤:
步骤一、从电视终端采集用户行为日志。
步骤二、分析用户基本行为
步骤三、生成电视支持的说法配置文件;
对电视支持的说法进行汇总,并对每个说法设置权重w,对于要优先提示的说法设置较高的权重;
步骤四、通过电视终端采集用户行为日志获得每个用户每种说法的使用次数us,通过说法配置文件来计算所有用户已会使用的说法的用户说法均值gv。
步骤五、根据步骤三中的权重w和步骤四中的用户说法均值gv,得到说法的新的权重w1;
Figure GDA0002524742820000021
说明:权重w1=权重w*用户均值gv,(对应领域下的标签)。
当用户使用的说法中没有配置文件下的说法时(该说法用户没有用过,也即新的说法):
权重w1=w*10
这样权重值较大,新说法比较容易排在前面。
步骤六、根据步骤五得到的新的权重w1和步骤四中每个用户每种说法的使用次数us,得到每个用户各领域下每种说法的权重。
Figure GDA0002524742820000022
说明:当用户这个统计周期没有使用过该说法,直接为该权重;当用户使用过该说法如视频类视频名称,则最终权重=新的权重/每个用户每种说法的使用次数us。这样当用户使用次数多时,得到的值就较低,后面排序会排在后面,即用户已经会说的说法会去掉,而提示用户使用用户不会说的说法。
步骤七、根据领域下说法的权重进行排序,并根据预设定的场景进行语音个性化提示。
更进一步的方案是:
分析用户基本行为,具体包括:
计算用户一周内观看最多的一部视频;
计算用户一周内使用最多的节目源;
当获取不到用户基本行为时,则直接提示热门影视内容,比如一周内平台上最热的视频。
更进一步的方案是:
所述说法配置文件,包括默认配置文件,轮流替换文件,全局配置文件和全程配置文件,
各配置文件作用:
默认配置文件:对于新的用户直接采用默认配置文件进行提示。
轮流替换文件:轮流替换文件中包括国家(如中国、美国)、电视台(如中央一台、湖南卫视)等自定义一些配置,每次提示时能随机选取数据进行替换。
全局配置文件:主要是提示全局场景下的说法。
全程配置文件:主要提示在某应用下提示说法。
其中
所述全局配置文件格式为:
领域 标志 意图或类型 提示语句 step
VIDEO 1/2 name 我想看video 0.7
说明:
第一列为说法所属的领域。
第二列为说法被推荐的场景标志。对于某些场景下会推荐(在某个应用下会提示,但全局也会提示就是2,其他是全局的为1);
第三列为说法所属的标签。
第四列为具体说法。
第五列为通过非语音的手段做相应操作的难易程度等级,按键1次设为0.6,按键2次设为0.7,按键3次设为0.8,按键4次设为0.9,按照5次以上,或者非语音根本无法达到,则设为1.0.(人为设定)。
按键无法达到时,更倾向于用语音操作,设置权重越大。
所述全程配置文件格式为:
场景 app rank 意图或类型 提示语句
weak_scene media_video 1 CONTROL_PLAY 快进到第5分钟
说明:
第一列为说法所属的场景类型(目前只有strong_scene和weak_scene)
第二列为说法所属的应用(app),指这种说法是哪个app下的全程说法,例如是QQ音乐,天气具体应用一些场景。
第三列为说法的初始默认权重,用于初始排序。
第四列为说法所属的标签
第五列为具体说法。
更进一步的方案是:
每个用户每种说法的使用次数通过电视终端采集用户行为日志获得;用户说法均值gv是根据所有用户说法使用情况,计算出用户说法的均值,即该说法总使用次数/总用户个数。
其中,两种具体的说法格式如下:
全局用户说法格式:
用户 领域 意图或类型 次数
mac VIDEO name 2
全程用户说法格式:
用户 领域 意图或类型 次数
mac media_video CONTROL_PLAY 2
说明:
第一列为用户的标志
第二列为用户说法的领域
第三列为用户使用语音的意图
第四列为用户使用该说法的次数
用户说法均值gv:
根据所有用户说法使用情况,计算出用户说法的均值,即该说法总使用次数/总用户个数
本发明通过分析用户使用语音操作电视的行为习惯和目前已支持语音说法,建立决策算法;根据决策算法从配置文件输出语音说法对用户进行个性化语音提示;提升用户体验度以及培养用户使用语音操作电视的习惯,更好的为用户提供个性化服务。
附图说明
图1为本发明基于电视设备的个性化智能语音提示方法流程图。
图2为智能语音提示在终端显示的两个场景。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
目前智能电视已经非常普及,同时语音识别也广泛应用于电视产品中。为了能够更好的引导用于使用语音去操作电视,同时使用户在使用语音时有较好的体验度。发明人根据用户的语音使用习惯和自定义决策算法,依据大数据进行个性化语音提示。参考图1,具体原理解释说明如下:
(1)首先从电视终端采集用户行为日志
(2)分析用户基本行为
计算用户一周内观看最多的一部视频;
用户一周内使用最多的节目源;
一周内平台上最热的视频
(3)支持说法配置文件生成
获取全局配置文件中设置的权重w,如(0.7为对应领域说法的权重)
格式如下:
领域 标志 说法关键字 提示语句 权重
VIDEO 1 name 我想看video 0.7
VIDEO 1 rate 来一部高分电影 0.7
其中VIDEO表示视频领域,name,rate为定义的说法中的两个关键词,video为用户想要看的视频名称。在同一个领域下,根据关键字有不同的提示说法。
全程配置文件格式如下:
场景 app rank 意图或类型 提示语句
weak_scene media_video 1 CONTROL_PLAY 快进到第5分钟
(4)分析用户操作语音习惯:计算每个用户每种说法的使用次数us和所有用户已会说法的均值gv
计算每个用户各领域下各说法的使用次数,如下表:
用户 领域 说法关键字 次数
Mac APP OPEN 1
Mac ChAT chat 1
Mac VIDE QUERY 2
Mac VIDEO name 2
计算所有用户说法均值
当用户说法的均值小于0.1时,设为0.1。目的是防止权重过小。
格式如下:
领域 说法关键字 均值
VIDEO name 14.562886
VIDEO rate 0.1
(5)根据步骤(3)和步骤(4)说法均值得到新的权重w1
Figure GDA0002524742820000061
说明:权重w1=权重w*用户均值gv,(对应领域下的标签)。当用户使用的说法中没有配置文件下的说法时(该说法用户没有用过,也即新的说法):
权重w1=w*10
这样权重值较大,新说法比较容易排在前面。
(6)根据步骤(5)和步骤(4)中用户各领域下说法使用次数,得到每个用户各领域下每种说法的权重。
Figure GDA0002524742820000062
说明:当用户这个统计周期没有使用过该说法,直接为该权重;当用户使用过该说法如视频类视频名称,则最终权重=新的权重/每个用户周期内使用该说法的次数。这样当用户使用次数多时,得到的值就较低,后面排序会排在后面,即用户已经会说的说法会去掉,而提示用户使用用户不会说的说法。
用户mac经过计算后该用户的VIDEO领域中name说法的权重为5.09701。
即w2=w*gv/us=0.7*14.562886/2
(7)替换个性化标签
步骤3中可以看到提示语句“我想看video”,当该mac有视频偏好时,取该mac的视频名称;当用户没有时,取大众喜爱视频。其他标签也是如此。比如最近最热门视频为“温暖的弦”,可以为该用户提示为“我想看温暖的弦”。
(8)对说法进行整体排序。
对各领域下的意图或标签进行排序(第五列为排序值),可以看到VIDEO领域中“我想看温暖的弦”(标签为name)语句排在第一位,说明该mac使用该说法的频率比较低,小于所有用户的均值。因此继续推送。
用户 提示语句 权重 领域 排序
mac 我想看温暖的弦 5.09701 VIDEO 1
mac 我想看电影 2.1707215 VIDEO 2
mac 我想看光头强 0.56505156 VIDEO 3
(9)将计算出来的每个用户的提示语句更新到电视终端。
如附图2为一个实施例中,电视终端在不同场景下的提示语句。
尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims (3)

1.一种基于电视设备的智能语音提示方法,其特征在于包括下述步骤:
步骤一、从电视终端采集用户行为日志;
步骤二、分析用户基本行为;
步骤三、生成电视支持的说法配置文件;
对电视支持的说法进行汇总,在说法配置文件中对每种说法设置初始权重w,对于要优先提示的说法设置较高的权重;
步骤四、通过电视终端采集用户行为日志获得每个用户每种说法的使用次数us,根据所有用户说法使用情况计算出每种说法均值gv,即每种说法均值gv=所有用户每种说法总使用次数/总用户个数;
步骤五、根据步骤三中的每种说法的初始权重w和步骤四中的每种用户说法均值gv,得到每种说法的新的权重w1;
Figure FDA0002670099830000011
说明:当所有用户都没有使用过该说法,则该说法的新的权重w1=初始权重w*10;当存在有用户使用过该说法,则该说法的新的权重w1=初始权重w*每种说法均值gv;
步骤六、根据步骤五得到的每种说法的新的权重w1和步骤四中每个用户每种说法的使用次数us,得到每个用户各领域下每种说法的权重w2;
Figure FDA0002670099830000012
说明:当某一用户在统计周期内没有使用过该说法,则该用户的该说法的最终权重w2直接为该说法的新的权重w1;当该用户在统计周期内使用过该说法,则该用户的该说法的最终权重w2=该说法的新的权重w1/该用户该说法的使用次数us;
步骤七、根据每个用户各领域下每种说法的权重w2对所有说法进行排序,更新说法配置文件,并根据预设定的场景标志进行语音个性化提示。
2.根据权利要求1所述基于电视设备的智能语音提示方法,其特征在于:
分析用户基本行为,具体包括:
计算用户一周内观看最多的一部视频;
计算用户一周内使用最多的节目源;
当获取不到用户基本行为时,则直接提示热门影视内容,比如一周内平台上最热的视频。
3.根据权利要求2所述基于电视设备的智能语音提示方法,其特征在于:
所述说法配置文件,包括默认配置文件,轮流替换文件,全局配置文件和全程配置文件,其中,全局配置文件格式为:
包括领域、标志、意图或类型、提示语句及step的五列,其中:
第一列为说法所属的领域;
第二列为说法被推荐的场景标志;
第三列为说法所属的标签;
第四列为具体说法;
第五列为通过非语音的手段做相应操作的难易程度等级,按键1次设为0.6,按键2次设为0.7,按键3次设为0.8,按键4次设为0.9,按照5次以上,或者非语音根本无法达到,则设为1.0;
按键无法达到时,更倾向于用语音操作,设置权重越大;
所述全程配置文件格式为:
包括场景、app、rank、意图或类型、提示语句的五列,其中,
第一列为说法所属的场景类型,包括strong_scene和weak_scene;
第二列为说法所属的app,指这种说法是哪个app下的全程说法;
第三列为说法的初始默认权重,用于初始排序;
第四列为说法所属的标签;
第五列为具体说法。
CN201811134174.1A 2018-09-27 2018-09-27 基于电视设备的个性化智能语音提示方法 Active CN109218843B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811134174.1A CN109218843B (zh) 2018-09-27 2018-09-27 基于电视设备的个性化智能语音提示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811134174.1A CN109218843B (zh) 2018-09-27 2018-09-27 基于电视设备的个性化智能语音提示方法

Publications (2)

Publication Number Publication Date
CN109218843A CN109218843A (zh) 2019-01-15
CN109218843B true CN109218843B (zh) 2020-10-23

Family

ID=64981871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811134174.1A Active CN109218843B (zh) 2018-09-27 2018-09-27 基于电视设备的个性化智能语音提示方法

Country Status (1)

Country Link
CN (1) CN109218843B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145721B (zh) * 2019-12-12 2024-02-13 科大讯飞股份有限公司 个性化提示语生成方法、装置和设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203151689U (zh) * 2012-10-26 2013-08-21 三星电子株式会社 图像处理设备以及图像处理系统
CN103916708A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 显示装置和用于控制显示装置的方法
CN103945250A (zh) * 2013-01-17 2014-07-23 三星电子株式会社 图像处理设备、其控制方法、以及图像处理系统
WO2016003509A1 (en) * 2014-06-30 2016-01-07 Apple Inc. Intelligent automated assistant for tv user interactions
CN106448668A (zh) * 2016-10-10 2017-02-22 山东浪潮商用系统有限公司 一种语音识别的方法及设备
CN107688608A (zh) * 2017-07-28 2018-02-13 合肥美的智能科技有限公司 智能语音问答方法、装置、计算机设备和可读存储介质
CN108132805A (zh) * 2017-12-20 2018-06-08 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140089863A (ko) * 2013-01-07 2014-07-16 삼성전자주식회사 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203151689U (zh) * 2012-10-26 2013-08-21 三星电子株式会社 图像处理设备以及图像处理系统
CN103916708A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 显示装置和用于控制显示装置的方法
CN103945250A (zh) * 2013-01-17 2014-07-23 三星电子株式会社 图像处理设备、其控制方法、以及图像处理系统
WO2016003509A1 (en) * 2014-06-30 2016-01-07 Apple Inc. Intelligent automated assistant for tv user interactions
CN106448668A (zh) * 2016-10-10 2017-02-22 山东浪潮商用系统有限公司 一种语音识别的方法及设备
CN107688608A (zh) * 2017-07-28 2018-02-13 合肥美的智能科技有限公司 智能语音问答方法、装置、计算机设备和可读存储介质
CN108132805A (zh) * 2017-12-20 2018-06-08 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN109218843A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN106796496B (zh) 显示设备及其操作方法
KR102100389B1 (ko) 개인화된 엔티티 발음 학습
CN104038804B (zh) 基于语音识别的字幕同步装置和方法
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
CN108063969B (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
US10811013B1 (en) Intent-specific automatic speech recognition result generation
CN104380373A (zh) 用于名称发音的系统和方法
CN105304080A (zh) 语音合成装置及方法
US9922650B1 (en) Intent-specific automatic speech recognition result generation
CN103853703A (zh) 一种信息处理方法及电子设备
CN109979474B (zh) 语音设备及其用户语速修正方法、装置和存储介质
CN109599130A (zh) 收音方法、装置及存储介质
CN110691258A (zh) 一种节目素材制作方法、装置及计算机存储介质、电子设备
CN110740275A (zh) 一种非线性编辑系统
JP2015212732A (ja) 音喩認識装置、及びプログラム
US20150371627A1 (en) Voice dialog system using humorous speech and method thereof
CN101763756A (zh) 基于网络的交互式智能外语听写训练系统和方法
US20230109783A1 (en) Computing device and corresponding method for generating data representing text
US9832526B2 (en) Smart playback method for TV programs and associated control device
Levin et al. Automated closed captioning for Russian live broadcasting
CN113113024A (zh) 语音识别方法、装置、电子设备和存储介质
CN109218843B (zh) 基于电视设备的个性化智能语音提示方法
CN109376145B (zh) 影视对白数据库的建立方法、建立装置及存储介质
CN114550718A (zh) 热词语音识别方法、装置、设备与计算机可读存储介质
KR20130128172A (ko) 장애인을 위한 이동통신 단말기 및 문자생성방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant