CN1591571A - 提供个性化服务的音频/视频装置和方法 - Google Patents

提供个性化服务的音频/视频装置和方法 Download PDF

Info

Publication number
CN1591571A
CN1591571A CNA2004100740661A CN200410074066A CN1591571A CN 1591571 A CN1591571 A CN 1591571A CN A2004100740661 A CNA2004100740661 A CN A2004100740661A CN 200410074066 A CN200410074066 A CN 200410074066A CN 1591571 A CN1591571 A CN 1591571A
Authority
CN
China
Prior art keywords
user
speech
voice commands
service
speaker identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100740661A
Other languages
English (en)
Other versions
CN1300765C (zh
Inventor
崔承亿
郑善化
明寅植
李贞奉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1591571A publication Critical patent/CN1591571A/zh
Application granted granted Critical
Publication of CN1300765C publication Critical patent/CN1300765C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

一种通过话音和说话者识别提供个性化服务的音频/视频装置,其中,当用户通过遥控装置中的无线麦克风输入他的/她的话音时,执行对输入话音的话音识别和说话者识别,并且确定与输入话音相对应的命令,从而,给用户提供用户的个性化服务。此外,一种通过话音和说话者识别提供个性化服务的方法,包括以下步骤:由用户通过遥控装置中的麦克风输入他的/她的话音;如果输入话音,则识别输入话音和输入该话音的说话者;基于输入话音确定命令;以及根据确定结果提供服务。

Description

提供个性化服务的音频/视频装置和方法
                        技术领域
本发明涉及一种通过话音和说话者识别提供个性化服务的音频/视频(A/V)装置和方法,更具体地说,涉及这样一种通过话音和说话者识别提供个性化服务的A/V装置和方法,其中,当输入用户话音时,同时执行话音识别和说话者识别以提供根据说话者识别的个性化服务。
                        背景技术
在相关技术中,为了接收个性化服务,用户应该选择说话者识别模式,然后说出已经登记的密码(输入字)用于用户识别,最终说出相应的命令用于想要得到的服务。
这可能是不方便的,由于用户可能通过执行两个处理仅仅接收个性化服务,这两个处理包括:输入用于说话者识别的密码处理;以及输入用于话音识别的命令处理。另外,由于分别应用用于说话者识别的输入字(密码)和用于话音识别的输入字(命令),用户应该记忆分别的输入字,这也是不方便的。
此外,如果另一个用户想要享受个性化服务,则应该输入“改变用户”命令,然后再次执行说话者和话音识别,这引起用户的不方便。
                        发明内容
本发明的目的在于解决前述的不方便之处。本发明的一方面提供一种通过话音和说话者识别提供个性化服务的A/V装置和方法,其中,依照用户的话音输入,同时执行话音和说话者识别而不需要分离的用户识别处理。
本发明的另一方面是提供一种通过话音和说话者识别提供个性化服务的A/V装置和方法,其中,通过均等地将输入字(命令)应用于话音识别和说话者识别来迅速提供想要得到的服务。
根据本发明的示例性实施例,提供了一种通过话音和说话者识别向用户提供个性化服务的音频/视频装置,其中,当用户通过遥控装置的无线麦克风输入他的/她的话音时,执行对输入话音的话音识别和说话者识别,并且确定对应于输入话音的命令,从而将用户的个性化服务提供给用户。
此外,A/V装置可包括:话音识别单元,用于识别通过话音输入单元输入的话音;说话者识别单元,用于基于通过话音输入单元输入的话音识别用户;确定单元,用于确定哪个命令对应于通过话音识别单元识别的话音;数据库,用于存储用户信息、话音信息、关于用户的个性化服务的信息、以及命令;和服务搜索单元,用于在数据库中搜索对应于已识别命令的服务和关于用户的个性化服务的信息。
此外,根据本发明的另一个示例性实施例,提供了一种通过话音和说话者识别提供个性化服务的方法,包括下述步骤:由用户通过遥控装置中的无线麦克风输入他的/她的话音;如果输入了话音,则识别输入话音和输入话音的说话者;基于输入话音确定命令;和根据确定结果提供服务。
                        附图说明
通过下面结合附图对给出的优选实施例进行的描述,本发明的上述和其他目的、特点、和优点将会变得清楚,其中:
图1是示意性地表示根据本发明的示例性实施例的通过话音和说话者识别提供个性化服务的A/V装置的方框图;
图2是示意性地表示根据本发明的另一个示例性实施例通过话音和说话者识别提供个性化服务的方法的流程图;
图3A和3B表示根据本发明实施例的命令表;
图4表示根据本发明的示例性实施例的通过话音和说话者识别提供个性化服务的方法;和
图5表示根据本发明的另一个示例性实施例的通过话音和说话者识别提供个性化服务的方法。
                      具体实施方式
以下,参照附图来详细描述本发明的示例性实施例。
图1是示意性地表示根据本发明的示例性实施例的通过话音和说话者识别提供个性化服务的A/V装置的方框图。A/V装置200包括话音识别单元210、说话者识别单元220、控制单元230、确定单元240,服务搜索单元250、和数据库260。
当通过遥控装置100中的无线麦克风输入用户话音时,A/V装置200执行对输入话音的话音和说话者识别,确定对应于输入话音的命令,然后向用户提供个性化服务。
话音识别单元210用于识别通过在遥控装置100中提供的话音输入单元110输入的话音,即,用于识别由用户输入的命令。
说话者识别单元220用于基于通过话音输入单元110输入的话音识别说话者,即,基于存储于数据库260中的关于用户的话音的信息,识别输入他的/她的话音的用户。
确定单元240用于确定哪个命令对应于话音识别单元210识别的话音,即,用于分析由话音识别单元210识别的命令,并且确定该命令是否需要用户信息。
数据库260用于存储关于用户,话音、以及用户的个性化服务的信息,以及可获得的命令。换句话说,当话音识别单元210和说话者识别单元220执行鉴别处理时,数据库提供存储在其中的命令和关于相关用户的信息。可获得的命令是指可由用户输入的所有命令,例如,包括“搜索频道”命令、“登记频道”命令、“删除频道”命令等。
此外,命令分类为需要用户鉴别的命令和不需要用户鉴别的命令。将在以后参考图3更详细地描述存储在数据库260中的命令。
服务搜索单元250用于根据确定单元240的确定结果在数据库260种搜索设计命令的信息和关于用于用户的个性化服务的信息,即,根据确定单元240的确定结果搜索相关的服务。
控制单元230用于提供由服务搜索单元250搜索的服务,即,提供与由用户输入的命令相对应的服务。这里,服务可被认为是从最喜欢的频道得到的广播节目的显示、关于推荐节目信息的显示、最喜欢的音乐的重放,选择的音乐流派的显示,或诸如此类。
其间,通过在遥控装置100中提供的话音输入单元110输入用户的话音。此时,无线麦克风用于用户话音的输入。
图2是示意性地表示根据本发明的另一示例性实施例的通过话音和说话者识别提供个性化服务的方法的流程图。首先,如果用户通过安装在遥控装置中的无线麦克风输入他的/她的话音(S100),则话音输入单元110将通过无线麦克风输入的用户的话音(命令)发送到话音识别单元210。
然后,话音识别单元210识别从话音输入单元110发送的命令,说话者识别单元220同时基于输入话音执行说话者识别(S110)。换句话说,话音识别单元210识别由用户输入的命令,同时,说话者识别单元220基于输入话音执行对用户的说话者识别。明确地说,话音识别单元210将输入命令转换为文本,并且将该文本发送给确定单元240,说话者识别单元220从输入话音中提取特点,分析该提取的特点,然后在存储于数据库260中的用户话音之中搜索具有与输入话音的话音信号最接近的用户话音,从而识别出输入命令的用户。这里,用户应提前执行用户登记处理以为说话者识别做准备。通过用户登记处理,关于用户的具体信息在数据库260中登记。结果,基于话音的说话者识别被执行。此外,已经登记在数据库260中的登记字包括请求个性化服务的命令。因此,登记字和命令被平等的应用,以便话音和说话者识别可被同时执行。
此后,由话音识别单元210识别的命令被发送到轮流分析由话音识别单元210识别的命令的确定单元240(S120)。换句话说,确定单元240基于输入命令分析将执行哪个操作,并且确定分析的命令是否是用于用户的需要用户信息的个性化命令或者是不需要用户信息的普通命令。这里,用于用户的个性化命令是由用户根据他的/她的个人偏爱和品味频繁输入的命令,并且可以被认为是“最喜欢的频道”、“通知预订”、“通知列表”、“记录预订”、“预订列表”、“记录列表”、“推荐节目”、“按次付费频道”、“购物频道”、或诸如此类。普通命令是不会受到用户偏爱和品味影响的命令,并且可被认为是新闻、戏剧、运动、或诸如此类。
随后,如果确定单元240确定输入命令是请求个性化服务的命令(S130),则服务搜索单元250确定输入他的/她的话音的用户是否是登记在数据库260中的用户并且被说话者识别单元220通过说话者识别而识别(S140)。
如果确定输入他的/她的话音的用户是登记在数据库260中的用户(S140),则搜索关于由说话者识别单元220鉴别的用户的信息并从在用户基础上登记信息的数据库260中提取该信息(S150)。此后,在包含于提取的用户信息中的服务列表中搜索对应于用户输入的命令的个性化服务(S160)。
然后,控制单元230向用户提供由服务搜索单元250搜索的个性化服务(S170)。
另一方面,如果确定输入他的/她的话音的用户不是在数据库260中登记的用户(S140),则服务搜索单元250向用户提供基本上在A/V装置内配置的基本服务(S190,S200),或者通知用户没有用于该用户的登记的个性化服务并且请求用户执行用户登记处理(S210)。这里,基本服务是在A/V装置中默认配置的服务,并且如果输入他的/她的话音的用户尚未通过用于个性化服务的用户登记,则因此没有个性化服务提供给用户。换句话说,基本服务是临时提供给尚未在数据库260中登记的用户的服务。例如,如果用户输入“推荐节目”命令,则确定单元240分析输入命令。基于分析结果,确定结果,即用户输入命令是请求个性化服务命令,被发送到轮流确定输入他的/她的话音的用户是否是在数据库260中登记的用户的服务搜索单元250。
然后,如果确定已经输入命令(“推荐节目”)的用户是还未在数据库260中登记的用户,则给用户提供在A/V装置中默认配置的基本服务(例如,“MBC9点新闻”节目),因为没有提供给用户的个性化服务。
另一方面,如果由确定单元240确定输入命令是请求普通服务的命令(S130),则服务搜索单元250搜索数据库260以找到对应输入命令的普通服务(S180)。然后,控制单元230给用户提供由服务搜索单元250搜索的普通服务(S170)。
其间,如果另一个用户通过安装在遥控装置中的无线麦克风输入命令,则执行用于用户的话音和说话者识别,并将根据搜索到的关于用户的信息的个性化服务提供给用户。
图3A和3B表示本发明的个性化命令表。图3A表示当应用视频器件(数字TV)时可输入的个性化命令表,图3B表示应用音频器件(音频部件,MP3播放器,多媒体播放器,或诸如此类)时可输入的个性化命令表。
首先,参考图3A,将描述当应用视频器件时可输入的个性化命令表。
“最喜欢的频道”由用户配置,以提供在数据库260中登记的频道之一作为他的/她的最喜欢的频道。即,如果用户说“最喜欢的频道”作为命令,则来自存储在数据库260中的最喜欢的频道之一的图片显示在屏幕上。
“通知预订”被配置,以便在节目广播开始之前(或之后)向用户通知该用户想要接收关于其通知的任意节目广播的开始。即,如果用户预订/输入关于具体节目的信息(广播时间、频道信息、节目标题,等等),则用户被通知具体节目的开始。
“通知列表”是用于在数据库260中登记和保持用户预订以被通知其开始的节目列表的列表。即,如果用户说“通知列表”作为命令,则登记的“通知列表”显示在屏幕上。这里,根据用户需要可以进行列表的操作和处理。
“记录预订”被配置,以便用户预订他/她想要观看的节目的记录。即,如果用户输入关于节目的信息(广播时间、频道信息、节目题目,等等),则从设定的时间记录节目广播。
“预订列表”,是用于在数据库260中登记和保持,用户预订以被记录和通知的节目列表的列表。即,如果用户说“预订列表”作为命令,则登记的“预订列表”显示在屏幕上。这里,根据用户需要可以进行列表的操作和处理。
“记录列表”,是用于登记和保持记录在数据库260中的节目列表的列表。即,如果用户说“记录列表”作为命令,则登记的“记录列表”显示在屏幕上。这里,根据用户需要可以进行重放或删除节目。
“推荐节目”是以这种方式配置的,以便用户接收关于被该用户和其他与该用户具有相似品味的用户从内容提供者或广播站推荐的节目的信息,并且登记该信息。即,如果用户说“推荐节目”作为命令,则提供给用户推荐节目以及它上面的信息。
“按次付费频道”被配置,以当搜索或观看按次付费频道时根据通过用户鉴定(说话者识别)的用户个人信息来确定该用户是否已经被授权观看按次付费频道,并向该用户提供允许的信息。
“成人频道”被配置,以当搜索或观看有年龄限制的频道时根据通过用户鉴定(说话者识别)的用户个人信息来确定该用户是否已经被授权观看由年龄限制的频道,并仅当该用户是授权用户时向该用户提供相关的信息。
“购物频道”被配置,以当进行TV交易时根据通过用户鉴别(说话者识别)的用户个人信息来确定该用户是否已经被授权进行TV交易,并仅当该用户是授权用户时向该用户提供相关的信息。
其次,参考图3B,将描述当应用音频器件时可输入的个性化命令表。
“播放”被配置,已通过根据说出命令用户的特征信息用户鉴定(说话者识别)重放个性化歌曲列表中的歌曲。换句话说,如果用户说“播放”作为命令,重放登记在列表中的歌曲。
“依据流派选择”被配置,以依据流派例如韩国流行音乐,爵士乐,古典音乐和外国流行音乐提供个性化服务。具体地说,如果用户说出多个流派中的一种(例如,“韩国流行音乐”)作为命令,则重放该流派(韩国流行音乐)音乐。
“最喜欢的歌曲列表”,是一系列登记在数据库260中的用户最喜欢的歌曲。即,如果用户说“最喜欢的歌曲列表”作为命令,则重放登记的最喜欢的歌曲。
其间,用户能够输入并登记除前述命令之外的其它命令。
图4表示根据本发明的示例性实施例的通过话音和说话者识别提供个性化服务的方法。首先,当观看体育新闻频道时,如果用户对着安装在遥控装置中的无线麦克风说“最喜欢的频道”,话音输入单元110将由用户输入的“最喜欢的频道”命令发送给话音识别单元210。
然后,话音识别单元210识别输入命令,即“最喜欢的频道”,同时,说话者识别单元220基于输入话音执行说话者识别。
随后,话音识别单元210转发该输入命令(“最喜欢的频道”)给确定单元240,确定单元240轮流分析该转发的命令。这里,确定单元240分析该命令,并且通知服务搜索单元250转发的命令是对应于“最喜欢的频道”的命令并且已分析过的命令,即“最喜欢的频道”,是要求用户信息的个性化命令的事实。
相应地,服务搜索单元250从数据库260中提取说话者识别单元220识别的用户的信息,并且在包含于提取的用户信息中的服务列表之中搜索“最喜欢的频道”列表。
然后,控制单元230给用户提供其中一个搜索的最喜欢的频道(例如,“乡村时代”)。
其间,当观看“乡村时代”时,如果用户再一次说“最喜欢的频道”作为命令,频道变成在最喜欢的频道列表中的具有最靠近“乡村时代”的标号“午夜TV娱乐”(见图4中所示的表)。
此外,当观看“乡村时代”时,如果用户说“向下”(或“向上”)作为命令,则频道变为登记在它下面的“午夜TV娱乐”。
图5表示根据本发明的另一示例性实施例的通过话音和说话者识别提供个性化服务的方法,其中,通过话音输入提供给多个用户想要得到的频道服务。
首先,当用户看TV时,如果用户对安装在遥控装置中的无线麦克风说“最喜欢的频道”,则话音识别单元210和说话者识别单元220执行对应于输入命令“最喜欢的频道”的话音识别和说话者识别。
然后,确定单元240分析输入命令以确定用户想得到什么服务,并且将输入命令是请求个性化服务的“最喜欢的频道”确定结果通知给服务搜索单元250。
相应地,服务搜索单元250在存储在数据库260中的用户服务列表之中搜索“最喜欢的频道”的列表,并且向用户提供其中一个最喜欢的频道(例如,“滑稽音乐会”)。
其后,如果另一个用户对安装在遥控装置中的无线麦克风说“最喜欢的频道”则话音识别单元210和说话者识别单元220基于输入命令“最喜欢的频道”执行话音识别和说话者识别。此时,通过说话者识别确定已经输入命令的用户不是同一用户。
然后,确定单元240分析的用户输入的命令并且发送分析结果给服务搜索单元250,并且服务搜索单元250在存储在数据库260中的用户服务列表之中搜索“最喜欢的频道”的列表并且向用户提供其中一个最喜欢的频道(例如,“夏日气味”)。
作为本发明的另一示例性实施例,以下将描述用户通过音频部件收听音乐的情形。首先,如果该用户对安装在遥控装置中的无线麦克风说“爵士乐”作为命令,则话音输入单元110发送由用户输入的命令“爵士乐”给话音识别单元210。
然后,话音识别单元210识别该输入命令“爵士乐”,同时,说话者识别单元220基于输入话音执行用于用户的说话者识别。
随后,话音识别单元210转发输入命令(“爵士乐”)给轮流分析该转发命令的确定单元240。此时,确定单元240分析该命令(“爵士乐”)并且转发分析结果给服务搜索单元250。
相应地,服务搜索单元250从数据库260中提取由说话者识别单元220识别的关于用户的信息,并且在包含于提取的用户信息中的音乐流派之中搜索和重放爵士乐。
根据以上描述的本发明优选实施例,存在一个优点,即由于当用户通过无线麦克风输入他的/她的话音时,话音和说话者识别被同时执行,从而不用执行分离的用户鉴定处理而搜索个性化服务,并且迅速向用户提供想要得到的服务。
此外,存在另一个优点,即由于输入字(命令)可能被平等的应用到话音和说话者识别中,所以用户不需要记忆用于用户鉴别的输入字,并且不必分离地提供用于话音和说话者识别的器件。
尽管本发明是结合优选实施例来描述的,但是很明显对于本领域的技术人员,在不脱离由所附权利要求限定的本发明的精神和范围的情况下,可以对其进行各种修改和变换。因此,对本发明实施例的简单变换落于本发明的范围内。

Claims (12)

1、一种通过话音和说话者识别向用户提供个性化服务的音频/视频装置,包括:
话音识别单元,用于识别话音命令;
说话者识别单元,用于基于话音命令识别用户;
其中,当用户输入话音命令时,执行对话音命令的话音识别和说话者识别。
2、如权利要求1所述的装置,其中,所说的话音命令被输入到具有用于接收话音命令的话音输入单元的遥控装置中。
3、如权利要求1所述的装置,还包括:
确定单元,确定哪个动作与话音识别单元识别的话音命令相对应。
4、如权利要求1所述的装置,还包括:
数据库,用于存储用户信息、话音信息、关于用户的个性化服务的信息、和动作;和
服务搜索单元,用于在数据库中搜索与识别的话音命令相对应的服务和关于用户的个性化服务的信息。
5、如权利要求1所述的装置,其中,同时执行用户的话音和说话者识别。
6、一种用于通过话音和说话者识别提供个性化服务的方法,包括:
由用户输入话音命令;
识别话音命令和已输入话音命令的用户;
基于话音命令确定将执行的动作;和
根据确定的动作执行服务。
7、如权利要求6所述的方法,其中,基于话音命令确定动作的步骤,包括:
确定哪个动作与话音命令相对应;
如果确定该动作请求个性化服务,则使用存储在数据库中的用户服务信息搜索相关的服务;和
如果确定该动作不请求个性化服务,则根据话音命令搜索服务。
8、如权利要求6所述的方法,其中,动作被均等地应用在话音和说话者识别。
9、如权利要求6所述的方法,其中,所说的话音命令被输入到遥控装置中的无线麦克风。
10、如权利要求6所述的方法,其中,同时执行识别话音命令和用户。
11、如权利要求6所述的方法,其中,使用同一话音命令识别话音命令和用户。
12、如权利要求1所述的装置,其中,话音识别单元和说话者识别单元使用同一话音命令。
CNB2004100740661A 2003-09-03 2004-09-02 提供个性化服务的音频/视频装置和方法 Expired - Fee Related CN1300765C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR200361511 2003-09-03
KR0361511 2003-09-03
KR1020030061511A KR20050023941A (ko) 2003-09-03 2003-09-03 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법

Publications (2)

Publication Number Publication Date
CN1591571A true CN1591571A (zh) 2005-03-09
CN1300765C CN1300765C (zh) 2007-02-14

Family

ID=34132228

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100740661A Expired - Fee Related CN1300765C (zh) 2003-09-03 2004-09-02 提供个性化服务的音频/视频装置和方法

Country Status (5)

Country Link
US (1) US20050049862A1 (zh)
EP (1) EP1513136A1 (zh)
JP (1) JP2005078072A (zh)
KR (1) KR20050023941A (zh)
CN (1) CN1300765C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
CN103517147A (zh) * 2012-06-14 2014-01-15 三星电子株式会社 提供响应信息的显示设备、交互服务器以及方法
CN105183778A (zh) * 2015-08-11 2015-12-23 百度在线网络技术(北京)有限公司 服务提供方法和装置
CN105551491A (zh) * 2016-02-15 2016-05-04 海信集团有限公司 语音识别方法和设备
US9342576B2 (en) 2007-12-03 2016-05-17 Sony Corporation Information processing device, information processing terminal, information processing method, and program
CN106920546A (zh) * 2015-12-23 2017-07-04 小米科技有限责任公司 智能识别语音的方法及装置

Families Citing this family (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8238881B2 (en) 2001-08-07 2012-08-07 Waloomba Tech Ltd., L.L.C. System and method for providing multi-modal bookmarks
US8213917B2 (en) 2006-05-05 2012-07-03 Waloomba Tech Ltd., L.L.C. Reusable multimodal application
US8694322B2 (en) * 2005-08-05 2014-04-08 Microsoft Corporation Selective confirmation for execution of a voice activated user interface
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070157285A1 (en) * 2006-01-03 2007-07-05 The Navvo Group Llc Distribution of multimedia content
WO2007081682A2 (en) * 2006-01-03 2007-07-19 The Navvo Group Llc Distribution of multimedia content
US20070156853A1 (en) * 2006-01-03 2007-07-05 The Navvo Group Llc Distribution and interface for multimedia content and associated context
US9928510B2 (en) * 2006-11-09 2018-03-27 Jeffrey A. Matos Transaction choice selection apparatus and system
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR100913130B1 (ko) * 2006-09-29 2009-08-19 한국전자통신연구원 사용자 프로파일을 이용한 음성 인식 서비스 방법 및 장치
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
DE102009051508B4 (de) * 2009-10-30 2020-12-03 Continental Automotive Gmbh Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung
US8886541B2 (en) * 2010-02-04 2014-11-11 Sony Corporation Remote controller with position actuatated voice transmission
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110307250A1 (en) * 2010-06-10 2011-12-15 Gm Global Technology Operations, Inc. Modular Speech Recognition Architecture
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8453058B1 (en) * 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9288421B2 (en) * 2012-07-12 2016-03-15 Samsung Electronics Co., Ltd. Method for controlling external input and broadcast receiving apparatus
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
JP6348903B2 (ja) * 2013-06-10 2018-06-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 話者識別方法、話者識別装置及び情報管理方法
KR20150012464A (ko) * 2013-07-25 2015-02-04 삼성전자주식회사 디스플레이 장치 및 개인화 서비스 제공 방법
KR101531848B1 (ko) * 2013-11-20 2015-06-29 금오공과대학교 산학협력단 사용자 중심의 내비게이션 통신장치
US9900177B2 (en) 2013-12-11 2018-02-20 Echostar Technologies International Corporation Maintaining up-to-date home automation models
US20150163412A1 (en) 2013-12-11 2015-06-11 Echostar Technologies, Llc Home Monitoring and Control
US9769522B2 (en) 2013-12-16 2017-09-19 Echostar Technologies L.L.C. Methods and systems for location specific operations
US9450812B2 (en) 2014-03-14 2016-09-20 Dechnia, LLC Remote system configuration via modulated audio
US9723393B2 (en) 2014-03-28 2017-08-01 Echostar Technologies L.L.C. Methods to conserve remote batteries
US10089985B2 (en) * 2014-05-01 2018-10-02 At&T Intellectual Property I, L.P. Smart interactive media content guide
US20150336786A1 (en) * 2014-05-20 2015-11-26 General Electric Company Refrigerators for providing dispensing in response to voice commands
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102246900B1 (ko) 2014-07-29 2021-04-30 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US9621959B2 (en) 2014-08-27 2017-04-11 Echostar Uk Holdings Limited In-residence track and alert
US9824578B2 (en) 2014-09-03 2017-11-21 Echostar Technologies International Corporation Home automation control using context sensitive menus
US9989507B2 (en) 2014-09-25 2018-06-05 Echostar Technologies International Corporation Detection and prevention of toxic gas
JP6129134B2 (ja) * 2014-09-29 2017-05-17 シャープ株式会社 音声対話装置、音声対話システム、端末、音声対話方法およびコンピュータを音声対話装置として機能させるためのプログラム
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9983011B2 (en) 2014-10-30 2018-05-29 Echostar Technologies International Corporation Mapping and facilitating evacuation routes in emergency situations
US9511259B2 (en) 2014-10-30 2016-12-06 Echostar Uk Holdings Limited Fitness overlay and incorporation for home automation system
CN104505091B (zh) * 2014-12-26 2018-08-21 湖南华凯文化创意股份有限公司 人机语音交互方法及系统
US9967614B2 (en) 2014-12-29 2018-05-08 Echostar Technologies International Corporation Alert suspension for home automation system
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9729989B2 (en) 2015-03-27 2017-08-08 Echostar Technologies L.L.C. Home automation sound detection and positioning
US9948477B2 (en) 2015-05-12 2018-04-17 Echostar Technologies International Corporation Home automation weather detection
US9946857B2 (en) 2015-05-12 2018-04-17 Echostar Technologies International Corporation Restricted access for home automation system
US9632746B2 (en) 2015-05-18 2017-04-25 Echostar Technologies L.L.C. Automatic muting
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
KR102398488B1 (ko) * 2015-06-26 2022-05-13 엘지전자 주식회사 복수의 디바이스에 대한 원격제어를 수행할 수 있는 이동 단말기
US9960980B2 (en) 2015-08-21 2018-05-01 Echostar Technologies International Corporation Location monitor and device cloning
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US9996066B2 (en) 2015-11-25 2018-06-12 Echostar Technologies International Corporation System and method for HVAC health monitoring using a television receiver
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10101717B2 (en) 2015-12-15 2018-10-16 Echostar Technologies International Corporation Home automation data storage system and methods
US9798309B2 (en) 2015-12-18 2017-10-24 Echostar Technologies International Corporation Home automation control based on individual profiling using audio sensor data
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10091017B2 (en) 2015-12-30 2018-10-02 Echostar Technologies International Corporation Personalized home automation control based on individualized profiling
US10060644B2 (en) 2015-12-31 2018-08-28 Echostar Technologies International Corporation Methods and systems for control of home automation activity based on user preferences
US10073428B2 (en) 2015-12-31 2018-09-11 Echostar Technologies International Corporation Methods and systems for control of home automation activity based on user characteristics
WO2017128040A1 (zh) * 2016-01-26 2017-08-03 深圳市柔宇科技有限公司 头戴式设备、耳机装置及头戴式设备分离控制方法
US9628286B1 (en) 2016-02-23 2017-04-18 Echostar Technologies L.L.C. Television receiver and home automation system and methods to associate data with nearby people
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
GB2583988B (en) * 2016-06-06 2021-03-31 Cirrus Logic Int Semiconductor Ltd Voice user interface
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US9882736B2 (en) 2016-06-09 2018-01-30 Echostar Technologies International Corporation Remote sound generation for a home automation system
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
CN107527613A (zh) * 2016-06-21 2017-12-29 中兴通讯股份有限公司 一种视频业务控制方法、移动终端及业务服务器
US10294600B2 (en) 2016-08-05 2019-05-21 Echostar Technologies International Corporation Remote detection of washer/dryer operation/fault condition
US10049515B2 (en) 2016-08-24 2018-08-14 Echostar Technologies International Corporation Trusted user identification and management for home automation systems
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
WO2018101459A1 (ja) 2016-12-02 2018-06-07 ヤマハ株式会社 コンテンツ再生機器、収音機器、及びコンテンツ再生システム
WO2018101458A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 収音機器、コンテンツ再生機器、及びコンテンツ再生システム
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
KR101883301B1 (ko) 2017-01-11 2018-07-30 (주)파워보이스 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버
CN107147618B (zh) * 2017-04-10 2020-05-15 易视星空科技无锡有限公司 一种用户注册方法、装置及电子设备
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
JP6927308B2 (ja) * 2017-07-26 2021-08-25 日本電気株式会社 音声操作装置及びその制御方法
KR101891698B1 (ko) * 2018-03-02 2018-08-27 주식회사 공훈 화자의 위치정보를 이용한 음성 인식을 통한 화자 식별 시스템 및 방법
JP2019193134A (ja) * 2018-04-26 2019-10-31 シャープ株式会社 表示装置、テレビ受信装置及び表示方法
US11017782B2 (en) * 2018-11-14 2021-05-25 XMOS Ltd. Speaker classification
JP7017643B2 (ja) * 2018-12-03 2022-02-08 グーグル エルエルシー テキスト非依存話者認識
JP7254316B1 (ja) 2022-04-11 2023-04-10 株式会社アープ プログラム、情報処理装置、及び方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717743A (en) * 1992-12-16 1998-02-10 Texas Instruments Incorporated Transparent telephone access system using voice authorization
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
EP1147513A1 (en) * 1998-12-29 2001-10-24 Alcatel USA Sourcing, L.P. Security and user convenience through voice commands
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
US6324512B1 (en) * 1999-08-26 2001-11-27 Matsushita Electric Industrial Co., Ltd. System and method for allowing family members to access TV contents and program media recorder over telephone or internet
US6339706B1 (en) * 1999-11-12 2002-01-15 Telefonaktiebolaget L M Ericsson (Publ) Wireless voice-activated remote control device
CN1101025C (zh) * 1999-11-19 2003-02-05 清华大学 语音命令控制器的训练与识别方法
CN1123862C (zh) * 2000-03-31 2003-10-08 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
EP1189206B1 (en) * 2000-09-19 2006-05-31 Thomson Licensing Voice control of electronic devices
DE10111121B4 (de) * 2001-03-08 2005-06-23 Daimlerchrysler Ag Verfahren zur Sprechererkennung für die Bedienung von Geräten
FR2823361A1 (fr) * 2001-04-05 2002-10-11 Thomson Licensing Sa Procede et dispositif d'extraction acoustique d'un signal vocal
JP2004533752A (ja) * 2001-04-13 2004-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 対話システムにおける話し手の認証
US7519534B2 (en) * 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9342576B2 (en) 2007-12-03 2016-05-17 Sony Corporation Information processing device, information processing terminal, information processing method, and program
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
CN103187053B (zh) * 2011-12-31 2016-03-30 联想(北京)有限公司 输入方法和电子设备
CN103517147A (zh) * 2012-06-14 2014-01-15 三星电子株式会社 提供响应信息的显示设备、交互服务器以及方法
CN105183778A (zh) * 2015-08-11 2015-12-23 百度在线网络技术(北京)有限公司 服务提供方法和装置
CN106920546A (zh) * 2015-12-23 2017-07-04 小米科技有限责任公司 智能识别语音的方法及装置
CN106920546B (zh) * 2015-12-23 2020-03-20 小米科技有限责任公司 智能识别语音的方法及装置
CN105551491A (zh) * 2016-02-15 2016-05-04 海信集团有限公司 语音识别方法和设备

Also Published As

Publication number Publication date
CN1300765C (zh) 2007-02-14
US20050049862A1 (en) 2005-03-03
JP2005078072A (ja) 2005-03-24
EP1513136A1 (en) 2005-03-09
KR20050023941A (ko) 2005-03-10

Similar Documents

Publication Publication Date Title
CN1300765C (zh) 提供个性化服务的音频/视频装置和方法
US9854315B1 (en) Systems and methods for broadcast audience interaction and participation
US9563699B1 (en) System and method for matching a query against a broadcast stream
JP4528763B2 (ja) インターネットからデータをストリーミングするリアルタイム記録エージェント
JP5828501B2 (ja) 番組コンテキストに基づくモバイルコンテンツの提示
CN101616292B (zh) 信息处理设备、信息处理方法和信息处理系统
US20040143349A1 (en) Personal audio recording system
CN1943222A (zh) 用于控制媒体内容处理设备的方法和媒体内容处理设备
CN1753502A (zh) 提供广告音乐的系统和方法
CN1383328A (zh) 推荐节目的方法及其系统
EP2342849A2 (en) Methods and devices for communications between two devices
CN102169489A (zh) 信息处理装置、关键字注册方法和程序
CN1581942A (zh) 具有声级控制功能的视频显示装置及其控制方法
JP5583279B2 (ja) 移動体用放送受信装置および放送受信方法
CN101180633A (zh) 用于检测内容项目边界的方法和设备
CN100546267C (zh) 用于处理信息的系统、装置、方法、记录介质和计算机程序
CN1653814A (zh) 具有改进的用户接口的系统
EP1579679A1 (en) Audio signal identification method and system
US7965975B2 (en) On demand, network radio and broadcast method
CN1781309A (zh) 用于自动搜索可通过网络访问的信息源以得到满足预定标准的内容的方法和设备
CN1286316C (zh) 以电视接收机为基础的音频和视频合成编辑装置
KR102452245B1 (ko) 음악재생기에서 오디오 비디오 연동방법
KR100703852B1 (ko) 디지털 방송 수신이 가능한 이동 전화 단말기에 프로그램 정보를 제공하는 시스템
WO2005117437A1 (en) Method of retrieving epg data for broadcast items in a remote area
JP3565261B2 (ja) データ検索方法、情報提供システム、および記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070214

Termination date: 20180902