CN102799603A - 提供链接列表的方法和应用所述方法的显示设备 - Google Patents

提供链接列表的方法和应用所述方法的显示设备 Download PDF

Info

Publication number
CN102799603A
CN102799603A CN2012101269533A CN201210126953A CN102799603A CN 102799603 A CN102799603 A CN 102799603A CN 2012101269533 A CN2012101269533 A CN 2012101269533A CN 201210126953 A CN201210126953 A CN 201210126953A CN 102799603 A CN102799603 A CN 102799603A
Authority
CN
China
Prior art keywords
voice
link
index
tabulation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101269533A
Other languages
English (en)
Inventor
黄炳进
柳映准
李蕙汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120026328A external-priority patent/KR20130004050A/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN102799603A publication Critical patent/CN102799603A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种在显示设备上提供链接列表的方法和应用所述方法的显示设备。所述方法包括:识别用户发出的语音;在显示设备当前显示的网页中包括的链接中搜索包括与用户发出的语音一致的索引的链接;产生一个或多个链接的列表,所述一个或多个链接中的每一个包括与用户发出的语音一致的索引。

Description

提供链接列表的方法和应用所述方法的显示设备
本申请要求于2011年4月28日在韩国知识产权局提交的第10-2011-0040322号韩国专利申请和于2012年3月15日在韩国知识产权局提交的第10-2012-0026328号韩国专利申请的优先权,所述申请的整个公开包含于此以资参考。
技术领域
与示例性实施例一致的设备和方法涉及一种使用语音识别提供链接列表的方法和应用所述方法的显示设备,更具体地讲,涉及一种提供链接列表的方法(所述链接列表提供包括网页中所包括的链接中的至少一个链接的列表)和应用所述方法的显示设备。
背景技术
即使在诸如电视(TV)或移动装置以及个人计算机(PC)的显示设备中,使用网页浏览器进行网页浏览正变得普通。
在现有技术中为了选择TV中的网页上显示的链接,使用了通过如下操作选择链接的方法:使用四方向键向上、向下、向左和向右移动高亮类型的光标,或者使用鼠标定点类型进行定点和选择。
然而,由于TV中通常不包括诸如触摸板或鼠标指针的输入设备,并且使用在诸如智能电话的具有小显示屏的移动装置中触摸和选择小尺寸的链接的方法,所以存在用户选择到不期望的链接的多种情况。
因此,需要一种使用户更简单并准确地执行网页中包括的链接的方法。
发明内容
一个或多个示例性实施例可克服以上缺点和以上没有描述的其他缺点。然而,应该理解,一个或多个示例性实施例不需要克服上述缺点,并且可不克服以上描述的任何问题。
一个或多个示例性实施例提供了一种提供链接列表的方法和应用所述方法的显示设备,其中,所述方法和显示设备在当前显示的网页中包括的链接中搜索包括与通过语音识别单元识别的语音一致的索引的链接,并使用搜索结果产生包括链接的列表,所述链接包括与识别的语音一致的索引。
根据示例性实施例的一方面,一种显示设备的提供链接列表的方法包括以下步骤:识别用户发出的语音;在当前连接的网页中包括的链接中搜索包括与识别的语音一致的索引的链接;使用搜索结果产生包括链接的列表,所述链接包括与识别的语音一致的索引。
所述方法还可包括:如果重新识别出用户的语音,则根据新识别的语音执行列表中包括的链接之一。
所述方法还可包括:如果作为搜索结果存在包括与识别的语音一致的索引的一个链接,则立即执行包括与识别的语音一致的索引的链接,如果存在包括与识别的语音一致的索引的多个链接,则产生步骤可包括:产生包括与识别的语音一致的索引的多个链接的列表。
所述方法还可包括:如果新识别出用户的语音,则改变列表,以反映最新识别结果。
改变列表的步骤可包括:以如下方式改变列表作为新识别的结果:从列表中删除包括与新识别的语音不一致的索引的链接,仅保留包括与新识别的语音一致的索引的链接。
改变列表的步骤还可包括:高亮和显示列表中包括的链接的索引中与先前识别的语音和新识别的语音一致的索引。
如果通过外部输入设备选择了特定区域,则产生列表的步骤可包括:显示包括所述特定区域中所包括的链接的列表。
如果用户发出的语音中包括预设词,则产生列表的步骤可包括:显示包括在网页内被呈现为图像的链接的列表。
所述方法还可包括:提取被显示的网页中包括的链接的索引。
识别用户的输入语音的步骤可包括:使用包括麦克风的外部语音识别设备识别用户的语音。
显示设备可以是从包括计算机、电视(TV)、智能电话和便携式媒体播放器(PMP)的组中选择的任何一个。
所述方法还可包括:如果没有链接与识别的语音一致,或者用户的语音无法被识别,则显示引导消息以通知语音无法被识别。
链接列表可包括用于返回先前搜索结果的先前项和用于取消列表的取消项中的至少一个。
根据示例性实施例的一方面,一种显示设备包括:通信单元,经网络连接到网页;显示单元,显示网页;语音识别单元,识别用户发出的语音;和控制单元,在通过通信单元当前连接的网页中包括的链接之中搜索包括与识别的语音一致的索引的链接,并产生包括链接的列表,所述链接包括与识别的语音一致的索引。
如果重新识别出用户语音,则控制单元可根据新识别的语音来执行列表中包括的链接之一。
如果作为搜索结果存在一个包括与识别的语音一致的索引的链接,则控制单元可包括立即执行包括与识别语音一致的索引的链接,如果存在多个包括与识别的语音一致的索引的链接,则控制单元可包括产生链接的列表,所述链接包括与识别的语音一致的索引。
如果重新识别出用户的语音,则控制单元可改变列表以反映新识别结果。
控制单元可根据新识别的结果按如下方式改变列表:从列表中删除包括与新识别的语音不一致的索引的链接,仅保留包括与新识别的语音一致的索引的链接。
控制单元可高亮和显示列表中包括的链接的索引之中的与先前识别的语音和新识别的语音一致的索引。
如果通过外部输入设备选择了特定区域,则控制单元可控制显示单元显示包括所述特定区域中所包括的链接的列表。
如果识别的语音中包括预设词,则控制单元可控制显示单元显示包括在网页内被呈现为图像的链接的列表。
显示设备还可包括:索引提取单元,提取被显示的网页中包括的链接的索引。
语音识别单元可使用包括麦克风的外部语音识别设备来识别用户的输入语音。
显示设备可以是从包括计算机、电视(TV)、智能电话和便携式媒体播放器(PMP)的组中选择的任何一个。
如果不存在与识别的语音一致的链接,或者用户的语音无法被识别,则控制单元可显示引导消息以通知语音无法被识别。
链接列表可包括用于返回先前搜索结果的先前项和用于取消列表的取消项中的至少一个。
示例性实施例的其他方面和优点将在详细的描述中被阐述,从详细的描述将是明显的,或者可通过实践示例性实施例被获知。
附图说明
通过参照附图对示例性实施例的详细描述,以上和/或其他方面将更清楚,其中:
图1是示意性示出根据示例性实施例的显示设备的框图;
图2是示出根据示例性实施例的电视(TV)的详细框图;
图3A和图3B是示出根据示例性实施例的在包括与识别的语音一致的索引的链接是一个的情况下提供链接列表的方法的示图;
图4A和图4B是示出根据示例性实施例的通过反映新识别结果来改变列表的方法的示图;
图5A和图5B是示出根据另一示例性实施例的通过反映新识别结果来改变列表的方法的示图;
图6A至图6C是示出根据示例性实施例的使用外部输入设备和语音识别来执行链接的方法的示图;
图7A至图7C是示出根据示例性实施例的选择和执行被呈现为图像的链接的方法的示图;
图8是简要示出根据示例性实施例的显示设备的提供链接列表的方法的流程图;
图9是详细示出根据示例性实施例的显示设备的提供链接的方法的流程图;
图10是示出根据示例性实施例的使用分散语音识别系统执行链接的方法的示图。
具体实施方式
以下,将参照附图更详细地描述示例性实施例。
在下面的描述中,当在不同的附图中描述相同的元件时,对相同的元件使用相同的标号。提供了在说明书中定义的内容(例如,详细的结构和元件),以帮助全面理解示例性实施例。因此,清楚的是不用那些特别定义的内容也可执行示例性实施例。另外,现有技术中公知的功能或元件不被详细描述,这是因为对现有技术中公知的功能或元件的详细描述会因不必要的细节而模糊示例性实施例。
图1是示出根据示例性实施例的显示设备100的示意性框图。如图1所示,显示设备100包括索引提取单元110、语音识别单元120、控制单元130、显示单元140和通信单元150。
索引提取单元110提取通过显示单元140当前显示的网页中包括的链接的索引。如这里所使用的,“索引”是与网页的脚本中包括的链接相应的至少一个关键词。
语音识别单元120识别用户发出的语音。具体地讲,语音识别单元120分析从嵌入到电视(TV)(图2中的200)中的麦克风或外部麦克风输入的、由用户发出的语音的波形,区分与用户发出的语音相应的词或词序列,并将区分的词识别为文本信息。语音识别单元120可被包括在显示设备100中,或者可通过外部语音输入设备被实现。
控制单元130在通过通信单元150当前连接的网页中包括的链接中搜索包括与通过语音识别单元120识别的语音一致的索引的链接,并使用搜索结果执行包括与识别的语音一致的索引的链接。
具体地讲,控制单元130将从网页的脚本中提取的链接的索引顺序地与通过语音识别单元120识别的语音进行比较,并搜索包括与识别的语音一致的索引的链接。
控制单元130确定包括与识别的语音一致的索引的连接是否为一个。换句话讲,控制单元130确定是只有一个链接包括与识别的语音一致的索引,还是有多于一个的链接包括所述索引。如果包括与识别的语音一致的索引的链接的数量是1,则控制单元130立即执行包括与识别的语音一致的索引的链接,并在显示单元140上显示链接的网页。
如果包括与识别的语音一致的索引的链接的数量是多个链接,则控制单元130产生并显示包括多个链接的列表,所述多个链接包括与识别的语音一致的索引。此时,在列表中还显示与所述多个链接相应的索引和数量。
如果通过语音识别单元120重新识别了用户的语音,则控制单元130根据新识别的语音执行列表中包括的链接之一。具体地讲,如果在显示单元140上显示了列表,并且通过语音识别单元120识别出用户希望选择的链接或者相应的数字,则控制单元130执行列表中包括的链接中的与识别的语音相应的链接。
另外,如果通过语音识别单元120重新识别出用户的语音,则控制单元130将列表改变成反映新识别结果的列表。具体地讲,控制单元130可按如下方式改变列表:删除包括多个链接的列表中的与新识别的语音不一致的链接,并且只保留与新识别的语音一致的链接。此外,控制单元130可高亮并显示列表中显示的链接的索引中的与第一次识别的语音和新识别的语音一致的索引。
显示单元140根据控制单元130的控制来显示网页。
通信单元150通过连接到外部网络来与包括多个链接的网页连接,并且连接的网页被显示在显示单元140上。
用户可通过上述可识别语音的显示设备100更方便且准确地选择和执行网页的链接。
以下,将参照图2至图7C描述根据示例性实施例的提供TV 200的链接列表的方法。
图2是示出根据示例性实施例的TV 200的详细框图。如图2所示,TV 200包括通信单元215、视频输入单元210、音频/视频(A/V)处理单元220、显示单元230、索引提取单元240、语音识别单元250、控制单元260、图形用户界面(GUI)产生单元270和定点装置280。同时,根据示例性实施例的索引提取单元240、语音识别单元250、控制单元260和GUI产生单元270可被实现为至少一个CPU、处理器等。
视频输入单元210(还被称为图像输入单元)包括多个输入端,通过输入端从外部设备(例如,视频播放器或数字通用盘(DVD)播放器)和外部网络接收诸如分量视频信号、超视频家庭系统(S-VHS)视频信号、合成视频信号等的输入,并输入与每个视频信号相应的音频信号。
通信单元215通过连接到外部网络来与包括多个链接的网页连接。此时,通信单元215可在控制单元260的控制下经网络连接到外部设备(例如,服务器)。通信单元215可被实现为以太网、无线LAN和蓝牙中的至少一个。
A/V处理单元220对从视频输入单元210和通信单元215接收的视频信号和音频信号执行信号处理(例如,视频解码、视频缩放或音频缩放)。A/V处理单元220将视频信号输出到显示单元230。
显示单元230显示从A/V处理单元220输出的视频信号。此外,显示单元230可显示通过通信单元215加载的网页。显示单元230可通过添加GUI产生单元270产生的GUI来显示视频。
索引提取单元240提取在显示单元230显示的网页中包括的链接的索引。具体地讲,索引提取单元240对网页的脚本中包括的链接的文本信息执行解析,并提取索引。提取的索引可以是链接中包括的文本信息中的有意义的关键词。此外,提取的索引可被存储在存储单元(未示出)中。
语音识别单元250识别用户发出的语音,并将识别的语音输出为文本信息。具体地讲,语音识别单元250分析通过TV 200中嵌入的麦克风或有线/无线连接到TV 200的麦克风而输入的用户所发出的语音的特征波形(即,语音的特征向量),区分与用户发出的语音相应的词或词序列,并将区分的字输出为文本信息。
尽管以上描述的实施例示出了语音识别单元250嵌入在TV 200中或者连接到TV 200的配置,这仅为一个实施例,可通过其他的语音识别设备来识别用户发出的语音。
例如,语音识别单元250可通过外部语音输入设备(例如,包括麦克风的智能电话、平板电脑(PC)或遥控器)被实现。具体地讲,语音识别单元250可通过外部语音输入设备识别用户发出的语音,将识别的语音转换成文本信息,并将转换的文本信息发送到TV 200。外部语音输入设备和TV 200可通过使用无线保真(Wi-Fi)或蓝牙来发送和接收文本信息。
GUI产生单元270产生将被提供给用户的GUI。GUI产生单元270可产生作为在屏显示(OSD)类型提供的用户菜单的GUI。
如果包括与由语音识别单元250识别的语音一致的索引的链接是多个链接,则GUI产生单元270将包括所述多个链接(所述多个链接包括与识别的语音一致的索引)的列表产生为在屏显示(OSD)类型。具体地讲,如果多个链接被找到(每个链接均包括与识别的语音一致的索引),则GUI产生单元270提取找到的链接的索引,并对提取的索引编号,以将列表410产生为在屏显示(OSD)类型,如图4A或图4B所示。如图4B所示,列表410可包括用于返回先前搜索结果的返回项413和用于取消列表的取消项416。如果语音“先前”或“取消”通过语音识别单元250被识别,或使用定点装置280被选择,则返回项413或取消项416可被执行。因此,如果由于用户语音没有被合适地识别(例如,无意识的用户语音被识别)而找到不期望的链接,则可使用返回项413或取消项416来取消搜索结果。
此外,如果通过定点装置280选择了特定区域,则GUI产生单元270将包括特定区域中所包括的链接的列表产生为在屏显示(OSD)类型。如果特定的语言被识别以选择被呈现为图像的链接,则GUI产生单元270将包括被呈现为图像的链接的列表产生为在屏显示(OSD)类型。
此外,如果通过语音识别单元250重新识别出用户的语音,则GUI产生单元270可通过反映新识别结果来改变列表,这将参照图4A至图5B被详细解释。
定点装置280是外部输入设备,其接收用户输入,并将用户输入发送到控制单元260。具体地讲,定点装置280接收链接选择命令等,并将接收的链接选择命令传送到控制单元260。例如,定点装置280可以是相关映射类型的定点装置(例如,遥控器、鼠标、键区或触摸板)或直接映射类型的直接定点装置。
控制单元260从而根据用户的操作控制TV 200的整体功能。
具体地讲,控制单元260在当前连接的网页中包括的链接中搜索包括与通过语音识别单元250识别的语音一致的索引的链接,并使用搜索结果提供包括具有与识别语音一致的索引的链接。控制单元260根据用户输入执行列表中包括的多个链接之一。此时,当前连接的网页不仅包括当前显示在显示单元230上的网页,还包括随着屏幕被诸如滚动的操作移动而被显示的网页。
具体地讲,控制单元260通过将语音识别单元250识别的语音与从索引提取单元240提取的链接的索引进行比较来搜索包括与识别的语音一致的索引的链接。
控制单元260确定包括与识别的语音一致的索引的链接是单个链接还是多个链接。如果包括与识别的语音一致的索引的链接的数量是一,则控制单元260立即执行包括与识别的语音一致的索引的链接,并在显示单元230上显示链接的网页。
例如,当用户在诸如图3A示出的网页的网页被连接的同时发出“Suwon”时,语音识别单元250区分用户发出的语音,并输出被称为“Suwon”的文本信息。控制单元260搜索用户发出的字“Suwon”与网页中包括的链接的索引是否一致。作为搜索结果,当包括索引“Suwon”的链接只有一个(“Hikein housing prices in Suwon area”)时,控制单元260立即执行链接310“Hike inhousing prices in Suwon area”,并如图3B所示显示链接的网页屏幕。
然而,当包括与识别的语音一致的索引的链接的数量是多个时,控制单元260产生包括具有与识别的语音一致的索引的多个链接的列表,并显示所述列表。具体地讲,控制单元260将从当前连接的网页的脚本中提取的链接的索引顺序地与通过语音识别单元250识别的语音进行比较,并搜索包括与识别的语音一致的索引的链接。控制单元260将搜索到的链接的索引编号,并将列表产生为在屏显示(OSD)类型,并在显示单元230进行显示。
例如,如果用户发出“Samsung”,则语音识别单元250区分用户发出的语音,并输出被称为“Samsung”的文本信息。控制单元260确定用户发出的词“Samsung”是否与网页中包括的链接的索引一致。
作为搜索结果,如果存在三个包括被称为“Samsung”的索引的链接(“Samsung Electronics,hidden for 40years...”、“Samsung Electronics,R&Dinvestment top 10in the world”和“...chosen by conservative SamsungElectro-mechanics”),则控制单元260产生包括这三个链接的列表,如图4A和图5A所示。
如果通过语音识别单元250重新识别出用户的语音,则控制单元根据新识别的语音执行列表中包括的链接之一。如果通过语音识别单元250重新识别出链接的索引或其相应的编号,则控制单元260执行与新识别的用户语音相应的链接。例如,如果识别出用户语音“work”或“Samsung Electronics,hiddenfor 40years”,则控制单元260可执行作为与识别出的语音相应的链接的“Samsung Electronics,hidden for 40years”。
为了执行列表中包括的链接之一,可使用诸如定点装置280的外部设备。
如果通过语音识别单元250重新识别出用户的语音,则控制单元260可改变列表以反映新识别结果。
具体地讲,控制单元260可按这样的方式改变列表:从列表删除与新识别的语音不一致的链接,并保留与新识别的语音一致的链接。例如,在如图4A所示显示列表的状态下,如果用户发出“Electronics”,则语音识别单元250区分用户发出的“Electronics”,并输出称为“Electronics”的文本信息。控制单元260确定用户新发出的词“Electronics”与列表中包括的链接的索引是否一致。
作为新识别结果,如果列表中包括的链接中的两个链接包括索引“electronic”(“Samsung Electronics,hidden for 40years...”和“SamsungElectronics,R&B investment top 10in the world...”),则控制单元260按如下方式改变列表:从列表中删除不包括索引“electronics”的一个链接(“...chosenby conservative Samsung Electro-mechanics”),只保留包括索引“Electronics”的两个索引,如图4B所示。
作为另一示例,控制单元260可按如下方式改变列表:在列表中显示的链接的索引中,只有与用户发出的语音以及用户新发出的语音一致的索引被高亮。例如,在如图5B所示显示列表的状态下,用户发出“Electronics”,则控制单元260识别出词“Electronics”,并搜索列表中包括的链接的索引。
作为新搜索结果,如果列表中包括的链接中存在包括索引“Electronics”的链接,则控制单元260高亮并显示列表中呈现的链接中的先前识别的“Samsung”和新识别的“Electronics”,如图5B所示。
此外,控制单元260可根据新搜索结果重新布置列表中呈现的链接的顺序。例如,如果列表中呈现3个链接,则当新识别的语音与第二显示的链接一致时,控制单元260可改变列表以使第二显示的链接被第一显示。
以下,控制单元260可通过根据用户输入选择列表中呈现的链接中的一个链接来执行所述一个链接。作为用户输入,用户可发出列表中呈现的链接号,或者可连续发出语音以搜索一个链接,或者外部输入设备可被使用。
例如,在如图4B所示显示列表的状态下,如果用户发出“2”,则语音识别单元250再次输出被称为“2”的文本信息。以下,控制单元260在列表410中包括的多个链接中搜索编号为“2”的链接,并立即执行列表410中包括的链接中的包括索引“2”的链接“Samsung Electronics,R&D investment top10in the world”。
作为另一示例,在如图4B所示显示列表的状态下,如果用户发出“investment”,则语音识别单元250输出被称为“investment”的文本信息。以下,控制单元260在列表中包括的多个链接中搜索包括索引“investment”的链接。如果在列表中显示的多个链接中存在一个包括“investment”的链接,则控制单元260立即执行作为包括索引“investment”的链接的链接“SamsungElectronics,R&D investment top 10in the world”。
作为另一示例,在如图4B所示显示列表的状态下,控制单元260可通过诸如触摸板或鼠标的定点装置280的输入来执行列表中呈现的链接之一。
此外,当通过定点装置280选择了特定区域时,控制单元260控制显示单元230显示包括链接的列表,所述链接是包括在当前连接的网页中的链接之中的被包括在所述特定区域中的链接。控制单元260根据通过语音识别单元250识别的语音选择列表中的链接之一,并执行该链接。
例如,当定点装置280的指针位于特定点时,控制单元260选择特定区域610,所述特定区域610是距离定点装置280的指针所在的特定点预设距离内的区域。
如图6B所示,控制单元260产生列表620,所述列表620包括指针605所在的特定区域610中包括的链接。当用户发出“Suwon”时,控制单元260选择和执行图6B的列表620中包括的链接中的包括“Suwon”的链接“Hikein housing prices in Suwon area”。因此,如图6C所示,控制单元260控制显示单元230显示链接“Hike in housing prices in Suwon area”被链接到的网页。
通过如图6A至图6C所示的实施例,即使在由于显示屏小(例如,智能电话)而无法正常触摸期望的触摸点的设备中,也可更准确地选择链接。
此外,为了选择被呈现为图像的链接,当识别的语音包括预设字时,控制单元260控制显示单元230显示在当前连接的网页内被呈现为图像的链接,并根据通过语音识别单元250识别的语音执行列表中包括的链接之一。
例如,在如图7A所示连接网页的同时,如果用户发出“image”,则控制单元260在网页中搜索被呈现为图像的链接。作为搜索结果,存在三个被呈现为图像的链接(“OO  RESORT”、“LAST”和“EVERYDAY KNOWLEDGESHOPPING”),控制单元260产生如图7B所示的包括三个链接的列表。产生的列表710中的链接可如在网页中那样被呈现为图像。然而,这仅为一个实施例,可以以诸如统一资源定位符(URL)的另一呈现类型来产生列表。
另一方面,在显示列表710的状态下,如果用户发出“1”,则控制单元260搜索包括索引“1”的链接,并执行包括索引“1”的链接(“OO RESORT”)。因此,如图7C所示,控制单元260控制显示单元230显示与“OO RESORT”链接的网页。
同时,如果不存在与通过语音识别单元250识别的用户语音一致的链接,或者难以识别用户语音(例如,用户发音太轻或者不清楚),则控制单元260可显示引导消息以通知无法识别语音。此时,引导消息可包括关于语音识别失败的信息和请求再次识别语音的消息。
如上所述,通过用户的语音提供了链接列表,并且链接被执行,从而可更准确和方便地执行链接。
以下,将参照图8和图9描述显示设备100的提供链接列表的方法。图8是简要示出根据示例性实施例的提供链接列表的方法的流程图。
首先,显示设备100显示当前连接的网页(S810)。此时,当前连接的网页不仅包括在显示单元230上当前显示的网页,还包括可随着屏幕通过诸如滚动的操作移动而被显示的网页。另外,显示的当前连接的网页包括至少一个链接。
显示设备100识别用户发出的语音(S820)。具体地讲,显示设备100对用户发出的语音的波形执行解析,区分与用户发出的语音相应的词或词序列,并将区分的词或词序列输出为文本信息。
显示设备100搜索包括与识别的语音相应的索引的链接(S830)。具体地讲,显示设备100通过将识别的语音和从显示屏中包括的超链接提取的链接进行比较来搜索包括与识别的语音一致的索引的链接。
另外,显示设备100产生包括多个链接的列表,所述多个链接包括与识别的语音一致的索引(S840)。具体地讲,如果包括与识别的语音一致的索引的链接是多个链接,则显示设备100产生多个链接的索引及其相应编号的列表,并将其显示为在屏显示(OSD)类型。
如上所述,包括识别的用户语音的多个链接的列表被产生,从而用户可更方便和准确地执行链接。
图9是详细示出根据示例性实施例的提供链接的方法的流程图。
显示设备100显示当前连接的网页(S910)。网页包括至少一个链接。
显示设备100识别用户发出的语音(S920)。具体地讲,显示设备100对用户发出的语音的波形执行解析,识别与发出的语音相应的词或词序列,并将识别的词或词序列输出为文本信息。
显示设备100搜索包括与识别的语音一致的索引的链接(S930)。具体地讲,显示设备100将识别的语音和从屏幕上显示的超连接提取的索引进行比较,以搜索包括与识别的语音一致的索引的链接。
显示设备100确定是存在一个还是存在多个包括与识别的语音一致的索引的链接(S940)。
如果存在一个包括与识别的语音一致的索引的链接(S940为是),则显示设备100立即执行包括与识别的语音一致的索引的链接(S950)。
如果存在多个包括与识别的语音一致的索引的链接(S940为否),则显示设备100产生包括与识别的语音一致的索引的多个链接的列表(S960)。具体地讲,如果存在多个包括与识别的语音一致的索引的链接,则显示设备100产生多个链接的索引及其相应编号的列表,并将其显示为在屏显示(OSD)类型。
显示设备100确定是否存在用户发出的新语音,如果是,则重新识别用户的语音(S970)。如果不存在用户发出的新语音,则不重新进行语音识别(S970为否),并且显示设备100根据用户输入选择列表中当前显示的链接之一(S990),并执行选择的链接(S950)。
然而,如果存在新识别的用户语音(S970为是),则显示设备100改变列表以反映新识别结果(S980)。具体地讲,显示设备100可按如下方式改变列表作为新识别的结果:从包括多个连接的列表中删除与新识别语音不一致的链接,仅保留与新识别语音一致的链接。另外,显示设备100可高亮并显示列表中包括的链接的索引中的与初始识别的语音和新识别的语音一致的索引。显示设备100根据用户输入选择列表中显示的链接之一(S990)。如果选择了一个链接,则显示设备100执行选择的链接(S950)。
如上所述,使用用户语音执行链接,因此,用户可更准确和方便地执行链接。
以下,将参照图10描述根据另一示例性实施例的使用分散语音识别系统提供链接列表的方法。
图10是示出根据另一示例性实施例的使用分散语音识别系统执行链接的方法的示图。如图10所示,分散语音识别系统1000可包括移动装置1010、服务器1020和TV 200。
具体地讲,移动装置1010是语音识别设备(例如包括麦克风的智能电话、平板PC或遥控器),所述语音识别设备提取用户发出的语音的语音信息(例如,特征向量),并将语音信息发送到服务器1020。
服务器1020接收用户发出的语音信息,通过接收的语音信息识别用户的语音,将识别的语音转换成文本信息,并将文本信息发送到TV 200。
TV 200通过经服务器1020接收文本信息,并将文本信息与由索引提取单元240提取的索引进行比较,来搜索和执行链接。具体地讲,TV 200通过将从服务器1020接收的文本信息和当前显示的网页中包括的链接的索引进行比较,来从当前显示的网页中包括的链接中搜索包括与用户发出的语音一致的索引的链接,并执行找到的链接。搜索和执行链接的方法如上所述,因此其详细描述将被省略。
尽管以上描述的分散语音识别系统1000使用移动装置1010提取用户发出的语音的特征向量,但这仅为一个实施例,TV 200可直接提取用户发出的语音的特征向量,并将提取的特征向量发送到服务器1020。
尽管示例性实施例示出了分散语音识别系统1000通过将对用户发出的语音进行识别所获得的文本信息和通过TV 200由索引提取单元240所提取的索引进行比较来搜索和执行链接,但这仅为一个实施例,分散语音识别系统可通过将对用户发出的语音进行识别所获得的文本信息和通过另一外部服务器链接的索引进行比较来搜索和执行链接。
此外,除了示例性实施例中描述的语音识别方法,能够识别用户发出的语音的任何语音识别方法可应用于本发明构思。
示例性实施例中描述的网页仅为说明性的,可被其他种类的可链接的页(例如,word文本)替代。此外,和示例性实施例中描述的显示设备100一样,能够搜索互联网网页的任何显示设备可被应用。例如,显示设备100可以是计算机、TV、PMP、智能电话等。
以上示例性实施例和优点仅为示例性的,不应被解释为限制本发明构思。示例性实施例可被容易地应用于其他类型的设备。另外,示例性实施例的描述意图为说明性的,并不会限制权利要求的范围,多种替换、修改和改变对于本领域技术人员而言将是清楚的。

Claims (15)

1.一种在显示设备上提供链接列表的方法,所述方法包括以下步骤:
识别用户发出的语音;
在显示设备当前显示的网页中包括的链接中搜索包括与用户发出的语音一致的索引的链接;
产生一个或多个链接的列表,所述一个或多个链接中的每一个包括与用户发出的语音一致的索引;
如果用户的语音被识别为新发出的,则更新列表以反映新发出的语音。
2.如权利要求1所述的方法,其中,更新列表的步骤包括:从列表中删除不包括与新发出的语音一致的索引的一个或多个链接。
3.如权利要求1所述的方法,其中,更新列表的步骤包括:高亮包括与新发出的语音一致的索引的一个或多个链接。
4.如权利要求1所述的方法,所述方法还包括以下步骤:
识别用于选择列表的一个链接的语音;
根据识别的语音执行一个链接。
5.如权利要求1所述的方法,其中,如果通过外部输入设备选择了特定区域,则产生列表的步骤包括:显示仅包括所述特定区域中所包括的链接的列表。
6.如权利要求1所述的方法,其中,如果用户发出的语音中包括预设词,则产生列表的步骤包括:显示仅包括在当前显示的网页内被呈现为图像的链接的列表。
7.如权利要求1所述的方法,还包括如下步骤:提取显示的网页中包括的链接的索引。
8.如权利要求1所述的方法,其中,识别用户发出的语音的步骤包括:使用包括麦克风的外部语音识别设备识别用户发出的语音。
9.如权利要求1所述的方法,其中,显示设备是从包括计算机、电视、智能电话和便携式媒体播放器的组中选择的一个。
10.一种显示设备,包括:
显示单元,显示网页;
语音识别单元,识别用户发出的语音;
控制单元,在显示单元当前显示的网页中包括的链接中搜索包括与用户发出的语音一致的索引的链接,产生一个或多个链接的列表,所述一个或多个链接中的每一个包括与用户发出的语音一致的索引,如果用户的语音被识别为新发出的,则更新列表以反映新发出的语音。
11.如权利要求10所述的显示设备,其中,控制单元更新列表以从列表中删除不包括与最新发出的语音一致的索引的一个或多个链接。
12.如权利要求10所述的显示设备,其中,控制单元更新列表以高亮包括与最新发出的语音一致的索引的一个或多个链接。
13.如权利要求10所述的显示设备,其中,语音识别单元识别选择列表的一个链接的语音,控制单元根据识别的语音执行一个链接。
14.如权利要求10所述的显示设备,其中,如果通过外部输入设备选择了特定区域,则控制单元控制显示单元显示包括所述特定区域中所包括的链接的列表。
15.如权利要求10所述的显示设备,其中,如果用户发出的语音中包括预设词,则控制单元控制显示单元显示列表,所述列表包括在当前显示的网页内被呈现为图像的链接。
CN2012101269533A 2011-04-28 2012-04-26 提供链接列表的方法和应用所述方法的显示设备 Pending CN102799603A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20110040322 2011-04-28
KR10-2011-0040322 2011-04-28
KR1020120026328A KR20130004050A (ko) 2011-04-28 2012-03-15 음성 인식을 이용한 링크 리스트 제공 방법 및 이를 적용한 디스플레이 장치
KR10-2012-0026328 2012-03-15

Publications (1)

Publication Number Publication Date
CN102799603A true CN102799603A (zh) 2012-11-28

Family

ID=46317120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101269533A Pending CN102799603A (zh) 2011-04-28 2012-04-26 提供链接列表的方法和应用所述方法的显示设备

Country Status (4)

Country Link
US (1) US20120278719A1 (zh)
EP (1) EP2518722A3 (zh)
CN (1) CN102799603A (zh)
WO (1) WO2012148156A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152244A (zh) * 2013-01-30 2013-06-12 歌尔声学股份有限公司 一种控制即时通信平台通信的方法、装置和通信系统
CN103916688A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 交互服务器、显示设备及其控制方法
CN104318923A (zh) * 2014-11-06 2015-01-28 广州三星通信技术研究有限公司 一种语音处理方法、装置及终端
CN109036417A (zh) * 2018-07-03 2018-12-18 百度在线网络技术(北京)有限公司 用于处理语音请求的方法和装置
CN111512370A (zh) * 2017-12-29 2020-08-07 瑞欧威尔公司 在录制的同时对视频作语音标记

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102262050B1 (ko) * 2012-11-09 2021-06-09 삼성전자 주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
KR20140060040A (ko) * 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
JP2014203208A (ja) * 2013-04-03 2014-10-27 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
US11138971B2 (en) 2013-12-05 2021-10-05 Lenovo (Singapore) Pte. Ltd. Using context to interpret natural language speech recognition commands
CN105940399B (zh) * 2014-03-28 2019-04-26 松下知识产权经营株式会社 声音检索装置、声音检索方法以及显示装置
US10276154B2 (en) * 2014-04-23 2019-04-30 Lenovo (Singapore) Pte. Ltd. Processing natural language user inputs using context data
US20170286049A1 (en) * 2014-08-27 2017-10-05 Samsung Electronics Co., Ltd. Apparatus and method for recognizing voice commands
KR102403803B1 (ko) * 2020-07-29 2022-05-30 삼성전자 주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819220A (en) * 1996-09-30 1998-10-06 Hewlett-Packard Company Web triggered word set boosting for speech interfaces to the world wide web
CN1270361A (zh) * 1999-04-09 2000-10-18 国际商业机器公司 使用内容和扬声器信息进行音频信息检索的方法和装置
WO2007008798A2 (en) * 2005-07-07 2007-01-18 V-Enable, Inc. System and method for searching for network-based content in a multi-modal system using spoken keywords
US20070214119A1 (en) * 2006-03-07 2007-09-13 Microsoft Corporation Searching within a Site of a Search Result
US20070233692A1 (en) * 2006-04-03 2007-10-04 Lisa Steven G System, methods and applications for embedded internet searching and result display
US20100076996A1 (en) * 2005-03-24 2010-03-25 The Mitre Corporation System and method for audio hot spotting
US20100115398A1 (en) * 2008-10-31 2010-05-06 Samsung Electronics Co., Ltd. Apparatus and method for efficiently displaying web contents
US20100114684A1 (en) * 2008-09-25 2010-05-06 Ronel Neged Chat rooms search engine queryer
CN101996234A (zh) * 2009-08-17 2011-03-30 阿瓦雅公司 词云音频导航

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4440598C1 (de) * 1994-11-14 1996-05-23 Siemens Ag Durch gesprochene Worte steuerbares Hypertext-Navigationssystem, Hypertext-Dokument für dieses Navigationssystem und Verfahren zur Erzeugung eines derartigen Dokuments
WO1999048088A1 (en) * 1998-03-20 1999-09-23 Inroad, Inc. Voice controlled web browser
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
KR20030012284A (ko) * 2001-07-31 2003-02-12 (주)한국음성도메인센터 사용자 단말기용 웹브라우저와 그 구동방법 및 웹브라우징서비스 시스템
KR100462812B1 (ko) * 2001-12-22 2004-12-20 주식회사 케이티 음성인식을 통한 웹 경로 인터페이스 시스템 및 그 방법
US20030171926A1 (en) * 2002-03-07 2003-09-11 Narasimha Suresh System for information storage, retrieval and voice based content search and methods thereof
WO2005013141A1 (en) * 2003-07-28 2005-02-10 Limelight Networks, Llc Consistent browser file download
WO2005070092A2 (en) * 2004-01-08 2005-08-04 Voice Signal Technologies, Inc. Automated testing of voice regognition software
US8825379B2 (en) * 2005-01-05 2014-09-02 Sirius Xm Connected Vehicle Services Inc. Systems and methods for off-board voice-automated vehicle navigation
US20090204910A1 (en) * 2006-04-22 2009-08-13 Qin Zhang System and method for web directory and search result display
US20090326953A1 (en) * 2008-06-26 2009-12-31 Meivox, Llc. Method of accessing cultural resources or digital contents, such as text, video, audio and web pages by voice recognition with any type of programmable device without the use of the hands or any physical apparatus.
US20100100383A1 (en) * 2008-10-17 2010-04-22 Aibelive Co., Ltd. System and method for searching webpage with voice control
KR20100046586A (ko) * 2008-10-27 2010-05-07 삼성전자주식회사 맵 기반의 웹 검색 방법 및 장치

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819220A (en) * 1996-09-30 1998-10-06 Hewlett-Packard Company Web triggered word set boosting for speech interfaces to the world wide web
CN1270361A (zh) * 1999-04-09 2000-10-18 国际商业机器公司 使用内容和扬声器信息进行音频信息检索的方法和装置
US20100076996A1 (en) * 2005-03-24 2010-03-25 The Mitre Corporation System and method for audio hot spotting
WO2007008798A2 (en) * 2005-07-07 2007-01-18 V-Enable, Inc. System and method for searching for network-based content in a multi-modal system using spoken keywords
US20070214119A1 (en) * 2006-03-07 2007-09-13 Microsoft Corporation Searching within a Site of a Search Result
CN101395608A (zh) * 2006-03-07 2009-03-25 微软公司 在搜索结果的站点内搜索
US20070233692A1 (en) * 2006-04-03 2007-10-04 Lisa Steven G System, methods and applications for embedded internet searching and result display
US20100114684A1 (en) * 2008-09-25 2010-05-06 Ronel Neged Chat rooms search engine queryer
US20100115398A1 (en) * 2008-10-31 2010-05-06 Samsung Electronics Co., Ltd. Apparatus and method for efficiently displaying web contents
CN101996234A (zh) * 2009-08-17 2011-03-30 阿瓦雅公司 词云音频导航

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916688A (zh) * 2013-01-07 2014-07-09 三星电子株式会社 交互服务器、显示设备及其控制方法
CN103152244A (zh) * 2013-01-30 2013-06-12 歌尔声学股份有限公司 一种控制即时通信平台通信的方法、装置和通信系统
CN103152244B (zh) * 2013-01-30 2015-12-02 歌尔声学股份有限公司 一种控制即时通信平台通信的方法、装置和通信系统
CN104318923A (zh) * 2014-11-06 2015-01-28 广州三星通信技术研究有限公司 一种语音处理方法、装置及终端
CN104318923B (zh) * 2014-11-06 2020-08-11 广州三星通信技术研究有限公司 一种语音处理方法、装置及终端
CN111512370A (zh) * 2017-12-29 2020-08-07 瑞欧威尔公司 在录制的同时对视频作语音标记
CN111512370B (zh) * 2017-12-29 2021-08-03 瑞欧威尔公司 在录制的同时对视频作语音标记
CN109036417A (zh) * 2018-07-03 2018-12-18 百度在线网络技术(北京)有限公司 用于处理语音请求的方法和装置
CN109036417B (zh) * 2018-07-03 2020-06-23 百度在线网络技术(北京)有限公司 用于处理语音请求的方法和装置

Also Published As

Publication number Publication date
WO2012148156A3 (en) 2013-03-21
US20120278719A1 (en) 2012-11-01
WO2012148156A2 (en) 2012-11-01
EP2518722A2 (en) 2012-10-31
EP2518722A3 (en) 2013-08-28

Similar Documents

Publication Publication Date Title
CN102799603A (zh) 提供链接列表的方法和应用所述方法的显示设备
KR101909807B1 (ko) 메시지 입력 방법 및 장치
CN105592343B (zh) 针对问题和回答的显示装置和方法
JP6618223B2 (ja) 音声処理方法及び装置
US9928030B2 (en) Speech retrieval device, speech retrieval method, and display device
US9268987B2 (en) Method of recognizing QR code in image data and apparatus and method for converting QR code in content data into touchable object
US20160006856A1 (en) Messaging application with in-application search functionality
KR20170014353A (ko) 음성 기반의 화면 내비게이션 장치 및 방법
JP2014126600A (ja) 音声認識装置、音声認識方法、およびテレビ
CN111933134A (zh) 人机交互的方法及装置、电子设备、存储介质
US8498993B2 (en) Information acquiring apparatus, information acquiring program, recording medium, information acquiring method and information acquiring system
KR102358012B1 (ko) 음성 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체
JP6652231B1 (ja) 会話制御プログラム、会話制御方法および情報処理装置
CN102663055A (zh) 浏览器导航的实现方法、装置及浏览器
KR20160032564A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
CN103744836A (zh) 一种人机对话方法及装置
US20140136196A1 (en) System and method for posting message by audio signal
US9343065B2 (en) System and method for processing a keyword identifier
CN103618958A (zh) 一种电视机文本信息输入方法及装置
JP2016029495A (ja) 映像表示装置および映像表示方法
CN113707145A (zh) 显示设备及语音搜索方法
KR20150097250A (ko) 태그 정보를 이용한 스케치 검색 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20130004050A (ko) 음성 인식을 이용한 링크 리스트 제공 방법 및 이를 적용한 디스플레이 장치
KR101932281B1 (ko) 이동 단말기 및 이에 의한 웹 서비스 표시 방법,웹 서버 및 이에 의한 웹 서비스 제공 방법
KR101099010B1 (ko) 온라인 사전 서비스 제공 방법 및 장치, 그 프로그램을 기록한 컴퓨터로 판독 가능한 기록매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128