CN103902613A - 基于语音识别和云搜索技术的人机交互系统及方法 - Google Patents

基于语音识别和云搜索技术的人机交互系统及方法 Download PDF

Info

Publication number
CN103902613A
CN103902613A CN201210584562.6A CN201210584562A CN103902613A CN 103902613 A CN103902613 A CN 103902613A CN 201210584562 A CN201210584562 A CN 201210584562A CN 103902613 A CN103902613 A CN 103902613A
Authority
CN
China
Prior art keywords
module
speech recognition
search
man
interactive system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210584562.6A
Other languages
English (en)
Inventor
邵峰晶
王兵
王亮
翟伟伟
崔九梅
王爱玲
赵红雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haiersoft Co Ltd
Original Assignee
Qingdao Haiersoft Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haiersoft Co Ltd filed Critical Qingdao Haiersoft Co Ltd
Priority to CN201210584562.6A priority Critical patent/CN103902613A/zh
Publication of CN103902613A publication Critical patent/CN103902613A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing

Abstract

本发明涉及一种基于语音识别和云搜索技术的人机交互系统及方法。本发明的基于语音识别和云搜索技术的人机交互系统,包括MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块、主处理芯片,MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块分别与主处理芯片连接。本发明的基于语音识别和云搜索技术的人机交互系统及方法,改变原来基于遥控器手动输入繁琐的缺点,本发明可以直接语音输入;让原来用户被动的了解电视购物为主动,改变原来用户对购物不感兴趣的特点,增加用户的参与互动性。

Description

基于语音识别和云搜索技术的人机交互系统及方法
技术领域
本发明涉及一种基于语音识别和云搜索技术的人机交互系统及方法。
背景技术
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术已经发展成为涉及声学、语言学、数字信号处理、统计模式、概率论和信息论、发声机理和听觉机理、人工智能等等识别等多学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别系统在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块:“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”),得到其包含的文字信息,此外,后端模块还存在一个“自适应”的反馈模块,可以对用户的语音进行自学习,从而对“声学模型”和“语音模型”进行必要的“校正”,进一步提高识别的准确率。
云搜索(Cloud Search Engine):是运用云计算(Cloud Computing)技术的搜索引擎,可以绑定多个域名,定义搜索范围和性质,同时,不同域名可以有不同UI和流程,这个UI和流程由运行在云计算服务器上的个性化程序完成。作为新型搜索引擎,与传统搜索引擎需要输入多个关键字不同的是,用户可以告诉搜索引擎每个搜索关键字的比重,每个搜索关键字都被置于“搜索云”中,并用不同大小,粗细的字型区分。例如,我们键入“TechCrunch”及“Apple”并让Tech Crunch以粗体显示,目的是获得Tech Crunch网站上所有有关Apple的文章。而在将来完美的搜索中,我们可以键入“iPhone”及“app store”,并让“app store”以更细的字形显示,这就可以让销售相关产品商店的信息在结果中的排名得到提升,同时排除那些没有相关产品的商店。
电子商务:通常是指是在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器/服务器应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。电子商务是利用微电脑技术和网络通讯技术进行的商务活动。
电视购物:相比较于网络购物,有着其天然的优势。电视频道在中国的权威性很高,其品牌的美誉度远远高于任何一家商业网站。另外,电视频道可以开办网站从事电子商务,并通过电视+电话(短信)+直邮目录等多种方式满足用户的购买需求,但网站则不能开办电视频道。而电视购物频道卖场直播的巨大感染力也是网上购物所不具有的。美国电视购物的销售额,约占美国零售总额的8%。中国台湾东森去年在岛内的电视零售销售额为350亿元新台币。而据中国广告协会电视委员会提供的数字,在2005年全国社会消费品零售总额6700多万亿元中,电视购物所占份额仅为0.1%。电视购物在国内不是没有市场,而是缺少规范的操作。权威机构的电视购物频道呼之欲出。在这样的背景下开播的中视购物频道,确实是前景广阔的一个平台。不同的媒体给观众产生的错觉是不一样的。每个媒体都有它在观众群体中不同的心理定位,巧妙利用媒体对观众的心理影响,充分利用错觉效应,对品牌提升会起到事半功倍的效果。弱势品牌以中央台作背书,会给消费者以强势品牌的错觉。
发明内容
本发明的技术效果能够克服上述缺陷,提供一种基于语音识别和云搜索技术的人机交互系统及方法,其实现对用户语音信息的保存、处理及与电视之间的无线传输,电视端接收遥控器发送过来的语音信息后基于网络通过后台服务对该信息进行准确识别后并显示到电视上。
为实现上述目的,本发明采用如下技术方案:其包括MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块、主处理芯片,MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块分别与主处理芯片连接。
该应用主要是基于网络电视在家庭环境下使用,借助于支持语音识别的遥控器,通过网络电视直接跟电子商家进行信息交互,利用云搜索技术及时了解商家的商品信息并反馈需求,方便用户和商家之间更有效的交互,形成一个创新的信息交互应用模式。应用范围主要是在网络环境下的电子购物应用场合使用,硬件终端为电视。
本发明的创新点也是通过将语音识别技术、云搜索技术和电视购物结合起来,形成一种基于电视终端的新型人机信息交互系统。
主处理芯片采用MSP430F149型号。
本发明的另一个目的是提供一种基于语音识别和云搜索技术的人机交互方法,包括如下步骤:
(1)显示历史记录;
(2)判断是否选择历史关联,否,进行下一步;是,使用历史关联内容后进入步骤(5);
(3)输入搜索内容;
(4)判断是否网络关键字索引,否,进行下一步;是,使用关键字关联内容后,进行下一步;
(5)确定搜索内容;
(6)结束。
系统从用户获取输入内容,网络搜索,通过调用百度的网络接口,返回相应格式的数据,经过解析之后显示给用户,本地搜索,通过调用android底层的数据库接口,或遍历android系统文件,形成列表,然后以一定的格式显示给用户,供用户进行操作。
云搜索具备以下五项功能:
1、网络和本地搜索:通过用户的输入,搜索网络和本地的应用、图片、视频、文本信息,对搜索结果作相应的处理。
2、搜索设置:用户可以设置哪几种内置的搜索方式出现在搜索界面上供用户选择,选择是否删除搜索记录。
3、搜索选择:用户可以选择全局搜索、单一条件搜索进行搜索。
4、搜素引擎的卸载与安装:用户可以安装、或卸载相关类型的搜索引擎,这里通过android自身的安装应用和卸载用应用管理,安装的引擎会自动注册到系统的设置搜索中。
5、搜素历史记录的显示:会自动显示历史搜索关键字,选中搜索关键字后可以对该关键字搜索。
通过将语音识别技术、云搜索技术和电视购物结合起来,形成一种基于电视终端可方便用户的新型人机信息交互系统,一是可以让用户更方便快捷的与商家进行信息交互以便获得想了解的商品信息,一是可以在商家之间形成良好的竞争氛围为用户提供更贴心的服务,更重要的通过本系统是在商家和用户之间搭建一个良好的信息交互通道,为后续两者之间开展长期有效互动提供技术基础,也为后续推广新型服务运营模式提供探索。
当用户基于网络电视安装电视购物应用APK程序后,用户可以选择不同的商家进入商家浏览卖场信息,如果想直接了解打折信息或关注的某商品的信息可以通过点击“我想知道”按钮进入对应画面,在出现的对话输入框中可以通过语音遥控器直接表达想输入的信息,语音遥控器将识别的信息以无线形式传输给电视(前提是电视已接入无线接收装置),当用户确认信息无误后提交系统,系统会基于云搜索搜索相关商品信息直接推送到电视界面,让用户方便快捷的了解到对应信息。用户可以直接介于电视进行网上购物,也可以通过此交互系统向商家反馈各种信息从而形成有效互动,用户如果对某商家提供的信息不满意可直接投诉到商家的售后服务部门或选择其他商家。
本发明的基于语音识别和云搜索技术的人机交互系统及方法,改变原来基于遥控器手动输入繁琐的缺点,本发明可以直接语音输入;让原来用户被动的了解电视购物为主动,改变原来用户对购物不感兴趣的特点,增加用户的参与互动性,拓展了用户的购物渠道,也侧面增加了商家的贸易额,真正做到双赢。
附图说明
图1为本发明的模块意图;
图2为本发明的流程示意图。
具体实施方式
本发明的基于语音识别和云搜索技术的人机交互系统,包括MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块、主处理芯片,MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块分别与主处理芯片连接。
主处理芯片采用MSP430F149型号。
本发明的基于语音识别和云搜索技术的人机交互方法,包括如下步骤:
(1)显示历史记录;
(2)判断是否选择历史关联,否,进行下一步;是,使用历史关联内容后进入步骤(5);
(3)输入搜索内容;
(4)判断是否网络关键字索引,否,进行下一步;是,使用关键字关联内容后,进行下一步;
(5)确定搜索内容;
(6)结束。

Claims (3)

1.一种基于语音识别和云搜索技术的人机交互系统,其特征在于,包括MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块、主处理芯片,MIC接口、语音接收模块、按键处理模块、红外处理模块、存储模块、无线发射模块、电源管理模块分别与主处理芯片连接。
2.根据权利要求1所述的基于语音识别和云搜索技术的人机交互系统,其特征在于,主处理芯片采用MSP430F149型号。
3.一种基于语音识别和云搜索技术的人机交互方法,其特征在于,包括如下步骤:
(1)显示历史记录;
(2)判断是否选择历史关联,否,进行下一步;是,使用历史关联内容后进入步骤(5);
(3)输入搜索内容;
(4)判断是否网络关键字索引,否,进行下一步;是,使用关键字关联内容后,进行下一步;
(5)确定搜索内容;
(6)结束。
CN201210584562.6A 2012-12-30 2012-12-30 基于语音识别和云搜索技术的人机交互系统及方法 Pending CN103902613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210584562.6A CN103902613A (zh) 2012-12-30 2012-12-30 基于语音识别和云搜索技术的人机交互系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210584562.6A CN103902613A (zh) 2012-12-30 2012-12-30 基于语音识别和云搜索技术的人机交互系统及方法

Publications (1)

Publication Number Publication Date
CN103902613A true CN103902613A (zh) 2014-07-02

Family

ID=50993941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210584562.6A Pending CN103902613A (zh) 2012-12-30 2012-12-30 基于语音识别和云搜索技术的人机交互系统及方法

Country Status (1)

Country Link
CN (1) CN103902613A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333815A (zh) * 2014-10-28 2015-02-04 深圳市同洲电子股份有限公司 一种电视购物的方法、终端及系统
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、系统
WO2016192368A1 (zh) * 2015-06-03 2016-12-08 深圳市轻生活科技有限公司 一种智能语音交互终端
CN106934694A (zh) * 2017-03-08 2017-07-07 摩瑞尔电器(昆山)有限公司 一种语音交互搜索购物系统及其使用方法
CN107993650A (zh) * 2017-11-30 2018-05-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108053674A (zh) * 2018-01-16 2018-05-18 湖州华科信息咨询有限公司 一种用于红绿灯故障提示和维修的方法和装置
CN109087110A (zh) * 2018-08-24 2018-12-25 深圳市云之音科技有限公司 一种智能销售方法、装置及终端设备
CN109389452A (zh) * 2017-08-10 2019-02-26 阿里巴巴集团控股有限公司 语音销售的方法及装置
CN110547665A (zh) * 2018-06-04 2019-12-10 佛山市顺德区美的电热电器制造有限公司 烹饪状态的确定方法、装置、存储介质和服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100173269A1 (en) * 2009-01-07 2010-07-08 Manika Puri Food recognition using visual analysis and speech recognition
CN202014321U (zh) * 2011-03-21 2011-10-19 海尔集团公司 遥控器及电视机系统
CN102231147A (zh) * 2010-11-08 2011-11-02 百度在线网络技术(北京)有限公司 一种用于实时展现联想词的方法、设备及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100173269A1 (en) * 2009-01-07 2010-07-08 Manika Puri Food recognition using visual analysis and speech recognition
CN102231147A (zh) * 2010-11-08 2011-11-02 百度在线网络技术(北京)有限公司 一种用于实时展现联想词的方法、设备及系统
CN202014321U (zh) * 2011-03-21 2011-10-19 海尔集团公司 遥控器及电视机系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333815A (zh) * 2014-10-28 2015-02-04 深圳市同洲电子股份有限公司 一种电视购物的方法、终端及系统
WO2016192368A1 (zh) * 2015-06-03 2016-12-08 深圳市轻生活科技有限公司 一种智能语音交互终端
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、系统
CN106934694A (zh) * 2017-03-08 2017-07-07 摩瑞尔电器(昆山)有限公司 一种语音交互搜索购物系统及其使用方法
CN109389452A (zh) * 2017-08-10 2019-02-26 阿里巴巴集团控股有限公司 语音销售的方法及装置
CN107993650A (zh) * 2017-11-30 2018-05-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108053674A (zh) * 2018-01-16 2018-05-18 湖州华科信息咨询有限公司 一种用于红绿灯故障提示和维修的方法和装置
CN110547665A (zh) * 2018-06-04 2019-12-10 佛山市顺德区美的电热电器制造有限公司 烹饪状态的确定方法、装置、存储介质和服务器
CN110547665B (zh) * 2018-06-04 2022-04-01 佛山市顺德区美的电热电器制造有限公司 烹饪状态的确定方法、装置、存储介质和服务器
CN109087110A (zh) * 2018-08-24 2018-12-25 深圳市云之音科技有限公司 一种智能销售方法、装置及终端设备

Similar Documents

Publication Publication Date Title
CN103902613A (zh) 基于语音识别和云搜索技术的人机交互系统及方法
US11960526B2 (en) Query response using media consumption history
US20230377583A1 (en) Keyword determinations from conversational data
CN103607647B (zh) 多媒体视频的广告推荐方法、系统及广告播放设备
US10963505B2 (en) Device, system, and method for automatic generation of presentations
US8844800B2 (en) Ratings using machine-readable representations
US9020824B1 (en) Using natural language processing to generate dynamic content
WO2016192509A1 (zh) 一种信息处理方法和装置
US20200321005A1 (en) Context-based enhancement of audio content
CN103365833B (zh) 一种基于上下文场景的输入候选词提示方法及系统
CN101689267A (zh) 基于语音输入的自然语言处理选择演示广告的系统和方法
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
CN108573393B (zh) 评论信息处理方法、装置、服务器及存储介质
CN103956168A (zh) 一种语音识别方法、装置及终端
KR102203890B1 (ko) 통화 자동 관리 시스템 및 그 방법
US20160104216A1 (en) System and methods to facilitate in-situ evaluations
CN109101505B (zh) 一种推荐方法、推荐装置和用于推荐的装置
CN103593356A (zh) 基于多媒体信息指纹技术的信息搜索方法、系统和应用
WO2019060389A1 (en) SYSTEM AND METHOD FOR RECOVERING LIST OF POTENTIAL CLIENTS AND AUTOMATED PRESENCE TRACKING
CN108322770A (zh) 视频节目识别方法、相关装置、设备和系统
US20120179551A1 (en) Personalised Items in Mobile Devices based on User Behaviour
CN106462637A (zh) 显示与设备上播放的内容有关的信息
WO2022143349A1 (zh) 一种确定用户意图的方法及装置
CN113923477A (zh) 视频处理方法、装置、电子设备以及存储介质
CN106663112A (zh) 呈现与实体相关联的事件的信息卡

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140702