CN102184257A - 一种统一搜索方法、装置及系统 - Google Patents
一种统一搜索方法、装置及系统 Download PDFInfo
- Publication number
- CN102184257A CN102184257A CN2011101474980A CN201110147498A CN102184257A CN 102184257 A CN102184257 A CN 102184257A CN 2011101474980 A CN2011101474980 A CN 2011101474980A CN 201110147498 A CN201110147498 A CN 201110147498A CN 102184257 A CN102184257 A CN 102184257A
- Authority
- CN
- China
- Prior art keywords
- search
- key word
- searching key
- searching
- customizing messages
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种统一搜索方法、装置及系统,所述方法包括:接收搜索用户输入的搜索关键词;依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索;响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。本发明实施例可以解决兼顾统一管理及按业务特点配置的现有技术问题,以针对不同的用户或者搜索方式都实现统一的搜索结果。
Description
技术领域
本发明涉及网络数据处理领域,特别涉及一种统一搜索方法、装置及系统。
背景技术
在互联网高速发展的今天,不同用户对信息获取的需求越来越强烈,对信息获取的便捷性要求也越来越高。信息、通信和技术(InformationCommunication Technology,ICT)服务是电信和互联网服务的融合,因此,实现网络和语音搜索的结合,必将成为下一个搜索引擎发展的方向。互联网与电信趋向融合,语音搜索市场成为移动通信行业发展的前景。目前语音接入搜索服务是应用最为广泛的,另外逐步扩展为互联网搜索、移动搜索以及IM搜索等多种搜索方式。
由于不同搜索方式的搜索都需要使用搜索引擎,而如果使用不同搜索方式的搜索引擎,将导致数据结果不统一,或者竞价排名的结果不一致,业务和数据管理复杂等诸多问题。而如果对于每一类搜索方式都开发一套搜索引擎,那就会导致有很多的重复开发,使得开发及维护成本都过高。进一步的,由于信息服务的不断丰富,结合地理信息的查询将会日益增多,也需要一个统一的平台来提供基于地理信息的查询结果。
总之,目前需要本领域技术人员迫切解决的一个技术问题就是:如何解决兼顾统一管理及按业务特点配置的现有技术问题,以针对不同的用户或者搜索方式都实现统一的搜索结果。
发明内容
本发明所要解决的技术问题是提供一种统一搜索方法,用以解决兼顾统一管理及按业务特点配置的现有技术问题,以针对不同的用户或者搜索方式都实现统一的搜索结果。
本发明还提供了一种统一搜索装置及系统,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本发明公开了一种统一搜索方法,包括:
接收搜索用户输入的搜索关键词;
依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索;
响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
优选的,还包括:
获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息;
将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系;
按照索引结果分类存储至所述预置索引库中。
优选的,所述将所述搜索结果进行展示之前,还包括:
按照预定的排序规则对所述搜索结果进行重组;
将重组结果按照顺序在浏览器上进行展示。
优选的,还包括:
动态调整所述排序规则。
优选的,所述接收搜索用户输入的搜索关键词,具体包括:
接收用户触发的语音信号;
识别所述语音信号,并将识别结果作为用户输入的搜索关键词。
优选的,还包括:
将所述搜索结果转换为语音信号进行播报。
本发明公开了一种统一搜索装置,包括:
接收模块,用于接收搜索用户输入的搜索关键词;
分发模块,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器与其对应的预置索引库中根据所述搜索关键词在进行搜索;
展示模块,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
优选的,还包括:
获取模块,用于获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息;
索引模块,用于将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系;
存储模块,用于按照索引结果分类存储至所述预置索引库中。
优选的,还包括:
重组模块,用于按照预定的排序规则对所述搜索结果进行重组;
展示模块,用于将重组结果按照顺序在浏览器上进行展示。
优选的,还包括:
调整模块,应用动态调整所述排序规则。
优选的,所述接收模块,具体包括:
接收子模块,用于接收用户触发的语音信号;
识别子模块,用于识别所述语音信号,并将识别结果作为用户输入的搜索关键词。
优选的,还包括:
播报模块,用于将所述搜索结果转换为语音信号进行播报。
本发明公开了一种统一搜索系统,包括:
预置索引库,包括至少两个子索引库,所述子索引库用于存储一类与搜索关键词对应的特定信息;
统一搜索装置,包括接收模块、分发模块和展示模块,所述接收模块,用于接收搜索用户输入的搜索关键词;所述分发模块,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,所述展示模块,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示;
分类搜索服务器,用于根据所述搜索关键词在与其对应的预置索引库中进行搜索;并将搜索结果返回至所述统一搜索装置。
与现有技术相比,本发明包括以下优点:
本发明实施例通过提供统一的接口来接收用户输入的搜索关键词,并根据其搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,由所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索,这样就可以使用统一的搜索方式,解决了兼顾统一管理及按业务特点配置的现有技术问题,以针对不同的用户或者搜索方式都实现统一的搜索结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明在实际应用中实现平台的框架图;
图2是本发明的一种统一搜索方法实施例1的流程图;
图3是方法实施例1中步骤201的流程图;
图4是本发明的一种统一搜索方法实施例2的流程图;
图5是本发明的一种统一搜索装置实施例1的结构框图;
图6是本发明的装置实施例1中接收模块501的结构框图;
图7是本发明的一种统一搜索装置实施例2的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了方便本领域技术人员对本发明更好的理解,下面首先对本发明在实际应用中的实现架构上进行详细介绍。
本发明涉及的统一搜索引擎可以依据统一、规范的数据来源,统一的业务规则,以及标准的对外搜索服务接口对搜索用户提供搜索功能。其他外部系统只需要采用简单的接口即可使用统一搜索引擎提供的功能。参考图1所示,本发明的实现平台可以分为:基础能力层、业务平台层、业务门户层、接入层和网络层。
其中,基础能力层集成了各种搜索功能(例如:全文检索、地图定位搜索等)及分发索引规则、排序过滤规则。分发索引规则指的是将用户输入的搜索关键词分发给对应的分类搜索服务器的规则,而排序过滤规则指的是对搜索结果进行排序的规则。基础能力层能够提供标准的信息检索、信息流转以及信息处理服务,它的信息来源于业务平台层的信息支撑域,同时对业务平台层的业务支撑域做基于各种业务应用逻辑的信息检索、信息流转和信息处理服务。可见,基础能力层在功能上实现了信息搜索引擎、地理信息系统(Geographic Information System,GIS)搜索引擎、工作流引擎、人工业务引擎和报表引擎的功能等。其中,GIS是获取、整理、分析和管理地理空间数据的重要工具、技术和学科,近年来得到了广泛关注和迅猛发展。由于信息技术的发展,从理论上来说,GIS可以运用于任何行业。
基础能力层具有以下技术特点:采用面向服务的体系结构(Service-Oriented Architecture,SOA),即以功能独立的模块为服务,内加独立子服务模块,以服务可扩展为核心来设计搜索引擎的框架。并且,采用代理服务模块来完成所有协议的适配,并兼顾未来协议的扩展,支持的协议包括SIP、H.248、MGCP、T.38(FAX)、IMAP/SMTP/POP3、SMPP、PAP、MLP和MM7。进一步的,还可以采用配置模块来封装各种具体服务,并采用服务之间保持低耦合的原则,使未来扩展服务的影响最小化。基础能力层还可以用前置代理服务模块来分担协议适配和服务指派的任务,从而充分保证后端服务的负载,使信息查询的速度得以保证。
其中,业务平台层可以包括信息支撑域及业务支撑域。信息支撑域的功能包括信息的采集、存储和发布;更具体的,信息支撑域主要负责整合各个信息来源通道,对信息进行采编、加工、存储和共享,以及对信息进行集中的管理和维护等,它对业务实现层的其它域提供高效、可靠的信息数据支撑。功能上包括信息内容的配置、信息采编、信息存储、信息发布、信息管理和信息维护等。而业务支撑域的功能包括业务及服务的扩展设置,例如排序策略的设置等。业务支撑域面向业务实现和运营的全过程,建立完整的业务运营体系,支持各种业务和服务的开展。
其中,业务门户层提供面向运营商或者代理商等的管理门户(即是界面),运营商或者代理商可以登陆进行排序策略的设置,以及搜索范围的设定等。业务门户层包括前向用户门户、SP/CP门户、后向用户门户、代理商门户、坐席门户和运营商管理门户等多种门户,进行统一管理。
其中,接入层可以提供搜索终端或搜索网络的搜索接口;例如提供语音搜索接口、短信搜索接口、互联网搜索接口,由此可以实现多种终端的接入搜索。
其中,网络层表示搜索服务器的支持网络,对应的是相应的搜索终端。例如语音搜索,需要支持PSTN网络协议、IP网络协议等。
应用上述实现平台进行搜索时,首先由运营商登陆业务管理门户,录入可供搜索的特定信息,包括图片、多媒体和/或文本资料等内容,然后设定搜索范围或者排序策略等。业务平台层则支撑用户的搜索信息录入、存储、审核和发布等。而基础能力层集成多种搜索能力,将录入的信息内容进行存储、索引以及关键字关联等,然后将搜索引擎通过接口层接入各种搜索界面或搜索网络,组建起一套统一的搜索体系,并应用到业务平台中。当搜索用户通过语音电话或短信等终端发送搜索命令后,搜索引擎根据搜索关键字执行相关的搜索,然后按照设定的排序过滤策略重组搜索结果,最后将结果通过网络(PSTN\3G\Internet等)呈现给用户。
通过上述实现平台实现的统一搜索方式,可以实现以下有益效果:首先,具有智能化、高速度、多语言、高可配置和语音融合等特点。其次,具有高可靠与分布式应用的特点,本发明的统一搜索系统采用分布式架构,实现跨地域信息整合,大规模的信息运营及语音支持;具体可以采用GIS系统实现,为用户提供精确的指路服务、周边搜索、地图与定位服务。再次,还具有快速响应的高性能,针对号百业务检索的特殊性,系统具备毫秒级的快速响应能力。第四,系统具有统一的接口适配能力,可通过抽象统一相应的接口规范全省不同业务的多种方式查询。第五,系统采用分布式计算和部署,按照地域或者其他维度进行信息分类检索,可以方便灵活的进行业务扩充,能够快速为外围业务系统提供信息搜索服务。第六,系统具有灵活的业务配置能力,统一搜索引擎将数据模块化,能够快速进行业务配置和排序策略等的灵活设置,有效支持业务扩展。第七,统一搜索引擎的数据采用双份保存,同时提供在线服务,定时进行数据备份,保证系统24小时不间断提供给外围业务系统的搜索服务,也保证了数据的安全性。
参考图2,示出了本发明一种统一搜索方法实施例1的流程图,可以包括以下步骤:
步骤201:接收搜索用户输入的搜索关键词。
这里的搜索用户指的是需要通过所述统一搜索方法进行信息搜索的用户。当搜索用户需要进行搜索时,可以通过互联网或语音发起搜索业务,本步骤即是通过接口(API)接收用户输入的搜索关键词。本发明实施例中公开的搜索引擎可以面向不同来源的多种检索需求,包括:通信录检索、商品检索、位置检索和综合信息检索等。
参考图3所示,所述步骤101具体也可以接收语音信号,并针对语音信号进行检索,具体的,在用户通过语音发出搜索请求时,具体可以包括:
步骤301:接收用户触发的语音信号。
当用户通过语音电话或短信等终端发送搜索命令后,首先接收用户触发的语音信号。例如,一段用户的录音等。这样根据用户的语音,即可自动提供信息查询与电话转接服务。所述语音信号具体可以普通话的发音,也可以是粤语的语音信号,以实现先进的人机语音对话。
步骤302:识别所述语音信号。
具体的,需要对语音信号进行识别,将语音信号识别为文本信号,具体的可以采用自动语音识别技术(Automatic Speech Recognition),ASR是一种将人的语音转换为文本的技术。
步骤303:将识别结果作为用户输入的搜索关键词。
将最后的识别结果再作为用户输入的搜索关键词,供系统进行检索。
步骤202:依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索。
在本步骤中需要根据搜索关键词的搜索类别及来源,将不同类别及来源的搜索关键词发送给不同的分类搜索服务器进行处理,分类搜索服务器与索引库一一对应,可以在对应的预置索引库中进行搜索关键词的相关搜索行为。例如对通信录的检索请求就分发给通信录搜索服务器执行,通信搜索服务器接收到搜索请求后,从对应的预置索引库(IndexDB)检索,最后可以返回搜索结果。
在本实施例中,可以采用高性能的异步I/O通讯,及数据高速缓存技术。并可以采用负载均衡和动态调整压力方案,摆脱对四层交换机的依赖,并对系统进行健康检测,使系统具备负载动态调整的能力。
步骤203:响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
在本实施例中,可以实现统一搜索排名机制,分类搜索服务器返回搜索结果之后,再将搜索结果展示给搜索用户。具体的,还可以按照设定的排序过滤策略重组搜索结果,最后将结果通过PSTN\3G\Internet等网络呈现给用户。
需要说明的是,在展示搜索结果时,本发明实施例支持多种排序策略,例如:优先报号、行业首查和百事通加盟等。例如,当发布用户办理了相关业务,购买了相关的搜索关键词后,可以将相应的业务规则发布给统一搜索引擎;当搜索用户提交搜索请求时,搜索引擎检索到搜索结果后,根据排序策略进行过滤重组;并根据业务规则,匹配发布用户购买的搜索关键词,将办理了相关业务的搜索结果放在序列前面展示给搜索用户,然后将没有办理业务的搜索结果过滤,或者排在后面;这样经过层层过滤,就可以保证搜索结果的顺序按照业务策略排序,在保证搜索结果准确的前提下,进一步提升发布用户的使用体验。
步骤204:将所述搜索结果转换为语音信号进行播报。
需要说明的是,如果用户通过语音信号输入搜索关键词,则还需要对搜索结果进行转换并播报给搜索用户。具体可以采用TTS(Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分。采用本发明实施例进行TTS语音报号,可将文字转换为语音播报给搜索用户,TTS支持即时输入报号,支持多种语言,包括普通话、粤语播报等。
在本发明实施例中,可以在统一核心引擎的基础上,采用配置模块来封装各种具体服务,采用FilterChain框架实现排序策略的高度可配置性及动态调整。本发明实施例可以解决语音搜索与互联网搜索、移动终端搜索的结合问题,实现了综合信息搜索应用,该搜索引擎可以应用于语音坐席、互联网门户和移动搜索(例如短信搜索)等领域,支持语音、互联网和短信等多种接入方式,可以根据用户需要,为用户提供各种各样的信息查询、号码查询、号码播报、号码转接、语音订购、语音广告、语音导航和地图定位导航等功能。本发明解决了跨互联网及通信网络的搜索问题,实现了语音搜索、互联网搜索、移动搜索,可以衍生出多种IT通信服务产品,产生巨大的经济与社会价值。
参考图4,示出了本发明一种统一搜索方法实施例2的流程图,可以包括以下步骤:
步骤401:获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息。
在本实施例中,首先是建立预置索引库的步骤。获取特定信息的方式包括:发布用户输入或者采用爬虫服务器抓取。发布用户登陆业务管理门户,可以录入可供搜索的图片、多媒体、文本资料等内容,然后设定搜索范围和排序策略等;而爬虫服务器则可以通过互联网抓取特定信息,例如天气预报、交通生活信息和赛事赛程等,可以在过滤无效信息之后分类存入所述预置索引库。
CTI(计算机电话集成,Computer Telephony Integration)技术可以将计算机技术应用到电话系统中,能够自动地对电话中的信令信息进行识别处理,并通过建立有关的话路连接,而向用户传送预定的录音文件、转接来话等。而在本发明实施例中,CTI技术不仅要处理传统的电话语音,而且要处理包括传真、短信等其它形式的信息媒体。
步骤402:将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系。
再对获取到的特定信息进行索引,即是建立搜索关键词与特定信息之间的关联关系,以便于搜索服务器在后续搜索时,可以直接依据所述搜索关键词与特定信息的关联关系找到相应的特定信息。
步骤403:按照索引结果分类存储至所述预置索引库中。
再按照索引结果将搜索关键词和特定信息对应的分类存储至预置索引库中。
步骤404:接收搜索用户输入的搜索关键词。
建立索引库之后,再接收到搜索用户输入的搜索关键词。
步骤405:依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索。
步骤406:按照预定的排序规则对所述搜索结果进行重组。
在本步骤中,搜索到相应的特定信息之后,还需要按照预定的排序规则对所述搜索结果进行重组。
步骤407:将重组结果按照顺序在浏览器上进行展示。
再将重组之后的结果展示给搜索用户,这样就方便的给发布用户提供相应的信息发布服务,可以使得购买了相应的搜索关键词的发布用户的特定信息排在前面展示给搜索用户。在本发明实施例中,可以基于业务规格,和用户购买的商品实例对信息进行加工处理,生成适合业务系统使用的信息,并对已发布信息进行管理。还可以记录信息被业务系统应用的情况,包括收集业务系统反馈回来的用户使用记录,并根据记录的数据进行统计分析,评估各类信息的价值。
步骤408:动态调整所述排序规则。
在本实施例中,还可以在使用过程中对所述排序规则进行动态调整,例如,当用户需求发生变化的时候,或者不同的发布用户又购买了其他的搜索关键词,因此,在这种情况下,需要动态调整所述排序规则。可见,本发明实施例具有高度可配置、易于扩展和动态扩展等特点。在本发明实施例中,通过修改可以配置使用不同的排序策略,通过二次开发接口可开发新的排序模块,并且通过脚本技术在不影响提供服务的情况下,可进行功能的动态扩展。
本实施例中也可以实现语音搜索,可以在号百平台实现了IP方式的呼叫接入,其个人计算机对电话(PC to Phone)的业务可以媲美电话对电话(Phone to Phone)业务。在原来的语音垂直搜索引擎上,结合TTS技术和ASR技术,可以用很低的成本为用户提供高效精确的查号转接服务,并且可以保证每次查询在60毫秒内返回结果给用户。基于上述基础功能,还可以衍生出一系列面向商家的产品服务:号码查询、信息查询、电话转接、企业总机、个人通信助理、行业首查、优先报号、语音名片、商家加盟、冠名报号、机票酒店订购和地图导航等。
本发明实施例还实现了以查询转接为基础的统一通信创新,可以发展以通信录管理和查号转接为核心,同时叠加灵活的自动语音导航、总机服务、语音识别、留言信箱、短信群发以及事件提醒等功能,为企业提供方便内外部沟通的信息通信门户;由此,还可衍生出来的产品包括企业手机报、汽车救援和政府综合通信指挥调度等。
本发明实施例还实现了以语音订购为基础的电子商务创新,可以利用先进的语音接入和语音支付能力,可以提供多种语音订购服务,例如订机票、订酒店、订电影票和礼品订购等,最终演变为一个强大的生活订购平台。
本发明实施例还实现了以ICT能力为基础的融合创新,本发明实施例在的实现平台在IT技术的基础上,融合多种CT能力,形成多个能力引擎,包括GIS、支付能力、点击拨号、电话会议、网络传真、语音短信和统一搜索引擎等。并且,信息技术与通信技术的结合,可以创造一批独特的产品应用,例如号百小精灵、商机短信、短信全能搜、位置搜索、和E家百事通等。
本发明实施例还实现了人工与自助服务结合的服务手段创新。本发明实施例的统一搜索结合了语音接入、TTS报号和ASR技术,可以提供人工查询服务与自助查询服务。例如用户拨打某统一的服务号码后,可选择或按设定进入人工服务或进入自助服务流程。如果进入人工服务,可由话务员与用户沟通,了解用户的搜索需求,话务员通过坐席检索出结果,再通过TTS播报、短信或者口报方式将结果反馈给用户,也可以为用户直接转接电话;若是进入自助服务流程,用户可以直接对着电话说出搜索请求,系统通过ASR技术,自动识别用户的搜索请求,然后检索结果,并将结果通过TTS方式反馈给用户,也可根据用户要求直接为用户转接电话。
本发明实施例中公开的整套搜索与信息采编架构,实现了完成的信息爬虫采编、分类入库、搜索索引和搜索分发机制,各模块紧密链接,保证业务流程的高效运转。同时,统一搜索还支持自动语音识别及人工业务的接入,提供多种媒体呼叫接入、业务处理、路由处理、排队处理和质检录音等能力,支撑人工信息服务的全面开展。并且,统一搜索引擎通过对接不同的业务系统及搜索终端,实现了各种数据的汇集,进行统一的数据及排序管理,然后对各种业务系统提供搜索服务。本发明实施例公开的统一搜索可提供的搜索功能包括但不限于:号码百事通信息运营基础号百信息搜索、广东省综合信息检索、通信录检索、企业总机检索、位置及周边相关信息检索和日志清单查询。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
与上述本发明一种统一搜索方法实施例1所提供的方法相对应,参见图5,本发明还提供了一种统一搜索装置实施例1,在本实施例中,该装置可以包括:
接收模块501,用于接收搜索用户输入的搜索关键词。
参考图6所示,所述接收模块501,具体可以包括:
接收子模块601,用于接收用户触发的语音信号。
识别子模块602,用于识别所述语音信号,并将识别结果作为用户输入的搜索关键词。
分发模块502,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器与其对应的预置索引库中根据所述搜索关键词在进行搜索。
展示模块503,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
播报模块504,用于将所述搜索结果转换为语音信号进行播报。
通过上述实现平台实现的统一搜索装置,可以实现以下有益效果:首先,具有智能化、高速度、多语言、高可配置和语音融合等特点。其次,具有高可靠与分布式应用的特点,本发明的统一搜索系统采用分布式架构,实现跨地域信息整合,大规模的信息运营及语音支持;具体可以采用GIS系统实现,为用户提供精确的指路服务、周边搜索、地图与定位服务。再次,还具有快速响应的高性能,针对号百业务检索的特殊性,系统具备毫秒级的快速响应能力。第四,系统具有统一的接口适配能力,可通过抽象统一相应的接口规范全省不同业务的多种方式查询。第五,系统采用分布式计算和部署,按照地域或者其他维度进行信息分类检索,可以方便灵活的进行业务扩充,能够快速为外围业务系统提供信息搜索服务。第六,系统具有灵活的业务配置能力,统一搜索引擎将数据模块化,能够快速进行业务配置和排序策略等的灵活设置,有效支持业务扩展。第七,统一搜索引擎的数据采用双份保存,同时提供在线服务,定时进行数据备份,保证系统24小时不间断提供给外围业务系统的搜索服务,也保证了数据的安全性。
与上述本发明一种统一搜索方法实施例2所提供的方法相对应,参见图7,本发明还提供了一种统一搜索装置实施例2,在本实施例中,该装置可以包括:
获取模块701,用于获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息。
索引模块702,用于将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系。
存储模块703,用于按照索引结果分类存储至所述预置索引库中。
接收模块501,用于接收搜索用户输入的搜索关键词。
分发模块502,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器与其对应的预置索引库中根据所述搜索关键词在进行搜索。
重组模块704,用于按照预定的排序规则对所述搜索结果进行重组。
展示模块705,用于将重组结果按照顺序在浏览器上进行展示。
调整模块706,应用动态调整所述排序规则。
本发明实施例中公开的整套搜索与信息采编架构,实现了完成的信息爬虫采编、分类入库、搜索索引和搜索分发机制,各模块紧密链接,保证业务流程的高效运转。同时,统一搜索还支持自动语音识别及人工业务的接入,提供多种媒体呼叫接入、业务处理、路由处理、排队处理和质检录音等能力,支撑人工信息服务的全面开展。并且,统一搜索引擎通过对接不同的业务系统及搜索终端,实现了各种数据的汇集,进行统一的数据及排序管理,然后对各种业务系统提供搜索服务。本发明实施例公开的统一搜索可提供的搜索功能包括但不限于:号码百事通信息运营基础号百信息搜索、广东省综合信息检索、通信录检索、企业总机检索、位置及周边相关信息检索和日志清单查询。
此外,本发明实施例还公开了一种统一搜索系统,该系统具体可以包括:预置索引库、统一搜索装置和分类搜索服务器,其中,所述预置索引库包括至少两个子索引库,所述子索引库用于存储一类与搜索关键词对应的特定信息;所述统一搜索装置,包括接收模块、分发模块和展示模块,所述接收模块,用于接收搜索用户输入的搜索关键词;所述分发模块,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,所述展示模块,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示;所述分类搜索服务器,用于根据所述搜索关键词在与其对应的预置索引库中进行搜索;并将搜索结果返回至所述统一搜索装置。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种统一搜索方法、装置及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (13)
1.一种统一搜索方法,其特征在于,该方法包括:
接收搜索用户输入的搜索关键词;
依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器在与其对应的预置索引库中根据所述搜索关键词进行搜索;
响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息;
将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系;
按照索引结果分类存储至所述预置索引库中。
3.根据权利要求1所述的方法,其特征在于,所述将所述搜索结果进行展示之前,还包括:
按照预定的排序规则对所述搜索结果进行重组;
将重组结果按照顺序在浏览器上进行展示。
4.根据权利要求3所述的方法,其特征在于,还包括:
动态调整所述排序规则。
5.根据权利要求1所述的方法,其特征在于,所述接收搜索用户输入的搜索关键词,具体包括:
接收用户触发的语音信号;
识别所述语音信号,并将识别结果作为用户输入的搜索关键词。
6.根据权利要求5所述的方法,其特征在于,还包括:
将所述搜索结果转换为语音信号进行播报。
7.一种统一搜索装置,其特征在于,该装置包括:
接收模块,用于接收搜索用户输入的搜索关键词;
分发模块,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,以便于所述分类搜索服务器与其对应的预置索引库中根据所述搜索关键词在进行搜索;
展示模块,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示。
8.根据权利要求7所述的装置,其特征在于,还包括:
获取模块,用于获取待存储至预置索引库的特定信息,所述特定信息的获取方式包括:采用爬虫服务器抓取特定信息,或者接收发布用户输入的特定信息;所述特定信息包括:文字、图片和/或多媒体信息;
索引模块,用于将所述特定信息按照搜索关键词进行索引,以建立特定信息与搜索关键词之间的关联关系;
存储模块,用于按照索引结果分类存储至所述预置索引库中。
9.根据权利要求7所述的装置,其特征在于,还包括:
重组模块,用于按照预定的排序规则对所述搜索结果进行重组;
展示模块,用于将重组结果按照顺序在浏览器上进行展示。
10.根据权利要求9所述的装置,还包括:
调整模块,应用动态调整所述排序规则。
11.根据权利要求7所述的装置,其特征在于,所述接收模块,具体包括:
接收子模块,用于接收用户触发的语音信号;
识别子模块,用于识别所述语音信号,并将识别结果作为用户输入的搜索关键词。
12.根据权利要求11所述的装置,其特征在于,还包括:
播报模块,用于将所述搜索结果转换为语音信号进行播报。
13.一种统一搜索系统,其特征在于,包括:
预置索引库,包括至少两个子索引库,所述子索引库用于存储一类与搜索关键词对应的特定信息;
统一搜索装置,包括接收模块、分发模块和展示模块,所述接收模块,用于接收搜索用户输入的搜索关键词;所述分发模块,用于依据所述搜索关键词的搜索类别及来源将所述搜索关键词分发至对应的分类搜索服务器,所述展示模块,用于响应于所述分类搜索服务器返回的搜索结果,将所述搜索结果进行展示;
分类搜索服务器,用于根据所述搜索关键词在与其对应的预置索引库中进行搜索;并将搜索结果返回至所述统一搜索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101474980A CN102184257A (zh) | 2011-06-02 | 2011-06-02 | 一种统一搜索方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101474980A CN102184257A (zh) | 2011-06-02 | 2011-06-02 | 一种统一搜索方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102184257A true CN102184257A (zh) | 2011-09-14 |
Family
ID=44570434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101474980A Pending CN102184257A (zh) | 2011-06-02 | 2011-06-02 | 一种统一搜索方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102184257A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034660A (zh) * | 2011-10-10 | 2013-04-10 | 阿里巴巴集团控股有限公司 | 信息提供方法、装置及系统 |
CN103049455A (zh) * | 2011-10-14 | 2013-04-17 | 中兴通讯股份有限公司 | 基于分级式搜索的呼叫中心服务方法及系统 |
CN103077176A (zh) * | 2012-01-13 | 2013-05-01 | 北京飞漫软件技术有限公司 | 一种在浏览器中按关键词类型进行快捷搜索的方法 |
CN103617278A (zh) * | 2013-12-09 | 2014-03-05 | 北京奇虎科技有限公司 | 一种地址栏搜索的控制方法及装置 |
CN104572717A (zh) * | 2013-10-18 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
CN105447149A (zh) * | 2015-11-26 | 2016-03-30 | 北京搜狗科技发展有限公司 | 一种用于网络搜索的交互方法、装置及电子设备 |
CN105824877A (zh) * | 2016-03-08 | 2016-08-03 | 乐视网信息技术(北京)股份有限公司 | 一种基于语音的信息搜索方法及相应装置 |
CN105930525A (zh) * | 2016-05-30 | 2016-09-07 | 北京小米移动软件有限公司 | 内容搜索方法及装置 |
CN106933962A (zh) * | 2017-02-06 | 2017-07-07 | 涂正富 | 一种微区域网络接入及垂直搜索精准定位获取目标的方法 |
CN107341268A (zh) * | 2017-07-25 | 2017-11-10 | 北京奇艺世纪科技有限公司 | 一种热搜榜排序方法及系统 |
WO2018023480A1 (zh) * | 2016-08-03 | 2018-02-08 | 王晓光 | 大数据中关键字分类搜索方法及系统 |
CN107729336A (zh) * | 2016-08-11 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 数据处理方法、设备及系统 |
CN109086311A (zh) * | 2018-06-25 | 2018-12-25 | 涂正富 | 一种商业专用搜索引擎 |
CN109460501A (zh) * | 2018-11-15 | 2019-03-12 | 成都傅立叶电子科技有限公司 | 一种全局检索作战辅助决策系统及方法 |
CN110019544A (zh) * | 2017-09-30 | 2019-07-16 | 北京国双科技有限公司 | 数据查询方法及系统 |
CN110377797A (zh) * | 2019-07-31 | 2019-10-25 | 重庆大司空信息科技有限公司 | 一种职业资格检索方法和系统 |
CN111552768A (zh) * | 2020-03-26 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101272524A (zh) * | 2007-03-23 | 2008-09-24 | 中国移动通信集团山东有限公司 | 用于移动业务快速发现的搜索平台及其搜索方法 |
CN101437039A (zh) * | 2007-11-15 | 2009-05-20 | 华为技术有限公司 | 一种移动搜索的方法、系统和设备 |
CN101710927A (zh) * | 2009-11-23 | 2010-05-19 | 中国电信股份有限公司 | 基于语音平台提供信息服务的方法和系统 |
CN101789000A (zh) * | 2009-12-28 | 2010-07-28 | 青岛朗讯科技通讯设备有限公司 | 搜索引擎中的模式分类方法 |
-
2011
- 2011-06-02 CN CN2011101474980A patent/CN102184257A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101272524A (zh) * | 2007-03-23 | 2008-09-24 | 中国移动通信集团山东有限公司 | 用于移动业务快速发现的搜索平台及其搜索方法 |
CN101437039A (zh) * | 2007-11-15 | 2009-05-20 | 华为技术有限公司 | 一种移动搜索的方法、系统和设备 |
CN101710927A (zh) * | 2009-11-23 | 2010-05-19 | 中国电信股份有限公司 | 基于语音平台提供信息服务的方法和系统 |
CN101789000A (zh) * | 2009-12-28 | 2010-07-28 | 青岛朗讯科技通讯设备有限公司 | 搜索引擎中的模式分类方法 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034660B (zh) * | 2011-10-10 | 2016-09-28 | 阿里巴巴集团控股有限公司 | 信息提供方法、装置及系统 |
CN103034660A (zh) * | 2011-10-10 | 2013-04-10 | 阿里巴巴集团控股有限公司 | 信息提供方法、装置及系统 |
CN103049455A (zh) * | 2011-10-14 | 2013-04-17 | 中兴通讯股份有限公司 | 基于分级式搜索的呼叫中心服务方法及系统 |
CN103077176A (zh) * | 2012-01-13 | 2013-05-01 | 北京飞漫软件技术有限公司 | 一种在浏览器中按关键词类型进行快捷搜索的方法 |
CN104572717A (zh) * | 2013-10-18 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
CN104572717B (zh) * | 2013-10-18 | 2020-01-31 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
CN103617278A (zh) * | 2013-12-09 | 2014-03-05 | 北京奇虎科技有限公司 | 一种地址栏搜索的控制方法及装置 |
CN105447149A (zh) * | 2015-11-26 | 2016-03-30 | 北京搜狗科技发展有限公司 | 一种用于网络搜索的交互方法、装置及电子设备 |
CN105824877A (zh) * | 2016-03-08 | 2016-08-03 | 乐视网信息技术(北京)股份有限公司 | 一种基于语音的信息搜索方法及相应装置 |
CN105930525A (zh) * | 2016-05-30 | 2016-09-07 | 北京小米移动软件有限公司 | 内容搜索方法及装置 |
WO2018023480A1 (zh) * | 2016-08-03 | 2018-02-08 | 王晓光 | 大数据中关键字分类搜索方法及系统 |
CN107729336A (zh) * | 2016-08-11 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 数据处理方法、设备及系统 |
CN106933962A (zh) * | 2017-02-06 | 2017-07-07 | 涂正富 | 一种微区域网络接入及垂直搜索精准定位获取目标的方法 |
CN107341268A (zh) * | 2017-07-25 | 2017-11-10 | 北京奇艺世纪科技有限公司 | 一种热搜榜排序方法及系统 |
CN107341268B (zh) * | 2017-07-25 | 2020-06-05 | 北京奇艺世纪科技有限公司 | 一种热搜榜排序方法及系统 |
CN110019544A (zh) * | 2017-09-30 | 2019-07-16 | 北京国双科技有限公司 | 数据查询方法及系统 |
CN109086311A (zh) * | 2018-06-25 | 2018-12-25 | 涂正富 | 一种商业专用搜索引擎 |
CN109460501A (zh) * | 2018-11-15 | 2019-03-12 | 成都傅立叶电子科技有限公司 | 一种全局检索作战辅助决策系统及方法 |
CN110377797A (zh) * | 2019-07-31 | 2019-10-25 | 重庆大司空信息科技有限公司 | 一种职业资格检索方法和系统 |
CN111552768A (zh) * | 2020-03-26 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
CN111552768B (zh) * | 2020-03-26 | 2022-07-19 | 深圳平安医疗健康科技服务有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102184257A (zh) | 一种统一搜索方法、装置及系统 | |
US9792356B2 (en) | System and method for supporting natural language queries and requests against a user's personal data cloud | |
US7844215B2 (en) | Mobile audio content delivery system | |
US20220005290A1 (en) | Methods and systems for creating online unified contact and communication management (cm) platform | |
US8849659B2 (en) | Spoken mobile engine for analyzing a multimedia data stream | |
CN101146152B (zh) | 用于电信信息台的信息采集和搜索系统 | |
US10182154B2 (en) | Method and apparatus for using a search engine advantageously within a contact center system | |
CN101404697B (zh) | 提供综合信息服务的呼叫中心系统及呼叫方法 | |
US20100129065A1 (en) | Content request, storage and/or configuration systems and methods for live content or events | |
CN102362471A (zh) | 对话支持 | |
US20040093343A1 (en) | Enhanced client relationship management systems and methods | |
CN101556669A (zh) | 利用人机交互技术与用户进行个性化营销的方法和设备 | |
US20070208564A1 (en) | Telephone based search system | |
CA2596456C (en) | Mobile audio content delivery system | |
CN103136236B (zh) | 信息搜索的方法及系统 | |
CN101178740A (zh) | 搜索信息发布方法 | |
CN110677540A (zh) | 一种医疗机构的咨询电话智能语音识别管理系统 | |
CN101661485A (zh) | 用于支持联系信息查询的方法和设备 | |
CN107343111A (zh) | 一种云呼叫中心数据管理系统 | |
CN102546977A (zh) | 呼叫信息的处理方法及其处理系统 | |
CN1722757B (zh) | 基于话音通讯的录音系统 | |
Zheng | 5G messaging application solutions for business architecture | |
CN104346665A (zh) | 基于信息技术的客户服务系统 | |
CN110019861A (zh) | 依据收藏媒体数据的时间信息产生提示的系统及其方法 | |
Zhang et al. | An IVR Service System Based on Adjustable Broadcast Sequence Speech Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110914 |