CN105740242A - 基于二维码的信息搜索装置与方法及移动终端 - Google Patents
基于二维码的信息搜索装置与方法及移动终端 Download PDFInfo
- Publication number
- CN105740242A CN105740242A CN201410741263.8A CN201410741263A CN105740242A CN 105740242 A CN105740242 A CN 105740242A CN 201410741263 A CN201410741263 A CN 201410741263A CN 105740242 A CN105740242 A CN 105740242A
- Authority
- CN
- China
- Prior art keywords
- keywords
- original
- enhanced
- search engine
- vertical search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims description 22
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 33
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000010267 cellular communication Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910001416 lithium ion Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了基于二维码的信息搜索装置与方法及移动终端。所述方法包括:解析出二维码所承载的原始数据;采用与原始数据的数据类型相对应的抽取规则从原始数据中抽取出原始关键词;扩充原始关键词,得到增强关键词;根据增强关键词的语义选择垂直搜索引擎;使用垂直搜索引擎搜索增强关键词得到垂直搜索结果。采用本发明实施例,移动终端可以根据二维码所承载的原始具体抽取原始关键词,并利用垂直搜索引擎对增强关键词进行搜索得到搜索结果,搜索过程自动完成,无需用户手动操作,易用性高;移动终端自动选择垂直操作引擎并且对增强关键词进行搜索,搜索结果的准确度可以有效避免多次搜索,进一步提升易用性,方便用户使用。
Description
技术领域
本发明涉及信息处理领域,尤其涉及基于二维码的信息搜索装置与方法及移动终端。
背景技术
随着移动终端的普及,出现了二维码(QuickResponseCode)技术。由于二维码具有一定的自身校验功能并且能够承载内容多样的信息,因此被广泛应用于产品推广、网站链接、数据下载、定位/导航、名片交流等十分广泛的领域。
虽然二维码能够承载内容多样信息,但是受制于其编码方式,二维码所能承载信息的容量比较有限,因此在实际使用中二维码通常只承载一些基本信息。如果用户对二维码所承载的基本信息感兴趣,还需要使用搜索引擎进一步进行搜索,才能获取更多的相关信息。例如,在应用于产品推广时,二维码通常只承载产品名称、生产厂家等基本信息。如果用户对该产品感兴趣,还需要使用搜索引擎对二维码所承载的产品名称、生产厂家等进行搜索,才能获取该产品更多的相关信息。
在现有技术中,当用户希望根据二维码所承载的基本信息搜索其它相关信息时,需要从二维码所承载的信息中选出关键词,并手动将所述关键词输入到搜索引擎界面中指定的搜索框,进而由搜索引擎完成搜索并将搜索到的搜索结果返回给用户。由于移动终端的屏幕及操作界面较小,手动将关键词输入到搜索引擎界面中指定的搜索框不但操作不便而且过程繁琐。并且,二维码所承载的信息复杂多样,用户很难通过关键词进行一次搜索就准确获取到自己想要的相关信息,会使得用户操作过程更加繁琐。
由此可以看出,现有基于二维码所承载信息进行搜索的方法易用性低,不方便用户使用。
发明内容
本发明实施例提供了基于二维码的信息搜索装置与方法及移动终端,以解决现有基于二维码所承载信息进行搜索的方法易用性低,不方便用户使用的问题。
第一方面,本发明实施例提供了基于二维码的信息搜索装置,该装置包括:解析单元,用于解析出二维码所承载的原始数据;抽取单元,用于采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;扩充单元,用于扩充原始关键词,得到增强关键词;选择单元,用于根据所述增强关键词的语义选择垂直搜索引擎;搜索单元,用于使用所述垂直搜索引擎搜索所述增强关键词得到垂直搜索结果。
结合第一方面,在第一方面第一种可能的实现方式中,所述抽取单元包括:分词处理子单元,用于当所述原始数据为文本时,对所述文本进行分词处理得到词汇组;第一抽取子单元,用于基于语义从所述词汇组中抽取出原始关键词。
结合第一方面,在第一方面第二种可能的实现方式中,所述抽取单元包括:网页下载子单元,用于当所述原始数据为统一资源定位符URL时,下载所述URL对应的指定网页;第二抽取子单元,用于从所述指定网页中抽取出原始关键词。
结合在第一方面第二种可能的实现方式,在第一方面第三种可能的实现方式中,所述第二抽取子单元,具体用于从所述指定网页的指定节点中抽取出原始关键词;和/或从所述指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
结合第一方面或第一方面第一至三种可能的实现方式中的一种,在第一方面第四种可能的实现方式中,所述扩充单元包括:词汇获取子单元,用于获取与所述原始关键词语义相关的热门词汇;词汇扩充子单元,用于生成包含所述原始关键词与所述热门词汇的所述增强关键词。
结合第一方面或第一方面第一至四种可能的实现方式中的一种,在第一方面第五种可能的实现方式中,所述装置还包括:语境确定单元,用于确定所述增强关键词所处语境;所述选择单元,还用于根据所述强关键词的语义及所述语境选择垂直搜索引擎。
结合第一方面或第一方面第一至五种可能的实现方式中的一种,在第一方面第六种可能的实现方式中,所述搜索单元,具体用于使用所述垂直搜索引擎搜索所述指定关键词得到垂直搜索结果,所述指定关键词从所述增加关键词中抽取。
结合第一方面或第一方面第一至六种可能的实现方式中的一种,在第一方面第七种可能的实现方式中,该装置还包括:通用搜索单元,用于使用通用搜索引擎对所述原始关键词进行搜索得到通用搜索结果;结果合并单元,用于将所述垂直搜索结果与所述通用搜索结果进行组合得到综合搜索结果。
第二方面,本发明实施例还提供了基于二维码的信息搜索方法,所述方法包括:解析出二维码所承载的原始数据;采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;扩充原始关键词,得到增强关键词;根据所述增强关键词的语义选择垂直搜索引擎;使用所述垂直搜索引擎搜索所述增强关键词得到垂直搜索结果。
结合第二方面,在第二方面第一种可能的实现方式中,所述采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词包括:当所述原始数据为文本时,对所述文本进行分词处理得到词汇组,基于语义从所述词汇组中抽取出原始关键词;或者,当所述原始数据为统一资源定位符URL时,下载所述URL对应的指定网页,从所述指定网页的指定节点中抽取出原始关键词,和/或从所述指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
结合第二方面或第二方面第一种可能的实现方式,在第二方面第二种可能的实现方式中,所述对所述原始关键词进行扩充得到增强关键词包括:获取与所述原始关键词语义相关的热门词汇;生成包含所述原始关键词与所述热门词汇的所述增强关键词。
结合第二方面或第二方面第一至二种可能的实现方式中的一种,在第二方面第三种可能的实现方式中,在以所述强关键词的语义为选择条件选定垂直搜索引擎之前还包括:确定所述增强关键词所处语境;所述以所述强关键词的语义为选择条件选定垂直搜索引擎包括:以所述强关键词的语义及所述语境为选择条件选定垂直搜索引擎。
结合第二方面或第二方面第一至三种可能的实现方式中的一种,在第二方面第四种可能的实现方式中,所述使用所述垂直搜索引擎搜索所述增强关键词得到垂直搜索结果,包括:使用所述垂直搜索引擎搜索所述指定关键词得到垂直搜索结果,所述指定关键词从所述增加关键词中抽取。
结合第二方面或第二方面第一至四种可能的实现方式中的一种,在第二方面第五种可能的实现方式中,该方法还包括:使用通用搜索引擎对所述原始关键词进行搜索得到通用搜索结果;将所述垂直搜索结果与所述通用搜索结果进行组合得到综合搜索结果。
第三方面,本发明实施例提供了一种移动终端,其特征在于,所述移动终端包括处理器及通信接口;所述处理器,用于解析出二维码所承载的原始数据;采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;扩充原始关键词,得到增强关键词;根据所述增强关键词的语义选择垂直搜索引擎;通过所述通信接口接收所述垂直搜索引擎根据所述增强关键词执行垂直搜索操作得到垂直搜索结果。
本发明实施例中,解析出二维码所承载的原始数据;采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;扩充原始关键词,得到增强关键词;根据所述增强关键词的语义选择垂直搜索引擎;使用所述垂直搜索引擎搜索所述增强关键词得到垂直搜索结果。采用本发明实施例,移动终端可以根据二维码所承载的原始具体抽取原始关键词,并利用垂直搜索引擎对增强关键词进行搜索得到搜索结果,搜索过程自动完成,无需用户手动操作,易用性高;移动终端自动选择垂直操作引擎并且对增强关键词进行搜索,搜索结果的准确度可以有效避免多次搜索,进一步提升易用性,方便用户使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明移动终端的结构示意图;
图2为本发明基于二维码的信息搜索装置的结构示意图;
图3为本发明基于二维码的信息搜索方法一个实施例的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,为本发明移动终端的结构示意图。所述移动终端可以基于二维码进行信息搜索。
如图1所示,所述分享设备包括输入装置101、处理器102、输出装置103、通信接口104、存储器105、外设接口106等组件。这些组件通过一条或多条总线进行通信。本领域技术人员可以理解,图中示出的电子设备的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施方式中,分享设备及接收设备均可以是任何移动或便携式电子设备,包括但不限于移动电话、移动电脑、平板电脑、个人数字助理(PersonalDigitalAssistant,PDA)、媒体播放器、智能电视,以及上述两项或两项以上的组合等。
输入装置101用于实现用户与电子设备的交互和/或信息输入到电子设备中。例如,输入装置101可以接收用户输入的数字或字符信息,以产生与用户设置或功能控制有关的信号输入。在本发明具体实施方式中,输入装置101可以是触控面板,也可以是其他人机交互界面,例如实体输入键、麦克风等,还可是其他外部信息撷取装置,例如摄像头等。触控面板,也称为触摸屏或触控屏,可收集用户在其上触摸或接近的操作动作。比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或接近触控面板的位置的操作动作,并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸操作,并将检测到的触摸操作转换为电信号,以及将所述电信号传送给触摸控制器;触摸控制器从触摸检测装置上接收所述电信号,并将它转换成触点坐标,再送给处理单元。所述触摸控制器还可以接收处理单元发来的命令并执行。此外,可以采用电阻式、电容式、红外线(Infrared)以及表面声波等多种类型实现触控面板。在本发明的其他实施方式中,输入装置101所采用的实体输入键可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。麦克风形式的输入装置101可以收集用户或环境输入的语音并将其转换成电信号形式的、处理单元可执行的命令。
在本发明的其他一些实施方式中,所述输入装置101还可以是各类传感器件,例如霍尔器件,用于检测电子设备的物理量,例如力、力矩、压力、应力、位置、位移、速度、加速度、角度、角速度、转数、转速以及工作状态发生变化的时间等,转变成电量来进行检测和控制。其他的一些传感器件还可以包括重力感应计、三轴加速计、陀螺仪等。
处理器102为电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器105内的软件程序和/或模块,以及调用存储在存储器105内的数据,以执行电子设备的各种功能和/或处理数据。处理器102可以由集成电路(IntegratedCircuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器102可以仅包括中央处理器(CentralProcessingUnit,简称CPU),也可以是GPU、数字信号处理器(DigitalSignalProcessor,简称DSP)、及通信接口104中的控制芯片(例如基带芯片)的组合。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信接口104用于建立通信信道,使分享设备通过通信信道连接到接收设备。通信接口104可以包括无线局域网(WirelessLocalAreaNetwork,简称wirelessLAN)模块、蓝牙模块、基带(BaseBand)模块等通信模块,以及通信模块对应的射频(RadioFrequency,简称RF)电路,用于进行无线局域网络通信、蓝牙通信、红外线通信及/或蜂窝式通信系统通信,例如宽带码分多重接入(WidebandCodeDivisionMultipleAccess,简称W-CDMA)及/或高速下行封包存取(HighSpeedDownlinkPacketAccess,简称HSDPA)。通信模块用于控制电子设备中的各组件的通信,并且可以支持直接内存存取(DirectMemoryAccess)。
在本发明的不同实施方式中,通信接口104中的各种通信模块一般以集成电路芯片(IntegratedCircuitChip)的形式出现,并可进行选择性组合,而不必包括所有通信模块及对应的天线组。例如,通信接口104可以仅包括基带芯片、射频芯片以及相应的天线以在一个蜂窝通信系统中提供通信功能。经由通信接口104建立的无线通信连接,例如无线局域网接入或WCDMA接入,电子设备可以连接至蜂窝网(CellularNetwork)或因特网(Internet)。在本发明的一些可选实施方式中,通信接口104中的通信模块,例如基带模块可以集成到处理器102中,典型的如高通(Qualcomm)公司提供的APQ+MDM系列平台。
射频电路用于信息收发或通话过程中接收和发送信号。通常,射频电路包括用于执行这些功能的公知电路,包括但不限于天线系统、射频收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、编解码(Codec)芯片组、用户身份模块(SIM)卡、存储器等等。此外,射频电路还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于GSM(GlobalSystemofMobilecommunication,全球移动通讯系统)、GPRS(GeneralPacketRadioService,通用分组无线服务)、CDMA(CodeDivisionMultipleAccess,码分多址)、WCDMA(WidebandCodeDivisionMultipleAccess,宽带码分多址)、高速上行行链路分组接入技术(HighSpeedUplinkPacketAccess,HSUPA)、LTE(LongTermEvolution,长期演进)、电子邮件、SMS(ShortMessagingService,短消息服务)等。
输出装置103包括但不限于影像输出装置1031和声音输出装置1032。影像输出装置103用于输出文字、图片和/或视频。影像输出装置1031可包括显示面板,例如采用LCD(LiquidCrystalDisplay,液晶显示器)、OLED(OrganicLight-EmittingDiode,有机发光二极管)、场发射显示器(fieldemissiondisplay,简称FED)等形式来配置的显示面板。或者影像输出装置1031可以包括反射式显示器,例如电泳式(electrophoretic)显示器,或利用光干涉调变技术(InterferometricModulationofLight)的显示器。影像输出装置1031可以包括单个显示器或不同尺寸的多个显示器。在本发明的具体实施方式中,上述输入装置101所采用的触控面板亦可同时作为输出装置1031的显示面板。例如,触控面板显示当前的显示画面,同时可以接收到用户划定保密区域的指令。虽然在结构图中,输入装置101与输出装置103是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板与显示面板集成一体而实现电子设备的输入和输出功能。例如,影像输出装置103可以显示各种图形化用户接口(GraphicalUserInterface,简称GUI)以作为虚拟控制组件,包括但不限于窗口、卷动轴、图标及剪贴簿,以供用户通过触控方式进行操作。
在本发明具体实施方式中,影像输出装置1031包括滤波器及放大器,用来将处理单元所输出的视频滤波及放大。声音输出装置1032包括数字模拟转换器,用来将处理单元所输出的音频信号从数字格式转换为模拟格式。
存储器105可用于存储软件程序以及模块,处理单元通过运行存储在存储器105的软件程序以及模块,从而执行电子设备的各种功能应用以及实现数据处理。存储器105主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序,比如声音播放程序、图像播放程序等等;数据存储区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。在本发明具体实施方式中,存储器105可以包括易失性存储器,例如非挥发性动态随机存取内存(NonvolatileRandomAccessMemory,简称NVRAM)、相变化随机存取内存(PhaseChangeRAM,简称PRAM)、磁阻式随机存取内存(MagetoresistiveRAM,简称MRAM)等,还可以包括非易失性存储器,例如至少一个磁盘存储器件、电子可擦除可编程只读存储器(ElectricallyErasableProgrammableRead-OnlyMemory,简称EEPROM)、闪存器件,例如反或闪存(NORflashmemory)或是反及闪存(NANDflashmemory)。非易失存储器储存处理单元所执行的操作系统及应用程序。处理单元从非易失存储器加载运行程序与数据到内存并将数字数据储存于大量储存装置中。操作系统包括用于控制和管理常规系统任务,例如内存管理、存储设备控制、电源管理等,以及有助于各种软硬件之间通信的各种组件和/或驱动器。在本发明实施方式中,操作系统可以是Google公司的Android系统、Apple公司开发的iOS系统或Microsoft公司开发的Windows操作系统等,或者是Vxworks这类的嵌入式操作系统。
应用程序包括安装在电子设备上的任何应用,包括但不限于浏览器、电子邮件、即时消息服务、文字处理、键盘虚拟、窗口小部件(Widget)、加密、数字版权管理、语音识别、语音复制、定位(例如由全球定位系统提供的功能)、音乐播放等等。
电源用于给电子设备的不同部件进行供电以维持其运行。作为一般性理解,电源可以是内置的电池,例如常见的锂离子电池、镍氢电池等,也包括直接向电子设备供电的外接电源,例如AC适配器等。在本发明的一些实施方式中,电源还可以作更为广泛的定义,例如还可以包括电源管理系统、充电系统、电源故障检测电路、电源转换器或逆变器、电源状态指示器(如发光二极管),以及与电子设备的电能生成、管理及分布相关联的其他任何组件。
处理器101,可以用于解析出二维码所承载的原始数据;采用与原始数据的数据类型相对应的抽取规则从原始数据中抽取出原始关键词;扩充原始关键词,得到增强关键词;根据增强关键词的语义选择垂直搜索引擎;通过通信接口104接收垂直搜索引擎根据增强关键词执行垂直搜索操作得到垂直搜索结果。
可选的,处理器101,还可以用于当原始数据为文本时,对文本进行分词处理得到词汇组;基于语义从词汇组中抽取出原始关键词。
可选的,处理器101,还可以用于当原始数据为统一资源定位符URL时,下载URL对应的指定网页;从指定网页中抽取出原始关键词。从指定网页中抽取出原始关键词可以包括:从指定网页的指定节点中抽取出原始关键词;和/或从指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
可选的,处理器101,还可以用于获取与原始关键词语义相关的热门词汇;生成包含原始关键词与热门词汇的增强关键词。
可选的,处理器101,还可以用于确定增强关键词所处语境;以强关键词的语义及语境为选择条件选定垂直搜索引擎。
可选的,处理器101,还可以用于通过通信接口104接收垂直搜索引擎根据指定关键词执行垂直搜索操作得到垂直搜索结果,指定关键词从增加关键词中抽取。
可选的,处理器101,还可以用于通过通信接口104接收通用搜索引擎对原始关键词进行搜索得到通用搜索结果;将垂直搜索结果与通用搜索结果进行组合得到综合搜索结果。
其中,二维码可以由输入装置101输入到装置中,也可以预先保存在存储器上105。影像输出装置1031还可以对垂直搜索结果、通用搜索结果及综合搜索结果进行展示。
采用本实施例,移动终端可以在获取到二维码后,直接根据二维码所承载的原始具体抽取关键词,并利用垂直搜索引擎对关键词进行搜索获取搜索结果,搜索过程自动实现,无需用户手动操作,操作简单,并且,移动终端可以自动选择垂直操作引擎以提高搜索结果的准确度,避免多次搜索,因而更加方便用户使用。
参见图2,为本发明基于二维码的信息搜索装置的结构示意图。该装置可以设置在移动终端上。
如图2所示,装置包括解析单元201、抽取单元202、扩充单元203、选择单元204、搜索单元205。
其中,解析单元201,用于解析出二维码所承载的原始数据;抽取单元202,用于采用与原始数据的数据类型相对应的抽取规则从原始数据中抽取出原始关键词;扩充单元203,用于扩充原始关键词,得到增强关键词;选择单元204,用于根据增强关键词的语义选择垂直搜索引擎;搜索单元205,用于使用垂直搜索引擎根据增强关键词执行垂直搜索操作得到垂直搜索结果。
可选的,抽取单元202可以包括:分词处理子单元,用于当原始数据为文本时,对文本进行分词处理得到词汇组;第一抽取子单元,用于基于语义从词汇组中抽取出原始关键词。
可选的,抽取单元202可以包括:网页下载子单元,用于当原始数据为统一资源定位符URL时,下载URL对应的指定网页;第二抽取子单元,用于从指定网页中抽取出原始关键词。第二抽取子单元,可以用于从指定网页的指定节点中抽取出原始关键词;和/或从指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
可选的,扩充单元203可以包括:词汇获取子单元,用于获取与原始关键词语义相关的热门词汇;词汇扩充子单元,用于生成包含原始关键词与热门词汇的增强关键词。
可选的,装置还可以包括:语境确定单元,用于确定增强关键词所处语境;选择单元204,还用于根据强关键词的语义及语境选择垂直搜索引擎。
可选的,搜索单元205,可以用于使用垂直搜索引擎根据指定关键词执行垂直搜索操作得到垂直搜索结果,指定关键词从增加关键词中抽取。
可选的,装置还可以包括:通用搜索单元205,用于使用通用搜索引擎对原始关键词进行搜索得到通用搜索结果;结果合并单元,用于将垂直搜索结果与通用搜索结果进行组合得到综合搜索结果。
采用本实施例,移动终端可以在获取到二维码后,直接根据二维码所承载的原始具体抽取关键词,并利用垂直搜索引擎对关键词进行搜索获取搜索结果,搜索过程自动实现,无需用户手动操作,操作简单,并且,移动终端可以自动选择垂直操作引擎以提高搜索结果的准确度,避免多次搜索,因而更加方便用户使用。
参见图3,为本发明基于二维码的信息搜索方法一个实施例的流程图。该方法包括如下步骤:
步骤301,解析出二维码所承载的原始数据基本信息。
移动终端首先获取二维码,并解析出二维码所承载的原始数据。其中,二维码可以由移动终端通过摄像头扫描获取,或者也可以由移动终端对自身保存的图片文件进行分析获取;对二维码的解析可以通过移动终端上所安装的解析软件实现;二维码所承载的原始数据是指通过预定编码方式编码生成二维码的数据,原始数据可能包括文本、统一资源定位符(UniformResourceLocator,简称URL)、电子邮箱地址、电话号码、电子名片等多种不同类型。
步骤302,采用与原始数据的数据类型相对应的抽取规则从原始数据中抽取出原始关键词。
由于从二维码解析出的原始数据有多种类型。原始数据可能是二维码所承载的基本信息本身,例如电子邮箱地址、电话号码等;或者也是可能是二维码所承载的基本信息的获取方式,例如URL等,因此需要根据原始数据的数据类型的不同选择相应的抽取规则,然后使用抽取规则从原始数据中抽取出原始关键词。其中,原始关键词,是指从二维码所承载的基本信息中抽取出来的关键词,关键词可以为一个,也可以为多个。
根据原始数据类型的不同,从原始数据中抽取原始关键词的方式也不相同。
当原始数据是基本信息本身时,可以直接从基本信息中抽取出原始关键词。以原始数据为文本为例,可以首先对文本进行分词处理得到词汇组;然后基于语义从词汇组中抽取出原始关键词。
例如,当原始数据为“这里有新品特价手机”时,可以通过分词处理得到“这里”“有”“新品”“特价”“手机”等词汇构成的词汇组,然后根据各个词汇的语义从词汇中选出“特价”“新品”“手机”作为原始关键词。
当原始数据是基本信息的获取方式时,可以首先获取基本信息,然后从基本信息中抽取出原始关键词。以原始数据为URL为例,首先下载URL对应的指定网页;从指定网页中抽取出原始关键词。
在一种可能的实现方式中,从指定网页中抽取出原始关键词时,可以首先获取网页中的文本;然后采用分词处理对网页中的文本进行分词处理得到词汇组;再根据词汇组中各个词汇的语义从词汇中抽取出原始关键词。
在另一种可能的实现方式中,从指定网页中抽取出原始关键词时,可以先确定上述指定网页对应原始关键词抽取规则,然后按照抽取规则从指定网页中抽取出原始关键词。
例如,由于网页通常具有一定的框架结构,移动终端可以首先分析出指定网页的文档对象模型(HTMLDocumentObjectModel,简称DOM),然后根据DOM中的节点的位置关系,确定原始关键词可能所在的节点,然后再从该节点所包含的内容中抽取出原始关键词。又如,为便于搜索引擎对网页进行抓取,网页中通常会设置有用于指示该网页内容所包含的关键词的“keywords”标签。因此,移动终端也可以在获取到指定网页之后,首先查找指定网页中的“keywords”标签,然后将“keywords”标签所指示的内容作为原始关键词。由于同一个网站的网页通常具有相同的DOM结构或HTML标签与内容对应关系,因此可以预先为同一网站的网页生成统一的原始关键词抽取规则。该原始关键词抽取规则可以是从指定网页的指定节点中抽取原始关键词,也可以是从指定网页的中指定HTML标签对应的内容中抽取出原始关键词。在原始数据为URL时,移动终端可以首先根据URL确定该URL所属的网站,获取该网站指定网页对应的原始关键词抽取规则,然后利用该原始关键词抽取规则从该URL对应的指定网页中抽取原始关键词。步骤303,扩充原始关键词,得到增强关键词。
在抽取出原始关键词之后,移动终端可以采用不同的方式对原始关键词进行扩充得到增强关键词。
在一种可能的实现方式中,移动终端可以首先从指定搜索引擎获取热门词汇,然后从中选出原始关键词语义相关的热门词汇,对原始关键词进行扩充,其中,热门词汇是指指定搜索引擎一段时间搜索度最高的词汇。例如,当原始关键词为“手机”时,可以热门词汇中选出“MATE7”等与“手机”相关关键词作为与“手机”语义相关的热门词汇,对原始关键词进行扩充。
在另一种可能的实现方式中,移动终端还可以根据原始关键词的语义对原始关键词进行扩充。例如,当原始关键词包括“特价”时,可以使用“优惠”、“折扣”等与“特价”语义相似或相关的关键词对原始关键词进行扩充。
在另一种可能的实现方式中,移动终端还可以根据原始关键词的语境对对原始关键词进行扩充,其中,语境是指关键词所处的语言环境,即可以包括语言因素,也可以包括非语言因素。例如语境可以包括:原始关键词上下文;移动终端获取二维码时所处的时间、空间及情景;移动终端用户的搜索引擎使用偏好等。例如,当移动终端的用户前次使用该移动终端搜索了“HUAWEI”这一与“手机”语义相关的关键词时,还可以将“HUAWEI”作为增加关键词其中之一。
在此需要说明的是,在扩充原始关键词时,移动终端可以采用前述方式中的一种进行扩充,也可以同时采用多种方式进行扩充。
步骤304,根据增强关键词的语义选择垂直搜索引擎。
在得到增强关键词后,移动终端可以以增强关键词的语义,确定增强关键词所属的行业或领域,然后从针对该行业或领域专业的多个搜索引擎中,选择其中一个搜素引擎作为垂直搜索引擎。例如,在增强关键词包括“手机”、“特价”、“优惠”、“折扣”、“新品”、“HUAWEI”时,可以选择针对电子商务领域的专业搜索引擎作为垂直搜索引擎。
即便是关键词相同,在不同的语境下移动终端的用户所希望搜索到的相关信息也可能不同。因此在选择垂直搜索引擎时,除根据增强关键词的语义外,还可以同时根据增加关键词所处的语境。由于同一行业或领域内的专业搜索引擎通常会有多个,在选择垂直搜索引擎时同时将增强关键词的语义及所处语境作为选择条件,可以有利于垂直搜索引擎的选择更加准确。
例如,在增强关键词包括“手机”、“特价”、“优惠”、“折扣”、“新品”、“HUAWEI”时,如果移动终端位于某住宅区内,移动终端用户通常想要获取的搜索结果是手机的测评信息,因此移动终端可以选择资讯类网站所提供的资讯类专业搜索引擎作为垂直搜索引擎。如果移动终端位于某电子产品卖场内,移动终端用户通常想要获取的搜索结果是手机的价格信息,因此移动终端可以选择电商类网站所提供的价格类专业搜索引擎作为垂直搜索引擎。
步骤305,根据增强关键词,使用垂直搜索引擎执行垂直搜索操作,得到垂直搜索结果。
在根据增强关键词,使用垂直搜索引擎执行垂直搜索操作时,移动终端可以直接调用垂直搜索引擎的接口,将增强关键词作为搜索条件提交到搜索引擎。搜索引擎在以增强关键词为搜索条件完成搜索后,向移动终端返回垂直搜索结果,并由移动终端将垂直搜索结果展示给用户。
由于增加关键词中可能包括较多的关键词,因此在垂直搜索引擎确定后,移动终端也可以从增强关键词中选取出若干指定关键词,然后使用垂直搜索引擎根据指定关键词执行垂直搜索操作得到垂直搜索结果。
在从增强关键词中选取指定关键词时,可以按照预定规则进行选取。预定规则可以按照需要预先设定。在具体的实现方式中,当增强关键词中包含的关键词属于不同的语义簇时,可以从每一个语义簇中选择一个关键词作为指定关键词。例如,当增强关键词中包括“特价”、“优惠”、“折扣”时,可以选取其中任意一个作为指定关键词。在获取到指定关键词后,可以就爱那个指定关键词成搜索条件,然后使用垂直搜索引擎对搜索条件进行搜索获取垂直搜索结果,从而完成基于二维码的信息搜索。
在另一个实施例中,移动终端在使用垂直搜索引擎进行搜索的同时,还可以使用通用搜索引擎对原始关键词进行搜索,得到通用搜索结果。在垂直搜索结果生成之后,可以将垂直搜索结果与通用搜索结果进行组合得到综合搜索结果。由于综合搜索结果既包含了垂直搜索结果又包含了通用搜索结果,可以避免因为垂直搜索引擎选择不当造成搜索结果不能满足移动设备用户需求的情况。
采用本实施例,移动终端可以在获取到二维码后,直接根据二维码所承载的原始具体抽取关键词,并利用垂直搜索引擎对关键词进行搜索获取搜索结果,搜索过程自动实现,无需用户手动操作,操作简单,并且,移动终端可以自动选择垂直操作引擎以提高搜索结果的准确度,避免多次搜索,因而更加方便用户使用。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种基于二维码的信息搜索装置,其特征在于,包括:
解析单元,用于解析出二维码所承载的原始数据;
抽取单元,用于采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;
扩充单元,用于扩充原始关键词,得到增强关键词;
选择单元,用于根据所述增强关键词的语义选择垂直搜索引擎;
搜索单元,用于使用所述垂直搜索引擎搜索所述增强关键词,得到垂直搜索结果。
2.如权利要求1所述的装置,其特征在于,所述抽取单元包括:
分词处理子单元,用于当所述原始数据为文本时,对所述文本进行分词处理得到词汇组;
第一抽取子单元,用于基于语义从所述词汇组中抽取出原始关键词。
3.如权利要求1所述的装置,其特征在于,所述抽取单元包括:
网页下载子单元,用于当所述原始数据为统一资源定位符URL时,下载所述URL对应的指定网页;
第二抽取子单元,用于从所述指定网页中抽取出原始关键词。
4.如权利要求3所述的装置,其特征在于,
所述第二抽取子单元,具体用于从所述指定网页的指定节点中抽取出原始关键词;和/或
从所述指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
5.如权利要求1至4任一项所述的装置,其特征在于,所述扩充单元包括:
词汇获取子单元,用于获取与所述原始关键词语义相关的热门词汇;
词汇扩充子单元,用于生成包含所述原始关键词与所述热门词汇的所述增强关键词。
6.如权利要求1至5任一项所述的装置,其特征在于,
所述装置还包括:语境确定单元,用于确定所述增强关键词所处语境;
所述选择单元,还用于根据所述强关键词的语义及所述语境选择垂直搜索引擎。
7.如权利要求1至6任一项所述的装置,其特征在于,
所述搜索单元,具体用于使用所述垂直搜索引擎搜索所述指定关键词得到垂直搜索结果,所述指定关键词从所述增加关键词中抽取。
8.如权利要求1至7任一项所述的装置,其特征在于,还包括:
通用搜索单元,用于使用通用搜索引擎对所述原始关键词进行搜索得到通用搜索结果;
结果合并单元,用于将所述垂直搜索结果与所述通用搜索结果进行组合得到综合搜索结果。
9.一种基于二维码的信息搜索方法,其特征在于,包括:
解析出二维码所承载的原始数据;
采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词;
扩充原始关键词,得到增强关键词;
根据所述增强关键词的语义选择垂直搜索引擎;
使用所述垂直搜索引擎搜索所述增强关键词,得到垂直搜索结果。
10.如权利要求9所述的方法,其特征在于,所述采用与所述原始数据的数据类型相对应的抽取规则从所述原始数据中抽取出原始关键词包括:
当所述原始数据为文本时,对所述文本进行分词处理得到词汇组,基于语义从所述词汇组中抽取出原始关键词;或者,
当所述原始数据为统一资源定位符URL时,下载所述URL对应的指定网页,从所述指定网页的指定节点中抽取出原始关键词,和/或从所述指定网页中指定超文本标记语言HTML标签对应的内容中抽取出原始关键词。
11.如权利要求9或10所述的方法,其特征在于,所述对所述原始关键词进行扩充得到增强关键词包括:
获取与所述原始关键词语义相关的热门词汇;
生成包含所述原始关键词与所述热门词汇的所述增强关键词。
12.如权利要求9至11任一项所述的方法,其特征在于,
在以所述强关键词的语义为选择条件选定垂直搜索引擎之前还包括:
确定所述增强关键词所处语境;
所述以所述强关键词的语义为选择条件选定垂直搜索引擎包括:
以所述强关键词的语义及所述语境为选择条件选定垂直搜索引擎。
13.如权利要求9至12任一项所述的方法,其特征在于,所述使用所述垂直搜索引擎搜索所述增强关键词得到垂直搜索结果包括:
使用所述垂直搜索引擎搜索所述指定关键词得到垂直搜索结果,所述指定关键词从所述增加关键词中抽取。
14.如权利要求9至13任一项所述的方法,其特征在于,还包括:
使用通用搜索引擎对所述原始关键词进行搜索得到通用搜索结果;
将所述垂直搜索结果与所述通用搜索结果进行组合得到综合搜索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410741263.8A CN105740242A (zh) | 2014-12-08 | 2014-12-08 | 基于二维码的信息搜索装置与方法及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410741263.8A CN105740242A (zh) | 2014-12-08 | 2014-12-08 | 基于二维码的信息搜索装置与方法及移动终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105740242A true CN105740242A (zh) | 2016-07-06 |
Family
ID=56237606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410741263.8A Pending CN105740242A (zh) | 2014-12-08 | 2014-12-08 | 基于二维码的信息搜索装置与方法及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740242A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844701A (zh) * | 2017-01-03 | 2017-06-13 | 宁波亿拍客网络科技有限公司 | 一种可基于计算机视觉感知识别的特定标记及使用方法 |
CN110020037A (zh) * | 2017-07-27 | 2019-07-16 | 中国电信股份有限公司 | 应用特征库生成方法和装置 |
CN110399548A (zh) * | 2018-04-20 | 2019-11-01 | 北京搜狗科技发展有限公司 | 一种搜索处理方法、装置、电子设备以及存储介质 |
CN111597366A (zh) * | 2020-05-13 | 2020-08-28 | 支付宝(杭州)信息技术有限公司 | 信息处理方法和装置 |
CN115794984A (zh) * | 2022-11-14 | 2023-03-14 | 北京百度网讯科技有限公司 | 数据存储方法、数据检索方法、装置、设备以及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814170A (zh) * | 2009-02-24 | 2010-08-25 | 上海亿动信息技术有限公司 | 一种在广告发布控制系统中发布广告的控制装置及方法 |
CN102135967A (zh) * | 2010-01-27 | 2011-07-27 | 华为技术有限公司 | 网页关键词提取方法、装置及系统 |
US20110184954A1 (en) * | 2005-05-06 | 2011-07-28 | Nelson John M | Database and index organization for enhanced document retrieval |
CN103218410A (zh) * | 2013-03-26 | 2013-07-24 | 亿赞普(北京)科技有限公司 | 互联网事件分析方法与装置 |
CN103577601A (zh) * | 2013-11-18 | 2014-02-12 | 北京京东尚科信息技术有限公司 | 数据获取方法和装置 |
CN104199833A (zh) * | 2014-08-01 | 2014-12-10 | 北京奇虎科技有限公司 | 一种网络搜索词的聚类方法和聚类装置 |
-
2014
- 2014-12-08 CN CN201410741263.8A patent/CN105740242A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184954A1 (en) * | 2005-05-06 | 2011-07-28 | Nelson John M | Database and index organization for enhanced document retrieval |
CN101814170A (zh) * | 2009-02-24 | 2010-08-25 | 上海亿动信息技术有限公司 | 一种在广告发布控制系统中发布广告的控制装置及方法 |
CN102135967A (zh) * | 2010-01-27 | 2011-07-27 | 华为技术有限公司 | 网页关键词提取方法、装置及系统 |
CN103218410A (zh) * | 2013-03-26 | 2013-07-24 | 亿赞普(北京)科技有限公司 | 互联网事件分析方法与装置 |
CN103577601A (zh) * | 2013-11-18 | 2014-02-12 | 北京京东尚科信息技术有限公司 | 数据获取方法和装置 |
CN104199833A (zh) * | 2014-08-01 | 2014-12-10 | 北京奇虎科技有限公司 | 一种网络搜索词的聚类方法和聚类装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844701A (zh) * | 2017-01-03 | 2017-06-13 | 宁波亿拍客网络科技有限公司 | 一种可基于计算机视觉感知识别的特定标记及使用方法 |
CN110020037A (zh) * | 2017-07-27 | 2019-07-16 | 中国电信股份有限公司 | 应用特征库生成方法和装置 |
CN110399548A (zh) * | 2018-04-20 | 2019-11-01 | 北京搜狗科技发展有限公司 | 一种搜索处理方法、装置、电子设备以及存储介质 |
CN111597366A (zh) * | 2020-05-13 | 2020-08-28 | 支付宝(杭州)信息技术有限公司 | 信息处理方法和装置 |
CN111597366B (zh) * | 2020-05-13 | 2023-02-03 | 支付宝(杭州)信息技术有限公司 | 信息处理方法和装置 |
CN115794984A (zh) * | 2022-11-14 | 2023-03-14 | 北京百度网讯科技有限公司 | 数据存储方法、数据检索方法、装置、设备以及介质 |
CN115794984B (zh) * | 2022-11-14 | 2023-11-28 | 北京百度网讯科技有限公司 | 数据存储方法、数据检索方法、装置、设备以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109857327B (zh) | 信息处理装置、信息处理方法以及存储介质 | |
JP5956725B2 (ja) | コンテキスト認識型ヘルプ・コンテンツを提供する方法、デバイス、及びコンピュータ・プログラム製品 | |
US9241242B2 (en) | Information recommendation method and apparatus | |
CN106970790B (zh) | 一种应用程序创建的方法、相关设备及系统 | |
US9930167B2 (en) | Messaging application with in-application search functionality | |
CN105580394B (zh) | 消息推送及消息显示的方法和装置 | |
CN108287918B (zh) | 基于应用页面的音乐播放方法、装置、存储介质和电子设备 | |
WO2014169715A1 (en) | Information recommendation method and apparatus | |
CN104423868A (zh) | 电子书阅读定位方法及装置 | |
CN107870666B (zh) | 一种终端控制方法及终端 | |
CN111490927B (zh) | 一种显示消息的方法、装置及设备 | |
CN104142774B (zh) | 页面内容的处理方法及装置 | |
CN103473253B (zh) | 经地理编码的数据的检测及用于其的用户界面 | |
CN105740242A (zh) | 基于二维码的信息搜索装置与方法及移动终端 | |
CN111316618B (zh) | 一种网络页面保存方法及终端 | |
CN106446180B (zh) | 一种歌曲的识别方法及移动终端 | |
CN104281394A (zh) | 智能选词的方法和装置 | |
JP2015509625A (ja) | タッチ端末におけるテキスト検索のための方法及び装置 | |
CN108604331B (zh) | 一种信息提醒方法以及移动设备 | |
CN105095253A (zh) | 网页显示方法及装置 | |
CN104281568A (zh) | 一种释义显示方法和装置 | |
US20160291844A1 (en) | Method and apparatus for opening a data processing page | |
CN109032905B (zh) | 一种点击事件的统计方法以及相关设备 | |
TWI504860B (zh) | An electronic device and how to launch an app based on address information | |
WO2019056324A1 (zh) | 推荐联想词的方法、移动终端以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160706 |
|
RJ01 | Rejection of invention patent application after publication |