CN101625682A - 搜索输入装置、搜索输入方法及搜索引擎装置 - Google Patents

搜索输入装置、搜索输入方法及搜索引擎装置 Download PDF

Info

Publication number
CN101625682A
CN101625682A CN200810116370A CN200810116370A CN101625682A CN 101625682 A CN101625682 A CN 101625682A CN 200810116370 A CN200810116370 A CN 200810116370A CN 200810116370 A CN200810116370 A CN 200810116370A CN 101625682 A CN101625682 A CN 101625682A
Authority
CN
China
Prior art keywords
search
data
auxiliary
user
auxiliary data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200810116370A
Other languages
English (en)
Inventor
侯紫峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN200810116370A priority Critical patent/CN101625682A/zh
Publication of CN101625682A publication Critical patent/CN101625682A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种搜索输入装置、搜索输入方法及搜索引擎装置。本发明的搜索输入装置包括:搜索输入信息接收器,其接收主要搜索数据;搜索辅助信息生成器,其根据所述主要搜索数据生成搜索辅助数据;和搜索数据综合器,其对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。通过这样,根据主要搜索数据来自动生成与其相关的搜索辅助数据,通过将该主要搜索数据和搜索辅助数据综合起来进行搜索,从而能够提高搜索精确度。

Description

搜索输入装置、搜索输入方法及搜索引擎装置
技术领域
本发明涉及一种搜索输入装置、搜索输入方法、及搜索引擎装置,特别是一种能够根据搜索数据来自动生成其相关信息的搜索输入装置、搜索输入方法及搜索引擎装置。
背景技术
现有的搜索技术往往是通过一个文本框关键字来进行搜索,比如搜索引擎中,一般都提供有输入文本框,由用户输入关键字来执行搜索,但这种搜索其结果往往不精确,效果也不够好。
因此,现有技术中给出了一种建立知识索引的方法包括:将目标文档划分成多个部分;对各个部分中包含的知识进行编码,以得到相应知识的知识编码;相互对应地存储所述各个部分及其知识编码。在输入了搜索数据时,对所述搜索语句进行语法或者语义分析,以获得该搜索语句的基于知识编码的语义表达;在知识库中匹配该语义表达,以找到对应的答案。
基于上述建立知识索引的方法现有技术中提供的搜索方法,主要用‘对象-属性-属性值’这样的知识表达方式,来限定一类语句的语义范畴。例如:联想电脑-种属-电脑,联想电脑-生产厂商-联想。
但是,上述搜索技术至少存在以下问题:
1.仅用关键字进行搜索,数据形式单一,局限性很大。
2.仅仅是对搜索数据本身进行语义分析,其信息量仍不足以获得足够精确及有效的结果。无法有效的获得数据本身的属性,搜索数据的目的和环境。
发明内容
本发明的目的在于,提供一种能够根据主要搜索数据来自动生成与其相关的搜索辅助数据,通过将该主要搜索数据和搜索辅助数据综合起来进行搜索的搜索输入装置、搜索输入方法、以及搜索引擎装置。
根据本发明的一个方面,提供了一种搜索输入装置,包括:
搜索输入信息接收器,其接收主要搜索数据;
搜索辅助信息生成器,其根据所述主要搜索数据生成搜索辅助数据;和
搜索数据综合器,其对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;
其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。
优选地,所述搜索辅助信息生成器包括:
搜索辅助信息发送单元,用于将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据;
搜索辅助信息接收单元,用于接收由所述辅助信息产生模块处理得到的所述搜索辅助数据。
优选地,所述搜索输入装置还包括:搜索辅助数据筛选模块,用于根据用户筛选操作在所述搜索辅助数据中提取出与所述用户筛选操作相关的搜索辅助数据。
优选地,所述搜索辅助信息生成器具有与搜索引擎的辅助信息产生模块一致的自动生成环境,并在所述自动生成环境下生成所示搜索辅助数据,所述辅助信息产生模块用于根据主要搜索数据处理得到相应的搜索辅助数据。
优选地,所述搜索辅助信息生成器包括:用户信息记录模块,用于记录与用户相关的用户信息,并根据所述用户信息生成所述搜索辅助数据。
优选地,所述的搜索输入装置还包括:搜索辅助信息修正模块,用于接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。
优选地,所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,浏览器,图标,动画中的一种或多种。
根据本发明的另一个方面,提供了一种搜索输入方法,包括:
接收主要搜索数据;
根据所述主要搜索数据生成搜索辅助数据;和
对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;
其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。
优选地,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:
将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据;
优选地,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:根据用户筛选操作在所述搜索辅助数据中提取出与所述用户筛选操作相关的搜索辅助数据。
优选地,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:按照与搜索引擎端根据主要搜索数据处理得到相应的搜索辅助数据相同的自动生成方式生成所述搜索辅助数据。
优选地,根据所述主要搜索数据生成搜索辅助数据具体为:根据与用户相关的用户信息生成所述搜索辅助数据。
优选地,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。
优选地,所述综合处理为冗余数据清除以及数据的规范化。
优选地,所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,网页,图标,动画中的一种或多种。
根据本发明的另一个方面,提供了一种搜索引擎,包括:
搜索数据采集装置,用于采集源数据,并从所述源数据中提取关键数据,对所述源数据和所述关键数据建立索引,得到数据索引;
数据仓库,用于接收并存储由所述搜索数据采集装置所发送的所述源数据、所述关键数据、及所述数据索引;及
搜索处理装置,用于接收来自一搜索输入装置的搜索数据,根据所述搜索数据在所述数据仓库中进行查找,输出查找结果;
所述关键数据中包括情景信息。
优选地,所述搜索数据采集装置包括:统计分析模块,用于通过对所述源数据进行统计分析而提取所述关键数据。
优选地,所述搜索数据采集装置包括:语义分析模块,用于通过对所述源数据进行语义关联分析而提取所述关键数据。
优选地,所述的搜索引擎还包括:用户配置模块,用于根据用户操作对所述关键数据进行限制、选择、修改。
优选地,所述源数据为文字数据,图像数据,音频数据,视频数据,窗口,网页,图标,动画中的一种或多种。
本发明的实施例至少具有以下有益效果:
1.根据主要搜索数据生成搜索辅助数据,并将主要搜索数据和搜索辅助数据综合起来执行搜索,因此能够提高搜索精确度。
2.利用搜索引擎端的处理生成搜索辅助数据,因此不会给搜索输入装置增加负担,且能够生成与搜索引擎端的生成规则一致的搜索辅助数据,从而进一步提高搜索精确度。
3.提供用户对搜索引擎端所生成的搜索辅助数据进行选择的可能,从而进一步提高搜索精确度。
4.利用搜索输入装置端的本地处理来生成搜索辅助数据,且采用了与搜索引擎端一致的生成环境,因此既不会给搜索引擎增加负担,又能够生成与搜索引擎端的生成环境匹配的搜索辅助数据,从而进一步提高搜索精确度。
5.将自动生成与人工干预方式结合,能够搜索出更加符合用户需求的数据,进一步提高搜索精确度。
通过本发明的实施例能够扩大搜索数据的范围,对多种多样的数据形式方便地进行搜索,同时还能够根据主要搜索数据生成搜索辅助数据,使搜索更精确,更有效。
附图说明
图1是本发明实施例的搜索系统的结构图。
图2是本发明实施例的搜索输入装置的结构图。
图3是本发明实施例的搜索数据采集装置的处理流程。
图4是本发明的实施例2的输入数据之一例。
具体实施方式
下面,根据附图说明本发明的实施方式。
图1中示出了本发明实施例的基于属性和情景的搜索系统的结构图。首先对照图1,对此实施例的搜索系统进行说明。
本实施例的基于属性和情景的搜索系统,典型地由下图的3个部分组成:
分别是:搜索输入装置1、搜索引擎2、和搜索输出装置3。其中,搜索引擎2由搜索数据采集装置21、数据仓库22、搜索处理装置23构成。
以下分别对各个部分进行概要说明。
[搜索输入装置]
图2中示出了本发明的搜索输入装置的结构。参照图2,所述搜索输入装置由搜索输入信息接收器,搜索辅助信息生成器及搜索数据综合器组成。其中,搜索输入信息接收器接收用户输入的主要搜索数据,并将主要搜索数据发送给搜索辅助信息生成器,搜索辅助信息生成器自动形成关于主要搜索数据的属性数据和情景数据。搜索数据综合器接收来自搜索输入信息接收器的主要搜索数据和搜索辅助信息生成器的属性数据和情景数据,并将所述主要搜索数据及其属性数据和情景数据进行综合处理,得到待发送搜索数据,并将所述待发送搜索数据发送至搜索引擎2的搜索处理装置23。这里所说的数据综合,主要用来实现冗余数据清除以及数据的规范化,以方便后续处理。关于属性数据和情景数据及其生成方法,将在后面详述。
其中,搜索辅助信息生成器包括:搜索辅助信息发送单元,用于将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据;搜索辅助信息接收单元,用于接收由所述辅助信息产生模块处理得到的所述搜索辅助数据。
其中,搜索辅助信息包括:属性数据和情景数据,还可以通过所述搜索输入装置内的搜索辅助信息修正模块接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。例如:手工增加,减少,修改。
[搜索引擎]
下面对搜索引擎2的构成部分搜索数据采集装置21、数据仓库22、搜索处理装置23分别进行说明
[搜索数据采集装置]
图3中示出了此实施例的的搜索数据采集装置21的处理流程。参照图3,搜索引擎的搜索数据采集装置21,首先采集网络上的各种数据(包括网页或者网页中的部分数据:如:文字数据,图像数据,音频数据,视频数据,图标,动画等等)。数据采集之后,搜索数据采集装置21提取以上数据的关键数据。(关键数据包括:数据的关键片段,数据的属性信息;数据的情景信息。关键数据的提取将在后面详述)。搜索数据采集装置21将关键数据和原始数据组成索引形式,并送到数据仓库22。(即:可以通过数据的关键片段索引查找原始数据;通过数据的属性信息索引查找原始数据;通过数据的情景信息索引查找原始数据)。
在此,对上述数据的关键片段进行说明。在数据的格式不同的情况下,数据的关键片段也存在差异,以下列举一些对于不同格式的数据,数据的关键片段的形式:
对于文本数据是关键词;
对于图像数据是图像的题目、说明等文字信息的关键词以及图像的分割子图;
对于视频数据是视频的题目、说明等文字信息的关键词以及视频的帧;
对于音频数据是音频的题目、说明等文字信息的关键词以及音频片段。
以上仅仅是列举,本发明的数据关键片段并不仅限于上述形式,可以根据需要进行设置、扩充。
[数据仓库22]
本发明的搜索引擎2,将搜索数据采集装置21送来的原始数据和数据索引综合到数据仓库22中。对于数据仓库22内容的查找,可以通过数据的关键片段进行,可以通过数据的属性数据进行,还可以通过数据的情景数据进行。在这里,与通常的数据库不同的是要建立有关情景数据的查找索引。情景数据索引是可以随着情景的变化而动态修正的。
[搜索处理装置23]
搜索处理装置23将来自搜索输入装置1的主要搜索数据、属性数据、情景数据进一步处理,形成适合当前数据仓库22查找的主要搜索数据的关键片段、属性数据、情景数据。然后,在数据仓库22中,依据数据的关键片段索引,属性数据索引、情景数据索引进行数据查找。并将查找到的各种数据依据一定的规则分类、排列,送往搜索输出装置。特别的,由于有了情景数据,可以依据情景数据进行分类,排列。
[搜索输出装置3]
依据预定的或者用户指定的呈现方式,将搜索到的数据呈现给用户。特别的,可以依据情景数据各种约定进行呈现。
以上,对此实施例的搜索系统的结构进行了整体说明。所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,浏览器,图标,动画中的一种或多种。
基于上述实施例的搜索系统,本发明的实施例还提供了一种搜索输入方法,包括:
接收主要搜索数据;
根据所述主要搜索数据生成搜索辅助数据;和
对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;
其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。
优选地,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:
将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据;
优选地,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:根据用户筛选操作在所述搜索辅助数据中提取出与所述用户筛选操作相关的搜索辅助数据。
优选地,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:按照与搜索引擎端根据主要搜索数据处理得到相应的搜索辅助数据相同的自动生成方式生成所述搜索辅助数据。
优选地,根据所述主要搜索数据生成搜索辅助数据具体为:根据与用户相关的用户信息生成所述搜索辅助数据。
优选地,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。
优选地,所述综合处理为冗余数据清除以及数据的规范化。
优选地,所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,网页,图标,动画中的一种或多种。
下面对本发明实施例中即属性数据和情景数据及其产生方法进行详细说明。
[属性数据的定义]
属性数据是数据的特性的描述。
例如:一个文件的格式,文件的归属,文件的大小,文件的建立时间,修改时间,等等。再例如:一个图像的名称,图像的尺寸,图像的颜色,图像的格式,等等。
属性数据是数据的固有特性,可以采用各种已知的技术手段从数据中提取,且针对不同格式的数据,存在不同的属性数据提取方式。
[情景数据的定义]
情景数据是数据的语义相关方面的描述,包括:语义内涵、语义分类、语义关联、语义环境等多方面的描述。它们可以显性地出现在原始数据中,即关键数据;更多的则表现为隐性数据,表示原始数据的关联的各个方面。
例如:坦克上的LCD。其语义内涵,就包括坦克,液晶显示器等等;语义分类就包括军事,设备等等;语义关联就包括装甲车,战车,装备,仪器,显示器,观察,显示设备等等;语义环境就包括报道,简介,原理,方法,结构,操作等等。
[情景数据的生成]
本发明的情景数据的产生方法,既在搜索输入装置端应用,又在搜索引擎端应用。
关于情景数据的产生有多种方式,这里首先考虑搜索引擎2对网络上采集的各种原始数据生成情景数据的情况(注:网络上采集的各种原始数据,通常是以网页,文件等方式体现的,是由大量源数据组成的数据)。
1搜索引擎端
情景数据的生成方法大体上可以分为自动生成方法和人工参与方法,首先对情景数据的自动生成方法进行说明。
1.1自动生成方法
1.1.1统计生成方法
统计生成方法主要是进行分类。此方法是对大量已有数据的情景数据进行统计,分类。当一个新的数据出现时,对其语义,形式等方面进行类比分析和归类,产生起相应的情景数据。
例如:下面关于LCD的一个介绍文章,就可以用统计的方法得到很多情景数据。
LCD概述
LCD液晶显示器是Liquid Crystal Display的简称,LCD的构造是在两片平行的玻璃当中放置液态的晶体,两片玻璃中间有许多垂直和水平的细小电线,透过通电与否来控制杆状水晶分子改变方向,将光线折射出来产生画面。比CRT要好的多,但是价钱较其贵。
LCD液晶投影机是液晶显示技术和投影技术相结合的产物,它利用了液晶的电光效应,通过电路控制液晶单元的透射率及反射率,从而产生不同灰度层次及多达1670百万种色彩的靓丽图像。LCD投影机的主要成像器件是液晶板。LCD投影机的体积取决于液晶板的大小,液晶板越小,投影机的体积也就越小。
根据电光效应,液晶材料可分为活性液晶和非活性液晶两类,其中活性液晶具有较高的透光性和可控制性。液晶板使用的是活性液晶,人们可通过相关控制系统来控制液晶板的亮度和颜色。与液晶显示器相同,LCD投影机采用的是扭曲向列型液晶。LCD投影机的光源是专用大功率灯泡,发光能量远远高于利用荧光发光的CRT投影机,所以LCD投影机的亮度和色彩饱和度都高于CRT投影机。LCD投影机的像元是液晶板上的液晶单元,液晶板一旦选定,分辨率就基本确定了,所以LCD投影机调节分辨率的功能要比CRT投影机差。
LCD投影机按内部液晶板的片数可分为单片式和三片式两种,现代液晶投影机大都采用3片式LCD板(图1)。三片式LCD投影机是用红、绿、蓝三块液晶板分别作为红、绿、蓝三色光的控制层。光源发射出来的白色光经过镜头组后会聚到分色镜组,红色光首先被分离出来,投射到红色液晶板上,液晶板“记录”下的以透明度表示的图像信息被投射生成了图像中的红色光信息。绿色光被投射到绿色液晶板上,形成图像中的绿色光信息,同样蓝色光经蓝色液晶板后生成图像中的蓝色光信息,三种颜色的光在棱镜中会聚,由投影镜头投射到投影幕上形成一幅全彩色图像。三片式LCD投影机比单片式LCD投影机具有更高的图像质量和更高的亮度。LCD投影机体积较小、重量较轻,制造工艺较简单,亮度和对比度较高,分辨率适中,现在LCD投影机占有的市场份额约占总体市场份额的70%以上,是目前市场上占有率最高、应用最广泛的投影机。
液晶显示器使用时,不允许施加直流电压,驱动电压的直流成分最大不能超过50mV。LCM在焊接时应注意只焊I/O接口,且烙铁温度不高于260℃,烙时一次不超过3~4秒,焊接次数最多不超过3~4次,焊剂应最好使用高质量焊剂,焊后,应注意把PCB板清洁。
注意LCD与LCM防潮,潮湿会使LCD的玻璃表面电阻降低,造成显示不正常,且易使LCM电极腐蚀。
LCD装机时,应确保器件的导电线接触面积充分大,并保持整个接触面压力均衡(注意拧螺丝的压力应均衡),固定框要求平整、光滑,固定框的压力应尽可能加在该器件的四周封接框上;LCM在装配时,要注意操作人的充分接地,使用的烙铁及其它器具均应保持良好的接地。焊接应注意保护LCD表面,以免焊剂溅落于表面造成破坏。
器件不宜长期受阳光直射及紫外线的照射,以免影响使用寿命。
器件不宜存放在高温、高湿或有腐蚀、挥发性化学物品环境中,以免使LCD变色、LCM电极腐蚀,失去正常的显示功能。LCM应放在有抗静电的包装或器具里。
LCD的上下两面贴的偏光片切勿沾上有机溶剂;因偏光片材质较软,装机使用过程中,避免硬物顶伤、压伤器件的上下两面,且不能使用粗、硬的布擦拭偏光片;LCM在操作过程中请勿接触油脂类东西。
以上原始数据比较长,所以仅仅举一些例子说明。
用统计的方法,我们可以得到如下的情景数据:
LCD概念;LCD介绍;LCD理论基础介绍;LCD应用背景;LCD显示器;LCD投影仪;LCD使用注意事项;……;等等。另外还有:CRT显示器;价格;体积;电光效应;光照;腐蚀;……;等等。其文章类型是:LCD简介。
统计的方法,还可以将很多用户在搜索时频繁使用的伴随数据自动归结为相应的情景数据。如:有许多用户在查找LCD时,经常伴随“制造”,就可以将“LCD制造”推荐给用户为相关情景数据。
1.1.2语义关联方法
语义关联方法主要用于情景数据的扩展和补充。
例如,对上述LCD概述有许多关键字,以及其他方法产生的情景数据,可以通过语义关联产生更多的情景数据。如:对于LCD概念,还可以产生LCD原理,LCD简介,LCD实现方法,等等情景数据;
语义关联方法,可以基于语义关联库产生。这个语义关联库可以进行动态增减。
语义关联的情景数据也可以从用户的使用习惯来获得。
语义关联可以按照使用的频度,语义的相关度等方面形成多层次的关联数据,以便用户进行比较局限的还是更广泛的搜索应用。
1.2人工参与方法
人工参与的方法主要用于在统计数据库还未建成时的人工数据收集和分类,以及统计数据库建成后的整理和修改。
2搜索输入装置端
其次,考虑用户端利用搜索输入装置1生成各种原始数据的情景数据的情况。
与搜索引擎2端一样,在搜索输入装置1端进行的情景数据的生成方法大体上也可以分为自动生成方法和人工参与方法,首先对情景数据的自动生成方法进行说明。
2.1自动生成方法
2.1.1搜索引擎端提供方法:
用户端先将主要搜索数据传送到搜索引擎端,进行一次预处理,获得搜索引擎端的帮助得到情景数据。并将自动上传的情景数据显示出来供用户选择。
此外,还可以通过事先将搜索引擎2端提供的控件下载到用户端,一旦用户利用搜索输入装置1输入了搜索数据,该控件便在用户端自动运行,通过与服务器端的交互动作来生成情景数据。
2.1.2用户端自己生成方法:
用户保持一个来自服务端统计或者关联等方法的自动生成环境,可以经常与服务端通信保持更新。这样,用户端可以自己本地进行自动情景数据生成。
2.1.3用户端环境限制方法:
用户端可以通过用户的社会角色生成情景数据。如:科研人员:通常对原理,方法等感兴趣;记者:通常对发生什么事的报道感兴趣;
用户端可以通过使用习惯产生情景数据。如:有的用户对娱乐,趣闻感兴趣,其用户习惯库中就有相应的情景数据;另一些用户对技术,原理,方法,研究感兴趣,用户习惯库中就有连外一些相应的情景数据。
以上方法可以综合应用。
2.2用户参与方法:
2.2.1用户端强制限制方法:
用户可以根据当时的需要强制给出一些情景数据。例如:虽然主要搜索数据可能只是关于LCD进展的报道,用户可以强制给出原理,方法,理论基础等情景信息,以便决定搜索范围。
2.2.2用户修正方法:
由于自动生成的情景信息通常并不全是用户的需求,用户可以只选择其中的部分情景信息。也可以修改部分情景信息的表述。还可以自己给出更关注的情景信息。
以上对情景信息的生成方法进行了说明,各种生成方法可以分别单独采用,也可以综合运用。为了提高基于情景信息的搜索的查准率和查全率,最好将人工参与方法和自动生成方法结合起来运用。
下面针对各种数据格式,列举出具体的实施例,对情景数据的生成方法进行说明。
实施例1
文本数据的情景数据生成
关于文本数据的情景数据生成,可以参照以上的情景数据生成的方法中,作为例子所列举的针对关于LCD的一个介绍文章的情景数据生成处理。
实施例2
图像数据的情景数据生成
图像数据的情景数据包括图像的分类、图像的形状、图像的布局、图像的色彩等基于内容的特征量。
情景数据的生成可由人完成,例如人工给出一些描述特征的关键词,也可以通过对应的图像处理程序完成,自动提取出检索用户可能关心的一些图像情景数据。提取的情景数据既可以是全局性的,如整幅图像的颜色分布,也可以是针对某个内部的局部对象,如图像中的子区域。特征表示方法有许多,如颜色表示法中就有颜色直方图、颜色矩、颜色集等,纹理表示法中有Tramura纹理特征、基于小波变换的纹理特征表示法。不过,涉及图像高级抽象的特征时,会受到知识领域和检索任务的限制,因此往往需要人工干预提供辅助。
例如:图4中示出了一张海上日出的图像。其分类可以是海上日出,也可以是更广泛的大海,太阳等等。其布局内容可以是,太阳刚刚露出,太阳隐藏在云中,太阳初升,大海平静,风急浪高,远处的船舶,近景中的人物、动物等等;其色彩有蓝海,红日,黄日,近岸色彩,远景色彩,白浪,黄沙,蓝色主色调,红色主色调,多彩主色调等等,以及天空、云彩、海水、沙滩等不同的纹理。以上各种情景数据均可以采用各种算法,从图像中提取出来。
实施例3
音频数据的情景数据生成
音频数据的情景数据包括乐段,小节,音调,音色,音域,乐段相似,小节相似,调式,节拍,等等。
例如:对于一段乐曲,其情景数据可以是,分乐段相似,分小节相似,乐段来源,乐段作曲者,乐段调式,等等。
实施例4
视频数据的情景数据生成
视频数据的情景数据包括视频帧,视频段,视频主题,视频分类,等等。
例如:对一个电影片断,其情景数据可以是视频类别(风光片?纪录片?故事片?等等),视频主题,视频人物,视频来源等等
实施例5
窗口数据的情景数据生成
窗口数据的主要内容可以是文字,图像,视频等等,还包括窗口类型,窗口的各种按钮,各种菜单等等。
因此,可以先将窗口数据分割成各种数据:如:文字部分;图像部分;窗口类型等。然后,对不同种类的数据,分别生成相应的情景信息。
以上对本发明的具体实施方式进行了说明,本发明的实施例的各种方法、装置均能够通过软件程序来实现,这些程序可以存储于光盘、硬盘、闪烁存储器、软盘等各种存储介质中,还可以通过互联网传输获得。
并且,本发明的实施不限于具体实施方式中所描述的方案,对于本领域普通技术人员而言,能够对本发明进行各种修改、变更,只要这些修改、变更没有超出本发明的实质要点,便落在本发明的范围之内。

Claims (20)

1、一种搜索输入装置,包括:
搜索输入信息接收器,其接收主要搜索数据;
搜索辅助信息生成器,其根据所述主要搜索数据生成搜索辅助数据;和
搜索数据综合器,其对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;
其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。
2、根据权利要求1所述的搜索输入装置,其特征在于,所述搜索辅助信息生成器包括:
搜索辅助信息发送单元,用于将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据;
搜索辅助信息接收单元,用于接收由所述辅助信息产生模块处理得到的所述搜索辅助数据。
3、根据权利要求2所述的搜索输入装置,其特征在于,还包括:搜索辅助数据筛选模块,用于根据用户筛选操作在所述搜索辅助数据中提取出与所述用户筛选操作相关的搜索辅助数据。
4、根据权利要求1所述的搜索输入装置,其特征在于,
所述搜索辅助信息生成器具有与搜索引擎的辅助信息产生模块一致的自动生成环境,并在所述自动生成环境下生成所示搜索辅助数据,所述辅助信息产生模块用于根据主要搜索数据处理得到相应的搜索辅助数据。
5、根据权利要求1所述的搜索输入装置,其特征在于,所述搜索辅助信息生成器包括:用户信息记录模块,用于记录与用户相关的用户信息,并根据所述用户信息生成所述搜索辅助数据。
6、根据权利要求1~5中任一种所述的搜索输入装置,其特征在于,还包括:搜索辅助信息修正模块,用于接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。
7、根据权利要求1所述的搜索输入装置,所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,浏览器,图标,动画中的一种或多种。
8、一种搜索输入方法,包括:
接收主要搜索数据;
根据所述主要搜索数据生成搜索辅助数据;和
对所述主要搜索数据和所述搜索辅助数据进行综合处理,获得待发送搜索数据;
其中,所述搜索辅助数据包括情景信息,所述待发送搜索数据包括与所述情景信息相关的信息。
9、根据权利要求8所述的搜索输入方法,其特征在于,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:
将所述主要搜索数据传送给搜索引擎,所述搜索引擎具有一辅助信息产生模块,用于根据所述主要搜索数据处理得到所述搜索辅助数据。
10、根据权利要求9所述的搜索输入方法,其特征在于,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:根据用户筛选操作在所述搜索辅助数据中提取出与所述用户筛选操作相关的搜索辅助数据。
11、根据权利要求8所述的搜索输入方法,其特征在于,所述根据所述主要搜索数据生成搜索辅助数据的步骤具体为:按照与搜索引擎端根据主要搜索数据处理得到相应的搜索辅助数据相同的自动生成方式生成所述搜索辅助数据。
12、根据权利要求8所述的搜索输入方法,其特征在于,根据所述主要搜索数据生成搜索辅助数据具体为:根据与用户相关的用户信息生成所述搜索辅助数据。
13、根据权利要求8~12中任一种所述的搜索输入方法,其特征在于,在执行所述对所述主要搜索数据和所述搜索辅助数据进行综合处理的步骤之前,还包括:接收用户修正操作,并根据所述用户修正操作对所述搜索辅助数据进行限制、选择、修改。
14、根据权利要求8~12中任一种所述的搜索输入方法,其特征在于,
所述综合处理为冗余数据清除以及数据的规范化。
15、根据权利要求8中所述的搜索输入方法,其特征在于,所述主要搜索数据为文字数据,图像数据,音频数据,视频数据,窗口,网页,图标,动画中的一种或多种。
16、一种搜索引擎,包括:
搜索数据采集装置,用于采集源数据,并从所述源数据中提取关键数据,对所述源数据和所述关键数据建立索引,得到数据索引;
数据仓库,用于接收并存储由所述搜索数据采集装置所发送的所述源数据、所述关键数据、及所述数据索引;及
搜索处理装置,用于接收来自一搜索输入装置的搜索数据,根据所述搜索数据在所述数据仓库中进行查找,输出查找结果;
所述关键数据中包括情景信息。
17、根据权利要求16所述的搜索引擎,其特征在于:所述搜索数据采集装置包括:统计分析模块,用于通过对所述源数据进行统计分析而提取所述关键数据。
18、根据权利要求16所述的搜索引擎,其特征在于:所述搜索数据采集装置还包括:语义分析模块,用于通过对所述源数据进行语义关联分析而提取所述关键数据。
19、根据权利要求16~18中任一种所述的搜索引擎,其特征在于,还包括:用户配置模块,用于根据用户操作对所述关键数据进行限制、选择、修改。
20、根据权利要求16~18中任一种所述的搜索引擎,其特征在于:
所述源数据为文字数据,图像数据,音频数据,视频数据,窗口,网页,图标,动画中的一种或多种。
CN200810116370A 2008-07-09 2008-07-09 搜索输入装置、搜索输入方法及搜索引擎装置 Pending CN101625682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810116370A CN101625682A (zh) 2008-07-09 2008-07-09 搜索输入装置、搜索输入方法及搜索引擎装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810116370A CN101625682A (zh) 2008-07-09 2008-07-09 搜索输入装置、搜索输入方法及搜索引擎装置

Publications (1)

Publication Number Publication Date
CN101625682A true CN101625682A (zh) 2010-01-13

Family

ID=41521533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810116370A Pending CN101625682A (zh) 2008-07-09 2008-07-09 搜索输入装置、搜索输入方法及搜索引擎装置

Country Status (1)

Country Link
CN (1) CN101625682A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402525A (zh) * 2010-09-10 2012-04-04 联想(北京)有限公司 一种搜索处理装置、电子设备及搜索处理方法
CN102436482A (zh) * 2011-10-25 2012-05-02 四川九洲电器集团有限责任公司 基于jdl2004架构标准的单源目标估计方法
CN103365936A (zh) * 2012-03-30 2013-10-23 财团法人资讯工业策进会 视频推荐系统及其方法
CN103853808A (zh) * 2012-11-28 2014-06-11 国际商业机器公司 产生搜索结果的方法和系统
CN104781636A (zh) * 2013-03-12 2015-07-15 奥迪股份公司 具有拼写装置-补足建议的、配属于车辆的设备
CN105989001A (zh) * 2015-01-27 2016-10-05 北京大学 图像搜索方法及装置、图像搜索系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402525A (zh) * 2010-09-10 2012-04-04 联想(北京)有限公司 一种搜索处理装置、电子设备及搜索处理方法
CN102436482A (zh) * 2011-10-25 2012-05-02 四川九洲电器集团有限责任公司 基于jdl2004架构标准的单源目标估计方法
CN102436482B (zh) * 2011-10-25 2013-08-28 四川九洲电器集团有限责任公司 基于jdl2004架构标准的单源目标估计方法
CN103365936A (zh) * 2012-03-30 2013-10-23 财团法人资讯工业策进会 视频推荐系统及其方法
CN103853808A (zh) * 2012-11-28 2014-06-11 国际商业机器公司 产生搜索结果的方法和系统
US10108720B2 (en) 2012-11-28 2018-10-23 International Business Machines Corporation Automatically providing relevant search results based on user behavior
US10133823B2 (en) 2012-11-28 2018-11-20 International Business Machines Corporation Automatically providing relevant search results based on user behavior
CN104781636A (zh) * 2013-03-12 2015-07-15 奥迪股份公司 具有拼写装置-补足建议的、配属于车辆的设备
US10078423B2 (en) 2013-03-12 2018-09-18 Audi Ag Device associated with a vehicle and having a spelling system with a completion suggestion
CN104781636B (zh) * 2013-03-12 2018-12-04 奥迪股份公司 具有拼写装置-补足建议的、配属于车辆的设备
CN105989001A (zh) * 2015-01-27 2016-10-05 北京大学 图像搜索方法及装置、图像搜索系统
CN105989001B (zh) * 2015-01-27 2019-09-06 北京大学 图像搜索方法及装置、图像搜索系统

Similar Documents

Publication Publication Date Title
CN105339881B (zh) 通过使用数据列表建设网站的设备、系统和方法
CN110147437A (zh) 一种基于知识图谱的搜索方法及装置
CN101625682A (zh) 搜索输入装置、搜索输入方法及搜索引擎装置
CN104462573B (zh) 一种视频搜索结果展示方法及装置
CN104102723B (zh) 搜索内容提供方法和搜索引擎
CN107239203A (zh) 一种图像管理方法和装置
US20130097172A1 (en) Method and apparatus for indexing and retrieving multimedia with objective metadata
US20220277053A1 (en) Generating app or web pages via extracting interest from images
CN107465936A (zh) 一种直播列表镜像展示方法、直播平台服务器及客户端
CN105185222B (zh) 一种地图渲染展示方法和装置
CN102770816A (zh) 具有改进的用户界面的数字点播设备和相关方法
CN103971391A (zh) 一种动画生成方法及装置
CN107404671A (zh) 电影内容特征获取系统及应用系统
CN108960988A (zh) 一种个性化壁纸推荐方法、装置、终端设备及存储介质
CN101609613A (zh) 基于全景智能化扫描数字切片技术的形态学教学系统
CN107168968A (zh) 面向情感的图像色彩提取方法及系统
CN110377817A (zh) 搜索词条挖掘方法和装置及其在多媒体资源的应用
Yang Investigating seasonal color change in the environment by color analysis and information visualization
US11470240B2 (en) Method and terminal device for matching photgraphed objects and preset text imformation
CN110297942A (zh) 一种视频探索方法、装置、设备及存储介质
CN112035685B (zh) 相册视频生成方法、电子设备和存储介质
CN109348592B (zh) 一种照明情境构建方法及系统、计算机设备和存储介质
CN101770481B (zh) 搜索终端装置、搜索方法
CN103500214B (zh) 一种基于视频搜索的分词信息推送方法和装置
CN110287348A (zh) 一种基于机器学习的gif格式图片搜索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100113