CN1811756A - 可携式数据库搜寻代理器处理系统及修正方法 - Google Patents

可携式数据库搜寻代理器处理系统及修正方法 Download PDF

Info

Publication number
CN1811756A
CN1811756A CN 200510006312 CN200510006312A CN1811756A CN 1811756 A CN1811756 A CN 1811756A CN 200510006312 CN200510006312 CN 200510006312 CN 200510006312 A CN200510006312 A CN 200510006312A CN 1811756 A CN1811756 A CN 1811756A
Authority
CN
China
Prior art keywords
proxy device
database search
information paper
search proxy
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510006312
Other languages
English (en)
Other versions
CN100481071C (zh
Inventor
周培林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuhui Knowledge Science & Technology Co Ltd
Original Assignee
Yuhui Knowledge Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuhui Knowledge Science & Technology Co Ltd filed Critical Yuhui Knowledge Science & Technology Co Ltd
Priority to CNB2005100063124A priority Critical patent/CN100481071C/zh
Publication of CN1811756A publication Critical patent/CN1811756A/zh
Application granted granted Critical
Publication of CN100481071C publication Critical patent/CN100481071C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示一种可携式数据库搜寻代理器处理系统及修正方法,该代理器记录一组资料搜寻参数,以提供数据库检索系统据以在大量的数据库中,搜寻所需的资料。该可携式数据库搜寻代理器于置入本发明的可携式数据库搜寻代理器处理系统后,该处理系统可依据使用者的指示,修正该代理器中所记录的资料搜寻参数,而使利用修正后代理器进行资料搜寻的结果,更符合该使用者的搜寻目的。

Description

可携式数据库搜寻代理器处理系统及修正方法
技术领域
本发明是关于一种可携式数据库搜寻代理器处理系统及修正方法,特别是关于一种培育、训练可携式数据库搜寻代理器,并利用该数据库搜寻代理器进行资料搜寻的处理系统及修正方法。
背景技术
随着计算机应用普及以及互联网的大量应用,透过互联网在各种大型数据库系统中搜寻有用的资料,已成为每一个人日常生活及工作上一件重要的活动。现代的计算机系统,不但已将各种有用的信息,结合成巨大的数据库,互联网更将这些大型数据库连结成更大的数据库。虽然这个正在急速扩大的数据库提供了大量的文件、信息,但如何在这个大型数据库中搜寻有用的资料,已成为一个技术上重要的课题。
跟随互联网的兴起,各种在互联网上搜寻文件的搜寻引擎(searchengine)应运而生。这种搜寻引擎通常是以网站的形式存在。使用者进入这种搜寻网站后,只要在网页上打入所谓的「关键词」(keywords),搜寻引擎即自动在所连结的各大网站中搜寻符合搜寻条件的文章,呈现在读者所指定的网页上。
在上述已知技术中,对于文件的搜寻,有两种主要的作法。最常见的作法乃是所谓的关键词检索。这种搜寻技术是依据使用者打入的关键词(keywords),在所有可能搜寻的数据库中,找寻具有输入的关键词的文章,加以显示,另一种作法是令使用者输入文章所可能包含的词,以及不应包含的词。在搜寻条件中,也可能对所输入的搜寻用词,赋其特性参数(attributes)。运算单元依据其输入搜寻用词的存在或不存在某篇文章中,以“与(AND)”、“或(OR)”等运算单元,计算每一篇文章的相关值,称为布林值(Boolean Value),依序排列,作为搜寻结果。
由于在互联网等大型数据库系统,搜寻文件等信息,乃是一件艰巨的工作,大多数的公司、政府机关,以及中小企业中,经常能正确搜寻到有用的结果。已成为工作上重要的技能。由公司雇主的角度言,正确搜寻能力,除靠先天的秉赋之外,尚需长期的练习与经验累积。然而,这种经验的累积,并无法加以传承或传播。尤其在公司职员更迭时,新任职员必须重行训练,花费几乎相同的时间,才能造就出具有相同搜寻资料经验与能力的后继者。
发明内容
本发明的目的乃在提供一种可携式数据库搜寻代理器,该代理器可代替使用者在互联网等大型数据库中进行搜寻。
本发明的目的也在提供一种可携带式数据库搜寻代理器,可记录使用者的搜寻参数而自动在互联网等大型数据库中进行资料搜寻,得到与本人搜寻相同的结果。
本发明的目的也在提供一种可携带式数据库搜寻代理器,该代理器可记录使用者资料检索的行为模式,而代替使用者在大型数据库中进行搜寻,并可提供于他人用来搜寻大量的资料。
本发明的目的也在提供一种可携带式数据库搜寻代理器,可随时对其搜寻参数加以修正,以符合使用者检索的目的。
为达上述目的,本发明采用的技术手段如下:
一种可携式数据库搜寻代理器处理系统,包括:
一个搜寻代理器存储器,用以储存多数的数据库搜寻代理器;其中,任一数据库搜寻代理器均记录一组搜寻参数,各搜寻参数包括至少一个搜寻指标及其相对应的权值;任一数据库搜寻代理器并均记录一群经标示以「符合」或「不符」搜寻目的的代表性资料文件;
一个搜寻引擎,可依据该搜寻代理器存储器中所储存的数据库搜寻代理器中所含的搜寻参数,作为搜寻条件,在一数据库中寻找近似的资料文件,集合成一群近似资料文件;
一资料文件暂存装置,用以储存该搜寻引擎所搜寻的近似资料文件;
一训练模块,可将该搜寻所得的近似资料文件内容,显示提供于使用者,并接受使用者对各近似资料文件的评价;其中,该评价包括任一近似资料文件「符合」或「不符」搜寻目的的评价;该训练模块并可依据经使用者评价的资料文件内容及其相对应的评价,以及该代表性资料文件所含的资料文件内容及其相对应的评价产生一修正用数据库搜寻代理器,该搜寻代理器包括一组搜寻参数,任一参数均包括一搜寻指标及其权值;
一修正模块,可依据该修正用数据库搜寻代理器的内容,修正该数据库搜寻代理器的内容;及
一使用者介面,用以供使用者操作至少该搜寻代理器存储器、该搜寻引擎、该训练模块及该修正模块。
本发明的目的也在提供一种依据使用者检索资料的目的,修正可携带式数据库搜寻代理器的修正方法。
为达上述目的,本发明采用的技术手段如下:
一种可携式数据库搜寻代理器修正方法,包括:
取得一个可携式数据库搜寻代理器中所记录的一组资料搜寻参数;各搜寻参数包括至少一搜寻指标及其相对应的权值;
取得一群与该可携式数据库搜寻代理器相关的资料文件;该群资料文件包括多数经标示为与该可携式数据库搜寻代理器的搜寻目的「相符」的数据文件及多数经标示为与该可携式数据库搜寻代理器的搜寻目的「不符」的数据文件;
依据该一组资料搜寻参数在特定的数据库中进行搜寻,得到多数符合或接近搜寻条件的资料文件;
在所得的资料文件中选取特定数量的资料文件,提供使用者阅读;
接受使用者对所提供的资料文件的评价,并将评价结果加以记录;该评价包括代表「符合」或「不符」搜寻目的的评价;
将经使用者评价的资料文件及其标示加入该群资料文件中;
分析该群资料文件,产生一修正用数据库搜寻代理器;该修正用数据库搜寻代理器记录一组资料搜寻参数;各搜寻参数包括至少一搜寻指标及其相对应的权值;
以该修正用数据库搜寻代理器在该群资料文件中进行比对,判断预定数量的资料文件分别为符合搜寻目的或不符搜寻目的;
计算以该修正用数据库搜寻代理器所比对结果与该预定数量资料文件所标示相符的比例,作为正确率;
以该正确率调整该修正用数据库搜寻代理器的参数权值;
合并该可携式数据库搜寻代理器与该调整后修正用数据库搜寻代理器;及
获得修正的可携式数据库搜寻代理器。
在本发明的实施例中,并可包括重复该正确率计算及依据该正确率修正数据库搜寻代理器,直到正确率达到所需的步骤。在本发明的实例中,另外包括删除该群数据文件中资料文件的步骤。
综上所述,本发明揭示一种可携式数据库搜寻代理器,该代理器记录一组资料搜寻参数,以提供数据库检索系统据以在大量的数据库中,搜寻所需的资料。该可携式数据库搜寻代理器于置入本发明的可携式数据库搜寻代理器处理系统后,该处理系统可依据使用者的指示,修正该代理器中所记录的资料搜寻参数,而使利用修正后代理器进行资料搜寻的结果,更符合该使用者的搜寻目的。
附图说明
图1表示本发明可携式数据库搜寻代理器处理系统的系统图。
图2即表示一种自一文字文件产生一个数据库搜寻代理器的方法流程图。
图3表示本发明的可携式数据库搜寻代理器修正方法流程图。
图中符号说明:
  11   搜寻代理器存储器
  12   搜寻引擎
  13   数据库
  14   资料文件暂存装置
  15   训练模块
  16   修正模块
  17   使用者介面
具体实施方法
图1表示本发明可携式数据库搜寻代理器处理系统的系统图。如图所示,本发明的可携式数据库搜寻代理器处理系统包括:
一个搜寻代理器存储器11,用以储存多数的数据库搜寻代理器11a-11n;其中,任一数据库搜寻代理器均记录一组搜寻参数,各搜寻参数包括至少一个搜寻指标及其相对应的权值;该搜寻参数可表以:
     Si=(xi1,wi1),(xi2,wi2),...(xin,win)
其中,Si表第i搜寻代理器,x表其指标,w表权值;
一个搜寻引擎12,可依据该搜寻代理器存储器11中所储存的数据库搜寻代理器中所含的搜寻参数,作为搜寻条件,在一数据库13中寻找近似的资料文件,集合成一群近似资料文件;
一资料文件暂存装置14,用以储存该搜寻引擎12所搜寻的近似资料文件;
一训练模块15,可将该搜寻所得的近似资料文件内容,显示提供于使用者,并接受使用者对各近似资料文件的评价;其中,该评价包括任一近似资料文件是否符合搜寻目的的评价;该训练模块15并可依据经使用者评价的资料文件内容及其相对应的评价,产生一修正用数据库搜寻代理器,该搜寻代理器包括一组搜寻参数,任一参数均包括一搜寻指标及其权值;
一修正模块16,可依据该修正用数据库搜寻代理器的内容,修正该搜寻代理器存储器11中的数据库搜寻代理器的内容;及
一使用者介面17,用以供使用者操作至少该搜寻代理器存储器11、该搜寻引擎12、该训练模块15及该修正模块16。
利用上述系统,使用者可以在该搜寻代理器存储器11中置入一外来数据库搜寻代理器,而以该数据库搜寻代理器在该搜寻引擎12对该数据库13进行搜寻,并依据搜寻结果修正该数据库搜寻代理器,以更符合使用者所需。
在本发明中,数据库搜寻代理器Si可表为:
     Si=(xi1,wi1),(xi2,wi2),...(xin,win)
其中,x表搜寻用指标,如所搜寻的档案为文字文件,则x可为一关键词词,如为影像,则为一特征,如为声音,则可为一段波形或其它特征;w则表其相对应的权值。该权值代表相对应的指标与特定搜寻目的的关系值,其值可为正或负。
该数据库搜寻代理器可以利用任何已知技术产生。例如,TW专利申请案第92123876号,即揭示一种以手动方式,将一搜寻用关键词,转化成一串搜寻用指标的技术。
又例如TW专利申请案93105874号,则揭示一种对一个或数个资料文件内容进行分析,自动产生一串搜寻用指标的技术。
兹以该93105874号专利申请案新揭示的技术为例,说明该数据库搜寻代理器的产生方法。以下的说明,以对一文字文件文章进行分析,产生描述该文章特性的搜寻代理器为实例。
图2即表示一种自一文字文件产生一个数据库搜寻代理器的方法流程图。如图所示,于201取得一资料文件,该资料文件为一文字文件;于202将该文字文件转换成文字资料格式,以供处理。于203对该文字文件进行字词分割处理,而将该文字文件转换成一串以「词」word为单位的连续资料。接着,于204计算各「词」在该文字文件中出现的次数,得到一串由「词」与「词频」所组合的指标集合,称为「指标资料串」。其次,于205对该指标资料串进行正规化处理normalization。正规化处理可消除文字文件长短对指标及其权值所造成的影响。在实际应用上,可以设定一文字文件标准长度。将所有待处理文章与该设定值比较,而将其词频值以该比较值作正规化处理。
再次,于206对于词频极高,但并无指标意义的词,进行调整。在进行调整时,可对某些在大多数文字文件都会出现的词,降低其权值。
进行调整时,乃是将前步骤所得的词频值,乘以一调整值。使得当一个词所出现的文章数量越大比例越高时,其权值即趋近于0。
经过上述处理步骤后,于207得到所有词的权值,分别加以记录,成为一数据库搜寻代理器。在该过程中,如果是利用多数文字文件,并包括「符合」该搜寻目的及「不符」该搜寻目的的文字文件,则所得的数据库搜寻代理器可包括权值为正的指标及权值为负的指标。
经过上述步骤之后,将在步骤中曾经分析过的文字文件,加以挑选,取得预订数量的代表性文字文件,较好包括经判断为「符合」该搜寻目的及「不符」该搜寻目的的文字文件,连同其「符合」该搜寻目的及「不符」该搜寻目的的标示,加以存盘备用。在选择具代表性文字文件时,可挑选近似度<详下述>的绝对值较高的文字文件。
除上述方法外,其它可以建立类似结构的数据库搜寻代理器的方法,也可应用在本发明。
该搜寻引擎12可在该数据库13中,取得资料文件A,并与该数据库搜寻代理器所含的指标比对,标示出在该数据库中所存在的指标,计算近似度Similarity:
     Similarity=∑xjwj xj∈(A)
其中,A代表所检索的资料文件,A表其内含资料的集合;xj该数据库搜寻代理器所含的指标,wj为其权值。
该搜寻引擎12将近似值计算结果与一临界值比较,挑选出近似值大于临界值的资料文件,作为搜寻结果,存在该资料文件暂存装置14备用。
上述搜寻的目的,在测试该外来数据库搜寻代理器所搜寻的结果,是否与使用者的检索目的相同。在本发明中,该外来数据库搜寻代理器为经过他人建立,训练的代理器,可以使该他人在数据库中检索出所需的资料文件,但所检索的结果,未必符合另一人的需求。
为使外来的数据库搜寻代理器能符合特定使用者的需求,该训练模块15乃将上述搜寻的结果显示在该使用者介面17,供使用者进行评价。该使用者可阅读其内容,并进行评价。该评价通常包括是否符合搜寻目的的评价。在实际应用上,可提供一按钮,使用者仅需键入「相符」及「不符」,即可完成评价。当然,其它评价方式,例如令使用者给予评分,也属可行。
经过使用者评价的数据文件,给予标记。当使用者已评价过特定数量的资料文件,或者使用者指示停止评价后,该训练模块15即将经过评价的文字文件,加入该外来数据库搜寻代理器所附的该群代表性文字文件中,并对该群代表性文字文件进行分析,得到一个修正用数据库搜寻代理器,该代理器St仍以下式表示:
     St=(xt1,wt1),(xt2,wt2),...(xtm,wtm)
x、w定义同前。
其中,对使用者评为「不符」的资料文件,由该资料文件所产生的指标,其权值可标为负值。综合使用者已评价的资料文件及该外来数据库搜寻代理器所附的该群代表性文字文件的内容,可产生一修正用数据库搜寻代理器。建立修正用数据库搜寻代理器的方式,可以参考上述93105874号专利申请案所揭示的技术,于此不再赘述。
在实际操作上,该修正用数据库搜寻代理器St包括大量与该外来数据库搜寻代理器相同的搜寻用指标。这是因为一个外来数据库搜寻代理器乃是经过他人长期使用,训练所得的结果。
该修正模块16以所得的修正用数据库搜寻代理器,再度对该群加入新数据文件的代表性资料文件进行比对,测试各文字文件比对结果是否与所标示的「符合」或「不符」相同。其后,对比对结果进行统计,计算该修正数据库搜寻代理器的正确率(acc)。
其次,该修正模块16以该正确率acc修正该修正用数据库搜寻代理器,并将该修正用数据库搜寻代理器St与该外来数据库搜寻代理器Si合并,成为测试用数据库搜寻代理器Ss
     Ss={(xsk,wsk)}
其中,
Figure A20051000631200151
      k∈N丅
接者,该修正模块(16)再度对该群加入新文字文件的文字文件进行比对,并将所得知正确率与一标准值比较。如该正确率已达标准值,则该测试用数据库搜寻代理器即为合格的数据库搜寻代理器,所搜寻的结果足以符合使用者的需求。
如该正确率未达该标准值,则修正模块16继续对该外来数据库搜寻代理器进行修正。其修正方式可例如将该修正用数据库搜寻代理器所含的权值,全部乘以该正确率或历次正确率的乘积,再与该外来数据库搜寻代理器合并。或以其它方法,修正该修正用数据库搜寻代理器的指标或其权值。此外,也可分别修正该外来数据库搜寻代理器及该修正用数据库搜寻代理器,再予合并,均无不可。
将修正后的测试用数据库搜寻代理器,再度进行搜寻、评价,计算其正确率,直到其正确率超过该标准值。即可获得符合所需的数据库搜寻代理器。
综合上述,本发明的可携式数据库搜寻代理器处理系统修正该外来数据库搜寻代理器的流程,如图3的可携式数据库搜寻代理器修正流程图所示,而包括下列步骤:
于301取得一个外来数据库搜寻代理器中所记录的一组资料搜寻参数;该参数包括至少一搜寻条件及其相对应的权值;
于302取得一群与该组资料搜寻参数相关的资料文件;该群资料文件包括多数经标示为与该可携式数据库搜寻代理器的搜寻目的「相符」的数据文件及多数经标示为与该可携式数据库搜寻代理器的搜寻目的「不符」的数据文件;
于303依据该一组资料搜寻参数在数据库13中进行搜寻,得到若干符合或接近搜寻条件的资料文件;
于304在所得的资料文件中选取特定数量的资料文件,显示于该使用者介面17供使用者阅读;
于305接受使用者对所提供的资料文件的评价;该评价包括代表是否符合搜寻目的的评价;
于306将经使用者评价的资料文件及其标示加入该群资料文件中;
于307分析该群资料文件,产生一修正用数据库搜寻代理器;该修正用数据库搜寻代理器记录一组资料搜寻参数;各搜寻参数包括至少一搜寻指标及其相对应的权值;
于308以该修正用数据库搜寻代理器在该群资料文件中进行比对,判断预定数量的资料文件分别为符合搜寻目的或不符搜寻目的;
于309计算以该修正用数据库搜寻代理器所比对结果与该预定数量资料文件所标示的符合搜寻目的或不符搜寻目的相符的比例,作为正确率;
于310以该正确率调整该修正用数据库搜寻代理器的参数权值;
于311合并该可携式数据库搜寻代理器与该调整后修正用数据库搜寻代理器,得到修正后数据库搜寻代理器;
于312输出该修正后的数据库搜寻代理器,作为修正结果。
最后,于313在该群资料文件中删除对训练效果较无影响的资料文件,以防止资料文件所占记忆空间过大。
在本发明中,该使用者介面也可提供一个随时修正的功能,以在使用者激活后,进行数据库搜寻代理器的修正。
如上所述,本发明的可携式数据库搜寻代理器处理系统,可对一外来数据库搜寻代理器进行修正,使其搜寻的结果符合所需。如此一来,数据库搜寻代理器可以成为一独立的搜寻工具,在不同计算机系统中使用,且可长期使用达于成熟的数据库搜寻代理器,可由他人借用,传承经验,该他人也可利用本发明加以修正,而符合自己的搜寻需求。此外,本人他可随时修正其数据库搜寻代理器。本发明使得数据库搜寻代理器达到完全可携的目标。
以上是对本发明可携式数据库搜寻代理器处理系统的说明,习于斯艺的人士不难由上述的说明,明了本发明的精神进而作出不同的衍伸与变化,唯只要不超出本发明的精神,均应包含于其权利要求范围内。

Claims (16)

1.一种可携式数据库搜寻代理器处理系统,其特征是,包括:
一个搜寻代理器存储器,用以储存多数的数据库搜寻代理器;其中,任一数据库搜寻代理器均记录一组搜寻参数,各搜寻参数包括至少一个搜寻指标及其相对应的权值;任一数据库搜寻代理器并均记录一群经标示以「符合」或「不符」搜寻目的的代表性资料文件;
一个搜寻引擎,可依据该搜寻代理器存储器中所储存的数据库搜寻代理器中所含的搜寻参数,作为搜寻条件,在一数据库中寻找近似的资料文件,集合成一群近似资料文件;
一资料文件暂存装置,用以储存该搜寻引擎所搜寻的近似资料文件;
一训练模块,可将该搜寻所得的近似资料文件内容,显示提供于使用者,并接受使用者对各近似资料文件的评价;其中,该评价包括任一近似资料文件「符合」或「不符」搜寻目的的评价;该训练模块并可依据经使用者评价的资料文件内容及其相对应的评价,以及该代表性资料文件所含的资料文件内容及其相对应的评价产生一修正用数据库搜寻代理器,该搜寻代理器包括一组搜寻参数,任一参数均包括一搜寻指标及其权值;
一修正模块,可依据该修正用数据库搜寻代理器的内容,修正该数据库搜寻代理器的内容;及
一使用者介面,用以供使用者操作至少该搜寻代理器存储器、该搜寻引擎、该训练模块及该修正模块。
2.如权利要求1所述的可携式数据库搜寻代理器处理系统,其特征是,该数据库搜寻代理器包括:
Si=(xi1,wi1),(xi2,wi2),…(xin,win)
其中,Si表第i搜寻代理器,x表其指标,w表权值。
3.如权利要求2所述的可携式数据库搜寻代理器处理系统,其中,所搜寻的档案为文字文件,且x为一关键词词。
4.如权利要求1所述的可携式数据库搜寻代理器处理系统,其特征是,该搜寻引擎可在该数据库中,取得资料文件,并与该数据库搜寻代理器所含的搜寻指标比对,标示出在该数据库中所存在的搜寻指标,计算近似度Similarity:
Similarity=∑xjwj  xj∈(A)
其中,A代表所检索的资料文件,A表其内含资料的集合;xj该数据库搜寻代理器所含的指标,wj为其权值;且
该搜寻引擎将近似值计算结果与一临界值比较,挑选出近似值大于临界值的资料文件,作为近似的资料文件搜寻结果。
5.如权利要求1所述的可携式数据库搜寻代理器处理系统,其特征是,经使用者评为不符合搜寻目的的资料文件,即将由该资料文件所产生的指标所对应的权值标为负值。
6.如权利要求1所述的可携式数据库搜寻代理器处理系统,其特征是,该修正模块以下式将该修正用数据库搜寻代理器St={(xtk,wtk)}与该外来数据库搜寻代理器Si={(xik,wik)}合并,成为修正后数据库搜寻代理器Ss
Ss={(xsk,wsk)}
其中,
x表一指标,w表其权值,acc表该修正用数据库搜寻代理器搜寻该经使用者评价的资料文件以及该代表性资料文件所含的资料文件的结果正确率。
7.如权利要求6所述的可携式数据库搜寻代理器处理系统,其特征是,该修正模块可反复根据该修正后数据库搜寻代理器搜寻该经使用者评价的资料文件以及该代表性资料文件所含的资料文件的结果正确率,修正该数据库搜寻代理器,直到该正确率达于一定值。
8.如权利要求6所述的可携式数据库搜寻代理器处理系统,其特征是,该修正模块分别修正该外来数据库搜寻代理器及该修正用数据库搜寻代理器,再予合并。
9.一种可携式数据库搜寻代理器修正方法,其特征是,包括:
取得一个可携式数据库搜寻代理器中所记录的一组资料搜寻参数;各搜寻参数包括至少一搜寻指标及其相对应的权值;
取得一群与该可携式数据库搜寻代理器相关的资料文件;该群资料文件包括多数经标示为与该可携式数据库搜寻代理器的搜寻目的「相符」的数据文件及多数经标示为与该可携式数据库搜寻代理器的搜寻目的「不符」的数据文件;
依据该一组资料搜寻参数在特定的数据库中进行搜寻,得到多数符合或接近搜寻条件的资料文件;
在所得的资料文件中选取特定数量的资料文件,提供使用者阅读;
接受使用者对所提供的资料文件的评价,并将评价结果加以记录;该评价包括代表「符合」或「不符」搜寻目的的评价;
将经使用者评价的资料文件及其标示加入该群资料文件中;
分析该群资料文件,产生一修正用数据库搜寻代理器;该修正用数据库搜寻代理器记录一组资料搜寻参数;各搜寻参数包括至少一搜寻指标及其相对应的权值;
以该修正用数据库搜寻代理器在该群资料文件中进行比对,判断预定数量的资料文件分别为符合搜寻目的或不符搜寻目的;
计算以该修正用数据库搜寻代理器所比对结果与该预定数量资料文件所标示相符的比例,作为正确率;
以该正确率调整该修正用数据库搜寻代理器的参数权值;
合并该可携式数据库搜寻代理器与该调整后修正用数据库搜寻代理器;及
获得修正的可携式数据库搜寻代理器。
10.如权利要求9所述的可携式数据库搜寻代理器修正方法,其特征是,该数据库搜寻代理器Si包括:
Si=(xi1,wi1),(xi2,wi2),…(xin,win)
其中,x表一指标,w表其权值;
11.如权利要求9所述的可携式数据库搜寻代理器修正方法,其特征是,所搜寻的档案为文字文件,x为一关键词。
12.如权利要求9所述的可携式数据库搜寻代理器修正方法,其特征是,该搜寻结果以近似度Similarity值超出一临界值的档案,该近似度的计算方式为:
Similarity=∑xjwj  xj∈(A)
其中,A代表所检索的资料文件,A表其内含资料的集合;xj该数据库搜寻代理器Sj所含的指标,wj为其权值。
13.如权利要求9所述的可携式数据库搜寻代理器修正方法,其特征是,经使用者评为不符搜寻目的的资料文件,则将由该资料文件所产生的指标权值标为负值。
14.如权利要求9所述的可携式数据库搜寻代理器修正方法,其特征是,该合并一数据库搜寻代理器Si={(xik,wik)}与另一数据库搜寻代理器St={(xtk,wtk)}成为修正用数据库搜寻代理器Ss的方式包括:
Ss={(Ssk,wsk)}
其中,
x表一指标,w表其权值,acc表该修正用数据库搜寻代理器搜寻该经使用者评价的资料文件以及该代表性资料文件所含的资料文件的结果正确率。
15.如权利要求14所述的可携式数据库搜寻代理器修正方法,其特征是,另包括反复根据该修正后数据库搜寻代理器搜寻该经使用者评价的资料文件以及该代表性资料文件所含的资料文件的结果正确率,修正该数据库搜寻代理器,直到该正确率达于一定值的步骤。
16.如权利要求14所述的可携式数据库搜寻代理器修正方法,其特征是,该一数据库搜寻代理器Si及该另一数据库搜寻代理器,均经调整所含参数值,再予合并。
CNB2005100063124A 2005-01-26 2005-01-26 可携式数据库搜寻代理器处理系统及修正方法 Expired - Fee Related CN100481071C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100063124A CN100481071C (zh) 2005-01-26 2005-01-26 可携式数据库搜寻代理器处理系统及修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100063124A CN100481071C (zh) 2005-01-26 2005-01-26 可携式数据库搜寻代理器处理系统及修正方法

Publications (2)

Publication Number Publication Date
CN1811756A true CN1811756A (zh) 2006-08-02
CN100481071C CN100481071C (zh) 2009-04-22

Family

ID=36844679

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100063124A Expired - Fee Related CN100481071C (zh) 2005-01-26 2005-01-26 可携式数据库搜寻代理器处理系统及修正方法

Country Status (1)

Country Link
CN (1) CN100481071C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI709865B (zh) * 2019-02-01 2020-11-11 香港商希瑞科技股份有限公司 運維數據讀取裝置及其讀取方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI709865B (zh) * 2019-02-01 2020-11-11 香港商希瑞科技股份有限公司 運維數據讀取裝置及其讀取方法
US11494130B2 (en) 2019-02-01 2022-11-08 Silicon Motion Technology (Hong Kong) Limited Operation data accessing device and accessing method thereof

Also Published As

Publication number Publication date
CN100481071C (zh) 2009-04-22

Similar Documents

Publication Publication Date Title
GB2568118A (en) Large-scale image tagging using image-to-topic embedding
US8949227B2 (en) System and method for matching entities and synonym group organizer used therein
CN106383836B (zh) 将可操作属性归于描述个人身份的数据
US20090164266A1 (en) Category aggregated opinion data
US20110314026A1 (en) System and Method for Retrieving Information Using a Query Based Index
CN101075942A (zh) 基于专家值传播算法的社会网络专家信息处理系统及方法
JP2005085285A5 (zh)
CN1573923A (zh) 用于用户模型化以增强对命名实体识别的系统和方法
CN103310003A (zh) 一种基于点击日志的新广告点击率预测方法及系统
CN103577416A (zh) 扩展查询方法及系统
CN103186574A (zh) 一种搜索结果的生成方法和装置
CN101216826A (zh) 信息搜索系统及方法
CN108090223B (zh) 一种基于互联网信息的开放学者画像方法
CN1750002A (zh) 提供搜索结果的方法
CN101751439A (zh) 基于层次聚类的图像检索方法
CN103399862A (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
KR101145979B1 (ko) 개체명 마킹 장치, 개체명 마킹 방법, 및 이를 위한 컴퓨터 판독가능 매체
CN101604340B (zh) 一种获得查询的时新性的方法
CN110472058B (zh) 实体搜索方法、相关设备及计算机存储介质
CN1811756A (zh) 可携式数据库搜寻代理器处理系统及修正方法
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
KR101351555B1 (ko) 대용량 데이터의 텍스트마이닝을 위한 의미기반 분류 추출시스템
CN115098534A (zh) 基于索引权重提升的数据查询方法、装置、设备及介质
CN117056392A (zh) 一种基于动态超图技术的大数据检索服务系统及方法
CN101847097B (zh) 一种需求项与工作产品间跟踪关系维护方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090422

Termination date: 20200126