CN102737113B - 检索方法、检索装置 - Google Patents
检索方法、检索装置 Download PDFInfo
- Publication number
- CN102737113B CN102737113B CN201210142277.9A CN201210142277A CN102737113B CN 102737113 B CN102737113 B CN 102737113B CN 201210142277 A CN201210142277 A CN 201210142277A CN 102737113 B CN102737113 B CN 102737113B
- Authority
- CN
- China
- Prior art keywords
- file
- file data
- priority
- entry
- file group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种检索方法、检索装置,在检索装置(1)中,提取部(101)从多个文件组(300a~300n)分别具备的多个文件数据中提取包含期望的检索字符串的文件数据。设定部(102)基于预定的规则对提取的文件数据分别设定输出优先级。判定部(103)按顺序判定多个文件组(300a~300n)是否分别具备设定了输出优先级的文件数据中的满足预定的输出条件的文件数据。输出部(104)在判定的文件组(300a~300n)具备满足预定的输出条件的文件数据的情况下,输出该文件数据中的预定的个数的文件数据。
Description
技术领域
本发明涉及适合于有效地提示来自多个文件组的检索结果的检索方法,以及检索装置。
背景技术
目前,已知的是内置有国语词典或英日词典、日英词典、英英词典等各种词典的数据库(词典DB)的电子词典装置(下面仅称为“电子词典”)。词典DB是指,使词条和对该词条进行说明解说的说明信息(文字数据或图像数据、动画数据、语音数据等)对应起来的信息集合,以能够使用计算机进行检索处理而系统地构成的词典DB。
另外,为了提高检索的便利性,电子词典具备各种各样的功能。特别是,在内置有针对多个词典的DB的电子词典中,较多的是在通过同时检索多个词典,以省去用户选择词典的麻烦等用于提高可用性方面下工夫的电子词典。
例如,专利文献1(日本特开2006-106889号公报)中公开的是如下的技术,在内置有多个词典信息的电子词典中,根据用户的水平对词典设置优先级,以该优先级的顺序对检索结果进行一览显示。据此,用户能够优先获得针对例如与中学/高中/大学等自身的水平相应的词典检索结果,能够提高电子词典的可用性。
如内置多个词典DB的装置那样,具备多个文件组的检索装置,较多的是以同时检索多个文件组的方式提高便利性。但是,存在以下情况,尽管检索了多个文件组,但检索结果没有从所有的文件组中毫无遗漏地输出而是集中于一部分的文件组进行输出等,没有将来自多个文件组的检索结果有效地提示给用户。
具体而言,若将内置有多个词典DB的电子词典装置作为例子进行说明,则在以日语检索语进行检索的情况下,与英英词典相比,国语词典的说明信息中所包含的该日语检索语较多,因此,实际上,即使进行英英词典的检索,提示给用户的检索结果也会容易变成几乎由来自国语词典的信息占有,相反,若用英语检索语进行检索,则也会容易引起提示给用户的检索结果几乎由来自英英词典的信息占有。
发明内容
为了解决如上所述的课题而提出本发明,其目的在于提供一种适合于有效地提示来自多个文件组的检索结果的检索方法、检索装置。
为了实现上述目的,本发明的检索方法的特征在于,其具备如下的步骤:
提取步骤,从多个文件组分别具备的多个文件数据中,提取包含期望的检索字符串的文件数据;
设定步骤,基于预定的规则对所述提取的文件数据分别设定输出优先级;
判定步骤,按顺序判定所述多个文件组是否分别具备被设定了所述输出优先级的文件数据中的满足预定的输出条件的文件数据;和
输出步骤,其在所述判定的文件组具备满足所述预定的输出条件的文件数据的情况下,输出该文件数据中预定的个数的文件数据。
根据本发明,能够提供一种适合于有效地提示来自多个文件组的检索结果的检索方法、检索装置。
附图说明
图1是表示本发明的实施方式的检索装置的概要结构的图;
图2是表示本发明的实施方式的检索装置的物理结构的图;
图3(a)、(b)均是表示本发明的实施方式的多个文件组及文件数据的结构的图;
图4是表示本发明的实施方式的检索装置的处理的流程的流程图;
图5是表示在本发明的实施方式中,对文件数据设定得分,并排序的情况的图;
图6是表示在本发明的实施方式的检索装置中输出处理的流程的流程图;
图7是表示在本发明的实施方式中从多个文件组中巡回地输出的情况的图;
图8是表示针对本发明的检索装置的结构概要,其它的例子的图。
具体实施方式
下面,参照附图对本发明的实施方式进行说明。另外,以下说明的实施方式不限定本发明的范围而是用于进行说明。因此,本领域的技术人员可采用将下述的各结构要素置换为均等的结构要素的实施方式,这些实施方式也包含在本发明的范围内。另外,在以下的说明中,为了使本发明容易理解,适当省略不重要的公知的技术的事项的说明。
在本实施方式中,作为实现检索装置的信息处理装置,假设具备电子词典等功能的小型信息处理装置进行说明。即,本实施方式的检索装置为从构成电子词典的多个文件数据中检索包含期望的检索语的文件数据的装置。
这种检索装置1采用如图1所示的构成,其具备控制部100、存储部110、输入部120及显示部130。另一方面,该检索装置1物理上如图2所示构成,其具备CPU(CentralProcessingUnit)151、ROM(ReadOnlyMemory)152、RAM(RandomAccessMemory)153、键盘154及监视器155。下面,参照图1及图2对检索装置1的构成要素进行说明。
控制部100控制检索装置1整体的动作,并与各构成要素连接,对控制信号、数据进行互换。即,控制部100与存储部110、输入部120及显示部130连接,一边充分利用这些各部的功能,一边执行检索处理。
在此,控制部100具备提取部101、设定部102、判定部103及输出部104。这些各部详细如后所述,从存储于存储部110的多个文件组300a~300n中确定包含期望的检索语的文件数据,执行对应预定的输出优先级进行输出的处理。
这种控制部100(提取部101、设定部102、判定部103、输出部104)例如由CPU151构成。在此,CPU151通过用于转发命令、数据的传送路径即系统总线与各构成要素相互连接,根据记录于ROM152的检索装置1整体的动作控制所需的计算机程序、各种数据进行动作。而且,CPU151将从ROM152读出的计算机程序、数据、进行其它的处理所需的数据暂时存储于RAM153,同时对各种动作进行控制。这样,通过CPU151与ROM152、RAM153协作,控制部100对检索装置1全体的动作进行控制。
存储部110例如由在检索装置1内具备的ROM152那样的只读存储介质构成,控制部100存储检索处理所需的各种数据。具体而言,在此,预先存储成为检索对象的多个文件组300a~300n。
在此,预先存储于存储部110的文件组300a~300n相当于各自不同种类的词典。具体而言,如图3(a)所示,如文件组300a为国语辞典,文件组300b为英日辞典,还有文件组300n为百科词典那样,为分别相互独立的词典。即,检索装置1具备这样的多种词典,将该多种词典作为检索对象进行检索。
另外,这些文件组300a~300n分别作为词典的构成单位,具备多个文件数据301。具体而言,如图3(b)所示,例如相当于国语辞典的文件组300a由多个文件数据301a~301c等构成,进而,该文件数据301a~301c等分别由“词条”和“说明文”构成。在此“词条”是指成为该词典的词条的一个语句,对于一个文件数据301对应一个词条。而且,对于“词条”对应说明该词条的“说明文”,将他们组合构成一个文件数据301。文件组300a~300n分别存在“词条”的数的文件数据301,整体构成一个文件组300。
返回图1及图2,输入部120例如由如键盘154那样的输入装置构成,接受来自用户的输入。具体而言,在此,接受来自用户的检索语。所接受的检索语向控制部100的提取部101供给,用于提取包含该检索语的文件数据301的处理。
显示部130例如由如监视器155那样的显示装置构成,其将控制部100进行的处理的结果提示给用户。具体而言,在此,通过将包含用户输入的检索语的文件数据301基于后述的预定的输出优先级显示在监视器155上,来提示给该用户。由此,取得作为输出结果的包含用户自身输入的检索语的文件数据301,能够进行各种利用。
另外,输入部120和显示部130也可以由将触摸面板等那样的输入装置和显示装置组合的装置构成。在该情况下,由内置于触摸面板的触摸传感器等组成的位置输入装置构成输入部120,由液晶显示器等组成的显示装置构成显示部130。
如上述构成的检索装置1,在控制部100的控制的基础上进行检索处理。具体而言,按照图4的流程图所示的步骤执行处理。
本处理以检索装置1的输入部120接受从用户输入的检索语为契机开始。即,使用键盘154,用户输出期望的检索语,指示进行检索的主旨,从而开始本处理。
开始处理时,首先,检索装置1的提取部101指定最初的文件组300(步骤S401)。在此,最初的文件组300是指检索装置1在存储部110中具备的多个文件组300a~300n中按照预先决定的顺序排列的最初的文件组300。即,多个文件组300a~300n被预先决定预定的顺序被存储在存储部110,基于该预定的顺序,进行自此开始叙述的提取处理及输出处理等。下面,为了方便,假设预先决定文件组300a、文件组300b、...文件组300n这样的顺序进行说明。
若指定最初的文件组300a,则提取部101在该指定的文件组300a内提取词条中包含所输入的检索语的文件数据301(步骤S402)。即,提取部101将输入的检索语的字符串(检索字符串)和文件组300a具备的多个文件数据301a~301c等的词条的字符串进行比较,提取词条中包含与检索字符串一致的字符串的文件数据301。
例如,在用户输入“携帯(AB)”(下面,对示例的各汉字分配A~F记号并用括号标注。)的检索语的情况下,提取词条为“携帯(AB)”的语句本身即文件数据301、或者“携帯電話(ABCD)”及“常時携帯(EFAB)”这样包含检索字符串的文件数据301。这样,词条中包含输入的检索语的文件数据301,例如在具备1000个文件数据301的文件组300a内有10个的情况下,提取该10个文件数据301。
另外,此时进行的检索的详细方法可以基于任何公知的检索技术。即,提取部101例如也可以进行依次扫描多个文件数据301a~301c等词条的字符串并找出检索字符串的按序型检索(grep型检索),或者为了检索处理的高速化也可以进行预先准备了索引文件的索引型(index型)检索。
这样,若提取词条中包含检索语的文件数据301,则接着设定部102对提取的文件数据301设定相当于词条和检索语的字符数的差值的得分(步骤S403)。在此“得分”是指表示后述的输出处理的输出优先级的指标,相对于一个文件数据301设定一个值。即,在此按照基于设定的得分的优先级,之后进行输出文件数据301的处理。
此时,设定部102取得词条和检索语的字符数的差值,设定为得分的值。即,若词条和检索语的字符数的差值较大,则得分变成较大的值,若差值较小,则得分变成较小的值。词条和检索语的字符数的差值较小是指词条和检索语的一致的程度较大,被认为是用户意向的文件数据301的可能性较高。因此,按照差值(得分)越小的文件数据301越优先输出的方式,输出优先级变得较高。
具体而言,参照如图5所示的例子进行说明。在用户输入“携帯(AB)”的检索语的情况下,会提取具有“携帯(AB)”“携帯電話(ABCD)”“常時携帯(EFAB)”的词条的文件数据301。在词条为“携帯(AB)”的语句本身即文件数据301中,由于没有字符数的差值(0文字),因此,得分被设定为“0”。另一方面,在为词条“携帯電話(ABCD)”或“常時携帯(EFAB)”这类的文件数据301中,由于字符数的差值为两个文字,因此,设定得分为“2”。
若这样设定得分,则进而检索装置1的控制部100对提取的文件数据301按得分从小到大的顺序排列(步骤S404)。即,将文件数据301按输出优先级从高到低的顺序排列。例如,得分为“0”即“携帯(AB)”的词条的文件数据301排列在比得分为“2”的“携帯電話(ABCD)”或“常時携帯(EFAB)”的词条的文件数据301靠前的位置。
此时,控制部100将得分相同的文件数据301按照检索语离开头从近到远的顺序进一步排列(步骤S405)。即,相对于按得分顺序排列的文件数据301,进而在具有相等的得分的文件数据301之间也进行排列。作为此时的排列的基准,控制部100着眼于词条内的检索语的位置,将靠近开头的优先。其原因如下,认为检索语靠近开头的是用户意向的文件数据301的可能性较高。
具体而言,若参照如图5所示的例子进行说明,则针对具有得分相同的“2”即“携帯電話(ABCD)”和“常時携帯(EFAB)”词条的两个文件数据301,“携帯電話(ABCD)”的词条一方与“常時携帯(EFAB)”的词条相比,由于靠前的位置中包含检索语“携帯(AB)”的字符串,因此,被排列在靠前的位置。其结果,在用户输入“携帯(AB)”的检索语的情况下,针对具有提取的“携帯(AB)”“携帯電話(ABCD)”“常時携帯(EFAB)”词条的三个文件数据301,得分为“0”、最小的“携帯(AB)”的词条的文件数据301排在第一位,得分为“2”的“携帯電話(ABCD)”的词条的文件数据301排在第二位,虽得分相同为“2”但检索语没有位于最前头的“常時携帯(EFAB)”的词条的文件数据301排在第三位。
另外,得分和检索语的位置都相同的情况下,基于文件组300内的词条的50音顺序或字母顺序等其它要素进行排列。
若对从这样指定的文件组300a中提取的各文件数据301设定得分进行排序,则将该文件数据301暂时保持在RAM153中,同时,接着,检索装置1的控制部100判定是否有未处理的文件组300(步骤S406)。
在有未处理的文件组300的情况下(步骤S406;是(YES)),指定下一文件组300(步骤S407),处理回到步骤S402。即,在文件组300a的处理后,指定下一文件组300b,对该指定的文件组300b进行上述步骤S402~S405中的文件数据301的提取、得分的设定、排列的各处理。对所有文件组300a~300n的各个文件组进行这些处理,包含输入的检索语的文件数据301被按得分从小到大的顺序排列。
之后,若没有未处理的文件组300(步骤S406;否(NO)),则基于设定的得分即输出优先级,移至输出文件数据301的处理(步骤S408)。针对该输出处理,再次参照图6的流程图详细地进行说明。
若开始输出处理,则检索装置1的判定部103将作为输出文件数据301的判定基准的输出得分S初始化为“0”,而且,指定最初的文件组300(步骤S601)。在此,最初的文件组300是指按上述的预定的顺序存储的最初的文件组300。具体而言,如图7的例子所示,在按如下顺序存储国语辞典的文件组300a、英日辞典的文件组300b、百科词典的文件组300c这三个文件组300a~300c的情况下,在该步骤S601中,指定国语辞典的文件组300a。
另外,在图7的例子中,各文件组300a~300c成为经上述的步骤S402~S405的处理的状态。即,在各文件组300a~300c具备的文件数据301中,提取包含输入的检索语的文件数据301,对它们设定得分,进而成为按照得分从小到大的顺序排列的状态。在自此的输出处理的说明中,参照图6的流程图和图7的具体例两者进行说明。
若指定最初的文件组300a,则判定部103判定在指定的文件组300a内是否有得分为S且未输出的文件数据301(步骤S602),在有的情况下(步骤S602;是),输出部104输出一个相应的文件数据301(步骤S603)。在此,由于输出得分S的值被初始化为“0”,因此,判定在文件组300a内是否有得分为“0”的文件数据301,在有的情况下,输出其中的一个。在此,不将得分为“0”(输出优先级最大)的文件数据301全部输出,仅输出一个的理由为,若一次输出较多的文件数据301,则不能从多个文件组300a~300c中按照尽可能平衡的顺序输出文件数据301。因此,检索装置1,预先决定预定的个数(在此为一个)作为一次输出的个数并存储在存储部110中等,输出部104按每个指定的文件组300依次输出预定的个数输出文件数据301。
具体而言,在图7中,在文件组300a内,作为得分设定为“0”的文件数据301,存在一个“a1”的词条的文件数据301。因此,在此,输出部104通过将该“a1”的文件数据301通过检索装置1的显示部130显示在监视器155上等,向用户输出。
接着,判定部103判定在所有的文件组300a~300c内是否有得分为S且未输出的文件数据301(步骤S604)。即,判定是否还有也包含在其它的文件组300内与输出的“a1”相同的得分为“0”的文件数据301。
在有情况下(步骤S604;是),指定下一文件组300b(步骤S605),处理返回步骤S602。而且,判定部103判定在该指定的文件组300b内,是否有相应的文件数据301,在有的情况下,在步骤S603中,输出部104输出一个相应的文件数据301。
具体而言,在图7中,由于与输出的“a1”的文件数据301得分同样为“0”即“b1”的文件数据301存在于指定的英日辞典的文件组300b内,因此,输出部104会接着“a1”输出“b1”的文件数据301。
若输出“b1”的文件数据301,则在所有的文件组300a~300c内得分为“0”且未输出的文件数据301已经消失。因此,在图6的流程图中,判断没有得分为“0”且未输出的文件数据301(步骤S604;否),接着,将输出得分的值增加至“1”,即着眼于在未输出的文件数据301中输出优先级最大的文件数据301,进行处理。
因此,首先,判定部103判定在所有的文件组300a~300c内是否有未输出的文件数据301(步骤S606)。在此,由于只输出得分为“0”的文件数据301,而未输出得分为“1”以上的文件数据301,因此,判断为有(步骤S606;是)。此时,将输出得分S的值增加至S+1,即将为“0”的设定为“1”(步骤S607),进而,在指定下一文件组300c的基础上(步骤S605),再进行步骤S602的处理。
在此,如图7所示,指定的百科词典的文件组300c具有的文件数据301,得分仅为“2”以上。因此,在图6的步骤S602中,判定部103判定为在指定的文件组300c内没有得分被设定为“1”的文件数据301(步骤S602;否),在此,不通过步骤S603不输出任何的文件数据301。而且,该状态下的处理会再次移至步骤S604、S605,指定下一文件组300a,返回步骤S602。
在此,由于到此为止指定的文件组300c为按预定的顺序存储的最后,因此,在步骤S605中,作为接着指定的文件组,巡回地返回至预定的顺序的最初,指定国语辞典的文件组300a。而且,再次判定在该最初的文件组300a即国语辞典内是否存在得分被设定为“1”的未输出的文件数据301(步骤S602)。具体而言,在该最初的文件组300a中,得分被设定为“1”的未输出的文件数据301存在“a2”和“a3”两个。因此,在此判定为有,执行步骤S603的文件数据301的输出处理。
此时,输出部104输出该两个文件数据301(“a2”和“a3”)中的预定的个数,即在此输出一个文件数据301。即,输出部104不同时输出该两个文件数据301,仅输出一个排在前头的“a2”的文件数据301,移至下一英日辞典的文件组300b的处理。由此,通过从多个文件组300a~300c中分别逐一输出文件数据301,从而实现从多个文件组300a~300c中毫无遗漏的输出。
重复如上所述的处理,检索装置1的输出部104一边巡回地指定文件组300a~300c,一边从得分较小的文件数据301开始按顺序输出各一个。其结果,从如图7的三个文件组300a~300c中按“a1”、“b1”、“a2”、“b2”、“a3”、“b3”、“c1”、“b4”、“c2”、“a4”、“c3”、“c4”、“c5”、“a5”、“b5”...的顺序输出文件数据301。
通过如以上的结构,本实施方式的检索装置1,在从多个文件组300a~300n中的包含期望的检索语的文件数据301的检索中,对文件数据301设定基于检索语和词条的字符数的差值的输出优先级,按照该输出优先级从高到低的顺序一边巡回多个文件组300a~300n一边逐一输出文件数据301。
其结果,从多个文件组300a~300n中毫无遗漏地输出包含检索语的文件组301,用户即使未明确地指定并检索任一文件组300,也能够从多个文件组300a~300n中分别确认符合意向的可能性较高的文件数据301,另外,能够一边在多个文件组300a~300n间进行比较等,一边找出。
另外,上述实施方式为一个例子,本发明的适用范围不受其限制。即,可进行各种应用,所有的实施方式都包含在本发明范围内。
例如,在上述实施方式中,检索装置1将文件组300a~300n存储于如ROM152那样的存储部110内。但不限定于此,,检索装置1也可以具备硬盘等大容量存储装置、DVD-ROM驱动器,文件组300a~300n被存储在硬盘、DVD-ROM等中。或者,检索装置1也可以与网络连接,文件组300a~300n存在于网络上。
另外,在上述实施方式中,对于检索装置1而言,用户输入检索语的输入部120、显示检索结果的显示部130与控制部100、存储部110存在于同一装置内。但不限定于此,输入部120和显示部130也可以位于检索装置1的外部。即,例如如图8所示,检索装置1也可以不具备输入部120和显示部130,而经由网络150与具备它们的终端装置2连接,构成为如在线型的电子词典那样的信息设备。
此时,检索装置1和终端装置2通过各自具备的通信部140a、140b经由网络150彼此相互通信数据。即,终端装置2的用户输入的检索语被发送给检索装置1,并通过控制部100执行检索处理。之后,在将作为检索结果的文件数据的信息与对他们设定的输出的顺序对应的基础上,再次发送给终端装置2,并经由显示部130显示给用户。通过采用这种结构,能够一并管理检索装置1内的文件组300a~300n等,能够被多个用于利用,另外,由于用户端的终端装置2无需保持文件组300a~300n等,因此,具有能够抑制数据大小的优点。
另外,在上述实施方式中,假设如电子词典那样的小型的信息处理装置作为检索装置1进行了说明。但不限定于此,检索装置1也可以为商业用/家庭用的普通的计算机装置、便携式电话等其它信息设备。即,检索装置1例如也可是在普通的计算机装置中,从硬盘等大容量存储装置、DVD-ROM等准备的文件组300a~300n中检索包含期望的检索语的文件数据301的装置,还可以是在手机中,从在网络150上准备的文件组300a~300n中检索包含期望的检索语的文件数据301的装置。
另外,在上述实施方式中,检索装置1提取“词条”中包含检索语的文件数据301(所谓的“词条检索”),根据基于设定的输出优先级的预定的规则,输出该提取出的文件数据301。但不限定于此,也可以提取文件数据301中的“说明文”中包含检索语的文件数据(所谓的“全文检索”)。即,可以将检索对象扩展到“词条”和“说明文”两者,将在任何一方中包含检索语的文件数据301向用户输出。
在该情况下,也可以针对通过“全文检索”提取的文件数据301,与通过“词条检索”提取的文件数据301相比,将输出优先级较低地(将得分较大地)设定。由此,即使用户未明确地指定检索“词条检索”和“全文检索”,也将是符合用户的检索意向的文件数据301的可能性较高的通过“词条检索”提取出的文件数据301优先输出,之后,输出“说明文”中包含检索语的文件数据301,用户能够更加简便地获得符合意向的检索结果。
该情况下,而且,也可以预先对输出的文件数据301的个数决定最大值,在“词条”中包含检索语的文件数据301不满足该最大值的情况下,只提取剩余数量的“说明文”中包含检索语的文件数据301。通常,由于若“说明文”也包含在检索对象内,则检索对象会扩大,因此,在此,通过仅在不满足输出个数的情况下将检索对象扩展至“说明文”,能够抑制整个处理的负荷。
另外,在上述实施方式中,假设从用户接受单一的检索语的情况进行了说明。但不限定于此,检索装置1也可以接受多个检索语,并进行针对实施它们的逻辑积及逻辑和等各种运算处理后而得结果的检索,基于以预定的规则设定的输出优先级,向用户输出。在该情况下,对作为检索结果而提取的文件数据301设定的输出优先级,可以通过在此包含的多个检索语的出现位置、出现频度、或者多个检索语间的出现位置的间隔的各种出现形式来设定。
另外,在上述实施方式中,文件组300a~300n具备的多个文件数据301a~301c等由“词条”和“说明文”构成。但不限定于此,可以由各种各样的要素构成。例如,也可以为具有用于说明“词条”的图或表。或者,不限于由这种“词条”和“说明文”构成的词典的构成单位,检索装置1也可以为检索各种电子数据的装置。例如,也可以为在普通的计算机装置中,从存储于硬盘等大容量存储装置的电子文件中,检索包含期望的检索字符串的电子文件的装置。或者,也可以为与网络连接,并检索存在于网络上的网页的装置。
另外,在上述实施方式中,文件组300a~300n预先被决定预定的顺序,并基于该预定的顺序,进行检索装置1的处理。在此,预定的顺序不限于不可从预先决定的一个顺序进行设定变更的顺序,可以为各种设定的顺序。例如,也可以为针对各文件组300预先存储使用频度,按照该使用频度升从高到低的顺序决定预定的顺序。或者,也可以由用户自己决定顺序。由此,从符合用户的意向的可能性较高的文件组300的检索结果按顺序输出,从而提高检索装置1的可用性。
或者,不限于将存储于存储部110的所有的文件组300a~300n作为检索对象,也可以按照用户能够自己选择检索对象的文件组300的方式,从该选择的文件组300中,基于预定的顺序进行检索处理。由此,更容易进行符合用户意向的检索结果的输出。
另外,在上述实施方式中,巡回地逐一输出多个文件组300a~300n具备的文件数据301中输出优先级较高的文件数据。但是不限于逐一输出文件数据,也可以巡回地逐次输出两个、三个,或者其它个数。即,输出部104作为每次输出的文件数据301的个数而决定的预定的个数,不限于一个,可以为若干个。通常,若将预定的个数设为一个或两个那样比较少的个数,则可从所有的文件组300中进行毫无遗漏的文件数据301的输出。相反,若是增大预定的个数,则从各文件组300的文件数据301的输出成为每次输出某种程度上大量的个数。或者,也可以用户自己指定这种每一次输出的文件数据301的个数。由此,能够灵活地设计从多个文件组300a~300n中毫无遗漏地输出的程度。
另外,当然,能够提供预先具备用于实现本发明的功能的结构的检索装置,还能够提供通过程序的应用,使已有的个人计算机、信息终端设备等作为本发明的检索装置发挥作用。即,通过使控制已有的个人计算机、信息终端设备等的CPU等能够执行用于实现上述实施方式中示例的检索装置1的各功能结构的检索程序,能够作为本发明的检索装置1发挥作用。另外,能够使用检索装置1实施本发明的检索方法。
另外,这种程序的适用方法是任意的,例如除能够收容在CD-ROM或DVD-ROM、存储器卡等计算机可读存储介质中来进行应用之外,例如,还可以经由因特网等通信介质来进行应用。
Claims (10)
1.一种检索方法,其特征在于,
具备如下步骤:
提取步骤,从多个文件组分别具备的多个文件数据中,提取包含期望的检索字符串的文件数据;
优先级设定步骤,基于检索字符串与文件数据的字符串的一致度对在各所述文件组中提取的文件数据分别设定输出优先级;
基准优先级设定步骤,设定成为是否输出文件数据的判定基准的优先级;
文件组指定步骤,指定多个文件组中包含的一个文件组;
第一判定步骤,判定在通过所述文件组指定步骤指定的一个文件组中是否包含被设定了与通过所述基准优先级设定步骤设定的基准优先级相同的优先级的文件数据;
输出步骤,输出预定个数在所述第一判定步骤判定为包含的文件数据;
第二判定步骤,判定在所述多个文件组中是否存在与所设定的基准优先级相同的优先级的未输出的文件数据;以及
重复步骤,在所述第二判定步骤判定为存在未输出的文件数据时,指定下一个文件组,重复第一判定步骤和输出步骤,在判定为不存在未输出的文件数据时,将基准优先级从高切换到低的同时重复所述文件组指定步骤、所述第一判定步骤以及所述输出步骤。
2.根据权利要求1所述的检索方法,其特征在于,
所述多个文件组分别具备的多个文件数据分别由词条和对应的说明文构成,
在所述优先级设定步骤中,基于词条和检索字符串的字符数的差值设定文件数据的输出优先级。
3.根据权利要求2所述的检索方法,其特征在于,
在所述优先级设定步骤中,对于词条和所述检索字符串的字符数的差值相等的文件数据,按照该词条中出现所述检索字符串的位置离该词条的开头字符从近到远的顺序,进一步设定文件数据的输出优先级。
4.根据权利要求3所述的检索方法,其特征在于,
在所述优先级设定步骤中,将所述提取的文件数据中的、词条中没有包含所述检索字符串的文件数据的输出优先级设定为比词条中包含所述检索字符串的文件数据的输出优先级低。
5.根据权利要求4所述的检索方法,其特征在于,
在所述提取步骤中,从所述多个文件组分别具备的多个文件数据中提取词条中包含所述检索字符串的文件数据,在该提取的文件数据的个数不满足预定的最大数的情况下,进而提取说明文中包含所述检索字符串的文件数据。
6.一种检索装置,其特征在于,
具备:
提取单元,其从多个文件组分别具备的多个文件数据中提取包含期望的检索字符串的文件数据;
优先级设定单元,其基于检索字符串与文件数据的字符串的一致度对在各所述文件组中提取的文件数据分别设定输出优先级;
基准优先级设定单元,其设定成为是否输出文件数据的判定基准的优先级;
文件组指定单元,其指定多个文件组中包含的一个文件组;
第一判定单元,其判定在通过所述文件组指定单元指定的一个文件组中是否包含被设定了与通过所述基准优先级设定单元设定的基准优先级相同的优先级的文件数据;
输出单元,其输出预定个数在所述第一判定单元判定为包含的文件数据;
第二判定单元,其判定在所述多个文件组中是否存在与所设定的基准优先级相同的优先级的未输出的文件数据;以及
重复单元,其在所述第二判定单元判定为存在未输出的文件数据时,指定下一个文件组,重复第一判定单元的判定和输出单元的输出,在判定为不存在未输出的文件数据时,将基准优先级从高切换到低的同时重复所述文件组指定单元的指定、所述第一判定单元的判定以及所述输出单元的输出。
7.根据权利要求6所述的检索装置,其特征在于,
所述多个文件组分别具备的多个文件数据分别由词条和对应的说明文构成,
在所述优先级设定单元中,基于词条和检索字符串的字符数的差值设定文件数据的输出优先级。
8.根据权利要求7所述的检索装置,其特征在于,
在所述优先级设定单元中,对于词条和所述检索字符串的字符数的差值相等的文件数据,按照该词条中出现所述检索字符串的位置离该词条的开头字符从近到远的顺序进一步设定文件数据的输出优先级。
9.根据权利要求8所述的检索装置,其特征在于,
在所述优先级设定单元中,将所述提取的文件数据中的、词条中没有包含所述检索字符串的文件数据的输出优先级设定为比词条中包含所述检索字符串的文件数据的输出优先级低。
10.根据权利要求9所述的检索装置,其特征在于,
在所述提取单元中,从所述多个文件组分别具备的多个文件数据中提取词条中包含所述检索字符串的文件数据,在该提取的文件数据的个数不满足预定的最大数的情况下,进而提取说明文中包含所述检索字符串的文件数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011-074477 | 2011-03-30 | ||
JP2011074477A JP5699744B2 (ja) | 2011-03-30 | 2011-03-30 | 検索方法、検索装置、ならびに、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102737113A CN102737113A (zh) | 2012-10-17 |
CN102737113B true CN102737113B (zh) | 2016-04-13 |
Family
ID=46928665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210142277.9A Active CN102737113B (zh) | 2011-03-30 | 2012-03-29 | 检索方法、检索装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8782067B2 (zh) |
JP (1) | JP5699744B2 (zh) |
CN (1) | CN102737113B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5699744B2 (ja) * | 2011-03-30 | 2015-04-15 | カシオ計算機株式会社 | 検索方法、検索装置、ならびに、コンピュータプログラム |
JP6135331B2 (ja) * | 2013-06-27 | 2017-05-31 | カシオ計算機株式会社 | 電子機器、プログラム、および、検索システム、検索方法 |
JP5888356B2 (ja) * | 2014-03-05 | 2016-03-22 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP7053219B2 (ja) * | 2017-11-06 | 2022-04-12 | アズビル株式会社 | 文書検索装置および方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5926812A (en) * | 1996-06-20 | 1999-07-20 | Mantra Technologies, Inc. | Document extraction and comparison method with applications to automatic personalized database searching |
WO2000043909A1 (fr) * | 1999-01-21 | 2000-07-27 | Sony Corporation | Procede et dispositif de traitement de documents et support d'enregistrement |
JP3696745B2 (ja) * | 1999-02-09 | 2005-09-21 | 株式会社日立製作所 | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002297594A (ja) * | 2001-04-02 | 2002-10-11 | Nippon Telegr & Teleph Corp <Ntt> | 分散型検索装置におけるメタ検索方法及び装置及びメタ検索プログラム及びメタ検索プログラムを格納した記憶媒体及び分散型検索装置における検索実行方法及び装置及び検索実行プログラム及び検索実行プログラムを格納した記憶媒体 |
CN100432963C (zh) * | 2001-05-18 | 2008-11-12 | 尼康照相机贩卖株式会社 | 电子商店和电子公告牌的提供方法、站点检索方法 |
JP2004133775A (ja) * | 2002-10-11 | 2004-04-30 | Sony Ericsson Mobilecommunications Japan Inc | 辞書データ検索装置、辞書データ検索方法、辞書データ検索プログラム、及び辞書データ検索プログラムが記憶された記憶媒体 |
US20040103368A1 (en) * | 2002-11-21 | 2004-05-27 | Research Foundation Of State University Of New York | Link traverser |
US20040193596A1 (en) * | 2003-02-21 | 2004-09-30 | Rudy Defelice | Multiparameter indexing and searching for documents |
JP2005189963A (ja) * | 2003-12-24 | 2005-07-14 | Canon Inc | 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 |
JP2006106889A (ja) | 2004-09-30 | 2006-04-20 | Casio Comput Co Ltd | 情報表示制御装置及びプログラム |
GB2430279A (en) * | 2005-05-11 | 2007-03-21 | Royce Technology Ltd | Metasearch tool for recruitment purposes |
JP2008130050A (ja) * | 2006-11-24 | 2008-06-05 | Canon Inc | 画像検索装置及びその方法 |
JP2008257505A (ja) * | 2007-04-05 | 2008-10-23 | Casio Comput Co Ltd | 辞書機能を備えた電子装置および電子辞書プログラム |
CN100524317C (zh) * | 2007-10-10 | 2009-08-05 | 华为技术有限公司 | 一种关联关系搜索结果的排序方法及装置 |
JP2009259039A (ja) * | 2008-04-17 | 2009-11-05 | Hitachi Ltd | 複数のデータベースの検索方法及びメタ検索サーバ |
JP5240567B2 (ja) * | 2008-12-02 | 2013-07-17 | アイシン・エィ・ダブリュ株式会社 | 検索装置、及び検索用プログラム |
EP2221734B1 (en) * | 2009-02-16 | 2017-11-29 | Accenture Global Services Limited | Cross community invitation and multiple provider product information processing system |
US8892550B2 (en) * | 2010-09-24 | 2014-11-18 | International Business Machines Corporation | Source expansion for information retrieval and information extraction |
JP5801545B2 (ja) * | 2010-10-15 | 2015-10-28 | キヤノン株式会社 | 情報処理装置、その情報処理方法及びプログラム |
JP5699744B2 (ja) * | 2011-03-30 | 2015-04-15 | カシオ計算機株式会社 | 検索方法、検索装置、ならびに、コンピュータプログラム |
-
2011
- 2011-03-30 JP JP2011074477A patent/JP5699744B2/ja active Active
-
2012
- 2012-03-23 US US13/428,182 patent/US8782067B2/en active Active
- 2012-03-29 CN CN201210142277.9A patent/CN102737113B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102737113A (zh) | 2012-10-17 |
US20120254209A1 (en) | 2012-10-04 |
JP5699744B2 (ja) | 2015-04-15 |
JP2012208775A (ja) | 2012-10-25 |
US8782067B2 (en) | 2014-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102737113B (zh) | 检索方法、检索装置 | |
US20110055241A1 (en) | High precision search system and method | |
US10275483B2 (en) | N-gram tokenization | |
CN102959547A (zh) | 字词库调整方法及设备 | |
CN101645093A (zh) | 一种分类词库实现的方法和输入法客户端 | |
CN103257995B (zh) | 文本检索装置以及文本检索方法 | |
TW200805095A (en) | Data product search using related concepts | |
CN106257452A (zh) | 基于上下文特征修改搜索结果 | |
KR102182672B1 (ko) | 다국어 통합 자음 패턴 검색 방법 및 그 장치 | |
US8572082B2 (en) | Method and device for generating a similar meaning term list and search method and device using the similar meaning term list | |
Ruette et al. | Lexical variation in aggregate perspective | |
US9557895B2 (en) | Electronic book with changeable paths | |
JP2012208774A (ja) | 検索方法、検索装置、ならびに、コンピュータプログラム | |
US20150178289A1 (en) | Identifying Semantically-Meaningful Text Selections | |
CN104090724A (zh) | 一种智能终端中通过双指手势操作文件的方法及装置 | |
CN110073351A (zh) | 通过组合来自用户尝试的候选来预测文本 | |
JP5810814B2 (ja) | 辞書機能を備えた電子機器、複合語検索方法、及びプログラム | |
CN101873381A (zh) | 手机菜单显示方法和手机 | |
CN107315735A (zh) | 用于笔记整理的方法及设备 | |
WO2023124785A1 (zh) | 一种交互方法、装置、计算机设备以及存储介质 | |
CN104123378A (zh) | 一种信息处理方法及电子设备 | |
KR20120060732A (ko) | 준세벌 한글자판과 새로운 두루자판 시스템 | |
JP5541014B2 (ja) | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム | |
JP3848014B2 (ja) | 文書検索方法および文書検索装置 | |
US7716195B2 (en) | Search methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |