CN1362681A - 信息检索处理装置和方法,记录信息检索程序的记录媒体 - Google Patents

信息检索处理装置和方法,记录信息检索程序的记录媒体 Download PDF

Info

Publication number
CN1362681A
CN1362681A CN01145183A CN01145183A CN1362681A CN 1362681 A CN1362681 A CN 1362681A CN 01145183 A CN01145183 A CN 01145183A CN 01145183 A CN01145183 A CN 01145183A CN 1362681 A CN1362681 A CN 1362681A
Authority
CN
China
Prior art keywords
information
scope
search key
retrieval
positional information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01145183A
Other languages
English (en)
Inventor
内山将夫
村田真树
井佐原均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COMMUNICATION COMPREHENSIVE INST
Original Assignee
COMMUNICATION COMPREHENSIVE INST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by COMMUNICATION COMPREHENSIVE INST filed Critical COMMUNICATION COMPREHENSIVE INST
Publication of CN1362681A publication Critical patent/CN1362681A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种信息检索处理装置具有:在输入用于在所述输出装置所显示的所述电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收位置信息的装置;根据所述位置信息从输出装置显示的电子字符信息中指定预定的检索关键字提取范围的装置;以及根据所述指定的检索关键字提取范围执行信息检索并输出检索结果的装置。

Description

信息检索处理装置和方法, 记录信息检索程序的记录媒体
发明领域
本发明涉及信息检索处理装置、信息检索处理方法以及记录信息检索处理程序的记录媒体,更具体地来说,涉及这样的信息检索处理装置、信息检索处理方法和记录信息检索处理程序的记录媒体,其中信息检索处理装置能够以简单的方式在用于万维网中的电子信息和电子百科全书等的访问或检索系统中实现信息检索处理方法。
背景技术
按照常规的电子信息检索技术,有一种利用用户输入的关键字进行检索的关键字检索技术。还有一种相似主题检索技术,用于检索与正在查阅的文档相似的文档。
例如,有下列参考文档:
(1)参考文档1:Ken Aratani,Tatsuhiko Tunoda,Takumi Oishi,Makoto Nagao,“利用词的频率和位置检索报纸的相关文章的技术”,Information Processing Society of Japan,Treatise Journal 1997年,Vol.38,No.4,pp 855-862;以及
(2)参考文档2:Hitoshi Isahara,Hiromi Kosaku,KiyotakaUchimoto,Masaki Murata,Hiroshi Kabuta,Masahiro Mikami,NoriyukiNishimata,Makoto Takahashi,“利用基于主题相关性的信息检索方法发展新闻读者”Information Technology Promotion Agency,Japan the19-th technology releese treatises 2000年10月11-12日。
随着电子文档和信息社会的发展,利用计算机检索电子文档的信息检索技术已非常重要。
大多数信息检索系统要求用户输入关键字。但是,在关键字检索中,要花费很多时间来输入关键字,且所输入的关键字局限于用户可以想到的关键字范围内。因此,在某些情况下所输入关键字的重要性可能会出现误差,其中如果选择和输入了不重要的关键字,则可能会增加检索噪声,导致检索精度降低的问题。
还有,在相似主题检索技术中,检索仅适用于文档级,因此存在这样的限制:无法检索与文档的一部分所表示的内容相似的文档。因此,如果存在整个文档和文档的一部分所表示的内容之间的相似性冲突,则该问题会导致检索精度降低。
发明内容
通过本发明解决了上述问题,本发明的目的在于提供一种信息检索处理装置,用于仅通过对屏幕上显示的、用户希望更详细地进行了解的一部分电子信息进行单击或拖动来实现关键字检索,检索电子信息时,只需使用单触式操作。
再者,本发明的目的在于提供一种信息检索处理方法,用于仅通过对屏幕上显示的、用户希望更详细地进行了解的一部分电子信息进行单击或拖动来实现关键字检索,检索电子信息时只需使用单触式操作。
再者,本发明的目的在于提供一种记录用于操作信息检索处理装置的信息检索处理程序的记录媒体,所述信息检索处理装置用于仅通过对屏幕上显示的、用户希望更详细地进行了解的一部分电子信息进行单击或拖动来实现关键字检索,检索电子信息时,只需使用单触式操作。
本发明的信息检索处理装置可以基于电子字符信息来检索信息。所述装置包括:输出装置;接收装置,在输入用于在输出装置所显示的电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收位置信息;指定装置,用于根据所述位置信息从输出装置所显示的电子字符信息中指定检索关键字提取范围;以及执行和输出装置,用于根据所指定的检索关键字提取范围执行信息检索并输出信息检索的结果。
再者,本发明的信息检索处理方法可以根据电子字符信息检索信息。所述方法包括:在输入用于在输出装置所显示的电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收位置信息;根据所述位置信息从输出装置所显示的电子字符信息中指定检索关键字提取范围;以及根据所指定的检索关键字提取范围执行信息检索以输出信息检索的结果。
再者,本发明的记录媒体记录基于电子字符信息来检索信息的程序。所述程序使计算机执行以下操作:在输入用于在输出装置所显示的电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收位置信息;根据所述位置信息从输出装置所显示的电子字符信息中指定检索关键字提取范围;以及根据所指定的检索关键字提取范围执行信息检索以输出信息检索的结果。
即,本发明涉及从电子字符信息中提取检索关键字,并根据所提取的检索关键字检索信息,它是以如下方式来实现的:在输入用于在输出装置所显示的电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收位置信息;指定预定的检索关键字提取范围;以及根据所指定的检索关键字提取范围执行信息检索并输出信息检索的结果。在这些处理步骤中,检索关键字提取范围被定义为这样的范围,它包含用户输入的位置信息的字符之前、之后或者前后的预定数目的字符、词或行。在用户所输入的位置信息指定了检索关键字提取范围的起始位置或结束位置的情况下,检索关键字提取范围被定义为从所述起始位置到所述结束位置的输入范围。
在常规技术的情况下,当根据检索关键字来进行信息检索时,用户必须从键盘输入一个或多个关键字。但是,在本发明中,用户只需要简单地使用指示装置(如鼠标)对当前查阅电子文档中感兴趣的词或主题的部分进行单击或拖动,由此即可检索或查阅仅与所述部分相关的其他电子信息。
用于在计算机上实现各处理装置的程序可以存储在适当的记录媒体中、诸如可供计算机读取的便携式媒体存储器、半导体存储器或硬盘。
附图说明
图1是说明根据本发明实施例的信息检索处理装置的配置的方框图。
图2是根据本发明实施例的信息检索处理方法的处理流程图。
图3是显示输入范例和检索结果的显示范例的视图。
图4是显示输入范例和检索结果的显示范例的视图。
图5是显示设定检索关键字的提取条件的用户设置屏面的范例的视图。
图6A至图6D是显示检索关键字提取范围的范例的视图,其中图6A显示通过拖动设定范围(字符串的列表)的范例,图6B显示通过拖动设定范围(矩形范围)的范例,图6C显示设定被单击的部分前后20个字符的范围的范例,以及图6D显示设定被单击的部分之前三行的范围的范例。
具体实施方式
下面将参考附图对本发明的最优实施例予以说明。图1说明根据本发明实施例的信息检索处理装置的配置范例。信息检索处理装置10包括:检索关键字提取范围识别部分(或装置)11、检索关键字提取部分(或装置)12、信息检索执行部分(或装置)13、信息检索数据库14以及检索关键字提取条件设置部分(或装置)15。信息检索数据库14可以在信息检索处理装置10之外另行设置。另外,信息检索执行部分13还可以利用通过网络连接的其他装置执行检索。
本实施例中的信息检索处理装置10具有作为输出装置的显示器20和指示装置21、例如作为输入装置的鼠标。指示装置21可以是任何形式的,只要它可以在显示屏上指定位置。
检索关键字提取范围识别部分(或装置)11接收用于指定显示器20上显示的电子字符信息的检索关键字提取范围的位置信息,然后根据所接收的位置信息从显示器20上显示的字符信息指定检索关键字提取范围。检索关键字提取部分(或装置)12从检索关键字提取范围识别部分11中指定的检索关键字提取范围提取一个或多个检索关键字。信息检索执行部分(或装置)13利用检索关键字执行部分12提取的检索关键字检索信息检索数据库14,并且输出检索结果。检索关键字提取条件设置部分(或装置)15根据用户预先提供的输入设置用于从显示屏幕上的位置信息指定检索关键字提取范围的提取条件。
图2说明图1所示的信息检索处理装置10的处理流程。首先,检索关键字提取范围识别部分11接收位置信息的输入以便指定在电子文档中提取检索关键字的范围(步骤S1),并且根据所接收的位置信息在电子文档中指定检索关键字提取范围。
利用指示装置21(如鼠标)对所显示的电子文档上、例如用户希望进行更详细了解的部分进行单击或拖动来指定位置信息。指定该范围的方式有如下几种。其中X是正整数。
(1)该范围被指定为被单击的部分之前、之后或者前后X个字符。
(2)该范围被指定为被单击的部分之前、之后或者前后X行。
(3)该范围被指定为被单击的部分之前、之后或者前后X个主导词。
(4)该范围被指定为包含被单击部分的段落前后且以空行相隔的段落。
(5)该范围被指定为被单击部分前后且以句点或标点符号相隔的部分。
(6)该范围被指定为被拖动的部分。
例如,在该范围被定义为用户单击的部分前后40个字符的情况下,用户先接受所单击部分(位置信息)的输入,然后指定包括所单击字符且位于所单击字符前后的总共81个字符作为检索关键字提取范围。另外,在该范围被定义为用户单击的部分前后20个字符的情况下,用户先接受所单击部分(位置信息)的输入,然后通过词法分析(morphological analysis)提取所输入部分前后20个字符,并将它们定义为检索关键字提取范围。
接下来,检索关键字执行部分12从指定的检索关键字提取范围提取检索关键字。首先,利用词法分析从检索关键字提取范围将从属词或独立词归类,并从所归类的独立词中提取名词(如果需要,可以是动词),以利用所提取的名词作为检索关键字。再者,可以从这些名词中仅提取重要的名词(如技术术语)作为检索关键字。重要的词是否是检索关键字可以通过如下方式判断:与该类文档无关而常在任何文档中出现的词则为不重要的,而有偏向地在指定文档出现的词则是重要的。这可以利用存储有关典型文档中词出现频率的统计信息的词典来判断。检索关键字的重要性可以参照存储表示专有名词或技术术语的词属性的词典来判断。还可以利用其他常见的词提取处理过程来提取检索关键字。
接下来,根据信息检索执行部分13所提取的检索关键字从信息检索数据库14检索信息(步骤S4),并输出检索结果(步骤S5)。还可以利用基于网络的现存检索服务器来实现信息的检索。
再者,可以利用如下Rebertson表达式来执行检索处理过程,其中利用检索关键字执行部分12所提取的所有名词作为检索关键字,因此提供了较高精度的解决方法:
             S(d)=∑TF(d,t)/(TF(d,t)+1)*IDF(t)
(∑表示关键字t的总和)
其中S(d)是文章d的得分值,TF(d,t)是关键字t在文章d中的出现频率,而IDF(t)是出现关键字t的文章数目的倒数。
下面提供参考文档3。从此参考文档3可以追溯到Robertson的文档,且将其包括在本说明书中作为参考:(3)参考文档3;MasakiMurata,Sei Ba,Kiyotaka Uchimoto,Hiromi Kosaku,Masao Uchiyama,Hitoshi Isahara,“利用位置信息和场信息进行的信息检索”,NaturalLanguage Processing(Natural Language Association Journal),2000年4月,Vol.7,No.2,第141页到第160页。
在各种文档中出现的关键字被认为是不重要的,而具有较小的IDF(t)值,即文章数目的倒数,可以通过乘以小加权值而在上述表达式中使用。上述表达式中S(d)的值是以t作为关键字计算出来的,结果则按照具有高S(d)值的文章的顺序呈现给用户。
下面将描述一个特定范例,其中电子文章中的文本的一部分是从已登记的文章书籍信息的数据库中检索来的。图3显示检索源的输入范例和从该输入范例中提取的检索结果的显示范例。
图3所示的输入范例是显示器20上显示的电子技术文章的一部分。假定用户查看所显示的文章,且对“校勘分析”感兴趣。于是,用户将光标移动到所显示的文档中“校勘分析”附近,然后单击它。
此处,例如,假定将被单击部分前后20个字符的指定范围(总共41个字符)设定为检索关键字提取条件。然后,检索关键字提取范围识别部分11检测到光标位于“校勘”部分处,接收其位置信息,并指定“校勘”前后20个字符(总共41个字符)作为检索关键字提取范围。所指定的范围就是“对处理的研究是句子结构分析,用于捕捉处理名词短语的表示现象和句子结构的校勘分析”。
检索关键字执行部分12对检索关键字提取范围执行词法分析以便单独提取名词。所提取的词包括“处理、研究、名词、短语、表示、现象、校勘、分析、句子、结构、句子、结构、分析”,以此类的一组词作为检索关键字。根据已准备好的检索关键字提取词典,“名词”、“表示”、“现象”、“校勘”和“分析”被指定为所提取的一组词中的重要检索关键字,“名词短语”和“表示现象”可以作为组合词来用。
信息检索执行部分13利用从检索关键字执行部分12接收的检索关键字对文章图书信息数据库(信息检索数据库14)执行检索处理,并输出检索结果。检索结果的显示范例如图3所示。作为检索处理结果,显示相应文章的图书信息清单。在本范例中,检索源的数据是该文章,检索源是图书信息。但是,即使提取检索关键字的检索源数据和检索对象的数据属于不同格式,也可以象本范例中那样进行检索。
还可以通过万维网(WWW)检索信息,而非其中检索对象位于特定位置的信息检索数据库14。在通过WWW检索信息的情况下,检索结果以图3所示的清单格式或更简单的格式显示,可以单击检索结果以通过超链接来访问文章的内容。
下面将参考图4的范例阐述利用Rebertson表达式的检索范例。假定输入范例同图3所示的范例。在特定的检索关键字提取范围“对处理的研究是句子结构分析,用于捕捉处理名词短语的表示现象和句子结构的校勘分析”、“名词”、“表示”和“校勘”并不频繁地出现在各种文档中,因此在Rebertson表达式中,IDF(t)的值很高。因此,包含这些词的图书信息得到高的得分,而呈现给用户。检索结果的显示范例如图4所示。
在某些情况中,也采用短语级,如“句子结构”作为关键字。在这种情况下,“句子结构”不可能出现在各种文章中,IDF(t)也就变得更大,存在大量的包含“句子结构”的图书信息被错误地输出的可能性。但是,当利用此关键字来检索用户阅读的所有文档时,可能包含其他关键字,如词法词态和语法,则存在得到很多不需要的文章的可能性,因此一般认为,在得到稍与“句子结构”有关的文章的范畴内检索有关“校勘”的项目即可获得足够的精度。
另一方面,还考虑到用户希望更准确地查询词典的情况。此时,可以采用拖动来指定。例如,如果拖动感兴趣的部分,则所拖动的范围仅为“处理名词短语表示现象的校勘分析”。在此情况中,如果进行词法分析以提取名词,则得到“名词、短语、表示、现象、校勘、分析”的结果,而没有象“句子结构”这样的关键字,如果执行检索,则更为准确地检索到有关“校勘”的文章。
图5显示设定检索关键字条件的用户设置屏面的范例,图6显示检索关键字提取范围的范例。在本实施例中,用户可以预先在图1的检索关键字提取条件设置部分15所显示的图5中所示的用户设置屏面上设定检索关键字提取条件。首先,可以通过单击校验框来选定通过拖动,还是通过单击来指定范围。
再者,当通过拖动来指定范围时,可以选择是指定字符串阵列还是指定矩形范围。例如,在通过拖动指定范围和选择字符串阵列的情况下,假定拖动了从“词法分析”到“大体上分类”的范围,如图6A所示。于是,检索关键字提取范围就是“大体上分为词法分析、语法分析、涵义分析和上下文语境分析”。另外,在通过拖动指定范围和选择矩形范围的情况下,拖动了从“上下文语境分析”到“校勘分析”的范围,检索关键字提取范围则是包含在左上角的“上下文语境分析”和右下角的“校勘分析”的矩形范围。
在通过单击指定范围时选择了“被单击部分前后20个字符”(用户设定数字20)的情况下,用户单击检索源数据中的字符“校勘”,如图6C所示,由此包含被单击部分前后20个字符的总共41个字符被识别为检索关键字提取范围(虚线包围的范围)。图6D显示通过单击指定范围,选择被单击部分前后三行时的检索关键字提取范围(虚线包围的范围)的范例。其他设置的情况雷同。
用户需要时,可以从菜单中调用检索关键字提取条件设置部分15。从而,检索关键字提取条件设置部分15会显示图5所示的用户设置屏面,并且把用户设置的检索关键字提取条件的设置信息告知检索关键字提取范围识别部分11。由于此设置信息会被保留,所以用户可以根据需要在图5所示的用户设置屏面上更改该设置信息。
传统技术和本实施例的方法之间的差异将利用通过浏览器访问互联网信息、如WWW的范例予以阐述。当用户阅读某个主页时,假定用户要搜索更详细描述当前阅读的页面的某个部分的页面。
此时,在利用关键字检索的传统技术的情况下,要求用户从正在阅读和搜索的页面的该部分拾取主导词(实义词),并将它输入到用于关键字检索的现存检索引擎中来执行检索。另外,在检索相似主题的传统技术的情况下,检索是仅以文档为单位(此处以主页中页面为单位)启用的,由此取出主导词(实义词)并从正在阅读的整个页面进行检索。相应地,较之从正在阅读的页面的一部分提取,包含不需要的关键字的概率比较高。
相反,在本实施例的检索方法的情况下,使用指示装置仅单击正在阅读的页面的想要详细了解的部分,从该部分附近预定范围内的自然语言句子中提取主导词(实义词);或者使用指示装置仅拖动正在阅读的页面且想要详细了解的部分,从被拖动的部分中的自然语言句子中提取主导词(实义词),从而通过WWW检索信息。因此,不象传统关键字检索那样,这里无需用户每次指定关键字,而且此设计对于用户很友好。另外,不象相似主题的传统检索那样,这里不是从整个文档中提取关键字,而是自动从页面的预先通知的一部分提取的,因此可以高精度地执行检索。
当采用传统关键字检索执行检索时,如图3所示,字符串、如“校勘”或“校勘分析”可被作为检索关键字输入,但是仅以“校勘”或“校勘分析”作为检索关键字,不能够充分地拾取用户希望了解的检索结果。此时,即使用户想要添加其他检索关键字,在不知道相关词汇的情况下,也难以指定和添加合适的词作为检索关键字。
相反,在本实施例的检索方法的情况下,仅通过单击字符“校勘”附近的部分,即可自动提取符“校勘”附近的词汇,如“名词短语”或“表示现象”。一般,在语义上相关的词组在文档都靠得较近,因此选择词、如“校勘”、“名词短语”或“表示现象”会被选为检索关键字,由此可以实现精确的检索。由此,用户可以容易地获得检索结果,而无需知道词、如“校勘”、“名词短语”或“表示现象”是否在语义上相关,且不会遗漏想要的信息。
如上所述,利用本发明,通过以下方法检索信息:接收用户从检索源的电子字符信息指定的位置信息、指定用于从它的位置信息提取检索关键字的范围、然后从检索源的指定范围自动提取检索关键字。因此,用户只需在显示屏上的电子文档中指示要检索的信息部分,其效果是可以免除用户输入检索关键字的操作负担。
另外,不是从整个文档的相似性,而是从文档的部分范围提取检索关键字,因此即使该文档的检索源部分与整个文档的内容有不同的倾向,也可以输出高精度的检索结果。

Claims (12)

1.一种基于电子字符信息来检索信息的信息检索处理装置,所述装置包括:
输出装置;
接收装置,在输入用于在所述输出装置所显示的所述电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收所述位置信息;
指定装置,用于根据所述位置信息从所述输出装置上显示的所述电子字符信息指定检索关键字提取范围;以及
执行和输出装置,用于根据所指定的检索关键字提取范围执行所述信息检索并输出所述信息检索的结果。
2.如权利要求1所述的信息检索处理装置,其特征在于:所述指定装置将以下各种范围定义为所述检索关键字提取范围:包含所述位置信息之前、之后或前后预定数目的字符、词或行的范围;所述位置信息表示的段落的范围;或者包含所述位置信息的字符的由标点符号限定的范围。
3.如权利要求1所述的信息检索处理装置,其特征在于:在所述位置信息指定所述检索关键字的提取范围的起始位置和结束位置的情况下,所述指定装置将从所述起始位置到所述结束位置的输入范围定义为所述检索关键字提取范围。
4.如权利要求1所述的信息检索处理装置,其特征在于所述执行和输出装置还包括:
提取装置,用于从所述检索关键字提取范围提取一个或多个检索关键字;
信息检索数据库;以及
检索和输出装置,它利用所述一个或多个检索关键字检索所述信息检索数据库并输出所述信息检索的结果。
5.如权利要求1至3中任何一个所述的信息检索处理装置,其特征在于还包括:
条件设置装置,用于设定从所述位置信息指定所述检索关键字提取范围的提取条件,所述提取条件由用户输入。
6.如权利要求1所述的信息检索处理装置,其特征在于还包括:
输入装置,用于输入在所述输出装置所显示的所述电子字符信息中指定提取检索关键字的范围的所述位置信息,所述输入装置是指示装置。
7.一种基于电子字符信息来检索信息的信息检索处理方法,所述方法包括:
在输入用于在所述输出装置所显示的所述电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收所述位置信息;
根据所述位置信息从所述输出装置上显示的所述电子字符信息指定所述检索关键字提取范围;以及
根据所述指定的检索关键字提取范围执行所述信息检索以输出所述信息检索的结果。
8.如权利要求7所述的信息检索处理方法,其特征在于:所述指定步骤把以下各种范围定义为所述检索关键字提取范围:包含所述位置信息之前、之后或前后预定数目的字符、词或行的范围;所述位置信息表示的段落的范围;或者包含所述位置信息的字符的由标点符号限定的范围。
9.如权利要求7所述的信息检索处理方法,其特征在于:在所述位置信息指定所述检索关键字的提取范围的起始位置和结束位置的情况下,所述指定装置将从所述起始位置到所述结束位置的输入范围定义为所述检索关键字提取范围。
10.如权利要求7所述的信息检索处理方法,其特征在于所述执行步骤还包括:
从所述检索关键字提取范围提取一个或多个检索关键字;以及
利用所述一个或多个检索关键字检索所述信息检索数据库,以输出所述信息检索的结果。
11.如权利要求7至9中任何一个所述的信息检索处理方法,其特征在于还包括:
条件设置步骤,用来设定从所述位置信息指定所述检索关键字提取范围的提取条件,所述提取条件由用户输入。
12.一种记录基于电子字符信息来检索信息的信息检索处理程序的记录媒体,其特征在于所述程序使计算机执行以下步骤:
在输入用于在所述输出装置所显示的所述电子字符信息中指定提取检索关键字的范围的位置信息的情况下接收所述位置信息。
根据所述位置信息从所述输出装置上显示的所述电子字符信息指定检索关键字提取范围;以及
根据所述指定的检索关键字提取范围执行所述信息检索并输出所述信息检索的结果。
CN01145183A 2000-12-27 2001-12-27 信息检索处理装置和方法,记录信息检索程序的记录媒体 Pending CN1362681A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000396764A JP2002197104A (ja) 2000-12-27 2000-12-27 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP396764/00 2000-12-27

Publications (1)

Publication Number Publication Date
CN1362681A true CN1362681A (zh) 2002-08-07

Family

ID=18862001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01145183A Pending CN1362681A (zh) 2000-12-27 2001-12-27 信息检索处理装置和方法,记录信息检索程序的记录媒体

Country Status (3)

Country Link
US (1) US20020083045A1 (zh)
JP (1) JP2002197104A (zh)
CN (1) CN1362681A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100437561C (zh) * 2003-12-17 2008-11-26 国际商业机器公司 电子文档的处理方法和装置及其系统
CN102591897A (zh) * 2011-01-11 2012-07-18 株式会社东芝 文件检索装置以及文件检索方法
CN105592331A (zh) * 2015-12-16 2016-05-18 广州华多网络科技有限公司 一种弹幕消息的处理方法、相关设备和系统
CN111061925A (zh) * 2019-12-16 2020-04-24 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467137B1 (en) 1994-09-02 2008-12-16 Wolfe Mark A System and method for information retrieval employing a preloading procedure
US20030221163A1 (en) * 2002-02-22 2003-11-27 Nec Laboratories America, Inc. Using web structure for classifying and describing web pages
US20050149851A1 (en) * 2003-12-31 2005-07-07 Google Inc. Generating hyperlinks and anchor text in HTML and non-HTML documents
JP2006338142A (ja) * 2005-05-31 2006-12-14 Sharp Corp 電子書籍装置
JP4934355B2 (ja) * 2005-08-30 2012-05-16 株式会社ズー 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
JP5105802B2 (ja) * 2005-09-07 2012-12-26 株式会社リコー 情報処理装置
JP2007140803A (ja) * 2005-11-17 2007-06-07 Mitsubishi Electric Corp 文書管理システム
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
US20070219986A1 (en) * 2006-03-20 2007-09-20 Babylon Ltd. Method and apparatus for extracting terms based on a displayed text
JP2007257369A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 情報検索装置
JP5232449B2 (ja) * 2007-11-21 2013-07-10 Kddi株式会社 情報検索装置およびコンピュータプログラム
JP5384315B2 (ja) * 2009-08-04 2014-01-08 日本電信電話株式会社 検索装置及び方法及びプログラム
JP5295094B2 (ja) * 2009-12-28 2013-09-18 日立Geニュークリア・エナジー株式会社 情報参照支援システム
CN102004721A (zh) * 2010-11-10 2011-04-06 无敌科技(西安)有限公司 一种标示词汇习语的装置及方法
JP5752572B2 (ja) * 2011-11-24 2015-07-22 シャープ株式会社 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム
JP6119360B2 (ja) * 2013-03-26 2017-04-26 大日本印刷株式会社 参照情報提示システム、参照情報提示方法、サーバ、参照情報配信方法、及び、プログラム
EP2793103A1 (en) * 2013-04-17 2014-10-22 Advanced Digital Broadcast S.A. Method for operating a text input interface
CN105095231A (zh) * 2014-04-29 2015-11-25 阿里巴巴集团控股有限公司 一种呈现搜索结果的方法和装置
US9886461B1 (en) 2014-07-11 2018-02-06 Google Llc Indexing mobile onscreen content
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10055390B2 (en) 2015-11-18 2018-08-21 Google Llc Simulated hyperlinks on a mobile device based on user intent and a centered selection of text

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05181853A (ja) * 1992-01-07 1993-07-23 Hitachi Ltd 文書処理方式
JPH07129587A (ja) * 1993-11-08 1995-05-19 Canon Inc 文書処理装置及び方法
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
JPH1145252A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
JP3502553B2 (ja) * 1998-11-18 2004-03-02 日本電信電話株式会社 分散型文書検索装置
JP2000276485A (ja) * 1999-03-25 2000-10-06 Sharp Corp 電子辞書装置及び電子辞書プログラムを記録した記録媒体
US6341306B1 (en) * 1999-08-13 2002-01-22 Atomica Corporation Web-based information retrieval responsive to displayed word identified by a text-grabbing algorithm
US6345273B1 (en) * 1999-10-27 2002-02-05 Nancy P. Cochran Search system having user-interface for searching online information

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100437561C (zh) * 2003-12-17 2008-11-26 国际商业机器公司 电子文档的处理方法和装置及其系统
US8788494B2 (en) 2003-12-17 2014-07-22 International Business Machines Corporation Method, device and system for processing, browsing and searching an electronic documents
CN102591897A (zh) * 2011-01-11 2012-07-18 株式会社东芝 文件检索装置以及文件检索方法
CN105592331A (zh) * 2015-12-16 2016-05-18 广州华多网络科技有限公司 一种弹幕消息的处理方法、相关设备和系统
CN105592331B (zh) * 2015-12-16 2019-09-27 广州华多网络科技有限公司 一种弹幕消息的处理方法、相关设备和系统
CN111061925A (zh) * 2019-12-16 2020-04-24 珠海格力电器股份有限公司 联系人查找方法、装置、终端设备及可读存储介质

Also Published As

Publication number Publication date
US20020083045A1 (en) 2002-06-27
JP2002197104A (ja) 2002-07-12

Similar Documents

Publication Publication Date Title
CN1362681A (zh) 信息检索处理装置和方法,记录信息检索程序的记录媒体
US8073877B2 (en) Scalable semi-structured named entity detection
JP4857075B2 (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム
Lim et al. Multiple sets of features for automatic genre classification of web documents
JP5241828B2 (ja) 辞書の単語及び熟語の判定
JP4637181B2 (ja) 文書構造に基づいた検索結果の表示
US9367637B2 (en) System and method for searching a bookmark and tag database for relevant bookmarks
US9251208B2 (en) Information theory based result merging for searching hierarchical entities across heterogeneous data sources
KR20190062391A (ko) 전자 기록의 문맥 리트리벌을 위한 시스템 및 방법
US8510314B1 (en) Book content item search
US20150066934A1 (en) Automatic classification of segmented portions of web pages
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
JP2021529385A (ja) エンティティー間の関係の調査するためのシステム及び方法
US9043338B1 (en) Book content item search
US7203673B2 (en) Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents
Roy et al. Discovering and understanding word level user intent in web search queries
CN112035723A (zh) 资源库的确定方法和装置、存储介质及电子装置
WO2017000659A1 (zh) 一种富集化url的识别方法和装置
CN104778232A (zh) 一种基于长查询的搜索结果的优化方法和装置
Lim et al. Automatic genre detection of web documents
JPH117452A (ja) ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
Hast et al. Making large collections of handwritten material easily accessible and searchable
Mitocaru et al. The Lib2Life Platform-Processing, Indexing and Semantic Search for Old Romanian Documents.
Turcu et al. Towards a custom designed mechanism for indexing and retrieving video transcripts
Cunningham et al. Building heritage document collections for Pacific Island nations using semantic-enriched search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication