CN102880632A - 一种语用关键词检索方法与装置 - Google Patents
一种语用关键词检索方法与装置 Download PDFInfo
- Publication number
- CN102880632A CN102880632A CN2012102565661A CN201210256566A CN102880632A CN 102880632 A CN102880632 A CN 102880632A CN 2012102565661 A CN2012102565661 A CN 2012102565661A CN 201210256566 A CN201210256566 A CN 201210256566A CN 102880632 A CN102880632 A CN 102880632A
- Authority
- CN
- China
- Prior art keywords
- keyword
- pragmatic
- colon
- retrieval
- search key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 210000001072 colon Anatomy 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 22
- 230000008878 coupling Effects 0.000 claims description 16
- 238000010168 coupling process Methods 0.000 claims description 16
- 238000005859 coupling reaction Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 description 29
- 238000004590 computer program Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种语用关键词检索方法,用于实现语义关键词和语用关键词的区别检索,以满足在使用关键词检索时需要区分语义关键词和语用关键词的需求,达到提高关键字检索效率的目的。
Description
技术领域
本发明涉及计算机及通信领域,特别是涉及信息检索中语用关键词检索的方法及装置。
背景技术
搜索服务是组织互联网信息通讯的基本枢纽。但是,由于目前的全文关键字检索并未对检索关键词进行语义功能和语用功能区分,直接导致了检索效率低下。
例如:如果用户输入同一检索关键字词“NBA篮球比赛直播时间”,实际上存在着两种截然不同的应用功能需求。一种需求是想检索到与“NBA篮球比赛直播时间”相关的所有信息,这时,“时间”一词是揭示目标信息主题的“语义关键词”。另一种需求则是只想检索到NBA篮球比赛直播的具体时间,如“NBA篮球比赛直播:9-30-20:30”,这时,“时间”一词则是指示“9-30-20:30”等类似信息的功能与效用的语用关键词。显然,用户输入同一检索关键词的这两种不同应用功能需求,所指向的目标信息有巨大差别。并且,后一种检索需求的应用频率要远高于前一种需求。
由于现有搜索服务只做关键词字符匹配和按关键词命中率排序,不做语义关键词和语用关键词的区别检索,严重影响了全文关键字检索的效率与质量。因此,正确判别检索关键词是语用关键词还是语义关键词,实现语义关键词和语用关键词的区别检索,对改善信息检索效率具有重要应用价值。
本发明提供一种语用关键词检索方法,以提高关键字检索效率。
以下结合实施例进一步说明本发明。
图1:一种语用关键词检索主流程图
图2:语用关键词列表示意图
图3:一种语用关键词检索的附加流程图
图4:语用关键词固定搭配提示示意图
图5:一种语用关键词检索的附加流程图2
图6:相关装置结构图
发明内容
本发明实施例提供一种语用关键词检索方法,以提高关键字检索效率。
一种语用关键词检索方法,用于提高关键字检索效率,其包括以下步骤:
获取用户输入的检索关键词;
在检索关键词后添加冒号“:”或,先用检索关键词匹配语用关键字词表中的语用关键词,对匹配成功的关键词添加冒号;
用关键词紧跟冒号的固定搭配,或者,用紧跟冒号的语用关键词固定搭配匹配发布信息中的关键词;
如果匹配成功,则判别该语用关键词后是否有信息;
如果有,则调用并显示该语用关键词匹配成功的对应信息。
一种用于语用关键词检索装置,包括
语用关键字词典模块,用于存储可以具有语用功能的关键词;
匹配模块1,用于将用户输入的关键词匹配语用关键字词典中的语用关键词;
匹配模块2,用于语用关键词加冒号的固定搭配与发布信息关键词匹配;
接口模块,用于调用和显示匹配成功的语用关键词对应的信息。
具体实施方式
本发明中的“语用关键词”,是指指示主题词相关信息的功能与效用的关键词。其说明实例见背景技术介绍。
参见图1,本实施例提供语用关键词检索方法,其主要方法流程如下:
步骤101:获取用户输入的检索关键词;
步骤102:在检索关键词后添加标点符号冒号“:”或,先用检索关键词匹配语用关键字词表(见图表2)的语用关键词,匹配成功后再对该关键词添加冒号;
图2中的“语用关键词分类”用于语用关键词分类导航,图2中的“语用关键词”是统计语用关键词应用结果产生的语用关键词,并且该词表中仅收录可以有语用功能的关键词。
步骤103:用在关键词后紧跟冒号的关键词固定搭配匹配发布信息中的关键词;
大多数情况下,用户在发布语用关键词后会紧跟有冒号“:”,而检索关键词时则一般不会输入冒号,因此,在检索关键词后自动添加冒号进行检索,有助于判别发布信息中的关键词是语用关键词还是语义关键词。
但是,关键词紧跟冒号时有三种基本含义:一种是冒号前的关键词在表达信息;例如:“张三说:……”,或者,冒号后的内容是冒号前关键词的语义描述,例如:“NBA:‘美国职业篮球赛’的缩写”;或者,冒号前的关键字是冒号后内容的功能与效用指示词,例如:“NBA篮球比赛直播时间:9-30-20:30”中的“时间”。因此,仅自动添加冒号进行检索,效果仍不理想。
但是,并不是所有关键词都可以作为语用关键词使用,如大多数名词都不会作为语用关键词使用,因此,要想进一步判断用户发布的关键词是语义关键词还是语用关键词,除了判断关键词后是否紧跟冒号之外,还可以建立一个语用关键词词表,先用用户输入关键词匹配语用关键词表,匹配成功的关键词再添加冒号,以进一步提高判别用户输入的检索关键词是语用关键词还是语义关键词的效率。
步骤104:如果匹配成功,则判断该语用关键词后是否有信息;
步骤105:如果有,则调用并显示该语用关键词的对应信息。
由于语用关键词也可以作为语义关键词使用,并且语义关键词在文本中的出现频率要远高于语用关键词的出现频率,因此,如果语用关键词匹配成功,可不计算该文件中该关键词的出现频率,直接判别该语用关键词后是否有信息,以进一步提高语用关键词检索效率。
以上方法有助于区分同一检索关键词是语义关键词和语用关键词,再通过在检索结果中语用关键词优先排序等方法,可以提高关键字的目标信息检索效率。
以上步骤虽然可以改善关键词检索效率,但是,仍然不能明确判断用户输入的检索关键词是语义关键词还是语用关键词。因此,为了进一步提高关键词的检索效率,还可以加入以下步骤。
参见图3:进一步提高关键词匹配效率的方法,其步骤如下:
步骤301:获取用户输入的检索关键词;
步骤302:用检索关键词匹配语用关键字词表中的关键词(如图2);
步骤303:判断检索关键词匹配语用关键字词表中的关键词是否成功;
步骤304:如果成功,则在用户输入检索关键词时加入提示语,例如,加入提示语为“是否需要加冒号“:”、“加一个冒号试试”……,或者,将已加入冒号的语用关键词固定搭配直接显示在关键词检索的辅助提示框中(参见图4);
图4是提供检索服务时的人机交互输入界面示意图。该图的最上行为检索关键字输入栏,以下为检索关键词提示栏,检索关键词提示栏中的“产品说明:”是显示在关键词检索的辅助提示框中的语用关键词固定搭配示例。
步骤305:判断检索关键词是否添加了冒号,或,选用了紧跟冒号的关键词的;
步骤306:是,则将此关键词和冒号作为语用关键词固定搭配在发布信息的关键词中进行匹配;否,则将此关键词作为不区分语义、语用功能的关键字符号在发布信息的关键词中进行匹配。
步骤301-306在步骤101-105基础上,通过对用户输入关键字冒号的人机交互确认,更为明确地判断用户输入检索关键字需要的是语用功能还是语义功能,但是,由于语用关键词总是和指示检索主题的语义关键词搭配应用,在没有语义关键词匹配成功的前提下,语用关键词匹配成功将检索到大量信息,并且其实用价值并不大。
因此,为了更进一步提高关键词检索效率,还可以提供以下步骤:
(参见图4)
步骤401:在执行步骤101-105或301-306之前或后,判断用户输入的若干检索关键词中是否有其它关键词在同一文件中匹配成功;
步骤401中的“其它关键词”是指关键词检索中的语义主题词,如“NBA篮球比赛直播时间”中的“NBA篮球比赛”。
步骤402:如果有,则进一步执行步骤101-105或301-306,如果没有,则可以不再执行步骤101-105或301-306,或,将该关键词不区分语义和语用功能进行符号匹配检索。
本发明通过以上步骤可以有效区分关键词检索中的语义关键词检索和语用关键词检索,对提高信息检索效率具有明确而显著的作用。
一种用于语用关键词和标点符号的组合检索装置(参见图5),包括
语用关键字词典模块,用于存储可以具有语用功能的关键词;
匹配模块1,用于将用户输入的关键词匹配语用关键字词典中的语用关键词;
匹配模块2,用于语用关键词加冒号的固定搭配与发布信息关键词匹配;
接口模块,用于调用和显示匹配成功的语用关键词对应的信息。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种语用关键词检索方法,其特征在于,包括以下步骤:
获取用户输入的检索关键词;
在检索关键词后添加冒号“:”或,先用检索关键词匹配语用关键字词表中的语用关键词,对匹配成功的关键词添加冒号;
用关键词紧跟冒号的固定搭配,或者,用紧跟冒号的语用关键词固定搭配匹配发布信息中的关键词;
如果匹配成功,则判别该语用关键词后是否有信息;
如果有,则调用并显示该语用关键词匹配成功的对应信息。
2.根据权利要求1的一种语用关键词检索方法,其特征在于,包括以下步骤:
获取用户输入的检索关键词;
用检索关键词匹配语用关键字词表中的关键词;
判断检索关键词匹配语用关键字词表中的关键词是否成功;
如果成功,则在用户输入检索关键词时加入提示语,或者,将已加入冒号
的语用关键词直接显示在关键词检索的辅助提示框中;
判断检索关键词是否添加或选用了紧跟关键词的冒号;
是,则将此关键词和冒号作为语用关键词固定搭配在发布信息中进行匹配;否,则将此关键词作为不区分语义、语用功能的关键字进行模糊检索。
3.根据权利要求1和2的一种语用关键词检索方法,其特征在于,包括以下步骤:
在执行步骤101-105或301-306之前或后,判断用户输入的若干检索关键词中是否有其它关键词在同一文件中匹配成功;
如果有,则进一步执行步骤101-105或301-306,如果没有,则将该关键词不区分语义和语用功能进行符号匹配检索。
4.根据权利要求1的一种语用关键词检索的装置,其特征在于,包括语用关键字词典模块、匹配模块1、匹配模块2、接口模块。
5.根据权利要求4的一种语用关键词检索的装置,其特征在于,其语用关键字词典模块用于存储可以具有语用功能的关键词。
6.根据权利要求4的一种语用关键词检索的装置,其特征在于,匹配模块1用于将用户输入的关键词匹配语用关键字词典中的语用关键词。
7.根据权利要求4的一种语用关键词检索的装置,其特征在于,匹配模块2用于语用关键词加冒号的固定搭配与发布信息关键词匹配。
8.根据权利要求4的一种语用关键词检索的装置,其特征在于,接口模块用于调用和显示匹配成功的语用关键词对应的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210256566.1A CN102880632B (zh) | 2012-07-24 | 2012-07-24 | 一种语用关键词检索方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210256566.1A CN102880632B (zh) | 2012-07-24 | 2012-07-24 | 一种语用关键词检索方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102880632A true CN102880632A (zh) | 2013-01-16 |
CN102880632B CN102880632B (zh) | 2016-02-24 |
Family
ID=47481958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210256566.1A Active CN102880632B (zh) | 2012-07-24 | 2012-07-24 | 一种语用关键词检索方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102880632B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970848A (zh) * | 2014-05-01 | 2014-08-06 | 刘莎 | 一种通用型互联网信息数据挖掘方法 |
CN107729082A (zh) * | 2017-10-12 | 2018-02-23 | 深圳盈诺德信息技术有限公司 | 企业资源计划的功能模块的调用方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102053993A (zh) * | 2009-11-10 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种文本过滤方法及文本过滤系统 |
US20110208731A1 (en) * | 2010-02-19 | 2011-08-25 | The Go Daddy Group, Inc. | Automated semantic domain spinning tools |
CN102193994A (zh) * | 2011-04-22 | 2011-09-21 | 武汉大学 | 一种根据用户非功能性需求搜索Web服务的方法 |
CN102436495A (zh) * | 2011-11-14 | 2012-05-02 | 百度在线网络技术(北京)有限公司 | 一种提供动态搜索页面的方法及其装置 |
-
2012
- 2012-07-24 CN CN201210256566.1A patent/CN102880632B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102053993A (zh) * | 2009-11-10 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种文本过滤方法及文本过滤系统 |
US20110208731A1 (en) * | 2010-02-19 | 2011-08-25 | The Go Daddy Group, Inc. | Automated semantic domain spinning tools |
CN102193994A (zh) * | 2011-04-22 | 2011-09-21 | 武汉大学 | 一种根据用户非功能性需求搜索Web服务的方法 |
CN102436495A (zh) * | 2011-11-14 | 2012-05-02 | 百度在线网络技术(北京)有限公司 | 一种提供动态搜索页面的方法及其装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970848A (zh) * | 2014-05-01 | 2014-08-06 | 刘莎 | 一种通用型互联网信息数据挖掘方法 |
CN103970848B (zh) * | 2014-05-01 | 2016-05-11 | 刘莎 | 一种通用型互联网信息数据挖掘方法 |
CN107729082A (zh) * | 2017-10-12 | 2018-02-23 | 深圳盈诺德信息技术有限公司 | 企业资源计划的功能模块的调用方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102880632B (zh) | 2016-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102024064B (zh) | 快速搜索方法和移动通信终端 | |
CN102629160B (zh) | 一种输入法、输入装置及终端 | |
CN101526879A (zh) | 设备上的语言输入接口 | |
TW200925937A (en) | Inquiry-oriented user input apparatus and method | |
WO2008145055A1 (fr) | Procédé pour obtenir une information de mot de restriction et pour optimiser le système du procédé d'entrée et de sortie | |
CN110325987B (zh) | 语境语音驱动深度书签 | |
CN102591475A (zh) | 一种在线编辑器的内容输入方法及系统 | |
CN102591880A (zh) | 信息提供方法及装置 | |
US10073828B2 (en) | Updating language databases using crowd-sourced input | |
CN103123624A (zh) | 确定中心词的方法及装置、搜索方法及装置 | |
CN103092943A (zh) | 一种广告调度的方法和广告调度服务器 | |
WO2013127319A1 (en) | Method and apparatusfor text searching on a touchterminal | |
EP2963565A1 (en) | Method and apparatus for processing input information | |
WO2024036616A1 (zh) | 一种基于终端的问答方法及装置 | |
CN102567441A (zh) | 提供与用户会话相关的情境提示 | |
CN103778124A (zh) | 一种树形结构查询方法及装置 | |
CN102902711A (zh) | 一种语用关键词通用模板的生成、应用方法与装置 | |
CN101571874A (zh) | 一种手机信息搜索排序系统 | |
CN103631784B (zh) | 页面内容检索方法和系统 | |
CN103218155A (zh) | 操作启动系统与方法 | |
WO2022105754A1 (zh) | 输入文字的方法、装置和电子设备 | |
CN102142030B (zh) | 一种数据搜索方法和数据搜索装置 | |
CN102880632A (zh) | 一种语用关键词检索方法与装置 | |
CN109783612A (zh) | 报表数据定位方法及装置、存储介质、终端 | |
CN103020209A (zh) | 一种广告信息投放的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160725 Address after: 400041 Chongqing Jiulongpo Yuzhou Road No. 132 unit 5 No. 20-4 Patentee after: Chongqing city in the Information Technology Co., Ltd. Address before: 400041 Chongqing Jiulongpo Yuzhou Road No. 132 of No. 5 20-4 Patentee before: Liu Sha |