CN101794304B - 行业信息服务系统及方法 - Google Patents

行业信息服务系统及方法 Download PDF

Info

Publication number
CN101794304B
CN101794304B CN201010113039.6A CN201010113039A CN101794304B CN 101794304 B CN101794304 B CN 101794304B CN 201010113039 A CN201010113039 A CN 201010113039A CN 101794304 B CN101794304 B CN 101794304B
Authority
CN
China
Prior art keywords
keyword
information
vocabulary
search
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010113039.6A
Other languages
English (en)
Other versions
CN101794304A (zh
Inventor
朱定局
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changshu intellectual property operation center Co.,Ltd.
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201010113039.6A priority Critical patent/CN101794304B/zh
Publication of CN101794304A publication Critical patent/CN101794304A/zh
Application granted granted Critical
Publication of CN101794304B publication Critical patent/CN101794304B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种行业信息服务系统及方法,所述系统包括:前处理模块,对用户输入的信息进行处理,获取用户输入的信息的关键词集合;条件搜索模块,在预设条件词表中搜索所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴;信息匹配模块,根据所述条件搜索模块获取的关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息;映射输出模块,将所述信息匹配模块搜索得到的行业信息返回给用户。采用本发明,能自动提供给用户所需的行业信息,方便快捷,且能实现个性化服务。

Description

行业信息服务系统及方法
【技术领域】
本发明涉及信息处理技术领域,尤其涉及一种行业信息服务系统及方法。
【背景技术】
行业信息是指与某个行业相关的信息,如气象行业信息,包括某些时间某些地方的某些天气属性(如温度、湿度、污染度等);又如交通行业信息,包括某些时间某些地方的某些交通属性(如拥塞度、车流量等)。行业信息服务即是将用户想要的行业信息传递给用户。随着通信技术的发展,要求向用户提供行业信息服务越来越及时方便且具有个性化。
目前,信息服务的方式主要有三种:(1)用户以特定的代码和特定的顺序发送短消息给信息服务中心,信息服务中心将人工输入的预先设定好的行业信息回复给用户。例如,气象手机短息服务中,短信编辑11发送到10620121或通过短信编辑11+城市区号发送到10620121,信息服务中心则返回给用户该城市的气象信息。(2)用户拨打电话咨询信息服务中心时,根据语音提示按相应按键,听取事先设定好的与按键对应的信息,特殊咨询可按人工服务键。如,12121为天气预报热线,用户使用电话拨打12121后,根据语音提示音,按键选取听取所需要的信息,例如0对应全国各大城市天气预报,1对应市区24小时天气预报,2对应市区三日天气预报,3对应今日特别提醒,9为人工服务等。(3)用户打开信息服务网站,只能看到网站上事先设定好的信息,或只能在指定的省市下拉框中选择省市。而采用搜索的方式需要输入市名等,且搜索出来的是事先设定好的相应市区的行业信息。例如,登录http://www.weathersz.com/可以查看或搜索到深圳各区的气象信息。
由于上述几种方式都需要用户进一步的行为动作(如需要进一步按键、搜索等),无法自动提供给用户其所需的信息,不具有智能化;且返回给用户的信息是预先设定好的行业信息,无法实现个性化服务。
【发明内容】
基于此,有必要提供一种行业信息服务系统,能自动提供给用户所需的行业信息,方便快捷。
一种行业信息服务系统,所述系统包括:前处理模块,对用户输入的信息进行处理,获取用户输入的信息的关键词集合;条件搜索模块,在预设条件词表中搜索所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴,条件搜索模块在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配;信息匹配模块,根据所述条件搜索模块获取的关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息;映射输出模块,将所述信息匹配模块搜索得到的行业信息返回给用户;所述条件搜索模块包括:条件词表存储模块,存储包括时间词表、空间词表和行业信息属性词表的一种以上的条件词表;查找模块,从所述条件词表中查找所述关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到所述关键词集合中的关键词所属条件范畴;所述前处理模块包括:识别处理模块,用于识别用户输入的信息,将用户输入的信息转换为文本信息,所述输入信息包括语音、手写输入的文字和直接输入的文字中的至少一种;分词模块,对所述文本信息进行分词处理,获取所述文本信息中的关键词集合;所述识别处理模块还用于通过语音识别工具和手写识别工具将所述用户输入的信息转换为文本信息。
进一步优选地,所述条件搜索模块还包括:排序模块,统计查找模块从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。
优选地,所述信息匹配模块包括:行业信息表存储模块,用于存储包含时间限定字段、空间限定字段和行业信息属性字段的行业信息表;搜索语句生成模块,采用逻辑词将所述关键词集合及关键词所属条件范畴进行关联,生成搜索语句;搜索模块,利用所述搜索语句对行业信息表进行搜索,得到相应的行业信息。
优选地,所述映射输出模块进一步用于将所述信息匹配模块搜索得到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。
此外,还有必要提供一种行业信息服务方法,能自动提供给用户所需的行业信息,方便快捷。
一种行业信息服务方法,所述方法包括:对用户输入的信息进行处理,获取用户输入的信息的关键词集合;在预设条件词表中查找所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴,在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配;根据所述关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息;将所述搜索得到的行业信息返回给用户;所述方法还包括:预先设置包含时间词表、空间词表和行业信息属性词表的一种以上的条件词表;所述在预设条件词表中查找关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴的步骤具体是:从所述条件词表中查找所述关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到所述关键词集合中的关键词所述条件范畴;所述对用户输入的信息进行处理,获取用户输入的信息的关键词集合的步骤具体是:识别用户输入的信息,将用户输入的信息转换为文本信息,对所述文本信息进行分词处理,获取所述文本信息中的关键词集合;
所述输入信息包括语音、手写输入的文字和直接输入的文字中的至少一种;
所述将用户输入的信息转换为文本信息的步骤为:
通过语音识别工具和手写识别工具将所述用户输入的信息转换为文本信息。
优选地,所述方法还包括:预先设置包含时间词表、空间词表和行业信息属性词表的一种以上的条件词表;所述在预设条件词表中查找关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴的步骤具体是:从所述条件词表中查找所述关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到所述关键词集合中的关键词所述条件范畴。
进一步优选地,所述在预设条件词表中搜索关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴的步骤还包括:
统计从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。
优选地,所述方法还包括:将包含时间限定字段、空间限定字段和行业信息属性字段的行业信息表存储在行业信息库中;所述根据关键词所属条件范畴,从行业信息库中搜索得到与条件范畴匹配的行业信息的步骤具体是:采用逻辑词将所述关键词集合进行关联,生成搜索语句,利用所述搜索语句对行业信息表进行搜索,得到相应的行业信息。
优选地,所述将搜索得到的行业信息返回给用户的步骤具体是:将所述搜索得到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。
上述行业信息服务系统及方法,通过对用户输入的信息进行前处理,得到相应关键词,并搜索得到该关键词所属条件范畴,从而搜索得到对应的行业信息并返回给用户。当用户想要某一行业信息时,仅需一次输入信息,无需进一步按键或搜索就能自动得到所需的行业信息,方便快捷。得到用户想要的行业信息后可通过多种方式返回给用户,从而能为用户提供个性化服务。
【附图说明】
图1是一个实施例中行业信息服务系统的示意图;
图2是一个实施例中前处理模块的示意图;
图3是一个实施例中条件搜索模块的示意图;
图4是一个实施例中信息匹配模块的示意图;
图5是一个实施例中行业信息服务方法的流程图;
图6是一个实施例中前处理的方法流程图;
图7是一个实施例中根据关键词所属条件范畴匹配得到行业信息的流程图。
【具体实施方式】
图1示出了一个实施例中的行业信息服务系统,该系统包括前处理模块10、条件搜索模块20、信息匹配模块30和映射输出模块40,其中:
(1)前处理模块10用于对用户输入的信息进行处理,获取用户输入的信息的关键词集合。如图2所示,在一个实施例中,前处理模块10包括识别处理模块101和分词模块102,其中:
识别处理模块101用于识别用户输入的信息,将用户输入的信息转换为文本信息。用户可采用多种方式输入信息,例如语音、手写笔或直接输入文字。识别处理模块101可采用传统的语音识别工具(如IBM简体中文输入系统、固定电话语音识别软件等)和手写识别工具实现。例如,用户输入“今天下3点深圳南山西丽的温度和湿度是多少;动物园的温度和湿度是多少”的语音,则识别处理模块101将该语音转换为文本信息,即“今天下午3点深圳南山西丽的温度和湿度是多少;动物园的温度和湿度是多少”的文本格式,多个句子以句子集合表示。
分词模块102对该文本信息进行分词处理,获取文本信息中的关键词集合。该实施例中,可采用传统的分词工具对文本信息进行分词处理,例如爱博汉语分词系统、ChineseWordSeg、ICTCLAS中文分词系统等。如对上例中的“今天下午3点深圳南山西丽的温度和湿度是多少;动物园的温度和湿度是多少”进行分词处理后,得到关键词集合为“今天,下午,3点,深圳,南山,西丽,温度,湿度;动物园,温度,湿度”。
(2)条件搜索模块20用于在预设条件词表中搜索关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴。如图3所示,条件搜索模块20包括条件词表存储模块201和查找模块202,其中:
条件词表存储模块201用于存储条件词表。条件词表包括时间词表、空间词表和/或行业信息属性词表。时间词表包括一级时间词表、二级时间词表、三级时间词表等,具体需要几级时间词表可根据行业信息的时间复杂度来决定。例如,气象行业信息的时间词表可分为五级,一级时间词表为年词表,年词表中的词如“今年”、“明年”、“后年”、“2008年”、“2009年”等;二级时间词表为月词表,月词表中的词如“这个月”、“上个月”、“下个月”、“12月”、“11月”、“十二月”、“十一月”等;三级时间词表为日词表,日词表中的词如“今天”、“明天”、“昨天”、“12日”、“11日”、“十二日”、“十一日”等;四级时间词表为时词表,五级时间词表为分词表,以此类推。空间词表也可以分为一级空间词表、二级空间词表、三次空间词表等,具体需根据行业信息的空间复杂度决定。例如,一级空间词表为国词表,国词表中的词如“中国”、“美国”、“英国”等;二级空间词表可为省词表,省词表中的词如“广东”、“湖南”等;三级空间词表为市词表,市词表中的词如“深圳”、“广州”、“惠州”等;四级空间词表为区词表,区词表中的词如“南山区”、“罗湖区”、“天河区”等;五级空间词表可为街道词表,街道词表中的词如“学苑大道”、“南海大道”等;六级空间词表可为单位词表,以此类推。行业信息属性词表也包括一级属性词表、二级属性词表、三级属性词表等,同样的,也可根据行业信息的属性复杂度来决定。例如,气象行业信息的属性词表采用一级属性词表,该属性词表中的词如“气温”、“降水量”、“湿度”、“气压”、“日照时数”、“空间质量”等等。
在一个实施例中,上述时间词表、空间词表及行业信息属性词表包含两个字段,第一个字段为词字段,第二个字段为相应的值字段,词字段记录了上述词表中的词,值字段记录了该词对应的索引值,根据该索引值即可搜索到对应的行业信息内容。
查找模块202用于从条件词表中查找关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到关键词集合中的关键词所属条件范畴。这里的索引值是指对应该关键词具体的值,例如对应关键词“今年”的索引值则是“2009”,对应关键词“本月”的索引值可以是“12”等,今年是2009年,本月是12月。
在一个实施例中,在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,例如关键词“福田区”可与词表中的“福田”匹配。在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配,如关键词“技术”与已经查找得到的词表中的“深圳先进技术研究院”可匹配,这样可以避免重复查找词表。在查找时,各关键词可先与各一级词表(包括一级时间词表、一级空间词表、一级属性词表等)中的词进行匹配,在一级词表中没有匹配到相应的词时,可再到二级词表中进行匹配,如此类推。
在另一个实施例中,若一个句子的关键词集合匹配完成后,未查找到与一级时间词表(如年词表)匹配的关键词,则可增加关键词“今年”;若未查找到与二级时间词表(如月词表)匹配的关键词,则可增加关键词“本月”,如此类推。当然,一级时间词表不一定是年词表,而二级时间词表也一定是月词表,对于不同的行业信息可有所不同。在另一个实施例中,若一个句子的关键词集合匹配完成后,未查找到与各空间词表匹配的关键词,则可增加关键词“手机所在地”;若未查找到与各级属性词表匹配的关键词,则可增加属性关键词“常用属性”,方法原理与上述时间词表未匹配到相应关键词的过程相同。在另一个实施例中,若用户的一次问询包括多个句子,而下一个句子未查找到与各级时间词表匹配的关键词,则可将上一个句子中的时间关键词加入;若下一个句子未查找到与各级空间词表匹配的关键词,则可将上一个句子中的空间关键词加入;同理,若下一个句子未查找到与各级行业信息属性词表匹配的关键词,则可将上一个句子的属性关键词加入。另外,可在多个词表中同时查找一个关键词,进而可在多个词表中同时查找多个关键词,当在某一个词表中查找到该关键词时,则停止其他级别和类型的词表中对该关键词的查找。若一个空间关键词在多个同级词表中查找到(如重复的地名),则需根据已查找到的其它空间关键词所在的上级空间范畴来进行筛选,查找得到该关键词所在词表,同时可得到该关键词在词表中对应的索引值,如空间关键词在词表中对应的索引值可以为经纬度。
查找模块202根据查找到的条件词表中的关键词及索引值,则能得到用户输入的信息中的关键词所属条件范畴。例如,今天是2009年12月10日,用户输入的信息转换为文本信息并进行分词处理后,得到的关键词集合为“今天,下午,3点,深圳,南山,西丽,温度,湿度;动物园,温度,湿度”。查找模块202从条件词表中查找到上述关键词及对应的索引值如表1所示,应当说明的是,该表仅仅用于说明查找的过程及结果,查找模块202并不建立这样的表格。
表1
关键词 所属条件词表类型 索引值
今年 年词表 2009
本月 月词表 12
今天 日词表 11
下午 时段词表 12<value<18
3点 时词表 3
深圳 市词表 经纬度范围
南山 区词表 经纬度范围
西丽 镇词表 经纬度范围
温度 属性词表 温度的代码
湿度 属性词表 湿度的代码
今年 年词表 2009
本月 月词表 12
今天 日词表 11
上午 时段词表 0<value<12
3点 时词表 3
动物园 单位词表 经纬度范围
温度 属性词表 温度的代码
湿度 属性词表 湿度的代码
该实施例中,查找模块202查找得到的结果中,根据索引值即可找到相应的行业信息内容。
在另一个实施例中,条件搜索模块20还可包括排序模块203(图中未示出),排序模块203用于统计查找模块202从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。例如,查找到的关键词的次数越多,则该关键词的排序越靠前,由于查找条件词表时是依次进行查找的(例如从前至后),将查找到的次数越多的关键词靠前,即将最常用的关键词靠前,这样能够有效的缩短查找时间。
(3)信息匹配模块30用于根据条件搜索模块20获取的关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息。如图4所示,在一个实施例中,信息匹配模块30包括行业信息表存储模块301、搜索语句生成模块302和搜索模块303,其中:
行业信息表存储模块301用于存储行业信息表。行业信息表记录了行业信息,可包括时间限定字段、空间限定字段和行业信息属性字段等。如在气象行业中,其行业信息表可记录为年、月、日、时段、时点、经纬度、温度、湿度、污染度、日照等。应当说明的是,通常行业信息表中记录的行业信息是具体的数值或代码信息,依照行业自身的特性而有所不同。如上述气象行业信息表中,记录的是年、月、日、时段、时点、经纬度、温度、湿度、污染度、日照等的具体内容。
搜索语句生成模块302用于采用逻辑词将关键词集合进行关联,生成搜索语句。这里的逻辑词即“或(or)”、“和(and)”“且”等此类的逻辑词。在一个实施方式中,不同的句子可使用逻辑词“或”;同级时间关键词之间、同级空间关键词之间若没有“到”则使用逻辑词“或”;同级时间关键词之间、同级空间关键词之间若有“到”则使用逻辑词“大于xx且小于xx”;属性关键词之间可使用“或”,邻接的不同级时间关键词之间使用“且”;时段值的最小值与时点值相加作为时点值;邻接的不同级空间关键词中只选用最低级空间关键词对应的经纬度;时间关键词与空间关键词之间使用“且”。将时间关键词和空间关键词作为条件,将属性关键词作为要从行业信息表中搜索的字段。
例如,对用户输入的信息进行处理得到的关键词集合为:“今天,下午,3点,深圳,南山,西丽,温度,湿度;动物园,温度,湿度”。查找模块202所查找得到的结果如表1所示,搜索语句生成模块302用于根据查找的结果采用逻辑词将这些关键词关联得到的搜索语句则为:“select温度的代码and湿度的代码from气象行业信息表whereyear=2009andmonth=12andday=11and12<hour<18hour=12+3)and经纬度=深圳南山西丽的经纬度范围,andselect温度的代码and湿度的代码from气象行业信息表whereyear=2009andmonth=12andday=11and0<hour<12hour=0+3)and经纬度=深圳南山西丽动物园的经纬度范围”。
搜索模块303利用搜索语句对行业信息表进行搜索,得到相应的行业信息。如上述实施例中,搜索模块303采用上述语句对气象行业信息表进行搜索,根据相应的索引值(如2009、12、11等)搜索气象行业信息表中的内容,搜索的结果例如为“温度=24℃and湿度=80%”。搜索模块303可以同时对多个行业信息表进行搜索,一旦在其中一个表中搜索到,则停止该搜索语句在其他表中的搜索。在另一个实施例中,还会对搜索到的内容进行处理,例如,当根据上述搜索语句搜索到的符合上述条件的多个结果,包括多个温度和湿度,则可对温度和湿度取平均值作为搜索结果。
(4)映射输出模块40用于将信息匹配模块30搜索得到的行业信息返回给用户。为使适应不同的用户需求,映射输出模块40可将搜索到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。在一个实施例中,映射输出模块40将信息匹配模块30输出的结果映射为自然语言文本,将用户输入的信息转换得到的文本信息去掉“是多少”类似的词语,并在相应属性词后加上“是”和在行业信息表中搜索到的属性值,得到最终的输出结果。例如,根据用户输入的信息转换而得到的文本内容是“今天下3点深圳南山西丽的温度和湿度是多少;动物园的温度和湿度是多少”,则最终的输出结果是“今天下3点深圳南山西丽的温度和湿度是24℃;动物园的温度和湿度是80%”。
在一个实施方式中,当用户通过短信进行问询时,可将上述搜索得到的信息内容通过短信回复;当用户输入的是电话或手机或PC语音咨询时,则上述信息内容可先转换为语音信息再返回给用户;当用户是通过网络或3G手机上的网络或3G手机的其他能展示多媒体的方式输入信息,则将空间关键词映射为相应地理信息和图像,将时间显示为时钟种类的标志,将属性以行业惯用的方式展示(如气象行业中,下雨则用雨点表示),并附上行业其他附带信息(如气象动态云图等),也可附上一些商业信息(如与空间关键词、时间关键词或属性关键词相关的广告信息等),并将这些信息通过多媒体方式返回给用户。
图5示出了一个实施例中的行业信息服务方法,该方法具体过程如下:
在步骤S10中,对用户输入的信息进行处理,获取用户输入的信息的关键词集合。在一个实施例中,如图6所示,步骤S10具体过程如下:
在步骤S101中,识别用户输入的信息,将用户输入的信息转换为文本信息。用户可采用多种方式输入信息,例如语音、手写笔或直接输入文字。可采用传统的语音识别工具或手写识别工具等将用户输入的信息转换为文本信息。
在步骤S102中,对文本信息进行分词处理,获取文本信息中的关键词集合。该实施例中,可采用传统的分词工具对文本信息进行分词处理,例如爱博汉语分词系统、ChineseWordSeg、ICTCLAS中文分词系统等。
在步骤S20中,在预设条件词表中查找所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴。在一个实施例中,事先存储了条件词表,条件词表包括时间词表、空间词表和/或行业信息属性表等,各词表可根据复杂度分多级词表。每个词表中都包含两个字段,第一个字段为词字段,第二个字段为相应的值字段,词字段记录了上述词表中的词,值字段记录了该词对应的索引值,索引值是指对应该关键词具体的值,根据该索引值即可搜索到对应的行业信息内容。
在一个实施例中,在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,例如关键词“福田区”可与词表中的“福田”匹配。在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配,可以避免重复查找词表。在查找时,各关键词可先与各一级词表(包括一级时间词表、一级空间词表、一级属性词表等)中的词进行匹配,在一级词表中没有匹配到相应的词时,可再到二级词表中进行匹配,如此类推。根据查找到的条件词表中的关键词及索引值,则能得到用户输入的信息中的关键词所属条件范畴。查找得到的结果如表1所示。
在另一个实施例中,步骤S20还包括:统计从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。例如,查找到的关键词的次数越多,则该关键词的排序越靠前,由于查找条件词表时是依次进行查找的(例如从前至后),将查找到的次数越多的关键词靠前,即将最常用的关键词靠前,这样能够有效的缩短查找时间。
在步骤S30中,根据所述关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息。行业信息库中存储了行业信息表,行业信息表记录了行业信息,可包括时间限定字段、空间限定字段和行业信息属性字段等,通常行业信息表中记录的行业信息是具体的数值或代码信息,依照行业自身的特性而有所不同。在一个实施例中,如图7所示,步骤S30的具体过程如下:
在步骤S301中,采用逻辑词将所述关键词集合进行关联,生成搜索语句。这里的逻辑词即“或(or)”、“和(and)”“且”等此类的逻辑词。在一个实施方式中,不同的句子可使用逻辑词“或”;同级时间关键词之间、同级空间关键词之间若没有“到”则使用逻辑词“或”;同级时间关键词之间、同级空间关键词之间若有“到”则使用逻辑词“大于xx且小于xx”;属性关键词之间可使用“或”,邻接的不同级时间关键词之间使用“且”;时段值的最小值与时点值相加作为时点值;邻接的不同级空间关键词中只选用最低级空间关键词对应的经纬度;时间关键词与空间关键词之间使用“且”。将时间关键词和空间关键词作为条件,将属性关键词作为要从行业信息表中搜索的字段。
在步骤S302中,利用所述搜索语句对行业信息表进行搜索,得到相应的行业信息。例如,对气象行业信息表进行搜索,根据相应的索引值(如2009、12、11等)搜索气象行业信息表中的内容,搜索的结果例如为“温度=24℃and湿度=80%”。搜索模块303可以同时对多个行业信息表进行搜索,一旦在其中一个表中搜索到,则停止该搜索语句在其他表中的搜索。在另一个实施例中,还会对搜索到的内容进行处理,例如,当根据上述搜索语句搜索到的如何上述条件的多个结果,包括多个温度和湿度,则可对温度和湿度取平均值作为搜索结果。
在步骤S40中,将所述搜索得到的行业信息返回给用户。为使适应不同的用户需求,可将搜索到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。在一个实施例中,将搜索得到的结果映射为自然语言文本,将用户输入的信息转换得到的文本信息去掉“是多少”类似的词语,并在相应属性词后加上“是”和在行业信息表中搜索到的属性值,得到最终的输出结果。例如,根据用户输入的信息转换而得到的文本内容是“今天下3点深圳南山西丽的温度和湿度是多少;动物园的温度和湿度是多少”,则最终的输出结果是“今天下3点深圳南山西丽的温度和湿度是24℃;动物园的温度和湿度是80%”。
在一个实施方式中,当用户通过短信进行问询时,可将上述搜索得到的信息内容通过短信回复;当用户输入的是电话或手机或PC语音咨询时,则上述信息内容可先转换为语音信息再返回给用户;当用户是通过网络或3G手机上的网络或3G手机的其他能展示多媒体的方式输入信息,则将空间关键词映射为相应地理信息和图像,将时间显示为时钟种类的标志,将属性以行业惯用的方式展示(如气象行业中,下雨则用雨点表示),并附上行业其他附带信息(如气象动态云图等),也可附上一些商业信息(如与空间关键词、时间关键词或属性关键词相关的广告信息等),并将这些信息通过多媒体方式返回给用户。
上述行业信息服务系统及方法,通过对用户输入的信息进行前处理,得到相应关键词,并搜索得到该关键词所属条件范畴,从而搜索得到对应的行业信息并返回给用户。当用户想要某一行业信息时,仅需一次输入信息,无需进一步按键或搜索就能自动得到所需的行业信息,方便快捷。得到用户想要的行业信息后可通过多种方式返回给用户,从而能为用户提供个性化服务。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种行业信息服务系统,其特征在于,所述系统包括:
前处理模块,对用户输入的信息进行处理,获取用户输入的信息的关键词集合;
条件搜索模块,在预设条件词表中搜索所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴,条件搜索模块在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配;
信息匹配模块,根据所述条件搜索模块获取的关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息;
映射输出模块,将所述信息匹配模块搜索得到的行业信息返回给用户;
所述条件搜索模块包括:
条件词表存储模块,存储包括时间词表、空间词表和行业信息属性词表的一种以上的条件词表;
查找模块,从所述条件词表中查找所述关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到所述关键词集合中的关键词所属条件范畴;
所述前处理模块包括:
识别处理模块,用于识别用户输入的信息,将用户输入的信息转换为文本信息,所述输入信息包括语音、手写输入的文字和直接输入的文字中的至少一种;
分词模块,对所述文本信息进行分词处理,获取所述文本信息中的关键词集合;
所述识别处理模块还用于通过语音识别工具和手写识别工具将所述用户输入的信息转换为文本信息。
2.根据权利要求1所述的行业信息服务系统,其特征在于,所述条件搜索模块还包括:
排序模块,统计查找模块从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。
3.根据权利要求1所述的行业信息服务系统,其特征在于,所述信息匹配模块包括:
行业信息表存储模块,用于存储包含时间限定字段、空间限定字段和行业信息属性字段的行业信息表;
搜索语句生成模块,采用逻辑词将所述关键词集合及关键词所属条件范畴进行关联,生成搜索语句;
搜索模块,利用所述搜索语句对行业信息表进行搜索,得到相应的行业信息。
4.根据权利要求1或3所述的行业信息服务系统,其特征在于,所述映射输出模块进一步用于将所述信息匹配模块搜索得到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。
5.一种行业信息服务方法,所述方法包括:
对用户输入的信息进行处理,获取用户输入的信息的关键词集合;
在预设条件词表中查找所述关键词集合中的关键词,获取所述关键词集合中的关键词所属条件范畴,在条件词表中查找关键词集合中的关键词时,先进行模糊匹配,在查找时,可将关键词与已经查找得到的词表中的词进行模糊匹配;
根据所述关键词所属条件范畴,从行业信息库中搜索得到与所述条件范畴匹配的行业信息;
将所述搜索得到的行业信息返回给用户;
所述方法还包括:预先设置包含时间词表、空间词表和行业信息属性词表的一种以上的条件词表;所述在预设条件词表中查找关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴的步骤具体是:从所述条件词表中查找所述关键词集合中的关键词,根据所述条件词表中的关键词与索引值的对应关系,得到所述关键词集合中的关键词所述条件范畴;
所述对用户输入的信息进行处理,获取用户输入的信息的关键词集合的步骤具体是:
识别用户输入的信息,将用户输入的信息转换为文本信息,对所述文本信息进行分词处理,获取所述文本信息中的关键词集合;
所述输入信息包括语音、手写输入的文字和直接输入的文字中的至少一种;
所述将用户输入的信息转换为文本信息的步骤为:
通过语音识别工具和手写识别工具将所述用户输入的信息转换为文本信息。
6.根据权利要求5所述的行业信息服务方法,其特征在于,所述在预设条件词表中搜索关键词集合中的关键词,获取关键词集合中的关键词所属条件范畴的步骤还包括:
统计从条件词表中查找到的关键词的次数,根据查找到的关键词的次数对条件词表中的关键词进行排序。
7.根据权利要求5所述的行业信息服务方法,其特征在于,所述方法还包括:将包含时间限定字段、空间限定字段和行业信息属性字段的行业信息表存储在行业信息库中;所述根据关键词所属条件范畴,从行业信息库中搜索得到与条件范畴匹配的行业信息的步骤具体是:采用逻辑词将所述关键词集合进行关联,生成搜索语句,利用所述搜索语句对行业信息表进行搜索,得到相应的行业信息。
8.根据权利要求5或7所述的行业信息服务方法,其特征在于,所述将搜索得到的行业信息返回给用户的步骤具体是:
将所述搜索得到的行业信息转换为文本信息、语音信息、多媒体信息和盲文中的一种或两种以上,并将所述文本信息、语音信息、多媒体信息和/或盲文返回至用户。
CN201010113039.6A 2010-02-10 2010-02-10 行业信息服务系统及方法 Active CN101794304B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010113039.6A CN101794304B (zh) 2010-02-10 2010-02-10 行业信息服务系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010113039.6A CN101794304B (zh) 2010-02-10 2010-02-10 行业信息服务系统及方法

Publications (2)

Publication Number Publication Date
CN101794304A CN101794304A (zh) 2010-08-04
CN101794304B true CN101794304B (zh) 2016-05-25

Family

ID=42587003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010113039.6A Active CN101794304B (zh) 2010-02-10 2010-02-10 行业信息服务系统及方法

Country Status (1)

Country Link
CN (1) CN101794304B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411579B (zh) * 2010-09-20 2016-07-13 深圳市世纪光速信息技术有限公司 一种搜索行业相关信息的方法及装置
CN102622434B (zh) * 2011-12-31 2014-06-25 华为数字技术(成都)有限公司 数据存储方法、查找方法及装置
CN103092934A (zh) * 2013-01-07 2013-05-08 苏州海客科技有限公司 基于统计次数的行程单关键字获取方法
CN104281880A (zh) * 2013-07-05 2015-01-14 厦门市博维科技有限公司 能耗建模系统
CN104679492B (zh) * 2013-11-29 2018-08-28 国际商业机器公司 计算机实现的提供技术支持的设备和方法
CN104331771B (zh) * 2014-10-31 2018-07-06 单利峰 一站式小微企业服务外包管理系统
CN107704461B (zh) * 2016-07-26 2020-04-24 中国科学院自动化研究所 一种基于数据分析的智能路况信息检索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN101114295A (zh) * 2007-08-11 2008-01-30 腾讯科技(深圳)有限公司 检索在线广告资源的方法和装置
CN101178711A (zh) * 2006-11-30 2008-05-14 腾讯科技(深圳)有限公司 一种中文自动应答方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178711A (zh) * 2006-11-30 2008-05-14 腾讯科技(深圳)有限公司 一种中文自动应答方法及系统
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN101114295A (zh) * 2007-08-11 2008-01-30 腾讯科技(深圳)有限公司 检索在线广告资源的方法和装置

Also Published As

Publication number Publication date
CN101794304A (zh) 2010-08-04

Similar Documents

Publication Publication Date Title
CN101794304B (zh) 行业信息服务系统及方法
CN103294776B (zh) 一种智能手机通讯录模糊搜索的方法
US9317816B2 (en) Email optimization for predicted recipient behavior: suggesting changes that are more likely to cause a target behavior to occur
US9760542B1 (en) Providing context-sensitive writing assistance
Cidell Content clouds as exploratory qualitative data analysis
WO2017076205A1 (zh) 一种获取聊天发起句的回复提示内容的方法及装置
CN103268313B (zh) 一种自然语言的语义解析方法及装置
CN107145577A (zh) 地址标准化方法、装置、存储介质及计算机
CN103440311A (zh) 一种地名实体识别的方法及系统
CN110765753B (zh) 文案生成方法、系统、计算机设备和存储介质
CN101420313A (zh) 一种针对客户端用户群进行聚类的方法和系统
WO2015184013A1 (en) Suggesting changes in an email to increase the likelihood of an outcome
WO2021036439A1 (zh) 一种信访问题答复方法及装置
CN103678269A (zh) 一种信息处理方法和装置
CN103106287A (zh) 一种用户检索语句的处理方法及系统
CN107729549B (zh) 一种包含要素提取的机器人客服方法及系统
CN106874287A (zh) 一种兴趣点poi地址编码的处理方法及装置
CA3061788A1 (en) Electronic communication system with drafting assistant and method of using same
CN107967250A (zh) 一种信息处理方法及装置
CN108153875B (zh) 语料处理方法、装置、智能音箱和存储介质
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN102036198A (zh) 一种在短信内容中增加附加信息的方法及装置
CN112395885B (zh) 短文本语义理解模板生成方法、语义理解处理方法及装置
US20210319481A1 (en) System and method for summerization of customer interaction
CN108920500A (zh) 一种时间解析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201105

Address after: 518000 room 605, building 2, oceanwide city square, Qianhai Road, Nanshan street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: SHENZHEN BOSHI INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 1068 No. 518055 Guangdong city in Shenzhen Province, Nanshan District City Xili Road School of Shenzhen University

Patentee before: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201117

Address after: 215500 No.13, Caotang Road, Changshu, Suzhou, Jiangsu Province

Patentee after: Changshu intellectual property operation center Co.,Ltd.

Address before: 518000 room 605, building 2, oceanwide city square, Qianhai Road, Nanshan street, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN BOSHI INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 215500 5th floor, building 4, 68 Lianfeng Road, Changfu street, Changshu City, Suzhou City, Jiangsu Province

Patentee after: Changshu intellectual property operation center Co.,Ltd.

Address before: No.13 caodang Road, Changshu City, Suzhou City, Jiangsu Province

Patentee before: Changshu intellectual property operation center Co.,Ltd.