CN103186569A - 一种需求识别方法及需求识别系统 - Google Patents
一种需求识别方法及需求识别系统 Download PDFInfo
- Publication number
- CN103186569A CN103186569A CN2011104488006A CN201110448800A CN103186569A CN 103186569 A CN103186569 A CN 103186569A CN 2011104488006 A CN2011104488006 A CN 2011104488006A CN 201110448800 A CN201110448800 A CN 201110448800A CN 103186569 A CN103186569 A CN 103186569A
- Authority
- CN
- China
- Prior art keywords
- requirement
- data container
- dictionary
- file
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012545 processing Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 12
- 230000000593 degrading effect Effects 0.000 claims description 5
- 230000000717 retained effect Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 9
- 238000006731 degradation reaction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明提供了一种需求识别方法及需求识别系统,其中方法包括:系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;获取待识别搜索项(query);遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对所述待识别query进行需求识别,直至遍历完毕;输出识别结果。本发明采用统计的需求识别框架,无需针对每一需求类型均写一遍代码,节约了人力资源,提高了效率。
Description
【技术领域】
本发明涉及计算机技术领域,特别涉及一种需求识别方法及需求识别系统。
【背景技术】
随着互联网在全球范围内的迅速发展与成熟,网络上的信息资源不断丰富,信息数据量也在飞速膨胀,通过搜索引擎获取信息已经成为现代人获取信息的主要方式。为了向用户提供更加便捷、准确地查询服务是搜索引擎技术在当今和未来的发展方向。在搜索引擎技术中,对用户的搜索需求进行识别是提高搜索准确性和有效性的重要一环,特别在结构化搜索(即垂直搜索)中作用显著。
现有需求识别的方式中,不同需求类型采用的需求识别方式不完全相同,例如各需求类型均采用了精确识别方式和模板匹配方式结合的具体处理方式,但在进行预处理或退场降级时可能会采用不同的处理方式,这就需要分别针对各需求识别方式编写代码,但往往不同需求类型的识别方式中具体的处理方式会存在重叠,例如采用了相同的精确识别方式或模板匹配方式,其中也可能存在相同的词典,如果每一个需求识别方式都人工的编写一遍代码显然十分耗费人力资源。例如,如果存在20类需求类型,平均每个需求类型中的需求识别方式包含3个具体的处理方式和词典,则需要人工编写60个处理方式和词典的代码,工作量很大,效率也十分低下。
【发明内容】
本发明提供了一种需求识别方法及需求识别系统,以便于节约人力资源,提高效率。
具体技术方案如下:
一种需求识别方法,该方法包括:
S1、系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
S2、获取待识别搜索项query;
S3、遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对所述待识别query进行需求识别,直至遍历完毕;
S4、输出所述步骤S3的识别结果。
根据本发明一优选实施例,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
根据本发明一优选实施例,所述步骤S1具体包括:
S11、系统启动时,加载配置文件至内存;
S12、从所述配置文件中解析出各需求类型的识别方式和采用的词典;
S13、根据步骤S12的识别结果加载词典文件。
根据本发明一优选实施例,所述步骤S11具体为:系统启动时,在内存中创建一个数据容器,将配置文件中的各需求类型分别作为所述数据容器的一个节点进行存储;
所述步骤S13为在所述数据容器的各节点读入对应需求类型的词典文件;
步骤S3中遍历所述各需求类型为:遍历所述数据容器中的各节点。
根据本发明一优选实施例,该方法还包括:
如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为所述新的数据容器的节点进行存储,并对于未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入所述新的数据容器的对应节点;
获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至所述新的数据容器。
根据本发明一优选实施例,待所有线程的待识别query都切换至所述新的数据容器时,释放原来的数据容器;
所述释放原来的数据容器具体为:保留被所述新的数据容器复用的内容,删除未被所述新的词典文件复用的内容。
一种需求识别系统,该系统包括:
启动配置单元,用于在系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
输入单元,用于获取待识别搜索项query;
识别遍历单元,用于遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对所述待识别query进行需求识别,直至遍历完毕;
输出单元,用于输出所述识别遍历单元的识别结果。
根据本发明一优选实施例,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
根据本发明一优选实施例,所述启动配置单元具体包括:
文件加载子单元,用于在系统启动时加载配置文件至内存;
文件解析子单元,用于从所述配置文件中解析出各需求类型的识别方式和采用的词典;
词典加载子单元,用于根据所述文件解析子单元的识别结果加载词典文件。
根据本发明一优选实施例,所述文件加载子单元在系统启动时,具体在内存中创建一个数据容器,将配置文件中的各需求类型分别作为所述数据容器的一个节点进行存储;
所述词典加载子单元在加载词典文件时具体在所述数据容器的各节点读入对应需求类型的词典文件;
所述识别遍历单元在遍历所述各需求类型时,具体遍历所述数据容器中的各节点。
根据本发明一优选实施例,该系统还包括:
更新处理单元,用于如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为所述新的数据容器的节点进行存储,并对未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入所述新的数据容器的对应节点;
所述识别遍历单元,还用于在所述输入单元获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至所述新的数据容器。
根据本发明一优选实施例,该系统还包括:更新释放单元,用于待所有线程的待识别query都切换至所述新的数据容器时,释放原来的数据容器,具体为:保留被所述新的数据容器复用的内容,删除未被所述新的词典文件复用的内容。
由以上技术方案可以看出,本发明只需要将识别方式中具体的处理方式作为需求识别函数写一次代码进行存储,配置文件中指明各需求类型采用的识别方式和词典,在进行需求识别时再调用存储的需求识别函数,显然相比较现有技术中针对每一需求类型均写一遍代码的方式,节约了人力资源,提高了效率,特别在需求类型数量和识别方式的具体处理方式数量较大时,效果尤其明显。
【附图说明】
图1为本发明实施例一提供的需求识别方法流程图;
图2为本发明实施例一提供的需求识别流程的一个实例图;
图3为本发明实施例二提供的词典更新的方法流程图;
图4为本发明实施例三提供的需求识别系统的结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
通过对一系列的需求识别项目的观察和研究发现,不同的需求类型的识别方式之间重叠的具体处理方式可以达到左右,以数量较多的需求类型而言,重叠率甚至更高,并且不同需求类型的识别方式的套路基本相同,因此在本发明中采用了一个统一的框架来实现不同需求类型的需求识别,下面通过实施例一对本发明提供的需求识别方法进行详细描述。
实施例一、
图1为本发明实施例一提供的需求识别方法流程图,如图1所示,该方法可以包括以下步骤:
步骤101:系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典。
在本发明实施例中预先将各需求类型的识别方式和采用的词典配置在配置文件中,也就是说,在配置文件中指示出各需求类型的识别方式和采用的词典,但具体的识别方式的需求识别函数和词典文件并不在配置文件中。
配置文件的格式本发明并不加以限制,任意能够指示出各需求类型的识别方式和采用的词典的形式均可以使用,在实施例中以键-值(key-value)方式保存配置文件中的内容。
配置文件通常由若干节点构成,每个节点代表一个需求类型,每个节点包含一个需求类型标识(ID)用于标记需求类型,每个节点中还可以包括其他的属性,例如该需求类型使用的识别方式ID和词典ID。本发明并不限制标识方式,可以采用诸如:编号、名称、指针等任意方式。
其中,需求类型对应的识别方式可以包括但不限于:精确匹配方式和模板匹配方式中的一种或组合,除此之外,还可以进一步包括:预处理方式、降级退场方式和补充处理方式等中的一种或任意组合。
所谓精确匹配方式是预先挖掘出具有对应需求类型的query构成精确query列表,将待识别query与精确query列表进行匹配,将命中精确query列表中的query对应的需求类型作为待识别query的需求类型。
所谓模板匹配方式是预先挖掘出具有对应需求类型的模板,将待识别query与各模板进行匹配,将匹配到的模板对应的需求类型作为待识别query的需求类型。还可以根据匹配到的模板具有的置信度确定待识别query在各需求类别上的需求强度。
所谓预处理方式是对待识别query在精确匹配和模式匹配之前进行的预处理,包括但不限于:去除多余的符号、大小写转换等处理。
所谓降级退场方式是对待识别query识别出的在某类需求上的需求强度进行降级或者去除的处理。例如,待识别query“步步惊心”识别为在小说类需求上具有强需求,降级是将强需求降为弱需求,退场是将强需求改为没有需求。降级退场方式可以理解为对需求识别结果的一种打补丁的措施。
所谓补充处理方式通常是对违反国家法律法规等的特殊query进行的识别,例如对黄反、色情类query进行的识别。
以上具体的识别方式可以采用现有方式,在此不再具体详述,配置文件所采用的上述识别方式及对应词典的key-value和功能实例可以如表1中所示。
表1
配置文件所采用具体识别方式是可扩展的,即key的数量以及对应value的数量是可扩展的。
下面举一个配置文件的具体实例,假设存在两个需求类型,ID分别是4和12,对应配置文件内容如下所示:
本步骤在具体执行时,系统启动后加载配置文件至内存,从配置文件中解析出各需求类型的识别方式和采用的词典后,根据识别结果加载词典文件。
具体地,在系统启动时,可以首先在内存中创建一个数据容器,将配置文件中的各需求类型分别作为该数据容器的一个节点进行存储,解析出各需求类型的识别方式和采用的词典后,在各节点读入对应需求类型的词典文件(识别方式对应的函数和词典文件通常是存储在硬盘中的,在系统启动后会将词典文件从硬盘读入内存,从而提高处理效率)。然后返回该数据容器的起点以备后续对待识别query进行需求识别时对各节点进行遍历。
步骤102:获取待识别query。
步骤103:遍历各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对待识别query进行需求识别,直至遍历完毕。
从创建的数据容器的起点开始逐一对各节点进行遍历,对遍历到的节点调用该节点的识别方式对应的需求识别函数以及该节点所读入的词典文件对待识别query进行需求识别。具体如何利用需求识别函数以及词典对query进行需求识别为已知技术,本发明不进行赘述,在此仅举一个具体的实例,参见图2。
如图2中所示,遍历数据容器的各节点,根据当前遍历到的节点调用该节点的识别方式对应的需求识别函数以及该节点所读入的词典进行需求识别,例如对query进行预处理后,首先利用精确匹配词典和精确匹配函数对query进行精确匹配,再利用模板匹配词典和模板匹配函数对query进行模板匹配,对利用匹配结果确定的需求识别结果集合降级退场词典进行降级退场处理,最后利用补充处理词典和补充处理函数对待识别query进行补充处理,完成当前遍历到的节点对应的需求类型的识别,如果数据容器中存在下一节点,则遍历下一节点,直至遍历完毕。
步骤104:输出步骤103的识别结果。
本步骤输出的可以是待识别query在各需求识别类型上是否具有需求,或者在各需求识别类别上的需求强度等。
举个例子,假设输入的待识别query为“刘德华图片”,配置文件中具有两类需求识别类型,即图片类和视频类,分别按照上述流程进行识别,假设在图片需求类型的识别过程中,预处理时删除空格,待识别query变为“刘德华图片”,精确匹配时无匹配结果,继续模板匹配,命中模板,降级退场处理无命中,补充处理也无命中,从而得到该待识别query具有图片类需求。假设在视频需求类型的识别过程中,预处理时删除空格,待识别query变为“刘德华图片”,精确匹配时无匹配结果,继续模板匹配,无匹配结果,降级退场处理无命中,补充处理也无命中,从而得到该待识别query不具有视频类需求。最终输出的识别结果为:“刘德华图片”具有图片类需求。
在系统运行过程中可能会存在词典文件更新的情况,如果重新加载并解析配置文件则会影响正在进行的query识别,为了解决这一问题,本发明可以采用一种双缓冲机制来进行词典文件的更新,下面通过实施例二进行详细描述。
实施例二、
图3为本发明实施例二提供的词典更新的方法流程图,如图3所示,该方法包括以下步骤:
步骤301:检测到词典文件更新。
此处的词典文件更新可以通过内存数据容器中词典文件的时间戳和硬盘中词典文件的时间戳是否一致来检测,如果硬盘中词典文件进行了更新,则硬盘中词典文件的时间戳与内存数据容器中词典文件的时间戳就会不一致,从而检测到词典文件进行了更新。当然也可以采用其他检测方式,比如词典文件发生更新后会主动通知系统等方式,本发明并不对此检测方式进行限制。
步骤302:在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为新的数据容器的节点进行存储。
为了不影响正在进行的query需求识别,保留原来数据容器不变的同时,在内存中再创建一个新的数据容器,该数据容器的节点与原来数据容器的节点一致,都是配置文件中的各需求类型。
步骤303:在新的数据容器中,对于未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入新的数据容器的对应节点。
为了尽量小地对系统性能产生影响,在该数据容器中仅将更新后的词典文件读入新的数据容器的对应节点,对于其他未更新的内容则复用原来的数据容器中的内容,复用方式可以采用指针的方式指向原来的数据容器中对应的内容。
步骤304:获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至新的数据容器。
对于正在识别中的query进行需求识别时继续采用原来的数据容器,对于新接收到的待识别query,如果此时已经存在两个数据容器,则切换至新的数据容器进行实施例一所示的需求识别过程。
步骤305:待所有线程的待识别query都切换至新的数据容器时,释放原来的数据容器。
在有些系统中会采用一个以上的线程进行需求识别,每个线程分别负责不同的待识别query,因此需要针对每一个线程都进行步骤304所述的切换过程,当所有线程的待识别query都切换至新的数据容器时,原来的数据容器就可以释放了。
在释放原来的数据容器时,由于存在一些内容是被新的数据容器所复用的,因此需要保留被新的数据容器复用的内容,删除未被新的词典文件复用的内容。
以上是对本发明所提供的方法进行的详细描述,下面通过实施例三对本发明所提供的需求识别系统进行详细描述。
实施例三、
图4为本发明实施例三提供的需求识别系统的结构图,如图4所示,该系统包括:启动配置单元400、输入单元410、识别遍历单元420和输出单元430。
启动配置单元400在系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典。
在本发明实施例中预先将各需求类型的识别方式和采用的词典配置在配置文件中,也就是说,在配置文件中指示出各需求类型的识别方式和采用的词典,但具体的识别方式的函数和词典文件并不在配置文件中。
配置文件通常由若干节点构成,每个节点代表一个需求类型,每个节点包含一个需求类型标识(ID)用于标记需求类型,每个节点中还可以包括其他的属性,例如该需求类型使用的识别方式ID和词典ID。本发明并不限制标识方式,可以采用诸如:编号、名称、指针等任意方式。
其中,需求类型对应的识别方式可以包括但不限于:精确匹配方式和模板匹配方式中的一种或组合,除此之外,还可以进一步包括:预处理方式、降级退场方式和补充处理方式等中的一种或任意组合。
具体地,启动配置单元400可以包括:文件加载子单元401、文件解析子单元402以及词典加载子单元403。
文件加载子单元401在系统启动时加载配置文件至内存。具体地,可以在内存中创建一个数据容器,将配置文件中的各需求类型分别作为数据容器的一个节点进行存储。
文件解析子单元402从配置文件中解析出各需求类型的识别方式和采用的词典。
词典加载子单元403根据文件解析子单元402的识别结果加载词典文件。具体地,在加载词典文件时在数据容器的各节点读入对应需求类型的词典文件。
输入单元410获取待识别搜索项query。
识别遍历单元420遍历各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对待识别query进行需求识别,直至遍历完毕。
输出单元430输出识别遍历单元420的识别结果。
针对系统运行过程中的词典文件更新情况,为了避免重新加载并解析配置文件对正在进行的query识别产生的影响,可以采用一种双缓冲机制来进行词典文件的更新,即该系统还可以包括:更新处理单元440。
更新处理单元440如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为新的数据容器的节点进行存储,并对未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入新的数据容器的对应节点。
此时,识别遍历单元420还用于在输入单元410获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至新的数据容器。
在有些系统中会采用一个以上的线程进行需求识别,每个线程分别负责不同的待识别query,因此需要针对每一个线程都进行切换处理,当所有线程的待识别query都切换至新的数据容器时,原来的数据容器就可以释放了。
此时该系统还可以包括:更新释放单元450,用于待所有线程的待识别query都切换至新的数据容器时,释放原来的数据容器,具体为:保留被新的数据容器复用的内容,删除未被新的词典文件复用的内容。
由以上描述可以看出,本发明提供的方法和系统可以具有以下优点:
1)本发明只需要将识别方式中具体的处理方式写一次代码进行存储,配置文件中指明各需求类型采用的识别方式和词典,在进行需求识别时再调用存储的具体处理方式,显然相比较现有技术中针对每一需求类型均写一遍代码的方式,节约了人力资源,提高了效率,特别在需求类型数量和识别方式的具体处理方式数量较大时,效果尤其明显。
2)本发明采用了一套统一的框架适用于所有需求类型,在该框架中程序与数据隔离,增加和修改需求类型时仅需要在配置文件中指明该需求类型所采用的识别方式和词典即可,不需要针对增加或修改的需求类型重新写一遍代码,也无需修改程序,方便对需求识别类型的扩展。
3)本发明中采用的双缓冲机制的词典文件更新方式,减小了词典文件更新对正在进行的query识别所造成的影响以及对系统性能造成的影响。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (12)
1.一种需求识别方法,其特征在于,该方法包括:
S1、系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
S2、获取待识别搜索项query;
S3、遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型所采用的词典对所述待识别query进行需求识别,直至遍历完毕;
S4、输出所述步骤S3的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
3.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
S11、系统启动时,加载配置文件至内存;
S12、从所述配置文件中解析出各需求类型的识别方式和采用的词典;
S13、根据步骤S12的识别结果加载词典文件。
4.根据权利要求3所述的方法,其特征在于,所述步骤S11具体为:系统启动时,在内存中创建一个数据容器,将配置文件中的各需求类型分别作为所述数据容器的一个节点进行存储;
所述步骤S13为在所述数据容器的各节点读入对应需求类型的词典文件;
步骤S3中遍历所述各需求类型为:遍历所述数据容器中的各节点。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为所述新的数据容器的节点进行存储,并对于未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入所述新的数据容器的对应节点;
获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至所述新的数据容器。
6.根据权利要求5所述的方法,其特征在于,待所有线程的待识别query都切换至所述新的数据容器时,释放原来的数据容器;
所述释放原来的数据容器具体为:保留被所述新的数据容器复用的内容,删除未被所述新的词典文件复用的内容。
7.一种需求识别系统,其特征在于,该系统包括:
启动配置单元,用于在系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
输入单元,用于获取待识别搜索项query;
识别遍历单元,用于遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型所采用的词典对所述待识别query进行需求识别,直至遍历完毕;
输出单元,用于输出所述识别遍历单元的识别结果。
8.根据权利要求7所述的系统,其特征在于,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
9.根据权利要求7所述的系统,其特征在于,所述启动配置单元具体包括:
文件加载子单元,用于在系统启动时加载配置文件至内存;
文件解析子单元,用于从所述配置文件中解析出各需求类型的识别方式和采用的词典;
词典加载子单元,用于根据所述文件解析子单元的识别结果加载词典文件。
10.根据权利要求9所述的系统,其特征在于,所述文件加载子单元在系统启动时,具体在内存中创建一个数据容器,将配置文件中的各需求类型分别作为所述数据容器的一个节点进行存储;
所述词典加载子单元在加载词典文件时具体在所述数据容器的各节点读入对应需求类型的词典文件;
所述识别遍历单元在遍历所述各需求类型时,具体遍历所述数据容器中的各节点。
11.根据权利要求10所述的系统,其特征在于,该系统还包括:
更新处理单元,用于如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为所述新的数据容器的节点进行存储,并对未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入所述新的数据容器的对应节点;
所述识别遍历单元,还用于在所述输入单元获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至所述新的数据容器。
12.根据权利要求11所述的系统,其特征在于,该系统还包括:更新释放单元,用于待所有线程的待识别query都切换至所述新的数据容器时,释放原来的数据容器,具体为:保留被所述新的数据容器复用的内容,删除未被所述新的词典文件复用的内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110448800.6A CN103186569B (zh) | 2011-12-28 | 2011-12-28 | 一种需求识别方法及需求识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110448800.6A CN103186569B (zh) | 2011-12-28 | 2011-12-28 | 一种需求识别方法及需求识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103186569A true CN103186569A (zh) | 2013-07-03 |
CN103186569B CN103186569B (zh) | 2016-07-13 |
Family
ID=48677738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110448800.6A Active CN103186569B (zh) | 2011-12-28 | 2011-12-28 | 一种需求识别方法及需求识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103186569B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112256669A (zh) * | 2020-09-27 | 2021-01-22 | 北京三快在线科技有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090313239A1 (en) * | 2008-06-16 | 2009-12-17 | Microsoft Corporation | Adaptive Visual Similarity for Text-Based Image Search Results Re-ranking |
CN102096716A (zh) * | 2011-02-11 | 2011-06-15 | 百度在线网络技术(北京)有限公司 | 一种基于搜索引擎的计算器实现方法和装置 |
CN102117320A (zh) * | 2011-01-11 | 2011-07-06 | 百度在线网络技术(北京)有限公司 | 一种结构化数据搜索的方法和装置 |
-
2011
- 2011-12-28 CN CN201110448800.6A patent/CN103186569B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090313239A1 (en) * | 2008-06-16 | 2009-12-17 | Microsoft Corporation | Adaptive Visual Similarity for Text-Based Image Search Results Re-ranking |
CN102117320A (zh) * | 2011-01-11 | 2011-07-06 | 百度在线网络技术(北京)有限公司 | 一种结构化数据搜索的方法和装置 |
CN102096716A (zh) * | 2011-02-11 | 2011-06-15 | 百度在线网络技术(北京)有限公司 | 一种基于搜索引擎的计算器实现方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112256669A (zh) * | 2020-09-27 | 2021-01-22 | 北京三快在线科技有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103186569B (zh) | 2016-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549538B (zh) | 一种代码检测方法、装置、存储介质及测试终端 | |
CN109240661B (zh) | 一种代码生成方法及装置 | |
CN110851209B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN106970993B (zh) | 挖掘模型更新方法和装置 | |
CN107341014A (zh) | 电子设备、技术文档的生成方法及装置 | |
US10203953B2 (en) | Identification of duplicate function implementations | |
CN110232095B (zh) | 一种数据同步方法、装置、存储介质和服务器 | |
CN110516233B (zh) | 数据处理的方法、装置、终端设备以及存储介质 | |
CN112579466B (zh) | 测试用例的生成方法、装置及计算机可读存储介质 | |
KR20070048638A (ko) | 볼륨 이미지 및 그것을 포함하는 컴퓨터 판독가능 매체 | |
CN109828952B (zh) | Pcm体制卫星遥测数据分类提取方法、系统 | |
CN110705226A (zh) | 电子表格的创建方法、装置及计算机设备 | |
CN114936269A (zh) | 文档搜索平台、搜索方法、装置、电子设备及存储介质 | |
CN106547765B (zh) | 基于sql的数据库管理方法及装置 | |
CN113961768A (zh) | 敏感词检测方法、装置、计算机设备和存储介质 | |
CN112765963B (zh) | 语句分词方法、装置、计算机设备及存储介质 | |
CN116339818B (zh) | 代码变更类型的筛选方法、电子设备及可读存储介质 | |
CN111026736B (zh) | 数据血缘管理方法及装置、数据血缘解析方法及装置 | |
CN103186569B (zh) | 一种需求识别方法及需求识别系统 | |
CN116594628A (zh) | 数据溯源方法、装置和计算机设备 | |
CN116361287A (zh) | 路径解析方法、装置以及系统 | |
CN110597765A (zh) | 一种大零售呼叫中心异构数据源数据处理方法及装置 | |
CN113836917B (zh) | 文本分词处理方法及其装置、设备与介质 | |
CN105930162A (zh) | 一种基于子图搜索的特征定位方法 | |
CN113722337B (zh) | 业务数据确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |