CN111966806B - 一种酒店预定短信的信息提取及修补方法 - Google Patents
一种酒店预定短信的信息提取及修补方法 Download PDFInfo
- Publication number
- CN111966806B CN111966806B CN202010824717.3A CN202010824717A CN111966806B CN 111966806 B CN111966806 B CN 111966806B CN 202010824717 A CN202010824717 A CN 202010824717A CN 111966806 B CN111966806 B CN 111966806B
- Authority
- CN
- China
- Prior art keywords
- hotel
- information
- short message
- library
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000000605 extraction Methods 0.000 title claims abstract description 9
- 230000008439 repair process Effects 0.000 title claims abstract description 8
- 230000001502 supplementing effect Effects 0.000 claims abstract description 4
- 235000014101 wine Nutrition 0.000 claims description 23
- 230000011218 segmentation Effects 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 9
- 238000013145 classification model Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
Abstract
本发明公开一种酒店预定短信的信息提取及修补方法。所述方法包括:获取用户导入的酒店预定短信;从所述短信中提取酒店信息,酒店信息包括酒店所在的城市名、酒店名、酒店位置和酒店电话;查找酒店库中与提取的酒店信息匹配度最高的酒店,根据酒店库中记载的所述酒店的信息,补充和/或修改短信内容;酒店库中记录了每个城市所有酒店的信息。本发明能够自动提取用户导入的酒店预定短信,并获得准确、完整的酒店信息,解决了现有行程管理服务通过导入酒店预定短信来智能管理行程时的酒店信息缺失的问题。
Description
技术领域
本发明涉及电子商务、自然语言处理及短信技术领域,具体涉及一种酒店预定短信的信息提取及修补方法。
背景技术
在数字化转型的疯狂簇拥下,智慧出行领域的发展情况空前大好,越来越多的出行平台和手机厂商推出个性化的行程管理服务。随着移动互联网的普及和智能服务的多样化,人们在出行前会通过各种OTA平台订购机票、火车票、酒店和门票等。同时,各种预定短信会疯狂地袭击手机屏幕,在使用时还需从几十甚至上百条短信中查找有效的预定信息,过程繁琐而且浪费时间,尤其当前快节奏的生活已经让人们感到疲惫,迫切需要智能化的行程管理服务。而酒店预定是出行中不可缺少的一个步骤,现有的行程管理工具一般都支持导入酒店短信来识别酒店信息并加入现有行程,但展示的酒店信息要么直接是短信文本,要么就是酒店信息缺失,不能给用户带来更智能贴心化的服务。
发明内容
为了解决现有技术中存在的上述问题,本发明提出一种酒店预定短信的信息提取及修补方法,提取用户导入的酒店预定短信中的酒店信息,如时间、酒店名、位置和联系方式等,并将其映射到酒店库完善酒店相关信息,最终将完整的酒店行程信息完整的呈现给用户。
为实现上述目的,本发明采用如下技术方案:
一种酒店预定短信的信息提取及修补方法,包括以下步骤:
步骤1,获取用户导入的酒店预定短信;
步骤2,从所述短信中提取酒店信息,酒店信息包括酒店所在的城市名、酒店名、酒店位置和酒店电话;
步骤3,查找酒店库中与提取的酒店信息匹配度最高的酒店,根据酒店库中记载的所述酒店的信息,补充和/或修改短信内容;酒店库中记录了每个城市所有酒店的信息。
与现有技术相比,本发明具有以下有益效果:
本发明通过提取用户酒店预定短信中的酒店信息,将可能不完整、不规范的酒店信息,与记录有效城市名和酒店名的酒店库中的酒店信息进行匹配,得到匹配度最高的酒店,利用匹配度最高的酒店的信息,对用户的酒店预定短信进行补充和修正,能够获得准确、完整的酒店信息,解决了现有行程管理服务通过导入酒店预定短信来智能管理行程时的酒店信息缺失的问题。
附图说明
图1为本发明实施例一种酒店预定短信的信息提取及修补方法的流程图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明实施例一种酒店预定短信的信息提取及修补方法,流程图如图1所示,所述方法包括以下步骤:
S101、获取用户导入的酒店预定短信;
S102、从所述短信中提取酒店信息,酒店信息包括酒店所在的城市名、酒店名、酒店位置和酒店电话;
S103、查找酒店库中与提取的酒店信息匹配度最高的酒店,根据酒店库中记载的所述酒店的信息,补充和/或修改短信内容;酒店库中记录了每个城市所有酒店的信息。
在本实施例中,步骤S101主要用于获取用户导入的酒店预定短信。酒店预定短信一般包括下单平台(如“美团点评”)、酒店名(如“快捷酒店”)和入住日期(如“2020年5月15日)等内容。
在本实施例中,步骤S102主要用于从短信中提取酒店信息。酒店信息主要包括酒店所在的城市名、酒店名、酒店位置和酒店电话等。值得说明的是,并不是每个用户导入的酒店预定短信都包含这些信息,经常存在短信内容缺失或不规范现象,如缺少酒店电话号码,酒店名不规范,与正确的酒店名相差较大。
在本实施例中,步骤S103主要用于通过匹配酒店库修正短信内容。酒店库中记载了全国乃至全世界各个地区的酒店信息,包括规范的酒店名称、准确的地址、电话号码等信息。将从短信中获取的不是很规范、完整的酒店信息,比如酒店名和酒店地址,与酒店库中满足条件的酒店的信息进行匹配,查找匹配度最高的酒店,以酒店库中此酒店的信息修正短信中的酒店信息。
作为一种可选实施例,所述S101还包括:
如果短信文本长度小于设定阈值或不包含中文,提醒用户输入正确的酒店预定短信;
将获取的短信文本输入预先训练好的分类模型,如果输出的分类结果为正确,转S102;如果输出的分类结果为错误,提醒用户输入正确的酒店预定短信。
本实施例给出了判断用户导入的酒店预定短信是否正确的一种技术方案。首先,根据一些简单的规则进行初步判断,滤除那些明显不正确的短信。比如,如果短信文本的字数太少(如少于15个字),或短信中不包含中文,就不可能是正确的酒店预定短信;然后,将经简单判断为正确的短信进行进一步识别,方法是将提取的短信文本输入到训练好的分类模型中,如果分类模型输出的分类结果为正确,则所述短信为正确的酒店预定短信。分类模型一般采用朴素贝叶斯模型,通过采用由大量的带有正确和错误标签的短信文本构成的数据集进行机器学习得到。本实施例通过进行短信真伪识别,一来可以提醒用户正确输入酒店预定短信,二来可以通过滤除错误的短信减小数据处理的工作量。
作为一种可选实施例,所述S102在提取酒店信息前还包括预处理步骤:过滤无效或无意义字符,对日期格式进行转换。
本实施例给出了对短信进行预处理的一种技术方案。预处理主要包括两项内容:一是过滤无效或无意义字符,如短信“【美团点评】预订成功:2020年9月3日>入住\n怡美酒店(国贸360店),请携带身份证,报张三入住”中的换行符“\n”和字符“<”均是过滤对象;二是对转换日期格式,比如将短信中的日期“2020年9月3日”转换为2020-09-03。
作为一种可选实施例,所述S102具体包括:
针对待提取信息分别构建正则表达式;正则表达式是通过对目标文本的格式规律进行抽象总结,按照规定的语法得到的一种对字符串操作的逻辑公式,能够对目标文本进行过滤或匹配;
利用构建的正则表达式提取入住日期、下单平台、酒店地址和酒店电话,并根据当前日期和时间判断短信是否过期,若过期向用户发送提醒信息;
定义由城市名和酒店名组成的词典库,并分别将城市名和酒店名定制为专有词性;利用中文分词工具包HanLP对短信文本进行分词处理,根据分词结果中包含的专有词性提取城市名和酒店名;
如果分词结果中不包含酒店名的专有词性,按照BMEWO标注标准,利用双向LSTM-CRF模型对短信文本进行序列标注,通过解析标注结果并对连续的酒店名标注进行合并得到酒店名。
本实施例给出了从短信文本中提取酒店信息的一种技术方案。本实施例利用构建不同的正则表达式提取入住日期、下单平台、酒店地址和酒店电话等信息。正则表达式又称规则表达式,用于基于自然语言格式编写规则去检索文本。需要对目标文本出现格式规律进行抽象总结,然后基于规定的语法去编写识别规则得到一个对字符串操作的逻辑公式。如提取日期的正则表达式为:
((((?!0000)[0-9]{4})[-/年])?(0?[1-9]|1[0-2])[-/月](1[0-9]|2[0-9]|3[0-1]|0?[1-9])[日]?)|((0?[1-9])[月](0[1-9]|1[0-9]|2[0-9]|3[0-1]|[1-9])[日])。
应用该表达式可以从短信“【美团点评】预订成功:2019-10-05入住银座佳驿酒店,>请携带身份证,报xxx入住”中,提取入住日期“2019-10-05”。如果提取的日期在当前日期之前,说明该短信属于无效的过期短信。
本实施例通过对酒店名和酒店所属城市名定制专有词性,提取酒店名和城市名。建立一个由城市名和酒店名组成的词典库,并将词典库中的城市名和酒店名定制为专有词性。专有词性是一种不同于常用词性的专用的词语类型,如将北京等城市名定义为n_city,将酒店名定义为n_hotel。定制专有词库属于本领域命名实体识别的常用基础手段之一,相对简单高效。将定制的词库融入开源工具HanLP进行相应的配置后,在利用HanLP对文本进行分词时就可以得到自定义的专有词性。因此,本实施例利用HanLP对短信文本进行分词处理,分词结果中词性为n_city的词即为城市名,词性为n_hotel的词即为酒店名。例如,对短信“【美团点评】预订成功:2020-10-13入住格林豪泰(砀山大隅口店),请携带身份证,报张三入住”进行分词处理后得到:token='格林豪泰',POS='n_hotel';token='砀山',POS='n_city'”,由此可知,城市名为砀山,酒店名为格林豪泰。
如果通过分词处理不能有效提取酒店名,比如分词结果中不包含专有词性n_hotel,本实施例利用双向LSTM-CRF模型从短信文本中提取酒店名。对短信文本按照BMEWO标注标准进行序列标注:B表示词的开始,M表示中间,E表示结尾,W表示单个的实体,O表示无关字符,可得到短信的标注结果。如将短信文本“【美团点评】预订成功:入住亚朵酒店”标注为“【/O美/B-platform团/M-platform点/M-platform评/B-platform】/O预/O订/O成/O功/O:/S入/O住/O亚/B-hotel_name朵/M-hotel_name酒/M-hotel_name店/E-hotel_name”。双向LSTM-CRF模型将词向量输入到BiLSTM层,根据单词的上下文给出对应标注类别的概率分布,如这种(0.48,0.2,0.9)形式的非归一化概率分布,即句子中每个词的所有类别的各自得分。之后将这个得分(即概率分布)作为CRF模型的特征分布输入,通过CRF来学习特征转移概率,最终获得标签序列的概率。最后解析标注结果并对连续的酒店名标注进行合并得到酒店名,如将连续标注为“B/M/E-hotel_name”的词组合起来就是完整的酒店名称“亚朵酒店”。
作为一种可选实施例,所述S103查找酒店库中与提取的酒店信息匹配度最高的酒店的方法包括:
根据提取的城市名从酒店库中获取属于该城市的所有酒店H的信息;
将从短信中提取的酒店名和酒店地址拼接成一个文本串A,将H中的每个酒店名及其对应的酒店地址拼接成一个文本串Bi,i=1,2,…,n,n为H中酒店的数量,按下式计算A与Bi的相似度Ci:
式中,|A∩Bi|为A与Bi的交集包含的汉字数量,|A∪Bi|为A与Bi的并集包含的汉字数量;
计算大于设定阈值的Ci的最大值,所述最大值对应的酒店库中的酒店即为所求匹配度最高的酒店;
如果从短信中提取的酒店信息包括酒店电话,从H中删除电话不是所述酒店电话的酒店,然后再与从短信中提取的酒店信息进行匹配。
本实施例给出了将提取的酒店信息与酒店库中的酒店信息进行匹配的一种技术方案。先将提取的酒店名和酒店地址拼接成一个文本串A,再将酒店库中与提取的城市名匹配的酒店H中每个酒店的酒店名和酒店地址拼接成一个文本串Bi,然后计算A与Bi的相似度Ci,Ci的最大值对应的酒店库中的酒店即为匹配酒店。为了避免出现匹配错误,本实施例对匹配酒店的相似度大小进行了限定,即要求相似度大于设定的阈值。比如,两组看似不同的酒店名和地址的组合信息,“如家酒店:北京市朝阳区南沙滩8号院”和“如家酒店:北京市朝阳区南沙滩8号院2楼”,根据上面的相似度公式得到相似度值为0.9,说明这两组有非常大的该概率描述的是同一个酒店。如果相似度较小,比如0.4,即使是所有相似度中的最大值,也不适合作为匹配酒店。
上述仅对本发明中的几种具体实施例加以说明,但并不能作为本发明的保护范围,凡是依据本发明中的设计精神所做出的等效变化或修饰或等比例放大或缩小等,均应认为落入本发明的保护范围。
Claims (5)
1.一种酒店预定短信的信息提取及修补方法,其特征在于,包括以下步骤:
步骤1,获取用户导入的酒店预定短信;
步骤2,从所述短信中提取酒店信息,酒店信息包括酒店所在的城市名、酒店名、酒店位置和酒店电话;
步骤3,查找酒店库中与提取的酒店信息匹配度最高的酒店,根据酒店库中记载的所述酒店的信息,补充和/或修改短信内容;酒店库中记录了每个城市所有酒店的信息。
2.根据权利要求1所述的酒店预定短信的信息提取及修补方法,其特征在于,所述步骤1还包括:
如果短信文本长度小于设定阈值或不包含中文,提醒用户输入正确的酒店预定短信;
将获取的短信文本输入预先训练好的分类模型,如果输出的分类结果为正确,转步骤2;如果输出的分类结果为错误,提醒用户输入正确的酒店预定短信。
3.根据权利要求1所述的酒店预定短信的信息提取及修补方法,其特征在于,所述步骤2在提取酒店信息前还包括预处理步骤:过滤无效或无意义字符,对日期格式进行转换。
4.根据权利要求3所述的酒店预定短信的信息提取及修补方法,其特征在于,所述步骤2具体包括:
针对待提取信息分别构建正则表达式;正则表达式是通过对目标文本的格式规律进行抽象总结,按照规定的语法得到的一种对字符串操作的逻辑公式,能够对目标文本进行过滤或匹配;
利用构建的正则表达式提取入住日期、下单平台、酒店地址和酒店电话,并根据当前日期和时间判断短信是否过期,若过期向用户发送提醒信息;
定义由城市名和酒店名组成的词典库,并分别将城市名和酒店名定制为专有词性;利用中文分词工具包HanLP对短信文本进行分词处理,根据分词结果中包含的专有词性提取城市名和酒店名;
如果分词结果中不包含酒店名的专有词性,按照BMEWO标注标准,利用双向LSTM-CRF模型对短信文本进行序列标注,通过解析标注结果并对连续的酒店名标注进行合并得到酒店名。
5.根据权利要求4所述的酒店预定短信的信息提取及修补方法,其特征在于,所述步骤3查找酒店库中与提取的酒店信息匹配度最高的酒店的方法包括:
根据提取的城市名从酒店库中获取属于该城市的所有酒店H的信息;
将从短信中提取的酒店名和酒店地址拼接成一个文本串A,将H中的每个酒店名及其对应的酒店地址拼接成一个文本串Bi,i=1,2,…,n,n为H中酒店的数量,按下式计算A与Bi的相似度Ci:
式中,|A∩Bi|为A与Bi的交集包含的汉字数量,|A∪Bi|为A与Bi的并集包含的汉字数量;
计算大于设定阈值的Ci的最大值,所述最大值对应的酒店库中的酒店即为所求匹配度最高的酒店;
如果从短信中提取的酒店信息包括酒店电话,从H中删除电话不是所述酒店电话的酒店,然后再与从短信中提取的酒店信息进行匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010824717.3A CN111966806B (zh) | 2020-08-17 | 2020-08-17 | 一种酒店预定短信的信息提取及修补方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010824717.3A CN111966806B (zh) | 2020-08-17 | 2020-08-17 | 一种酒店预定短信的信息提取及修补方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111966806A CN111966806A (zh) | 2020-11-20 |
CN111966806B true CN111966806B (zh) | 2023-10-27 |
Family
ID=73389508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010824717.3A Active CN111966806B (zh) | 2020-08-17 | 2020-08-17 | 一种酒店预定短信的信息提取及修补方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966806B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113015170A (zh) * | 2021-03-05 | 2021-06-22 | 中国工商银行股份有限公司 | 短信验证方法、装置、电子设备和介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1540974A1 (en) * | 2002-08-21 | 2005-06-15 | Intellprop Limited | Telecommunications services apparatus and methods |
CN101877837A (zh) * | 2009-04-30 | 2010-11-03 | 华为技术有限公司 | 一种短信过滤的方法和装置 |
CN104468983A (zh) * | 2014-11-13 | 2015-03-25 | 重庆蓝岸通讯技术有限公司 | 一种移动终端基于短信票务出行信息的自动提醒方法 |
CN105049627A (zh) * | 2015-07-28 | 2015-11-11 | 深圳市万普拉斯科技有限公司 | 卡片生成方法和装置 |
CN105187624A (zh) * | 2015-06-29 | 2015-12-23 | 北京金山安全软件有限公司 | 一种生成行程事项的方法及行程事项生成装置 |
CN107786950A (zh) * | 2016-08-24 | 2018-03-09 | 南京乐朋电子科技有限公司 | 一种改变短信的应用系统 |
WO2018150244A1 (en) * | 2017-02-18 | 2018-08-23 | Yogesh Chunilal Rathod | Registering, auto generating and accessing unique word(s) including unique geotags |
WO2019023994A1 (zh) * | 2017-08-02 | 2019-02-07 | 深圳传音通讯有限公司 | 一种基于智能终端的行程管理方法及行程管理系统 |
CN109726266A (zh) * | 2018-12-21 | 2019-05-07 | 珠海市小源科技有限公司 | 短信签名处理方法、设备及计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110185015A1 (en) * | 2009-08-10 | 2011-07-28 | Jordan Stolper | System for managing user selected web content |
US10977289B2 (en) * | 2019-02-11 | 2021-04-13 | Verizon Media Inc. | Automatic electronic message content extraction method and apparatus |
-
2020
- 2020-08-17 CN CN202010824717.3A patent/CN111966806B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1540974A1 (en) * | 2002-08-21 | 2005-06-15 | Intellprop Limited | Telecommunications services apparatus and methods |
CN101877837A (zh) * | 2009-04-30 | 2010-11-03 | 华为技术有限公司 | 一种短信过滤的方法和装置 |
CN104468983A (zh) * | 2014-11-13 | 2015-03-25 | 重庆蓝岸通讯技术有限公司 | 一种移动终端基于短信票务出行信息的自动提醒方法 |
CN105187624A (zh) * | 2015-06-29 | 2015-12-23 | 北京金山安全软件有限公司 | 一种生成行程事项的方法及行程事项生成装置 |
CN105049627A (zh) * | 2015-07-28 | 2015-11-11 | 深圳市万普拉斯科技有限公司 | 卡片生成方法和装置 |
CN107786950A (zh) * | 2016-08-24 | 2018-03-09 | 南京乐朋电子科技有限公司 | 一种改变短信的应用系统 |
WO2018150244A1 (en) * | 2017-02-18 | 2018-08-23 | Yogesh Chunilal Rathod | Registering, auto generating and accessing unique word(s) including unique geotags |
WO2019023994A1 (zh) * | 2017-08-02 | 2019-02-07 | 深圳传音通讯有限公司 | 一种基于智能终端的行程管理方法及行程管理系统 |
CN109726266A (zh) * | 2018-12-21 | 2019-05-07 | 珠海市小源科技有限公司 | 短信签名处理方法、设备及计算机可读存储介质 |
Non-Patent Citations (4)
Title |
---|
"互联网+"环境下旅游目的地的移动信息服务研究;夏彦杰;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;J155-228 * |
Context Extraction from Reviews for Context Aware Recommendation Using Text Classification Techniques;Lahlou, Fatima Zahra等;《2013 ACS INTERNATIONAL CONFERENCE ON COMPUTER SYSTEMS AND APPLICATIONS (AICCSA)》;第1-4页 * |
基于短信的旅游领域实体问答系统研究;毛存礼;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-821 * |
基于移动通信定位数据的交通信息提取及分析方法研究.《中国博士学位论文全文数据库 工程科技Ⅱ辑》.2015,C034-11. * |
Also Published As
Publication number | Publication date |
---|---|
CN111966806A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909548B (zh) | 中文命名实体识别方法、装置及计算机可读存储介质 | |
WO2018032937A1 (zh) | 一种文本信息分类方法及其装置 | |
CN108959242B (zh) | 一种基于中文字符词性特征的目标实体识别方法及装置 | |
CN106777275A (zh) | 基于多粒度语义块的实体属性和属性值提取方法 | |
CN109460725B (zh) | 小票消费明细内容融合及提取方法、设备以及存储介质 | |
CN111669757B (zh) | 一种基于通话文本词向量的终端诈骗电话识别方法 | |
CN107967250A (zh) | 一种信息处理方法及装置 | |
CN110941720A (zh) | 一种基于知识库的特定人员信息纠错方法 | |
CN114416942A (zh) | 一种基于深度学习的自动化问答方法 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN110765889A (zh) | 法律文书的特征提取方法、相关装置及存储介质 | |
CN114549241A (zh) | 合同审查方法、装置、系统与计算机可读存储介质 | |
CN111966806B (zh) | 一种酒店预定短信的信息提取及修补方法 | |
CN113255346B (zh) | 一种基于图嵌入与crf知识融入的地址要素识别方法 | |
CN111191153A (zh) | 一种信息技术咨询服务展示装置 | |
CN113051384B (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN110619119A (zh) | 文本智能编辑方法、装置及计算机可读存储介质 | |
CN112182321B (zh) | 一种基于地图技术的互联网信息发布搜索方法 | |
CN112835860A (zh) | 共享文档的处理方法、装置、设备及计算机可读存储介质 | |
CN107577674A (zh) | 识别企业名称的方法及装置 | |
CN116304023A (zh) | 一种基于nlp技术的招投标要素抽取方法、系统及存储介质 | |
CN110362656A (zh) | 一种语义要素提取方法及装置 | |
CN115687754A (zh) | 一种基于智能对话的主动式网络信息挖掘方法 | |
CN115392251A (zh) | 一种互联网金融业务的实体实时识别方法 | |
CN114998920A (zh) | 基于nlp语义识别的供应链金融文件管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |