CN106227891A - 一种基于模式的商品查询短文本语义处理方法 - Google Patents
一种基于模式的商品查询短文本语义处理方法 Download PDFInfo
- Publication number
- CN106227891A CN106227891A CN201610711300.XA CN201610711300A CN106227891A CN 106227891 A CN106227891 A CN 106227891A CN 201610711300 A CN201610711300 A CN 201610711300A CN 106227891 A CN106227891 A CN 106227891A
- Authority
- CN
- China
- Prior art keywords
- keyword
- text
- semantic
- pattern
- short text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于模式的商品查询短文本语义处理方法,包括以下步骤:(1)用户向移动端输入想要查询商品的关键字;(2)云计算根据用户所输入的关键字进行拆分,并把拆分关键字分别进行词性及相似语义的模式处理;(3)将处理得到的模式进行搜索,得到相关长文本信息后,将长文本拆分成不等的短文本,识别出关键字或关键字相关信息所在短文本位置,并结合其所在位置的上下文语义,筛选出相关度最高的文本信息;(4)将相关度最高的文本信息进行最后编辑,梳理成合适的语义顺序,输出商品信息。本发明通过一系列的商品关键字文本处理,获得匹配度更高,且不重复出现无关的商品信息。
Description
技术领域
本发明涉及一种语义处理方法,具体是一种基于模式的商品查询短文本语义处理方法。
背景技术
互联网的普及率越来越高,现已逐步地在影响人们的生活,为人们带来便利。人们可以通过在网上搜索商品的相关信息,通过商品信息更好地了解商品,可增大其对商品的购买能力,也可以帮助大家在线下使用商品。目前,用户可以通过各大引擎输入商品关键字搜索相关的商品信息。通过向各大引擎输入商品关键字进行搜索,得到相关的商品信息可能匹配度不高,处理难度较高,直接匹配也会产生许多无关或者重复对应的一些信息。
发明内容
本发明的目的在于提供一种基于模式的商品查询短文本语义处理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于模式的商品查询短文本语义处理方法,包括以下步骤:(1)用户向移动端输入想要查询商品的关键字;(2)云计算根据用户所输入的关键字进行拆分,并把拆分关键字分别进行词性及相似语义的模式处理;(3)将处理得到的模式进行搜索,得到相关长文本信息后,将长文本拆分成不等的短文本,识别出关键字或关键字相关信息所在短文本位置,并结合其所在位置的上下文语义,筛选出相关度最高的文本信息;(4)将相关度最高的文本信息进行最后编辑,梳理成合适的语义顺序,输出商品信息。
作为本发明再进一步的方案:通过拆分关键字,并进行语义及词性模式处理,利用模式进行相关长文本信息搜索,再拆分长文本信息为短文本,结合关键词信息位置的上下文语义,筛选出相关度最高的信息。
与现有技术相比,本发明的有益效果是:本发明通过一系列的商品关键字文本处理,获得匹配度更高,且不重复出现无关的商品信息。
附图说明
图1为基于模式的商品查询短文本语义处理方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中,一种基于模式的商品查询短文本语义处理方法,包括以下步骤:(1)用户向移动端输入想要查询商品的关键字;(2)云计算根据用户所输入的关键字进行拆分,并把拆分关键字分别进行词性及相似语义的模式处理;(3)将处理得到的模式进行搜索,得到相关长文本信息后,将长文本拆分成不等的短文本,识别出关键字或关键字相关信息所在短文本位置,并结合其所在位置的上下文语义,筛选出相关度最高的文本信息;(4)将相关度最高的文本信息进行最后编辑,梳理成合适的语义顺序,输出商品信息。
通过拆分关键字,并进行语义及词性模式处理,利用模式进行相关长文本信息搜索,再拆分长文本信息为短文本,结合关键词信息位置的上下文语义,筛选出相关度最高的信息。
本发明的工作原理是:本发明基于模式的商品查询短文本语义处理方法,包括以下步骤:(1)用户向移动端输入想要查询商品的关键字;(2)云计算根据用户所输入的关键字进行拆分,并把拆分关键字分别进行词性及相似语义的模式处理;(3)将处理得到的模式进行搜索,得到相关长文本信息后,将长文本拆分成不等的短文本,识别出关键字或关键字相关信息所在短文本位置,并结合其所在位置的上下文语义,筛选出相关度最高的文本信息;(4)将相关度最高的文本信息进行最后编辑,梳理成合适的语义顺序,输出商品信息。通过拆分关键字,并进行语义及词性模式处理,利用模式进行相关长文本信息搜索,再拆分长文本信息为短文本,结合关键词信息位置的上下文语义,筛选出相关度最高的信息。改善了通过普通引擎搜索出商品信息匹配度不高的缺点,降低无关和重复商品信息的出现率,最后通过将筛选出的信息进行梳理,清楚表达商品信息。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (2)
1.一种基于模式的商品查询短文本语义处理方法,其特征在于,包括以下步骤:(1)用户向移动端输入想要查询商品的关键字;(2)云计算根据用户所输入的关键字进行拆分,并把拆分关键字分别进行词性及相似语义的模式处理;(3)将处理得到的模式进行搜索,得到相关长文本信息后,将长文本拆分成不等的短文本,识别出关键字或关键字相关信息所在短文本位置,并结合其所在位置的上下文语义,筛选出相关度最高的文本信息;(4)将相关度最高的文本信息进行最后编辑,梳理成合适的语义顺序,输出商品信息。
2.根据权利要求1所述的基于模式的商品查询短文本语义处理方法,其特征在于,通过拆分关键字,并进行语义及词性模式处理,利用模式进行相关长文本信息搜索,再拆分长文本信息为短文本,结合关键词信息位置的上下文语义,筛选出相关度最高的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610711300.XA CN106227891A (zh) | 2016-08-24 | 2016-08-24 | 一种基于模式的商品查询短文本语义处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610711300.XA CN106227891A (zh) | 2016-08-24 | 2016-08-24 | 一种基于模式的商品查询短文本语义处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106227891A true CN106227891A (zh) | 2016-12-14 |
Family
ID=57553302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610711300.XA Pending CN106227891A (zh) | 2016-08-24 | 2016-08-24 | 一种基于模式的商品查询短文本语义处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106227891A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380869A (zh) * | 2020-11-12 | 2021-02-19 | 平安科技(深圳)有限公司 | 晶体信息检索方法、装置、电子设备及存储介质 |
CN113139849A (zh) * | 2021-04-26 | 2021-07-20 | 北京沃东天骏信息技术有限公司 | 一种商品搜索方法和装置 |
CN112380869B (zh) * | 2020-11-12 | 2024-10-29 | 平安科技(深圳)有限公司 | 晶体信息检索方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101320382A (zh) * | 2008-05-07 | 2008-12-10 | 索意互动(北京)信息技术有限公司 | 基于上下文对搜索结果重新排序的方法和系统 |
US20100179948A1 (en) * | 2009-01-12 | 2010-07-15 | Alibaba Group Holding Limited | Method and system for querying information |
CN102073725A (zh) * | 2011-01-11 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统 |
US20140040023A1 (en) * | 2007-07-25 | 2014-02-06 | Ebay Inc. | Merchandising items of topical interest |
CN103995870A (zh) * | 2014-05-21 | 2014-08-20 | 百度在线网络技术(北京)有限公司 | 交互式搜索方法和装置 |
CN104951428A (zh) * | 2014-03-26 | 2015-09-30 | 阿里巴巴集团控股有限公司 | 用户意图识别方法及装置 |
-
2016
- 2016-08-24 CN CN201610711300.XA patent/CN106227891A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140040023A1 (en) * | 2007-07-25 | 2014-02-06 | Ebay Inc. | Merchandising items of topical interest |
CN101320382A (zh) * | 2008-05-07 | 2008-12-10 | 索意互动(北京)信息技术有限公司 | 基于上下文对搜索结果重新排序的方法和系统 |
US20100179948A1 (en) * | 2009-01-12 | 2010-07-15 | Alibaba Group Holding Limited | Method and system for querying information |
CN102073725A (zh) * | 2011-01-11 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统 |
CN104951428A (zh) * | 2014-03-26 | 2015-09-30 | 阿里巴巴集团控股有限公司 | 用户意图识别方法及装置 |
CN103995870A (zh) * | 2014-05-21 | 2014-08-20 | 百度在线网络技术(北京)有限公司 | 交互式搜索方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380869A (zh) * | 2020-11-12 | 2021-02-19 | 平安科技(深圳)有限公司 | 晶体信息检索方法、装置、电子设备及存储介质 |
CN112380869B (zh) * | 2020-11-12 | 2024-10-29 | 平安科技(深圳)有限公司 | 晶体信息检索方法、装置、电子设备及存储介质 |
CN113139849A (zh) * | 2021-04-26 | 2021-07-20 | 北京沃东天骏信息技术有限公司 | 一种商品搜索方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2007050234A3 (en) | System for obtaining reviews using selections created by user base | |
CN104834632B (zh) | 一种基于语义扩充的微博话题检测和热度评估方法 | |
CN103853842A (zh) | 一种自动问答方法和系统 | |
CN106326452A (zh) | 一种基于上下文的人机对话方法 | |
WO2011028636A3 (en) | Systems and methods for visual messaging | |
CN109308315A (zh) | 一种基于专家领域相似度与关联关系的协同推荐方法 | |
CN106227891A (zh) | 一种基于模式的商品查询短文本语义处理方法 | |
CN103902699B (zh) | 一种用于大数据环境下可支持多格式特性的数据空间检索方法 | |
Liu et al. | Method for product integrated innovation based on functional combination and TRIZ | |
CN104102739B (zh) | 一种扩充实体库的方法及装置 | |
Truong Pham et al. | Hybrid Data Augmentation And Deep Attention-Based Dilated Convolutional-Recurrent Neural Networks For Speech Emotion Recognition | |
Alsudais et al. | Clustering prominent named entities in topic-specific text corpora | |
Cruz Gambardella et al. | Searching for Designs in-between | |
Chandra et al. | Entrepreneurial Inclination among Family Owned Firms vs. Corporate Decision Makers | |
Dorsett et al. | Search for supersymmetry in the single-lepton final state using the sum of large jet masses | |
Rexhaj et al. | Wives of Henry VIII: Historiography in the concepts of modern cinema | |
Quassdorf | Meaningless Work with Words: The Literary Figure of the Scribe | |
Montanaro et al. | Variabilità craniometrica in alcune popolazioni italiane di capriolo | |
Czander | “You are my witnesses”: A theological approach to the laws of testimony | |
Palmer et al. | Music-color associations to classical music in synesthetes and non-synesthetes: The surprising role of emotion | |
Ravi et al. | A Global Research Productivity of Green Marketing: A Scientometric Study | |
Neerman et al. | The Calumny of Apelles: a rediscovered masterpiece by Maarten de Vos | |
Adesegun Kukoyi et al. | Voice Information Retrieval In Collaborative Information Seeking | |
Pham | Efficient Strategy For Minning High Utility Quanitative Itemsets | |
JP2002215667A (ja) | 知識データベースとキャラクターによる提案型Web応答システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161214 |
|
RJ01 | Rejection of invention patent application after publication |