CN110347908B - 语音购物方法、装置、介质及电子设备 - Google Patents
语音购物方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN110347908B CN110347908B CN201910435026.1A CN201910435026A CN110347908B CN 110347908 B CN110347908 B CN 110347908B CN 201910435026 A CN201910435026 A CN 201910435026A CN 110347908 B CN110347908 B CN 110347908B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- keyword
- information
- commodity information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000013598 vector Substances 0.000 claims abstract description 227
- 238000010801 machine learning Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 235000014102 seafood Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及自然语言处理技术领域,揭示了一种语音购物方法、装置、介质及电子设备。该方法包括:获取待识别语音信息;将待识别语音信息转换为文本信息;提取文本信息中的关键词;根据关键词,构造语音信息的特征向量,作为第一特征向量;基于第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量;基于第一特征向量,从获取的第二特征向量中确定出与第一特征向量匹配的第二特征向量作为目标特征向量;将目标特征向量对应的商品信息发送至待识别语音信息的采集端,以便用户进行购物操作。此方法下,实现了将描述性的语音信息向商品信息的映射,提高了语音购物的返回结果与消费者的意图的匹配程度,提高了购物时的搜索效率。
Description
背景技术
随着电子商务的发展,消费者足不出户即可购买各种各样的商品。网购已经融入到了人们的生活。消费者在网购平台进行购物时,主要通过两种方式进入商品的购买界面:一种是通过点击广告窗口或者在平台主页等位置导航进入的特定商品栏目中的商品链接来实现的,另一种是通过文字或语音搜索出商品。其中,搜索是在消费者网购时帮助消费者寻找特定商品的重要手段,然而在现有技术中,无论是语音搜索还是文字搜索,只能根据商品的种类进行搜索,这样搜索出的结果数量将是庞大的,消费者无法进行个性化的精准搜索,导致搜索结果不能准确反映消费者的意图,搜索效率低下。因此现有技术亟需一种能更精确反映消费者意图,进而提高搜索效率的语音购物方法。
发明内容
在自然语言处理技术领域,为了解决上述技术问题,本公开的目的在于提供一种语音购物方法、装置、介质及电子设备。
根据本申请的一方面,提供了一种语音购物方法,所述方法包括:
获取采集的用于购物的待识别语音信息;
将所述待识别语音信息转换为文本信息;
提取所述文本信息中的关键词;
根据所述关键词,构造所述语音信息的特征向量,作为第一特征向量;
基于所述第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量,其中,所述预设的商品信息库包括多个商品信息,每一商品信息仅与一个第二特征向量对应;
基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;
将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
根据本申请的另一方面,提供了一种语音购物装置,所述装置包括:
获取模块,被配置为获取采集的用于购物的待识别语音信息;
转换模块,被配置为将所述待识别语音信息转换为文本信息;
提取模块,被配置为提取所述文本信息中的关键词;
第一特征向量获取模块,被配置为根据所述关键词,构造所述语音信息的特征向量,作为第一特征向量;
第二特征向量获取模块,被配置为基于所述第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量,其中,所述预设的商品信息库包括多个商品信息,每一商品信息仅与一个第二特征向量对应;
目标特征向量获取模块,被配置为基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;
发送模块,被配置为将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
根据本申请的另一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行如前所述的方法。
根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明所提供的语音购物方法包括如下步骤:获取采集的用于购物的待识别语音信息;将所述待识别语音信息转换为文本信息;提取所述文本信息中的关键词;根据所述关键词,构造所述语音信息的特征向量,作为第一特征向量;基于所述第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量,其中,所述预设的商品信息库包括多个商品信息,每一商品信息仅与一个第二特征向量对应;基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
此方法下,通过将用户输入的一段语音信息转换为文字并提取关键词,得到向量,然后根据向量以及商品信息库中的商品信息获取商品信息对应的向量,最终根据利用用户语音得到的向量和商品信息对应的向量确定出用户所需的商品,实现了用户的描述性质的语音信息向用户商品信息的映射,在一定程度使得语音购物的返回结果更好地反映了消费者的意图,提高了购物时的搜索效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音购物方法的应用场景示意图;
图2是根据一示例性实施例示出的一种语音购物方法的流程图;
图3是根据图2对应实施例示出的一实施例的步骤230的细节流程图;
图4是根据图2对应实施例示出的一实施例的步骤250的细节流程图;
图5是根据图4对应实施例示出的一实施例的步骤254的细节流程图;
图6是根据图2对应实施例示出的一实施例的步骤260的细节流程图;
图7是根据一示例性实施例示出的一种语音购物装置的框图;
图8是根据一示例性实施例示出的一种实现上述语音购物方法的电子设备示例框图;
图9是根据一示例性实施例示出的一种实现上述语音购物方法的计算机可读存储介质。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
本公开的实施终端可以是任何具有运算、处理以及通信功能的设备,该设备可与外部设备相连,用于接收或者发出信息,可以是便携移动设备,例如智能手机、平板电脑、笔记本电脑、PDA(Personal Digital Assistant)等,也可以是固定式设备,例如,计算机设备、现场终端、台式电脑、服务器、工作站等,还可以是多个设备的集合,比如服务器集群或者云计算的物理基础设施等。
优选地,本公开的实施终端可以为服务器、服务器集群或者云计算的物理基础设施。
图1是根据一示例性实施例示出的一种语音购物方法的应用场景示意图。语音购物是指在线通过识别用户声音的方式向用户返回用户声音对应的商品的过程。如图1所示,包括商家终端110、服务器120、用户终端130以及呈现在用户终端130界面的语音购物界面140,服务器120可以通过通信链路与商家终端110、用户终端130进行通信,商家终端110和用户终端130之间的通信可以经由服务器120来完成。一般情况下,语音购物的流程是这样的:商家终端110向服务器120提交商品信息,其中,所述商品信息可以包括商品的描述、商品的价格、商品的照片等内容,服务器120接收到商品信息后会存储在本地或者对应的数据库中,消费者在其用户终端130上,通过App(Application,应用程序)或者Web页面的方式可以向服务器120提交请求,服务器120根据该请求可以返回与请求针对的商品信息。在一般情况下,提交获取商品信息的请求的方式可以是在语音购物界面140的形式的入口提交,在该入口中,用户可以通过输入文字(比如商品名称)的方式来提交请求,还可以是录入语音的方式提交请求。本申请的发明人意识到,在现有技术下,在语音购物时,也只能录入商品名称或者商品类型形式的语音才能被识别,比如当用户需要购买某种笔记本电脑时,只能说“笔记本电脑”或者“苹果笔记本电脑”等词组才能被识别,但当用户用详细表示欲购买的商品的句子形式的语音搜索商品时,比如“8G内存的苹果笔记本电脑”,就无法识别,这样就导致了搜索效率低下。
图2是根据一示例性实施例示出的一种语音购物方法的流程图。如图2所示,包括以下步骤:
步骤210,获取采集的用于购物的待识别语音信息。
待识别语音信息是记录声音形式的内容的语音数据信息。采集待识别语音信息的方式可以包括但不限于音频采集卡、麦克风等。待识别语音信息用于购物是指该待识别语音信息可以用来获取商品。
在一个实施例中,本端之外的终端采集了用于待识别的语音信息并发送至本公开的实施终端。
在一个实施例中,本公开的实施终端连接或内置有麦克风等能用于录音的单元直接进行了待识别语音信息的采集。
在一个实施例中,用于购物的待识别语音信息可以是通过流媒体协议或者HTTP等互联网协议实时上传至本端,是从而进行实时获取的。
在一个实施例中,用于购物的待识别语音信息被上传至本端后经过一段时间才被本端获取。
步骤220,将所述待识别语音信息转换为文本信息。
在一个实施例中,可以通过调用开放平台的语音识别API(ApplicationProgramming Interface,应用程序编程接口)将语音信息转化为文本信息。
步骤230,提取所述文本信息中的关键词。
在一个实施例中,通过将所述文本信息与预设的句式进行匹配,以得到所述文本信息中的关键词。比如文本信息为“找一台黑色的电脑”,而预设的句式包括:“找一台……”、“找一台……的……”、“找一部……”、“找一件……”、“找一个……”等,则通过这些句式与文本信息进行匹配得到的文本信息中的关键词为“黑色”和“电脑”。
在一个实施例中,预设的句式是根据专家经验设定的。
在一个实施例中,预设的句式是通过对预料库中的数据利用大数据方式统计出来的。
步骤240,根据所述关键词,构造所述语音信息的特征向量,作为第一特征向量。
在一个实施例中,预先设置了一个向量元素值库,在该向量元素值库中有预设的按照特定顺序排序的多个关键词,并且存储了每一个关键词对应的向量元素值,通过查询该向量元素值库,得到每一关键词对应的向量元素值,将所有所述关键词对应的所述向量元素值按照各对应的关键词在该向量元素值库中的排序,对各向量元素值进行排序,得到所述第一特征向量。
在一个实施例中,向量元素值库中关键词对应的向量元素值是根据经验设定的。
在一个实施例中,向量元素值库中关键词对应的向量元素值是根据大数据统计设定的。比如,关键词“海鲜”、“水产”、“鲜活”这几个关键词由于语境相近,统计出在同一或同类商品上同时出现的几率较高,可以为这些关键词设定相近的向量元素值,具体而言,向量元素值可以根据商品相关信息中出现这些关键词的频数来设定向量元素值的大小。比如在10000件海产品相关的商品中,有5600件商品信息中出现了“海鲜”、4800件商品信息中出现了“水产”、4600件商品信息中出现了“鲜活”,则可以分别将“海鲜”、“水产”、“鲜活”三个关键词的向量元素值分别设定为56、48和46,这样就可以使得相似的产品具有相近的向量元素值。
步骤250,基于所述第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量。
其中,所述预设的商品信息库包括多个商品信息,每一商品信息仅与一个第二特征向量对应。
商品信息是针对每一商品建立的能够表示该商品的特点、功能以及属性等内容的信息。其中包括文字形式的信息,还可包括图片、视频、音频等形式的信息。
在一个实施例中,商品信息包括商品名称、商品标题、商品广告语和商品描述信息等文字形式的信息。
在一个实施例中,第二特征向量是将商品信息的多个维度的文字特征按照一定方式量化后得到的向量。
在一个实施例中,从所述文本信息中提取的关键词为第一关键词,所述关键词属于预设的关键词与类型对应关系表中的一个类型,通过图4所示出的步骤来获取第二特征向量。如图4所示,包括以下步骤:
步骤251,从所述关键词与类型对应关系表中获取构造所述第一特征向量的所有所述第一关键词对应的类型。
类型是用于对关键词进行分类的标识信息,可以实现为文字、字符串等形式。
在一个实施例中,与手机这种商品有关的关键词与类型对应关系表可以如下所示:
类型 | 关键词 |
屏幕 | 全面屏、水滴屏、刘海屏、滑盖屏、曲面屏…… |
尺寸 | 小屏、大屏、宽屏、4.5英寸、5.2英寸、5.8英寸…… |
核心数 | 四核、六核、八核、十核…… |
内存 | 32G、64G、128G、256G、512G…… |
…… | …… |
在一个实施例中,事先根据经验建立了包含大量可能的商品信息的关键词,然后为每一关键词设定类型,得到关键词与类型对应关系表。
步骤252,在预设的商品信息库中获取每一商品信息的关键词,作为第二关键词。
在一个实施例中,商品信息为文字形式的信息,可以通过如下方式获取每一商品信息的第二关键词:将每一商品信息分成词;在分成的词中获取存在于预设的关键词库的词,作为第二关键词。
步骤253,在所有商品信息中,针对为每一商品信息获取的所有第二关键词,确定对应的类型分别与构造所述第一特征向量的每一所述第一关键词对应的类型匹配的第二关键词,作为第三关键词。
第一特征向量的第一关键词以及商品信息的第二关键词都可以与各种类型对应,针对每一商品信息,该商品信息中第二关键词可以与第一关键词所属的类型为同一类型,也可以与第一关键词所属的类型的不同类型。第二关键词属于第三关键词,但与第三关键词的不同之处在于:对应于一个商品信息中各个第三关键词的对应类型分别与第一特征向量的第一关键词的对应类型是相同的。
比如在接收到待识别语音信息并将所述待识别语音信息转换为文本信息后,得到的文本信息为“搜一个大屏四核64G内存的手机”,则提取出的关键词可以为“大屏”、“四核”和“64G”,假如在商品信息库中的一个商品信息的第二关键词为“全网通”、“5.5英寸”、“刘海屏”、“金色”和“六核”,则针对该商品信息获取的第三关键词为“5.5英寸”和“六核”;假如在商品信息库中的另一个商品信息的第二关键词为“高清”、“双核”、“32G”和“水滴屏”,则针对该商品信息获取的第三关键词为“双核”和“32G”。
步骤254,根据为每一商品信息确定的所述第三关键词,获取第二特征向量。
在一个实施例中,如图5所示,提供了步骤254的具体实现步骤,可以包括以下步骤:
步骤2541,获取每一所述第三关键词对应的向量元素值。
在一个实施例中,预先设置了一个向量元素值库,在该向量元素值库中为每一个目标关键词设置了对应的向量元素值,通过查询该向量元素值库,得到每一目标关键词对应的向量元素值。
在一个实施例中,该向量元素值库中每一类型的向量元素值都是按照预定规则设置的。比如对于手机来说,可以为与手机有关的小屏、大屏、宽屏、4.5英寸、5.2英寸、5.8英寸这六个关键词分别设置对应的向量元素值为50,100,150,60,90,130。
比如为一个大屏、四核、64G的手机的构建的第二特征向量可以为[100,150,200],而为一个小屏、双核、32G的手机构建的第二特征向量可以为[50,100,150],将特征向量的每一元素按照每一元素值的相似程度量化即可得每一特征向量向量元素值。
步骤2542,按照构造所述第一特征向量的所述第一关键词对应的类型的排序,根据每一第三关键词的对应类型,得到第三关键词的排序。
第一特征向量中各关键词是按照一定的先后顺序排序的,因此可以根据第一关键词在第一特征向量中的顺序,得到每一第一关键词对应类型的排序。类型是第一关键词与第三关键词之间建立联系的桥梁,由于每一第一关键词的类型都有第三关键词与之对应,因此在得到第一关键词对应类型的排序后,就可以根据每一第三关键词的对应类型,得到第三关键词的排序。
步骤2543,根据所述第三关键词的排序,对每一第三关键词对应的向量元素值进行排序,以生成第二特征向量。
易于理解,第三关键词与向量元素值是一一对应的,按照第三关键词的排序即可对向量元素值进行排序。
综上所述,根据图5所示出的实施例,提供了获取第二特征向量的具体方案,并且由于构建出的第二特征向量中各关键词的类型和顺序与第一特征向量都是一一对应的,因此提高了获取的第二特征向量与第一特征向量的相关性,使得基于两类特征向量获取的商品信息能够更加客观准确地反映出用户意图。
步骤260,基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量,作为目标特征向量。
在一个实施例中,通过如下方式获取目标特征向量:在获取的第二特征向量中,针对每一第二特征向量,获取所述第一特征向量与所述第二特征向量的余弦距离;根据所述余弦距离,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量,作为目标特征向量。
在一个实施例中,将所述余弦距离最小的第二特征向量,作为与所述第一特征向量匹配的第二特征向量。本实施例的好处在于,将在理论上与用户语音信息最匹配的向量返回至用户,提高了语音购物时搜索商品的效率。
在一个实施例中,将所述余弦距离小于预定余弦距离阈值的第二特征向量,作为与所述第一特征向量匹配的第二特征向量。本实施例的好处在于,通过选择若干个第二特征向量作为目标特征向量,因此当利用目标特征向量获取商品信息时,就会使得向用户返回的商品信息可以有更多的选择;另外,由于选出作为目标特征向量的第二特征向量的余弦距离是小于预定余弦距离阈值的,并且由于余弦距离并不一定完全与商品信息和待识别语音信息的匹配程度呈现正相关的关系,因此会提高语音购物时搜索商品的准确率。
在一个实施例中,根据所述余弦距离,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量,作为目标特征向量,包括:
对所有第二特征向量按照所述余弦距离从小到大进行排序;将排序在前预定数目的第二特征向量作为目标特征向量。本实施例的好处在于,由于每次获取的目标特征向量的数目是一致的,因此当根据目标特征向量来获取商品信息时,就会保证每次用户语音购物时接收到的商品信息的数目维持在稳定的范围内。
步骤270,将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
目标特征向量本质上是与所述第一特征向量匹配的第二特征向量,而第二特征向量是基于商品信息获得的,因此第二特征向量与商品信息是对应的,目标特征向量也与商品信息相对应。
所述待识别语音信息的采集端是与采集待识别语音信息的终端,该终端可以是本公开执行主体所处的终端,还可以是本公开执行主体之外的终端。
在一个实施例中,所述待识别语音信息的采集端可以是用户的智能手机,而本端是服务器。
在一个实施例中,所述待识别语音信息的采集端可以是连接有麦克风等音频采集设备的电子计算机,而本公开实施终端也是同一电子计算机。
在一个实施例中,所述待识别语音信息的采集端安装有应用程序,通过该应用程序录入待识别语音信息并接收所述目标特征向量对应的商品信息,所述采集端的用户还可以通过该应用程序对接收到的商品信息进行购物操作。
图3是根据图2对应实施例示出的一实施例的步骤230的细节流程图。如图3所示,包括以下步骤:
步骤231,将所述文本信息分成词。
在一个实施例中,通过使用THULAC(THU Lexical Analyzer for Chinese)等分词工具包对所述文本信息进行分词。
步骤232,将分成的词输入已训练的机器学习模型,得到所述机器学习模式输出的至少一个关键词组合的概率。
所述关键词组合是从文本信息中提取的关键词的集合,所述关键词组合包含至少一个关键词。
在本实施例中,已训练的机器学习模型是训练好的用于针对一个特定文本信息输出该文本信息中词语能作为该文本信息的关键词的概率的模型。
在一个实施例中,所述机器学习模型通过下列方式进行训练:获取大量样本信息,所述样本信息包括每一文本信息分成的词和与每一文本信息对应的专家事先提取出的关键词组合;然后将针对每一文本信息分成的词输入机器学习模型,得到一个或多个关键词的组合;然后将得到的一个或多个关键词的组合与专家根据对应文本信息提取的关键词组合进行比对;若比对结果不一致或者针对所有文本信息获得的比对结果不一致的比例大于预定比例阈值,则调整机器学习模型的参数,再次将文本信息分成的词输入机器学习模型,直至机器学习模型输出的一个或多个关键词的组合与专家根据对应文本信息提取的关键词组合比对结果一致或者针对所有样本信息,机器学习模型输出的一个或多个关键词的组合与专家根据对应文本信息提取的关键词组合比对结果不一致的比例小于或等于预定比例阈值。
步骤233,根据所述关键词组合的概率,确定一个关键词组合。
在一个实施例中,将关键词组合的概率最大的关键词组合作为确定出的关键词组合。
在一个实施例中,在关键词组合的概率大于预定概率阈值的关键词组合中任取一个关键词组合作为确定出的关键词组合。
步骤234,将所述关键词组合中的关键词作为所述文本信息中的关键词。
综上所述,本实施例的好处在于,通过使用训练好的机器学习模型来得到关键词组合的概率,然后根据概率来获取关键词,提高了提取文本信息中关键词的准确率和效率。
图6是根据图2对应实施例示出的一实施例的步骤260的细节流程图。如图6所示,包括以下步骤:
步骤261,对所有第二特征向量和所述第一特征向量进行聚类,以划分为多个簇。
聚类是将物理或抽象对象的集合分成由类似的对象组成的多个簇的过程,每一簇可以包含一个或多个对象,每一簇中的对象特征或者属性是类似的。
在一个实施例中,通过K-means算法对所有第二特征向量和所述第一特征向量进行聚类。K-means算法一般流程为:从所有第二特征向量和所述第一特征向量中任意选择m个特征向量作为初始聚类中心;计算所有特征向量与m个初始聚类中心的距离,将每一特征向量划归为与该特征向量的所述距离最近的初始聚类中心对应的簇;然后针对每一簇中的所有特征向量,确定重新确定该簇的聚类中心;用重新确定的簇的聚类中心进行迭代聚类直至聚类结果不再变化或者迭代次数达到预定阈值。
步骤262,获取所述第一特征向量所属的簇中的第二特征向量作为与所述第一特征向量匹配的第二特征向量。
由于每一簇中的特征向量之间的距离是足够近的,因此属于同一簇的特征向量都是近似的,所以与所述第一特征向量最近似的第二特征向量可以作为与所述第一特征向量匹配的第二特征向量。因此本实施例的好处在于,通过聚类的方式获取与所述第一特征向量匹配的第二特征向量,即目标特征向量,在一定程度上可以提高获取目标特征向量的效率和准确率。
本公开还提供了一种语音购物装置,以下是本公开的装置实施例。
图7是根据一示例性实施例示出的一种语音购物装置的框图。如图7所示,装置700包括:
获取模块710,被配置为获取采集的用于购物的待识别语音信息;
转换模块720,被配置为将所述待识别语音信息转换为文本信息;
提取模块730,被配置为提取所述文本信息中的关键词;
第一特征向量获取模块740,被配置为根据所述关键词,构造所述语音信息的特征向量,作为第一特征向量;
第二特征向量获取模块750,被配置为基于所述第一特征向量和预设的商品信息库中的商品信息,获取多个第二特征向量,其中,所述预设的商品信息库包括多个商品信息,每一商品信息仅与一个第二特征向量对应;
目标特征向量获取模块760,被配置为基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;
发送模块770,被配置为将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
据本公开的第三方面,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述根据本发明的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。
存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
根据本公开的第四方面,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (9)
1.一种语音购物方法,其特征在于,所述方法包括:
获取采集的用于购物的待识别语音信息;
将所述待识别语音信息转换为文本信息;
提取所述文本信息中的第一关键词;
根据所述第一关键词,构造所述语音信息的特征向量,作为第一特征向量;
从关键词与类型对应关系表中获取构造所述第一特征向量的所有所述第一关键词对应的类型;
在预设的商品信息库中获取每一商品信息的关键词,作为第二关键词,其中,所述预设的商品信息库包括多个商品信息;
在所有商品信息中,针对为每一商品信息获取的所有第二关键词,确定对应的类型分别与构造所述第一特征向量的每一所述第一关键词对应的类型匹配的第二关键词,作为第三关键词;
根据为每一商品信息确定的所述第三关键词,获取第二特征向量,其中,每一商品信息仅与一个第二特征向量对应;
基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;
将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
2.根据权利要求1所述的方法,其特征在于,所述提取所述文本信息中的第一关键词,包括:
将所述文本信息分成词;
在预设的关键词库中对所述分成的词进行检索以得到在分成的词中存在于所述关键词库中的词,作为所述文本信息中的第一关键词。
3.根据权利要求1所述的方法,其特征在于,所述提取所述文本信息中的第一关键词,包括:
将所述文本信息分成词;
将分成的词输入已训练的机器学习模型,得到所述机器学习模型输出的至少一个关键词组合的概率,所述关键词组合是从文本信息中提取的关键词的集合,所述关键词组合包含至少一个关键词;
根据所述关键词组合的概率,确定一个关键词组合;
将所述关键词组合中的关键词作为所述文本信息中的第一关键词。
4.根据权利要求1所述的方法,其特征在于,所述根据为每一商品信息确定的所述第三关键词,获取第二特征向量,包括:
获取每一所述第三关键词对应的向量元素值;
按照构造所述第一特征向量的所述第一关键词对应的类型的排序,根据每一第三关键词的对应类型,得到第三关键词的排序;
根据所述第三关键词的排序,对每一第三关键词对应的向量元素值进行排序,以生成第二特征向量。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量,包括:
在获取的第二特征向量中,针对每一第二特征向量,获取所述第一特征向量与所述第二特征向量的余弦距离;
根据所述余弦距离,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量,包括:
对所有第二特征向量和所述第一特征向量进行聚类,以划分为多个簇;
获取所述第一特征向量所属的簇中的第二特征向量作为与所述第一特征向量匹配的第二特征向量。
7.一种语音购物装置,其特征在于,所述装置包括:
获取模块,被配置为获取采集的用于购物的待识别语音信息;
转换模块,被配置为将所述待识别语音信息转换为文本信息;
提取模块,被配置为提取所述文本信息中的第一关键词;
第一特征向量获取模块,被配置为根据所述第一关键词,构造所述语音信息的特征向量,作为第一特征向量;
第二特征向量获取模块,被配置为从关键词与类型对应关系表中获取构造所述第一特征向量的所有所述第一关键词对应的类型;在预设的商品信息库中获取每一商品信息的关键词,作为第二关键词,其中,所述预设的商品信息库包括多个商品信息;在所有商品信息中,针对为每一商品信息获取的所有第二关键词,确定对应的类型分别与构造所述第一特征向量的每一所述第一关键词对应的类型匹配的第二关键词,作为第三关键词;根据为每一商品信息确定的所述第三关键词,获取第二特征向量,其中,每一商品信息仅与一个第二特征向量对应;
目标特征向量获取模块,被配置为基于所述第一特征向量,从获取的第二特征向量中确定出与所述第一特征向量匹配的第二特征向量作为目标特征向量;
发送模块,被配置为将所述目标特征向量对应的商品信息发送至所述待识别语音信息的采集端,以便所述采集端的用户进行购物操作。
8.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据权利要求1至6中任一项所述的方法。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435026.1A CN110347908B (zh) | 2019-05-23 | 2019-05-23 | 语音购物方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435026.1A CN110347908B (zh) | 2019-05-23 | 2019-05-23 | 语音购物方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110347908A CN110347908A (zh) | 2019-10-18 |
CN110347908B true CN110347908B (zh) | 2023-04-18 |
Family
ID=68173917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910435026.1A Active CN110347908B (zh) | 2019-05-23 | 2019-05-23 | 语音购物方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110347908B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825844A (zh) * | 2019-10-21 | 2020-02-21 | 拉扎斯网络科技(上海)有限公司 | 语音检索方法、装置、可读存储介质和电子设备 |
CN111522907A (zh) * | 2020-03-30 | 2020-08-11 | 深圳市阿斯盾云科技有限公司 | 智能语音购物方法及系统 |
CN111949763B (zh) * | 2020-07-15 | 2024-03-22 | 有米科技股份有限公司 | 基于文本素材的单品类别确定方法及装置 |
CN112365884A (zh) * | 2020-11-10 | 2021-02-12 | 珠海格力电器股份有限公司 | 耳语的识别方法和装置、存储介质、电子装置 |
CN113643095A (zh) * | 2021-08-06 | 2021-11-12 | 北京远舢智能科技有限公司 | 基于语音识别技术的售货方法、装置和电子设备 |
CN116308682B (zh) * | 2023-05-12 | 2023-10-27 | 阿里巴巴(中国)有限公司 | 提供商品信息的方法及电子设备 |
CN116777569A (zh) * | 2023-08-21 | 2023-09-19 | 北京赛博日新科技有限公司 | 基于区块链的商品大数据语音介绍和智能结账方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260459A (zh) * | 2015-10-13 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN107993134A (zh) * | 2018-01-23 | 2018-05-04 | 北京知行信科技有限公司 | 一种基于用户兴趣的智能购物交互方法及系统 |
CN108073568A (zh) * | 2016-11-10 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置 |
CN109522486A (zh) * | 2018-11-30 | 2019-03-26 | 北京字节跳动网络技术有限公司 | 用于匹配信息的方法和装置 |
-
2019
- 2019-05-23 CN CN201910435026.1A patent/CN110347908B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260459A (zh) * | 2015-10-13 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN108073568A (zh) * | 2016-11-10 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置 |
CN107993134A (zh) * | 2018-01-23 | 2018-05-04 | 北京知行信科技有限公司 | 一种基于用户兴趣的智能购物交互方法及系统 |
CN109522486A (zh) * | 2018-11-30 | 2019-03-26 | 北京字节跳动网络技术有限公司 | 用于匹配信息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110347908A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110347908B (zh) | 语音购物方法、装置、介质及电子设备 | |
CN109408526B (zh) | Sql语句生成方法、装置、计算机设备及存储介质 | |
CN109145219B (zh) | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 | |
CN108536852B (zh) | 问答交互方法和装置、计算机设备及计算机可读存储介质 | |
CN110019732B (zh) | 一种智能问答方法以及相关装置 | |
CN111177569A (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
CN107832414A (zh) | 用于推送信息的方法和装置 | |
CN104834651B (zh) | 一种提供高频问题回答的方法和装置 | |
CN112035598A (zh) | 一种智能语义检索方法、系统和电子设备 | |
CN111444304A (zh) | 搜索排序的方法和装置 | |
WO2019072098A1 (zh) | 一种识别核心产品词的方法和系统 | |
CN111078842A (zh) | 查询结果的确定方法、装置、服务器及存储介质 | |
CN113570413A (zh) | 广告关键词的生成方法、装置、存储介质及电子设备 | |
CN112818091A (zh) | 基于关键词提取的对象查询方法、装置、介质与设备 | |
CN115248839A (zh) | 一种基于知识体系的长文本检索方法以及装置 | |
CN114756570A (zh) | 采购场景的垂直搜索方法、装置和系统 | |
WO2022245469A1 (en) | Rule-based machine learning classifier creation and tracking platform for feedback text analysis | |
CN111209351A (zh) | 对象关系预测、对象推荐方法及装置、电子设备、介质 | |
CN114758742A (zh) | 病历信息处理方法、装置、电子设备及存储介质 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN109902152B (zh) | 用于检索信息的方法和装置 | |
CN107609921A (zh) | 一种数据处理方法及服务器 | |
CN114742062B (zh) | 文本关键词提取处理方法及系统 | |
CN111126073A (zh) | 语义检索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |