CN104199956B - 一种erp数据语音搜索方法 - Google Patents

一种erp数据语音搜索方法 Download PDF

Info

Publication number
CN104199956B
CN104199956B CN201410471323.9A CN201410471323A CN104199956B CN 104199956 B CN104199956 B CN 104199956B CN 201410471323 A CN201410471323 A CN 201410471323A CN 104199956 B CN104199956 B CN 104199956B
Authority
CN
China
Prior art keywords
erp
information
speech recognition
data
text
Prior art date
Application number
CN201410471323.9A
Other languages
English (en)
Other versions
CN104199956A (zh
Inventor
曹毅
Original Assignee
成都博智维讯信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 成都博智维讯信息技术有限公司 filed Critical 成都博智维讯信息技术有限公司
Priority to CN201410471323.9A priority Critical patent/CN104199956B/zh
Publication of CN104199956A publication Critical patent/CN104199956A/zh
Application granted granted Critical
Publication of CN104199956B publication Critical patent/CN104199956B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Abstract

为了提升ERP数据语音检索的效率和便捷性,本发明提供了一种erp数据语音搜索方法。该方法包括:(1)建立可供语音搜索的ERP数据库;(2)解析采集到的用户查询语音;(3)对所输入的语音进行喉音识别,获得发音者的权限信息;当权限信息有效时,得到所输入的语音对应的语音识别文本;(4)根据所述语音识别文本对所述ERP数据库进行ERP数据搜索。本发明不仅提高了检索的效率,而且使ERP数据检索智能化地识别了当前查询者的身份认证信息并获得了相应的查询权限,使用户得到人性化的用户体验。

Description

一种erp数据语音搜索方法
技术领域
[0001] 本发明涉及数据检索领域。更具体地,涉及一种erp数据语音搜索方法。
背景技术
[0002] 目前,互联网和信息技术的应用已经深入到企业行为和个人生活的方方面面,许 多企业己经基于互联网建立自己的企业应用系统和网站,用于改善内部管理、降低成本、提 高效率,从而提升企业的竞争力;个人也可能充分享受互联网和信息技术带来的种种好处, 诸如开阔视野、缩短时空距离等。更多的资讯网及分类生活网站更开辟出大量广告版面增 加企业效益。
[0003]搜索是一种在网络上应用的具有大数据量的软件系统通常具有的功能,其以一定 的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的 信息搜索服务。
[0004]随着ERP系统的发展,ERP系统的网络上的数据总量在以爆炸式的速度增长。一方 面,搜索无疑是帮助人们快速找到所需数据资源的一种重要方式。另一方面,随着语音识别 技术的应用,语音搜索也逐渐成为搜索方式的发展趋势之一。
[0005] —些相关技术方案己经提出用于这种数据搜索方案。例如,申请号为 2〇0510034210 • 3的中国专利申请公开了一种基于INTERNET的多语钟语音域名和语音搜索 方法,其基于Internet的域名解释技术,语音识别(ASR)技术,语音合成(TTS)技术,结合了 Internet、语音CODEC、视频CODEC、TCP/IP、数据库技术和软件技术的多语种因特网语音访 问及搜索系统,根据用户用语音发出目标网站或其它平台的名称后直达访问,用语音发出 搜索网站的名称到达搜索站,并发出搜索关键词语音,完成目标搜索。
[0006]然而,现有搜索在网络上对语音的搜索效率还不能令人满意。
[0007]此外,对于ERP这种复杂庞大的系统来说,语音搜索多数情况下仍然依赖于使用 ERP系统自身的权限管理模块实现权限管理,面对不同的使用者使用查询和数据搜索功能 时,必须退出当前用户的系统并让其他人重新其自身的身份登陆到系统中。这给使用者带 来了极大的不便。尤其是在登陆手机端等键盘或点击操作方式不便输入的客户界面时,这 种低效率的问题就更加明显。
发明内容
[0008]为了克服现有技术的上述不足,本发明提供了一种erp数据语音搜索方法。该方法 包括:
[0009] ⑴建立可供语音搜索的ERP数据库;
[0010] ⑵解析采集到的用户查询语音;
[0011] (3)对所输入的语音进行喉音识别,获得发音者的权限信息;当权限信息有效时, 得到所输入的语音对应的语音识别文本;
[0012] ⑷根据所述语音识别文本对所述ERP数据库进行ERP数据搜索。
[0013] 进一步地,所述建立可供语音搜索的ERP数据库进一步包括:
[0014]获取ERP数据的标引信息和属性信息;
[0015]关联所述标引信息和属性信息,建立ERP数据索引。
[0016]进一步地,所述获取ERP数据的标引信息,具体包括:
[0017] 将原始的ERP数据变换为预设的编码格式;
[0018] 对变换后的ERP数据内容方面和文件大小方面标引;
[0019]对所述内容方面的标引找出关键词。
[0020] 进一步地,所述关键词为动词。
[0021] 进一步地,所述关键词为出现频次高的名词。
[0022] 进一步地,所述ERP数据还包括语音数据。
[0023]进一步地,获得ERP数据的标引信息包括获得语音数据的标引信息,具体包括: [0024] 获取识别路径和所述识别路径对应的语音识别文本;
[0025]获得语音识别文本中的人名信息,并对人名信息进行标引;
[0026] 获得语音识别文本中的关键词。
[0027]进一步地,所述属性信息包括ERP数据中的以往检索者信息权限信息。
[0028]进一步地,所述得到对应的语音识别文本,具体包括:
[0029] 获得解析采集到的用户查询语音的结果;
[0030]将上述结果进行区间划分;
[0031] 对每个区间音频信号分别进行语音识别获得段识别文本;
[0032]拼接每个区间音频信号的所述段识别文本得到所述语音识别文本。
[0033]进一步地,所述根据所述语音识别文本对所述ERP数据库进行ERP数据搜索,具体 包括:
[0034]根据所述属性信息,在ERP数据库中查找低于语音输入者权限的信息。
[0035]本发明的有益效果如下:基于使用者输入的语音信息,ERP数据检索智能化地识别 了当前查询者的身份认证信息并获得了相应的查询权限。而且,在建立高频动词、名词和人 名的索引这种高效率检索索引的基础上将待检索的数据范围按照权限进行了缩小,提高了 搜索效率。在会议或移动办公场合中,本发明提供的搜索技术具有免于用户身份切换的极 其人性化的用户体验。
附图说明
[0036]图1示出了本发明的语音搜索方法的流程图。
具体实施方式
[0037]下面将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施 例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于 本发明保护的范围。
[0038]如图1所示,根据优选的实施例的ERP数据语音搜索方法包括以下步骤:
[0039] 步骤100:建立可供语音搜索的ERP数据库;
[0040]步骤200:解析采集到的用户查询语音;
[0041]步骤300:对所输入的语音进行喉音识别,获得发音者的权限信息;当权限信息有 效时,得到所输入的语音对应的语音识别文本;
[0042]步骤400:根据所述语音识别文本对所述ERP数据库进行ERP数据搜索。
[0043]所述建立可供语音搜索的ERP数据库进一步包括:获取ERP数据的标引信息和属性 信息;
[0044]关联所述标引信息和属性信息,建立ERP数据索引。
[0045]所述获取ERP数据的标引信息,具体包括:
[0046]首先,将原始的ERP数据变换为预设的编码格式。将从不同信号源获取的ERP数据 变换到预设的格式。这里,不同信号源主要包括两个方面:一是通过ERP系统直接录入的信 息;二是通过ERP系统的数据接口从外部导入的信息。在此,要被预设的格式主要包括采样 率和存储格式。例如,将ERP数据文件B、C、D中的语音数据转换成待混音以发送给宿客户端A 的16k采样率、单声道的PCM数据;将ERP数据文件A、C、D的语音数据转换成待混音以发送给 宿客户端B的Ilk采样率、单声道的PCM数据;将ERP数据文件A、B、D的语音数据转换成待混音 以发送给宿客户端C的22k采样率、双声道的PCM数据;或者是,将ERP数据文件A、B、C的语音 数据转换成待混音以发送给宿客户端D的44k采样率、双声道的PCM数据。
[0047]然后,对变换后的ERP数据内容方面和文件大小方面标引。在这一步骤中,要检测 每个ERP数据字段或者ERP数据文件的大小,并且从语音文件名中提取内容方面的信息,例 如:“2014年零售部上半年业绩总结大会会议记录”、“人力资源管理能力培训系列讲座 (一)”、“申请增开广州黄浦区物流中心的报文”等等。
[0048]最后,对所述内容方面的标引找出关键词。所述关键词为动词或者出现频次高的 名词。根据上面的例子,这里的关键词可以选为“总结”、“讲座”、“增开”、“物流中心”等。每 个ERP数据字段或者ERP数据文件对应的关键词的数量至少为一个。
[0049] 所述ERP数据还包括语音数据。例如,上述ERP实例中就包括了 “2014年零售部上半 年业绩总结大会会议记录”这种语音信息记录。对于这类信息,获得ERP数据的标引信息包 括获得语音数据的标引信息,具体包括:获取识别路径和所述识别路径对应的语音识别文 本;
[0050]获得语音识别文本中的人名信息,并对人名信息进行标引;获得语音识别文本中 的关键词。
[0051]在本发明的另一个实施例中,在上述获取识别路径和所述识别路径对应的语音识 另|J文本的步骤中,利用自动连续语音识别方法,得到语音识别的前M条优选识别路径,以及 每条路径对应的识别结果。在获得语音识别文本中的人名信息步骤中,获取人名信息。然 后,将上述识别结果和人名信息进行信息匹配融合,并按照得分规则选择匹配得分最高的 结果作为语音识别文本。
[0052]对于语音数据,所述属性信息包括ERP数据中的以往检索者信息权限信息。这样, 在上述得到对应的语音识别文本的步骤中,具体包括:接收来自客户端的音频信号,并进行 解码。
[0053]可将音频解码为PCM格式;将解码后的音频信号根据静音进行端点检测,从而将连 续的音频信号切分为几段;将每段音频分别送入到分布式连续语音识别引擎中,并行进行 语音识别的处理;回收所有并行处理的语音识别的结果片段,并拼接得到完整的语音识别 结果。
[0054]在具体查找的过程中,文本搜索范围基于权限识别的结果。也就是说,所述根据所 述语音识别文本对所述ERP数据库进行ERP数据搜索是根据所述属性信息,在ERP数据库中 查找低于语音输入者权限的信息。这样,搜索范围被合理地缩小,在海量数据中极大地提高 了搜索效率。
[0055]根据本发明的实施例,上述属性信息可以被通过如下的方式获得:对语音识别的 文本结果进行语义理解,触发对ERP数据的搜索命令,并将搜索结果返回给用户,语音识别 的文本结果作为查询文本,对文本进行语义理解是指对提取文本中关键的、有意义的词,作 为查询检索的查询词。
[0056]本步骤提供两种提取查询词的方法,一种是基于属性的查询词提取,另一种是基 于实体、概念的查询词的抽取。触发对ERP数据的知识库的搜索命令,并将搜索结果返回给 用户,其具体包括:基于预定义的属性词典和用户查询语法规则提取语音识别的文本结果 中的属性信息。
[0057]对于属性信息进行扩展,得到扩展后的属性信息。所述的扩展主要是根据知识图 谱进行同义词、相关词等的扩展。
[0058]从语音识别的文本结果中抽取实体、概念等关键词信息。利用机器学习的方法从 海量的语料中学习到实体、概念等关键词信息。再利用这些信息从语音识别的文本结果中 抽取实体、概念等关键词。
[0059]对关键词信息进行扩展,得到扩展后的关键词信息。所述的扩展主要是根据知识 图谱进行同义词、相关词等的扩展。
[0060]利用属性信息从ERP数据的知识库中进行属性搜索,得到基于元数据的搜索结果。 [0061]利用关键词信息并从ERP数据的知识库中进行关键词搜索,得到基于关键词的搜 索结果;
[0062]对基于属性的搜索结果和基于关键词的搜索结果融合,得到最终的搜索结果,并 将结果返回给用户。
[0063]本发明中,喉音是指用户在发音时喉部产生的振动,其与普通的语音区别在于没 有考虑声道和鼻腔发音。
[00M]尽管已经显示并描述了本发明的示例性实施例,但是本领域的技术人员应该理 解,在不脱离本发明的原理和精神的情况下,可对这些实施例进行各种改变。本发明的范围 由所附的权利要求和等同物所限定。

Claims (8)

1.一种erp数据语音搜索方法,其特征在于,该方法包括:⑴建立可供语音搜索的ERP 数据库;⑵解析采集到的用户查询语音^3)对所输入的语音进行喉音识别,获得发音者的 权限信息;当权限信息有效时,得到所输入的语音对应的语音识别文本;(4)根据所述语音 识别文本对所述ERP数据库进行ERP数据搜索,其中:喉音是指用户在发音时喉部产生的振 动,其与语音区别在于没有考虑声道和鼻腔发音,所述建立可供语音搜索的ERP数据库进一 步包括:获取ERP数据的标引信息和属性信息;关联所述标引信息和属性信息,建立ERP数据 索引; 获得ERP数据的标引信息包括获得语音数据的标引信息,具体包括:获取识别路径和所 述识别路径对应的语音识别文本;获得语音识别文本中的人名信息,并对人名信息进行标 弓丨;获得语音识别文本中的关键词;并且 在上述获取识别路径和所述识别路径对应的语音识别文本的步骤中,利用自动连续语 音识别方法,得到语音识别的前若干条优选识别路径,以及每条路径对应的识别结果;在获 得语音识别文本中的人名信息步骤中,获取人名信息;然后,将上述识别结果和人名信息进 行信息匹配融合,并按照得分规则选择匹配得分最高的结果作为语音识别文本;所述根据 所述语音识别文本对所述ERP数据库进行ERP数据搜索是根据所述属性信息,在ERP数据库 中查找低于语音输入者权限的信息。
2. 根据权利要求1所述的方法,其特征在于,所述获取ERP数据的标引信息,具体包括: 将原始的ERP数据变换为预设的编码格式;对变换后的ERP数据内容方面和文件大小方面标 弓丨;对所述内容方面的标引找出关键词。
3. 根据权利要求2所述的方法,其特征在于,所述关键词为动词。
4. 根据权利要求2所述的方法,其特征在于,所述关键词为出现频次高的名词。
5. 根据权利要求1所述的方法,其特征在于,所述ERP数据还包括语音数据。
6. 根据权利要求1所述的方法,其特征在于,所述属性信息包括ERP数据中的以往检索 者信息权限信息。
7. 根据权利要求1所述的方法,其特征在于,所述得到所输入的对应的语音识别文本, 具体包括:获得解析采集到的用户查询语音的结果;将上述结果进行区间划分;对每个区间 音频信号分别进行语音识别获得段识别文本;拼接每个区间音频信号的所述段识别文本得 到所述语音识别文本。
8. 根据权利要求1所述的方法,其特征在于,所述根据所述语音识别文本对所述ERP数 据库进行ERP数据搜索,具体包括:根据所述属性信息,在ERP数据库中查找低于语音输入者 权限的信息。
CN201410471323.9A 2014-09-16 2014-09-16 一种erp数据语音搜索方法 CN104199956B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410471323.9A CN104199956B (zh) 2014-09-16 2014-09-16 一种erp数据语音搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410471323.9A CN104199956B (zh) 2014-09-16 2014-09-16 一种erp数据语音搜索方法

Publications (2)

Publication Number Publication Date
CN104199956A CN104199956A (zh) 2014-12-10
CN104199956B true CN104199956B (zh) 2018-01-16

Family

ID=52085249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410471323.9A CN104199956B (zh) 2014-09-16 2014-09-16 一种erp数据语音搜索方法

Country Status (1)

Country Link
CN (1) CN104199956B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10158734B2 (en) * 2015-04-01 2018-12-18 Google Llc Trigger associated notification delivery in an enterprise system
CN105260473A (zh) * 2015-10-28 2016-01-20 汤占宇 一种信息查询系统及方法
CN105488142B (zh) * 2015-11-24 2019-07-30 科大讯飞股份有限公司 成绩信息录入方法及系统
CN107967267A (zh) * 2016-10-18 2018-04-27 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN107610699A (zh) * 2017-09-06 2018-01-19 深圳金康特智能科技有限公司 一种具有会议记录功能的智能穿戴装置
CN107767873A (zh) * 2017-10-20 2018-03-06 广东电网有限责任公司惠州供电局 一种快速准确的离线语音识别装置及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576920A (zh) * 2009-06-19 2009-11-11 用友软件股份有限公司 搜索引擎系统
CN101950249A (zh) * 2010-07-14 2011-01-19 北京理工大学 默声音符编码字符输入方法和装置
CN102280106A (zh) * 2010-06-12 2011-12-14 三星电子株式会社 用于移动通信终端的语音网络搜索方法及其装置
CN103177315A (zh) * 2011-12-21 2013-06-26 北大方正集团有限公司 Erp信息发布方法及系统
CN103294690A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种检索方法及系统
CN103366745A (zh) * 2012-03-29 2013-10-23 三星电子(中国)研发中心 基于语音识别保护终端设备的方法及其终端设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8903847B2 (en) * 2010-03-05 2014-12-02 International Business Machines Corporation Digital media voice tags in social networks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576920A (zh) * 2009-06-19 2009-11-11 用友软件股份有限公司 搜索引擎系统
CN102280106A (zh) * 2010-06-12 2011-12-14 三星电子株式会社 用于移动通信终端的语音网络搜索方法及其装置
CN101950249A (zh) * 2010-07-14 2011-01-19 北京理工大学 默声音符编码字符输入方法和装置
CN103177315A (zh) * 2011-12-21 2013-06-26 北大方正集团有限公司 Erp信息发布方法及系统
CN103294690A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种检索方法及系统
CN103366745A (zh) * 2012-03-29 2013-10-23 三星电子(中国)研发中心 基于语音识别保护终端设备的方法及其终端设备

Also Published As

Publication number Publication date
CN104199956A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
US10297252B2 (en) Predicting and learning carrier phrases for speech input
US10878009B2 (en) Translating natural language utterances to keyword search queries
US20180232362A1 (en) Method and system relating to sentiment analysis of electronic content
US9870405B2 (en) System and method for evaluating results of a search query in a network environment
US8719020B1 (en) Generation of voice profiles
US20170242934A1 (en) Methods for integrating semantic search, query, and analysis and devices thereof
US9442930B2 (en) System, method and computer program product for automatic topic identification using a hypertext corpus
US10896184B2 (en) Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
Hiemstra et al. Parsimonious language models for information retrieval
TWI506460B (zh) 內容推薦系統及方法
CA2832909C (en) System and method for matching comment data to text data
KR101389148B1 (ko) 오리지널 유저 입력에 기초한 유저 입력의 제안 및 정제
US8903714B2 (en) Concept search and semantic annotation for mobile messaging
US8516052B2 (en) Dynamically managing online communication groups
US7962326B2 (en) Semantic answering system and method
US7403938B2 (en) Natural language query processing
JP4436909B2 (ja) 名前をハイパーリンクするためのシステム、方法、及びソフトウェア
CN101996195B (zh) 音频文件中语音信息的搜索方法、装置及设备
KR101359715B1 (ko) 모바일 음성 웹 제공 방법 및 장치
US7509313B2 (en) System and method for processing a query
US20190034040A1 (en) Method for extracting salient dialog usage from live data
US10339161B2 (en) Expanding network relationships
US7505956B2 (en) Method for classification
EP3410311A1 (en) Campaign information pushing method and device
US7623648B1 (en) Method and system of generating reference variations for directory assistance data

Legal Events

Date Code Title Description
PB01 Publication
C06 Publication
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 610000 No. 25 Fangqin Street, Chengdu High-tech Zone, Sichuan Province

Patentee after: Chengdu Bozhiwei information technology Limited by Share Ltd

Address before: 610000 No. 25 Fangqin Street, Chengdu High-tech Zone, Sichuan Province

Patentee before: CHENGDU BIZ-UNITED INFORMATION TECHNOLOGY CO., LTD.

CP01 Change in the name or title of a patent holder