CN106776763A - 目的地搜索方法及装置 - Google Patents

目的地搜索方法及装置 Download PDF

Info

Publication number
CN106776763A
CN106776763A CN201611036342.4A CN201611036342A CN106776763A CN 106776763 A CN106776763 A CN 106776763A CN 201611036342 A CN201611036342 A CN 201611036342A CN 106776763 A CN106776763 A CN 106776763A
Authority
CN
China
Prior art keywords
destination
pronunciation
relevance scores
text
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611036342.4A
Other languages
English (en)
Other versions
CN106776763B (zh
Inventor
陶欣
崇伟峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201611036342.4A priority Critical patent/CN106776763B/zh
Publication of CN106776763A publication Critical patent/CN106776763A/zh
Application granted granted Critical
Publication of CN106776763B publication Critical patent/CN106776763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明是关于一种目的地搜索方法及装置,其中,方法包括:接收用户输入的关于待搜索目的地的语音信息;对语音信息进行识别,得到语音信息对应的发音信息和文本信息;根据发音信息和文本信息,在目的地数据库中搜索与待搜索目的地相似的多个候选目的地;分别计算每个候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;根据发音和文本相关性得分、空间距离因子和搜索热度因子,对多个候选目的地进行排序;显示排序后的多个候选目的地。通过该技术方案,可以在保证目的地搜索的准确率的基础上,提高目的地搜索的成功率,从而提升用户的使用体验。

Description

目的地搜索方法及装置
技术领域
本发明涉及数据搜索技术领域,尤其涉及一种目的地搜索方法及装置。
背景技术
在相关的导航类软件中,用户可以输入自己想去的目的地,导航类软件根据用户输入的目的地文本精确查找与该目的地匹配的目的地,但是如果用户输入的文本存在错别字等,就查找不到匹配的目的地,用户使用体验不佳。
发明内容
本发明实施例提供一种目的地搜索方法及装置,用以实现在保证目的地搜索的准确率的基础上,提高目的地搜索的成功率,从而提升用户的使用体验。
根据本发明实施例的第一方面,提供一种目的地搜索方法,包括:
接收用户输入的关于待搜索目的地的语音信息;
对所述语音信息进行识别,得到所述语音信息对应的发音信息和文本信息;
根据所述发音信息和所述文本信息,在目的地数据库中搜索与所述待搜索目的地相似的多个候选目的地;
分别计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序;
显示排序后的多个候选目的地。
在该实施例中,在搜索与待搜索目的地匹配的候选目的地时,根据发音信息和文本信息同时进行搜索,这样,即使文本信息中存在错误,也可以通过发音信息搜索到与其匹配的候选目的地,从而保证搜索的成功率,并且在搜索得到多个候选目的地后,根据候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子对多个候选目的地进行排序,这样,可以将与待搜索目的地最相似的候选目的地显示在最前面,即将用户最可能需要的候选目的地显示在前面,从而方便用户进行选择,进一步提升用户的使用体验。
在一个实施例中,所述计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分,包括:
将所述待搜索目的地和所述每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
根据第一预设公式,分别计算所述待搜索目的地和所述每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
根据所述第一相关性得分、所述第二相关性得分、所述第三相关性得分、所述第四相关性得分和第二预设公式,计算得到所述发音和文本相关性得分。
在一个实施例中,所述第一预设公式包括:
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在所述待搜索目的地和所述候选目的地中同时出现的次数的平方根,c表示所述候选目的地的词的总个数;
所述第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
在该实施例中,候选目的地中,与待搜索目的地中包含相同词越多,且包含同样词的候选目的地的词总个数越少,则和待搜索目的地的发音和文本相关性得分越高。
在一个实施例中,所述计算每个候选目的地与用户输入的起点位置之间的空间距离因子,包括:
获取用户输入的起点位置;
根据第三预设公式,计算所述起点位置与所述每个候选目的地之间的空间距离;
根据所述空间距离和第四预设公式,确定所述空间距离因子。
在一个实施例中,所述第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示所述空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
所述第四预设公式包括:
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scale2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,所述预设衰减参数小于1。
在该实施例中,候选目的地中,与用户输入的起点位置之间的距离越近,则越可能是用户想要搜索的目的地,而与起点位置之间的距离大于一定的距离范围时,则可能是用户想要搜索的目的地的可能性较小,因此,在排序时,可以引入空间距离因子这个因素。
在一个实施例中,所述计算每个候选目的地的搜索热度因子,包括:
获取每个候选目的地的搜索热度;
根据所述搜索热度和第五预设公式计算得到所述搜索热度因子。
在一个实施例中,所述第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示所述搜索热度。
在该实施例中,搜索热度越高的候选目的地是用户想要搜索的目的地的可能性可能越高,因此,还可以在排序时,引入搜索热度因子这个因素。
在一个实施例中,所述根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序,包括:
根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子以及第六预设公式,计算得到所述待搜索目的地与所述每个候选目的地之间的最终相关性得分;
将所述多个候选目的地按照最终相关性得分进行降序排列。
在一个实施例中,所述第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
在该实施例中,在搜索得到多个候选目的地后,根据候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子对多个候选目的地进行排序,这样,可以将与待搜索目的地最相似的候选目的地显示在最前面,即将用户最可能需要的候选目的地显示在前面,从而方便用户进行选择,进一步提升用户的使用体验。
根据本发明实施例的第二方面,提供一种目的地搜索装置,包括:
接收模块,用于接收用户输入的关于待搜索目的地的语音信息;
识别模块,用于对所述语音信息进行识别,得到所述语音信息对应的发音信息和文本信息;
搜索模块,用于根据所述发音信息和所述文本信息,在目的地数据库中搜索与所述待搜索目的地相似的多个候选目的地;
计算模块,用于分别计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
排序模块,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序;
显示模块,用于显示排序后的多个候选目的地。
在一个实施例中,所述计算模块包括:
拆分子模块,用于将所述待搜索目的地和所述每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
第一计算子模块,用于根据第一预设公式,分别计算所述待搜索目的地和所述每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
第二计算子模块,用于根据所述第一相关性得分、所述第二相关性得分、所述第三相关性得分、所述第四相关性得分和第二预设公式,计算得到所述发音和文本相关性得分。
在一个实施例中,所述第一预设公式包括:
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在所述待搜索目的地和所述候选目的地中同时出现的次数的平方根,c表示所述候选目的地的词的总个数;
所述第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
在一个实施例中,所述计算模块包括:
第一获取子模块,用于获取用户输入的起点位置;
第三计算子模块,用于根据第三预设公式,计算所述起点位置与所述每个候选目的地之间的空间距离;
确定子模块,用于根据所述空间距离和第四预设公式,确定所述空间距离因子。
在一个实施例中,所述第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示所述空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
所述第四预设公式包括:
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scal2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,所述预设衰减参数小于1。
在一个实施例中,所述计算模块包括:
第二获取子模块,用于获取每个候选目的地的搜索热度;
第四计算子模块,用于根据所述搜索热度和第五预设公式计算得到所述搜索热度因子。
在一个实施例中,所述第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示所述搜索热度。
在一个实施例中,所述排序模块包括:
第五计算子模块,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子以及第六预设公式,计算得到所述待搜索目的地与所述每个候选目的地之间的最终相关性得分;
排列子模块,用于将所述多个候选目的地按照最终相关性得分进行降序排列。
在一个实施例中,所述第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种目的地搜索方法的流程图。
图2是根据一示例性实施例示出的一种目的地搜索方法中步骤S104的流程图。
图3是根据一示例性实施例示出的另一种目的地搜索方法中步骤S104的流程图。
图4是根据一示例性实施例示出的空间距离因子的取值趋势图。
图5是根据一示例性实施例示出的又一种目的地搜索方法中步骤S104的流程图。
图6是根据一示例性实施例示出的搜索热度因子的取值趋势图。
图7是根据一示例性实施例示出的一种目的地搜索方法中步骤S105的流程图。
图8是根据一示例性实施例示出的一种目的地搜索装置的框图。
图9是根据一示例性实施例示出的一种目的地搜索装置中计算模块的框图。
图10是根据一示例性实施例示出的另一种目的地搜索装置中计算模块的框图。
图11是根据一示例性实施例示出的又一种目的地搜索装置中计算模块的框图。
图12是根据一示例性实施例示出的一种目的地搜索装置中排序模块的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种目的地搜索方法的流程图。该目的地搜索方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有导航功能的设备。如图1所示,该方法包括步骤S101-S106:
在步骤S101中,接收用户输入的关于待搜索目的地的语音信息;
在步骤S102中,对语音信息进行识别,得到语音信息对应的发音信息和文本信息;
其中,发音信息是语音信息对于的拼音信息,如用户输入的语音信息是“海淀剧院”,则对应的文本信息为“海淀剧院”,发音信息为“hai dian ju yuan”。
在步骤S103中,根据发音信息和文本信息,在目的地数据库中搜索与待搜索目的地相似的多个候选目的地;
在步骤S104中,分别计算每个候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
在步骤S105中,根据发音和文本相关性得分、空间距离因子和搜索热度因子,对多个候选目的地进行排序;
在步骤S106中,显示排序后的多个候选目的地。
在该实施例中,在搜索与待搜索目的地匹配的候选目的地时,根据发音信息和文本信息同时进行搜索,这样,即使文本信息中存在错误,也可以通过发音信息搜索到与其匹配的候选目的地,从而保证搜索的成功率,并且在搜索得到多个候选目的地后,根据候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子对多个候选目的地进行排序,这样,可以将与待搜索目的地最相似的候选目的地显示在最前面,即将用户最可能需要的候选目的地显示在前面,从而方便用户进行选择,进一步提升用户的使用体验。
图2是根据一示例性实施例示出的一种目的地搜索方法中步骤S104的流程图。
如图2所示,在一个实施例中,上述步骤S104包括步骤S201-S203:
在步骤S201中,将待搜索目的地和每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
例如,对于“海淀剧院”,将其拆分成一元发音字段为:[“hai”,“dian”,“ju”,“yuan”],拆分成二元发音字段为:[“haidian”,“dianju”,“juyuan”],拆分成一元文本字段为:[“海”,“淀”,“剧”,“院”],拆分成二元文本字段为:[“海淀”,“淀剧”,“剧院”]。
在步骤S202中,根据第一预设公式,分别计算待搜索目的地和每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
在一个实施例中,第一预设公式包括:
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在待搜索目的地和候选目的地中同时出现的次数的平方根,c表示候选目的地的词的总个数;
在步骤S203中,根据第一相关性得分、第二相关性得分、第三相关性得分、第四相关性得分和第二预设公式,计算得到发音和文本相关性得分。
第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
在该实施例中,候选目的地中,与待搜索目的地中包含相同词越多,且包含同样词的候选目的地的词总个数越少,则和待搜索目的地的发音和文本相关性得分越高。
下面以一个具体实施例详细说明上述技术方案。
例如,用户输入的待搜索目的地为“海淀剧院”,候选目的地为“海淀公园”,如果计算一元文本字段对应的第三相关性得分,即f=“一元文本字段”,则此时的词为单个汉字。
“海淀剧院”的词=[“海”,“淀”,“剧”,“院”]
“海淀公园”的词=[“海”,“淀”,“公”,“园”]
根据公式“海”和“淀”在待搜索目的地和候选目的地中共同出现各1次,分子为2;候选目的地“海淀公园”的词的总个数为4,则分母为2。因此在搜索“海淀剧院”时,候选目的地“海淀公园”的一元文本字段的相关性得分为1。
而计算f=“二元发音字段”时,词是相邻两个汉字的拼音:
“海淀剧院”的词=[“haidian”,“dianju”,“juyuan”]
“海淀公园”的词=[“haidian”,“diangong”,“gongyuan”]
“haidian”在待搜索目的地和候选目的地中共同出现,计1次tf,分子为1;候选目的地“海淀公园”按二元发音字段拆分,词的总为3,分母为因此在查询“海淀剧院”时,候选目的地“海淀公园”的“二元发音字段”的相关性得分为0.58。
图3是根据一示例性实施例示出的另一种目的地搜索方法中步骤S104的流程图。
如图3所示,在一个实施例中,上述步骤S104包括步骤S301-S303:
在步骤S301中,获取用户输入的起点位置;
在步骤S302中,根据第三预设公式,计算起点位置与每个候选目的地之间的空间距离;
在步骤S303中,根据空间距离和第四预设公式,确定空间距离因子。
在一个实施例中,第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
第四预设公式包括:
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scal2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,预设衰减参数小于1。
在该实施例中,候选目的地中,与用户输入的起点位置之间的距离越近,则越可能是用户想要搜索的目的地,而与起点位置之间的距离大于一定的距离范围时,则可能是用户想要搜索的目的地的可能性较小,因此,在排序时,可以引入空间距离因子这个因素。
下面以一个具体实施例详细说明上述技术方案。
在没有明确指定目的地所在行政区划的情况下,对于目的地推断仅仅依靠字面或者发音的相似性是不够的。例如北京和上海都有称为“中山公园”的地点,如果用户身在上海,返回北京的地址并不合适,因此需要引入基于空间距离的计算。
首先根据用户起点位置与候选目的地的经纬度得到两者之间的距离。记起点位置所在的经纬度经纬度坐标为(x0,y0),候选目的地经纬度经纬度坐标为(x,y),地球赤道半径为R,则两者的地球表面距离d可以近似为:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
可以认为以用户所在经纬度坐标为中心一定距离之内的候选目的地具有同样的可能性,而超过这个范围的候选目的地的可能性随距离增加降低。本发明中可以以gauss函数计算距离因子:
其中exp是指数函数,max取两个参数中数值较大者,b是一个固定的偏移量,候选目的地离当前起点位置的距离小于该偏移量时距离因子为1,对候选得分没有影响;距离大于该偏移量时距离因子开始衰减。
以上公式中σ2用于控制距离因子随距离增大而衰减的速度,本身由scale和decay两个参数决定:
σ2=-scale2/(2*log(decay))
当d-b恰等于scale时,空间距离因子的数值为decay;scale越小,空间距离因子随距离增加减小的速度越快;decay越小,空间距离因子随距离增加减小的速度越快。
具体地,例如设置b=20km,scale=300km,decay=0.5,空间距离因子的取值趋势如图4所示。
图5是根据一示例性实施例示出的又一种目的地搜索方法中步骤S104的流程图。
如图5所示,在一个实施例中,上述步骤S104包括步骤S501-S502:
在步骤S501中,获取每个候选目的地的搜索热度;
在步骤S502中,根据搜索热度和第五预设公式计算得到搜索热度因子。
在一个实施例中,第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示搜索热度。普通的候选目的地至少有搜索热度为1,故而搜索热度因子不会为0,而较高的搜索热度会提升候选目的地得分,提升程度由k决定,k的值越大,提升程度越高。例如,当k=1.5时,搜索热度因子的数值趋势如图6所示。
在该实施例中,搜索热度越高的候选目的地是用户想要搜索的目的地的可能性可能越高,因此,还可以在排序时,引入搜索热度因子这个因素。
图7是根据一示例性实施例示出的一种目的地搜索方法中步骤S105的流程图。
如图7所示,在一个实施例中,上述步骤S105包括步骤S701-S702:
在步骤S701中,根据发音和文本相关性得分、空间距离因子和搜索热度因子以及第六预设公式,计算得到待搜索目的地与每个候选目的地之间的最终相关性得分;
在步骤S702中,将多个候选目的地按照最终相关性得分进行降序排列。
在一个实施例中,第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
在该实施例中,在搜索得到多个候选目的地后,根据候选目的地与待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子对多个候选目的地进行排序,这样,可以将与待搜索目的地最相似的候选目的地显示在最前面,即将用户最可能需要的候选目的地显示在前面,从而方便用户进行选择,进一步提升用户的使用体验。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图8是根据一示例性实施例示出的一种目的地搜索装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图8所示,该目的地搜索装置包括:
接收模块81,用于接收用户输入的关于待搜索目的地的语音信息;
识别模块82,用于对所述语音信息进行识别,得到所述语音信息对应的发音信息和文本信息;
搜索模块83,用于根据所述发音信息和所述文本信息,在目的地数据库中搜索与所述待搜索目的地相似的多个候选目的地;
计算模块84,用于分别计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
排序模块85,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序;
显示模块86,用于显示排序后的多个候选目的地。
图9是根据一示例性实施例示出的一种目的地搜索装置中计算模块的框图。
如图9所示,在一个实施例中,所述计算模块84包括:
拆分子模块91,用于将所述待搜索目的地和所述每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
第一计算子模块92,用于根据第一预设公式,分别计算所述待搜索目的地和所述每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
第二计算子模块93,用于根据所述第一相关性得分、所述第二相关性得分、所述第三相关性得分、所述第四相关性得分和第二预设公式,计算得到所述发音和文本相关性得分。
在一个实施例中,所述第一预设公式包括:
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在所述待搜索目的地和所述候选目的地中同时出现的次数的平方根,c表示所述候选目的地的词的总个数;
所述第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
图10是根据一示例性实施例示出的另一种目的地搜索装置中计算模块的框图。
如图10所示,在一个实施例中,所述计算模块84包括:
第一获取子模块1001,用于获取用户输入的起点位置;
第三计算子模块1002,用于根据第三预设公式,计算所述起点位置与所述每个候选目的地之间的空间距离;
确定子模块1003,用于根据所述空间距离和第四预设公式,确定所述空间距离因子。
在一个实施例中,所述第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示所述空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
所述第四预设公式包括:
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scale2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,所述预设衰减参数小于1。
图11是根据一示例性实施例示出的又一种目的地搜索装置中计算模块的框图。
如图11所示,在一个实施例中,所述计算模块84包括:
第二获取子模块1101,用于获取每个候选目的地的搜索热度;
第四计算子模块1102,用于根据所述搜索热度和第五预设公式计算得到所述搜索热度因子。
在一个实施例中,所述第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示所述搜索热度。
图12是根据一示例性实施例示出的一种目的地搜索装置中排序模块的框图。
如图12所示,在一个实施例中,所述排序模块85包括:
第五计算子模块1201,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子以及第六预设公式,计算得到所述待搜索目的地与所述每个候选目的地之间的最终相关性得分;
排列子模块1202,用于将所述多个候选目的地按照最终相关性得分进行降序排列。
在一个实施例中,所述第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (18)

1.一种目的地搜索方法,其特征在于,包括:
接收用户输入的关于待搜索目的地的语音信息;
对所述语音信息进行识别,得到所述语音信息对应的发音信息和文本信息;
根据所述发音信息和所述文本信息,在目的地数据库中搜索与所述待搜索目的地相似的多个候选目的地;
分别计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序;
显示排序后的多个候选目的地。
2.根据权利要求1所述的方法,其特征在于,所述计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分,包括:
将所述待搜索目的地和所述每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
根据第一预设公式,分别计算所述待搜索目的地和所述每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
根据所述第一相关性得分、所述第二相关性得分、所述第三相关性得分、所述第四相关性得分和第二预设公式,计算得到所述发音和文本相关性得分。
3.根据权利要求2所述的方法,其特征在于,所述第一预设公式包括:
s ( f ) = Σ t t f ( t ) | c |
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在所述待搜索目的地和所述候选目的地中同时出现的次数的平方根,c表示所述候选目的地的词的总个数;
所述第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
4.根据权利要求1所述的方法,其特征在于,所述计算每个候选目的地与用户输入的起点位置之间的空间距离因子,包括:
获取用户输入的起点位置;
根据第三预设公式,计算所述起点位置与所述每个候选目的地之间的空间距离;
根据所述空间距离和第四预设公式,确定所述空间距离因子。
5.根据权利要求4所述的方法,其特征在于,
所述第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示所述空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
所述第四预设公式包括:
α = exp ( - m a x ( 0 , d - b ) 2 2 σ 2 )
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scal2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,所述预设衰减参数小于1。
6.根据权利要求1所述的方法,其特征在于,所述计算每个候选目的地的搜索热度因子,包括:
获取每个候选目的地的搜索热度;
根据所述搜索热度和第五预设公式计算得到所述搜索热度因子。
7.根据权利要求6所述的方法,其特征在于,所述第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示所述搜索热度。
8.根据权利要求1所述的方法,其特征在于,所述根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序,包括:
根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子以及第六预设公式,计算得到所述待搜索目的地与所述每个候选目的地之间的最终相关性得分;
将所述多个候选目的地按照最终相关性得分进行降序排列。
9.根据权利要求8所述的方法,其特征在于,所述第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
10.一种目的地搜索装置,其特征在于,包括:
接收模块,用于接收用户输入的关于待搜索目的地的语音信息;
识别模块,用于对所述语音信息进行识别,得到所述语音信息对应的发音信息和文本信息;
搜索模块,用于根据所述发音信息和所述文本信息,在目的地数据库中搜索与所述待搜索目的地相似的多个候选目的地;
计算模块,用于分别计算每个候选目的地与所述待搜索目的地之间的发音和文本相关性得分、每个候选目的地与用户输入的起点位置之间的空间距离因子以及每个候选目的地的搜索热度因子;
排序模块,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子,对所述多个候选目的地进行排序;
显示模块,用于显示排序后的多个候选目的地。
11.根据权利要求10所述的装置,其特征在于,所述计算模块包括:
拆分子模块,用于将所述待搜索目的地和所述每个候选目的地按照发音信息和文本信息,分别拆分成一元发音字段、二元发音字段、一元文本字段和二元文本字段;
第一计算子模块,用于根据第一预设公式,分别计算所述待搜索目的地和所述每个候选目的地之间一元发音字段对应的第一相关性得分、二元发音字段对应的第二相关性得分、一元文本字段对应的第三相关性得分和二元文本字段的对应的第四相关性得分;
第二计算子模块,用于根据所述第一相关性得分、所述第二相关性得分、所述第三相关性得分、所述第四相关性得分和第二预设公式,计算得到所述发音和文本相关性得分。
12.根据权利要求11所述的装置,其特征在于,所述第一预设公式包括:
s ( f ) = Σ t t f ( t ) | c |
其中,s(f)表示字段f的相关性得分,t表示字段f中的词,tf(t)表示字段f中的词t在所述待搜索目的地和所述候选目的地中同时出现的次数的平方根,c表示所述候选目的地的词的总个数;
所述第二预设公式包括:
发音和文本相关性得分=第一相关性得分×1+第二相关性得分×0.5+第三相关性得分×1+第四相关性得分×0.5。
13.根据权利要求10所述的装置,其特征在于,所述计算模块包括:
第一获取子模块,用于获取用户输入的起点位置;
第三计算子模块,用于根据第三预设公式,计算所述起点位置与所述每个候选目的地之间的空间距离;
确定子模块,用于根据所述空间距离和第四预设公式,确定所述空间距离因子。
14.根据权利要求13所述的装置,其特征在于,
所述第三预设公式包括:
d=R*arccos(sin(y0)sin(y)+cos(y0)cos(y)cos(x0-x))
其中,d表示所述空间距离,R表示地球赤道半径,(x0,y0)表示起点位置经纬度坐标,(x,y)表示候选目的地经纬度坐标,arccos表示反余弦函数,sin表示正弦函数,cos表示余弦函数;
所述第四预设公式包括:
α = exp ( - m a x ( 0 , d - b ) 2 2 σ 2 )
其中,α表示空间距离因子,exp表示指数函数,max表示取两个参数中数值较大者,b表示预设偏移量,σ2表示预设衰减函数,其中,
σ2=-scale2/(2*log(decay))
其中,scale表示预设距离范围,decay表示预设衰减参数,所述预设衰减参数小于1。
15.根据权利要求10所述的装置,其特征在于,所述计算模块包括:
第二获取子模块,用于获取每个候选目的地的搜索热度;
第四计算子模块,用于根据所述搜索热度和第五预设公式计算得到所述搜索热度因子。
16.根据权利要求15所述的装置,其特征在于,所述第五预设公式包括:
β=log(1+k*θ)
其中,β表示搜索热度因子,k表示预设热度参数,k>0,θ表示所述搜索热度。
17.根据权利要求10所述的装置,其特征在于,所述排序模块包括:
第五计算子模块,用于根据所述发音和文本相关性得分、所述空间距离因子和所述搜索热度因子以及第六预设公式,计算得到所述待搜索目的地与所述每个候选目的地之间的最终相关性得分;
排列子模块,用于将所述多个候选目的地按照最终相关性得分进行降序排列。
18.根据权利要求17所述的装置,其特征在于,所述第六预设公式包括:
最终相关性得分=发音和文本相关性得分×空间距离因子×搜索热度因子。
CN201611036342.4A 2016-11-22 2016-11-22 目的地搜索方法及装置 Active CN106776763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611036342.4A CN106776763B (zh) 2016-11-22 2016-11-22 目的地搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611036342.4A CN106776763B (zh) 2016-11-22 2016-11-22 目的地搜索方法及装置

Publications (2)

Publication Number Publication Date
CN106776763A true CN106776763A (zh) 2017-05-31
CN106776763B CN106776763B (zh) 2019-12-06

Family

ID=58970388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611036342.4A Active CN106776763B (zh) 2016-11-22 2016-11-22 目的地搜索方法及装置

Country Status (1)

Country Link
CN (1) CN106776763B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101475A (zh) * 2017-06-20 2018-12-28 北京嘀嘀无限科技发展有限公司 出行语音识别方法、系统和计算机设备
CN110472158A (zh) * 2018-05-11 2019-11-19 北京搜狗科技发展有限公司 一种搜索条目的排序方法和装置
CN110750610A (zh) * 2019-10-14 2020-02-04 广州小鹏汽车科技有限公司 目的地的处理方法及装置、电子终端和介质
CN111611372A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 搜索结果的排序方法及装置、音乐搜索方法及装置
CN112652298A (zh) * 2020-12-11 2021-04-13 北京百度网讯科技有限公司 语音识别方法、装置、电子设备和存储介质
CN113223516A (zh) * 2021-04-12 2021-08-06 北京百度网讯科技有限公司 语音识别方法和装置
CN113722447A (zh) * 2021-11-03 2021-11-30 南京云问网络技术有限公司 一种基于多策略匹配的语音搜索方法
US11302313B2 (en) 2017-06-15 2022-04-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for speech recognition

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279877A (zh) * 2013-05-06 2013-09-04 曾锃 一种客户信息搜索和排名方法
CN104143005A (zh) * 2014-08-04 2014-11-12 五八同城信息技术有限公司 一种相关搜索系统及方法
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN105574173A (zh) * 2015-12-18 2016-05-11 畅捷通信息技术股份有限公司 基于语音识别的商品搜索方法及商品搜索装置
CN105760381A (zh) * 2014-12-16 2016-07-13 深圳市腾讯计算机系统有限公司 搜索结果处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279877A (zh) * 2013-05-06 2013-09-04 曾锃 一种客户信息搜索和排名方法
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN104143005A (zh) * 2014-08-04 2014-11-12 五八同城信息技术有限公司 一种相关搜索系统及方法
CN105760381A (zh) * 2014-12-16 2016-07-13 深圳市腾讯计算机系统有限公司 搜索结果处理方法及装置
CN105574173A (zh) * 2015-12-18 2016-05-11 畅捷通信息技术股份有限公司 基于语音识别的商品搜索方法及商品搜索装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11302313B2 (en) 2017-06-15 2022-04-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for speech recognition
CN109101475A (zh) * 2017-06-20 2018-12-28 北京嘀嘀无限科技发展有限公司 出行语音识别方法、系统和计算机设备
CN109101475B (zh) * 2017-06-20 2021-07-27 北京嘀嘀无限科技发展有限公司 出行语音识别方法、系统和计算机设备
CN110472158A (zh) * 2018-05-11 2019-11-19 北京搜狗科技发展有限公司 一种搜索条目的排序方法和装置
CN110472158B (zh) * 2018-05-11 2024-01-30 北京搜狗科技发展有限公司 一种搜索条目的排序方法和装置
CN111611372A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 搜索结果的排序方法及装置、音乐搜索方法及装置
CN110750610A (zh) * 2019-10-14 2020-02-04 广州小鹏汽车科技有限公司 目的地的处理方法及装置、电子终端和介质
CN112652298A (zh) * 2020-12-11 2021-04-13 北京百度网讯科技有限公司 语音识别方法、装置、电子设备和存储介质
CN113223516A (zh) * 2021-04-12 2021-08-06 北京百度网讯科技有限公司 语音识别方法和装置
CN113722447A (zh) * 2021-11-03 2021-11-30 南京云问网络技术有限公司 一种基于多策略匹配的语音搜索方法
CN113722447B (zh) * 2021-11-03 2022-02-08 南京云问网络技术有限公司 一种基于多策略匹配的语音搜索方法

Also Published As

Publication number Publication date
CN106776763B (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN106776763A (zh) 目的地搜索方法及装置
AU2014255510B2 (en) A method and apparatus for identifying and communicating locations
CN105205180B (zh) 一种知识图谱的评价方法及装置
CN103428165B (zh) 社交网络节点分组方法和装置
CN109829289B (zh) 口令猜测方法
CN109684446B (zh) 文本语义相似度计算方法及装置
CN106682035A (zh) 一种个性化学习推荐方法及装置
US20160019280A1 (en) Identifying question answerers in a question asking system
CN108519998B (zh) 基于知识图谱的问题引导方法及装置
Watanabe et al. Advantages and Drawbacks of Smartphones and Tablets for Visually Impaired People——Analysis of ICT User Survey Results——
Šepić et al. BrailleEasy: one-handed braille keyboard for smartphones
CN110020059A (zh) 用于包容性captcha的系统和方法
CN108255962A (zh) 知识点关联方法、装置、存储介质和电子设备
US10282453B2 (en) Contextual and interactive sessions within search
CN112132118B (zh) 人物关系识别方法、装置、电子设备及计算机存储介质
US20170109408A1 (en) Topic presentation method, device, and computer program
Yockey Validation Study of the Critical Thinking Dispositions Scale: A Brief Report.
WO2012015021A1 (en) Stroke and structure input method and system
CN107209916A (zh) 漫画数据显示装置及方法
Callier Machine learning in evolutionary studies comes of age
US20070050186A1 (en) Succession chinese character input method, electronic product for use in succession chinese character input method
Garzon Exploring Miamians’ perceptions of linguistic variation in Miami-Dade County and the state of Florida
CN106293129B (zh) 一种中文输入法中输入单个汉字的方法
CN104156491A (zh) 移动终端及其列表信息检索方法
CN108446277A (zh) 模拟学习的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200326

Address after: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Co-patentee after: Xiamen yunzhixin Intelligent Technology Co.,Ltd.

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: No. 101, 1st Floor, 1st Building, Xisanqi Building Materials City, Haidian District, Beijing, 100000

Patentee before: Yunzhisheng Intelligent Technology Co.,Ltd.