CN109190130B - 一种基于poi相似度与翻译机器匹配推荐算法的研究方法 - Google Patents

一种基于poi相似度与翻译机器匹配推荐算法的研究方法 Download PDF

Info

Publication number
CN109190130B
CN109190130B CN201811008690.XA CN201811008690A CN109190130B CN 109190130 B CN109190130 B CN 109190130B CN 201811008690 A CN201811008690 A CN 201811008690A CN 109190130 B CN109190130 B CN 109190130B
Authority
CN
China
Prior art keywords
translation
user
poi
attribute
popularity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811008690.XA
Other languages
English (en)
Other versions
CN109190130A (zh
Inventor
龙华
王瑞
邵玉斌
杜庆治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201811008690.XA priority Critical patent/CN109190130B/zh
Publication of CN109190130A publication Critical patent/CN109190130A/zh
Application granted granted Critical
Publication of CN109190130B publication Critical patent/CN109190130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于POI相似度与翻译机器匹配推荐算法的研究方法,属于人工智能技术领域。本发明通过先将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性进行划分;将翻译语句训练样本,根据属性与应用场景,建立可运于不同翻译场景下的特色翻译语句库;然后提取用户U所在位置的POI,以用户U所在位置为中心,建立搜索区域i,提取搜索区域内相应的POI信息;再对用户POI与搜索区域内POI进行匹配相似度比对,确定用户最终位置;最后,根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐最准确、最优的翻译结果。

Description

一种基于POI相似度与翻译机器匹配推荐算法的研究方法
技术领域
本发明涉及一种基于POI相似度与翻译机器匹配推荐算法的研究方法,属于人工智能技术领域。
背景技术
随着当今社会快速发展,与国外的交流活动越来越多。但是对于大部分人来语言不通成为了不小的交流障碍,目前市场上出现的了各种各样的语言翻译机,输入方式比较简单,基本需要通过用户选择语言,给使用造成了不便。
发明内容
本发明要解决的技术问题是提供一种基于POI与翻译机器匹配算法的研究方法,不但解决了用户不需要对翻译语言、所需翻译场景进行选择,还解决了用户外语路牌看不懂、外语交流听不懂、国外旅行不会说、沟通难的问题,通过对用户兴趣点(POI)提取,实现根据用户所在位置为用户推荐最有效、最精准的多语言翻译环境提高了用户翻译体验度与翻译效率。
本发明的技术方案是:一种基于POI相似度与翻译机器匹配推荐算法的研究方法,其特征在于:
Step1:将日常旅游、购物、出行、生活中会用到翻译场景的兴趣点POI按属性C划分;
Step2:建立运用于不同翻译场景下的特色翻译语句库;
将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;
Step3:用户兴趣点POI提取;
一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;
Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:
{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}
Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);
Figure BDA0001782494890000011
设定一个阀值do,如果两个兴趣点(POI)之间的欧式距离小于当前阀值do,则认为表示同值一个为实体,见式(2);
Figure BDA0001782494890000021
Step6:根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐相应的翻译结果。
所述基于流行度稳定性的推荐算法具体为:
对于注册时间小于三个月的用户,翻译系统没有办法对用户要求作出合理的预测,此时翻译系统根据用户位置属性c,确定推荐范围;同时考虑到推荐的实效性,流行度会随着时间的推移而发生变化,故通过计算出将要被推荐的项目j的流行度稳定性s(j)对用户进行相关翻译推荐;
Figure BDA0001782494890000022
令时间T={t1,t2,t3,t4,...,tn},pop(j,t)表示将要被推荐的项目j在任一时刻t时间段内的流行度,pop(j)表示将要被推荐的项目j在时间段T内的平均流行度,max(pop(j))和min(pop(j))表示将要被推荐的项目j在时间T内流行度最大值与最小值;
所述基于翻译语句自信息量大小进行推荐算法具体为:
设翻译语句库中,任一一个属性c中的翻译语句集合为Xn={xn1,xn2,…,xnn}其中n={1,2,3,…,n},每一个翻译语句被使用的概率为:P={p(xn1),p(xn2),…,p(xnn)},概率空间记为:
Figure BDA0001782494890000023
每一条翻译语句的自信息量为:
Figure BDA0001782494890000024
通过计算每一属性c中每一条翻译语句的自信息量,当概率p(xnn)越大,则信息量越小,翻译语句越稳定,被使用频率越高;将翻译语句自信息量从小到大排列后,推荐给用户。
所述兴趣点POI分类可以按照实际需求划分。
所述POI由于采集位置的差异以及数据精度,相同POI的位置也不同,采用矢量法,判断用户POI与搜索区域中的POI是否为同一实体。
所述在推荐系统中,将用户反馈的总次数定义为项目的流行度,当项目反馈次数越多则流行度越高,反之越少;为了避免大众的从众心里与好奇心,随着时间推移,新事物的流行度慢慢下降趋向于一个稳定的状态;通过流行度的稳定性来衡量用户的偏好。
本发明的有益效果是:本发明与现有技术相比,不但解决了用户不需要对翻译语言、所需翻译场景进行选择,而且还解决了用户外语路牌看不懂、外语交流听不懂、国外旅行不会说、沟通难的问题,实现根据用户所在位置为用户推荐最有效、最精准的多语言翻译环境提高了用户翻译体验度与翻译效率。
附图说明
图1是本发明步骤流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种基于POI与翻译机器匹配算法的研究方法,通过先将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性进行划分;将翻译语句训练样本,根据属性与应用场景(使用聚类算法),建立可运于不同翻译场景下的特色翻译语句库;然后提取用户U所在位置的POI,以用户U所在位置为中心,建立搜索区域i,提取搜索区域内相应的POI信息;再对用户POI与搜索区域内POI进行匹配相似度比对(使用欧式距离进行空间属性特征匹配),确定用户最终位置;最后,根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐最准确、最优的翻译结果。
述方法的具体步骤如下:
Step1:将日常旅游、购物、出行、生活中可能会用到翻译场景的兴趣点POI按属性C划分为:
一级目录:
餐饮、购物、住宿、出行、文体娱乐、金融服务、生活服务、汽车服务、教育、医疗、房产、旅游、企事业单位、行政机构、公共服务
二级目录:
餐饮(快餐、西餐、餐厅、咖啡茶馆、其他)
购物(商场、超市、电子电器、建材家居、农贸市场、专营店、其他)
住宿(宾馆旅店、公寓)
出行(长途汽车站、火车站、机场、码头、地铁、公交、加油站、停车场、高速、服务区)
文体娱乐(博物馆、展览馆、会展中心、图书馆、书店、美术馆、音乐厅、影剧戏院、青少年宫、科技文化馆、纪念馆、动物园、植物园、水族馆、公园、健身场所、体育馆、KTV、酒吧、网吧、游乐场、洗浴中心、其他)
金融服务(银行、证券、保险、ATM、其他)
生活服务(物流快递、法律事务所、电台报社、人才市场、彩票销售点、典当行、缴费点、通讯、家政、洗衣店、美容美发、摄影冲印、花卉服务、宠物、邮政、其他)
汽车服务(汽车租赁、汽车用品、保养维修店、美容装饰店、销售店、驾校)
教育(学校、培训机构)
医疗(医院、急救中心、药店、诊所、其他)
房产(大厦、写字楼、住宅小区、楼盘、房产中介)
旅游(景点景区、宗教场所、旅行社)
企事业单位(企业、事业、社会团体、科研院所、其他)
行政机构(政府、出入境、公安、工商税务、交通消防、其他)
公共服务(公厕、紧急避难场所、敬老院、救助站、殡葬设施、其他)
Step2:建立运用于不同翻译场景下的特色翻译语句库;
将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;
Step3:用户兴趣点POI提取;
一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;
Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:
{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}
Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);
Figure BDA0001782494890000041
设定一个阀值do,如果两个兴趣点(POI)之间的欧式距离小于当前阀值do,则认为表示同值一个为实体,见式(2);
Figure BDA0001782494890000042
Step6:根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐相应的翻译结果。
所述基于流行度稳定性的推荐算法具体为:
对于注册时间小于三个月的用户,翻译系统没有办法对用户要求作出合理的预测,此时翻译系统根据用户位置属性c,确定推荐范围;同时考虑到推荐的实效性,流行度会随着时间的推移而发生变化,故通过计算出将要被推荐的项目j的流行度稳定性s(j)对用户进行相关翻译推荐;
Figure BDA0001782494890000053
令时间T={t1,t2,t3,t4,...,tn},pop(j,t)表示将要被推荐的项目j在任一时刻t时间段内的流行度,pop(j)表示将要被推荐的项目j在时间段T内的平均流行度,max(pop(j))和min(pop(j))表示将要被推荐的项目j在时间T内流行度最大值与最小值;
所述基于翻译语句自信息量大小进行推荐算法具体为:
设翻译语句库中,任一一个属性c中的翻译语句集合为Xn={xn1,xn2,…,xnn}其中n={1,2,3,…,n},每一个翻译语句被使用的概率为:P={p(xn1),p(xn2),…,p(xnn)},概率空间记为:
Figure BDA0001782494890000051
每一条翻译语句的自信息量为:
Figure BDA0001782494890000052
通过计算每一属性c中每一条翻译语句的自信息量,当概率p(xnn)越大,则信息量越小,翻译语句越稳定,被使用频率越高;将翻译语句自信息量从小到大排列后,推荐给用户。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (1)

1.一种基于POI相似度与翻译机器匹配推荐算法的研究方法,其特征在于:
Step1:将日常旅游、购物、出行、生活中会用到翻译场景的兴趣点POI按属性C划分;
Step2:建立运用于不同翻译场景下的特色翻译语句库;
将含有X个翻译语句的训练样本,根据属性C与应用场景,使用聚类算法根据翻译语句样本使用场景与其相互之间的相似度,将其进行归类处理;划分为不同翻译场景语句集合{X1,X2,X3,…Xn},形成可用于不同翻译场景下的特色翻译语句库;
Step3:用户兴趣点POI提取;
一个用户U在位置L上访问了一个兴趣点POI,其中兴趣点POI由其名字id与其属性c表示,位置L通过经纬度坐标(α,β)表示;
Step4:以用户U所在位置为中心,建立搜索区域i,搜索所有的在i距离阀值范围内的所有兴趣点(POI),并提取相应信息:
{N(国家),B(城市),ID(名称),C(属性),X、Y(经纬度坐标)}
Step5:通过计算用户POI与搜索区域中的POI几何属性之间的欧式距离来判断是否为相同实体,见式(1);
Figure FDA0003171530010000011
设定一个阀值do,如果两个兴趣点(POI)之间的欧式距离小于当前阀值do,则认为表示同值一个为实体,见式(2);
Figure FDA0003171530010000012
Step6:根据用户最终位置的属性c,通过基于流行度稳定性推荐算法与基于翻译语句自信息量大小推荐算法两者相结合,为用户推荐相应的翻译结果;
所述基于流行度稳定性的推荐算法具体为:对于注册时间小于三个月的用户,翻译系统没有办法对用户要求作出预测,此时翻译系统根据用户位置属性c,确定推荐范围;通过计算出将要被推荐的项目j的流行度稳定性s(j)对用户进行相关翻译推荐;
Figure FDA0003171530010000013
令时间T={t1,t2,t3,t4,...,tn},pop(j,t)表示将要被推荐的项目j在任一时刻t时间段内的流行度,pop(j)表示将要被推荐的项目j在时间段T内的平均流行度,max(pop(j))和min(pop(j))表示将要被推荐的项目j在时间T内流行度最大值与最小值;
所述基于翻译语句自信息量大小进行推荐算法具体为:设翻译语句库中,任一一个属性c中的翻译语句集合为Xn={xn1,xn2,…,xnn}其中n={1,2,3,…,n},每一个翻译语句被使用的概率为:P={p(xn1),p(xn2),…,p(xnn)},概率空间记为:
Figure FDA0003171530010000021
每一条翻译语句的自信息量为:
Figure FDA0003171530010000022
通过计算每一属性c中每一条翻译语句的自信息量,当概率p(xnn)越大,则信息量越小,翻译语句越稳定,被使用频率越高;将翻译语句自信息量从小到大排列后,推荐给用户。
CN201811008690.XA 2018-08-30 2018-08-30 一种基于poi相似度与翻译机器匹配推荐算法的研究方法 Active CN109190130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811008690.XA CN109190130B (zh) 2018-08-30 2018-08-30 一种基于poi相似度与翻译机器匹配推荐算法的研究方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811008690.XA CN109190130B (zh) 2018-08-30 2018-08-30 一种基于poi相似度与翻译机器匹配推荐算法的研究方法

Publications (2)

Publication Number Publication Date
CN109190130A CN109190130A (zh) 2019-01-11
CN109190130B true CN109190130B (zh) 2022-04-12

Family

ID=64917656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811008690.XA Active CN109190130B (zh) 2018-08-30 2018-08-30 一种基于poi相似度与翻译机器匹配推荐算法的研究方法

Country Status (1)

Country Link
CN (1) CN109190130B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992727A (zh) * 2019-02-22 2019-07-09 上海晶赞融宣科技有限公司 Poi的信息搜集方法及装置、存储介质、终端
CN111858787A (zh) * 2019-09-24 2020-10-30 北京嘀嘀无限科技发展有限公司 一种poi信息获取的方法及装置
CN115168711A (zh) * 2019-11-18 2022-10-11 百度在线网络技术(北京)有限公司 兴趣点选择方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104375992A (zh) * 2013-08-12 2015-02-25 中国移动通信集团浙江有限公司 一种地址匹配的方法和装置
CN106021240A (zh) * 2016-04-29 2016-10-12 北京创鑫旅程网络技术有限公司 一种旅行中常用外语语句及对应场景的自动识别方法
CN106096785A (zh) * 2016-06-13 2016-11-09 北京游谱科技发展有限公司 一种基于行程规划的线路定制方法、系统
CN106462574A (zh) * 2014-06-24 2017-02-22 谷歌公司 用于基于来自图像的非文本上下文信息的来自图像的文本的机器语言翻译的技术
CN107291888A (zh) * 2017-06-21 2017-10-24 苏州发飚智能科技有限公司 基于机器学习统计模型的入住酒店附近生活推荐系统方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294622A1 (en) * 2007-05-25 2008-11-27 Issar Amit Kanigsberg Ontology based recommendation systems and methods
CN103914536B (zh) * 2014-03-31 2017-11-07 北京百度网讯科技有限公司 一种用于电子地图的兴趣点推荐方法及系统
MX2017016182A (es) * 2015-08-21 2018-03-01 Ford Global Tech Llc Sistema y metodo de recomendacion de estaciones de radio.
CN107256230B (zh) * 2017-05-03 2020-08-25 昆明理工大学 一种基于多元化地理信息点的融合方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104375992A (zh) * 2013-08-12 2015-02-25 中国移动通信集团浙江有限公司 一种地址匹配的方法和装置
CN106462574A (zh) * 2014-06-24 2017-02-22 谷歌公司 用于基于来自图像的非文本上下文信息的来自图像的文本的机器语言翻译的技术
CN106021240A (zh) * 2016-04-29 2016-10-12 北京创鑫旅程网络技术有限公司 一种旅行中常用外语语句及对应场景的自动识别方法
CN106096785A (zh) * 2016-06-13 2016-11-09 北京游谱科技发展有限公司 一种基于行程规划的线路定制方法、系统
CN107291888A (zh) * 2017-06-21 2017-10-24 苏州发飚智能科技有限公司 基于机器学习统计模型的入住酒店附近生活推荐系统方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于流行度和用户偏好的推荐算法研究;韩亚楠;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160215(第02期);第I138-2110页 *
移动应用中的隐私保护及服务推荐研究;董素芹;《中国优秀硕士学位论文全文数据库 信息科技辑》;20141215(第12期);第I138-131页 *

Also Published As

Publication number Publication date
CN109190130A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
Arefieva et al. A machine learning approach to cluster destination image on Instagram
Stepchenkova et al. Cultural differences in pictorial destination images: Russia through the camera lenses of American and Korean tourists
Miewald et al. Foodscapes and the geographies of poverty: Sustenance, strategy, and politics in an urban neighborhood
Nofre et al. Exploring nightlife and urban change in Bairro Alto, Lisbon
Torkington Exploring the linguistic landscape: the case of the ‘Golden Triangle’in the Algarve, Portugal
CN109190130B (zh) 一种基于poi相似度与翻译机器匹配推荐算法的研究方法
Cranshaw et al. Seeing a home away from the home: Distilling proto-neighborhoods from incidental data with latent topic modeling
Kirmse Youth and globalization in Central Asia: Everyday life between religion, media, and international donors
Fernández et al. Historic city, tourism performance and development: The balance of social behaviours in the city of Santiago de Compostela (Spain)
Lozanovska Ethno-architecture and the Politics of Migration
Liao et al. Inheritance and dissemination of cultural collective memory: An analysis of a traditional festival
Tamaki Likes on image posts in social networking services: Impact of travel episode
Taiwo Intra-urban distribution of child hawking in Southeast Nigeria
Johnston et al. Sensing the city
Carden Making space for tourists with minority languages: the case of Belfast's Gaeltacht Quarter
Lefebvre The library, the city, and infinite possibilities: Ryerson University’s Student Learning Centre Project
Kim et al. Changes in local residents’ perceptions and attitudes towards the impact of film tourism: The case of Eat Pray Love (epl) film tourism in Ubud, Bali
Donner Locating activist spaces: The neighbourhood as a source and site of urban activism in 1970s Calcutta
Wu et al. The evolution and space patterns of hutongtels in Beijing historic districts
Sun et al. Properties analysis on travel intensity of land use patterns
Kartal Sensory urban mapping: a case study of Istiklal Street, Istanbul with the method of'sensewalking'
Elsheshtawy Searching for Nasser Square: An urban center in the heart of Dubai
Pristed Nielsen et al. A strange familiarity? Place perceptions among the globally mobile
Alian et al. Implosive multiculturalism: Staging of the community in Bankstown, Sydney
Khương Appreciation in online English tourism advertising discourse: An appraisal analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant