CN109408822A - 一种跨语言图书相关度分析方法及系统 - Google Patents
一种跨语言图书相关度分析方法及系统 Download PDFInfo
- Publication number
- CN109408822A CN109408822A CN201811278010.6A CN201811278010A CN109408822A CN 109408822 A CN109408822 A CN 109408822A CN 201811278010 A CN201811278010 A CN 201811278010A CN 109408822 A CN109408822 A CN 109408822A
- Authority
- CN
- China
- Prior art keywords
- language
- books
- information
- controlling uep
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013519 translation Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000013517 stratification Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000007547 defect Effects 0.000 description 2
- 238000000151 deposition Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
本发明属于语言信息处理技术领域,公开了一种跨语言图书相关度分析方法及系统,通过调用百度翻译的开发者接口进行翻译,将中文出版信息与英文出版信息进行关联;将不同语言的书籍联系在一起、将不同国家的作者联系在一起进行跨语言推荐;对于英文数据信息,先通过将关键词串联起来,利用“.”进行划分标志,通过翻译后用“。”进行重新分割,获得对应语言的关键词串;对于中文关键词利用“。”作为划分标志进行拼接,经过翻译后再利用“.”进行分割得到对应的英文关键词。本发明将实现一种跨语言的图书及作者相关度计算方法,基于机器翻译以及图的方法计算不同语种的图书及作者之间的相关度,从而提高跨语言出版推荐系统的质量。
Description
技术领域
本发明属于语言信息处理技术领域,尤其涉及一种跨语言图书相关度分析方法及系统。
背景技术
目前,业内常用的现有技术是这样的:
互联网和搜索引擎的出现,让我们能快速地获取到海内外信息。但是随着网民数量的日益增多和网上信息大量的涌入,往往让人感觉无从下手。海量的信息轰炸使我们无法快速选择出对于自己有用的、感兴趣的信息。对于那些搜索引擎来说怎样能快速给用户提供有效的信息,提高竞争力显得尤为重要。
推荐系统应运而生,并广泛应用于社交网站、音乐网站、影视网站等领域。它是采用一定的过滤技术,通过物品本身的特征、用户的历史查询等信息,将一定差异的内容推荐给感兴趣的用户,从而提高用户的体验。
随着国际化进程的推荐,已经出现了海量的不同国家及语种的图书和作者,为了更好地为用户推荐图书和作者,需要构建跨语言的图书推荐系统,其中的关键在于如何计算不同语言之间的图书与作者之间的相关度。
综上所述,现有技术存在的问题是:
(1)现有技术中,不能很好的计算不同语言之间的图书与作者之间的相关度,造成不能很好的为用户推荐图书和作者。
(2)现有最主要的缺陷是由于主要是采用人工的方式挑选,或者是通过系统推荐的单个热词来人工的扩展,因此覆盖率和及时性无法保证。
发明内容
针对现有技术存在的问题,本发明提供了一种跨语言图书相关度分析方法及系统。
本发明是这样实现的,一种跨语言图书相关度分析方法,所述跨语言图书相关度分析方法包括:
通过调用百度翻译的开发者接口进行翻译,将中文出版信息与英文出版信息进行关联;
将不同语言的书籍联系在一起、将不同国家的作者联系在一起进行跨语言推荐。
进一步,对于英文数据信息,先通过将关键词串联起来,利用“.”进行划分标志,通过翻译后用“。”进行重新分割,获得对应语言的关键词串;
对于中文关键词利用“。”作为划分标志进行拼接,经过翻译后再利用“.”进行分割获得到对应的英文关键词。
进一步,所述跨语言图书相关度分析方法结合云存储的用户相关信息对用户进行跨语言图书推荐:
(1)向云端请求用户信息;
(2)云端返回相关用户信息;
(3)更新云端信息库。
进一步,所述跨语言图书相关度分析方法采用安全云存储技术对用户信息进行加密,加密步骤为:
步骤一、数据访问层进行信息加密,将经应用接口层的公有API接口上传至云存储管理服务器,也就是基础管理层;
步骤二、基础管理层提供数据分块存储、建立数据索引、支持数据密文搜索等功能提高系统效率和用户体验;
步骤三:基础管理层将数据密文和其附加信息通过安全高速的内部网络保存至存储层,存储层可以对上层存进来的数据进行压缩、删冗处理。
进一步,所述跨语言图书相关度分析方法的图书分类使用层次化的树状结构来描述类与类之间的逻辑关系,计算内容类别层次相关性,X与Y的语义相关度sim(X,Y)计算模型为:
式中:β表示X和Y所在子树的相关度,取值在[0,1],根据实际应用由领域专家给出;dx和dy分别表示X和Y的最近的共同父类到X和Y的距离;α(x,y)表示最近的共同父类到X和Y的距离。
本发明的另一目的在于提供一种实现所述跨语言图书相关度分析方法的计算机程序。
本发明的另一目的在于提供一种实现所述跨语言图书相关度分析方法的信息数据处理终端。
本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的跨语言图书相关度分析方法。
本发明的另一目的在于提供一种实现所述跨语言图书相关度分析方法跨语言图书相关度分析推荐系统。
综上所述,本发明的优点及积极效果为:
本发明将实现一种跨语言的图书及作者相关度计算方法,基于机器翻译以及图的方法计算不同语种的图书及作者之间的相关度,从而提高跨语言出版推荐系统的质量。
附图说明
图1是本发明实施例提供的跨语言图书相关度分析方法流程图。
图2是本发明实施例提供的翻译关联计算图。
图3是本发明实施例提供的“圈子”关联计算图。
图4是本发明实施例提供的书所在圈子的相关书籍,它们的作者也可能属于同一类型或者具有一定的联系图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现有最主要的缺陷是由于主要是采用人工的方式挑选,或者是通过系统推荐的单个热词来人工的扩展,因此覆盖率和及时性无法保证。
图1,本发明实施例提供的跨语言图书相关度分析方法,包括:
S101:通过调用百度翻译的开发者接口进行翻译,将中文出版信息与英文出版信息进行关联;
S102:将不同语言的书籍联系在一起、将不同国家的作者联系在一起进行跨语言推荐。
进一步,所述跨语言图书相关度分析方法结合云存储的用户相关信息对用户进行跨语言图书推荐:
(1)向云端请求用户信息;
(2)云端返回相关用户信息;
(3)更新云端信息库。
进一步,所述跨语言图书相关度分析方法采用安全云存储技术对用户信息进行加密,加密步骤为:
步骤一、数据访问层进行信息加密,将经应用接口层的公有API接口上传至云存储管理服务器,也就是基础管理层;
步骤二、基础管理层提供数据分块存储、建立数据索引、支持数据密文搜索等功能提高系统效率和用户体验;
步骤三:基础管理层将数据密文和其附加信息通过安全高速的内部网络保存至存储层,存储层可以对上层存进来的数据进行压缩、删冗处理。
进一步,所述跨语言图书相关度分析方法的图书分类使用层次化的树状结构来描述类与类之间的逻辑关系,计算内容类别层次相关性,X与Y的语义相关度sim(X,Y)计算模型为:
式中:β表示X和Y所在子树的相关度,取值在[0,1],根据实际应用由领域专家给出;dx和dy分别表示X和Y的最近的共同父类到X和Y的距离;α(x,y)表示最近的共同父类到X和Y的距离。
下面结合具体分析对本发明作进一步描述。
本发明实施例提供的跨语言图书相关度分析方法,包括:
1、翻译关联计算
如图2,通过调用百度翻译的开发者接口进行翻译,实现将中文出版信息与英文出版信息的关联。通过对单条出版信息的关键词拼接翻译拆分,达到减少所需要翻译词句的数量以及减少调用翻译接口的目标,提高运算效率。本系统选用的是百度开发者翻译接口对信息进行翻译。为减少调用翻译接口的次数,同时提高系统的运算效率,如果是英文数据信息的情况,先通过将关键词串联起来,利用“.”进行划分标志,通过翻译后用“。”进行重新分割,获得对应语言的关键词串。同样的对于中文关键词利用“。”作为划分标志进行拼接,经过翻译后再利用“.”进行分割获得到对应的英文关键词。
2、“圈子”关联计算
无论是血缘关系还是社交关系,在三次相关内关系依旧保持良好。将每个出版信息看作是一个人,一个人圈子里的朋友很可能有相同的兴趣爱好,是同一类型的人。同一个作者写的书,很有可能是同一类型的,其作者所在圈子的众多作者有很大概率属于同一类型的,他们的书也有一定概率具有相关性。如图3,由此就有可能将不同语言的书籍联系在一起实现跨语言推荐。
同一本书的各个作者,写作风格有可能相同。书所在圈子的相关书籍,它们的作者也可能属于同一类型或者具有一定的联系。如图4,这样将不同国家的作者联系在一起,当搜索查询某位作者时,将不同国家的作者推荐给用户,实现跨语言推荐。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种跨语言图书相关度分析方法,其特征在于,所述跨语言图书相关度分析方法包括:
通过调用百度翻译的开发者接口进行翻译,将中文出版信息与英文出版信息进行关联;
将不同语言的书籍联系在一起、将不同国家的作者联系在一起进行跨语言推荐。
2.如权利要求1所述的跨语言图书相关度分析方法,其特征在于,
对于英文数据信息,先通过将关键词串联起来,利用“.”进行划分标志,通过翻译后用“。”进行重新分割,获得对应语言的关键词串;
对于中文关键词利用“。”作为划分标志进行拼接,经过翻译后再利用“.”进行分割获得到对应的英文关键词。
3.如权利要求1所述的跨语言图书相关度分析方法,其特征在于,所述跨语言图书相关度分析方法结合云存储的用户相关信息对用户进行跨语言图书推荐:
(1)向云端请求用户信息;
(2)云端返回相关用户信息;
(3)更新云端信息库。
4.如权利要求1所述的跨语言图书相关度分析方法,其特征在于,所述跨语言图书相关度分析方法采用安全云存储技术对用户信息进行加密,加密步骤为:
步骤一、数据访问层进行信息加密,将经应用接口层的公有API接口上传至云存储管理服务器,也就是基础管理层;
步骤二、基础管理层提供数据分块存储、建立数据索引、支持数据密文搜索等功能提高系统效率和用户体验;
步骤三:基础管理层将数据密文和其附加信息通过安全高速的内部网络保存至存储层,存储层可以对上层存进来的数据进行压缩、删冗处理。
5.如权利要求1所述的跨语言图书相关度分析方法,其特征在于,所述跨语言图书相关度分析方法的图书分类使用层次化的树状结构来描述类与类之间的逻辑关系,计算内容类别层次相关性,X与Y的语义相关度sim(X,Y)计算模型为:
式中:β表示X和Y所在子树的相关度,取值在[0,1],根据实际应用由领域专家给出;dx和dy分别表示X和Y的最近的共同父类到X和Y的距离;α(x,y)表示最近的共同父类到X和Y的距离。
6.一种实现权利要求1~5任意一项所述跨语言图书相关度分析方法的计算机程序。
7.一种实现权利要求1~5任意一项所述跨语言图书相关度分析方法的信息数据处理终端。
8.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-5任意一项所述的跨语言图书相关度分析方法。
9.一种实现权利要求1~5任意一项所述跨语言图书相关度分析方法跨语言图书相关度分析推荐系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278010.6A CN109408822A (zh) | 2018-10-30 | 2018-10-30 | 一种跨语言图书相关度分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278010.6A CN109408822A (zh) | 2018-10-30 | 2018-10-30 | 一种跨语言图书相关度分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109408822A true CN109408822A (zh) | 2019-03-01 |
Family
ID=65469969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811278010.6A Pending CN109408822A (zh) | 2018-10-30 | 2018-10-30 | 一种跨语言图书相关度分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109408822A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070262A1 (en) * | 2008-09-10 | 2010-03-18 | Microsoft Corporation | Adapting cross-lingual information retrieval for a target collection |
JP2012058936A (ja) * | 2010-09-08 | 2012-03-22 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム |
US20120271828A1 (en) * | 2011-04-21 | 2012-10-25 | Google Inc. | Localized Translation of Keywords |
CN103106584A (zh) * | 2011-11-10 | 2013-05-15 | 厦门中图壹购信息技术有限公司 | 一种处理非统一的图书信息数据的系统及其方法 |
CN104484433A (zh) * | 2014-12-19 | 2015-04-01 | 东南大学 | 一种基于机器学习的图书本体匹配方法 |
CN104699778A (zh) * | 2015-03-10 | 2015-06-10 | 东南大学 | 一种基于机器学习的跨语言分类结构匹配方法 |
US20160140643A1 (en) * | 2014-11-18 | 2016-05-19 | Microsoft Technology Licensing | Multilingual Content Based Recommendation System |
CN106055623A (zh) * | 2016-05-26 | 2016-10-26 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种跨语言推荐方法和系统 |
CN106294639A (zh) * | 2016-08-01 | 2017-01-04 | 金陵科技学院 | 基于语义的跨语言专利新创性预判分析方法 |
CN106599206A (zh) * | 2016-12-15 | 2017-04-26 | 北京小米移动软件有限公司 | 搜索信息的方法及装置 |
CN108255940A (zh) * | 2017-12-08 | 2018-07-06 | 北京搜狗科技发展有限公司 | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 |
CN108255939A (zh) * | 2017-12-08 | 2018-07-06 | 北京搜狗科技发展有限公司 | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 |
-
2018
- 2018-10-30 CN CN201811278010.6A patent/CN109408822A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070262A1 (en) * | 2008-09-10 | 2010-03-18 | Microsoft Corporation | Adapting cross-lingual information retrieval for a target collection |
JP2012058936A (ja) * | 2010-09-08 | 2012-03-22 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム |
US20120271828A1 (en) * | 2011-04-21 | 2012-10-25 | Google Inc. | Localized Translation of Keywords |
CN103106584A (zh) * | 2011-11-10 | 2013-05-15 | 厦门中图壹购信息技术有限公司 | 一种处理非统一的图书信息数据的系统及其方法 |
US20160140643A1 (en) * | 2014-11-18 | 2016-05-19 | Microsoft Technology Licensing | Multilingual Content Based Recommendation System |
CN104484433A (zh) * | 2014-12-19 | 2015-04-01 | 东南大学 | 一种基于机器学习的图书本体匹配方法 |
CN104699778A (zh) * | 2015-03-10 | 2015-06-10 | 东南大学 | 一种基于机器学习的跨语言分类结构匹配方法 |
CN106055623A (zh) * | 2016-05-26 | 2016-10-26 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种跨语言推荐方法和系统 |
CN106294639A (zh) * | 2016-08-01 | 2017-01-04 | 金陵科技学院 | 基于语义的跨语言专利新创性预判分析方法 |
CN106599206A (zh) * | 2016-12-15 | 2017-04-26 | 北京小米移动软件有限公司 | 搜索信息的方法及装置 |
CN108255940A (zh) * | 2017-12-08 | 2018-07-06 | 北京搜狗科技发展有限公司 | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 |
CN108255939A (zh) * | 2017-12-08 | 2018-07-06 | 北京搜狗科技发展有限公司 | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 |
Non-Patent Citations (2)
Title |
---|
宋锐等: "国内在线专利服务系统的功能比较", 《现代情报》 * |
赵以昕等: "基于改进LDA模型的图书推荐方法研究", 《情报工程》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Okura et al. | Embedding-based news recommendation for millions of users | |
Zamani et al. | Situational context for ranking in personal search | |
CN112836130B (zh) | 一种基于联邦学习的上下文感知推荐系统及方法 | |
US9614807B2 (en) | System and method for analyzing messages in a network or across networks | |
Shmueli-Scheuer et al. | Extracting user profiles from large scale data | |
CN106605221A (zh) | 具有用于即时索引的方法的多用户搜索系统 | |
CN101833730A (zh) | 个性化数字出版系统及其方法 | |
Zhang et al. | A method to predict the performance and storage of executing contract for ethereum consortium-blockchain | |
US10489373B1 (en) | Method and apparatus for generating unique hereditary sequences and hereditary key representing dynamic governing instructions | |
US20120054209A1 (en) | Indexing and tag generation of content for optimal delivery of invitational content | |
Chen et al. | Location-aware news recommendation using deep localized semantic analysis | |
Du et al. | Ranking webpages using a path trust knowledge graph | |
Ouaftouh et al. | Social recommendation: A user profile clustering‐based approach | |
Chairatanakul et al. | Heterogeneous graph embedding with single-level aggregation and infomax encoding | |
Ma et al. | Social user profiling: A social-aware topic modeling perspective | |
Fu et al. | Confusing-keyword based secure search over encrypted cloud data | |
CN109408822A (zh) | 一种跨语言图书相关度分析方法及系统 | |
Wei et al. | MLP-IA: Multi-label user profile based on implicit association labels | |
CN113434789B (zh) | 基于多维度文本特征的搜索排序方法及相关设备 | |
Huang et al. | Location-aware query recommendation for search engines at scale | |
Han et al. | Representation learning with depth and breadth for recommendation using multi-view data | |
US20150220658A1 (en) | Managing and Using Shareable Search Lists | |
Lu et al. | Genderpredictor: a method to predict gender of customers from e-commerce website | |
CN110706021A (zh) | 一种广告投放方法及系统 | |
Zhu et al. | Incorporating contextual information into personalized mobile applications recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190301 |
|
RJ01 | Rejection of invention patent application after publication |