CN104572897B - 提供多语言信息的方法和系统 - Google Patents

提供多语言信息的方法和系统 Download PDF

Info

Publication number
CN104572897B
CN104572897B CN201410824613.7A CN201410824613A CN104572897B CN 104572897 B CN104572897 B CN 104572897B CN 201410824613 A CN201410824613 A CN 201410824613A CN 104572897 B CN104572897 B CN 104572897B
Authority
CN
China
Prior art keywords
information
language
multilingual
commodity
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410824613.7A
Other languages
English (en)
Other versions
CN104572897A (zh
Inventor
陈鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201410824613.7A priority Critical patent/CN104572897B/zh
Publication of CN104572897A publication Critical patent/CN104572897A/zh
Application granted granted Critical
Publication of CN104572897B publication Critical patent/CN104572897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Stored Programmes (AREA)

Abstract

本发明给出一种提供多语言信息的方法和系统,有助于减少数据库的数据量,并降低系统升级改造的成本。本发明的提供多语言信息的方法包括:保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同;在提供所述信息主体的信息时,先获取该信息主体的第一语言的信息;然后判断当前需要提供的是否为所述信息主体的其他语言的信息,若是,则调用多语言服务以获取该信息主体的其他语言的信息;再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容。

Description

提供多语言信息的方法和系统
技术领域
本发明涉及计算机技术领域,特别地涉及一种提供多语言信息的方法和系统。
背景技术
现有国内电商业务,一般只支持中文或者英文。但是随着电商国际化业务的发展,国内电商将需要支持多个国家的语言,比如法语,英语,日语等。该功能需要整理现有的系统数据结构,添加对商品,类目,SEO,广告等各种数据的多语言信息。现有的添加方案一般是修改现有数据表,增加多语言的数据,使用一个字段表示该条数据是属于哪种语言的数据,参考表1,表1示出了现有的一种商品表的结构。
表1
需要添加新的语言数据时,可以添加新的语言ID,并插入数据即可。如果多语言的数据量较大,也可以采用分表的方式解决,参考表2。
表2
在需要提供多语言数据时,根据商品ID和语言ID即可查到商品的多语言数据。
按照上述的现有技术,每种语言数据占用数据库中的单独一行,使数据库的总行数是商品数与语言种类数的乘积,由于商品数往往在千万至十亿数量级,上述的乘积值将到达几亿至几十亿数量级,使数据库的数据量过大,读写效率低下;另外在对仅包含一种语言的系统进行多语种升级改造时,添加数据库的行的方式使数据库需要被大幅改动,在相关的程序中也要修改大量的已有逻辑结构,系统升级改造的成本较高。
发明内容
有鉴于此,本发明给出一种提供多语言信息的方法和系统,有助于减少数据库的数据量,并降低系统升级改造的成本。
为实现上述目的,根据本发明的一个方面,给出了一种提供多语言信息的方法。
本发明的提供多语言信息的方法包括:保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同;在提供所述信息主体的信息时,先获取该信息主体的第一语言的信息;然后判断当前需要提供的是否为所述信息主体的其他语言的信息,若是,则调用多语言服务以获取该信息主体的其他语言的信息;再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容。
可选地,所述信息主体是商品;保存信息主体的第一语言的信息以及一种或多种其他语言的信息的步骤包括:在数据库中保存每个商品的信息,同一种商品的所述其他语言的信息位于数据库的同一行,数据库的各列分别是商品的各种所述其他语言的商品属性信息。
可选地,所述多语言服务由分布式服务器集群提供。
根据本发明的另一方面,给出了一种提供多语言信息的系统。
本发明的提供多语言信息的系统包括:存储模块,用于保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同;第一获取模块,用于在所述系统提供所述信息主体的信息时,先获取该信息主体的第一语言的信息;判断模块,用于判断当前需要提供的是否为所述信息主体的其他语言的信息;第二获取模块,用于在当前需要提供所述信息主体的其他语言的信息的情况下,调用多语言服务以获取该信息主体的其他语言的信息,再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容;服务子系统,用于提供所述多语言服务。
可选地,所述信息主体是商品;所述存储模块为数据库,该数据库中保存每个商品的信息,同一种商品的所述其他语言的信息位于数据库的同一行,数据库的各列分别是商品的各种所述其他语言的商品属性信息。
可选地,所述服务子系统为分布式服务器集群。
根据本发明的技术方案,在提供信息主体的信息时,先提供第一语言的信息,然后根据情况提供多语言信息,这种方式对于已有系统的改动量较小,便于系统升级。在多语言数据库中,每一种信息主体占用一行,而各语种的各项信息分别位于数据库的列中,这样使数据库的行数不至于过多。以商品为例,数据库的行数即为商品数。另外多语言服务采用插件式的设计,系统复杂度低,当需要扩展语言时,仅需修改插件,不用修改现有系统,同样便于系统升级改造。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的提供多语言信息的方法的基本流程的示意图;
图2是根据本发明实施例的提供多语言信息的系统的基本结构的示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
对于目前电商的情况来说,在初期商品信息一般具有一个本国语言例如中文,在业务扩展到国外时,需要支持其他语言时再进行扩展。在数据库中,存在一个商品表和商品表多语言表,其中商品表采用第一语言(通常是电商的本国语言),商品表多语言表中包含其他语言(外国语言)的商品信息,例如表3所示。
表3
在表3的商品表多语言表中,商品表多语言表中每一行是一种商品的各种属性信息。各列分别是一种语言的一种属性信息。商品表和商品表多语言表中虽然语种不同,但其中信息的含义是相同的。在用户打开网站浏览商品信息时,电商运营的服务端可以按照图1所示的流程来向用户提供商品信息。图1是根据本发明实施例的提供多语言信息的方法的基本流程的示意图。
步骤S11:获取商品的第一语言的信息。例如从表3获取,则第一语言的信息是商品表中的中文信息。
步骤S12:判断步骤S11中获取的信息内容是否有效。用户访问的网站的后台根据步骤S11中获取的信息内容进行判断并且返回一个结果字段。如果该结果字段表明信息内容有效,说明当前要向用户提供的是第一语言(按上例即为中文)的信息,此时进入步骤S15,返回第一语言的信息。若查询结果表明信息内容无效,则说明当前需要向用户提供其他语言的信息,此时进入步骤S13。
步骤S13:调用多语言服务。在该服务中,根据用户访问的网站的语种,查询商品表多语言表。事先为各语种设定标识,可按语言标准字符串设置,例如英语为en,日语为jp等。另外设定各个语言的内容在商品表多语言表中的哪些列,例如英文内容列于表中第2、4、5……等列,日文内容列于表中第3、7、8……等列。如果要添加一个语种,在表中添加列即可,便于系统扩展,并且数据库的条目数不变,有助于减少数据量。调用多语言服务时,传入的参数即为语种字符串,例如en,这样根据英文内容所在的各列,提取这些列中的当前被查商品所在行的内容然后向调用方返回。
步骤S14:使用多语言服务的结果替换步骤S11中获取的第一语言的信息。替换时应当替换含义相同的内容,例如多语言服务返回的结果中,商品英文名称为car,则应替换第一语言中的商品名称字段。为此,事先设定商品表和商品表多语言表中各相同属性所在列的关联关系,这样,按该关联关系来替换商品信息字段即可。
因为在现实中,多数电商的网站在开始阶段仅支持一种语言,已具有调用商品信息的接口,然后进行功能扩展,支持其他语言,所以最好是在现有接口参数不变的前提下加入多语言参数,减少系统改动量。因此在步骤S11中仍先获取第一语言的信息,然后判断是否为需要的信息,如果用户当前访问的是其他语言的网站,那么再调用多语言服务。多语言服务可以由插件来实现,插件部署在分布式服务器集群中。
以上是以商品作为信息主体为例,说明了如何提供多语言的商品信息。本实施例的方案也可以应用在其他需要多语言的商品信息的场合。图2是根据本发明实施例的提供多语言信息的系统的基本结构的示意图。如图2所示,本发明的提供多语言信息的系统20主要包括存储模块21、第一获取模块22、判断模块23、第二获取模块24、以及服务子系统25。
存储模块21用于保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同;第一获取模块22用于在系统20提供信息主体的信息时,先获取该信息主体的第一语言的信息;判断模块23用于判断当前需要提供的是否为信息主体的其他语言的信息;第二获取模块24用于在当前需要提供所述信息主体的其他语言的信息的情况下,调用多语言服务以获取该信息主体的其他语言的信息,再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容;服务子系统25用于提供多语言服务,可采用分布式服务器集群。
存储模块21可采用数据库实现,如信息主体是商品,则该数据库中保存每个商品的信息,同一种商品的其他语言的信息位于数据库的同一行,数据库的各列分别是商品的各种其他语言的商品属性信息。
根据本发明实施例的技术方案,在提供信息主体的信息时,先提供第一语言的信息,然后根据情况提供多语言信息,这种方式对于已有系统的改动量较小,便于系统升级。在多语言数据库中,每一种信息主体占用一行,而各语种的各项信息分别位于数据库的列中,这样使数据库的行数不至于过多。以商品为例,数据库的行数即为商品数。另外多语言服务采用插件式的设计,系统复杂度低,当需要扩展语言时,仅需修改插件,不用修改现有系统,同样便于系统升级改造。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (4)

1.一种提供多语言信息的方法,其特征在于,包括:
保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同,其中,在数据库中保存每个商品的信息,其中包括商品的第一语言的信息以及一种或多种其他语言的信息,同一种商品的所述其他语言的信息位于数据库的同一行,数据库的各列分别是商品的各种所述其他语言的商品属性信息,各种语言的信息的含义相同;
在提供所述信息主体的信息时,先获取该信息主体的第一语言的信息;然后判断当前需要提供的是否为所述信息主体的其他语言的信息,若是,则调用多语言服务以获取该信息主体的其他语言的信息;再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容。
2.根据权利要求1所述的方法,其特征在于,所述多语言服务由分布式服务器集群提供。
3.一种提供多语言信息的系统,其特征在于,包括:
存储模块,用于保存信息主体的第一语言的信息以及一种或多种其他语言的信息,各种语言的信息的含义相同;所述存储模块为数据库,该数据库中保存作为所述信息主体的每个商品的信息,同一种商品的所述其他语言的信息位于数据库的同一行,数据库的各列分别是商品的各种所述其他语言的商品属性信息;
第一获取模块,用于在所述系统提供所述信息主体的信息时,先获取该信息主体的第一语言的信息;
判断模块,用于判断当前需要提供的是否为所述信息主体的其他语言的信息;
第二获取模块,用于在当前需要提供所述信息主体的其他语言的信息的情况下,调用多语言服务以获取该信息主体的其他语言的信息,再使用该其他语言的信息中的内容替换该第一语言的信息中与该内容含义相同的内容;
服务子系统,用于提供所述多语言服务。
4.根据权利要求3所述的系统,其特征在于,所述服务子系统为分布式服务器集群。
CN201410824613.7A 2014-12-25 2014-12-25 提供多语言信息的方法和系统 Active CN104572897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410824613.7A CN104572897B (zh) 2014-12-25 2014-12-25 提供多语言信息的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410824613.7A CN104572897B (zh) 2014-12-25 2014-12-25 提供多语言信息的方法和系统

Publications (2)

Publication Number Publication Date
CN104572897A CN104572897A (zh) 2015-04-29
CN104572897B true CN104572897B (zh) 2017-11-28

Family

ID=53088959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410824613.7A Active CN104572897B (zh) 2014-12-25 2014-12-25 提供多语言信息的方法和系统

Country Status (1)

Country Link
CN (1) CN104572897B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544306A (zh) * 2013-11-01 2014-01-29 广东威创视讯科技股份有限公司 一种网站支持多语言显示的方法与装置
CN103699953A (zh) * 2013-11-06 2014-04-02 北京驭时德隆科技有限公司 项目管理系统及其数据处理方法和装置
CN104182405A (zh) * 2013-05-22 2014-12-03 阿里巴巴集团控股有限公司 一种连接查询方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9390147B2 (en) * 2011-09-23 2016-07-12 Red Lambda, Inc. System and method for storing stream data in distributed relational tables with data provenance

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182405A (zh) * 2013-05-22 2014-12-03 阿里巴巴集团控股有限公司 一种连接查询方法及装置
CN103544306A (zh) * 2013-11-01 2014-01-29 广东威创视讯科技股份有限公司 一种网站支持多语言显示的方法与装置
CN103699953A (zh) * 2013-11-06 2014-04-02 北京驭时德隆科技有限公司 项目管理系统及其数据处理方法和装置

Also Published As

Publication number Publication date
CN104572897A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
US8601361B2 (en) Automatically populating and/or generating tables using data extracted from files
CN105786793B (zh) 解析口语文本信息的语义的方法和装置
CN109284145A (zh) 多语言配置文件的生成和展示方法及装置、设备和介质
US10157175B2 (en) Business intelligence data models with concept identification using language-specific clues
US10572726B1 (en) Media summarizer
US20130259377A1 (en) Conversion of a document of captured images into a format for optimized display on a mobile device
US20070088743A1 (en) Information processing device and information processing method
US9684735B2 (en) System and method for recommending fonts
CN103902717A (zh) 一种企业内部门户个性化的实现系统和方法
US20240303428A1 (en) Systems and methods for generating social assets from electronic publications
CN110427604B (zh) 表格整合方法和装置
CN104090869B (zh) 一种翻译网络信息的方法及翻译系统
CN110020312A (zh) 提取网页正文的方法和装置
KR20210000952A (ko) 지식그래프 색인 방법 및 장치
US20130124684A1 (en) Visual separator detection in web pages using code analysis
US11061950B2 (en) Summary generating device, summary generating method, and information storage medium
CN109492196B (zh) 一种Excel表格数据提取的系统和方法
US7721198B2 (en) Story tracking for fixed layout markup documents
CN104572897B (zh) 提供多语言信息的方法和系统
EP3564833B1 (en) Method and device for identifying main picture in web page
CN105740239A (zh) 一种网页上文字的翻译方法及系统
US20210390126A1 (en) Section-linked document classifiers
US10157238B2 (en) Transformation of marked-up content to a reversible file format for automated browser based pagination
CN104536947A (zh) 版式文档的处理方法及装置
CN105955680A (zh) 一种支持动态附加扩展信息的单据打印方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant