CN107430504A - 数据变换系统及方法 - Google Patents

数据变换系统及方法 Download PDF

Info

Publication number
CN107430504A
CN107430504A CN201680014842.XA CN201680014842A CN107430504A CN 107430504 A CN107430504 A CN 107430504A CN 201680014842 A CN201680014842 A CN 201680014842A CN 107430504 A CN107430504 A CN 107430504A
Authority
CN
China
Prior art keywords
language
product
data
unknowable
concrete form
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680014842.XA
Other languages
English (en)
Inventor
尼耳·派拉克
帕维尔·扎斯拉夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lees Corp
Original Assignee
Lees Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lees Corp filed Critical Lees Corp
Publication of CN107430504A publication Critical patent/CN107430504A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/235Update request formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements

Abstract

一种变换数据的方法,包括步骤:接收处于一第一语言具体形式的数据;将处于所述第一语言具体形式的所述数据转换为一语言不可知形式;储存处于所述语言不可知形式的所述数据;将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式;及按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。

Description

数据变换系统及方法
相关申请案
特此提及于2015年4月8日提交的标题为“数据传输系统和方法”的美国临时专利申请案序列号62/144,407,其公开内容通过引用并入本文,并且根据37 C.F.R.1.78的(a)(1)要求其优先权。
技术领域
本发明涉及用于数据变换的方法及系统。
背景技术
各种数据变换系统及方法是已知的。
发明内容
本发明寻求提供用于数据变换的多种被改良的方法及系统。
因此,根据本发明的一优选实施例提供一种变换数据的方法,包括步骤:接收处于一第一语言具体形式的一数据;将处于所述第一语言具体形式的所述数据转换为一语言不可知形式;及储存处于所述语言不可知形式的所述数据;将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式;及按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
优选地,所述将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式的步骤是按需求发生的。
根据本发明的一优选实施例,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
根据本发明的一优选实施例,所述至少一第二语言具体形式包括所述至少第一语言具体形式。优选地,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
优选地,所述变换数据的方法还包括步骤:将处于所述第一语言具体形式的所述数据从一非结构化数据转换为一结构化数据,其中所述将处于所述第一语言具体形式的所述数据转换为所述语言不可知形式的步骤包括:将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
根据本发明的一优选实施例,处于所述第一语言具体形式的所述数据与一课题有关。此外,所述课题包括一文章。优选地,所述文章的多个属性通过所述数据被描述。此外,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应属性。
还根据本发明的另一优选实施例提供一种用于变换数据的系统,包括:一数据接收功能,能够运作以接收处于一第一语言具体形式的一数据;一语言具体对语言不可知的数据转换功能,能够运作以将处于所述第一语言具体形式的所述数据转换为一语言不可知形式;一语言不可知数据库,被配置以储存处于所述语言不可知形式的所述数据;一语言不可知对语言具体的数据转换功能,能够运作以将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式;及一数据汇出功能,能够运作以按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
根据本发明的一优选实施例,所述语言不可知对语言具体的数据转换功能能够运作以按需求将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式。
优选地,所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
根据本发明的一优选实施例,所述至少一第二语言具体形式包含所述至少第一语言具体形式。优选地,所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
优选地,所述语言具体对语言不可知的数据转换功能还能够运作:以将处于所述第一语言具体形式的所述数据从一非结构化数据转换为所述结构化数据;及以将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
优选地,处于所述第一语言具体形式的所述数据与一课题有关。此外,所述课题包括一文章。优选地,所述文章的多个属性通过所述数据被描述。此外,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
还根据本发明的一优选实施例进一步提供一种用于变换数据的方法,所述方法包括步骤:接收处于一第一语言具体形式的一非结构化数据;将处于所述第一语言具体形式的所述非结构化数据转换为一结构化语言不可知形式;及储存处于所述结构化语言不可知形式的所述数据;将所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
根据本发明的一优选实施例,所述将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式的步骤是按需求发生的。
根据本发明的一优选实施例,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
优选地,所述至少一第二语言具体形式包含所述至少第一语言具体形式。优选地,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
根据本发明的一优选实施例,所述方法还包括步骤:将处于所述第一语言具体形式的所述非结构化数据从一非结构化数据转换为所述结构化数据,其中所述将处于所述第一语言具体形式的所述非结构化数据转换为所述结构化语言不可知形式的步骤包括:将处于所述第一语言具体形式的所述结构化数据转换为处于所述结构化语言不可知形式的一结构化数据。
优选地,所述第一语言具体形式的所述数据与一课题有关。此外,所述课题包括一文章。根据本发明的一优选实施例,所述文章的多个属性通过所述数据被描述。此外,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
根据本发明的另一个优选实施例,还进一步提供一种用于变换数据的系统,包括:一非结构化数据接收功能,能够运作以接收处于一第一语言具体形式的一非结构化数据;一非结构化语言具体对结构化语言不可知的数据转换功能,能够运作以将处于所述非结构化第一语言具体形式的所述数据转换为一结构化语言不可知形式;一结构化语言不可知数据库,被配置以储存处于所述结构化语言不可知形式的所述数据;一结构化语言不可知对语言具体的数据转换功能,能够运作以将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及一数据汇出功能,能够运作以按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
根据本发明的一优选实施例,所述语言不可知对语言具体的数据转换功能能够运作以按需求将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式。
优选地,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,所处于述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
根据本发明的一优选实施例,所述至少一第二语言具体形式包括所述至少第一语言具体形式。优选地,所述至少一第二语言具体形式的所述数据包括语言与处于所述第一语言具体形式的语言相同的一数据。
根据本发明的一优选实施例,所述非结构化语言具体对语言不可知的数据转换功能,能够运作:以将处于所述第一语言具体形式的所述数据从所述非结构化数据转换为一结构化数据;及以将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
优选地,处于所述第一语言具体形式的所述数据与一课题有关。此外,所述课题包括一文章。根据本发明的一优选实施例,所述文章的多个属性通过所述数据被描述。此外,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
还根据本发明的另一优选实施例进一步提供一种用于变换产品数据的方法,所述方法包括步骤:提供一结构化语言不可知产品数据库,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;接收处于一第一语言具体形式的非结构化产品数据;分析所述非结构化产品数据,并且从处于所述第一语言具体形式的所述非结构化产品数据提取被指定到相应的多个非结构化产品属性的多个非结构化产品具体属性值;将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式;查明被指定到相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值是否相关于被储存于一结构化语言不可知产品数据库中的一具体产品,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值不相关于储存在所述结构化语言不可知产品数据库中的一具体产品,添加一新产品到所述结构化语言不可知产品数据库,所述新产品具有被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值;及因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值相关于储存在所述结构化语言不可知产品数据库中的一具体产品,指定所述多个结构化语言不可知产品具体属性值给所述具体产品的所述相应的多个语言不可知结构化产品属性。
优选地,所述接收处于所述第一语言具体形式的所述非结构化产品数据的步骤包括:从被描述在处于所述第一语言具体形式的所述非结构化产品数据中的一产品的一供应商接收处于所述第一语言具体形式的所述非结构化产品数据。或者,所述接收处于所述第一语言具体形式的所述非结构化产品数据的步骤包括:自动地从多个电子商业平台中的任一者检索处于所述第一语言具体形式的所述非结构化产品数据。
优选地,所述多个产品以多个产品类别被分类。此外,所述方法还包括步骤:分类一产品为所述多个产品类别中的至少一者。优选地,所述方法还包括步骤:分析所述非结构化产品数据,以将被描述在所述非结构化产品数据中的一产品分类为所述多个产品类别中的至少一者。此外,所述方法还包括步骤:利用所述分类以查明被指定到所述相应的多个语言不可知结构化产品属性的所述结构化语言不可知产品具体属性值是否与储存在所述结构化语言不可知产品数据库中的一具体产品是有关的。
根据本发明的一优选实施例,所述方法还包括步骤:将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
优选地,所述方法还包括步骤:将处于所述结构化语言不可知形式的所述数据转换为一格式,所述格式适于汇出到多个第三方电子商业平台中的任一者;及汇出处于所述格式的所述数据到多个第三方电子商业平台中的特定一者,所述格式适合汇出到所述多个第三方电子商业平台中的所述特定一者。
根据本发明的一优选实施例,所述汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据的步骤是按需求进行的。或者,所述汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据的步骤是自动进行的。
优选地,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为所述结构化语言不可知形式的步骤包括:查明是否所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在一字典中,其中对于每一种产品属性及被包括在所述产品属性中的产品属性值,所述字典包括:对所述第一语言形式的至少一者及所述至少一第二语言具体形式的每一者而言的一语言不可知标识符及其一翻译;因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中,利用所述字典以将所述多个非结构化产品具体属性值及所述多个非结构化产品属性转换为所述结构化语言不可知形式;及因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,将所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性添加到所述字典,并且指定一语言不可知标识符到所述多个非结构化产品具体属性值及所述多个非结构化产品属性中的每一者。
根据本发明的一优选实施例,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式的步骤还包括:因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,自动地将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为对所述至少一第二语言具体形式中的每一种而言的所述字典,并且将所述翻译添加到所述字典。优选地,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式的步骤还包括:因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,提示所述系统的一管理者对将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为所述至少一第二语言具体形式中的每一种,并且将所述翻译添加到所述字典。
根据本发明的一优选实施例,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述每一种利用所述字典。
根据本发明的一优选实施例,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一种是按需求发生的。或者,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一种是自动地发生的。
优选地,在处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,在处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
根据本发明的一优选实施例,所述至少一第二语言具体形式包含所述至少第一语言具体形式。优选地,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的所述语言相同的一数据。
还根据本发明的另一优选实施例提供一种多语言产品编目系统,所述系统包括:一结构化语言不可知产品数据库,被配置用以储存,对于多个产品中的每一者,多个结构化语言不可知产品属性值被指定到相应的多个结构化语言不可知产品属性;一非结构化产品数据接收功能,能够运作以接收处于一第一语言具体形式的一非结构化产品数据;一非结构化产品数据提取功能,能够运作以分析所述非结构化产品数据,并且从处于所述第一语言具体形式的所述非结构化产品数据提取被指定为相应的多个非结构化产品属性的多个非结构化产品具体属性值;一非结构化语言具体对结构化语言不可知产品的数据转换功能,能够运作以将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式;及一产品匹配功能,能够运作以:查明被指定到相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值是否相关于被储存于一结构化语言不可知产品数据库中的一具体产品,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值不相关于储存在所述结构化语言不可知产品数据库中的一具体产品,添加一新产品到所述结构化语言不可知产品数据库,所述新产品具有被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值;及因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值相关于储存在所述结构化语言不可知产品数据库中的一具体产品,指定所述多个结构化语言不可知产品具体属性值给所述具体产品的所述相应的多个语言不可知结构化产品属性。
优选地,所述非结构化产品数据接收功能,能够运作以从被描述在处于所述第一语言具体形式的所述非结构化产品数据中的一产品的一供应商接收处于所述第一语言具体形式的所述非结构化产品数据。根据本发明的一优选实施例,所述非结构化产品数据接收功能,能够运作以通过自动地从多个电子商业平台中的任一个检索处于所述第一语言具体形式的所述非结构化产品数据,而接收处于所述第一语言具体形式的所述非结构化产品数据。
优选地,所述多个产品以多个产品类别被分类。根据本发明的一优选实施例,所述多语言产品编目系统还包括:一产品分类功能,能够运作以分类一产品为所述多个产品类别中的至少一者。此外,所述产品分类功能能够运作以分析所述非结构化产品数据,以将被描述在其中的一产品分类为所述多个产品类别中的至少一者。优选地,所述产品匹配功能还能够运作以利用所述分类以查明被指定到所述相应的多个语言不可知结构化产品属性的所述结构化语言不可知产品具体属性值是否与储存在所述结构化语言不可知产品数据库中的一具体产品是有关的。
根据本发明的一优选实施例,所述多语言产品编目系统还包括:一语言不可知对语言具体产品的数据转换功能,能够运作以将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及一产品数据汇出功能,能够运作以汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。此外,所述语言不可知对语言具体产品的数据转换功能还能够运作以将处于所述结构化语言不可知形式的所述数据转换为一格式,所述格式适于汇出到多个第三方电子商业平台中的任一个;及所述产品数据汇出功能还能够运作以汇出处于所述格式的所述数据到多个第三方电子商业平台中的特定一者,所述格式适合汇出到所述多个第三方电子商业平台中的所述特定一者。
优选地,所述产品数据汇出功能能够运作以按需求地以汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。或者,所述产品数据汇出功能能够运作以自动地汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
根据本发明的一优选实施例,所述多语言产品编目系统还包括一字典,其中对于每一种产品属性及被包括在所述产品属性中的产品属性值,所述字典包括:对所述第一语言形式的至少一者及所述至少一第二语言具体形式的每一种而言的一语言不可知标识符及其一翻译。
根据本发明的一优选实施例,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:查明是否所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中;因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中,利用所述字典以将所述多个非结构化产品具体属性值及所述多个非结构化产品属性转换为所述结构化语言不可知形式;及因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,将所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性添加到所述字典,并且指定一语言不可知标识符到所述多个非结构化产品具体属性值及所述多个非结构化产品属性中的每一者。
根据本发明的一优选实施例,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还可被操作以:因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,自动地将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为对所述至少一第二语言具体形式中的每一种而言的所述字典,并且将所述翻译添加到所述字典。此外,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,提示所述系统的一管理者对将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为所述至少一第二语言具体形式中的每一者,并且将所述翻译添加到所述字典。
优选地,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:利用所述字典,以将所述将所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。
根据本发明的一优选实施例,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:按需求地将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。或者,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:自动地将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。
优选地,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。或者,处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
根据本发明的一优选实施例,所述至少一第二语言具体形式包含所述至少第一语言具体形式。优选地,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的所述语言相同的一数据。
附图说明
从以下结合附图的详细描述中将更全面地瞭解及理解本发明,其中:
图1是根据本发明的一优选实施例被建构及运作的一数据变换系统的一简化框图;
图2是图示与图1的所述系统的一实施例协作的一卖方执行的一些初始步骤的一简化流程图;
图3A及图3B显示非结构化语言具体列示数据的两个示例,每个列示数据构成一不同卖方馈送文件的一部分;
图4是图示非结构化产品数据接收功能(UPDRF)的一简化框图,这形成图1的所述系统的一实施例的一部分;
图5是形成图4的非结构化产品数据接收功能(UPDRF)的一部分的该输入数据列映射器的图解运作的一简化图例。
图6是图4的非结构化产品数据接收功能(UPDRF)的图解运作的一简化流程图;
图7是作为初始地存储在一数据库中的非结构化语言具体列示数据的一简化示例,这形成图1的所述系统的一实施例的一部分。
图8是形成图1的所述系统的一实施例的一部分的产品数据提取功能及产品匹配功能的图解运作的一简化流程图。
图9是在所述产品数据提取功能及产品匹配功能中利用的一类别结构表格的一简化图例,这形成图1的所述系统的一实施例的一部分;
图10是形成产品数据提取功能的运作的一示例的一简化图例,这形成图1的所述系统的一实施例的一部分。
图11是通过图10的所述提取功能利用的一典型类别属性结构表格的一简化图例;
图12是通过图10的所述提取功能利用的一典型属性值结构表格的一简化图例;
图13是通过图1的所述系统的一实施例利用的一典型结构转换表格的一部分的一简化图例。
图14A及图14B是通过图10的所述提取功能利用的两个类别具体规则集合的简化流程图;
图15是一典型的类别具体矩阵匹配规则的一简化图例;
图16是图示在图1的所述系统的一实施例的新产品创建及数据丰富运作的一简化流程图。
图17是一结构化产品表格的一部分的一简化图例;
图18是结构化产品数据表格的一部分的一简化图例;
图19是一典型的市场具体数据规范表格的一部分的一简化图例;
图20是与一语言不可知对语言具体的产品数据转换功能的运作的一示例的一简化图例,这形成图1的所述系统的一实施例的一部分。
图21是一结构翻译表格的一部分的一简化图例;
图22是一典型产品数据权重属性扩展及转换规则的一简化流程图;
图23是一典型的语言具体的市场具体产品列示创建规则的简化图例;
图24是将类别映射到一具体市场的一简化图例;
图25是成对的属性值映射到一具体市场的一简化图例;及
图26是一典型的语言具体的市场具体列示数据转换规则的一简化图例。
具体实施方式
现在参考图1,这是根据本发明的一优选实施例被建构及运作的数据变换系统100的图例的一简化框图。图1是图示在本发明的实施例中的一多语言电子商务环境的内容,应当理解的是,本发明的这个及其它实施例不需受限于这样的一种环境。
传统的诸多电子商务平台通常易于以一半结构化形式(a semi-structuredform)列示诸多产品。对于各种传统的电子商务平台列示诸多馈送(feeds)所需的格式各不相同,所述格式是语言具体的。因此,希望在诸多电子商务平台的一广泛范围上列示产品的商家通常需要在每个电子商务平台上以每种被期望的语言分别列示他们的产品。
本发明的一实施例的一特征在于:它有助于导入处于多种第一语言中的任一种的多个非结构化产品列示(unstructured product listings),将所述被导入的多个产品列示转换成一结构化语言不可知形式(structured language-agnostic form),并且随后提供处于多种第二语言中的任一种的所述多个产品列示。本发明的一实施例的所述系统呈现一产品列示,适合用于以任何语言列示在一结构化多语言目录(structured multi-language catalog)中或在任何适合的电子商务平台(electronic commerce plarform)上。
应当理解的是,所述第二多种语言通常还包括所述原始产品列示的所述语言,以及本发明的一实施例的所述系统可以被利用而汇入(import)处于一第一语言的一非结构化产品列示,并且以相同语言提供一结构化产品列示。
如图1所示,数据变换系统100通常包括数据操作功能(data manipulationfunctionality)102,所述数据操作功能与一数据库110进行相互作用(interacting),所述数据库110形成数据变换系统100的一部分。数据库110优选地包括用于多个非结构化产品列示及多个结构化产品列示的存储,所述多个非结构化产品列示通常被提供为处于一语言具体格式的多个输入,所述多个结构化产品列示通过数据变换系统100的数据操作功能102被提供。被存储在数据库110中的多个结构化产品列示可以处于一语言不可知格式(language agnostic format)及一种或多种语言具体格式(language specificformats)。
优选地,与数据库110进行接口(interfacing)的数据变换系统100所述数据操作功能102,优选地至少包括如下:
在下文中参考图4进一步描述的非结构化产品数据接收功能(unstructuredproduct data receiving functionality)120,以及,通常包括一馈送上载工具(feeduploading tool)122,包括一输入数据映射器(input data mapper)124及馈送文件接收功能(feed file receiving functionality)128,优选地包括数据写入功能(data writingfunctionality)130,一需求处理查明器(NEED TO PROCESS ascertainer)132和分类器/匹配器的触发器(classifier/matcher trigger)134;
产品分类/匹配功能(product classification/matching functionality)136;
除其他事项外(inter alia),非结构化产品数据提取功能(unstructuredproduct data extracting functionality)140与一字典(dictionary)142相互作用;
除其他事项外,非结构化语言具体对结构化语言不可知的产品数据转换功能(unstructured language specific to structured language agnostic product dataconverting functionality)144与字典142相互作用;
新产品创建及产品数据丰富功能(new product creation and product dataenrichment functionality)146;
语言不可知产品数据对语言具体产品数据转换功能(language agnosticproduct data to language specific product data converting functionality)150;
数据汇出功能160;及
选定商场列示功能(selected marketplace listing functionality)170。
这些功能在下文中参考图4到图25进一步说明。
现在参考图2,这是图示通过一卖方利用(employing)图1的系统执行的典型的多个初始运作。如图2所示,所述卖方选择他希望列出他的诸多产品的诸多市场,在这里也被称为“寄卖市场(marketplaces for boarding)”。所述卖方优选地为每个市场选择一货币兑换政策(currency conversion policy)、每个市场的一定价(pricing)及涨价(markup)政策,以及,每个市场的货运(shipping)及退货(return)政策。所述卖方然后将所述卖方列示馈送文件(seller listing feed file)上传到图1的所述系统中的数据库110。如图2所示,在上传所述卖方列示文件后,所述卖方发起本发明的所述系统的所述转换过程(conversion process),用于将所述非结构化语言具体产品列示转换为多个结构化语言不可知产品列示,然后,所述多个结构化语言不可知产品列示被存储在数据库110中。
如图1所示的实施例所示,非结构化语言具体列示数据形成一卖方列示馈送文件(seller listing feed file)的一部分通常是通过非结构化产品数据接收功能(Unstructured Product Data Receiving Functionality,UPDRF)120被提供到数据变换系统100。优选地,数据变换系统100将所述非结构化的语言具体列示数据存储在数据库110中。两个不同的卖方列示馈送文件的示例显现在图3A及图3B中。
应当被理解的是,在图3A及图3B中的卖方列示馈送文件的每个示例,包括对于一相机镜头(camera lens)的两个分离的列示。在图3A及图3B中所有列示的所述语言是英文,并且在两个示例中的所述列示数据都包括自由文本,不仅描述所述相机镜头,而且还描述所述镜头的所述状态及所述镜头的定价。在一种情况下,运送数据也被包括在内。
非结构化产品数据接收功能(UPDRF)120通常被示例在图4中,并且包括馈送上传工具122,所述馈送上传工具122通常以处于一卖方馈送文件的形式接收非结构化语言具体列示数据,诸如图3A及图3B所示。馈送上传工具122通常被实现在与图1的所述系统的一门户(portal)相关联的一网页(web page)上,这也能够参照上文对图2描述的功能。
除其他事项外,馈送上传工具122包括输入数据列映射器124,所述输入数据列映射器124根据从卖方接收到的多个指令,将在所述卖方列示馈送文件中的多个列(columns)映射到在数据库110中的多个列。所述输入数据列映射器124提供一映射指令输出(mappinginstruction output),所述映射指令输出通过数据变换系统100的非结构化产品数据接收功能120被利用,以重新排列在所述卖方列示馈送文件中的所述多个列,用以相应于在数据库110中的所述多个列,然后上传所述重新排列的数据到数据库110。图5是图示所述输入数据列映射器124的所述运作(operation)。
对于上传一卖方列示馈送文件到所述数据库110汇总(summarizing)的一优选的流程的一简化的流程图。除了通过输入数据列映射器124而被提供的所述映射指令输出以外,所述卖方列示馈送文件及通过馈送文件接收功能128而被处理的所述映射指令输出,也形成非结构化产品数据接收功能(UPDRF)120的一部分。
馈送文件接收功能128包括数据写入功能130,所述数据写入功能130根据通过输入数据列映射器124产生的所述多个映射指令,将来自所述卖方列示馈送中的每一行数据写入到所述数据库110中的一相应的行。所述数据写入功能130也将一独特列示金钥(unique listing key)添加到每一行,所述独特列示金钥优选地通过一散列函数(hashfunction)的运作而被生成,所述散列函数诸如一常规MD5散列函数。
所述数据写入功能130还优选地将一更新日期(update date)添加到每一行,以指示所述卖方列示数据被上传到数据库110的日期。
馈送文件接收功能128还包括一需要处理查明器(NEED TO PROCESSascertainer)132,以查明一新加载的列示(newly loaded listing)是否相关于已经存在于所述数据库上的列示,如果不是,则所述新加载的列示被列为一需要处理的标题(subject)。所述需要处理查明器132将新添加的行(row)的独特列示金钥(unigue listingkey)与在数据库中的所有列示(listings)的所述独特列示金钥进行比较。如果没有找到匹配(match),则将一需要处理旗标(flag)显现在所述新添加的行的“需要处理”的列中。
馈送文件接收功能128进一步包括分类器/匹配器的触发器134。分类器/匹配器的触发器134仅在整个卖方列示馈送文件已被上载到数据库110,并且已经为每个新的行生成一独特列示金钥时进行运作。
在上传整个卖方列示馈送文件后,分类器/匹配器的触发器134发起分类/匹配功能136,所述分类/匹配功能136处理在一新添加的行的所述需要处理的列中显现一需要处理旗标的多个行。分类/匹配功能136尝试将新列示与已经在数据库110中的一产品进行匹配。
一示例性更新的非结构化语言具体列示表格被存储在数据库110中,所述非结构化语言具体列示表格包括显现在图3A及图3B的卖方列示馈送文件中的所述列示数据,如图7所示。可以看出的是,除其他事项外,每一行包括一独特列示金钥、更新日期及在其中适当的一需要处理的旗标。
如上所述,在上传整个卖方列示馈送文件后,所述分类器/匹配器的触发器134发起分类/匹配功能136,分类/匹配功能136处理显现一需要处理旗标的多个行。
分类/匹配功能136被描述于如下有关图8呈现的一广义概观(generalizedoverview)。
如图8所示,分类/匹配功能136首先对一独特产品标识符确认是否存在,所述独特产品标识符(unigue product identifier),诸如一UPC代码或其完全由数字组成的等效物(equivalent)。如果从所述卖方列示供稿文件存储在来自数据库110(图7)中的一个行的所述列示描述列中的所述数据中提取这样一个独特产品标识符,并且该独特商品标识符已经存储在数据库110中,通过所述列示被呈现的所述产品与已经被存储在数据库110中的产品相匹配。
如果使用一独特产品标识符的匹配不能被实现,则分类/匹配功能136然后尝试从所述新的列表中提取一制造商(Manufacturer)与制造商的产品编号(Product Number),所述产品编号通常由数字与以拉丁字符(Latin characters)的字母(letters)组成。如果一制造商及制造商的产品编号从所述卖方列示馈送文件存储在来自数据库110(图5)中的一个行的所述列示描述列中的数据中被提取,并且该制造商与制造商的产品编号已经存储在数据库110中,通过所述列示被呈现的所述产品与已经存储在数据库110中的产品相匹配。
如果使用一独特产品标识符或一制造商与制造商的产品编号进行匹配不能被实现,则分类/匹配功能136然后尝试识别所述新列示的所述语言。这是使用常规技术被实现的,诸如可以在https://pypi.python.org/pypi/langdetect被找到。
一旦所述新列示的所述语言被识别(identified),所述列示被分类(classified)到一类别(category)中。分类/匹配功能136通过利用语言具体功能将所述列示分类为一类别,并且优选地利用一经过训练的统计模型,以对每个新添加的行中的所有列示数据进行分类,并且将该行分类为相关于存储在数据库110中的一类别结构表格中的多个类别中的一个,一简化示例显现在图9中。
考虑图9,可以看出的是,所述类别结构包括在一些类别之间存在一母子关系(parent-child relationship)的一指示(indication)。
因此,例如:类别C1000及C1002与母类别C100相关,类别C1001与母类别C101相关,并且类别C100及C101没有母类别。应当理解的是,所述分类功能可运作以将每个新添加的行分类为最特定的类别,例如:如果一类别存在一子类别。所述分类功能可运作于指定一类别ID到每一行。此类别ID是语言不可知的(language agnostic)。
一旦所述列示的所述类别被查明(ascertained),非结构化产品数据提取功能140从所述列示数据中提取各种属性与多个值,并且存储在一列示被提取的数据语言具体高速缓存(listing extracted data language specific cache)中的属性及多个值。这种步骤的一示例在图10中被示意性地图示。
从图10的一考量中,可以看出的是,不同的多个结构化语言具体属性与多个值通过非结构化产品数据提取功能140从非结构化语言具体列示数据被提取。还应当被理解的是,每个被提取的属性与值都具有对应的ID,这是语言不可知的。所述被提取的语言具体结构化数据优选地被临时存储在所述列示被提取的数据语言具体高速缓存,并且非结构化语言具体对语言不可知的产品数据转换功能144提供所述相应的被提取的语言不可知结构数据,所述被提取的语言不可知结构数据优选地被临时存储在一列示被提取的数据语言不可知高速缓存(listing extracted data language agnostic cache)。
每个属性都具有一个属性ID。图11是一类别属性结构表格的一示例,所述类别属性结构表格被存储在数据库110中,所述类别属性结构表格的多个属性与一给定类别(given category)相关联,所述给定类别在这里是镜头,所述镜头的类别ID是C1002(图9)。可以看出的是,每个属性都有一个属性ID,所述属性ID是语言不可知的,并且通过一属性类型被特性化(characterized)。所述多个属性类型通常包括:
一离散值列单(discrete value list)-多个预定值的一预定离散数量:
一个数字-可能具有大量数值的一个数字
每个值都具有一个值ID。图12是一属性值结构表格(attribute value structuretable)的一简化示例,所述属性值结构表格被存储在数据库110中,所述属性值结构表格的多个值与各种属性相关联(图11)。
应当被理解的是,不同的多个属性与多个值可以应用于多个类别,尽管这是罕见的并且通常被认为不会发生的。
应当被理解的是,在图9、图11及图12的多个表格中示例的多个结构与存储在数据库110中的一非常大的语言具体/语言不可知表格(language specific/languageagnostic table)相关联,所述语言具体/语言不可知表格存储相应于用于多个类别(categories)、多个属性(attributes)及多个值(values)的所有相关语言的多个列示描述(listing descriptions)的产品数据,以及,所述多个类别、诸多属性及诸多值相应的多个语言不可知ID。除其他事项外,字典142被实施在一语言具体/语言不可知表格中,所述语言具体/语言不可知表格的一简化示例显现在图13中。实际上,在图9、图11及图12示例的多个结构可以被存储在数据库110中,但没有一语言具体类别、属性或值名称。
优选地,整个语言具体/语言不可知表格中通常包括数十万个,甚至数百万个,不被使用于匹配(matching)的登录项(entries)。反倒是,只有那些处于所述被查明的(ascertained)语言的登录项被使用,并且对于那些登录项而言,最初仅有与类别相关的登录项被利用在图10的所述功能中(图9)。只有一旦在一列示的所述类别已经被查明为被企图通过使用仅在所述语言具体/语言不可知表格(图13)中的这些登录项与诸多属性及诸多值才进行匹配(图11及图12),所述所述语言具体/语言不可知表格(language specific/language agnostic)与已经查明的语言及类别有关。
优选地,在诸多属性及诸多值的匹配过程中,首先企图使用在图13中示例的一值表格(value table)以匹配多个值(values)。由于在实践过程中最重要的多个值是单一属性具体的(single attribute specific),因此通过多个匹配值(matching values),也可以实现一属性匹配(attribute match)。
再次转而参照图10,应当被理解的是,这里存在各种不同规则(rules),所述规则识别不同的多个列示数据元素(listing data elements),通常是多个值,并且所述多个值与不同的属性相关联。例如:“18-55”通过规则被辨识(recognized)为意指一焦距(focallength),并且“F/”意指一镜头光圈(lens aperture)。在图11中的所述功能中有用的两组典型的规则显现在图14A及图14B中。
现在转而参照图8,可以看出的是,一类别具体特征匹配矩阵(category
specific feature match matrix)被利用于进行匹配(matching)。这个矩阵为每
个类别定义必须知道的最小属性集合(minimum set of attributes),以便为在
那个类别中的一产品建立一产品匹配(product match)。这样的一种矩阵的一
个示例显现在图15中。
如果建立一产品匹配所需的诸多属性及诸多值被提取,并且在所述数据库中的一产品包括在所述矩阵中被指明的所有属性及值,则在所述新列示中的所述产品被匹配为在所述数据库中的一产品。
如果建立一产品匹配所需的诸多属性及诸多值不被提取,则系统100利用所述新产品创建及数据丰富功能146添加所述列示到数据库110。
现在参考图16,图16为示例系统100的新产品创建及数据丰富功能146的一简化流程图。
如图16所示,如果一新列示与已经在数据库中的一产品相匹配,则在所述新列示中的所有属性及值都被提取,并且以一语言不可知形式存储在数据库110中的一语言不可知结构化产品表格中。
然后查明显现在所述新列表中所有成对的属性-值(attribute-value pairs)是否显现在被存储于所述数据库中的所述产品数据中。如果所述新列示中没有显现在所述数据库中被存储的所述产品数据中的诸多属性及诸多值,则将这些新属性及值添加到数据库110中的现有产品。
如果所述新列示与所述数据库中已有的一产品不匹配,则在数据库110中的所述结构化产品表格中创建一新产品行(new product row)。一结构化产品表格的一个示例显现于图17中。一新产品ID被创建并且所有相关的成对的属性/值(attribute/value pairs)与所述新产品ID相关联,并且优选地存储在数据库110中的一新结构化产品数据表格中,这样的一示例显现在图18中。
在所述新产品ID和新成对的属性/值的所述创建过程(creation)后,所述列示将以一语言不可知形式被添加到数据库110中的所述语言不可知结构化产品表格。
如图16所示,如果新列示不被分类到数据库110中的一类别,则所述新列示被丢弃(discarded),并且系统100优选地通知所述卖方有关所述新列示是值得注意要被分类的(notable to be classified)。在这个阶段,在所述数据库110中的所述数据是备妥的,用于汇出(export)到由所述卖方指定的一个或多个商场(图2)。对于每个商场,一初始步骤是将所述产品数据从语言不可知形式转换为适用于该商场的一语言具体形式。图20显示系统100的所述语言具体不可知产品数据对语言具体产品数据转换功能150的一示例。优选使用一结构翻译表格,这样的一示例显现于图21中。另外,多个商场具体转换参数(marketplacespecific conversion parameters)在一商场具体数据规范表格(marketplace specificdata specifications table)中被找到,这样的一示例被图示在图19中。
优选地,语言不可知产品数据对语言具体产品数据转换功能150初始地将诸多属性从语言不可知形式(language agnostic form)转换为适合用于指定商场的语言具体形式(language specific form)。从此以后,语言不可知产品数据对语言具体产品数据转换功能150转换的诸多值不是多个数字。从图20中可以看出,所述过程以适合用于指定商场的所述语言具体形式产生作为多个输出的多个成对的属性-值(attribute-value pairs)。
由于不同商场利用不同的计量(measure)及货币(currencies)单位,通过数据输出功能160可以被执行(carried out)产品数据的各种操作(manipulations)。这种操作的诸多典型规则显现于图22中。此外,产品数据的商场具体修改可能是适当的。图23指示用于此用途(purpose)的一适用规则。
如图23所示,一典型的语言具体产品列示创建规则(typical language specificproduct listing creation rule)被提供用于俄语的所述OZON市场。通过使用图21的表格及所述被翻译的多个值,七个不同成对的属性-值(attribute-value pairs)被翻译。所述产生的商场语言具体产品列示被存储在数据库110中的一商场语言具体产品数据高速缓存(marketplace language specific product data cache)中,并且可以在一被指定的商场上寄卖(boarding)。
优选地,选定商场列示功能170利用一指定商场的一应用程序接口(API),将所述列示寄录(board)到所述指定的商场上。
系统100的选定商场列示功能170通过所述API,以一商场具体格式(marketplacespecific format)及语言提交(submits)一列示馈送(listing feed)。所述商场具体格式包括映射到具体市场的所述类别及成对的属性-值。这种映射的诸多示例在图24及图25中被示出。
在这里存在的情况中,这种映射是一个对一个(one to one)及映射更复杂的情况,诸如一个对多个(one to many)及/或多个对一个(many to one)。在这种情况下,所述成对的属性-值可能被涉及在所述映射中。
一旦每个列出的产品的所述寄录商场类别(boarded marketplace category)被选定,所述成对的属性值被映射到所述寄录商场的所述具体成对的属性值。这种映射通常利用一个对一个的映射。成对的属性-值映射的一个示例显现于图25中。在所述数据库中不存在于所述寄录商场中的成对的属性值通常被忽略。存在于所述寄录商场但不存在于数据库中成对的属性值通常也被忽略,但还是可以通过预先进行的多个转换而被提供。这样的一种转换的一个示例显现于图26中。
另一个重要步骤是将所述商场具体产品信息(marketplace-specific productinformation)与列示信息一致化(unifying),所述列示信息不包括在所述产品数据中。这种列示信息的一个示例是价格信息(price information)。参照如上文对图2所述内容,因为所述卖方可能针对不同的市场选择不同的定价政策(pricing policy),定价政策可能是对市场具体的,如同通过所述卖方选定的,并且不仅仅是一货币兑换的结果。
除了价格以外,所述列示信息可以包括与所述产品条件相关的卖方选定参数,如图26所示。
本领域技术人员将理解,本发明的范围不会受到上文特别示出及描述的内容的限制。相反,本发明的范围包括上文所述特征的组合及子组合,以及,其在现有技术中的修改。

Claims (87)

1.一种变换数据的方法,其特征在于,所述方法包括步骤:
接收处于一第一语言具体形式的一数据;
将处于所述第一语言具体形式的所述数据转换为一语言不可知形式;及
储存处于所述语言不可知形式的所述数据;
将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式;及
按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
2.根据权利要求1所述的变换数据的方法,其特征在于,所述将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式的步驟是按需求发生的。
3.根据权利要求1或2所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
4.根据权利要求1或2所述的变换数据的方法,其特征在于,所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
5.根据权利要求1至4任一项所述的变换数据的方法,其特征在于,所述至少一第二语言具体形式包括所述至少第一语言具体形式。
6.根据权利要求1或2所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
7.根据权利要求1至6任一项所述的变换数据的方法,其特征在于,所述方法的步骤还包括:将处于所述第一语言具体形式的所述数据从一非结构化数据转换为一结构化数据,其中所述将处于所述第一语言具体形式的所述数据转换为所述语言不可知形式的步骤包括:将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
8.根据权利要求1至7任一项所述的变换数据的方法,其特征在于,所述第一语言具体形式的所述数据与一课题有关。
9.根据权利要求8所述的变换数据的方法,其特征在于,所述课题包括一文章。
10.根据权利要求9所述的变换数据的方法,其特征在于,所述文章的多个属性通过所述数据被描述。
11.根据权利要求10所述的变换数据的方法,其特征在于,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应属性。
12.一种用于变换数据的系统,其特征在于,包括:
一数据接收功能,能够运作以接收处于一第一语言具体形式的一数据;
一语言具体对语言不可知的数据转换功能,能够运作以将处于所述第一语言具体形式的所述数据转换为一语言不可知形式;
一语言不可知数据库,被配置以储存处于所述语言不可知形式的所述数据;
一语言不可知对语言具体的数据转换功能,能够运作以将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式;及
一数据汇出功能,能够运作以按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
13.根据权利要求12所述的用于变换数据的系统,其特征在于,所述语言不可知对语言具体的数据转换功能能够运作以按需求将处于所述语言不可知形式的所述数据转换为至少一第二语言具体形式。
14.根据权利要求12或13所述的用于变换数据的系统,其特征在于,所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
15.根据权利要求12或13所述的用于变换数据的系统,其特征在于,所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
16.根据权利要求12至15任一项所述的用于变换数据的系统,其特征在于,所述至少一第二语言具体形式包含所述至少第一语言具体形式。
17.根据权利要求12或13所述的变换数据的方法,其特征在于,所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
18.根据权利要求12至17任一项所述的用于变换数据的系统,其特征在于,所述语言具体对语言不可知的数据转换功能还能够运作:
以将处于所述第一语言具体形式的所述数据从一非结构化数据转换为所述结构化数据;及
以将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
19.根据权利要求12至18任一项所述的用于变换数据的系统,其特征在于,处于所述第一语言具体形式的所述数据与一课题有关。
20.根据权利要求19所述的用于变换数据的系统,其特征在于,所述课题包括一文章。
21.根据权利要求20所述的用于变换数据的系统,其特征在于,所述文章的多个属性通过所述数据被描述。
22.根据权利要求21所述的用于变换数据的系统,其特征在于,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
23.一种用于变换数据的方法,其特征在于,所述方法包括步骤:
接收处于一第一语言具体形式的一非结构化数据;
将处于所述第一语言具体形式的所述非结构化数据转换为一结构化语言不可知形式;及
储存处于所述结构化语言不可知形式的所述数据;
将所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及
按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
24.根据权利要求23所述的变换数据的方法,其特征在于,所述将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式的步驟是按需求发生的。
25.根据权利要求23或24所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
26.根据权利要求23或24所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
27.根据权利要求23至26任一项所述的变换数据的方法,其特征在于,所述至少一第二语言具体形式包含所述至少第一语言具体形式。
28.根据权利要求23或24所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的语言相同的一数据。
29.根据权利要求23至28任一项所述的变换数据的方法,其特征在于,所述方法的步骤还包括:将处于所述第一语言具体形式的所述非结构化数据从一非结构化数据转换为所述结构化数据,其中所述将处于所述第一语言具体形式的所述非结构化数据转换为所述结构化语言不可知形式的步骤包括:将处于所述第一语言具体形式的所述结构化数据转换为处于所述结构化语言不可知形式的一结构化数据。
30.根据权利要求23至29任一项所述的变换数据的方法,其特征在于,所述第一语言具体形式的所述数据与一课题有关。
31.根据权利要求30所述的变换数据的方法,其特征在于,所述课题包括一文章。
32.根据权利要求31所述的变换数据的方法,其特征在于,所述文章的多个属性通过所述数据被描述。
33.根据权利要求32所述的变换数据的方法,其特征在于,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
34.一种用于变换数据的系统,其特征在于,包括:
一非结构化数据接收功能,能够运作以接收处于一第一语言具体形式的一非结构化数据;
一非结构化语言具体对结构化语言不可知的数据转换功能,能够运作以将处于所述非结构化第一语言具体形式的所述数据转换为一结构化语言不可知形式;
一结构化语言不可知数据库,被配置以储存处于所述结构化语言不可知形式的所述数据;
一结构化语言不可知对语言具体的数据转换功能,能够运作以将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及
一数据汇出功能,能够运作以按需求汇出处于所述至少一第二语言具体形式中的至少一者的所述数据。
35.根据权利要求34所述的用于变换数据的系统,其特征在于,所述语言不可知对语言具体的数据转换功能能够运作以按需求将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式。
36.根据权利要求34或35所述的用于变换数据的系统,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
37.根据权利要求34或35所述的用于变换数据的系统,其特征在于,所处于述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
38.根据权利要求34至37任一项所述的用于变换数据的系统,其特征在于,所述至少一第二语言具体形式包括所述至少第一语言具体形式。
39.根据权利要求34或35所述的变换数据的方法,其特征在于,所述至少一第二语言具体形式的所述数据包括语言与处于所述第一语言具体形式的语言相同的一数据。
40.根据权利要求34至39任一项所述的用于变换数据的系统,其特征在于,所述非结构化语言具体对语言不可知的数据转换功能,能够运作:
以将处于所述第一语言具体形式的所述数据从所述非结构化数据转换为一结构化数据;及
以将处于所述第一语言具体形式的所述结构化数据转换为处于所述语言不可知形式的一结构化数据。
41.根据权利要求34至40任一项所述的用于变换数据的系统,其特征在于,处于所述第一语言具体形式的所述数据与一课题有关。
42.根据权利要求41所述的用于变换数据的系统,其特征在于,所述课题包括一文章。
43.根据权利要求42所述的用于变换数据的系统,其特征在于,所述文章的多个属性通过所述数据被描述。
44.根据权利要求43所述的用于变换数据的系统,其特征在于,所述数据包括多个属性值,所述多个属性值被指定到所述文章的多个相应的属性。
45.一种用于变换产品数据的方法,其特征在于,所述方法包括步骤:
提供一结构化语言不可知产品数据库,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;
接收处于一第一语言具体形式的非结构化产品数据;
分析所述非结构化产品数据,并且从处于所述第一语言具体形式的所述非结构化产品数据提取被指定到相应的多个非结构化产品属性的多个非结构化产品具体属性值;
将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式;
查明被指定到相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值是否相关于被储存于一结构化语言不可知产品数据库中的一具体产品,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;
因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值不相关于储存在所述结构化语言不可知产品数据库中的一具体产品,添加一新产品到所述结构化语言不可知产品数据库,所述新产品具有被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值;及
因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值相关于储存在所述结构化语言不可知产品数据库中的一具体产品,指定所述多个结构化语言不可知产品具体属性值给所述具体产品的所述相应的多个语言不可知结构化产品属性。
46.根据权利要求45所述的用于变换产品数据的方法,其特征在于,所述接收处于所述第一语言具体形式的所述非结构化产品数据的步骤包括:从被描述在处于所述第一语言具体形式的所述非结构化产品数据中的一产品的一供应商接收处于所述第一语言具体形式的所述非结构化产品数据。
47.根据权利要求45所述的用于变换产品数据的方法,其特征在于,所述接收处于所述第一语言具体形式的所述非结构化产品数据的步骤包括:自动地从多个电子商业平台中的任一者检索处于所述第一语言具体形式的所述非结构化产品数据。
48.根据权利要求45至47任一项所述的用于变换产品数据的方法,其特征在于,所述多个产品以多个产品类别被分类。
49.根据权利要求48所述的用于变换产品数据的方法,其特征在于,所述方法还包括步骤:分类一产品为所述多个产品类别中的至少一者。
50.根据权利要求49所述的用于变换产品数据的方法,其特征在于,所述方法还包括步骤:分析所述非结构化产品数据,以将被描述在所述非结构化产品数据中的一产品分类为所述多个产品类别中的至少一者。
51.根据权利要求50所述的用于变换产品数据的方法,其特征在于,所述方法还包括步骤:利用所述分类以查明被指定到所述相应的多个语言不可知结构化产品属性的所述结构化语言不可知产品具体属性值是否与储存在所述结构化语言不可知产品数据库中的一具体产品是有关的。
52.根据权利要求45至51任一项所述的用于变换产品数据的方法,其特征在于,所述方法还包括步骤:
将处于所述结构化语言不可知形式的所述数据转换为一格式,所述格式适于汇出到多个第三方电子商业平台中的任一者;及
汇出处于所述格式的所述数据到多个第三方电子商业平台中的特定一者,所述格式适合汇出到所述多个第三方电子商业平台中的所述特定一者。
53.根据权利要求45至51任一项所述的用于变换产品数据的方法,其特征在于,所述方法还包括步骤:
将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及
汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
54.根据权利要求53所述的用于变换产品数据的方法,其特征在于,所述汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据的步骤是按需求进行的。
55.根据权利要求53所述的用于变换产品数据的方法,其特征在于,所述汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据的步骤是自动进行的。
56.根据权利要求53至55任一项所述的用于变换产品数据的方法,其特征在于,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为所述结构化语言不可知形式的步骤包括:
查明是否所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在一字典中,其中对于每一种产品属性及被包括在所述产品属性中的产品属性值,所述字典包括:对所述第一语言形式的至少一者及所述至少一第二语言具体形式的每一者而言的一语言不可知标识符及其一翻译;
因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中,利用所述字典以将所述多个非结构化产品具体属性值及所述多个非结构化产品属性转换为所述结构化语言不可知形式;及
因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,将所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性添加到所述字典,并且指定一语言不可知标识符到所述多个非结构化产品具体属性值及所述多个非结构化产品属性中的每一者。
57.根据权利要求56所述的用于变换产品数据的方法,其特征在于,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式的步骤还包括:
因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,自动地将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为对所述至少一第二语言具体形式中的每一种而言的所述字典,并且将所述翻译添加到所述字典。
58.根据权利要求57所述的用于变换产品数据的方法,其特征在于,所述将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式的步骤还包括:
因应于查明处于所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,提示所述系统的一管理者对将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为所述至少一第二语言具体形式中的每一种,并且将所述翻译添加到所述字典。
59.根据权利要求56至58任一项所述的用于变换产品数据的方法,其特征在于,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述每一种利用所述字典。
60.根据权利要求53至59任一项所述的用于变换产品数据的方法,其特征在于,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一种是按需求发生的。
61.根据权利要求53至60任一项所述的用于变换产品数据的方法,其特征在于,所述将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一种是自动地发生的。
62.根据权利要求53至61任一项所述的用于变换产品数据的方法,其特征在于,在处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
63.根据权利要求53至61任一项所述的用于变换产品数据的方法,其特征在于,在处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
64.根据权利要求53至63任一项所述的用于变换产品数据的方法,其特征在于,所述至少一第二语言具体形式包含所述至少第一语言具体形式。
65.根据权利要求53至63任一项所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的所述语言相同的一数据。
66.一种多语言产品编目系统,其特征在于,所述系统包括:
一结构化语言不可知产品数据库,被配置用以储存,对于多个产品中的每一者,多个结构化语言不可知产品属性值被指定到相应的多个结构化语言不可知产品属性;
一非结构化产品数据接收功能,能够运作以接收处于一第一语言具体形式的一非结构化产品数据;
一非结构化产品数据提取功能,能够运作以分析所述非结构化产品数据,并且从处于所述第一语言具体形式的所述非结构化产品数据提取被指定为相应的多个非结构化产品属性的多个非结构化产品具体属性值;
一非结构化语言具体对结构化语言不可知产品的数据转换功能,能够运作以将被指定到相应的多个非结构化产品属性的所述多个非结构化产品具体属性值转换为一结构化语言不可知形式;及
一产品匹配功能,能够运作以:
查明被指定到相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值是否相关于被储存于一结构化语言不可知产品数据库中的一具体产品,所述结构化语言不可知产品数据库被配置用以,对于多个产品中的每一者,储存被指定到相应的多个结构化语言不可知产品属性的多个结构化语言不可知产品属性值;
因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值不相关于储存在所述结构化语言不可知产品数据库中的一具体产品,添加一新产品到所述结构化语言不可知产品数据库,所述新产品具有被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值;及
因应于查明被指定到所述相应的多个结构化语言不可知产品属性的所述多个结构化语言不可知产品具体属性值相关于储存在所述结构化语言不可知产品数据库中的一具体产品,指定所述多个结构化语言不可知产品具体属性值给所述具体产品的所述相应的多个语言不可知结构化产品属性。
67.根据权利要求66所述的多语言产品编目系统,其特征在于,所述非结构化产品数据接收功能,能够运作以从被描述在处于所述第一语言具体形式的所述非结构化产品数据中的一产品的一供应商接收处于所述第一语言具体形式的所述非结构化产品数据。
68.根据权利要求66所述的多语言产品编目系统,其特征在于,所述非结构化产品数据接收功能,能够运作以通过自动地从多个电子商业平台中的任一个检索处于所述第一语言具体形式的所述非结构化产品数据,而接收处于所述第一语言具体形式的所述非结构化产品数据。
69.根据权利要求66至68任一项所述的多语言产品编目系统,其特征在于,所述多个产品以多个产品类别被分类。
70.根据权利要求69所述的多语言产品编目系统,其特征在于,所述多语言产品编目系统还包括:一产品分类功能,能够运作以分类一产品为所述多个产品类别中的至少一者。
71.根据权利要求70所述的多语言产品编目系统,其特征在于,所述产品分类功能能够运作以分析所述非结构化产品数据,以将被描述在其中的一产品分类为所述多个产品类别中的至少一者。
72.根据权利要求71所述的多语言产品编目系统,其特征在于,所述产品匹配功能还能够运作以利用所述分类以查明被指定到所述相应的多个语言不可知结构化产品属性的所述结构化语言不可知产品具体属性值是否与储存在所述结构化语言不可知产品数据库中的一具体产品是有关的。
73.根据权利要求66至72任一项所述的多语言产品编目系统,其特征在于,所述多语言产品编目系统还包括:
一语言不可知对语言具体产品的数据转换功能,能够运作以将处于所述结构化语言不可知形式的所述数据转换为至少一第二语言具体形式;及
一产品数据汇出功能,能够运作以汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
74.根据权利要求73所述的多语言产品编目系统,其特征在于,还包括:
所述语言不可知对语言具体产品的数据转换功能还能够运作以将处于所述结构化语言不可知形式的所述数据转换为一格式,所述格式适于汇出到多个第三方电子商业平台中的任一个;及
所述产品数据汇出功能还能够运作以汇出处于所述格式的所述数据到多个第三方电子商业平台中的特定一者,所述格式适合汇出到所述多个第三方电子商业平台中的所述特定一者。
75.根据权利要求73或74所述的多语言产品编目系统,其特征在于,所述产品数据汇出功能能够运作以按需求地以汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
76.根据权利要求73或74所述的多语言产品编目系统,其特征在于,所述产品数据汇出功能能够运作以自动地汇出处于所述至少一第二语言具体形式中的至少一者的所述产品数据。
77.根据权利要求73至76任一项所述的多语言产品编目系统,其特征在于,还包括一字典,其中对于每一种产品属性及被包括在所述产品属性中的产品属性值,所述字典包括:对所述第一语言形式的至少一者及所述至少一第二语言具体形式的每一种而言的一语言不可知标识符及其一翻译。
78.根据权利要求77所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:
查明是否所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中;
因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性被包括在所述字典中,利用所述字典以将所述多个非结构化产品具体属性值及所述多个非结构化产品属性转换为所述结构化语言不可知形式;及
因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,将所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性添加到所述字典,并且指定一语言不可知标识符到所述多个非结构化产品具体属性值及所述多个非结构化产品属性中的每一者。
79.根据权利要求78所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还可被操作以:因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,自动地将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为对所述至少一第二语言具体形式中的每一种而言的所述字典,并且将所述翻译添加到所述字典。
80.根据权利要求79所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:因应于查明所述第一语言具体形式的所述多个非结构化产品具体属性值及所述多个非结构化产品属性未被包括在所述字典中,提示所述系统的一管理者对将所述多个非结构化产品具体属性值及所述多个非结构化产品属性翻译为所述至少一第二语言具体形式中的每一者,并且将所述翻译添加到所述字典。
81.根据权利要求77至80任一项所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:利用所述字典,以将所述将所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。
82.根据权利要求73至81任一项所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:按需求地将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。
83.根据权利要求73至81任一项所述的多语言产品编目系统,其特征在于,所述非结构化语言具体对结构化语言不可知产品的数据转换功能还能够运作以:自动地将处于所述结构化语言不可知形式的所述产品数据转换为所述至少第二语言具体形式的所述至少一者。
84.根据权利要求73至83任一项所述的多语言产品编目系统,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于多种第二语言具体形式的数据。
85.根据权利要求73至83任一项所述的多语言产品编目系统,其特征在于,处于所述至少一第二语言具体形式的所述数据包括处于单种第二语言具体形式的数据。
86.根据权利要求73至85任一项所述的多语言产品编目系统,其特征在于,所述至少一第二语言具体形式包含所述至少第一语言具体形式。
87.根据权利要求73至85任一项所述的变换数据的方法,其特征在于,处于所述至少一第二语言具体形式的所述数据包含语言与处于所述第一语言具体形式的所述语言相同的一数据。
CN201680014842.XA 2015-04-08 2016-04-07 数据变换系统及方法 Pending CN107430504A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562144407P 2015-04-08 2015-04-08
US62/144,407 2015-04-08
PCT/IL2016/050374 WO2016162872A1 (en) 2015-04-08 2016-04-07 Data transformation system and method

Publications (1)

Publication Number Publication Date
CN107430504A true CN107430504A (zh) 2017-12-01

Family

ID=57071881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680014842.XA Pending CN107430504A (zh) 2015-04-08 2016-04-07 数据变换系统及方法

Country Status (6)

Country Link
US (3) US10846486B2 (zh)
EP (1) EP3281100A4 (zh)
JP (4) JP6833712B2 (zh)
CN (1) CN107430504A (zh)
HK (1) HK1247341A1 (zh)
WO (1) WO2016162872A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016162872A1 (en) 2015-04-08 2016-10-13 Elady Limited Data transformation system and method
US11238348B2 (en) * 2016-05-06 2022-02-01 Ebay Inc. Using meta-information in neural machine translation
US11368466B2 (en) * 2019-09-18 2022-06-21 David Michael Vigna Data classification of columns for web reports and widgets
US11625544B2 (en) * 2020-08-13 2023-04-11 Naver Corporation Method and system for training document-level natural language processing models
US20230044152A1 (en) 2021-08-05 2023-02-09 Rakuten Group, Inc. System and method for multi-modal transformer-based catagorization

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1609867A (zh) * 2003-10-24 2005-04-27 英业达股份有限公司 网络客户问题回复系统
CN1988475A (zh) * 2006-10-26 2007-06-27 武汉理工大学 对等网络中逻辑异构系统数据整合方法
US20090089263A1 (en) * 2006-04-21 2009-04-02 Microsoft Corporation Parsing Unstructured Resources
US20120109786A1 (en) * 2010-10-27 2012-05-03 Nir Platek Multi-language multi-platform e-commerce management system
CN103177036A (zh) * 2011-12-23 2013-06-26 盛乐信息技术(上海)有限公司 一种标签自动提取方法和系统
US20130198183A1 (en) * 2000-12-07 2013-08-01 Half.Com, Inc. System and method for retrieving and normalizing product information
US20140019114A1 (en) * 2010-07-13 2014-01-16 Motionpoint Corporation Dynamic Language Translation of Web Site Content

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061675A (en) * 1995-05-31 2000-05-09 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog
US6112201A (en) * 1995-08-29 2000-08-29 Oracle Corporation Virtual bookshelf
JPH0981569A (ja) * 1995-09-12 1997-03-28 Hitachi Ltd 多カ国対応サービス提供システム
US6101515A (en) * 1996-05-31 2000-08-08 Oracle Corporation Learning system for classification of terminology
JPH1185758A (ja) * 1997-09-08 1999-03-30 Sony Corp 意思伝達方法及び意思伝達システム
AU2001249123A1 (en) * 2000-03-15 2001-09-24 Hiawatha Island Software Co., Inc. System and method for providing computer network search services
US7213027B1 (en) * 2000-03-21 2007-05-01 Aol Llc System and method for the transformation and canonicalization of semantically structured data
US6714939B2 (en) * 2001-01-08 2004-03-30 Softface, Inc. Creation of structured data from plain text
US7337132B2 (en) 2001-10-17 2008-02-26 Sun Microsystems, Inc. Customizable two step mapping of extensible markup language data in an e-procurement system and method
US20040243554A1 (en) * 2003-05-30 2004-12-02 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis
US9189568B2 (en) * 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
US7613996B2 (en) * 2005-08-15 2009-11-03 Microsoft Corporation Enabling selection of an inferred schema part
US7996440B2 (en) * 2006-06-05 2011-08-09 Accenture Global Services Limited Extraction of attributes and values from natural language documents
US7970767B2 (en) * 2006-06-05 2011-06-28 Accenture Global Services Limited Extraction of attributes and values from natural language documents
US7552127B2 (en) * 2006-12-19 2009-06-23 International Business Machines Corporation System and method for providing platform-independent content services for users for content from content applications leveraging Atom, XLink, XML Query content management systems
US20100121630A1 (en) * 2008-11-07 2010-05-13 Lingupedia Investments S. A R. L. Language processing systems and methods
WO2011095988A2 (en) * 2010-02-03 2011-08-11 Puranik Anita Kulkarni A system and method for extraction of structured data from arbitrarily structured composite data
US8504492B2 (en) * 2011-01-10 2013-08-06 Accenture Global Services Limited Identification of attributes and values using multiple classifiers
US8620836B2 (en) * 2011-01-10 2013-12-31 Accenture Global Services Limited Preprocessing of text
JP5750665B2 (ja) * 2011-05-20 2015-07-22 株式会社フィッシュテイル 商品情報検索システム、商品情報検索方法及び商品情報検索プログラム
US9922096B2 (en) * 2011-07-08 2018-03-20 Yahoo Holdings, Inc. Automated presentation of information using infographics
US20150339759A1 (en) * 2012-02-06 2015-11-26 Amazon Technologies, Inc. Detecting product attributes associated with product upgrades based on behaviors of users
US8639698B1 (en) * 2012-07-16 2014-01-28 Google Inc. Multi-language document clustering
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US9443005B2 (en) * 2012-12-14 2016-09-13 Instaknow.Com, Inc. Systems and methods for natural language processing
CA2917717A1 (en) * 2013-07-09 2015-01-15 Blueprint Software Systems Inc. Computing device and method for converting unstructured data to structured data
US9015730B1 (en) * 2013-12-17 2015-04-21 International Business Machines Corporation Natural language access to application programming interfaces
US20160078398A1 (en) * 2014-09-16 2016-03-17 The Nielsen Company (Us), Llc Methods and apparatus to categorize items
WO2016162872A1 (en) 2015-04-08 2016-10-13 Elady Limited Data transformation system and method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130198183A1 (en) * 2000-12-07 2013-08-01 Half.Com, Inc. System and method for retrieving and normalizing product information
CN1609867A (zh) * 2003-10-24 2005-04-27 英业达股份有限公司 网络客户问题回复系统
US20090089263A1 (en) * 2006-04-21 2009-04-02 Microsoft Corporation Parsing Unstructured Resources
CN1988475A (zh) * 2006-10-26 2007-06-27 武汉理工大学 对等网络中逻辑异构系统数据整合方法
US20140019114A1 (en) * 2010-07-13 2014-01-16 Motionpoint Corporation Dynamic Language Translation of Web Site Content
US20120109786A1 (en) * 2010-10-27 2012-05-03 Nir Platek Multi-language multi-platform e-commerce management system
CN103250171A (zh) * 2010-10-27 2013-08-14 尼耳·派拉克 多种语言与多种平台电子化商业交易的管理系统
CN103177036A (zh) * 2011-12-23 2013-06-26 盛乐信息技术(上海)有限公司 一种标签自动提取方法和系统

Also Published As

Publication number Publication date
JP7089605B2 (ja) 2022-06-22
HK1247341A1 (zh) 2018-09-21
JP2024042023A (ja) 2024-03-27
JP2018513481A (ja) 2018-05-24
EP3281100A4 (en) 2018-10-17
EP3281100A1 (en) 2018-02-14
JP2021073615A (ja) 2021-05-13
JP2022120108A (ja) 2022-08-17
JP6833712B2 (ja) 2021-02-24
US20240037348A1 (en) 2024-02-01
WO2016162872A1 (en) 2016-10-13
US20180137106A1 (en) 2018-05-17
US10846486B2 (en) 2020-11-24
US20210056268A1 (en) 2021-02-25

Similar Documents

Publication Publication Date Title
US11809393B2 (en) Image and text data hierarchical classifiers
US11763356B2 (en) Visualization of reputation ratings
CN107430504A (zh) 数据变换系统及方法
WO2020139735A1 (en) Account manager virtual assistant using machine learning techniques
US10546054B1 (en) System and method for synthetic form image generation
US9697282B2 (en) Search apparatus, search method, search program, and recording medium
US20130060662A1 (en) Identifying product variants
US20200089800A1 (en) Normalization of unstructured catalog data
JP2010092490A (ja) データ整理のための方法及びシステム
US9483740B1 (en) Automated data classification
JP2006172452A (ja) データ整理のための方法及びシステム
US20150186739A1 (en) Method and system of identifying an entity from a digital image of a physical text
US9256805B2 (en) Method and system of identifying an entity from a digital image of a physical text
JP2009026195A (ja) 商品分類装置、商品分類方法及びプログラム
US10409643B2 (en) Service request based application feature activation
US20210342919A1 (en) System and method for cross catalog search
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
AU2021202844B2 (en) Personalized transaction categorization
US11586820B2 (en) Techniques for enhancing the quality of human annotation
US11775922B2 (en) Logistic recommendation engine
CN112560418A (zh) 从自由形式的表格式数据创建行项目信息
CN104809143A (zh) 用于将表格信息植入信息库的方法和装置
TW202141393A (zh) 多來源電子商務資料統合系統及其實施方法
Schmidts et al. Catalog Integration of Low-quality Product Data by Attribute Label Ranking.
US20230325418A1 (en) System and Method for Joining Datasets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1247341

Country of ref document: HK