CN107301244B - 一种商标分卡处理的方法、装置、系统及商标存储器 - Google Patents

一种商标分卡处理的方法、装置、系统及商标存储器 Download PDF

Info

Publication number
CN107301244B
CN107301244B CN201710553047.4A CN201710553047A CN107301244B CN 107301244 B CN107301244 B CN 107301244B CN 201710553047 A CN201710553047 A CN 201710553047A CN 107301244 B CN107301244 B CN 107301244B
Authority
CN
China
Prior art keywords
trade mark
minimum unit
participle
inscape
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710553047.4A
Other languages
English (en)
Other versions
CN107301244A (zh
Inventor
徐庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Guofang Software Technology Co ltd
Xu Qing
Foshan Guofang Identification Technology Co Ltd
Original Assignee
Foshan City China Side Trademark Software Co Ltd
Foshan Country Trademark Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan City China Side Trademark Software Co Ltd, Foshan Country Trademark Services Co Ltd filed Critical Foshan City China Side Trademark Software Co Ltd
Publication of CN107301244A publication Critical patent/CN107301244A/zh
Application granted granted Critical
Publication of CN107301244B publication Critical patent/CN107301244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种商标分卡处理方法、装置、系统及商标存储器,其中,所述商标分卡处理方法包括以下步骤:对待分卡商标中的构成要素汉语文字、图形、字母、数字或符号进行识别,获取构成要素的内容;提取待分卡商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;根据预设的最小单元多种组合规则,获取每一组合规则所生成的分词作为商标分卡信息。与现有商标分卡处理方法相比,本发明能获取全面反映商标的形状特征、读音特征和含义特征的商标分卡信息,有利实现对检索出的样本商标与输入商标在多特征方面进行商标近似度的综合评价,大幅提高商标近似度的数量化评价水平,加速商标审查工作的进步。

Description

一种商标分卡处理的方法、装置、系统及商标存储器
技术领域
本发明涉及商标信息检索领域,具体涉及一种商标分卡处理的方法、装置、系统及商标存储器。
背景技术
商标查询对于商标注册、管理及保护具有重要的意义,其作用体现在:能及时发现商标注册申请的障碍,弄清商标能否安全使用,发现他人抢注的商标,了解商标的法律状态、查清相关商标权利范围的详细信息等。商标分卡是商标检索的基础工作。
现有技术的商标分卡处理方法主要是针对商标的文字内容和图形进行商标分卡,包括:对商标含有的文字按整体和文字类别进行分卡,文字类别又细分为汉语文字、字母组合、数字、拼音,图形则按维也纳协定建立的《商标图形要素国际分类》标准对图形进行商标图形要素编码划分。例如图2所示的商标图样,一般会建立如下分卡:针对商标的汉语文字内容建立汉语文字分卡:“格力”,针对商标的字母组合文字内容建立英文文字分卡:“GREE”,针对商标的图形建立商标图形要素编码:“26.1.10”。
传统的商标分卡技术方案仅能解决商标检索的基本数据问题,但无法解决由多项分卡检索请求而检索出的样本商标集与输入商标的相似程度评价问题,这种商标分卡存在以下缺陷和弊端:
1、根据商标审查实务的经验总结,商标近似判断的重点在于判断两商标在形、义、音方面是否存在共同特征,而传统的商标分卡处理方法针对商标的文字内容和图形的分卡结果,无法全面反映商标的形状特征、含义特征和读音特征。
2、传统的商标分卡方法难以支持样本商标与输入商标在形、义、音多特征方面进行商标近似度的综合评价,易在商标检索中产生近似商标的漏检。
发明内容
鉴于此,本发明的目的在于提供一种商标分卡处理的方法。旨在克服传统商标分卡处理方法的缺陷,获取全面反映商标的形状特征、读音特征和含义特征的商标分卡信息,有利实现对检索出的样本商标与输入商标在多特征方面进行商标近似度的综合评价。
为实现上述目的,本发明的技术方案如下:
一种商标分卡处理方法,包括以下步骤:
步骤S110:对待分卡商标中的构成要素汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;
步骤S120:提取待分卡商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;
步骤S130:根据预设的最小单元多种组合规则,获取每一组合规则所生成的分词作为商标分卡信息和商标近似度评价基础信息。
所述商标分卡处理方法,步骤S110所述的构成要素的内容中:汉语文字构成要素的内容为商标中含有的汉语文字及其组合,图形构成要素的内容为商标图样图片及图片特征信息,字母构成要素的内容为商标中含有的字母及其组合,数字或符号构成要素的内容为商标中含有的汉语数字、阿拉伯数字、其他语种数字或符号及其组合。
所述商标分卡处理方法,步骤S120所述待分卡商标各构成要素的形状特征最小单元包括:
构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划;
构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像特征字符串集;
构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母;
构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字;
构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字;
构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字;
构成要素为符号的形状特征最小单元:为每一单个的符号。
所述商标分卡处理方法,步骤S120所述各构成要素的含义特征最小单元包括:
构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元;
构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称;
构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元;
构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔的每一组汉语数字所对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字所对应的预设基准语种数字,商标中每一单个的其它语种数字所对应的预设基准语种数字,所述预设基准语种数字为任何语种数字;
构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称。
所述商标分卡处理方法,步骤S120所述各构成要素的读音特征最小单元包括:
构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音;
构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音;
构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音;
构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音。
所述商标分卡处理的方法,其中,步骤S130所述预设的最小单元多种组合规则,包括形状特征最小单元多种组合规则,含义特征小单元多种组合规则,读音特征最小单元多种组合规则,其中,
所述形状特征最小单元多种组合规则包括:
A、构成要素为汉语文字的形状特征最小单元多种组合规则,包括分卡标准 a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一种,其中,
a1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a3表示按顺序排列的商标中的汉语文字切分为一个分词,
a4表示按逆序排列的商标中的汉语文字切分为一个分词,
a5表示按顺序排列的商标中含有的汉语数字切分为一个分词,
a6表示按逆序排列的商标中含有的汉语数字切分为一个分词,
a7表示商标中每个相对独立的部分分别切分为一个分词,
a8表示商标文字中完整包含现有汉语文字商标,将该部分切分为一个分词,
a9表示商标中含有的繁体、异体字转换为简体字后切分为一个分词,
a10表示商标中每个文字替换为形近字后切分为一个分词,
a11表示商标中每相邻汉语文字分别切分为一个分词,
a12表示商标中首尾汉字组合切分为一个分词,
a13表示商标中每个汉语文字切分为一个分词;
B、构成要素为字母、数字、符号的形状特征最小单元多种组合规则,包括分卡标准b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一种,其中,
b1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b3表示按顺序排列的商标中的字母组合切分为一个分词,
b4表示按逆序排列的商标中的字母组合切分为一个分词,
b5表示按顺序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b6表示按逆序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b7表示按顺序排列的商标中含有的符号组合切分为一个分词,
b8表示按逆序排列的商标中含有的符号组合切分为一个分词,
b9表示商标中每个相对独立部分分别切分为一个分词,
b10表示商标中每个字母被形近字母替换后切分为一个分词,
b11表示商标中每相邻字母组合分别切分为一个分词,
b12表示商标中字母按照不同定序排列后分别切分为一个分词,
b13表示商标中首尾字母组合切分为一个分词,
b14表示商标中每个字母或数字或符号分别切分为一个分词;
C、构成要素为图形的形状特征最小单元多种组合规则,包括分卡标准c1、 c2、c3、c4中的至少一种,其中,
c1表示商标图形要素编码集合整体切分为一个分词,
c2表示每一商标图形要素编码切分为一个分词,
c3表示每种图像特征识别方法所产生的商标图像特征字符串集整体分别切分为一个分词,
c4表示每种图像特征识别方法所产生的商标图像特征字符串集预设定长分别切分为一个分词,所述商标图像特征字符串集预设定长是指预先设置的商标图像轮廓线上连续相连的像素点的长度,连续相连的像素点以特征字符串集、或数字集表示,取值范围为商标图像特征字符串集、或数字集总长度的0.1%-50%;
所述读音特征最小单元多种组合规则包括:
D、构成要素为汉语文字的读音特征最小单元多种组合规则,包括分卡标准 d1、d2、d3中的至少一种,其中,
d1表示商标中每个汉语文字的拼音音节切分为一个分词,
d2表示商标中整体汉语文字对应的拼音切分为一个分词,
d3表示商标中每个汉语文字被替换为形近字后的拼音音节切分为一个分词;
E、构成要素为字母、数字、符号的读音特征最小单元多种组合规则包括分卡标准e1、e2、e3、e4中的至少一种,其中,
e1表示商标中每个英文单词的读音音节切分为一个分词,
e2表示商标中字母组合被其音近字母组合替换后得到的整体字母组合分别切分为一个分词,
e3表示商标中每个数字的读音音节切分为一个分词,
e4表示商标中每个符号的读音音节切分为一个分词;
F、构成要素为图形的读音特征最小单元多种组合规则包括分卡标准f1,其中,f1表示商标的图形要素编码所对应的每一事物的名称的拼音切分为一个分词;
所述含义特征最小单元多种组合规则包括:
G、构成要素为汉语文字的含义特征最小单元多种组合规则包括分卡标准 g1、g2、g3、g4中的至少一种,其中,
g1表示商标中完整包含商标服务器中现有汉语文字商标、且商标整体无含义,将含有现有汉语文字商标的部分切分为一个分词,
g2表示商标中与汉语词典所收录的词汇或商标服务器中现有汉语文字商标的汉字组合全部匹配的,将匹配部分分别切分为一个分词,
g3表示商标中含有的汉语词汇替换为近义词后分别切分为一个分词,
g4表示商标整体无含义的,整体汉语文字切分为一个分词;
H、构成要素为字母、数字、符号组合的含义特征最小单元多种组合规则包括分卡标准h1、h2、h3、h4、h5、h6、h7、h8中的至少一种,其中,
h1表示商标的整体字母组合由英文词典或其他语种词典所记载的单词组合构成,整体单词组合切分为一个分词,
h2表示商标中含有英语词典或其他语种词典所收录的单词,每个单词切分为一个分词,
h3表示商标中含有英语词典或其他语种词典所收录的单词,将每个单词的近义词切分为一个分词,
h4表示商标的整体字母组合与英文词典或其他语种词典所记载的单词不匹配的,整体字母组合切分为一个分词,
h5表示商标中被分隔的每一组数字切分为一个分词,
h6表示商标的整体数字组合切分为一个分词,
h7表示商标的整体符号组合切分为一个分词,
h8表示商标的每一符号切分为一个分词,
h9表示商标完整包含商标服务器现有字母组合商标、且商标整体无含义,将含有现有字母组合商标的部分切分为一个分词;
I、构成要素为图形的含义特征最小单元多种组合规则包括分卡标准i1、i2中的至少一种,其中,
i1表示商标图形要素编码所对应的每一事物的名称切分为一个分词,
i2表示商标图像特征字符串集对应有商标图形要素编码,商标图形要素编码所对应每个事物名称切分为一个分词;
Y、构成要素为例外调整文字的最小单元多种组合规则包括分卡标准y1、y2中的至少一种,其中,
y1表示商标中含有例外调整文字,将例外调整文字整体切分为一个分词;
y2表示商标中含有例外调整文字,将例外调整文字每个文字分别切分为一个分词。
本发明的另一目的是提供一种商标分卡处理的装置,包括:
构成要素的内容获取模块,用于对待分卡商标是否由汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;
形状特征最小单元提取模块,用于提取待分卡商标各构成要素的形状特征最小单元;
读音特征最小单元提取模块,用于提取待分卡商标各构成要素的读音特征最小单元;
含义特征最小单元提取模块,用于提取待分卡商标各构成要素的含义特征最小单元;
商标分卡信息获取模块,用于根据预设的最小单元多种组合规则,获取每一规则所生成的各种文字、图形的分词作为一个商标分卡的信息。
本发明的另一目的是提供一种商标分卡处理的系统,包括商标存储器和服务器,所述商标存储器和服务器经配置执行以下操作:对待分卡商标是否由汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;提取并储存待分卡商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;根据预设的最小单元多种组合规则,获取每一规则所生成的分词作为一个商标分卡的信息。
本发明的另一目的是提供一种商标存储器,包括:
基础字词典存储单元,用于存储汉语文字、汉语词语、英语单词、图形要素编码及其对应的事物名称、形近字、音近字、近义词;
商标构成要素内容存储单元,用于存储获取待分卡商标的汉语文字、图形、字母、数字或符号构成要素;
形状特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的形状特征最小单元和根据预设的形状特征最小单元多种组合规则获取的商标分卡信息;
读音特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的读音特征最小单元和根据预设的读音最小单元多种组合规则获取的商标分卡信息;
含义特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的含义特征最小单元和根据预设的含义最小单元多种组合规则获取的商标分卡信息;
商标分卡处理的程序存储单元,用于存储商标分卡处理的相关程序。
有益效果:本发明提取商标含有的汉语文字、图形、字母、数字或符号构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元,并根据预设的最小单元组合规则获取每一规则所产生的分词,作为商标分卡信息,从而建立商标在形音义方面的基础数据,为解决商标检索的近似度评价提供有效的数据支持,保障商标近似判断时考虑了两商标在形、义、音方面是否存在共同特征,避免商标的漏检,有利实现对检索出的样本商标与输入商标在形、义、音多特征方面进行商标近似度的综合评价的目的。
附图说明
图1是本发明实施例中的商标分卡处理方法的流程示意图。
图2是本发明实施例的示例性商标原图。
图3是图2n所示商标采用10×10坐标系标准获取商标图像轮廓线上像素点的图像特征字符串集图。
图4是图2n所示图形商标采用20×20坐标系标准获取商标图像轮廓线上像素点的图像特征字符串集图。
图5是本发明实施例中的商标分卡处理装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下结合附图并和具体实施例对本发明进一步详细说明。
如图1所示,一种商标分卡处理的方法,包括以下步骤:
步骤S110:对待分卡商标中的构成要素汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;
步骤S120:提取待分卡商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;
步骤S130:根据预设的最小单元多种组合规则,获取每一组合规则所生成的分词作为商标分卡信息和商标近似度评价基础信息。
以下基于具体实施例对上述各步骤进行具体说明:
第一,步骤S110:对待分卡商标中的构成要素汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容。
所示商标构成要素的内容中,汉语文字构成要素的内容为商标中含有的汉语文字及其组合,图形构成要素的内容为商标图样图片及图片特征信息,字母构成要素的内容为商标中含有的字母及其组合,数字或符号构成要素的内容为商标中含有的汉语数字、阿拉伯数字、其他语种数字或符号。
图2a至图2p所示为随机给出的示例性商标原图,这些商标图像可能包括商标构成要素的内容有:汉语文字、字母、数字、符号、图形等,均可作为本发明实施例的处理对象,即输入商标或样本商标。
输入商标的构成要素的内容一般通过在商标检索的检索入口录入而获取,也可通过图像识别或OCR文字识别获取,样本商标的构成要素的内容一般从现有的商标数据库中的各种商标文字数据记录和商标图形要素编码数据记录中获取。
以图2a为例,获取该商标构成要素的内容包括:汉语文字构成要素的内容“格力”,字母构成要素的内容“GREE”,图形构成要素的内容“商标图形要素编码:26.1.10”。
第二,步骤S120:提取输入商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元。
在本发明的实施例中,商标分卡的目是为商标近似度评价提供数据支持,这些数据由各种特征的最小单元及其组合构成,各种特征最小单元包括:
(1)形状特征最小单元
构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划。以图2a为例,其构成要素为汉语文字的形状特征最小单元为商标中含有的每一汉语文字,即:“格”和“力”。
构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像特征字符串集。以图2a为例,构成要素为图形的形状特征最小单元为商标图形要素编码,即:“26.1.10”。
构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母。以图2a为例,构成要素为字母的形状特征最小单元选“每一语种的单词”时为“GREE”,选“每一个字母”时为:“G”、“R”、“E”、“E”。
构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字,以图2b为例,汉语数字的形状特征最小单元为“壹贰叁”或“壹”、“贰”、“叁”。
构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字。以“555”商标为例,阿拉伯数字的形状特征最小单元为“555”或“5”、“5”、“5”。
构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字。
构成要素为符号的形状特征最小单元,为每一单个的符号。以图2p为例,构成要素为符号的形状特征最小单元是单个的符号,即“@”为构成要素为符号的形状特征最小单元。
(2)含义特征最小单元
构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元。以图2d为例,商标整体汉语文字组合“四通欧谱”不是由汉语词典所记载的词语组合构成的,其含义特征最小单元为商标的整体汉语文字组合,即“四通欧谱”。
构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称。以图2n为例,经检索查询获得的该商标图形要素编码是:5.7.13,该图形要素编码所对应事物的名称是“苹果”或“柿子”,其含义特征最小单元即为“苹果”或“柿子”。
构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元。
构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔(被标点符号、分隔符等分开)的每一组汉语数字对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字可以为预设的任何语种的数字。以图2b为示例,预设基准语种数字为阿拉伯数字时,构成要素为汉语数字的含义特征最小单元为“123”或“1”、“2”、“3”。
构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字。
构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字,商标中每一单个其他语种数字所对应的预设基准语种数字。
构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称。
(3)读音特征的最小单元
构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音。
构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音。
构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音。
构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音。
第三,步骤S130:根据预设的最小单元多种组合规则,获取每一组合规则所生成的分词作为商标分卡信息。
按照商标构成要素的形状、含义、读音特征的最小单元及其多种组合规则生成的各种文字、图形的切分信息,可以通过各种最小单元及其及组合获得分词,将这些分词作为商标在形音义方面的商标分卡基础数据,为解决商标检索的近似度评价提供有效的数据支持。
按照商标构成要素的各特征最小单元的多种组合规则而生成的各种文字、图形的切分信息的商标分卡标准,或简称“商标分词规则”、或“商标分卡规则”详细说明如下:
(1)形状特征最小单元多种组合规则包括:
A、构成要素为汉语文字的形状特征最小单元多种组合规则,包括分卡标准 a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一种,其中,
a1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a3表示按顺序排列的商标中的汉语文字切分为一个分词,
a4表示按逆序排列的商标中的汉语文字切分为一个分词,
a5表示按顺序排列的商标中含有的汉语数字切分为一个分词,
a6表示按逆序排列的商标中含有的汉语数字切分为一个分词,
a7表示商标中每个相对独立的部分分别切分为一个分词,
a8表示商标文字中完整包含现有汉语文字商标,将该部分切分为一个分词,
a9表示商标中含有的繁体、异体字转换为简体字后切分为一个分词,
a10表示商标中每个文字替换为形近字后切分为一个分词,
a11表示商标中每相邻汉语文字分别切分为一个分词,
a12表示商标中首尾汉字组合切分为一个分词,
a13表示商标中每个汉语文字切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
a1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词。即商标含有的全部文字及图形要素编码,不管是汉语汉字或其他语种的文字、字母组合、数字组合、符号或其他要素之间的组合,也不管其是否能构成一个有常用含义的词汇,均将商标整体所有语种文字及图形要素编码的组合按顺序排列视为一个分词。以图2a为示例,按照本商标分词规则切分为:“格力 GREE+26.1.10”分词,以图2c为示例,按照本商标分词规则切分为:“美秀·诗美MEIXIUSHIMEI”分词。
a2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词。即商标含有的全部文字,不管是汉语汉字或其他语种的文字、字母组合、数字组合、符号或其他要素之间的组合,也不管其是否能构成一个有常用含义的词汇,均将商标整体所有语种文字及图形要素编码的组合逆序排列视为一个分词。以图2a为示例,按照本商标分词规则切分为:“26.1.10+EERG力格”分词,以图2c为示例,按照本商标分词规则切分为:“IEMIHSUIXIEM美诗·秀美”分词。注意:文字的最小单元为单个文字,多文字可换序;字母、数字、符号的最小单元为单个字母、数字、符号,多个字母、数字、符号组合可换序;图形要素编码“26.1.10”整体为图形形状特征最小单元,不可将其数字再换序,但多个图形要素编码之间可换序(下同)。
a3表示按顺序排列的商标中的汉语文字切分为一个分词。即商标含有的汉语汉字将其整体顺序排列视为一个分词。以图2c为示例,按照本商标分词规则切分为:“美秀诗美”分词。
a4表示按逆序排列的商标中的汉语文字切分为一个分词。即商标含有的汉语汉字将其整体逆序排列视为一个分词。以图2c为示例,按照本商标分词规则切分为:“美诗秀美”分词。
a5表示按顺序排列的商标中含有的汉语数字切分为一个分词。即商标含有的汉语数字将其汉语数字整体顺序排列视为一个分词或将其汉语数字的每一数字分别视为一个分词。以图2b为示例,按照本商标分词规则切分为:“壹贰叁”或“壹”、“贰”、“叁”分词分词。
a6表示按逆序排列的商标中含有的汉语数字切分为一个分词。即商标含有的汉语数字将其汉语数字整体逆序排列视为一个分词或将其汉语数字的每一数字分别视为一个分词。以图2b为示例,按照本商标分词规则切分为:“叁贰壹”或“叁”、“贰”、“壹”分词。
a7表示商标中每个相对独立的部分分别切分为一个分词。即商标含有的相对独立部分将其相对独立部分分别视为一个分词。以图2c为示例,按照本商标分词规则切分为:“美秀”、“诗美”、“MEIXIU SHIMEI”分词。注意:相对独立部分的区分规则包括:不同语种为不同的相对独立部分,用符号或空格分隔开的同一语种文字组合为相对独立部分,不同的颜色的同一语种文字组合为相对独立部分。
a8表示商标文字中完整包含现有汉语文字商标,将该部分切分为一个分词。即商标含有在先的他人汉语文字商标,将该在先的他人商标的该部分视为一个分词。以图2d为示例,假设在先的他人商标有:“四通”、“欧普”,按照本商标分词规则切分为:“四通”、“欧普”分词。
a9表示商标中含有的繁体、异体字转换为简体字后切分为一个分词。即商标含有繁体、异体字,将该繁体、异体字转换为简体字后视为一个分词。以图2e、图2f为示例,按照本商标分词规则分别将商标中的“匯”、“滙”字切分为:“汇”分词。
a10表示商标中每个文字替换为形近字后切分为一个分词。即商标汉字具有形近字时,利用其形近字替换原有文字后视为一个分词。实际应用,可通过关联形近字字典,查询商标汉字是否具有形近字,以图2h为示例,按照本商标分词规则分别切分为:“格刀”、“格刃”、“烙力”、“洛力”、“络力”、“恪刀”、“恪力”、“辂力”等分词。
a11表示商标中每相邻汉语文字分别切分为一个分词。即当商标汉字字数在三个及以上时,将商标中相邻的每两个汉字视为一个分词。以图2d为示例,按照本商标分词规则分别切分为:“四通”、“通欧”、“欧普”分词。
a12表示商标中首尾汉字组合切分为一个分词。即当商标汉字字数在三个及以上时,将商标中首尾汉字视为一个分词。以图2d为示例,按照本商标分词规则分别切分为:“四普”分词。
a13表示商标中每个汉语文字切分为一个分词。即将商标中每一个汉字视为一个分词。以图2d为示例,按照本商标分词规则分别切分为:“四”、“通”、“欧”、“普”分词。
B、构成要素为字母、数字、符号的形状特征最小单元多种组合规则,包括分卡标准b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一种,其中,
b1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b3表示按顺序排列的商标中的字母组合切分为一个分词,
b4表示按逆序排列的商标中的字母组合切分为一个分词,
b5表示按顺序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b6表示按逆序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b7表示按顺序排列的商标中含有的符号组合切分为一个分词,
b8表示按逆序排列的商标中含有的符号组合切分为一个分词,
b9表示商标中每个相对独立部分分别切分为一个分词,
b10表示商标中每个字母被形近字母替换后切分为一个分词,
b11表示商标中每相邻字母组合分别切分为一个分词,
b12表示商标中字母按照不同定序排列后分别切分为一个分词,
b13表示商标中首尾字母组合切分为一个分词,
b14表示商标中每个字母或数字或符号分别切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
b1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词。即商标含有的全部文字及图形要素编码,不管是汉语汉字或其他语种的文字、字母组合、数字组合、符号或其他要素之间的组合,也不管其是否能构成一个有常用含义的词汇,均将商标整体所有语种文字及图形要素编码的组合按顺序排列视为一个分词。以图2a为示例,按照本商标分词规则切分为:“格力 GREE+26.1.10”分词,以图2c为示例,按照本商标分词规则切分为:“美秀·诗美MEIXIUSHIMEI”分词。
b2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词。即商标含有的全部文字,不管是汉语汉字或其他语种的文字、字母组合、数字组合、符号或其他要素之间的组合,也不管其是否能构成一个有常用含义的词汇,均将商标整体所有语种文字及图形要素编码的组合逆序排列视为一个分词。以图2a为示例,按照本商标分词规则切分为:“26.1.10+EERG力格”分词,以图2c为示例,按照本商标分词规则切分为:“IEMIHSUIXIEM美诗·秀美”分词。
b3表示按顺序排列的商标中的字母组合切分为一个分词。即商标含有的字母组合文字将其整体字母顺序排列视为一个分词。以图2c为示例,按照本商标分词规则切分为:“MEIXIUSHIMEI”分词。
b4表示按逆序排列的商标中的字母组合切分为一个分词。即商标含有的字母组合文字将其整体字母逆序排列视为一个分词。以图2c为示例,按照本商标分词规则切分为:“IEMIHSUIXIEM”分词。
b5表示按顺序排列的商标中含有非汉语数字或每一单个的非汉语数字分别切分为一个分词。即商标含有的非汉语数字,将该语种的数字整体顺序排列视为一个分词或将该语种数字的每一数字分别视为一个分词。以图2i为示例,按照本商标分词规则切分为:“one two three”或“one”、“two”、“three”分词。
b6表示按逆序排列的商标中含有非汉语数字或每一单个的非汉语数字分别切分为一个分词。即商标含有的非汉语数字将该语种数字整体逆序排列视为一个分词或将该语种数字的每一数字分别视为一个分词。以图2i为示例,按照本商标分词规则切分为:“threetwo one”或“three”、“two”、“one”分词。
b7表示按顺序排列的商标中含有符号组合切分为一个分词。即商标含有的符号组合文字将其符号组合文字整体顺序排列分别视为一个分词。以图2p为示例,按照本商标分词规则切分为:“@”分词。
b8表示按逆序排列的商标中含有符号组合切分为一个分词。即商标含有的符号组合文字将其符号组合文字整体逆序排列分别视为一个分词。以图2p为示例,按照本商标分词规则切分为:“@”分词。
b9表示商标中每个相对独立部分分别切分为一个分词。即商标含有的相对独立部分将其相对独立部分分别视为一个分词。以图2c为示例,按照本商标分词规则切分为:“美秀”、“诗美”、“MEIXIU SHIMEI”分词。注意:相对独立部分的区分规则包括:不同语种为不同的相对独立部分,用符号或空格分隔开的同一语种文字组合为相对独立部分,不同的颜色的同一语种文字组合为相对独立部分。
b10表示商标中每个字母被形近字母替换后切分为一个分词。即商标中字母具有形近字母,将该字母用其各形近字母替换后分别视为一个分词。实际应用中,通过关联行进字母字典,查询商标中每个字母是否具有行进字母,以图2l为示例,按照本商标分词规则分别切分为:“DC”、“DG”、“DO”、“OC”、“OO”、“OG”分词。
b11表示商标中每相邻字母组合分别切分为一个分词。即当商标字母字数在四个及以上时,将商标整段字母、数字、符号的每n个相邻的字母或数字或符号按原序和定序再加首字母算视为一个分词。其中n的取值范围在大于2小于总字母数的50%的范围,当最后1个余数少于预设的n值字母数的1半时,与前一分词合并为一分词,等于或大于1半时,独立为1个分词。以图2k为示例,n的取值为2时,按照本商标分词规则分别切分为:“CA”、“CAT”、“CTA”、“CAN”、“CNA”分词。
b12表示商标字母按照不同定序排列后分别切分为一个分词。所述定序排列包括:商标整体字母组合按原序整体排列,去除重复字母后按26个字母的固定顺序排列、除重复字母后按26个字母的固定顺序排列并在前添加首字母。以图 2k为示例,按原序整体排列后切分为:“catana”分词;去除重复字母后按26个字母的固定顺序排列后切分为:“acnt”分词;去除重复字母后按26个字母的固定顺序排列再在前添加首字母后切分为:“cacnt”分词。b13表示商标中首尾字母组合切分为一个分词。即当商标含有字母、数字、符号及组合词汇时,将商标中首尾字母组合视为一个分词。以图2k为示例,按照本商标分词规则分别切分为:“ca”分词。
b14表示商标中每个英文字母或数字或符号切分为一个分词。即当商标含有字母、数字、符号及组合词汇时,将商标中每一个字母或数字或符号视为一个分词。以图2k为示例,按照本商标分词规则分别切分为:“c”、“a”、“t”、“n”分词。
C、构成要素为图形的形状特征最小单元多种组合规则,包括分卡标准c1、 c2、c3、c4中的至少一种,其中,
c1表示商标图形要素编码集合整体切分为一个分词,
c2表示每一商标图形要素编码切分为一个分词,
c3表示每种图像特征识别方法所产生的商标图像特征字符串集整体分别切分为一个分词,
c4表示每种图像特征识别方法所产生的商标图像特征字符串集预设定长分别切分为一个分词,所述商标图像特征字符串集预设定长是指预先设置的商标图像轮廓线上连续相连的像素点的长度,连续相连的像素点以特征字符串集、或数字集表示,取值范围为商标图像特征字符串集、或数字集总长度的0.1%-50%。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
c1表示商标图形要素编码集合整体切分为一个分词。即:目前在商标行业内一般采用维也纳分类标准的商标图形要素编码表示商标图形的特征。将商标所有图形要素编码整体视为一个分词。以图2m为示例,经检索查询获得的商标图形要素编码是:26.1.12a、26.2.5、29.1.12,按照本商标分词规则切分为:“26.1.12a, 26.2.5,29.1.12”分词。
c2表示每一商标图形要素编码切分为一个分词。即:将商标每一个图形要素编码视为一个分词。以图2m为示例,经检索查询获得的商标图形要素编码是: 26.1.12a、26.2.5、29.1.12,按照本商标分词规则分别切分为:“26.1.12a”、“26.2.5”、“29.1.12”分词。
c3表示每种图像特征识别方法所产生的商标图像特征字符串集整体分别切分为一个分词。即将商标采用每一种图像特征识别方法所产生的商标图像特征字符串集的整体视为一个分词。以图2n为示例,采用图像特征识别方法一(基于 10×10的坐标系标准提取图像轮廓线上像素点数字集的方法)所提取的商标图像特征字符串集如图3所示,其中,定序(字符自小至大)商标图像特征字符串集的值如下:
6,7,15,16,17,25,26,27,
22,23,24,25,26,27,28,29,31,32,39,41,48,49,51,58, 61,68,69,71,79,80,81,82,89,92,93,94,95,96,97,98,99。
顺序(沿轮廓线顺时针方向逐个相邻点的顺序)商标图像特征字符串集的值如下:
6,7,17,27,26,25,15,16,
22,23,24,25,26,27,28,29,39,49,48,58,68,69,79,80,79, 89,99,98,97,96,95,94,93,92,82,81,71,61,51,41,31,32。
按照本分词规则分别切分为如下2个分词:
“6,7,15,16,17,25,26,27;22,23,24,25,26,27,28,29, 31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89, 92,93,94,95,96,97,98,99”。
“6,7,17,27,26,25,15,16;22,23,24,25,26,27,28,29, 39,49,48,58,68,69,79,80,79,89,99,98,97,96,95,94,93,92,82,81,71,61,51,41,31,32”。
再以图2n为示例,采用图像特征识别方法二(基于20×20的坐标系标准提取图像轮廓线上像素点数字集的方法)所提取的图像特征字符串集如图4所示,其中,定序(自小至大)商标图像特征字符串集的值如下:
12,13,14,31,32,34,50,51,53,54,70,73,90,91,92,93,110, 111;
85,86,87,88,93,94,95,96,103,104,105,108,109,110,111, 112,113,116,117,122,123,137,138,141,142,156,157,161,176, 181,196,201,216,221,236,241,256,257,261,277,278,281,282, 298,302,318,322,323,337,338,343,357,363,364,369,370,375,376,384,385,386,387,388,390,391,392,393,394,395。
顺序(沿轮廓线顺时针方向逐个相邻点的顺序)商标图像特征字符串集的值如下:
12,13,14,34,54,53,73,93,92,91,111,110,90,70,50,51, 31,32;
85,86,87,88,108,109,110,111,112,113,93,94,95,116,117, 137,138,157,156,176,196,216,236,256,257,277,278,298,318, 338,337,357,376,375,395,394,393,392,391,390,370,369,388, 387,386,385,384,364,363,344,343,323,322,302,282,281,261, 241,221,201,181,161,141,142,122,123,103,104,105。
按照本分词规则分别切分为如下2个分词:
“12,13,14,31,32,34,50,51,53,54,70,73,90,91,92,93, 110,111;85,86,87,88,93,94,95,96,103,104,105,108,109,110,111,112,113,116,117,122,123,137,138,141,142,156,157,161, 176,181,196,201,216,221,236,241,256,257,261,277,278,281,282,298,302,318,322,323,337,338,343,357,363,364,369,370, 375,376,384,385,386,387,388,390,391,392,393,394,395”。
“12,13,14,34,54,53,73,93,92,91,111,110,90,70,50,51, 31,32;85,86,87,88,108,109,110,111,112,113,93,94,95,116, 117,137,138,157,156,176,196,216,236,256,257,277,278,298,318,338,337,357,376,375,395,394,393,392,391,390,370,369,388,387,386,385,384,364,363,344,343,323,322,302,282,281,261,241,221,201,181,161,141,142,122,123,103,104,105”。
c4表示每种图像特征识别方法所产生的商标图像特征字符串集预设定长分别切分为一个分词。即将商标采用每一种图像特征识别方法所产生的商标图像特征字符串集(或商标图像特征信息)的每一预设定长视为一个分词。
所述商标图像特征字符串集(或商标图像特征信息)预设定长是按预设规则设置的一定长度范围的连续的局部商标图像特征字符串集,表现为连续的局部数字或字符集,取值范围在图像特征字符串集数字集或字符集总长度的0.1%至 50%。本实施例中,所述图像特征字符串集按如下具体规则切分为n个图像特征字符串集预设定长:
1)按获取图像特征字符串集的不同坐标系标准分别预设的切分长度,预设的切分长度的取值范围在10至100字符之间;
2)当图像特征字符串集的总数小于等于预设的切分长度时,不切分,整体视为一个图像特征字符串集预设定长;
3)图像特征字符串集总数大于预设的切分长度时,以预设的切分长度为标准将图像特征字符串集切分为若干个分组,每一分组视为一个图像特征字符串集预设定长;
4)具体连通域特征的图像特征字符串集的部分视为一个图像特征字符串集预设定长,比如图2n中的字符串集“6,7,15,16,17,25,26,27”和“22, 23,24,25,26,27,28,29,31,32,39,41,48,49,51,58,61,68, 69,71,79,80,81,82,89,92,93,94,95,96,97,98,99”分别为一个具体连通区域特征的图像特征字符串集,并及其分别视为一个图像特征字符串集预设定长。
5)以上切分的最后一组不足预设切分长度的50%的,与上组合并为一个图像特征字符串集预设定长,等于或超过50%的,将剩余的字符分为一组,视为一个图像特征字符串集预设定长。
再以图2n为示例,假如预设定长的值取5组数字,采用图像特征识别方法一(基于10×10的坐标系标准提取图像轮廓线上像素点数字集的方法)提取定序(自小至大)图像轮廓线上像素点数字集的方法所提取的商标图像特征字符串集如图3所示,按照本分词规则分别切分为如下11个分词:
“6,7,15,16,17,25,26,27”、“22,23,24,25,26,27,28,29, 31,32,39,41,48,49,51,58,61,68,69,71,79,80,81,82,89, 92,93,94,95,96,97,98,99”、
“6,7,15,16,17”、“25,26,27”、“22,23,24,25,26”、“27,28, 29,31,32”、“39,41,48,49,51”、“58,61,68,69,71”、“79,80,81, 82,89”、“92,93,94,95,96”、“97,98,99”;
再以图2n为示例,假如预设的切分长度为5组数字,采用图像特征识别方法一(基于10×10的坐标系标准提取图像轮廓线上像素点数字集的方法)提取顺序(沿轮廓线顺时针方向逐个相邻点的顺序)图像轮廓线上像素点数字集的方法所提取的商标图像特征字符串集如图4所示,按照本分词规则分别切分为如下 11个分词:
“6,7,17,27,26,25,15,16”、“22,23,24,25,26,27,28, 29,39,49,48,58,68,69,79,80,79,89,99,98,97,96,95,94,93, 92,82,81,71,61,51,41,31,32”、
“6,7,17,27,26”、“25,15,16”、“22,23,24,25,26”、“27,28, 29,39,49”、“48,58,68,69,79”、“80,79,89,99,98”、“97,96,95, 94,93”、“92,82,81,71,61”、“51,41,31,32”。
(2)读音特征最小单元多种组合规则包括:
D、构成要素为汉语文字的读音特征最小单元多种组合规则,包括分卡标准 d1、d2、d3中的至少一种,其中,
d1表示商标中每个汉语文字的拼音音节切分为一个分词,
d2表示商标中整体汉语文字对应的拼音切分为一个分词,
d3表示商标中每个汉语文字被替换为形近字后的拼音音节切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
d1表示商标中每个汉语文字的拼音音节切分为一个分词。即将商标每个汉字的拼音音节视为一个分词。以图2h为示例,“格”和“力”的拼音音节分别为“ge”和“li”,按照本商标分词规则分别切分为:“ge”、“li”分词。
d2表示商标中整体汉语文字对应的拼音切分为一个分词。即将商标整体汉字的拼音音节视为一个分词。以图2h为示例,“格”和“力”的拼音音节分别为“ge”和“li”,按照本商标分词规则分别切分为:“geli”分词。
d3表示商标中每个汉语文字被替换为形近字后的拼音音节切分为一个分词。以图2h为示例,“格”文字被替换为“挌”形近字,“力”文字被替换为“刀”形近字,“挌刀”的拼音音节分别为“ge”和“dao”,按照本商标分词规则分别切分为:“ge dao”分词。
E、构成要素为字母、数字、符号的读音特征最小单元多种组合规则包括分卡标准e1、e2、e3、e4中的至少一种,其中,
e1表示商标中每个英文单词的读音音节切分为一个分词,
e2表示商标中字母组合被其音近字母组合替换后得到的整体字母组合分别切分为一个分词,
e3表示商标中每个数字的读音音节切分为一个分词,
e4表示商标中每个符号的读音音节切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
e1表示商标中每个英文单词的读音音节切分为一个分词。即将商标每个英文单词的读音音节视为一个分词。以图2i为示例,“one”、“two”、“three”单词的读音音节分别为“[wΛn]”、“[tu]”、“[θri]”,按照本商标分词规则分别切分为:“[wΛn]”、“[tu:]”、“[θri:]”分词。
e2表示商标中的字母组合被其音近字母组合替换后得到的整体字母组合分别切分为一个分词。即商标中含有音近字母组合时,用其音近字母组合替换后得到的整体字母组合视为一个分词。实际应用,通过关联相关字典或数据库,查询商标中字母是否具有音近字母组合,以图2k为示例,其中“CA”与“KA”读音相同或相近,按照本商标分词规则切分为:“CATANA”、“KATANA”分词。
e3表示商标中每个数字的读音音节切分为一个分词。即将商标每个数字的读音音节视为一个分词。以图2i为示例,“one”、“two”、“three”为英文数字单词的读音音节分别为“[wΛn]”、“[tu]”、“[θri]”,按照本商标分词规则分别切分为:“[wΛn]”、“[tu:]”、“[θri:]”分词。
e4表示商标中每个符号的读音音节切分为一个分词。即商标含有符号,将该符号的读音视为一个分词。以图2d为示例,其中“@”为符号,其读音为“at”或“[aet]”,按照本商标分词规则切分为:“at”或“[aet]”分词。
F、构成要素为图形的读音特征最小单元多种组合规则包括分卡标准f1,其中,f1表示商标的图形要素编码所对应的每一事物的名称的拼音切分为一个分词。以图2n为示例,经检索查询获得的商标图形要素编码是:5.7.13,该图形要素编码所对应的每一事物的名称是“苹果”或“柿子”,其拼音分别为:“pingguo”或“shizi”,按照本商标分词规则切分为:“pingguo”或“shizi”分词。
(3)含义特征最小单元多种组合规则包括:
G、构成要素为汉语文字的含义特征最小单元多种组合规则包括分卡标准g1、 g2、g3、g4中的至少一种,其中,
g1表示商标中完整包含商标服务器中现有汉语文字商标、且商标整体无含义,将含有现有汉语文字商标的部分切分为一个分词,
g2表示商标中与汉语词典所收录的词汇或商标服务器中现有汉语文字商标的汉字组合全部匹配的,将匹配部分分别切分为一个分词,
g3表示商标中含有的汉语词汇替换为近义词后分别切分为一个分词,
g4表示商标整体无含义的,整体汉语文字切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
g1表示商标中完整包含商标服务器现有汉语文字商标、且整体无含义(整体文字不能与汉语词典所收录的词汇相匹配),将含有现有汉语文字商标的部分切分为一个分词。即该在先的他人汉字商标已形成其特有的含义,可视其为一个特有的名词,将该名词视为一个分词。以图2d为示例,“四通欧普”整体无含义,假设在先的他人汉字商标有:“欧普”,按照本商标分词规则切分为:“欧普”分词。
g2表示商标中与汉语词典所收录的词汇部分或商标服务器中现有汉字文字商标的汉字组合全部匹配的,将匹配部分分别切分为一个分词。以图2g为示例,按照本商标分词规则分别切分为:“电脑”分词。
g3表示商标中含有的汉语词汇替换为近义词后分别切分为一个分词。即商标含有汉语词汇,将该汉语词汇的近义词视为一个分词。以图2g为示例,“电脑”与“计算机”等为近义词,按照本商标分词规则分别切分为:“计算机”分词。
g4表示商标整体无含义的,整体汉语文字切分为一个分词。即商标整体汉语文字无含义(即无法与汉语词典或商标服务器中的现有汉语文字商标相匹配),将商标整体汉语文字视为一个分词。以图2d为示例,“四通欧普”整体汉语无含义,按照本商标分词规则分别切分为:“四通欧普”分词。
H、构成要素为字母、数字、符号组合的含义特征最小单元多种组合规则包括分卡标准h1、h2、h3、h4、h5、h6、h7、h8、h9中的至少一种,其中,
h1表示商标的整体字母组合由英文词典或其他语种词典所记载的单词组合构成,整体单词组合切分为一个分词,
h2表示商标中含有英语词典或其他语种词典所收录的单词,每个单词切分为一个分词,
h3表示商标中含有英语词典或其他语种词典所收录的单词,将每个单词的近义词切分为一个分词,
h4表示商标的整体字母组合与英文词典或其他语种词典所记载的单词不匹配的,整体字母组合切分为一个分词,
h5表示商标中被分隔的每一组数字切分为一个分词,
h6表示商标的整体数字组合切分为一个分词,
h7表示商标的整体符号组合切分为一个分词,
h8表示商标的每一符号切分为一个分词,
h9表示商标完整包含商标服务器现有字母组合商标、且商标整体无含义,(整体字母组合不能与英语词典所收录的单词相匹配)将含有现有字母组合商标的部分切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
h1表示商标的整体字母组合由英文词典或其他语种词典所记载的单词组合构成,整体单词组合切分为一个分词。以图2a为示例,商标中的整体字母组合为英文单词“gree”,按照本商标分词规则切分为“gree”分词。
h2表示商标中含有英语词典或其他语种词典所收录的单词,每个单词切分为一个分词。以图2i为示例,商标中含有英文单词“one”、“two”、“three”,按照本商标分词规则切分为“one”、“two”、“three”分词。
h3:表示商标中含有英语词典或其他语种词典所收录的单词,将每个单词的近义词切分为一个分词。即商标含有英语近义词,将该英语近义词视为一个分词。以图2j为示例,“ability”与“capacity”、“capability”、“genius”、“talent”、“competence”、“faculty”、“gift”、“aptitude”等均具有表示人的“能力,才能”之意,按照本商标分词规则切分为:“ability”、“capacity”、“capability”、“genius”、“talent”、“competence”、“faculty”、“gift”、“aptitude”等分词。
h4表示商标的整体字母组合与英文词典或其他语种词典所记载的单词不匹配的,整体字母组合切分为一个分词。以图2k为示例,按照本商标分词规则切分为“catana”。
I、构成要素为图形的含义特征最小单元多种组合规则包括分卡标准i1、i2中的至少一种,其中,
i1表示商标图形要素编码所对应的每一事物的名称切分为一个分词,
i2表示商标图像特征字符串集对应有商标图形要素编码,商标图形要素编码所对应每个事物名称切分为一个分词。
如下结合图2中各种商标图样说明本商标分词规则的处理方法:
i1表示商标图形要素编码所对应每个事物名称分别切分为一个分词。本实施例中,首先,通过建立事物名称词典文件,记录商标图形要素编码与该商标图形要素编码所描述事物名称的对应关系,以输入商标的图形要素编码为检索条件找出在事物名称词典文件中匹配的事物名称,该事物名称视为商标商标图形要素编码所对应的事物名称,将每个事物名称视为一个分词。以图2n为示例,经检索查询获得的商标图形要素编码是:5.7.13,该商标图形要素编码所对应的事物是“苹果”或“柿子”,按照本分词规则分别切分为:“苹果”、“柿子”分词。
i2表示商标图像特征字符串集所对应有商标图形要素编码,商标图形要素编码所对应每个事物名称切分为一个分词。本实施例通过如下方法获取:
第一,以输入商标的商标图像特征字符串集作为检索关键词获取检索匹配率最高的一个结果商标之后,将该结果商标运用现有技术已标记的商标图形要素编码视为输入商标的图形要素编码;第二,通过建立事物词典文件,记录商标图形要素编码与该商标图形要素编码所描述事物名称的对应关系;第三,以输入商标的图形要素编码为检索条件找出其在事物词典文件中匹配的事物名称,该事物名称视为商标图像特征字符串集所对应的事物名称,该事物名称视为一个分词。以图2n为示例,经商标图像特征字符串集(或商标图像特征信息)检索查询获得的商标图形要素编码是:“5.7.13”,对应的“事物名称”是“苹果”和“柿子”,该商标图像特征字符串集按照本分词规则分别切分为:“苹果”、“柿子”分词。
Y、构成要素为例外调整文字的最小单元多种组合规则包括分卡标准y1、y2中的至少一种,其中,
y1表示商标中含有例外调整文字,将例外调整文字整体切分为一个分词;
y2表示商标中含有例外调整文字,将例外调整文字每个文字分别切分为一个分词。
所述例外调整文字包括如下预设的一种以上:县级以上行政区域地名,公众知晓的外国地名,通用商品名称,表示商品的质量、主要原料、功能、用途、重量、数量及其他特点的词语,商品服务通用名称,显著性弱的文字。
以图2o为示例,商标文字“格力电器”中“电器”是通用商品名称,按照 y1分卡标准切分为:“电器”分词,按照y2分卡标准切分为:“电”、“器”分词。
根据前述预设的最小单元多种组合规则,可以获取每一规则所生成的各种文字、图形、字母、数字等构成要素形、音、义的切分信息,作为一个商标分卡信息。比如,分卡标准a1所得分词为商标中所有形状最小单元按顺序组合而成。实际应用中,上述形近字、近义词、音近字、音近字母组合、文字读音、字母读音、数字符合读音、图形要素编码所对应的事物名称等,均是通过关联现有的或预设的相关字词典或数据库获得。
本发明所述的商标分卡处理方法,可以有效克服传统的商标分卡的缺陷和弊端,即:无法全面反映商标的形状特征、含义特征和读音特征,难以支持样本商标与输入商标在形、义、音多特征方面进行商标近似度的综合评价,易在商标检索中产生近似商标的漏检。采用本发明所述的商标分卡处理方法,能获取全面反映商标的形状特征、读音特征和含义特征的商标分卡信息,有利实现对检索出的样本商标与输入商标在多特征方面进行商标近似度的综合评价,大幅提高商标近似度的数量化评价水平,加速商标审查工作的进步。
在本发明的实施例中,还涉及一种商标分卡处理的装置,图5是本发明实施例中提供的商标分卡处理装置的结构示意图,包括:
构成要素的内容获取模块,用于对待分卡商标是否由汉语文字、汉语数字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;
形状特征最小单元提取模块,用于提取待分卡商标各构成要素的形状特征最小单元;
读音特征最小单元提取模块,用于提取待分卡商标各构成要素的读音特征最小单元;
含义特征最小单元提取模块,用于提取待分卡商标各构成要素的含义特征最小单元;
商标分卡信息获取模块,用于根据预设的最小单元多种组合规则,获取每一规则所生成的各种文字、图形的分词作为一个商标分卡的信息。
在本发明的实施例中,还涉及一种商标分卡处理的系统,包括商标存储器和服务器,所述商标存储器和服务器经配置执行以下操作:对待分卡商标是否由汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;提取并储存待分卡商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;根据预设的最小单元多种组合规则,获取每一规则所生成的分词作为一个商标分卡的信息。
在本发明的实施例中,还涉及一种商标存储器,包括:
基础字词典存储单元,用于存储汉语文字、汉语词语、英语单词、图形要素编码及其对应的事物名称、形近字、近义词;
商标构成要素内容存储单元,用于存储获取待分卡商标的汉语文字、图形、字母、数字或符号构成要素;
形状特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的形状特征最小单元和根据预设的形状特征最小单元多种组合规则获取的商标分卡信息;
读音特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的读音特征最小单元和根据预设的读音最小单元多种组合规则获取的商标分卡信息;
含义特征分词集合存储单元,用于存储所提取待分卡商标各构成要素的含义特征最小单元和根据预设的含义最小单元多种组合规则获取的商标分卡信息;
商标分卡处理的程序存储单元,用于存储商标分卡处理的相关程序。
以上,结合具体的实施例对本发明的技术方案进行了详细介绍,所描述的具体实施例用于帮助理解本发明的思想,但并不能因此而理解为对本发明保护范围的限制。应当指出,本领域技术人员在本发明实施例的基础上做出的变形、推导、变换,也都应属于本发明保护范围之内。

Claims (5)

1.一种商标分卡处理方法,其特征在于,包括以下步骤:
步骤S110:对输入商标是否由汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;
步骤S120:提取输入商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;
步骤S130:根据预设的最小单元多种组合规则,获取每一组合规则所生成的分词作为商标分卡和商标近似度评价基础信息,
其中,步骤S120中,所述输入商标各构成要素的形状特征最小单元包括:
构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划;
构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像特征字符串集;
构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母;
构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字;
构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字;
构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字;
构成要素为符号的形状特征最小单元:为每一单个的符号,
所述输入商标各构成要素的含义特征最小单元包括:
构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元;
构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称;
构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元;
构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔的每一组汉语数字所对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字所对应的预设基准语种数字,商标中每一单个的其它语种数字所对应的预设基准语种数字,所述预设基准语种数字为任何语种数字;
构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称,
所述输入商标各构成要素的读音特征最小单元包括:
构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音;
构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音;
构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音;
构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音。
2.根据权利要求1所述的商标分卡处理方法,其特征在于,步骤S110所述的构成要素的内容中:汉语文字构成要素的内容为商标中含有的汉语文字及其组合,图形构成要素的内容为商标图样图片及图像特征信息,字母构成要素的内容为商标中含有的字母及其组合,数字或符号构成要素的内容为商标中含有的汉语数字、阿拉伯数字、其他语种数字或符号及其组合。
3.根据权利要求1所述的商标分卡处理方法,其特征在于,步骤S130所述预设的最小单元多种组合规则,包括形状特征最小单元多种组合规则,含义特征小单元多种组合规则,读音特征最小单元多种组合规则,其中,
所述形状特征最小单元多种组合规则包括:
A、构成要素为汉语文字的形状特征最小单元多种组合规则,包括分卡标准a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一种,其中,
a1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
a3表示按顺序排列的商标中的汉语文字切分为一个分词,
a4表示按逆序排列的商标中的汉语文字切分为一个分词,
a5表示按顺序排列的商标中含有的汉语数字切分为一个分词,
a6表示按逆序排列的商标中含有的汉语数字切分为一个分词,
a7表示商标中每个相对独立的部分分别切分为一个分词,
a8表示商标文字中完整包含现有汉语文字商标,将该部分切分为一个分词,
a9表示商标中含有的繁体、异体字转换为简体字后切分为一个分词,
a10表示商标中每个文字替换为形近字后切分为一个分词,
a11表示商标中每相邻汉语文字分别切分为一个分词,
a12表示商标中首尾汉字组合切分为一个分词,
a13表示商标中每个汉语文字切分为一个分词;
B、构成要素为字母、数字、符号的形状特征最小单元多种组合规则,包括分卡标准b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一种,其中,
b1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分词,
b3表示按顺序排列的商标中的字母组合切分为一个分词,
b4表示按逆序排列的商标中的字母组合切分为一个分词,
b5表示按顺序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b6表示按逆序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分词,
b7表示按顺序排列的商标中含有的符号组合切分为一个分词,
b8表示按逆序排列的商标中含有的符号组合切分为一个分词,
b9表示商标中每个相对独立部分分别切分为一个分词,
b10表示商标中每个字母被形近字母替换后切分为一个分词,
b11表示商标中每相邻字母组合分别切分为一个分词,
b12表示商标中字母按照不同定序排列后分别切分为一个分词,
b13表示商标中首尾字母组合切分为一个分词,
b14表示商标中每个字母或数字或符号分别切分为一个分词;
C、构成要素为图形的形状特征最小单元多种组合规则,包括分卡标准c1、c2、c3、c4中的至少一种,其中,
c1表示商标图形要素编码集合整体切分为一个分词,
c2表示每一商标图形要素编码切分为一个分词,
c3表示每种图像特征识别方法所产生的商标图像特征字符串集整体分别切分为一个分词,
c4表示每种图像特征识别方法所产生的商标图像特征字符串集预设定长分别切分为一个分词,所述商标图像特征字符串集预设定长是指预先设置的商标图像轮廓线上连续相连的像素点的长度,连续相连的像素点以特征字符串集、或数字集表示,取值范围为商标图像特征字符串集、或数字集总长度的0.1%-50%;
所述读音特征最小单元多种组合规则包括:
D、构成要素为汉语文字的读音特征最小单元多种组合规则,包括分卡标准d1、d2、d3中的至少一种,其中,
d1表示商标中每个汉语文字的拼音音节切分为一个分词,
d2表示商标中整体汉语文字对应的拼音切分为一个分词,
d3表示商标中每个汉语文字被替换为形近字后的拼音音节切分为一个分词;
E、构成要素为字母、数字、符号的读音特征最小单元多种组合规则包括分卡标准e1、e2、e3、e4中的至少一种,其中,
e1表示商标中每个英文单词的读音音节切分为一个分词,
e2表示商标中字母组合被音近字母组合替换后得到的整体字母组合分别切分为一个分词,
e3表示商标中每个数字的读音音节切分为一个分词,
e4表示商标中每个符号的读音音节切分为一个分词;
F、构成要素为图形的读音特征最小单元多种组合规则包括分卡标准f1,其中,f1表示商标的图形要素编码所对应的每一事物的名称的拼音切分为一个分词;
所述含义特征最小单元多种组合规则包括:
G、构成要素为汉语文字的含义特征最小单元多种组合规则包括分卡标准g1、g2、g3、g4中的至少一种,其中,
g1表示商标中完整包含商标服务器中现有汉语文字商标、且商标整体无含义,将含有现有汉语文字商标的部分切分为一个分词,
g2表示商标中与汉语词典所收录的词汇或商标服务器中现有汉语文字商标的汉字组合全部匹配的,将匹配部分分别切分为一个分词,
g3表示商标中含有的汉语词汇替换为近义词后分别切分为一个分词,
g4表示商标整体无含义的,整体汉语文字切分为一个分词;
H、构成要素为字母、数字、符号组合的含义特征最小单元多种组合规则包括分卡标准h1、h2、h3、h4、h5、h6、h7、h8、h9中的至少一种,其中,
h1表示商标的整体字母组合由英文词典或其他语种词典所记载的单词组合构成,整体单词组合切分为一个分词,
h2表示商标中含有英语词典或其他语种词典所收录的单词,每个单词切分为一个分词,
h3表示商标中含有英语词典或其他语种词典所收录的单词,将每个单词的近义词切分为一个分词,
h4表示商标的整体字母组合与英文词典或其他语种词典所记载的单词不匹配的,整体字母组合切分为一个分词,
h5表示商标中被分隔的每一组数字切分为一个分词,
h6表示商标的整体数字组合切分为一个分词,
h7表示商标的整体符号组合切分为一个分词,
h8表示商标的每一符号切分为一个分词,
h9表示商标完整包含商标服务器现有字母组合商标、且商标整体无含义,将含有现有字母组合商标的部分切分为一个分词;
I、构成要素为图形的含义特征最小单元多种组合规则包括分卡标准i1、i2中的至少一种,其中,
i1表示商标图形要素编码所对应的每一事物的名称切分为一个分词,
i2表示商标图像特征字符串集对应有商标图形要素编码,商标图形要素编码所对应每个事物名称切分为一个分词;
Y、构成要素为例外调整文字的最小单元多种组合规则包括分卡标准y1、y2中的至少一种,其中,
y1表示商标中含有例外调整文字,将例外调整文字整体切分为一个分词;
y2表示商标中含有例外调整文字,将例外调整文字每个文字分别切分为一个分词。
4.一种商标分卡处理的系统,包括商标存储器和服务器,其特征在于,所述商标存储器和服务器经配置执行以下操作:对输入商标是否由汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;提取并储存输入商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元,其中,所述形状特征最小单元包括:构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划;构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像特征字符串集;构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母;构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字;构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字;构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字;构成要素为符号的形状特征最小单元:为每一单个的符号,所述读音特征最小单元包括:构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音;构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音;构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音;构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音,所述含义特征最小单元包括:构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元;构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称;构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元;构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔的每一组汉语数字所对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字所对应的预设基准语种数字,商标中每一单个的其它语种数字所对应的预设基准语种数字,所述预设基准语种数字为任何语种数字;构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称;根据预设的最小单元多种组合规则,获取每一规则所生成的分词作为一个商标分卡和商标近似度评价的基础信息。
5.一种商标存储器,其特征在于,用于存储执行上述权利要求1至3任意一项中的商标分卡方法所产生的商标分卡信息,包括:
基础字词典存储单元,用于存储汉语文字、汉语词语、英语单词、图形要素编码及其对应的事物名称、形近字、音近字、近义词;
商标构成要素内容存储单元,用于存储获取输入商标的汉语文字、图形、字母、数字或符号构成要素;
形状特征分词集合存储单元,用于存储所提取输入商标各构成要素的形状特征最小单元和根据预设的形状特征最小单元多种组合规则获取的商标分卡信息,其中,所述形状特征最小单元包括:
构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划;
构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像特征字符串集;
构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母;
构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字;
构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字;
构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字;
构成要素为符号的形状特征最小单元:为每一单个的符号;
读音特征分词集合存储单元,用于存储所提取输入商标各构成要素的读音特征最小单元和根据预设的读音最小单元多种组合规则获取的商标分卡信息,其中,所述读音特征最小单元包括:
构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音;
构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音;
构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音;
构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音;
含义特征分词集合存储单元,用于存储所提取输入商标各构成要素的含义特征最小单元和根据预设的含义最小单元多种组合规则获取的商标分卡信息,其中,所述含义特征最小单元包括:
构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元;
构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称;
构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元;
构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔的每一组汉语数字所对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字所对应的预设基准语种数字,商标中每一单个的其它语种数字所对应的预设基准语种数字,所述预设基准语种数字为任何语种数字;
构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称;
商标分卡处理的程序存储单元,用于存储商标分卡处理的相关程序。
CN201710553047.4A 2016-12-30 2017-07-07 一种商标分卡处理的方法、装置、系统及商标存储器 Active CN107301244B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2016112573126 2016-12-30
CN201611257312.6A CN106649851A (zh) 2016-12-30 2016-12-30 近似商标查询结果排序方法、装置及其商标服务器

Publications (2)

Publication Number Publication Date
CN107301244A CN107301244A (zh) 2017-10-27
CN107301244B true CN107301244B (zh) 2018-06-15

Family

ID=58837704

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201611257312.6A Pending CN106649851A (zh) 2016-12-30 2016-12-30 近似商标查询结果排序方法、装置及其商标服务器
CN201710553047.4A Active CN107301244B (zh) 2016-12-30 2017-07-07 一种商标分卡处理的方法、装置、系统及商标存储器
CN201710553009.9A Active CN107330109B (zh) 2016-12-30 2017-07-07 一种商标查询结果近似度评价和排序方法、装置
CN201710553007.XA Active CN107330438B (zh) 2016-12-30 2017-07-07 一种图像轮廓线描述符的获取方法、装置
CN201711444394.XA Pending CN108052653A (zh) 2016-12-30 2017-12-27 图像特征描述符的获取方法、装置、存储介质、终端及图像检索方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201611257312.6A Pending CN106649851A (zh) 2016-12-30 2016-12-30 近似商标查询结果排序方法、装置及其商标服务器

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN201710553009.9A Active CN107330109B (zh) 2016-12-30 2017-07-07 一种商标查询结果近似度评价和排序方法、装置
CN201710553007.XA Active CN107330438B (zh) 2016-12-30 2017-07-07 一种图像轮廓线描述符的获取方法、装置
CN201711444394.XA Pending CN108052653A (zh) 2016-12-30 2017-12-27 图像特征描述符的获取方法、装置、存储介质、终端及图像检索方法

Country Status (3)

Country Link
US (1) US20200387543A1 (zh)
CN (5) CN106649851A (zh)
WO (1) WO2018120899A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649851A (zh) * 2016-12-30 2017-05-10 徐庆 近似商标查询结果排序方法、装置及其商标服务器
CN107273535A (zh) * 2017-06-29 2017-10-20 朱峰 一种商标智能分析系统
WO2019028618A1 (zh) * 2017-08-07 2019-02-14 深圳益强信息科技有限公司 基于大数据的商标价值评估的方法及系统
CN107609057B (zh) * 2017-08-25 2020-12-22 百度在线网络技术(北京)有限公司 一种获取商标图像的文字数据的方法与装置
CN108664945B (zh) * 2018-05-18 2021-08-10 徐庆 图像文本及形音义特征识别方法和装置
CN108763380B (zh) * 2018-05-18 2022-03-08 徐庆 商标识别检索方法、装置、计算机设备和存储介质
CN110580666A (zh) * 2018-06-08 2019-12-17 成都市卓睿科技有限公司 商标监控与预警方法及系统
CN110647639B (zh) * 2018-06-08 2020-11-10 成都市卓睿科技有限公司 一种商标近似检索结果排序方法
CN108897722A (zh) * 2018-06-26 2018-11-27 重庆智荟数创科技有限公司 基于笔顺算法的商标近似评估、监控系统及方法
CN108984649A (zh) * 2018-06-27 2018-12-11 广州朝舜网络科技有限公司 一种近似商标智能判断方法、装置、终端及存储介质
CN109033370A (zh) * 2018-07-27 2018-12-18 阿里巴巴集团控股有限公司 一种查找相似店铺的方法及装置、店铺接入的方法及装置
CN109063197B (zh) * 2018-09-06 2021-07-02 徐庆 图像检索方法、装置、计算机设备和存储介质
CN110895555B (zh) * 2018-09-13 2022-06-14 北京蓝灯鱼智能科技有限公司 数据检索方法和装置、存储介质及电子装置
CN109345454B (zh) * 2018-09-18 2023-01-06 徐庆 位图图像矢量化的方法、存储介质及系统
CN109656954A (zh) * 2018-11-28 2019-04-19 苏州中知联信息科技有限公司 商标查询方法、装置及计算机设备
CN109800340B (zh) * 2019-01-24 2021-03-19 北京梦知网科技有限公司 商标注册推荐方法及系统
CN110059159A (zh) * 2019-04-15 2019-07-26 重庆天蓬网络有限公司 一种近似商标实时监控系统
CN110069555A (zh) * 2019-05-06 2019-07-30 重庆天蓬网络有限公司 一种商标注册成功率的确定方法
CN110069554A (zh) * 2019-05-06 2019-07-30 重庆天蓬网络有限公司 一种基于商标注册信息的处理方法
CN110288264A (zh) * 2019-07-03 2019-09-27 深圳智高点知识产权运营有限公司 一种企业商标监控分析系统和方法
CN110717874B (zh) * 2019-10-10 2022-11-04 徐庆 一种图像轮廓线平滑处理方法
CN110929084B (zh) * 2019-12-17 2023-04-11 徐庆 一种图像形状特征描述符的获取方法及装置
CN111125160A (zh) * 2019-12-26 2020-05-08 广东知得失网络科技有限公司 一种基于商标近似分析的数据预处理方法、系统及终端
CN111782851A (zh) * 2020-05-19 2020-10-16 知昇(上海)人工智能科技有限公司 一种基于多相似度特征计算的中文商标名称相似判别方法
CN111882462B (zh) * 2020-08-03 2023-05-09 安徽大学 一种面向多要素审查标准的中文商标近似检测方法
CN113377906B (zh) * 2021-06-08 2022-11-01 四川大学 一种相似法条智能搜索系统及方法
CN113553980A (zh) * 2021-07-30 2021-10-26 徐庆 一种图片的商标图形要素编码生成方法、系统及装置
CN113554639A (zh) * 2021-07-30 2021-10-26 徐庆 一种图像特征提取及描述符获取方法、装置及存储介质
CN114581196A (zh) * 2022-03-10 2022-06-03 广州华多网络科技有限公司 商品排序处理方法及其装置、设备、介质、产品
CN115100665A (zh) * 2022-07-22 2022-09-23 贵州中烟工业有限责任公司 近似商标筛选方法、模型构建方法及计算机可读存储介质
CN115774548B (zh) * 2023-02-10 2023-04-11 北京一平方科技有限公司 基于人工智能的代码自动生成方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548507A (en) * 1994-03-14 1996-08-20 International Business Machines Corporation Language identification process using coded language words
US5790126A (en) * 1995-01-03 1998-08-04 Microsoft Corporation Method for rendering a spline for scan conversion of a glyph
US5864639A (en) * 1995-03-27 1999-01-26 Digital Processing Systems, Inc. Method and apparatus of rendering a video image
CN101013420A (zh) * 2006-12-31 2007-08-08 中国科学院计算技术研究所 一种识别中文文本编码形式的方法
CN101551859B (zh) * 2008-03-31 2012-01-04 夏普株式会社 图像辨别装置及图像检索装置
CN101567048B (zh) * 2008-04-21 2012-06-06 夏普株式会社 图像辨别装置及图像检索装置
CN101359367B (zh) * 2008-09-11 2010-09-29 西安理工大学 一种基于四边形骨架结构的静态手势特征描述方法
US20120144499A1 (en) * 2010-12-02 2012-06-07 Sky Castle Global Limited System to inform about trademarks similar to provided input
CN103020596B (zh) * 2012-12-05 2016-06-22 华北电力大学 一种基于块模型的电力生产中异常人体行为识别方法
CN103258037A (zh) * 2013-05-16 2013-08-21 西安工业大学 一种针对多组合内容的商标识别检索方法
CN104809142B (zh) * 2014-01-29 2018-03-23 北京瑞天科技有限公司 商标查询系统和方法
CN104462380A (zh) * 2014-12-11 2015-03-25 北京中细软移动互联科技有限公司 商标检索方法
CN105426530B (zh) * 2015-12-15 2017-05-10 徐庆 一种商标检索方法、装置和系统
CN105574533B (zh) * 2015-12-15 2018-01-12 徐庆 一种图像特征提取方法和装置
CN105574161B (zh) * 2015-12-15 2017-09-26 徐庆 一种商标图形要素识别方法、装置和系统
CN105740872B (zh) * 2016-01-29 2020-05-19 徐庆 图像特征提取方法及其装置
CN105809138B (zh) * 2016-03-15 2019-01-04 武汉大学 一种基于分块识别的道路警告标志检测与识别方法
CN105913067A (zh) * 2016-04-18 2016-08-31 徐庆 图像轮廓特征的提取方法及其装置
CN106295656B (zh) * 2016-08-03 2017-09-15 徐庆 基于图像色块内容的图像轮廓特征提取方法和装置
CN106649851A (zh) * 2016-12-30 2017-05-10 徐庆 近似商标查询结果排序方法、装置及其商标服务器

Also Published As

Publication number Publication date
CN107330438B (zh) 2018-04-17
CN107301244A (zh) 2017-10-27
CN107330109B (zh) 2018-04-17
CN107330438A (zh) 2017-11-07
CN107330109A (zh) 2017-11-07
CN108052653A (zh) 2018-05-18
CN106649851A (zh) 2017-05-10
WO2018120899A1 (zh) 2018-07-05
US20200387543A1 (en) 2020-12-10

Similar Documents

Publication Publication Date Title
CN107301244B (zh) 一种商标分卡处理的方法、装置、系统及商标存储器
US10489682B1 (en) Optical character recognition employing deep learning with machine generated training data
TW389865B (en) System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing network
CN110598203A (zh) 一种结合词典的军事想定文书实体信息抽取方法及装置
CN109213866A (zh) 一种基于深度学习的税务商品编码分类方法和系统
CN106528536A (zh) 一种基于词典与文法分析的多语种分词方法
US11645447B2 (en) Encoding textual information for text analysis
CN108763380A (zh) 商标识别检索方法、装置、计算机设备和存储介质
Yin et al. Decipherment of historical manuscript images
CN112612890A (zh) 轨道车辆的故障识别方法及装置
CN111563372B (zh) 一种基于教辅书籍出版的排版文档内容自查重方法
US11741318B2 (en) Open information extraction from low resource languages
CN110738050A (zh) 基于分词和命名实体识别的文本重组方法及装置、介质
Inunganbi et al. Recognition of handwritten Meitei Mayek script based on texture feature
CN110110087A (zh) 一种基于二分类器的用于法律文本分类的特征工程方法
JP7040227B2 (ja) 情報処理プログラム、情報処理方法、および情報処理装置
Hung et al. Automatic vietnamese passport recognition on android phones
CN111950274A (zh) 一种专业领域语料的中文分词方法及装置
Chakraborty et al. An open source tesseract based tool for extracting text from images with application in braille translation for the visually impaired
Halder et al. Individuality of isolated Bangla characters
Khorsheed Recognizing Cursive Typewritten Text Using Segmentation‐Free System
KR102569381B1 (ko) 테이블 중심의 웹 문서를 위한 기계독해 시스템 및 방법
Srihari et al. Questioned document examination using
Bataineh A Printed PAW Image Database of Arabic Language for Document Analysis and Recognition.
CN114330313A (zh) 识别文档章节标题的方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CB02 Change of applicant information

Address after: 528000 room 2002, block A, 33 Jihua five road, Chancheng District, Foshan, Guangdong.

Applicant after: Xu Qing

Applicant after: Foshan country trademark services Co., Ltd.

Applicant after: Foshan national trademark Identification Technology Co., Ltd.

Address before: 528000 room 2002, block A, 33 Jihua five road, Chancheng District, Foshan, Guangdong.

Applicant before: Xu Qing

Applicant before: Foshan country trademark services Co., Ltd.

Applicant before: Foshan City, China side trademark Software Co., Ltd.

CB02 Change of applicant information
CP01 Change in the name or title of a patent holder

Address after: 528000 room 2002, block A, 33 Jihua five road, Chancheng District, Foshan, Guangdong.

Patentee after: Xu Qing

Patentee after: Foshan Guofang Identification Technology Co.,Ltd.

Patentee after: Foshan Guofang Software Technology Co.,Ltd.

Address before: 528000 room 2002, block A, 33 Jihua five road, Chancheng District, Foshan, Guangdong.

Patentee before: Xu Qing

Patentee before: FOSHAN GUOFANG TRADEMARK SERVICE Co.,Ltd.

Patentee before: FOSHAN GUOFANG TRADEMARK IDENTIFICATION TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder