CN111860516A - 商家名称确定方法、装置、服务器及存储介质 - Google Patents
商家名称确定方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN111860516A CN111860516A CN202010583305.5A CN202010583305A CN111860516A CN 111860516 A CN111860516 A CN 111860516A CN 202010583305 A CN202010583305 A CN 202010583305A CN 111860516 A CN111860516 A CN 111860516A
- Authority
- CN
- China
- Prior art keywords
- name
- merchant name
- candidate
- merchant
- candidate merchant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004364 calculation method Methods 0.000 claims description 52
- 238000002372 labelling Methods 0.000 claims description 8
- 241000272525 Anas platyrhynchos Species 0.000 description 179
- 239000008280 blood Substances 0.000 description 57
- 210000004369 blood Anatomy 0.000 description 57
- 235000014347 soups Nutrition 0.000 description 57
- 230000003796 beauty Effects 0.000 description 46
- 230000001939 inductive effect Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 20
- 244000018633 Prunus armeniaca Species 0.000 description 14
- 235000009827 Prunus armeniaca Nutrition 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 12
- 239000000843 powder Substances 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 6
- 235000013361 beverage Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002411 adverse Effects 0.000 description 4
- 238000010420 art technique Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 235000009430 Thespesia populnea Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Abstract
本申请实施例提供了商家名称确定方法、装置、服务器及存储介质,该方法包括:基于对商家的门脸图像中的文字进行文字识别得到的识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,多维特征信息包括:候选商家名称对应的文字识别准确率、候选商家名称与识别结果的相似度、候选商家名称对应的招牌名称概率信息中的至少一个;基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度,基于每一个候选商家名称的置信度,确定商家的名称。同时考虑了候选商家名称中的匹配文字的识别准确率、候选商家名称与识别结果的相似度、候选商家名称中的匹配文字属于商家的招牌名称的概率,提升确定出的商家的名称的准确性。
Description
技术领域
本申请涉及互联网领域,具体涉及商家名称确定方法、装置、服务器及存储介质。
背景技术
通过商家的门脸图像搜索商家,向用户推送商家的相关信息的技术可以简化用户搜索商家的操作,为用户提供更加便捷的消费体验。
目前,在这一技术中最新采用的确定商家的名称的方式为:用户的终端拍摄商家的门脸图像,发送至服务器,服务器对商家的门脸图像中的文字进行文字识别,得到识别结果,同时,选取在商家的周围一定数量的商家的名称作为候选商家名称。对于每一个候选商家名称,根据该候选商家名称与识别结果之间的匹配文字,计算出该候选商家名称与识别结果中的包括匹配文字的部分之间的编辑距离,根据编辑距离,计算出该候选商家名称与识别结果的相似度。按照与识别结果的相似度由大至小的顺序,对所有候选商家名称进行排序,将与识别结果的相似度最大的候选商家名称确定为商家的名称。
然而,上述方式仅考虑候选商家名称与识别结果的相似度,而没有考虑匹配文字与商家的招牌名称的关联度、匹配文字的识别准确率等,导致确定出的商家的名称的准确性低,进一步会导致向用户推送的确定出的商家的名称所属的商家的相关信息的准确性低。
发明内容
为克服相关技术中存在的问题,本申请提供一种商家名称确定方法、装置、服务器及存储介质。
根据本申请实施例的第一方面,提供一种商家名称确定方法,包括:
对商家的门脸图像中的文字进行文字识别,得到识别结果;
基于所述识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,候选商家名称的多维特征信息包括:所述候选商家名称对应的文字识别准确率、所述候选商家名称对应的相似程度信息、以及所述候选商家名称对应的招牌名称概率信息中的至少一个;
基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度;以及
基于每一个候选商家名称的置信度,确定所述商家的名称。
根据本申请实施例的第二方面,提供一种商家名称确定装置,包括:
识别单元,被配置为对商家的门脸图像中的文字进行文字识别,得到识别结果;
获取单元,被配置为基于所述识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,候选商家名称的多维特征信息包括:所述候选商家名称对应的文字识别准确率、所述候选商家名称对应的相似程度信息、以及所述候选商家名称对应的招牌名称概率信息中的至少一个;
计算单元,被配置为基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度;
确定单元,被配置为基于每一个候选商家名称的置信度,确定所述商家的名称。
本申请提供的商家名称确定方法、装置,实现了在确定商家的名称时,同时考虑了候选商家名称中的匹配文字的识别准确率、候选商家名称与识别结果的相似度、候选商家名称中的匹配文字属于商家的招牌名称的概率,基于候选商家名称对应的文字识别准确率、候选商家名称对应的相似程度信息、候选商家名称对应的招牌名称概率信息中的至少一个,分别计算每一个候选商家的置信度,根据计算出的每一个候选商家的置信度,确定商家的名称,提升确定出的商家的名称的准确性。确定出的商家的名称对应的文字识别准确率还可以用于确定是否向用户推送确定出的商家的名称所属的商家的相关信息,避免在识别结果不准确的情况下仅计算候选商家名称与识别结果的相似度,导致确定出的商家的名称错误,向用户推送的商家的相关信息错误的情况。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1示出了本申请提供的商家名称确定方法的一个实施例的流程图;
图2示出了采用现有技术确定商家的名称的一个流程示意图;
图3示出了采用本申请提供的商家名称确定方法确定商家名称的一个流程示意图;
图4示出了采用现有技术确定商家的名称的一个流程示意图;
图5示出了本申请提供的商家名称确定方法的一个实施例的流程图;
图6示出了本申请提供的商家名称确定方法的一个实施例的流程图;
图7示出了利用商家名称置信度计算模型确定商家名称的一个流程示意图;
图8示出了本申请提供的商家名称确定装置的一个实施例的结构示意图;
图9示出了本申请提供的服务器的一个实施例的结构框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1是本申请提供的商家名称确定方法的一个实施例的流程图。该方法中的各个步骤可以由服务器执行,该方法包括以下步骤:
步骤101,对商家的门脸图像中的文字进行文字识别,得到识别结果。
在本实施例中,商家的门脸图像为用户利用用户的终端拍摄商家的门脸得到。
用户达到需要查询的商家的门口或门口附近的区域之后,用户利用用户的终端拍摄用户到达的商家的门脸图像。商家的门脸图像可以包括商家的招牌。商家的招牌可以包括商家的招牌名称、介绍商家提供的商品的文字例如商家提供的菜品的文字。
用户的终端将该商家的门脸图像发送至服务器,由服务器对该商家的门脸图像中的文字进行文字识别。
在本实施例中,可以采用文字识别算法例如OCR(Optical CharacterRecognition,光学字符识别)或文字识别模型例如用于文字识别的卷积神经网络对商家的门脸图像中的文字进行文字识别,得到识别结果。识别结果包括至少一个子结果,每一个子结果包括至少一个文字。
例如,采用OCR对一个商家的门脸图像中的文字进行文字识别之后,得到的识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。
在本实施例中,识别结果中的文字可以包括但不限于:中文文字、英文字母。
步骤102,基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息。
在本实施例中,可以预先在服务器上存储大量的商家名称。
在本实施例中,多个候选商家名称可以为预先存储的位于商家的门脸图像的拍摄位置所在的预设范围内的多个商家的名称。换言之,多个候选商家名称为预先存储的在商家的门脸图像的拍摄位置附近的多个商家的名称。
利用终端拍摄的图像携带图像的拍摄位置信息,商家的门脸图像的拍摄位置可以根据商家的门脸图像的拍摄位置信息确定。也可以在用户利用终端拍摄商家的门脸图像时,将通过GPS确定的用户的位置发送至服务器,将用户的位置作为商家的门脸图像的拍摄位置。
在本实施例中,当基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息时,可以首先对于多个候选商家名称中的每一个候选商家名称,确定该候选商家名称与识别结果共同包括的文字,该候选商家名称与识别结果共同包括的文字为该候选商家名称中的匹配文字。
例如,采用OCR对一个商家的门脸图像中的文字进行文字识别之后,得到的识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。
该商家的门脸图像的拍摄位置附近存在名称为“鸭血粉丝汤”的商家、名称为“美诱鸭脖”的商家等多个商家,多个候选商家名称包括“鸭血粉丝汤”、“美诱鸭脖”等候选商家名称。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”中的所有匹配文字包括:“美”、“诱”、“鸭”“脖”。
对于候选商家名称“鸭血粉丝汤”,候选商家名称“鸭血粉丝汤”中的所有匹配文字包括:“鸭”、“血”、“粉”“丝”、“汤”。
在本实施例中,对于每一个候选商家名称,该候选商家名称的多维特征信息包括:该候选商家名称对应的文字识别准确率、该候选商家名称对应的相似程度信息、以及该候选商家名称对应的招牌名称概率信息中的至少一个。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的文字识别准确率指示候选商家名称中的匹配文字的识别准确率。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的相似程度信息指示该候选商家名称与识别结果的相似度。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的招牌名称概率信息指示该候选商家名称中的匹配文字属于商家的招牌名称的概率。
例如,采用OCR对一个商家的门脸图像中的文字进行文字识别之后,得到的识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。
商家的门脸图像的拍摄位置附近存在名称为“鸭血粉丝汤”的商家、名称为“美诱鸭脖”的商家等商家,多个候选商家名称包括“鸭血粉丝汤”、“美诱鸭脖”等候选商家名称。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”中的所有匹配文字包括:“美”、“诱”、“鸭”“脖”。
候选商家名称“美诱鸭脖”的多维特征信息包括:候选商家名称“美诱鸭脖”对应的文字识别准确率、候选商家名称“美诱鸭脖”对应的相似程度信息、以及候选商家名称“美诱鸭脖”对应的招牌名称概率信息中的至少一个。
候选商家名称“美诱鸭脖”对应的文字识别准确率指示候选商家名称“美诱鸭脖”中的匹配文字的识别准确率。候选商家名称“美诱鸭脖”对应的相似程度信息指示候选商家名称“美诱鸭脖”与识别结果的相似度。候选商家名称“美诱鸭脖”对应的招牌名称概率信息指示候选商家名称“美诱鸭脖”中的匹配文字属于商家的招牌名称的概率。
对于候选商家名称“鸭血粉丝汤”,候选商家名称“鸭血粉丝汤”中的所有匹配文字包括:“鸭”、“血”、“粉”“丝”、“汤”。
候选商家名称“鸭血粉丝汤”的多维特征信息包括:候选商家名称“鸭血粉丝汤”对应的文字识别准确率、候选商家名称“鸭血粉丝汤”对应的相似程度信息、候选商家名称“鸭血粉丝汤”对应的招牌名称概率信息中的至少一个。
候选商家名称“鸭血粉丝汤”对应的文字识别准确率指示候选商家名称“鸭血粉丝汤”中的匹配文字的识别准确率。候选商家名称“鸭血粉丝汤”对应的相似程度信息指示候选商家名称“鸭血粉丝汤”与识别结果的相似度。候选商家名称“鸭血粉丝汤”对应的招牌名称概率信息指示候选商家名称“鸭血粉丝汤”中的匹配文字属于商家的招牌名称的概率。
在本实施例中,对于每一个候选商家名称,当计算该候选商家名称对应的文字识别准确率时,可以根据候选商家名称中的匹配文字的识别正确概率,计算该候选商家名称对应的文字识别准确率。
在采用文字识别算法例如OCR或文字识别模型例如用于文字识别的卷积神经网络对商家的门脸图像中的文字进行文字识别时,文字识别算法或文字识别模型输出该识别结果中的每一个文字的识别正确概率。文字的识别正确概率为该文字属于正确识别的文字的概率。
在本实施例中,对于每一个候选商家名称,当计算该候选商家名称对应的文字识别准确率时,可以去除该候选商家名称中的所有匹配文字的识别正确概率中的最高的识别正确概率和最低的识别正确概率,计算剩余的识别正确概率的平均值,将计算出的平均值作为该候选商家名称对应的文字识别准确率。也可以选取所有匹配文字的识别正确概率中的作为中位数的识别正确概率作为该候选商家名称对应的文字识别准确率。
在本实施例中,对于每一个候选商家名称,当计算该候选商家名称对应的相似程度信息时,可以将该候选商家名称中的匹配文字的数量与该候选商家名称的长度的比值作为该候选商家名称对应的相似程度信息。候选商家名称的长度为候选商家名称中的文字的数量。
在本实施例中,对于每一个候选商家名称,当计算该候选商家名称对应的相似程度信息时,也可以计算该候选商家名称与识别结果中的包括匹配文字的部分之间的编辑距离,根据编辑距离,计算出该候选商家名称与识别结果的相似度,将计算出的相似度作为该候选商家名称对应的相似程度信息。该候选商家名称与识别结果的相似度可以表示为1-编辑距离/(候选商家名称的长度+识别结果中的包括匹配文字的部分的长度)。
在本实施例中,当计算每一个候选商家名称对应的招牌名称概率信息,可以根据与商家的招牌名称相关的特征,计算候选商家名称对应的招牌名称概率信息。
商家的招牌名称中的文字通常采用比较醒目的文字,商家的招牌名称中的文字的面积即文字在商家的门脸图像中占据的区域的面积通常大于商家的招牌上的其他文字在商家的门脸图像中占据的区域的面积。
因此,与商家的招牌名称相关的特征可以为匹配文字的面积即匹配文字在商家的门脸图像中占据的区域的面积,占据的区域的面积越大的匹配文字,属于商家的招牌名称的概率越大。
在采用文字识别算法例如OCR或文字识别模型例如用于文字识别的卷积神经网络对商家的门脸图像中的文字进行文字识别时,对于识别结果中的每一个文字,文字识别算法或文字识别模型会输出该文字对应的文字框,该文字对应的文字框包围该文字。
在本实施例中,对于识别结果中的每一个文字,该文字在商家的门脸图像中占据的区域的面积可以为该文字对应的文字框的面积。
在本实施例中,对于每一个候选商家名称,当计算该候选商家名称对应的招牌名称概率信息时,可以对于候选商家名称中的每一个匹配文字,将该匹配文字的面积除以最大文字的面积,得到该匹配文字的面积与最大文字的面积的比值。最大文字为识别结果中的在商家的门脸图像中占据的区域的面积最大的文字。计算该候选商家名称中的所有匹配文字的面积与最大文字的面积的比值的和,将该候选商家名称中的所有匹配文字的面积与最大文字的面积的比值的和除以该候选商家名称中的匹配文字的数量,得到该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值,将该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值作为该候选商家名称对应的招牌名称概率信息。
步骤103,基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度。
在本实施例中,在获取每一个候选商家名称的多维特征信息之后,可以基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度。
在本实施例中,对于每一个候选商家名称,该候选商家名称的置信度指示该候选商家名称为商家的名称的概率。
在本申请中,在候选商家名称的多维特征信息包括候选商家名称对应的文字识别准确率、候选商家名称对应的相似程度信息、候选商家名称对应的招牌名称概率信息中的一个的情况下,对于每一个候选商家名称,可以将该候选商家名称的多维特征信息所包括的该候选商家名称对应的文字识别准确率、该候选商家名称对应的相似程度信息、该候选商家名称对应的招牌名称概率信息中的一个作为该候选商家名称的置信度。
在本实施例中,在候选商家名称的多维特征信息包括候选商家名称对应的文字识别准确率、候选商家名称对应的相似程度信息、候选商家名称对应的招牌名称概率信息中的多个的情况下,当基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度时,对于每一个候选商家名称,可以对该候选商家名称的多维特征信息中的各项进行加权计算,得到该候选商家名称的置信度。
对于每一个候选商家名称,可以对该候选商家名称的多维特征信息中的各项进行归一化,得到该候选商家名称的多维特征信息中的每一项的归一化值,将每一项的归一化值进行加权计算,得到该候选商家名称的置信度。
在本实施例中,可以预先设置在计算候选商家名称的置信度时,候选商家名称的多维特征信息中的每一项的权重。
步骤104,基于每一个候选商家名称的置信度,确定商家的名称。
在本实施例中,在基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度之后,可以基于每一个候选商家名称的置信度,确定商家的名称。
可选地,当基于每一个候选商家名称的置信度,确定商家的名称时,可以将置信度最高的候选商家名称确定为商家的名称。
可选地,在候选商家名称的多维特征信息包括候选商家名称对应的文字识别准确率、候选商家名称对应的相似程度信息、候选商家名称对应的招牌名称概率信息中的多个的情况下,当基于每一个候选商家名称的置信度,确定商家的名称时,还可以首先按照置信度由大至小的顺序,对所有候选商家名称进行排序,确定置信度最高的候选商家名称、置信度次高的候选商家名称,当置信度最高的候选商家名称的置信度与置信度次高的候选商家名称的置信度的差值小于差值阈值时,可以将置信度最高的候选商家名称的置信度和置信度次高的候选商家名称中的具有的预设类型的项最大的候选商家名称确定为商家的名称,预设类型的项可以为候选商家名称对应的招牌名称概率信息或对应的候选商家名称对应的文字识别准确率。
可选地,在候选商家名称的多维特征信息包括候选商家名称对应的文字识别准确率、候选商家名称对应的相似程度信息、候选商家名称对应的招牌名称概率信息中的多个的情况下,当基于每一个候选商家名称的置信度,确定商家的名称时,还可以首先确定置信度大于置信度阈值的所有候选商家名称。当置信度大于置信度阈值的候选商家名称的数量为多个时,可以将所有置信度大于置信度阈值的候选商家名称中具有的预设类型的项最大的候选商家名称确定为商家的名称,预设类型的项可以为候选商家名称对应的招牌名称概率信息或对应的候选商家名称对应的文字识别准确率。
在本实施例中,在确定商家的名称时,同时考虑了候选商家名称中的匹配文字的识别准确率、候选商家名称与识别结果的相似度、候选商家名称中的匹配文字属于商家的招牌名称的概率,基于该候选商家名称对应的文字识别准确率、该候选商家名称对应的相似程度信息、该候选商家名称对应的招牌名称概率信息等多个维度的信息,分别计算每一个候选商家的置信度,根据计算出的每一个候选商家的置信度,确定商家的名称,提升确定出的商家的名称的准确性。
在本实施例中,在确定商家的名称之后,可以确定是否向用户推送确定出的商家的名称所属的商家的相关信息,例如该商家的菜品的优惠信息,当确定向用户推送该商家的相关信息时,向该用户推送该商家的相关信息。
在本实施例中,当确定是否向用户推送确定出的商家的名称所属的商家的相关信息时,可以确定该商家的名称是否满足预设条件,预设条件可以为该商家的名称的置信度大于或等于置信度阈值并且该商家的名称对应的文字识别准确率大于或等于准确率阈值。当该商家的名称满足预设条件时,确定向用户推送具有该商家的名称的商家的相关信息。
当商家的名称的置信度小于置信度阈值时,可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称。
例如,用户在利用终端拍摄商家的门脸图像时,由于拍摄角度不佳,商家的门脸图像中仅包括商家的门脸中的招牌上的一部分文字,还可能出现与商家的名称关联度最高的招牌上的招牌名称的所有文字中只有部分文字在商家的门脸图像中。由于确定商家的名称时,参与置信度计算的相似程度信息、招牌名称概率信息均与匹配文字的数量相关,可能导致即使确定出的商家的名称正确,计算出的该商家的名称的置信度较低。
可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息例如提示用户终端的摄像头的拍摄角度应该正对商家的招牌来拍摄商家的门脸图像信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称。
当商家的名称对应的文字识别准确率小于文字识别准确率阈值时,可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息例如提示用户终端的摄像头的拍摄角度应该正对商家的招牌来拍摄商家的门脸图像信息、提示用户商家的门脸图像应该完全包括商家的招牌的信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称。
例如,用户在利用终端拍摄商家的门脸图像时,由于拍摄角度不佳、用户距离商家的门口距离较远导致门脸图像的清晰度低等因素,对商家的门脸图像中的文字的识别造成不利影响,造成识别结果的准确性低,可能导致确定出的商家的名称错误。
可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息例如提示用户终端的摄像头的拍摄角度应该正对商家的招牌来拍摄商家的门脸图像信息、提示用户应该在距离商家的门口较近的位置利用终端进行拍摄的信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称,提升确定的商家的名称的准确性。
以下对比本申请提供的确定商家的名称的方法与现有技术的区别:
请参考图2,其示出了采用现有技术确定商家的名称的一个流程示意图。
一个商家的名称为“美诱鸭脖”,该商家的招牌名称为“美诱鸭脖”。一个用户到达一个该商家的门口之后,该用户利用该用户的终端拍摄拍摄该商家的门脸,得该到商家的门脸图像,该用户的终端将该商家的门脸图像发送至服务器。
服务器采用OCR对该商家的门脸图像中的文字进行文字识别之后,得到的识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。该商家的门脸图像中的该商家的招牌上除了包括招牌名称“美诱鸭脖”之外,还包括介绍商家提供的菜品的文字,即“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”。
在服务器上预先存储的多个候选商家名称包括“鸭血粉丝汤”、“美诱鸭脖”等商家名称。
基于编辑距离,计算每一个候选商家名称与识别结果的相似度。候选商家名称“美诱鸭脖”与识别结果中的包括匹配文字的部分“美诱鸭脖”的编辑距离为0,候选商家名称“美诱鸭脖”与识别结果的相似度为1。候选商家名称“鸭血粉丝汤”与识别结果中的包括匹配文字的部分“鸭血粉丝汤”的编辑距离为0,候选商家名称“鸭血粉丝汤”与识别结果的相似度也为1。候选商家名称“美诱鸭脖”与识别结果的相似度与候选商家名称“鸭血粉丝汤”与识别结果的相似度相同。每一个其他的候选商家名称与识别结果的相似度均较小,例如,每一个其他的候选商家名称与识别结果的相似度均小于0.5。
对候选商家名称与识别结果的相似度由大至小进行排列,由于候选商家信息“鸭血粉丝汤”中的匹配文字的数量更多,因此,确定出的商家的名称为“鸭血粉丝汤”,确定出的商家的名称不是用户达到的商家的名称“美诱鸭脖”。向用户推送的优惠信息为名称为“鸭血粉丝汤”的商家的优惠信息,而不是用户到达的名称为“美诱鸭脖”的商家的优惠信息。
在现有技术中,由于在计算候选商家的置信度时,仅考虑候选商家名称与识别结果的相似度,并没有考虑商家的门脸图像中的招牌上的文字哪些是属于招牌名称的文字,哪些是介绍商家提供的商品的文字,换言之,没有考虑候选商家名称中的匹配文字属于商家的招牌名称的概率,导致确定出的商家的名称为错误的名称“鸭血粉丝汤”,而不是用户到达的该商家的名称“美诱鸭脖”。
请参考图3,其示出了采用本申请提供的方法确定商家名称的一个流程示意图。
在本申请中,在确定商家的名称时,同时考虑了候选商家名称中的匹配文字的识别准确率、候选商家名称与识别结果的相似度、候选商家名称中的匹配文字属于商家的招牌名称的概率。
在本申请中,基于指示候选商家名称中的匹配文字的识别准确率的候选商家名称对应的文字识别准确率、指示候选商家名称与识别结果的相似度的候选商家名称对应的相似程度信息、指示候选商家名称中的匹配文字属于商家的招牌名称的概率的候选商家名称对应的招牌名称概率信息等多个维度的信息,计算候选商家名称的置信度。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”的多维特征信息包括:候选商家名称“美诱鸭脖”对应的文字识别准确率、候选商家名称“美诱鸭脖”对应的相似程度信息、候选商家名称“美诱鸭脖”对应的招牌名称概率信息。
对于候选商家名称“鸭血粉丝汤”,候选商家名称“鸭血粉丝汤”的多维特征信息包括:候选商家名称“鸭血粉丝汤”对应的文字识别准确率、候选商家名称“鸭血粉丝汤”对应的相似程度信息、候选商家名称“鸭血粉丝汤”对应的招牌名称概率信息。
对于每一个候选商家名称对应的文字识别准确率,由于文字识别算法例如OCR或文字识别模型例如用于文字识别的卷积神经网络均为很成熟的技术,通常情况下,文字识别准确率较高,几乎所有文字可以被正确地识别,因此,通常情况下,候选商家名称“美诱鸭脖”对应的文字识别准确率与候选商家名称“鸭血粉丝汤”对应的文字识别准确率相同或几乎相同。每一个其他的候选商家名称对应的文字识别准确率也均较高。
对于每一个候选商家名称对应的相似程度信息,假设根据编辑距离,计算候选商家名称与识别结果的相似度,计算出的相似度作为候选商家名称对应的相似程度信息。候选商家名称与识别结果的相似度可以表示为1-编辑距离/(候选商家名称的长度+识别结果中的包括匹配文字的部分的长度)。
候选商家名称“美诱鸭脖”与识别结果中的包括匹配文字的部分“美诱鸭脖”的编辑距离为0,候选商家名称“美诱鸭脖”与识别结果的相似度为1。候选商家名称“鸭血粉丝汤”与识别结果中的包括匹配文字的部分“鸭血粉丝汤”的编辑距离为0,候选商家名称“鸭血粉丝汤”与识别结果的相似度也为1。候选商家名称“美诱鸭脖”与识别结果的相似度与候选商家名称“鸭血粉丝汤”与识别结果的相似度相同。每一个其他的候选商家名称与识别结果的相似度均较小,例如,每一个其他的候选商家名称与识别结果的相似度均小于0.5。
在候选商家名称“美诱鸭脖”与识别结果的相似度和候选商家名称“鸭血粉丝汤”与识别结果的相似度相同,候选商家名称“美诱鸭脖”对应的文字识别准确率与候选商家名称“鸭血粉丝汤”对应的文字识别准确率相同或几乎相同的情况下,候选商家名称“美诱鸭脖”的置信度与候选商家名称“鸭血粉丝汤”的置信度哪个高,取决于候选商家名称“美诱鸭脖”中的匹配文字属于商家的招牌名称的概率和候选商家名称“鸭血粉丝汤”中的匹配文字属于商家的招牌名称的概率。
由于候选商家名称“美诱鸭脖”中的每一个文字占据的区域的面积均大于“鸭血粉丝汤”中的每一个文字占据的区域的面积,因此,计算出的候选商家名称“美诱鸭脖”中的文字属于商家的招牌名称的概率大于计算出的候选商家名称“鸭血粉丝汤”中的文字属于商家的招牌名称的概率,即候选商家名称“美诱鸭脖”对应的招牌名称概率信息大于候选商家名称“鸭血粉丝汤”对应的招牌名称概率信息。例如,候选商家名称“美诱鸭脖”对应的招牌名称概率信息为0.9,候选商家名称“鸭血粉丝汤”对应的招牌名称概率信息为0.6。
因此,计算出的候选商家名称“美诱鸭脖”的置信度大于计算出的候选商家名称“鸭血粉丝汤”的置信度。
通过本申请中的确定商家的方法,在两个候选商家名称与识别结果的相似度相同或几乎相同,两个候选商家名称对应的文字识别准确率相同或几乎相同的情况下,由于考虑了候选商家名称属于商家的招牌名称的概率,确定出的商家的名称“美诱鸭脖”为正确的商家的名称。
请参考图4,其示出了采用现有技术确定商家的名称的一个流程示意图。
一个商家的名称为“和米堂”,该商家的招牌名称为“和米堂”。一个用户到达该名称为“和米堂”商家的门口的附近之后,该用户利用该用户的终端拍摄该商家的门脸,得该到商家的门脸图像。
该用户在利用终端拍摄该商家的门脸时,不仅距离该商家的门口有一定距离,而且用户的终端的摄像头的拍摄角度也不是正对该商家的招牌,拍摄角度存在问题,对文字的识别造成不利的影响。该用户的终端将该商家的门脸图像发送至服务器。
识别结果包括子结果“杏十堂”,由于拍摄角度存在问题,对文字的识别造成不利的影响,导致识别结果中的子结果“杏十堂”中的文字的识别准确率低。
由于用户拍摄角度存在问题,对文字的识别造成不利的影响,导致该商家的招牌名称“和米堂”中的“和”被错误地识别为“杏”,该商家的招牌名称“和米堂”中的“米”被错误地识别为“十”,该商家的招牌名称“和米堂”中的3个文字中的2个文字均识别错误。仅“堂”属于正确识别的文字,“杏”、“十”均属于识别错误的文字,“杏”的识别正确概率、“十”的识别正确概率均低。
由于识别结果中的子结果“杏十堂”与候选商家名称“杏花堂”共同包括两个匹配文字,候选商家名称“杏花堂”中的匹配文字的数量为2,使得候选商家名称与子结果的编辑距离达到一个较小的数值,进一步使得候选商家名称与识别结果的相似度达到一个较高的数值例如0.67。
所有候选商家名称中,与识别结果相似度最高的候选商家名称为“杏花堂”,确定出的商家的名称为“杏花堂”。
在现有技术中,候选商家名称“杏花堂”与识别结果的相似度最大,将候选商家名称“杏花堂”确定为商家的名称,向用户推送名称为“杏花堂”的商家的相关信息例如商家的菜品的优惠信息。名称为“杏花堂”的商家不是用户到达的名称为“和米堂”的商家,向用户推送的信息也不是用户达到的名称为“和米堂”的商家的相关信息。
在现有技术中,虽然候选商家名称与识别结果的相似度已经较高,例如0.67,但在现有技术中,候选商家名称与识别结果的相似度是基于识别结果完全准确的情况下计算出的。在识别结果不准确的情况下仅计算候选商家名称与识别结果的相似度,导致确定出的商家的名称错误,向用户推送的商家的相关信息错误的情况。
而在本申请中,考虑了候选商家名称中的匹配文字的文字识别准确率,指示候选商家名称中的匹配文字的识别准确率的候选商家名称对应的文字识别准确率参与候选商家名称的置信度的计算。
在本申请中,候选商家名称“杏花堂”对应的文字识别准确率低,可能使得候选商家名称“杏花堂”的置信度低。从而,即使候选商家名称“杏花堂”的置信度最高,由于候选商家名称“杏花堂”的置信度低,候选商家名称“杏花堂”的置信度小于置信度阈值,可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息,例如,例如提示用户终端的摄像头的拍摄角度应该正对商家的招牌来拍摄商家的门脸图像信息、提示用户应该在距离商家的门口较近的位置利用终端进行拍摄的信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称,提升确定的商家的名称的准确性。避免在识别结果不准确的情况下仅计算候选商家名称与识别结果的相似度,导致确定出的商家的名称错误,向用户推送的商家的相关信息错误的情况。
在本申请中,还可以直接根据确定出的商家的名称“杏花堂”对应的文字识别准确率小于文字识别准确率阈值,确定不向用户推送确定出的商家的名称“杏花堂”所属的商家的相关信息,可以向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息,以使得用户再次利用终端拍摄商家的门脸图像,再次确定商家的名称,提升确定的商家的名称的准确性。
图5是本申请提供的商家名称确定方法的一个实施例的流程图。该方法中的各个步骤可以由服务器执行,该方法包括以下步骤:
步骤501,对商家的门脸图像中的文字进行文字识别,得到识别结果。
本实施例中的对商家的门脸图像中的文字进行文字识别,得到识别结果的方式可以参考上述实施例中的对商家的门脸图像中的文字进行文字识别,得到识别结果的方式。
步骤502,基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,多维特征信息中的相似程度信息和招牌名称概率信息均包括多项。
在本实施例中,对于每一个候选商家名称,该候选商家名称的多维特征信息包括:该候选商家名称对应的文字识别准确率、该候选商家名称对应的相似程度信息、该候选商家名称对应的招牌名称概率信息。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的文字识别准确率为候选商家名称中的文字的平均识别准确率。
在采用文字识别算法例如OCR或文字识别模型例如用于文字识别的卷积神经网络对商家的门脸图像中的文字进行文字识别时,文字识别算法或文字识别模型输出该识别结果中的每一个文字的识别正确概率。文字的识别正确概率为该文字为识别正确的文字的概率。
在本实施例中,对于每一个候选商家名称,该候选商家名称的多维特征信息中的该候选商家名称对应的文字识别准确率为该候选商家名称中的匹配文字的识别正确概率的平均值。
在本实施例中,对于每一个候选商家名称,该候选商家名称的多维特征信息中的该候选商家名称对应的相似程度信息包括:该候选商家名称中的匹配文字的数量、该候选商家名称中的匹配文字对的数量、该候选商家名称对应的第一比值、该候选商家名称对应的第二比值,该候选商家名称中的匹配文字为该候选商家名称与识别结果共同包括的文字,该匹配文字对包括该候选商家名称中的两个相邻的匹配文字,该第一比值为该匹配文字的数量除以识别结果的长度的商,该第二比值为该匹配文字的数量除以识别结果的长度与该候选商家名称的长度之和的商。
在本实施例中,对于每一个候选商家名称,该候选商家名称的所有匹配文字中的每两个相邻的匹配文字构成一个匹配文字对。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的第一比值为该候选商家名称中的匹配文字的数量除以识别结果的长度的商,该候选商家名称对应的第一比值可以表示为该候选商家名称中的匹配文字的数量/识别结果的长度,识别结果的长度为识别结果包括的文字的数量。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的第二比值为该候选商家名称中的匹配文字的数量除以识别结果的长度与该候选商家名称的长度之和的商,该候选商家名称对应的第二比值可以表示为该候选商家名称中的匹配文字的数量/(识别结果的长度+该候选商家名称的长度),该候选商家名称的长度为该候选商家名称包括的文字的数量。
在本实施例中,对于每一个候选商家名称,该候选商家名称对应的招牌名称概率信息包括:该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、该候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、该候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值,其中,最大文字为识别结果中的面积最大的文字。
在采用文字识别算法或文字识别模型输出对商家的门脸图像中的文字进行文字识别时,对于识别结果中的每一个文字,文字识别算法或文字识别模型输出该文字对应的文字框,该文字对应的文字框包围该文字。
在本实施例中,对于识别结果中的每一个文字,该文字的面积可以是指该文字在商家的门脸图像中占据的区域的面积。
在本实施例中,对于识别结果中的每一个文字,该文字在商家的门脸图像中占据的区域的面积可以为该文字对应的文字框的面积。
在本实施例中,对于识别结果中的每一个文字,该文字的高度可以为该文字对应的文字框的高度。
在本实施例中,对于识别结果中的每一个文字,该文字的宽度可以为该文字对应的文字框的宽度。
在本实施例中,最大文字为识别结果中的所有文字中面积最大的文字,即最大文字为在商家的门脸图像中占据的区域的面积最大的文字。
以一个候选商家名称为例,对于该候选商家名称中的每一个匹配文字,将该匹配文字的面积除以最大文字的面积,得到该匹配文字的面积与最大文字的面积的比值。计算所有匹配文字的面积与最大文字的面积的比值的和,将所有文字对应的比值的和除以该候选商家名称中的匹配文字的数量,得到该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值。
参考上述计算一个候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值的方式,可以计算任意一个候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值。
以一个候选商家名称为例,对于候选商家名称中的每一个匹配文字,将该文字的高度除以最大文字的高度,得到该匹配文字的高度与最大文字的高度的比值。计算所有匹配文字的高度与最大文字的高度的比值的和,将所有匹配文字的高度与最大文字的高度的比值的和除以该候选商家名称中的匹配文字的数量,得到该候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值。
参考上述计算一个候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值的方式,可以计算任意一个候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值。
以一个候选商家名称为例,对于候选商家名称中的每一个匹配文字,将该匹配文字的宽度除以最大文字的宽度,得到该匹配文字的宽度与最大文字的宽度的比值。计算每一个匹配文字的宽度与最大文字的宽度的比值的和,将所有匹配文字的宽度与最大文字的宽度的比值的和除以该候选商家名称中的匹配文字的数量,得到该候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值。
参考上述计算一个候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值的方式,可以计算任意一个候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值。
以下举例说明本申请中计算候选商家名称的多维特征信息中的每一项的方式:
一个商家的名称为“美诱鸭脖”,该商家的招牌名称为“美诱鸭脖”。一个用户到达一个该商家之后,该用户利用该用户的终端拍摄拍摄该商家的门脸,得到商家的门脸图像,该用户的终端将该商家的门脸图像发送至服务器。
服务器采用OCR对该商家的门脸图像中的文字进行文字识别之后,得到的识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。除了招牌名称“美诱鸭脖”之外,还包括描述商家提供的商品的类型、特征信息的信息,即“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”中的所有匹配文字包括:“美”、“诱”、“鸭”“脖”。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”的多维特征信息中的候选商家名称“美诱鸭脖”对应的文字识别准确率为“美诱鸭脖”中的匹配文字的识别正确概率的平均值。
在采用文字识别算法例如OCR或文字识别模型例如用于文字识别的卷积神经网络对商家的门脸图像中的文字进行文字识别时,文字识别算法或文字识别模型输出该识别结果中的每一个文字的识别正确概率。文字的识别正确概率为该文字为识别正确的文字的概率。
计算“美诱鸭脖”中的所有匹配文字的识别正确概率的和,将“美诱鸭脖”中的所有匹配文字的识别正确概率的和除以“美诱鸭脖”中的所有匹配文字的数量即4,得到“美诱鸭脖”中的匹配文字的识别正确概率的平均值即“美诱鸭脖”对应的文字识别准确率。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”的多维特征信息中的候选商家名称“美诱鸭脖”对应的相似程度信息包括:候选商家名称“美诱鸭脖”中的匹配文字的数量、候选商家名称“美诱鸭脖”中的匹配文字对的数量、候选商家名称“美诱鸭脖”对应的第一比值、候选商家名称“美诱鸭脖”对应的第二比值。
候选商家名称“美诱鸭脖”中的匹配文字的数量为4。
候选商家名称“美诱鸭脖”包括“美诱”、“诱鸭”、“鸭脖”等3个匹配文字对,候选商家名称“美诱鸭脖”中的匹配文字对的数量为3。
候选商家名称“美诱鸭脖”对应的第一比值为候选商家名称“美诱鸭脖”中的匹配文字的数量除以识别结果的长度的商。
识别结果包括“美诱鸭脖”、“主题餐厅”、“休闲鸭脖”、“特色酸辣粉”、“鸭血粉丝汤”、“饮品”等6个子结果。识别结果包括24个文字,识别结果的长度为24。
候选商家名称“美诱鸭脖”对应的第一比值为4/24。
候选商家名称“美诱鸭脖”对应的第二比值为候选商家名称“美诱鸭脖”中的匹配文字的数量除以识别结果的长度与该候选商家名称的长度之和的商。
候选商家名称“美诱鸭脖”的长度为4,识别结果的长度与该候选商家名称“美诱鸭脖”的长度之和为28,候选商家名称“美诱鸭脖”对应的第二比值为4/28。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”的多维特征信息中的候选商家名称“美诱鸭脖”对应的招牌名称概率信息可以通过以下方式获得:
首先确定识别结果中面积最大的最大文字。
由于该商家的招牌名称为“美诱鸭脖”,为了使得招牌名称醒目,招牌名称中的文字通常大于其他的文字。“美”、“诱”、“鸭”“脖”中的每一个文字均大于其他的文字。将“美”、“诱”、“鸭”“脖”中最大的文字作为最大文字。
对于候选商家名称“美诱鸭脖”,候选商家名称“美诱鸭脖”中的所有匹配文字包括:“美”、“诱”、“鸭”“脖”。
对于候选商家名称“美诱鸭脖”中的每一个匹配文字,将该匹配文字的面积除以最大文字的面积,得到该匹配文字的面积与最大文字的面积的比值,即得到“美”的面积与最大文字的面积的比值、“诱”的面积与最大文字的面积的比值、“鸭”的面积与最大文字的面积的比值、“脖”的面积与最大文字的面积的比值。计算所有匹配文字的面积与最大文字的面积的比值的和,将所有匹配文字的面积与最大文字的面积的比值的和除以候选商家名称“美诱鸭脖”中的匹配文字的数量即4,得到候选商家名称“美诱鸭脖”中的匹配文字的面积与最大文字的面积的比值的平均值。
对于候选商家名称“美诱鸭脖”中的每一个匹配文字,将该匹配文字的高度除以最大文字的高度,得到该匹配文字的高度与最大文字的高度的比值,即得到“美”的高度与最大文字的高度的比值、“诱”的高度与最大文字的高度的比值、“鸭”的高度与最大文字的高度的比值、“脖”的高度与最大文字的高度的比值。计算所有匹配文字的高度与最大文字的高度的比值的和,将所有匹配文字的高度与最大文字的高度的比值的和除以候选商家名称“美诱鸭脖”中的匹配文字的数量即4,得到候选商家名称“美诱鸭脖”中的匹配文字的高度与最大文字的高度的比值的平均值。
对于候选商家名称“美诱鸭脖”中的每一个匹配文字,将该匹配文字的宽度除以最大文字的宽度,得到该匹配文字的宽度与最大文字的宽度的比值,即得到“美”的宽度与最大文字的宽度的比值、“诱”的宽度与最大文字的宽度的比值、“鸭”的宽度与最大文字的宽度的比值、“脖”的宽度与最大文字的宽度的比值。计算所有匹配文字的宽度与最大文字的宽度的比值的和,将所有匹配文字的宽度与最大文字的宽度的比值的和除以候选商家名称“美诱鸭脖”中的匹配文字的数量即4,得到候选商家名称“美诱鸭脖”中的匹配文字的宽度与最大文字的宽度的比值的平均值。
参考上述获取候选商家名称“美诱鸭脖”的多维特征信息中的各项的方式,获取候选商家名称“鸭血粉丝汤”的多维特征信息中的每一项。
步骤503,基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度。
在本实施例中,对于每一个候选商家名称,该候选商家名称的多维特征信息包括:该候选商家名称的多维特征信息中的该候选商家名称对应的文字识别准确率、该候选商家名称中的匹配文字的数量、该候选商家名称中的匹配文字对的数量、该候选商家名称对应的第一比值、该候选商家名称对应的第二比值、该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、该候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、该候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值。
在本实施例中,在获取每一个候选商家名称的多维特征信息之后,可以基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度。
在本实施例中,对于每一个候选商家名称,该候选商家名称的置信度指示该候选商家名称为商家的名称的概率。
在本实施例中,当基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度时,可以对于每一个候选商家名称,对该候选商家名称的多维特征信息中的各项进行加权计算,得到该候选商家名称中的置信度。
对于每一个候选商家名称,对该候选商家名称的多维特征信息中的每一项进行归一化,得到该候选商家名称的多维特征信息中的每一项的归一化值,将各项的归一化值进行加权计算,得到该候选商家名称中的置信度。
在本实施例中,可以预先设置在计算候选商家名称的置信度时,候选商家名称的多维特征信息中的每一项的权重。
步骤504,基于每一个候选商家名称的置信度,确定商家的名称。
在本实施例中,在基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度之后,可以基于每一个候选商家名称的置信度,确定商家的名称。
本实施例中的基于每一个候选商家名称的置信度,确定商家的名称的方式可以参考上述实施例中的基于每一个候选商家名称的置信度,确定商家的名称的方式。
图6是本申请提供的商家名称确定方法的一个实施例的流程图。该方法中的各个步骤可以由服务器执行,该方法包括以下步骤:
步骤601,对商家的门脸图像中的文字进行文字识别,得到识别结果。
本实施例中的对商家的门脸图像中的文字进行文字识别,得到识别结果的方式可以参考上述实施例中的对商家的门脸图像中的文字进行文字识别,得到识别结果的方式。
步骤602,基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息。
本实施例中的基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息的方式可以参考上述实施例中的基于识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息的方式。
步骤603,利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度。
在本实施例中,在利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度之前,预先对商家名称置信度计算模型进行训练。
在本实施例中,商家名称置信度计算模型可以为用于分类的神经网络。
在本实施例中,可以预先利用商家名称置信度计算模型的训练样本和训练样本的标注信息对商家名称置信度计算模型进行训练。
在本实施例中,商家名称置信度计算模型的每一个训练样本分别对应一个商家门脸图像。每一个训练样本对应的商家门脸图像不同。
对于商家名称置信度计算模型的每一个训练样本,该训练样本包括:多个用于训练的商家名称、多个用于训练的商家名称的多维特征信息。
该训练样本中的多个用于训练的商家名称包括:该训练样本对应的商家门脸图像所属的商家的名称、在该训练样本对应的商家门脸图像所属的商家附近的至少一个商家的名称。
获取用于训练的商家名称的多维特征信息可以参考上述实施例中获取候选商家名称的多维特征信息的方式。
在本实施例中,对于每一个训练样本,由标注人员根据该训练样本对应的商家门脸图像中的商家的招牌名称,对训练样本中的候选商家名称进行标注,得到该训练样本的标注信息,该训练样本的标注信息指示训练样本中的多个用于训练的商家名称中的属于商家的招牌名称或包括商家的招牌名称的商家名称。
换言之,该训练样本的标注信息指示训练样本中哪一个候选商家名称为训练样本对应的商家门脸图像所属的商家的招牌名称或包括训练样本对应的商家门脸图像所属的商家的招牌名称。
在本实施例中,在每一次对商家名称置信度计算模型进行训练时,利用一个训练样本和该训练样本的标注信息对商家名称置信度计算模型进行训练。
在每一次对商家名称置信度计算模型进行训练时,首先由商家名称置信度计算模型分别生成训练样本中的每一个用于训练的商家名称的多维特征信息对应的特征向量。对于训练样本中的每一个用于训练的商家名称,该用于训练的商家名称的多维特征信息对应的特征向量中的每一个分量分别表示用于训练的商家名称的多维特征信息中的一项。然后,对于训练样本中的每一个用于训练的商家名称,商家名称置信度计算模型基于该用于训练的商家名称的多维特征信息对应的特征向量,预测出该用于训练的商家名称的置信度。从而,得到训练样本中的每一个用于训练的商家名称的置信度。
当商家名称置信度计算模型根据训练样本的标注信息,确定预测出的置信度最高的候选商家名称不是商家的招牌名称或不包括商家的招牌名称时,则本次训练可以计算出损失函数值,更新商家名称置信度计算模型的参数的参数值。当商家名称置信度计算模型根据训练样本的标注信息,确定预测出的置信度最高的候选商家名称是商家的招牌名称或包括商家的招牌名称时,则本次训练可以不对商家名称置信度计算模型的参数的参数值进行更新。
通过利用大量的训练样本和训练样本的标注信息迭代地对商家名称置信度计算模型进行训练,经过训练之后,商家名称置信度计算模型可以确定在计算候选商家名称的置信度时候选商家名称的多维特征信息中的每一项的权重。
在本实施例中,商家名称置信度计算模型可以为感知机模型,感知机模型的输入层的节点数量与参与计算的多维特征信息中的维度数量相同,即作为商家名称置信度计算模型的感知机模型的输入层的节点数量与参与计算的多维特征信息中的项的数量相同。
例如,对于每一个候选商家名称,该候选商家名称的多维特征信息包括:该候选商家名称中的匹配文字的识别正确概率的平均值、候选商家名称中的匹配文字的数量、该候选商家名称中的匹配文字对的数量、该候选商家名称对应的第一比值、该候选商家名称对应的第二比值、该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、该候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、该候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值。
候选商家名称的多维特征信息包括8项,作为商家名称置信度计算模型的感知机模型的输入层的节点数量为8,作为商家名称置信度计算模型的感知机模型的输入层包括8个节点,每一个节点分别对应候选商家名称的多维特征信息中的一项。
作为商家名称置信度计算模型的感知机模型的隐藏层包括的节点的数量大于输入层的节点数量,例如,作为商家名称置信度计算模型的感知机模型的隐藏层包括12个节点,作为商家名称置信度计算模型的感知机模型的输出层包括1个节点。
在本实施例中,当利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息,确定商家的名称时,可以利用商家名称置信度计算模型生成每一个候选商家名称的多维特征信息对应的特征向量,候选商家名称的多维特征信息对应的特征向量中的每一个分量分别表示候选商家名称的多维特征信息中的一项。然后,对于每一个候选商家名称,商家名称置信度计算模型基于该候选商家名称的多维特征信息对应的特征向量,预测出该候选商家名称的置信度。从而,得到每一个候选商家名称的置信度。
步骤604,基于每一个候选商家名称的置信度,确定商家的名称。
在本实施例中,在利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度之后,可以基于每一个候选商家名称的置信度,确定商家的名称。
本实施例中的基于每一个候选商家名称的置信度,确定商家的名称的方式可以参考上述实施例中的基于每一个候选商家名称的置信度,确定商家的名称的方式。
请参考图7,其示出了利用商家名称置信度计算模型确定商家名称的一个流程示意图。
一个用户到达一个商家之后,该用户利用该用户的终端拍摄拍摄该商家的门脸,得到商家的门脸图像。为了查询是否存在该商家的优惠信息,该用户的终端将该商家的门脸图像发送至服务器。服务器对将该商家的门脸图像中的文字进行文字识别,得到识别结果。
服务器对于每一个候选商家名称,基于识别结果,获取每一个候选商家名称的多维特征信息。对于每一个候选商家名称,该候选商家名称的多维特征信息包括:该候选商家名称中的匹配文字的识别正确概率的平均值、候选商家名称中的匹配文字的数量、该候选商家名称中的匹配文字对的数量、该候选商家名称对应的第一比值、该候选商家名称对应的第二比值、该候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、该候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、该候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值。
服务器对于每一个候选商家名称,生成该候选商家名称对应的特征向量。每一个候选商家名称对应的特征向量中的分量的数量均为8。
通过商家名称置信度计算模型分别基于每一个候选商家名称的多维特征信息,计算出每一个候选商家名称的置信度。按照置信度由高至低的顺序,对所有候选商家名称进行排序,可以将置信度最大的候选商家名称确定为商家的名称。然后,可以向信息推荐系统提供确定出的商家的名称和确定出的商家的名称的置信度,以使得信息推荐系统可以根据确定出的商家的名称的置信度,确定是否向用户推送具有确定出的商家的名称的商家的相关信息或向用户的终端发送用于提示用户利用终端重新拍摄商家的门脸图像的信息。
请参考图8,其示出本申请提供的商家名称确定装置的一个实施例的结构示意图。本申请提供的商家名称确定装置中的各个单元被配置为完成的操作的具体实现方式可以参考方法实施例中描述的相应的操作的具体实现方式。
如图8所示,商家名称确定装置包括:识别单元801,获取单元802,计算单元803、确定单元804。
识别单元801被配置为对商家的门脸图像中的文字进行文字识别,得到识别结果;
获取单元802被配置为基于所述识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,候选商家名称的多维特征信息包括:所述候选商家名称对应的文字识别准确率、所述候选商家名称对应的相似程度信息、以及所述候选商家名称对应的招牌名称概率信息中的至少一个;
计算单元803被配置为基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度;
确定单元804被配置为基于每一个候选商家名称的置信度,确定所述商家的名称。
在一些实施例中,所述候选商家名称对应的文字识别准确率为所述候选商家名称中的匹配文字的识别正确概率的平均值,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,匹配文字的识别正确概率为所述匹配文字属于正确识别的文字的概率。
在一些实施例中,所述候选商家名称对应的相似程度信息包括:所述候选商家名称中的匹配文字的数量、所述候选商家名称中的匹配文字对的数量、所述候选商家名称对应的第一比值、所述候选商家名称对应的第二比值,其中,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,所述匹配文字对包括所述候选商家名称中的两个相邻的匹配文字,所述第一比值为所述匹配文字的数量除以识别结果的长度的商,所述第二比值为所述匹配文字的数量除以识别结果的长度与所述候选商家名称的长度之和的商。
在一些实施例中,所述候选商家名称对应的招牌名称概率信息包括:所述候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、所述候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、所述候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值,其中,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,最大文字为识别结果中的面积最大的文字。
在一些实施例中,确定单元803进一步被配置为将置信度最高的候选商家名称确定为所述商家的名称。
在一些实施例中,确定单元803进一步被配置为利用商家名称置信度计算模型生成每一个候选商家名称的多维特征信息对应的特征向量,其中,所述候选商家名称的多维特征信息对应的特征向量中的每一个分量分别表示所述候选商家名称的多维特征信息中的一项,商家名称置信度计算模型被预先通过训练样本和训练样本的标注信息训练,所述训练样本包括:多个用于训练的商家名称,所述训练样本的标注信息指示多个用于训练的商家名称中的属于商家的招牌名称或包括商家的招牌名称的商家名称;利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息对应的特征向量,计算每一个候选商家名称的置信度。
在一些实施例中,所述商家名称置信度计算模型为感知机模型,所述感知机模型的输入层的节点数量与参与计算的多维特征信息中的维度数量相同。
本申请还提供了一种服务器,该服务器可以配置有一个或多个处理器;存储器,用于存储一个或多个程序,一个或多个程序中可以包括用以执行上述实施例中描述的操作的指令。当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述实施例中描述的操作的指令。
图9是本申请提供的服务器的一个实施例的结构框图。服务器包括处理组件901,其进一步包括一个或多个处理器,以及由存储器902所代表的存储器资源,用于存储可由处理组件901执行的指令,例如应用程序。存储器902中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件901被配置为执行指令,以执行上述方法。
服务器还可以包括一个电源组件903被配置为执行服务器的电源管理,一个有线或无线网络接口904被配置为将电子设备连接到网络,和一个输入输出(I/O)接口905。服务器可以操作基于存储在存储器902的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本申请还提供了一种计算机可读介质,该计算机可读介质可以是服务器中所包括的;也可以是单独存在,未装配入服务器中。上述计算机可读介质承载有一个或者多个程序,当一个或者多个程序被服务器执行时,使得服务器执行上述实施例中描述的操作。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包括或存储程序的有形介质,该程序可以被消息执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多方面形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由消息执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包括的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包括一个或多个用于实现规定的逻辑功能的可执行消息。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机消息的组合来实现。
以上描述仅为本请求的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术实施例,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术实施例。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术实施例。
Claims (10)
1.一种商家名称确定方法,其特征在于,所述方法包括:
对商家的门脸图像中的文字进行文字识别,得到识别结果;
基于所述识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息;所述候选商家名称的多维特征信息包括:所述候选商家名称对应的文字识别准确率、所述候选商家名称对应的相似程度信息、以及所述候选商家名称对应的招牌名称概率信息中的至少一个;
基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度;以及
基于每一个候选商家名称的置信度,确定所述商家的名称。
2.根据权利要求1所述的商家名称确定方法,其特征在于,所述候选商家名称对应的文字识别准确率为所述候选商家名称中的匹配文字的识别正确概率的平均值,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,匹配文字的识别正确概率为所述匹配文字属于正确识别的文字的概率。
3.根据权利要求1所述的商家名称确定方法,其特征在于,所述候选商家名称对应的相似程度信息包括:所述候选商家名称中的匹配文字的数量、所述候选商家名称中的匹配文字对的数量、所述候选商家名称对应的第一比值、所述候选商家名称对应的第二比值,其中,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,所述匹配文字对包括所述候选商家名称中的两个相邻的匹配文字,所述第一比值为所述匹配文字的数量除以识别结果的长度的商,所述第二比值为所述匹配文字的数量除以识别结果的长度与所述候选商家名称的长度之和的商。
4.根据权利要求1所述的商家名称确定方法,其特征在于,所述候选商家名称对应的招牌名称概率信息包括:所述候选商家名称中的匹配文字的面积与最大文字的面积的比值的平均值、所述候选商家名称中的匹配文字的高度与最大文字的高度的比值的平均值、所述候选商家名称中的匹配文字的宽度与最大文字的宽度的比值的平均值,其中,所述候选商家名称中的匹配文字为所述候选商家名称与识别结果共同包括的文字,最大文字为识别结果中的面积最大的文字。
5.根据权利要求1所述的商家名称确定方法,其特征在于,基于每一个候选商家名称的置信度,确定所述商家的名称包括:
将置信度最高的候选商家名称确定为所述商家的名称。
6.根据权利要求1-5之一所述的商家名称确定方法,其特征在于,基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度包括:
利用商家名称置信度计算模型生成每一个候选商家名称的多维特征信息对应的特征向量,其中,所述候选商家名称的多维特征信息对应的特征向量中的每一个分量分别表示所述候选商家名称的多维特征信息中的一项,商家名称置信度计算模型被预先通过训练样本和训练样本的标注信息训练,所述训练样本包括:多个用于训练的商家名称,所述训练样本的标注信息指示多个用于训练的商家名称中的属于商家的招牌名称或包括商家的招牌名称的商家名称;
利用商家名称置信度计算模型基于每一个候选商家名称的多维特征信息对应的特征向量,计算每一个候选商家名称的置信度。
7.根据权利要求6所述的商家名称确定方法,其特征在于,所述商家名称置信度计算模型为感知机模型,所述感知机模型的输入层的节点数量与参与计算的多维特征信息中的维度数量相同。
8.一种商家名称确定装置,其特征在于,所述装置包括:
识别单元,被配置为对商家的门脸图像中的文字进行文字识别,得到识别结果;
获取单元,被配置为基于所述识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,候选商家名称的多维特征信息包括:所述候选商家名称对应的文字识别准确率、所述候选商家名称与识别结果的相似度、以及所述候选商家名称对应的招牌名称概率信息中的至少一个;
计算单元,被配置为基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度;
确定单元,被配置为基于每一个候选商家名称的置信度,确定所述商家的名称。
9.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的商家名称确定方法。
10.一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如权利要求1至7中任一项所述的商家名称确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010583305.5A CN111860516A (zh) | 2020-06-23 | 2020-06-23 | 商家名称确定方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010583305.5A CN111860516A (zh) | 2020-06-23 | 2020-06-23 | 商家名称确定方法、装置、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111860516A true CN111860516A (zh) | 2020-10-30 |
Family
ID=72989708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010583305.5A Pending CN111860516A (zh) | 2020-06-23 | 2020-06-23 | 商家名称确定方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860516A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381162A (zh) * | 2020-11-19 | 2021-02-19 | 北京百度网讯科技有限公司 | 信息点识别方法、装置及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN103473545A (zh) * | 2013-08-01 | 2013-12-25 | 西安交通大学 | 一种基于多特征的文本图像相似度度量方法 |
CN106611016A (zh) * | 2015-10-27 | 2017-05-03 | 北京航空航天大学 | 一种基于可分解词包模型的图像检索方法 |
CN109635810A (zh) * | 2018-11-07 | 2019-04-16 | 北京三快在线科技有限公司 | 一种确定文本信息的方法、装置、设备及存储介质 |
CN109784330A (zh) * | 2019-01-03 | 2019-05-21 | 北京百度网讯科技有限公司 | 招牌内容识别方法、装置及设备 |
CN110135245A (zh) * | 2019-04-02 | 2019-08-16 | 北京三快在线科技有限公司 | 到店确认方法、装置、电子设备及可读存储介质 |
CN111144402A (zh) * | 2019-11-27 | 2020-05-12 | 深圳壹账通智能科技有限公司 | Ocr识别准确率的计算方法、装置、设备以及存储介质 |
-
2020
- 2020-06-23 CN CN202010583305.5A patent/CN111860516A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN103473545A (zh) * | 2013-08-01 | 2013-12-25 | 西安交通大学 | 一种基于多特征的文本图像相似度度量方法 |
CN106611016A (zh) * | 2015-10-27 | 2017-05-03 | 北京航空航天大学 | 一种基于可分解词包模型的图像检索方法 |
CN109635810A (zh) * | 2018-11-07 | 2019-04-16 | 北京三快在线科技有限公司 | 一种确定文本信息的方法、装置、设备及存储介质 |
CN109784330A (zh) * | 2019-01-03 | 2019-05-21 | 北京百度网讯科技有限公司 | 招牌内容识别方法、装置及设备 |
CN110135245A (zh) * | 2019-04-02 | 2019-08-16 | 北京三快在线科技有限公司 | 到店确认方法、装置、电子设备及可读存储介质 |
CN111144402A (zh) * | 2019-11-27 | 2020-05-12 | 深圳壹账通智能科技有限公司 | Ocr识别准确率的计算方法、装置、设备以及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381162A (zh) * | 2020-11-19 | 2021-02-19 | 北京百度网讯科技有限公司 | 信息点识别方法、装置及电子设备 |
CN112381162B (zh) * | 2020-11-19 | 2024-05-07 | 北京百度网讯科技有限公司 | 信息点识别方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10824916B2 (en) | Weakly supervised learning for classifying images | |
CN109117777B (zh) | 生成信息的方法和装置 | |
US11809393B2 (en) | Image and text data hierarchical classifiers | |
CN108345692B (zh) | 一种自动问答方法和系统 | |
CN106776619B (zh) | 用于确定目标对象的属性信息的方法和装置 | |
WO2019210695A1 (zh) | 模型训练和业务推荐 | |
CN110348362B (zh) | 标签生成、视频处理方法、装置、电子设备及存储介质 | |
CN109492122A (zh) | 商家信息的获取方法、装置、终端及计算机可读存储介质 | |
CN113627508B (zh) | 陈列场景识别方法、装置、设备以及存储介质 | |
CN117115571B (zh) | 一种细粒度智能商品识别方法、装置、设备及介质 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN114898266B (zh) | 训练方法、图像处理方法、装置、电子设备以及存储介质 | |
CN114429633A (zh) | 文本识别方法、模型的训练方法、装置、电子设备及介质 | |
KR101743169B1 (ko) | 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체 | |
CN111860516A (zh) | 商家名称确定方法、装置、服务器及存储介质 | |
CN113537206B (zh) | 推送数据检测方法、装置、计算机设备和存储介质 | |
CN112446214A (zh) | 广告关键词的生成方法、装置、设备及存储介质 | |
CN113920306B (zh) | 目标再识别方法、装置及电子设备 | |
CN115937742A (zh) | 视频场景分割、视觉任务处理方法、装置、设备以及介质 | |
CN113344121B (zh) | 训练招牌分类模型和招牌分类的方法 | |
CN110674388A (zh) | 推送项目的配图方法、装置、存储介质和终端设备 | |
CN114882334A (zh) | 用于生成预训练模型的方法、模型训练方法及装置 | |
CN113779276A (zh) | 用于检测评论的方法和装置 | |
CN112580620A (zh) | 标志图片处理方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |