WO2020082562A1 - Procédé, appareil, dispositif et support de mémoire d'identification de symbole - Google Patents

Procédé, appareil, dispositif et support de mémoire d'identification de symbole Download PDF

Info

Publication number
WO2020082562A1
WO2020082562A1 PCT/CN2018/122832 CN2018122832W WO2020082562A1 WO 2020082562 A1 WO2020082562 A1 WO 2020082562A1 CN 2018122832 W CN2018122832 W CN 2018122832W WO 2020082562 A1 WO2020082562 A1 WO 2020082562A1
Authority
WO
WIPO (PCT)
Prior art keywords
preset
character
dictionary
target
word segmentation
Prior art date
Application number
PCT/CN2018/122832
Other languages
English (en)
Chinese (zh)
Inventor
周罡
王彬
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020082562A1 publication Critical patent/WO2020082562A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

L'invention concerne un procédé, un appareil, un dispositif et un support de mémoire d'identification de symbole basés sur le traitement de données volumineuses, le procédé comprenant les étapes consistant à : acquérir un texte à identifier (S10) ; appeler un outil de segmentation de mot pré-stocké à partir d'une première zone prédéfinie de telle sorte que l'outil de segmentation de mot divise le texte à identifier en une pluralité de symboles de référence de longueur prédéfinie (S20) ; selon une longueur cible pour les symboles de référence, rechercher un dictionnaire prédéfini correspondant dans une seconde zone prédéfinie et déterminer si les symboles de référence sont présents dans le dictionnaire prédéfini (S30) ; et lorsque les symboles de référence ne sont pas présents dans le dictionnaire prédéfini, filtrer un symbole cible à partir des symboles de référence qui ne sont pas présents au moyen d'un algorithme de correspondance floue (S40).
PCT/CN2018/122832 2018-10-25 2018-12-21 Procédé, appareil, dispositif et support de mémoire d'identification de symbole WO2020082562A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811254944.6A CN109657738B (zh) 2018-10-25 2018-10-25 字符识别方法、装置、设备及存储介质
CN201811254944.6 2018-10-25

Publications (1)

Publication Number Publication Date
WO2020082562A1 true WO2020082562A1 (fr) 2020-04-30

Family

ID=66110077

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/122832 WO2020082562A1 (fr) 2018-10-25 2018-12-21 Procédé, appareil, dispositif et support de mémoire d'identification de symbole

Country Status (2)

Country Link
CN (1) CN109657738B (fr)
WO (1) WO2020082562A1 (fr)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582169A (zh) * 2020-05-08 2020-08-25 腾讯科技(深圳)有限公司 图像识别数据纠错方法、装置、计算机设备和存储介质
CN111897958A (zh) * 2020-07-16 2020-11-06 邓桦 基于自然语言处理的古诗词分类方法
CN112347765A (zh) * 2020-10-10 2021-02-09 清华大学 基于词典匹配的实体标注方法、模块及装置
CN112667831A (zh) * 2020-12-25 2021-04-16 上海硬通网络科技有限公司 素材存储方法、装置及电子设备
CN113408270A (zh) * 2021-06-10 2021-09-17 广州三七极创网络科技有限公司 变体文本的识别方法、装置及电子设备
CN113420564A (zh) * 2021-06-21 2021-09-21 国网山东省电力公司物资公司 一种基于混合匹配的电力铭牌语义结构化方法及系统
CN113625884A (zh) * 2020-05-07 2021-11-09 顺丰科技有限公司 一种输入词推荐方法、装置、服务器及存储介质
CN113761913A (zh) * 2021-08-23 2021-12-07 南京优飞保科信息技术有限公司 一种话术文本的处理方法和系统
CN113988068A (zh) * 2021-12-29 2022-01-28 深圳前海硬之城信息技术有限公司 Bom文本的分词方法、装置、设备及存储介质
CN114386407A (zh) * 2021-12-23 2022-04-22 北京金堤科技有限公司 文本的分词方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633660B (zh) * 2019-08-30 2022-05-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质
CN110738202A (zh) * 2019-09-06 2020-01-31 平安科技(深圳)有限公司 字符识别方法、装置及计算机可读存储介质
CN111241365B (zh) * 2019-12-23 2023-06-30 望海康信(北京)科技股份公司 表格图片解析方法及系统
CN111860657A (zh) * 2020-07-23 2020-10-30 中国建设银行股份有限公司 一种图像分类方法、装置、电子设备及存储介质
CN112560791B (zh) * 2020-12-28 2022-08-09 苏州科达科技股份有限公司 识别模型的训练方法、识别方法、装置及电子设备
CN112949446B (zh) * 2021-02-25 2023-04-18 山东英信计算机技术有限公司 一种物体识别方法、装置、设备及介质
CN113743102B (zh) * 2021-08-18 2023-09-01 百度在线网络技术(北京)有限公司 识别字符的方法、装置以及电子设备
CN116580402A (zh) * 2023-05-26 2023-08-11 读书郎教育科技有限公司 一种词典笔的文本识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991889A (zh) * 2015-06-26 2015-10-21 江苏科技大学 一种基于模糊分词的非多字词错误自动校对方法
CN105068994A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN107622044A (zh) * 2016-07-13 2018-01-23 阿里巴巴集团控股有限公司 字符串的分词方法、装置及设备
CN108304484A (zh) * 2017-12-29 2018-07-20 北京城市网邻信息技术有限公司 关键词匹配方法及装置、电子设备和可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100476800C (zh) * 2007-06-22 2009-04-08 腾讯科技(深圳)有限公司 一种切分索引分词的方法及系统
JP5716328B2 (ja) * 2010-09-14 2015-05-13 株式会社リコー 情報処理装置、情報処理方法、および情報処理プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991889A (zh) * 2015-06-26 2015-10-21 江苏科技大学 一种基于模糊分词的非多字词错误自动校对方法
CN105068994A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN107622044A (zh) * 2016-07-13 2018-01-23 阿里巴巴集团控股有限公司 字符串的分词方法、装置及设备
CN108304484A (zh) * 2017-12-29 2018-07-20 北京城市网邻信息技术有限公司 关键词匹配方法及装置、电子设备和可读存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113625884A (zh) * 2020-05-07 2021-11-09 顺丰科技有限公司 一种输入词推荐方法、装置、服务器及存储介质
CN111582169A (zh) * 2020-05-08 2020-08-25 腾讯科技(深圳)有限公司 图像识别数据纠错方法、装置、计算机设备和存储介质
CN111582169B (zh) * 2020-05-08 2023-10-10 腾讯科技(深圳)有限公司 图像识别数据纠错方法、装置、计算机设备和存储介质
CN111897958A (zh) * 2020-07-16 2020-11-06 邓桦 基于自然语言处理的古诗词分类方法
CN111897958B (zh) * 2020-07-16 2024-03-12 邓桦 基于自然语言处理的古诗词分类方法
CN112347765B (zh) * 2020-10-10 2022-06-07 清华大学 基于词典匹配的实体标注方法、模块及装置
CN112347765A (zh) * 2020-10-10 2021-02-09 清华大学 基于词典匹配的实体标注方法、模块及装置
CN112667831A (zh) * 2020-12-25 2021-04-16 上海硬通网络科技有限公司 素材存储方法、装置及电子设备
CN113408270A (zh) * 2021-06-10 2021-09-17 广州三七极创网络科技有限公司 变体文本的识别方法、装置及电子设备
CN113420564B (zh) * 2021-06-21 2022-11-22 国网山东省电力公司物资公司 一种基于混合匹配的电力铭牌语义结构化方法及系统
CN113420564A (zh) * 2021-06-21 2021-09-21 国网山东省电力公司物资公司 一种基于混合匹配的电力铭牌语义结构化方法及系统
CN113761913A (zh) * 2021-08-23 2021-12-07 南京优飞保科信息技术有限公司 一种话术文本的处理方法和系统
CN113761913B (zh) * 2021-08-23 2024-02-23 南京优飞保科信息技术有限公司 一种话术文本的处理方法和系统
CN114386407A (zh) * 2021-12-23 2022-04-22 北京金堤科技有限公司 文本的分词方法及装置
CN113988068A (zh) * 2021-12-29 2022-01-28 深圳前海硬之城信息技术有限公司 Bom文本的分词方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109657738B (zh) 2024-04-30
CN109657738A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
WO2020082562A1 (fr) Procédé, appareil, dispositif et support de mémoire d'identification de symbole
WO2020015067A1 (fr) Procédé d'acquisition de données, dispositif, équipement et support de stockage
US7933453B2 (en) System and method for capturing and processing business data
WO2020119116A1 (fr) Procédé, appareil et dispositif de vérification d'assurance médicale basés sur l'analyse de données et support de stockage
WO2011021907A2 (fr) Système d'ajout de métadonnées, procédé et dispositif de recherche d'image, et procédé d'ajout de geste associé
WO2020233089A1 (fr) Procédé et appareil de création de jeu de test, terminal et support de stockage lisible par ordinateur
WO2020073495A1 (fr) Procédé, appareil et dispositif de réexamen basés sur l'intelligence artificielle, et support d'informations
WO2020186777A1 (fr) Procédé, appareil et dispositif de récupération d'image et support de stockage lisible par ordinateur
WO2021051558A1 (fr) Procédé et appareil de questions et réponses basées sur un graphe de connaissances et support de stockage
WO2020251233A1 (fr) Procédé, appareil et programme d'obtention de caractéristiques abstraites de données d'image
WO2021012489A1 (fr) Procédé d'interrogation de journal de plateforme téléphonique, dispositif terminal, support de stockage et appareil
WO2010123168A1 (fr) Procédé et système de gestion de base de données
WO2016099019A1 (fr) Système et procédé de classification de documents de brevet
WO2020087704A1 (fr) Procédé, appareil et dispositif de gestion d'informations de crédit et support d'enregistrement
WO2019024485A1 (fr) Procédé et dispositif de partage de données, et support de stockage lisible par ordinateur
EP2435935A2 (fr) Procédé de fourniture d'une carte de brevets par point de vue et système associé
WO2021215620A1 (fr) Dispositif et procédé pour générer automatiquement un sous-titre d'image spécifique au domaine à l'aide d'une ontologie sémantique
WO2020082766A1 (fr) Procédé et appareil d'association pour un procédé d'entrée, dispositif et support d'informations lisible
WO2021051557A1 (fr) Procédé et appareil de détermination de mot-clé basé sur une reconnaissance sémantique et support de stockage
WO2021012490A1 (fr) Procédé et appareil de commutation de relais de service, dispositif terminal, et support d'informations
WO2020085558A1 (fr) Appareil de traitement d'image d'analyse à grande vitesse et procédé de commande associé
WO2018086371A1 (fr) Ordinateur portable, terminal intelligent et procédé de création d'index de contenu pour ordinateur portable
WO2016088954A1 (fr) Procédé de classement de spams, support d'enregistrement destiné à le mettre en œuvre et dispositif de classement de spams
WO2014148784A1 (fr) Base de données de modèles linguistiques pour la reconnaissance linguistique, dispositif et procédé et système de reconnaissance linguistique
WO2020253113A1 (fr) Procédé, dispositif et appareil d'enregistrement de factures et support de stockage informatique

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18937751

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18937751

Country of ref document: EP

Kind code of ref document: A1