WO2020082562A1 - Procédé, appareil, dispositif et support de mémoire d'identification de symbole - Google Patents
Procédé, appareil, dispositif et support de mémoire d'identification de symbole Download PDFInfo
- Publication number
- WO2020082562A1 WO2020082562A1 PCT/CN2018/122832 CN2018122832W WO2020082562A1 WO 2020082562 A1 WO2020082562 A1 WO 2020082562A1 CN 2018122832 W CN2018122832 W CN 2018122832W WO 2020082562 A1 WO2020082562 A1 WO 2020082562A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- preset
- character
- dictionary
- target
- word segmentation
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
L'invention concerne un procédé, un appareil, un dispositif et un support de mémoire d'identification de symbole basés sur le traitement de données volumineuses, le procédé comprenant les étapes consistant à : acquérir un texte à identifier (S10) ; appeler un outil de segmentation de mot pré-stocké à partir d'une première zone prédéfinie de telle sorte que l'outil de segmentation de mot divise le texte à identifier en une pluralité de symboles de référence de longueur prédéfinie (S20) ; selon une longueur cible pour les symboles de référence, rechercher un dictionnaire prédéfini correspondant dans une seconde zone prédéfinie et déterminer si les symboles de référence sont présents dans le dictionnaire prédéfini (S30) ; et lorsque les symboles de référence ne sont pas présents dans le dictionnaire prédéfini, filtrer un symbole cible à partir des symboles de référence qui ne sont pas présents au moyen d'un algorithme de correspondance floue (S40).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811254944.6A CN109657738B (zh) | 2018-10-25 | 2018-10-25 | 字符识别方法、装置、设备及存储介质 |
CN201811254944.6 | 2018-10-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020082562A1 true WO2020082562A1 (fr) | 2020-04-30 |
Family
ID=66110077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2018/122832 WO2020082562A1 (fr) | 2018-10-25 | 2018-12-21 | Procédé, appareil, dispositif et support de mémoire d'identification de symbole |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109657738B (fr) |
WO (1) | WO2020082562A1 (fr) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582169A (zh) * | 2020-05-08 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 图像识别数据纠错方法、装置、计算机设备和存储介质 |
CN111897958A (zh) * | 2020-07-16 | 2020-11-06 | 邓桦 | 基于自然语言处理的古诗词分类方法 |
CN112347765A (zh) * | 2020-10-10 | 2021-02-09 | 清华大学 | 基于词典匹配的实体标注方法、模块及装置 |
CN112667831A (zh) * | 2020-12-25 | 2021-04-16 | 上海硬通网络科技有限公司 | 素材存储方法、装置及电子设备 |
CN113408270A (zh) * | 2021-06-10 | 2021-09-17 | 广州三七极创网络科技有限公司 | 变体文本的识别方法、装置及电子设备 |
CN113420564A (zh) * | 2021-06-21 | 2021-09-21 | 国网山东省电力公司物资公司 | 一种基于混合匹配的电力铭牌语义结构化方法及系统 |
CN113625884A (zh) * | 2020-05-07 | 2021-11-09 | 顺丰科技有限公司 | 一种输入词推荐方法、装置、服务器及存储介质 |
CN113761913A (zh) * | 2021-08-23 | 2021-12-07 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN113988068A (zh) * | 2021-12-29 | 2022-01-28 | 深圳前海硬之城信息技术有限公司 | Bom文本的分词方法、装置、设备及存储介质 |
CN114386407A (zh) * | 2021-12-23 | 2022-04-22 | 北京金堤科技有限公司 | 文本的分词方法及装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633660B (zh) * | 2019-08-30 | 2022-05-31 | 盈盛智创科技(广州)有限公司 | 一种文档识别的方法、设备和存储介质 |
CN110738202A (zh) * | 2019-09-06 | 2020-01-31 | 平安科技(深圳)有限公司 | 字符识别方法、装置及计算机可读存储介质 |
CN111241365B (zh) * | 2019-12-23 | 2023-06-30 | 望海康信(北京)科技股份公司 | 表格图片解析方法及系统 |
CN111860657A (zh) * | 2020-07-23 | 2020-10-30 | 中国建设银行股份有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
CN112560791B (zh) * | 2020-12-28 | 2022-08-09 | 苏州科达科技股份有限公司 | 识别模型的训练方法、识别方法、装置及电子设备 |
CN112949446B (zh) * | 2021-02-25 | 2023-04-18 | 山东英信计算机技术有限公司 | 一种物体识别方法、装置、设备及介质 |
CN113743102B (zh) * | 2021-08-18 | 2023-09-01 | 百度在线网络技术(北京)有限公司 | 识别字符的方法、装置以及电子设备 |
CN116580402A (zh) * | 2023-05-26 | 2023-08-11 | 读书郎教育科技有限公司 | 一种词典笔的文本识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991889A (zh) * | 2015-06-26 | 2015-10-21 | 江苏科技大学 | 一种基于模糊分词的非多字词错误自动校对方法 |
CN105068994A (zh) * | 2015-08-13 | 2015-11-18 | 易保互联医疗信息科技(北京)有限公司 | 一种药品信息的自然语言处理方法及系统 |
CN107622044A (zh) * | 2016-07-13 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 字符串的分词方法、装置及设备 |
CN108304484A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 关键词匹配方法及装置、电子设备和可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100476800C (zh) * | 2007-06-22 | 2009-04-08 | 腾讯科技(深圳)有限公司 | 一种切分索引分词的方法及系统 |
JP5716328B2 (ja) * | 2010-09-14 | 2015-05-13 | 株式会社リコー | 情報処理装置、情報処理方法、および情報処理プログラム |
-
2018
- 2018-10-25 CN CN201811254944.6A patent/CN109657738B/zh active Active
- 2018-12-21 WO PCT/CN2018/122832 patent/WO2020082562A1/fr active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991889A (zh) * | 2015-06-26 | 2015-10-21 | 江苏科技大学 | 一种基于模糊分词的非多字词错误自动校对方法 |
CN105068994A (zh) * | 2015-08-13 | 2015-11-18 | 易保互联医疗信息科技(北京)有限公司 | 一种药品信息的自然语言处理方法及系统 |
CN107622044A (zh) * | 2016-07-13 | 2018-01-23 | 阿里巴巴集团控股有限公司 | 字符串的分词方法、装置及设备 |
CN108304484A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 关键词匹配方法及装置、电子设备和可读存储介质 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113625884A (zh) * | 2020-05-07 | 2021-11-09 | 顺丰科技有限公司 | 一种输入词推荐方法、装置、服务器及存储介质 |
CN111582169A (zh) * | 2020-05-08 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 图像识别数据纠错方法、装置、计算机设备和存储介质 |
CN111582169B (zh) * | 2020-05-08 | 2023-10-10 | 腾讯科技(深圳)有限公司 | 图像识别数据纠错方法、装置、计算机设备和存储介质 |
CN111897958A (zh) * | 2020-07-16 | 2020-11-06 | 邓桦 | 基于自然语言处理的古诗词分类方法 |
CN111897958B (zh) * | 2020-07-16 | 2024-03-12 | 邓桦 | 基于自然语言处理的古诗词分类方法 |
CN112347765B (zh) * | 2020-10-10 | 2022-06-07 | 清华大学 | 基于词典匹配的实体标注方法、模块及装置 |
CN112347765A (zh) * | 2020-10-10 | 2021-02-09 | 清华大学 | 基于词典匹配的实体标注方法、模块及装置 |
CN112667831A (zh) * | 2020-12-25 | 2021-04-16 | 上海硬通网络科技有限公司 | 素材存储方法、装置及电子设备 |
CN113408270A (zh) * | 2021-06-10 | 2021-09-17 | 广州三七极创网络科技有限公司 | 变体文本的识别方法、装置及电子设备 |
CN113420564B (zh) * | 2021-06-21 | 2022-11-22 | 国网山东省电力公司物资公司 | 一种基于混合匹配的电力铭牌语义结构化方法及系统 |
CN113420564A (zh) * | 2021-06-21 | 2021-09-21 | 国网山东省电力公司物资公司 | 一种基于混合匹配的电力铭牌语义结构化方法及系统 |
CN113761913A (zh) * | 2021-08-23 | 2021-12-07 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN113761913B (zh) * | 2021-08-23 | 2024-02-23 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN114386407A (zh) * | 2021-12-23 | 2022-04-22 | 北京金堤科技有限公司 | 文本的分词方法及装置 |
CN113988068A (zh) * | 2021-12-29 | 2022-01-28 | 深圳前海硬之城信息技术有限公司 | Bom文本的分词方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109657738B (zh) | 2024-04-30 |
CN109657738A (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020082562A1 (fr) | Procédé, appareil, dispositif et support de mémoire d'identification de symbole | |
WO2020015067A1 (fr) | Procédé d'acquisition de données, dispositif, équipement et support de stockage | |
US7933453B2 (en) | System and method for capturing and processing business data | |
WO2020119116A1 (fr) | Procédé, appareil et dispositif de vérification d'assurance médicale basés sur l'analyse de données et support de stockage | |
WO2011021907A2 (fr) | Système d'ajout de métadonnées, procédé et dispositif de recherche d'image, et procédé d'ajout de geste associé | |
WO2020233089A1 (fr) | Procédé et appareil de création de jeu de test, terminal et support de stockage lisible par ordinateur | |
WO2020073495A1 (fr) | Procédé, appareil et dispositif de réexamen basés sur l'intelligence artificielle, et support d'informations | |
WO2020186777A1 (fr) | Procédé, appareil et dispositif de récupération d'image et support de stockage lisible par ordinateur | |
WO2021051558A1 (fr) | Procédé et appareil de questions et réponses basées sur un graphe de connaissances et support de stockage | |
WO2020251233A1 (fr) | Procédé, appareil et programme d'obtention de caractéristiques abstraites de données d'image | |
WO2021012489A1 (fr) | Procédé d'interrogation de journal de plateforme téléphonique, dispositif terminal, support de stockage et appareil | |
WO2010123168A1 (fr) | Procédé et système de gestion de base de données | |
WO2016099019A1 (fr) | Système et procédé de classification de documents de brevet | |
WO2020087704A1 (fr) | Procédé, appareil et dispositif de gestion d'informations de crédit et support d'enregistrement | |
WO2019024485A1 (fr) | Procédé et dispositif de partage de données, et support de stockage lisible par ordinateur | |
EP2435935A2 (fr) | Procédé de fourniture d'une carte de brevets par point de vue et système associé | |
WO2021215620A1 (fr) | Dispositif et procédé pour générer automatiquement un sous-titre d'image spécifique au domaine à l'aide d'une ontologie sémantique | |
WO2020082766A1 (fr) | Procédé et appareil d'association pour un procédé d'entrée, dispositif et support d'informations lisible | |
WO2021051557A1 (fr) | Procédé et appareil de détermination de mot-clé basé sur une reconnaissance sémantique et support de stockage | |
WO2021012490A1 (fr) | Procédé et appareil de commutation de relais de service, dispositif terminal, et support d'informations | |
WO2020085558A1 (fr) | Appareil de traitement d'image d'analyse à grande vitesse et procédé de commande associé | |
WO2018086371A1 (fr) | Ordinateur portable, terminal intelligent et procédé de création d'index de contenu pour ordinateur portable | |
WO2016088954A1 (fr) | Procédé de classement de spams, support d'enregistrement destiné à le mettre en œuvre et dispositif de classement de spams | |
WO2014148784A1 (fr) | Base de données de modèles linguistiques pour la reconnaissance linguistique, dispositif et procédé et système de reconnaissance linguistique | |
WO2020253113A1 (fr) | Procédé, dispositif et appareil d'enregistrement de factures et support de stockage informatique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18937751 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 18937751 Country of ref document: EP Kind code of ref document: A1 |