WO2022121171A1

WO2022121171A1 - Procédé et appareil de mise en correspondance de textes similaires, ainsi que dispositif électronique et support de stockage informatique

Info

Publication number: WO2022121171A1
Application number: PCT/CN2021/083714
Authority: WO
Inventors: 谢静文; 阮晓雯; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-12-10
Filing date: 2021-03-30
Publication date: 2022-06-16
Also published as: CN112541338A

Abstract

La présente invention concerne un procédé de mise en correspondance de textes similaires, comprenant les étapes consistant à : acquérir un texte standard, effectuer une extraction de mots caractéristiques sur le texte standard acquis, et construire une représentation sémantique standard selon un résultat d'extraction ; générer une table de paires de valeurs clés standard selon un mot caractéristique standard et la représentation sémantique standard (S3) ; effectuer une extraction de mots caractéristiques sur un texte cible acquis, et construire une représentation sémantique cible ; calculer la similarité entre un mot caractéristique cible et le mot caractéristique standard, et cribler, selon la similarité, une représentation sémantique à mettre en correspondance ; effectuer une mise en correspondance de représentations sur la représentation sémantique à mettre en correspondance et la représentation sémantique standard, de façon à obtenir une probabilité de mise en correspondance ; et déterminer le texte standard correspondant à la représentation sémantique standard, dont la probabilité de mise en correspondance est supérieure à une valeur seuil de probabilité prédéfinie, comme étant un texte similaire au texte cible (S7). En outre, la présente invention concerne également la technologie des chaînes de blocs. Le texte standard peut être stocké dans un nœud d'une chaîne de blocs. La présente invention concerne en outre un appareil de mise en correspondance de textes similaires, un dispositif électronique et un support de stockage lisible par ordinateur. Au moyen de la présente demande, le problème de la précision relativement faible de la mise en correspondance de textes similaires peut être résolu.