WO2022116436A1

WO2022116436A1 - Procédé et appareil d'appariement sémantique de texte pour des phrases longues et courtes, dispositif informatique et support de stockage

Info

Publication number: WO2022116436A1
Application number: PCT/CN2021/083780
Authority: WO
Inventors: 谢静文; 阮晓雯; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-12-01
Filing date: 2021-03-30
Publication date: 2022-06-09
Also published as: CN112446218A

Abstract

L'invention concerne un procédé et un appareil d'appariement sémantique de texte pour des phrases longues et courtes, un dispositif informatique et un support de stockage. Le procédé comprend les étapes suivantes : obtention d'une phrase à apparier et d'une phrase échantillon cible, et comparaison de la longueur des caractères à apparier correspondant à la phrase avec la longueur des caractères de l'échantillon cible correspondant à la phrase échantillon cible (S10) ; lorsque la longueur des caractères est inférieure à la longueur des caractères de l'échantillon cible, enregistrement de la longueur des caractères en tant que longueur de fenêtre d'une fenêtre coulissante (S20) ; coulissement de la fenêtre coulissante sur la phrase d'échantillon cible, appariement d'un champ d'échantillon cible de la phrase échantillon cible couverte par la fenêtre coulissante avec la phrase afin d'obtenir un premier résultat de distance sémantique (S30) ; détermination d'un premier score sémantique entre la phrase et la phrase d'échantillon cible selon le premier résultat de distance sémantique correspondant à la phrase et à la phrase échantillon cible (S40) ; lorsque le premier score sémantique dépasse un seuil de score prédéfini, enregistrement de la phrase échantillon cible en tant que phrase d'appariement sémantique correspondant à la phrase (S50). Le procédé améliore la précision d'appariement sémantique entre des phrases longues et courtes.