WO2020192009A1

WO2020192009A1 - Procédé de détection de silence reposant sur un réseau neuronal, et dispositif terminal et support

Info

Publication number: WO2020192009A1
Application number: PCT/CN2019/103149
Authority: WO
Inventors: 房树明; 程宁; 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-03-25
Filing date: 2019-08-29
Publication date: 2020-10-01
Also published as: CN110010153A

Abstract

L'invention concerne un procédé de détection de silence reposant sur un réseau neuronal, et un dispositif terminal et un support de stockage non volatil lisible par ordinateur, appartenant au domaine technique de l'intelligence artificielle. Le procédé consiste à : échantillonner, sur la base d'une fréquence d'échantillonnage préréglée, un signal audio d'origine à détecter, de façon à obtenir un signal d'échantillonnage correspondant au signal audio d'origine (S1); effectuer un traitement de division en trames sur le signal d'échantillonnage sur la base d'une longueur de champ récepteur préréglée de façon à obtenir au moins deux trames de sous-séquences audio (S2); introduire les sous-séquences audio dans un modèle de détection de silence pré-entraîné de façon à obtenir des valeurs de caractéristiques des sous-séquences audio, le modèle de détection de silence étant un modèle de réseau neuronal convolutif unidimensionnel, les valeurs de caractéristiques des sous-séquences audio étant utilisées pour représenter les probabilités que des segments audio correspondant aux sous-séquences audio soient des signaux de parole, et les valeurs de caractéristiques étant des valeurs unidimensionnelles (S3); et si les valeurs de caractéristiques des sous-séquences audio sont supérieures ou égales à un seuil de valeur de caractéristique préréglé, déterminer que les segments audio correspondant aux sous-séquences audio sont des signaux de parole (S4). Par conséquent, l'efficacité et la précision de la détection de silence sont améliorées.