WO2021179470A1

WO2021179470A1 - Procédé, dispositif et système de reconnaissance d'une vitesse d'échantillonnage de données vocales pures

Info

Publication number: WO2021179470A1
Application number: PCT/CN2020/097008
Authority: WO
Inventors: 刘兵兵; 包飞; 吴科苇; 刘如意; 车洋
Original assignee: 苏宁易购集团股份有限公司; 苏宁云计算有限公司
Priority date: 2020-03-10
Filing date: 2020-06-19
Publication date: 2021-09-16
Also published as: CN111354365B; CA3175103A1; CN111354365A

Abstract

Les modes de réalisation de la présente invention concernent un procédé, un dispositif et un système permettant de reconnaître une vitesse d'échantillonnage de données vocales pures. Le procédé consiste : à exécuter une transformée de Fourier sur des données vocales pures pour obtenir des données d'un domaine fréquentiel ; selon les données de seuil antérieures reçues, à traiter les données du domaine fréquentiel pour obtenir des informations de bande de fréquence ; à acquérir un point de fréquence de coupure haute fréquence des informations de bande de fréquence, et à calculer, selon des vitesses d'échantillonnage différentes prédéfinies, des fréquences hypothétiques correspondant au point de fréquence de coupure haute fréquence ; à comparer les différentes fréquences hypothétiques avec une fréquence précédente, et à déterminer la vitesse d'échantillonnage correspondant à la fréquence hypothétique lorsque le résultat de la comparaison est le plus similaire à la vitesse d'échantillonnage réelle. Dans la présente invention, en fonction de la caractéristique antérieure de la plage de largeur de bande dans le domaine fréquentiel d'une voix émise par un individu qui est comprise entre 200 Hz et 4000 Hz, différentes fréquences hypothétiques de données vocales pures sont comparées, et la vitesse d'échantillonnage réelle peut être déterminée en fonction de la valeur de la similarité du résultat de la comparaison. Ainsi, l'amplitude de la vitesse d'échantillonnage des données vocales pures peut être automatiquement prédite, ce qui permet d'éviter des problèmes tels que les effets considérables produits sur un traitement vocal lorsque la vitesse d'échantillonnage est inconnue.