WO2017107518A1

WO2017107518A1 - Procédé et appareil d'analyse d'un contenu vocal

Info

Publication number: WO2017107518A1
Application number: PCT/CN2016/096186
Authority: WO
Inventors: 周蕾蕾
Original assignee: 乐视控股（北京）有限公司; 乐视致新电子科技（天津）有限公司
Priority date: 2015-12-25
Filing date: 2016-08-22
Publication date: 2017-06-29
Also published as: CN105912521A

Abstract

La présente invention concerne un procédé et un appareil permettant d'analyser un contenu vocal. Le procédé consiste à : produire un premier dictionnaire de segmentation en mots par combinaison d'un groupe de mots, dans un champ spécifié, à un groupe de mots dans un champ non spécifié et effectuer une segmentation en mots sur un corpus mémorisé dans une machine en fonction du premier dictionnaire de segmentation en mots afin d'obtenir un groupe de mots dans le corpus (11) ; réaliser des statistiques, dans le corpus, sur la probabilité ou la fréquence d'apparition de chaque groupe de mots dans le groupe de mots du corpus et ajuster la probabilité ou la fréquence en fonction d'une règle prédéfinie, de sorte que la probabilité ou la fréquence d'apparition du groupe de mots dans le champ spécifié dans le groupe de mots dans le corpus augmente (12) ; produire un second dictionnaire de segmentation en mots par combinaison du groupe de mots dans le corpus à la probabilité ou fréquence ajustée et effectuer une segmentation en mots sur un contenu vocal envoyé par un utilisateur en fonction du second dictionnaire de segmentation en mots afin d'obtenir un groupe de mots dans le contenu vocal (13) ; et analyser le groupe de mots dans le contenu vocal en fonction d'un fichier de grammaire afin d'obtenir un sémantème (14) correspondant. Grâce au procédé, la probabilité d'apparition d'un groupe de mots dans un champ spécifié de tous les groupes de mots dans une machine augmente, ce qui améliore le taux de précision de l'analyse par la machine d'un sémantème d'un contenu vocal.