FR3074391A1

FR3074391A1 - Procede de controle parental par reconnaissance vocale dans un decodeur de television numerique, dispositif, produit programme d'ordinateur et support d'enregistrement associes

Info

Publication number: FR3074391A1
Application number: FR1761470A
Authority: FR
Inventors: Laurent Herrmann; Julien Sebire
Original assignee: Sagemcom Broadband SAS
Current assignee: Sagemcom Broadband SAS
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2019-05-31

Abstract

Un aspect de l'invention concerne un procédé (100) de contrôle parental par reconnaissance vocale dans un décodeur de télévision numérique, le procédé (100) comportant les étapes suivantes : i) le décodeur détecte (101) une métadonnée d'un programme relative à une classe d'âge du programme et extrait (102) la classe d'âge du programme, bloque (103) un affichage du programme et affiche (104) sur un écran de télévision numérique une demande de production vocale par un utilisateur ; ii) un microphone capture (105) un environnement sonore sous forme d'un signal et transmet (106) le signal capturé au décodeur ; iii) le décodeur enregistre (107) le signal transmis, analyse (108) le signal enregistré et débloque (109) l'affichage du programme sur l'écran de télévision numérique en fonction de l'analyse du signal transmis.

Description

PROCEDE DE CONTROLE PARENTAL PAR RECONNAISSANCE VOCALE DANS UN DECODEUR DE TELEVISION NUMERIQUE, DISPOSITIF, PRODUIT PROGRAMME D’ORDINATEUR ET SUPPORT D’ENREGISTREMENT ASSOCIES

DOMAINE TECHNIQUE DE L’INVENTION

Le domaine technique de l’invention est celui du contrôle parental des programmes de télévision. La présente invention concerne un procédé de contrôle parental par reconnaissance vocale dans un décodeur de télévision numérique ainsi qu’un dispositif, un produit programme d’ordinateur et un support d’enregistrement associés.

ARRIERE-PLAN TECHNOLOGIQUE DE L’INVENTION

La nécessité de protéger les enfants et les adolescents de la violence, notamment celle diffusée par la télévision, a fait l’objet de dispositions particulières en France dès les années 1970. La signalétique mise en place depuis novembre 2002 par le CSA (conseil supérieur de l’audiovisuel) comporte par exemple des indications d’âge : « -10 >>, « -12 >>, « -16 », « -18 >>. Ces indications s’affichent dans un coin de l’écran durant toute la diffusion des programmes auxquels elles sont associées. Des horaires de diffusion sont affectés à chaque catégorie de programmes de manière à limiter la présence des publics à protéger.

Dans le cadre du contrôle parental, il est par ailleurs connu de bloquer l’accès à certains contenus ou chaînes de télévision tant qu’un code de déblocage, généralement composé de quatre chiffres, n’est pas correctement saisi via une interface qui est typiquement le clavier de la télécommande de la télévision ou du décodeur. Cette technique s’avère toutefois peu sécurisée car des enfants peuvent obtenir et mémoriser le code de déblocage à l’insu de leurs parents.

RESUME DE L’INVENTION

La présente invention a pour objet de remédier à tout ou partie des problèmes évoqués ci-dessus en permettant de réaliser un contrôle parental des programmes de télévision plus sécurisé que dans l’état de la technique.

Un premier aspect de l’invention concerne un procédé de contrôle parental par reconnaissance vocale dans un décodeur de télévision numérique, le procédé comportant les étapes suivantes :

i) le décodeur détecte une métadonnée d’un programme relative à une classe d’âge du programme et extrait la classe d’âge du programme, bloque un affichage du programme et affiche sur un écran de télévision numérique une demande de production vocale par un utilisateur ;

ii) un microphone capture un environnement sonore sous forme d’un signal et transmet le signal capturé au décodeur ;

iii) le décodeur enregistre le signal transmis, analyse le signal enregistré et débloque l’affichage du programme sur l’écran de télévision numérique en fonction de l’analyse du signal enregistré.

Grâce à l’invention, le décodeur de télévision numérique contrôle l’affichage de programmes soumis à une restriction d’âge en fonction d’une analyse d’un signal sonore propre à l’utilisateur souhaitant afficher lesdits programmes et non plus en fonction d’un code à saisir via une interface de type télécommande.

Outre les caractéristiques qui viennent d’être évoquées dans le paragraphe précédent, le procédé de contrôle parental selon le premier aspect de l’invention peut présenter une ou plusieurs caractéristiques complémentaires parmi les suivantes, considérées individuellement ou selon toutes les combinaisons techniquement possibles.

Selon un premier mode de réalisation, dans l’étape iii), le décodeur enregistre le signal transmis, calcule la fréquence fondamentale du signal enregistré, calcule une classe d’âge d’un utilisateur en fonction de la fréquence fondamentale calculée, compare la classe d’âge calculée de l’utilisateur à la classe d’âge du programme et débloque l’affichage du programme sur l’écran de télévision numérique si la classe d’âge calculée de l’utilisateur est supérieure ou égale à la classe d’âge du programme. Ainsi l’analyse du signal sonore réalisée par le décodeur de télévision numérique lui permet avantageusement d’attribuer une classe d’âge à l’utilisateur, et non d’identifier de manière unique cet utilisateur.

Selon un deuxième mode de réalisation de l’invention :

- dans l’étape i), la demande de production vocale affichée sur l’écran de télévision numérique comporte un mot ou groupe de mots à dire par l’utilisateur, le mot ou groupe de mots étant défini par le décodeur ;

- dans l’étape iii), le décodeur enregistre le signal transmis, détermine si le signal enregistré correspond au mot ou groupe de mots défini par le décodeur et si oui, calcule la fréquence fondamentale du signal enregistré, calcule une classe d’âge d’un utilisateur en fonction de la fréquence fondamentale calculée, compare la classe d’âge calculée de l’utilisateur à la classe d’âge du programme et débloque l’affichage du programme sur l’écran de télévision numérique si la classe d’âge calculée de l’utilisateur est supérieure ou égale à la classe d’âge du programme.

La production vocale demandée à l’utilisateur est ainsi précisée par le décodeur au moyen d’un mot ou groupe de mots affiché sur l’écran de télévision numérique et à dire par l’utilisateur, par opposition à une prise de parole libre. Dans son analyse du signal sonore, le décodeur de télévision numérique commence par vérifier que l’utilisateur a bien respecté la condition imposée sur sa production vocale, c’est-à-dire que l’utilisateur a bien prononcé le mot ou groupe de mots affiché sur l’écran de télévision numérique, et pas autre chose. Le décodeur de télévision numérique poursuit l’analyse afin d’attribuer une classe d’âge à l’utilisateur seulement si en premier lieu la production vocale correspond bien au mot ou groupe de mots affiché sur l’écran de télévision numérique. Le deuxième mode de réalisation diminue avantageusement le risque qu’un utilisateur, typiquement un enfant, trompe le décodeur de télévision numérique au moyen d’un enregistrement de la voix d’un tiers, typiquement adulte. On améliore donc la robustesse du procédé de contrôle parental selon un aspect de l’invention. Par ailleurs, le deuxième mode de réalisation de l’invention optimise avantageusement les ressources du décodeur de télévision numérique en réalisant une analyse en deux temps et en n’attribuant une classe d’âge à l’utilisateur que si l’utilisateur a bien prononcé le mot ou groupe de mots demandé. On économise ainsi du temps et des ressources de calcul.

Selon le deuxième mode de réalisation, le décodeur définit avantageusement le mot ou groupe de mots à dire par l’utilisateur par une sélection pseudo-aléatoire au sein d’un catalogue. Le mot ou groupe de mots est ainsi modifié à chaque nouvelle utilisation du procédé de contrôle parental et cette modification n’est pas prévisible. On diminue plus encore le risque qu’un utilisateur parvienne à tromper le décodeur de télévision numérique au moyen d’un enregistrement de la voix d’un tiers car l’utilisateur ne sait pas à l’avance quel sera le mot ou groupe de mots à prononcer.

Selon une variante des premier ou deuxième modes de réalisation, le procédé de contrôle parental comporte :

- préalablement à l’étape i), un paramétrage préliminaire du décodeur selon lequel :

• le décodeur affiche sur l’écran de télévision numérique une demande de production vocale par un utilisateur ayant renseigné son âge ;

• le microphone capture un environnement sonore sous forme d’un signal et transmet le signal capturé au décodeur ;

• le décodeur enregistre le signal transmis, calcule la fréquence fondamentale du signal enregistré, calcule une classe d’âge de l’utilisateur ayant renseigné son âge en fonction de la fréquence fondamentale calculée et stocke la classe d’âge calculée ;

- dans l’étape iii), le décodeur ayant calculé la fréquence fondamentale du signal enregistré utilise au moins un couple {âge renseigné d’un utilisateur ; classe d’âge dudit utilisateur calculée lors du paramétrage préliminaire} pour calculer la classe d’âge de l’utilisateur en fonction de la fréquence fondamentale calculée.

Le décodeur réalise ainsi un calibrage lors de l’étape iii) au moyen des données acquises lors du paramétrage préliminaire. Cela lui permet de réduire la dispersion théorique des courbes donnant la classe d’âge d’un utilisateur en fonction de la fréquence fondamentale de la voix dudit utilisateur. La variante des premier et deuxième modes de réalisation améliore donc avantageusement la sensibilité et la fiabilité du procédé de contrôle parental selon un aspect de l’invention. Le paramétrage préliminaire est préférentiellement réalisé sur au moins un utilisateur habituel, c’est-à-dire typiquement au moins un membre de la famille.

Selon l’un quelconque des premier ou deuxième modes de réalisation ou leur variante, dans l’étape ii) :

- le microphone est activé :

• automatiquement par le décodeur, ou • suite à une action de l’utilisateur ;

- puis désactivé :

• automatiquement par le décodeur au bout d’un délai maximum d’activité, ou • suite à une action de l’utilisateur avant la fin du délai maximum d’activité.

Un deuxième aspect de l’invention concerne un dispositif pour la mise en oeuvre d’un procédé de contrôle parental par reconnaissance vocale selon le premier aspect de l’invention, le dispositif comportant :

- un microphone configuré pour capturer un environnement sonore sous forme d’un signal transmis au décodeur et

- un décodeur configuré pour détecter une métadonnée d’un programme relative à une classe d’âge du programme et extraire la classe d’âge du programme, bloquer un affichage du programme et afficher sur un écran de télévision numérique une demande de production vocale par un utilisateur puis enregistrer le signal transmis par le microphone, analyser le signal enregistré et débloquer l’affichage du programme sur l’écran de télévision numérique en fonction de l’analyse du signal transmis.

Outre les caractéristiques qui viennent d’être évoquées dans le paragraphe précédent, le dispositif de contrôle parental selon le deuxième aspect de l’invention peut présenter une ou plusieurs caractéristiques complémentaires parmi les suivantes, considérées individuellement ou selon toutes les combinaisons techniquement possibles :

- Le dispositif comporte une pluralité de microphones configurée pour capturer un environnement sonore sous forme d’un signal transmis au décodeur. Ainsi, le dispositif est avantageusement plus robuste au bruit pouvant survenir dans l’environnement sonore.

- Le décodeur comporte le microphone ou la pluralité de microphones.

Un troisième aspect de l’invention concerne un produit programme d’ordinateur comprenant les instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en oeuvre les étapes du procédé de contrôle parental par reconnaissance vocale selon le premier aspect de l’invention.

Un quatrième aspect de l’invention concerne un support d’enregistrement lisible par un ordinateur, sur lequel est enregistré le produit programme d’ordinateur selon le troisième aspect de l’invention.

L’invention et ses différentes applications seront mieux comprises à la lecture de la description qui suit et à l’examen des figures qui l’accompagnent.

BREVE DESCRIPTION DES FIGURES

Les figures sont présentées à titre indicatif et nullement limitatif de l’invention.

- La figure 1 montre une représentation schématique d’un dispositif pour la mise en oeuvre d’un procédé de contrôle parental par reconnaissance vocale selon un aspect de l’invention.

- La figure 2 montre un diagramme schématique des étapes d’un procédé de contrôle parental par reconnaissance vocale selon l’un des premier ou deuxième modes de réalisation de l’invention.

- La figure 3a montre une représentation graphique de l’amplitude d’un signal sonore en fonction du temps, sur une durée de deux secondes.

- La figure 3b montre une représentation graphique de l’amplitude du signal sonore de la figure 3a en fonction du temps, sur une durée de 100 ms.

- La figure 3c montre une représentation graphique du module de la transformée de Fourier du signal sonore de la figure 3b permettant de déterminer la fréquence fondamentale du signal sonore des figures 3a et 3b.

- La figure 4a montre une représentation graphique de l’évolution de la fréquence fondamentale moyenne de vibration des cordes vocales en fonction de l’âge, pour les hommes et les femmes.

- La figure 4b montre une représentation graphique de la relation entre la longueur moyenne du conduit vocal et le logarithme de la fréquence fondamentale moyenne de vibration des cordes vocales.

- La figure 5 montre un diagramme schématique des étapes d’un procédé de contrôle parental par reconnaissance vocale selon une variante des premier ou deuxième modes de réalisation de l’invention.

DESCRIPTION DETAILLEE D’AU MOINS UN MODE DE REALISATION DE L’INVENTION

Sauf précision contraire, un même élément apparaissant sur des figures différentes présente une référence unique.

La figure 1 montre une représentation schématique d’un dispositif 10 pour la mise en oeuvre d’un procédé 100 de contrôle parental par reconnaissance vocale selon un aspect de l’invention.

Le dispositif 10 comporte un microphone 1 ou une pluralité de microphones 1 et un décodeur 2 de télévision numérique (« set-top box (STB) >> ou « video gateway >> en langue anglaise). D’une manière générale, le décodeur 2 assure une fonction de transformation d’un signal externe en un contenu et d’affichage de ce contenu sur un écran de télévision. Lorsque le dispositif 10 comporte une pluralité de microphones 1, chaque microphone 1 est avantageusement agencé de manière à avoir une direction privilégiée de capture de l’environnement sonore qui lui est propre. Autrement dit, chaque microphone 1 capture plus particulièrement les sons provenant d’une certaine direction de l’espace qui lui est propre. Ainsi, le dispositif 10 équipé de la pluralité de microphone peut avantageusement filtrer le bruit provenant de certaines directions de l’espace afin de ne conserver que le signal utile provenant d’une ou plusieurs autres directions de l’espace. Le microphone 1 ou la pluralité de microphones 1 peuvent être indépendants ou intégrés dans le décodeur 2 ou dans un autre périphérique comme une télécommande ou un assistant vocal.

Lorsque le ou les microphones 1 ne sont pas intégrés dans le décodeur 2, le décodeur 2 comporte typiquement une première interface IT1 lui permettant une communication sans fil avec le ou les microphones 1. La première interface IT1 est par exemple un module de réception infrarouge, Bluetooth ou Zigbee RF4CE. Si le ou les microphones 1 sont intégrés dans le décodeur 2, la communication entre le ou les microphones 1 et le décodeur 2 est typiquement filaire.

Le décodeur 2 de télévision numérique comporte généralement :

- un processeur 21 associé à une mémoire 22,

- un espace de stockage 23 et

- différents éléments 24 d’interface (« front ends >> en anglais).

L’espace de stockage 23 est par exemple un disque dur ou une carte SD. Les différents éléments 24 d’interface permettent l’accès aux programmes de télévision numérique via une troisième interface IT3 du décodeur 2, qui permet par exemple une réception TNT, câblée ou satellite. Le décodeur 2 comporte typiquement une deuxième interface IT2 lui permettant d’accéder à Internet, par exemple de manière filaire via un câble Ethernet ou non filaire via Wifi, et aux services associés comme la vidéo à la demande. Enfin, le décodeur 2 de télévision numérique est connecté à un écran 3 de télévision numérique via une quatrième interface IT4 qui est typiquement un module HDMI.

La figure 2 montre un diagramme schématique des étapes du procédé 100 de contrôle parental par reconnaissance vocale selon un autre aspect de l’invention. Lorsqu’un utilisateur requiert la diffusion d’un programme de télévision numérique, c’est-à-dire son affichage sur l’écran 3 de télévision numérique via le décodeur 2 de télévision numérique, le décodeur 2 recherche, selon une première étape 101, si une métadonnée relative à une classe d’âge Cp dudit programme est disponible. Si le décodeur 2 ne détecte pas une telle métadonnée, la diffusion est autorisée par défaut et le programme est affiché sur l’écran 3. Si en revanche le décodeur 2 détecte une telle métadonnée :

- selon une deuxième étape 102, il extrait la classe d’âge Cp du programme et la stocke en mémoire ;

- selon une troisième étape 103, il bloque par défaut un affichage du programme sur l’écran 3 et

- selon une quatrième étape 104, il affiche sur l’écran 3 une demande de production vocale par l’utilisateur.

La classe d’âge Cp d’un programme de télévision numérique est par exemple déterminée par le CSA en France : « - 10 >>, « - 12 >>, « - 16 >> et « - 18 >> pour les programmes respectivement déconseillés aux moins de 10, 12, 16 ou 18 ans. D’autres classes d’âge Cp peuvent naturellement être utilisées en fonction des territoires et des époques. Le décodeur 2 peut réaliser un traitement sur les classes d’âge Cp qu’il extrait, de manière à leur attribuer une nouvelle classe. Par exemple, le décodeur 2 pourrait ne travailler qu’avec deux classes distinctes : une première classe « enfant >> et une deuxième classe « adulte >>. La classe « enfant >> correspondrait par exemple aux moins de 16 ans ou aux moins de ans tandis que la classe « adulte » correspondrait dans cet exemple aux plus de 16 ou 18 ans. Dans cet exemple, le décodeur 2 qui extrait une classe Cp « 10 » ou « -12 » lui attribue indifféremment la classe « enfant ». Le décodeur 2 pourrait également ne travailler qu’avec trois classes distinctes, par exemple une première classe « enfant », une deuxième classe « adolescent » et une troisième classe « adulte », etc.

Le ou les microphones 1 capturent alors un environnement sonore sous forme d’un signal, selon une cinquième étape 105, avant de transmettre le signal capturé au décodeur 2 selon une sixième étape 106. Le ou les microphones 1 peuvent être activés automatiquement par le décodeur 2 après la quatrième étape 104 d’affichage sur l’écran de la demande de production vocale par l’utilisateur, sans action de l’utilisateur. Alternativement, le ou les microphones 1 peuvent être activés suite à une action de l’utilisateur sur le décodeur 2 ou sur un périphérique connecté au décodeur 2 comme par exemple une télécommande. Quel que soit leur mode d’activation, le ou les microphones 1 sont préférentiellement désactivés automatiquement par le décodeur 2 au bout d’un délai maximum d’activité ou suite à une action de l’utilisateur avant la fin du délai maximum d’activité. Le délai maximum d’activité est préférentiellement compris entre 5 secondes et 30 secondes et par exemple fixé à 10, 15 ou 20 secondes.

Après la sixième étape 106 de transmission du signal capturé par le ou les microphones 1 au décodeur 2, le décodeur 2 enregistre le signal transmis selon une septième étape 107 puis analyse le signal enregistré selon une huitième étape 108. En fonction de cette analyse, selon une neuvième étape 109, le décodeur 2 :

- débloque l’affichage du programme sur l’écran 3 de télévision numérique si le résultat de l’analyse est concluant ou

- dans le cas contraire, continue de le bloquer selon la troisième étape 103 précédemment décrite.

La huitième étape 108 d’analyse réalisée par le décodeur 2 est à présent décrite.

Selon un premier mode de réalisation de l’invention, la huitième étape 108 d’analyse comporte :

- une première sous-étape 108-1 selon laquelle le décodeur 2 calcule la fréquence fondamentale F0 du signal enregistré,

- une deuxième sous-étape 108-2 selon laquelle le décodeur 2 calcule une classe d’âge Ca de l’utilisateur en fonction de la fréquence fondamentale F0 calculée, et

- une troisième sous-étape 108-3 selon laquelle le décodeur 2 compare la classe d’âge Ca calculée de l’utilisateur à la classe d’âge Cp du programme.

Dans la neuvième étape 109, le décodeur 2 débloque alors l’affichage du programme sur l’écran 3 si la classe d’âge Ca calculée de l’utilisateur est supérieure ou égale à la classe d’âge Cp du programme. Dans le cas contraire, si la classe d’âge Ca calculée de l’utilisateur est inférieure à la classe d’âge Cp du programme, le décodeur 2 continue de bloquer l’affichage du programme sur l’écran 3, selon la troisième étape 103. Les première, deuxième et troisième sousétapes 108-1, 108-2 et 108-3 de la huitième étape 108 d’analyse sont référencées pour faciliter la lecture mais ne sont pas représentées sur les figures.

Selon un deuxième mode de réalisation de l’invention, la demande de production vocale affichée sur l’écran 3 lors de la quatrième étape 104 comporte un mot ou groupe de mots à dire par l’utilisateur, le mot ou groupe de mot étant défini par le décodeur 2. Autrement dit, selon le deuxième mode de réalisation, la production vocale demandée à l’utilisateur n’est pas une prise de parole libre mais une prise de parole contrainte par le décodeur 2 au moyen du mot ou groupe de mots. Selon le premier mode de réalisation au contraire, la production vocale demandée à l’utilisateur peut être une prise de parole libre, où l’utilisateur dit ce qu’il veut. Selon le deuxième mode de réalisation, le décodeur 2 définit préférentiellement le mot ou groupe de mots à dire par l’utilisateur par une sélection pseudo-aléatoire au sein d’un catalogue. Le décodeur 2 peut avantageusement renouveler régulièrement le catalogue, partiellement ou totalement, en allant chercher des mots ou groupes de mots de manière pseudo-aléatoire dans un guide des programmes ou sur internet d’une manière générale. Le catalogue comporte par exemple cent mots ou groupes de mots et il est par exemple renouvelé de 10% toutes les 10 utilisations.

Selon le deuxième mode de réalisation, la huitième étape 108 d’analyse comporte une sous-étape initiale 108-0 selon laquelle le décodeur 2 détermine si le signal enregistré lors de la septième étape 107 correspond effectivement au mot ou groupe de mots défini par le décodeur 2 lors de la quatrième étape 104 d’affichage de la demande de production vocale sur l’écran 3. Si le signal enregistré lors de la septième étape 107 ne correspond pas au mot ou groupe de mots défini par le décodeur 2, la huitième étape 108 d’analyse est terminée et le décodeur 2 continue de bloquer l’affichage du programme sur l’écran 3, selon la troisième étape 103. Si le signal enregistré lors de la septième étape 107 correspond bien ay mot ou groupe de mots défini par le décodeur 2, alors la huitième d’analyse se poursuit par les première, deuxième et troisième sous-étapes 108-1, 108-2 et 1083 précédemment décrites, puis la neuvième étape 109 précédemment décrite a également lieu, selon laquelle l’affichage du programme sur l’écran 3 est débloqué si la classe d’âge Ca calculée de l’utilisateur est supérieure ou égale à la classe d’âge Cp du programme. La sous-étape initiale 108-0 de la huitième étape 108 d’analyse est référencée pour faciliter la lecture mais elle n’est pas représentée sur les figures.

Les figures 3a, 3b et 3c sont à présent décrites, qui illustrent plus particulièrement la première sous-étape 108-1 selon laquelle le décodeur 2 calcule la fréquence fondamentale F0 du signal enregistré. Calculer la fréquence fondamentale d’un signal sonore est connu en soi. La figure 3a montre par exemple une représentation graphique de l’amplitude d’un signal sonore en fonction du temps, sur une durée de deux secondes. La figure 3b montre une représentation graphique de l’amplitude du signal sonore de la figure 3a en fonction du temps, sur une durée de 100 ms : une fenêtre temporelle de 100 ms du signal sonore de la figure 3a est zoomée à la figure 3b. La figure 3c montre une représentation graphique du module de la transformée de Fourier, dans le domaine fréquentiel, du signal sonore de 100 ms de durée de la figure 3b, permettant de déterminer la fréquence fondamentale FO du signal sonore des figures 3a et 3b. La transformée de Fourier de la figure 3c fait apparaître, en plus de la fréquence fondamentale FO, plusieurs harmonique Ha.

Les figures 4a et 4b sont à présent décrites, qui illustrent plus particulièrement la deuxième sous-étape 108-2 selon laquelle le décodeur 2 calcule une classe d’âge Ca de l’utilisateur en fonction de la fréquence fondamentale FO calculée. Les figures 4a et 4b sont extraites de l’article : « La croissance de l’instrument vocal : contrôle, modélisation, potentialités acoustiques et conséquences perceptives », par Louis-Jean Boë et al., Rev. franç. de linguistique appliquée, 2008, XIII-2 (29-80). La figure 4a montre une représentation graphique de l’évolution de la fréquence fondamentale moyenne de vibration des cordes vocales en fonction de l’âge, pour les hommes et les femmes. La figure 4b montre une représentation graphique de la relation entre la longueur moyenne du conduit vocal et le logarithme de la fréquence fondamentale moyenne de vibration des cordes vocales. Dans la deuxième sous-étape 108-2, le décodeur 2 utilise préférentiellement une première méthode de détermination directe de l’âge à partir de la fréquence fondamentale FO, par exemple à partir du graphique de la figure 4a, ou alternativement une deuxième méthode de détermination indirecte de l’âge à partir du logarithme de la fréquence fondamentale log(FO), par exemple à partir du graphique de la figure 4b dans lequel on suppose que l’ordonnée, graduée selon la longueur du conduit vocal, est également graduée selon les âges. Le décodeur 2 peut également avantageusement utiliser une combinaison de la première méthode directe et de la deuxième méthode indirecte dans la deuxième sous-étape 108-2.

La figure 5 montre un diagramme schématique des étapes du procédé 100 de contrôle parental par reconnaissance vocale selon une variante des premier ou deuxième modes de réalisation de l’invention. Selon cette variante, le procédé 100 comporte, préalablement à la première étape 101, un paramétrage préliminaire 200 selon lequel :

- le décodeur 2 affiche sur l’écran 3 de télévision numérique une demande de production vocale par un utilisateur ayant renseigné son âge ;

- le microphone 1 capture un environnement sonore sous forme d’un signal et transmet le signal capturé au décodeur 2 ;

- le décodeur 2 enregistre le signal transmis, calcule la fréquence fondamentale du signal enregistré, calcule une classe d’âge Ca’ de l’utilisateur ayant renseigné son âge en fonction de la fréquence fondamentale calculée et stocke la classe d’âge Ca’ calculée.

Toujours selon cette variante, lorsque le procédé 100 réalise la première sousétape 108-1 et calcule la fréquence fondamentale F0 du signal enregistré, le procédé 100 réalise ensuite la deuxième sous-étape 108-2 avec une sous15 étape 108-2’ de calibrage : le décodeur 2 utilise au moins un couple {âge renseigné d’un utilisateur ; classe d’âge Ca’ dudit utilisateur calculée lors du paramétrage préliminaire 200} pour calculer la classe d’âge Ca de l’utilisateur en fonction de la fréquence fondamentale calculée.

Claims

REVENDICATIONS

1. Procédé (100) de contrôle parental par reconnaissance vocale dans un décodeur (2) de télévision numérique, le procédé (100) comportant les étapes suivantes :

i) le décodeur (2) détecte (101) une métadonnée d’un programme relative à une classe d’âge (Cp) du programme et extrait (102) la classe d’âge (Cp) du programme, bloque (103) un affichage du programme et affiche (104) sur un écran (3) de télévision numérique une demande de production vocale par un utilisateur ;

ii) un microphone (1) capture (105) un environnement sonore sous forme d’un signal et transmet (106) le signal capturé au décodeur (2) ;

iii) le décodeur (2) enregistre (107) le signal transmis, analyse (108) le signal enregistré et débloque (109) l’affichage du programme sur l’écran (3) de télévision numérique en fonction de l’analyse du signal transmis.
2. Procédé (100) selon la revendication précédente caractérisé en ce que dans l’étape iii), le décodeur (2) enregistre (107) le signal transmis, calcule (108-1) la fréquence fondamentale du signal enregistré, calcule (108-2) une classe d’âge (Ca) d’un utilisateur en fonction de la fréquence fondamentale calculée, compare (108-3) la classe d’âge (Ca) calculée de l’utilisateur à la classe d’âge (Cp) du programme et débloque (109) l’affichage du programme sur l’écran (3) de télévision numérique si la classe d’âge (Ca) calculée de l’utilisateur est supérieure ou égale à la classe d’âge (Cp) du programme.
3. Procédé (100) selon la revendication 1 caractérisé en ce que :

- dans l’étape i), la demande de production vocale affichée sur l’écran (3) de télévision numérique comporte un mot ou groupe de mots à dire par l’utilisateur, le mot ou groupe de mots étant défini par le décodeur (2) ;

- dans l’étape iii), le décodeur (2) enregistre (107) le signal transmis, détermine (108-0) si le signal enregistré correspond au mot ou groupe de mots défini par le décodeur (2) et si oui, calcule (108-1) la fréquence fondamentale du signal enregistré, calcule (108-2) une classe d’âge (Ca) d’un utilisateur en fonction de la fréquence fondamentale calculée, compare (108-3) la classe d’âge (Ca) calculée de l’utilisateur à la classe d’âge (Cp) du programme et débloque (109) l’affichage du programme sur l’écran (3) de télévision numérique si la classe d’âge (Ca) calculée de l’utilisateur est supérieure ou égale à la classe d’âge (Cp) du programme.
4. Procédé (100) selon la revendication précédente caractérisé en ce que le décodeur (2) définit le mot ou groupe de mots à dire par l’utilisateur par une sélection pseudo-aléatoire au sein d’un catalogue.
5. Procédé (100) selon l’une quelconque des revendications 2 ou 3 caractérisé en ce qu’il comprend :

- préalablement à l’étape i), un paramétrage préliminaire (200) du décodeur (2) selon lequel :

o le décodeur (2) affiche sur l’écran (3) de télévision numérique une demande de production vocale par un utilisateur ayant renseigné son âge ;

o le microphone (1) capture un environnement sonore sous forme d’un signal et transmet le signal capturé au décodeur (2) ;

o le décodeur (2) enregistre le signal transmis, calcule la fréquence fondamentale du signal enregistré, calcule une classe d’âge (Ca’) de l’utilisateur ayant renseigné son âge en fonction de la fréquence fondamentale calculée et stocke la classe d’âge (Ca’) calculée ;

- dans l’étape iii), le décodeur (2) ayant calculé (108-1) la fréquence fondamentale du signal enregistré utilise (108-2’) au moins un couple {âge renseigné d’un utilisateur ; classe d’âge (Ca’) dudit utilisateur calculée lors du paramétrage préliminaire} pour calculer (108-2) la classe d’âge (Ca) de l’utilisateur en fonction de la fréquence fondamentale calculée.
6. Procédé (100) selon l’une quelconque des revendications précédentes caractérisé en ce que dans l’étape ii) :

- le microphone (1) est activé :

o automatiquement par le décodeur (2), ou o suite à une action de l’utilisateur ;

- puis désactivé :

o automatiquement par le décodeur (2) au bout d’un délai maximum d’activité, ou o suite à une action de l’utilisateur avant la fin du délai maximum d’activité.
7. Dispositif (10) pour la mise en oeuvre d’un procédé (100) de contrôle parental par reconnaissance vocale selon l’une quelconque des revendications précédentes, le dispositif comportant :

- un microphone (1) configuré pour capturer (105) un environnement sonore sous forme d’un signal transmis (106) au décodeur (2) et

- un décodeur (2) configuré pour détecter (101) une métadonnée d’un programme relative à une classe d’âge (Cp) du programme et extraire (102) la classe d’âge (Cp) du programme, bloquer (103) un affichage du programme et afficher (104) sur un écran (3) de télévision numérique une demande de production vocale par un utilisateur puis enregistrer (107) le signal transmis par le microphone (1), analyser (108) le signal enregistré et débloquer (109) l’affichage du programme sur l’écran (3) de télévision numérique en fonction de l’analyse du signal enregistré.
8. Dispositif (10) selon la revendication précédente caractérisé en ce qu’il comporte une pluralité de microphones (1) configurée pour capturer un environnement sonore sous forme d’un signal transmis au décodeur (2).
9. Dispositif (10) selon l’une quelconque des revendications 7 ou 8 caractérisé en ce que le décodeur (2) comporte le microphone (1) ou la pluralité de microphones (1).
10. Produit programme d’ordinateur comprenant les instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en œuvre les étapes du procédé (100) de contrôle parental par

5 reconnaissance vocale selon l’une quelconque des revendications 1 à 6.
11. Support d’enregistrement lisible par un ordinateur, sur lequel est enregistré le produit programme d’ordinateur selon la revendication précédente.