FR2781970A1 - Procede et appareil permettant un fonctionnement en telephone a haut-parleur dans un dispostif de communication portable - Google Patents

Procede et appareil permettant un fonctionnement en telephone a haut-parleur dans un dispostif de communication portable Download PDF

Info

Publication number
FR2781970A1
FR2781970A1 FR9909515A FR9909515A FR2781970A1 FR 2781970 A1 FR2781970 A1 FR 2781970A1 FR 9909515 A FR9909515 A FR 9909515A FR 9909515 A FR9909515 A FR 9909515A FR 2781970 A1 FR2781970 A1 FR 2781970A1
Authority
FR
France
Prior art keywords
value
average value
current
shifted
frame energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9909515A
Other languages
English (en)
Other versions
FR2781970B1 (fr
Inventor
James Brent Nicholls
Chin Pan Wong
Martin Thuo Karanja
Patrick Joseph Doran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of FR2781970A1 publication Critical patent/FR2781970A1/fr
Application granted granted Critical
Publication of FR2781970B1 publication Critical patent/FR2781970B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/605Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Radio Relay Systems (AREA)

Abstract

Un dispositif de communication portable (104), tel qu'un téléphone cellulaire, peut fonctionner en mode téléphone à haut-parleur. Le dispositif de communication utilise une démarche de communication numérique, et reçoit et génère des signaux vocodés. Le haut-parleur fournit un fonctionnement en semi duplex pour supprimer l'écho. Lorsqu'une activité vocale est détectée, le dispositif active un haut-parleur et coupe un microphone pour éviter l'écho. Lorsque aucune activité vocale n'est détectée dans le signal reçu, le haut-parleur est coupé et le microphone activé. Pour déterminer le moment où une activité vocale est présente dans le signal reçu, un nouvel algorithme de détection d'activité vocale (VAD) est utilisé, qui tire parti de paramètres fournis comme partie intégrante du signal vocodé reçu.

Description

PROCEDE ET APPAREIL PERMETTANT UN FONCTIONNEMENT
EN TÉLÉPHONE A HAUT-PARLEUR DANS UN DISPOSITIF DE
COMMUNICATION PORTABLE
Références La présente application concerne la demande co- dépendante intitulée "Method For Suppressing Speaker Activation In A Portable Communication Device Operated In A Speakerphone Mode" enregistrée sous le numéro CM02824J; la demande co-dépendante intitulée "Method For Suppressing Speaker Activation In A Portable Communication Device Operated In A Speakerphone Mode"
enregistrée sous le numéro CM02827J; et la demande co-
dépendante intitulée "Method For Detecting Speech In A Vocoded Signal" enregistrée sous le numéro CM02882J, toutes ces applications étant attribuées avec la
présente demande et déposées pareillement.
Domaine technique La présente invention concerne, de manière générale, des dispositifs de communication portables et des systèmes de communication pour ceux-ci, et plus particulièrement des dispositifs de communication portables qui peuvent fonctionner en mode téléphone à haut-parleur, et des systèmes de communication pour ceux-ci. Arrière-plan technologique de l'invention Les téléphones à haut- parleur sont de plus en plus répandus sur le marché et sont utilisés par une majorité d'entreprises pour faciliter les communications. Les téléphones à haut-parleur ont également pris une place prédominante sur de nombreux marchés sur lesquels ils sont utilisés comme téléphones
"mains-libres". Toutefois, les téléphones à haut-
parleur sont principalement utilisés dans les systèmes
de communication terrestres lorsqu'un circuit de haut-
parleur de téléphone normal est remplacé par un haut-
parleur plus puissant, et lorsqu'un microphone à haute sensibilité et un circuit annexe sont utilisés au lieu d'un circuit classique. Le haut-parleur plus puissant et le microphone plus sensible sont généralement utilisés conjointement avec certains moyens permettant le mitigeage lorsque ces composants respectifs sont actifs. Dans un téléphone à haut-parleur typique, si le haut-parleur passe des signaux audio, si le microphone n'est pas désactivé, alors la ou les personnes à qui l'utilisateur du téléphone à haut-parleur est en train de parler s'entendent, ce qui entraîne un retour
désagréable. Il existe certains téléphones à haut-
parleur très onéreux qui comportent des circuits d'annulation de retour et d'écho très sophistiqués, mais la dépense que représentent de tels dispositifs est presque dissuasive. De plus, il existe également des téléphones à haut-parleur sans fil, mais ceux-ci ont tendance à n'être que des extensions de téléphones
sans fil.
A présent, peu de fabricants ont réussi à concevoir un téléphone à hautparleur mobile, en dépit du besoin évident d'un tel dispositif, c'est-àdire un dispositif de communication portable, tel un téléphone cellulaire qui soit apte à fonctionner en mode téléphone à haut-parleur. Les raisons pour lesquelles un tel dispositif n'a pas marché sont nombreuses et variées. L'une des raisons principales est qu'un téléphone à haut-parleur, par nécessité, nécessite un circuit de sortie audio plus puissant qu'un téléphone cellulaire classique. Un haut-parleur plus puissant signifie plus de poids et plus de volume, ce qui va à l'encontre des buts des dispositifs de communication portables. En outre, un haut-parleur plus puissant peut causer un problème si on le place dans un pavillon classique puisque, alors, on court le risque qu'un utilisateur qui tient le téléphone très près de son oreille, croyant que le téléphone se trouve en mode standard, pourrait se blesser du fait que le son est, au contraire, très fort. Par conséquent, une approche sûre consiste à utiliser un haut-parleur classique pour le mode téléphone standard, à l'emplacement classique, et à placer le haut-parleur plus puissant ailleurs dans le téléphone, loin de l'emplacement classique du pavillon. Une deuxième raison pour laquelle la mise en oeuvre d'un téléphone à haut-parleur est difficile dans un dispositif de communication portable est le fait que le haut-parleur et le microphone sont situés l'un près de l'autre. Si la stratégie du double haut-parleur suggérée ci-dessus est utilisée, ceci est encore plus problématique puisque, en général, la partie du téléphone o est situé le microphone est la plus
éloignée du pavillon. Pour que le téléphone à haut-
parleur soit acceptable, il doit faire le mitigeage entre le haut- parleur et le microphone très rapidement afin d'éviter le hachage de parties des paroles, ou bien l'utilisateur doit s'habituer à attendre plus longtemps que la normale avant de parler. Pour surmonter ce problème quand on utilise un système de communication mobile, on utilise des dispositifs extérieurs, couplés au dispositif de communication portable en tant qu'accessoires, et qui sont conçus de manière très similaire aux téléphones à haut-parleur terrestres classique. Toutefois, ils sont souvent pires que les téléphones à haut- parleur classiques, selon le
niveau du bruit ambiant.
Du fait des obstacles mentionnés ci-dessus et d'autres, concevoir un dispositif de communication
portable qui fonctionne en mode téléphone à haut-
parleur s'est révélé extrêmement difficile. L'une des déterminations clefs qui doive être respectée lors du fonctionnement d'un téléphone à haut-parleur consiste à savoir quand activer le haut-parleur et couper le microphone. En d'autres termes, activer le haut-parleur uniquement lorsqu'on reçoit des informations vocales et couper le haut-parleur dans les autres cas. Dans les téléphones cellulaires analogues, ceci est difficile à cause de la variation du bruit, et de la difficulté lors du traitement du signal, à déterminer la présence d'un contenu vocal dans le signal reçu. Un traitement supplémentaire et onéreux serait nécessaire pour détecter une voix de manière fiable. Dans les systèmes numériques, le traitement supplémentaire utilisant un traitement de paroles classique s'est révélé encombrant, et entraîne pour le moins une augmentation significative du coût. Par conséquent, il existe un besoin pour un moyen qui permette, dans un dispositif de communication portable qui fonctionne en mode téléphone à haut-parleur, de déterminer de manière fiable quand activer le haut-parleur et couper le microphone.
Brève description des dessins
La figure 1 est un schéma fonctionnel d'un système de communication selon un mode de réalisation de la présente invention; la figure 2 est un schéma fonctionnel d'un dispositif de communication portable qui peut fonctionner en mode téléphone à haut-parleur, selon un mode de réalisation de la présente invention; la figure 3 est un organigramme d'un procédé permettant de déterminer quand activer un haut- parleur, selon un mode de réalisation de la présente invention; la figure 4 est un organigramme d'un procédé permettant de mettre à jour les paramètres utilisés lors de la détermination de l'instant o activer un haut-parleur, selon un mode de réalisation de la présente invention; la figure 5 est un graphique de l'énergie de trame dans le temps et une valeur moyenne décalée qui en dérive, selon un mode de réalisation de la présente invention; la figure 6 est un graphique d'une valeur moyenne décalée dans le temps par rapport à un seuil, selon un mode de réalisation de la présente invention; la figure 7 est un graphique du produit de la valeur de l'énergie de trame et de la valeur de détection voisé/non voisé dans le temps, selon la présente invention; la figure 8 est un graphique d'une valeur moyenne décalée dans le temps par rapport à un seuil dynamique, selon un mode de réalisation de la présente invention; la figure 9 est un graphique d'une valeur moyenne décalée dans le temps qui montre des zones différentes dans lesquelles la valeur moyenne décalée diminue à un rythme différent selon la zone considérée, selon un mode de réalisation de la présente invention; la figure 10 est un organigramme d'un procédé permettant de couper un microphone, selon la présente invention.
Description détaillée d'un mode de réalisation préféré
Alors que la description se conclut par des
revendications qui définissent les caractéristiques de
l'invention que l'on considère nouvelles, on pense que l'invention sera mieux comprise si l'on considère la
description suivante conjointement avec les figures,
sur lesquelles les mêmes numéros de référence sont reportés. La présente invention résout le problème qui consiste à décider quand le signal audio reçu contient des informations vocales ou toute autre information audio intéressante, et de passer les informations audio sur un haut-parleur tout en coupant le microphone d'un dispositif de communication portable en tirant parti des paramètres qui sont obtenus à partir du traitement des données audio grâce à un vocodeur. Dans la plupart des opérations de vocodage, les données de paroles et autres données audio sont décomposées en trames, puis réduites à un jeu de mots ou de symboles numériques par l'intermédiaire d'un processus de mappage. En plus des symboles, d'autres paramètres sont généralement fournis avec chaque trame, tel un paramètre de l'énergie de trame et un paramètre de valeur de détection voisé/non voisé, comme cela est connu dans la technique. La valeur de détection voisé/non voisé est une mesure de
la tonalité ou de la hauteur du son, ou des deux.
Généralement, le paramètre de l'énergie de trame est le résultat d'une autocorrélation évaluée à la position zéro. La valeur de détection voisé/non voisé est un nombre, généralement un nombre entier, qui indique la valeur de la tonalité de la trame. En général, un chiffre bas en mode détection voisé/non voisé indique un son fricatif, tandis qu'un chiffre élevé indique un son tonal, tel qu'une voyelle. Ces paramètres sont générés par le matériel de transmission, de sorte qu'un dispositif de communication portable les trouve dans un signal reçu, et n'a pas besoin de passer des cycles de calcul précieux à les générer. Le dispositif de communication portable utilise la valeur de ces paramètres pour définir une valeur moyenne décalée de l'énergie de trame ou le produit des valeurs de l'énergie de trame et du mode détection voisé/non voisé, et compare la valeur moyenne décalée à une valeur de seuil. En général, lorsque la valeur moyenne décalée est supérieure à la valeur de seuil, la voix est déclarée présente et le microphone est coupé tandis
que les informations audio reçues passent dans le haut-
parleur. Lorsque la valeur moyenne décalée est inférieure au seuil, le haut-parleur est coupé tandis
que le microphone est actif.
En référence maintenant à la figure 1, celle-ci est un schéma fonctionnel d'un système de communication 100, selon un mode de réalisation de la présente invention. Le système comprend du matériel de réseau fixe (FNE) 102, et au moins une station mobile 104, tel qu'un dispositif de communication portable, apte à s'engager dans une session de communication audio en duplex total, comme dans la téléphonie cellulaire. Le système de communication est un système de communication numérique, et le FNE peut être conforme à la norme du Global System for Mobile Communication (GSM) ou Système Mondial de communications mobiles. Le FNE comprend un centre de commutation du service mobile (MSC) 106, qui est couplé pour fonctionner à un réseau téléphonique public commuté (RTPC) 108, et est couplé pour fonctionner à un transcodeur 110. Le transcodeur convertit les données audio en informations vocodées grâce à l'un quelconque des algorithmes de vocodage connus. Dans le mode de réalisation préféré, le système de communication utilise un codage par prédiction linéaire excité par somme vectorielle (VSELP), comme cela est connu dans la technique. Généralement, les données audio sont reçues au niveau du transcodeur en provenance du MSC, sous la forme de modulation par impulsion et codage (MIC), comme cela est courant en téléphonie. Le transcodeur code le signal audio sortant pour fournir un signal vocodé sortant qu'il transmet à une station de base 112, à laquelle il est couplé, pour fonctionner, à proximité du dispositif de communication portable 104. La station de base comprend du matériel émetteur-récepteur et est couplée pour fonctionner à une antenne 114, par l'intermédiaire de laquelle le signal vocodé est transmis au dispositif de communication portable. Le dispositif de communication portable reçoit le signal vocodé par liaison radio. Au même instant, le dispositif de communication portable peut effectuer un vocodage d'un signal audio ambiant, et le transmettre à la station de base sous la forme d'un signal vocodé entrant. En général, on fait référence aux signaux transmis par la station de base comme étant des signaux sortants tandis qu'on fait référence aux signaux transmis par le dispositif de communication portable comme étant des signaux entrants. Le signal vocodé entrant reçu en provenance du dispositif de communication portable est envoyé au transcodeur, o il est converti en un signal audio entrant, tel que, par exemple, des données en
modulation par impulsion et codage.
En référence maintenant à la figure 2, celle-ci représente un schéma fonctionnel d'un dispositif de communication portable 200 qui peut fonctionner en mode téléphone à haut-parleur, selon un mode de réalisation de la présente invention. Le dispositif de communication portable est le même que celui représenté sur la figure 1, auquel il est fait référence sous le numéro 104. Le dispositif comprend une antenne 202 couplée à un inverseur d'antenne 204, comme cela est courant dans la technique. L'inverseur d'antenne couple, l'antenne, de manière sélective, soit à un récepteur 206, soit à un émetteur 208. L'antenne et le récepteur forment un moyen de réception de signaux, tandis que l'antenne et l'émetteur forment un moyen de transmission des signaux. Le récepteur et l'émetteur sont tous deux couplés à un processeur de signaux numériques (DSP) 210. Le DSP est un moyen de calcul et un moyen permettant de fournir certaines valeurs, et effectue des fonctions telles que le décodage et le codage des codes de correction d'erreurs sans voie de retour, le traitement en bande de base, etc. Le DSP peut également effectuer le codage et le décodage vocal (vocodage). Le DSP fait passer les informations audio reçues à un circuit de sortie audio 212 pour qu'elles passent par un haut-parleur 214. Le circuit de sortie
audio et le haut-parleur forment un circuit de haut-
parleur. Dans le mode de réalisation préféré, le haut-
parleur 214 est un premier haut-parleur permettant de passer, de manière sélective, des informations audio à un volume de téléphone à hautparleur, par exemple, et le dispositif de communication portable comprend en outre un deuxième haut-parleur 216 pour passer, de manière sélective, des informations audio à un volume de pavillon de téléphone classique. Lorsque des informations audio passent sur le haut-parleur en mode téléphone à haut-parleur, le microphone 220 doit être coupé pour éliminer l'écho. Pour couper le microphone, le DSP peut simplement ignorer toute donnée reçue au cours de la période pendant laquelle la coupure doit durer. L'utilisateur peut choisir d'utiliser le premier
ou le second haut-parleur. En outre, le premier haut-
parleur peut également être utilisé lorsque le dispositif de communication portable fonctionne en mode répartition, comme dans les systèmes de communication
radio numériques à services intégrés.
Le dispositif de communication portable comprend également un système audio dans le circuit 218 afin de traiter les informations audio ambiantes reçues en provenance du microphone 220 afin de recevoir les signaux audio. Les circuits d'entrée audio et de sortie audio peuvent être combinés dans un seul codec, comme il est connu dans la technique. Le microphone et le circuit d'entrée audio forment un circuit de microphone. Le circuit d'entrée audio fait passer les signaux au DSP, qui à son tour effectue le codage et le traitement en bande de base, comme il est connu dans la technique. L'émetteur module alors le signal en bande de base fourni par le DSP, et transmet le signal
entrant à la station de base, comme sur la figure 1.
En référence maintenant à la figure 3, celle-ci est un organigramme 300 d'un procédé de détermination de l'instant o activer un haut- parleur, selon un mode de réalisation de la présente invention. En général,
les figures 3 à 9 et la description jointe ci-dessous
décrivent un nouveau procédé de détection d'activité de parole dans un signal vocodé, qui a de nombreuses applications, dont l'une consiste à déterminer l'instant o activer le haut-parleur d'un dispositif de communication portable et, au même instant, couper un microphone associé. Au début 302 du procédé, le dispositif de communication portable a établi une session de communication audio en duplex total avec une station de base. Dans le langage de la technique, le dispositif de communication est reconnu par le système et est entré en communication téléphonique avec une personne distante. De même, l'utilisateur du dispositif
a choisi un fonctionnement en téléphone à haut-parleur.
Par conséquent, le dispositif de communication reçoit (304) un signal vocodé en provenance de la station de base. Le signal vocodé est constitué d'une succession de trames, chaque trame contenant des informations audio et une valeur de l'énergie de trame correspondante, et, de préférence, une valeur de détection voisé/non voisé de trame. Le DSP ira ensuite chercher (306) les paramètres de la première trame ou des trames suivantes. Le DSP commence par calculer une valeur moyenne décalée. On entend par moyenne décalée, que les changements dans un sens d'un paramètre donné, comme la valeur de l'énergie de trame, changent la valeur moyenne décalée pour la valeur actuelle du paramètre, tandis que les changements dans l'autre sens entraînent l'ajustement de la valeur moyenne décalée selon une fonction de moyennage, ce qui entraîne une diminution par rapport à la valeur précédente. Après être allé chercher les paramètres de la trame suivante et avoir calculé la valeur moyenne décalée, le dispositif exécute un bloc de décision 308, qui inclut l'accomplissement des étapes consistant à fournir une valeur de seuil de l'indicateur vocal; à passer les informations audio sur le haut-parleur lorsque la moyenne décalée est supérieure à la valeur de seuil de l'indicateur vocal; et, tout en accomplissant l'étape consistant à passer les informations, à couper un microphone du dispositif de communication portable afin d'empêcher le retour audio. La valeur moyenne décalée et la valeur de seuil de l'indicateur vocal sont comparées aux blocs de décision 310 et 312. Le résultat de ces comparaisons est que, si quelque chose doit être
changé de l'état actuel du microphone et du haut-
parleur, alors le changement se produit selon les cases 314 et 316. A la case 314, le haut-parleur est activé et le microphone est coupé, et c'est l'inverse à la case 316. Une fois que l'action demandée a été effectuée, le dispositif de communication revient pour aller chercher les paramètres de la trame suivante. Si, après avoir effectué l'une des comparaisons, soit en 310, soit en 312, aucun changement n'est nécessaire, le dispositif de communication revient pour chercher les paramètres de la trame suivante sans aucun changement
des états du microphone et du haut-parleur.
En référence maintenant à la figure 4, celle-ci est un organigramme 400 d'un procédé permettant de mettre à jour les paramètres utilisés lors de la détermination de l'instant o activer le haut-parleur,
selon un mode de réalisation de la présente invention.
L'intégralité de ce qui est représenté sur la figure 4 est accompli à la case 306 de la figure 3. Tout d'abord, le dispositif de communication charge ou va chercher la valeur de l'énergie de trame (402) de la trame courante. Ensuite, une décision est prise (404), selon laquelle la valeur de l'énergie de trame est comparée à la valeur moyenne décalée (SAV). Au début, la valeur moyenne décalée peut être réglée sur n'importe quelle valeur, mais le zéro convient parfaitement. Si l'énergie de trame est supérieure à la valeur moyenne décalée, la valeur moyenne décalée est fixée comme étant égale à la valeur de l'énergie moyenne, comme à la case 406. Toutefois, si la valeur moyenne décalée actuelle, c'est-à-dire la valeur moyenne décalée qui a été déterminée précédemment, est supérieure à la valeur de l'énergie de trame courante, alors la valeur moyenne décalée courante est calculée en réduisant la valeur moyenne décalée actuelle d'un facteur de moyennage (408). Le facteur de moyennage peut être une constante préselectionnée, mais dans le mode de réalisation préféré, il prend la forme suivante: y[n]= a-y[n-l] + (l-a)ex[n], o y[n] est la valeur moyenne décalée courante; a est un facteur d'échelle ayant une valeur comprise entre zéro et un, de préférence au moins égale à 0,8 et de préférence encore comprise entre 0,95 et 0,99; y [n-l] est la valeur moyenne décalée actuelle; et x[n] est la valeur de l'énergie de trame courante. En référence maintenant à la figure 5, celle-ci est un graphique 500 de l'énergie de trame dans le
temps et une valeur moyenne décalée dérivée de celle-
ci, selon un mode de réalisation de la présente invention. L'énergie de trame est la ligne pleine 502 tandis que la valeur moyenne décalée est représentée par la ligne brisée. La figure 6 représente le même graphique sans la valeur de l'énergie et seulement la valeur moyenne décalée, ici, sous la forme d'une ligne pleine 504. Au même instant t, (506), la personne distante commence à parler. Sur la figure 6, se trouve une ligne brisée 600 à une valeur constante de l'énergie de trame, qui représente une valeur de seuil de l'indicateur vocal. Lorsque la valeur décalée 504 est supérieure à la valeur de seuil de l'indicateur vocal, le haut-parleur est activé et le microphone coupé. A partir du graphique de la figure 6, on peut voir que le haut-parleur sera donc actif entre l'instant t1 et l'instant t2. Toutefois d'après l'énergie de trame 502, on peut voir qu'il y a plusieurs périodes pendant lesquelles l'énergie de trame chute en dessous de la valeur de seuil de l'indicateur vocal, ce qui serait le cas si une personne disait une phrase dans laquelle se trouvent de
brèves pauses entre les mots. Toutefois, si le haut-
parleur est, en alternance, activé et coupé selon ces excursions, cela entraîne un hachage de brèves parties des informations audio, ce qui est évité en utilisant la valeur moyenne décalée sur laquelle les décisions
sont basées.
Bien que le mitigeage des états du haut-parleur et du microphone basés sur la seule énergie de trame, comme dans l'exemple précédent, soit efficace, on peut améliorer la prise de décision. Il peut arriver quelquefois que la personne distante se trouve dans un environnement bruyant, et qu'on puisse entendre le bruit de fond. De manière générale, le bruit de fond est hautement fricatif, et tend à dégrader la valeur de détection voisé/non voisé du signal vocal de la personne distante. Toutefois, il a été prouvé que, en général, une personne se trouvant dans un environnement bruyant a tendance à parler plus fort. Si ce n'est pas le cas, l'utilisateur du dispositif de communication portable peut demander à la personne distante de parler plus fort. Dans le mode de réalisation préféré, au lieu de simplement utiliser la seule énergie de trame sur laquelle baser les décisions, on a découvert qu'utiliser le produit de la valeur de l'énergie de trame et de la valeur de détection voisé/non voisé rend plus précise la valeur moyenne décalée. Dans le VSELP, l'énergie de trame est donnée comme étant rO, qui est connue pour signifier l'évaluation de la fonction d'autocorrélation à la position zéro, et les valeurs de détection voisé/non voisé sont des nombres entiers 0, 1, 2 ou 3. Ainsi, on donnera une plus grande importance aux trames ayant une valeur de détection voisé/non voisé élevée, même si elles peuvent avoir des valeurs de l'énergie de trame de faible ou de moyenne gamme, seront mises en valeur. On peut voir cet effet sur la figure 7, sur laquelle l'axe vertical, au lieu d'être une énergie de trame seule, est le produit de la valeur de l'énergie de trame et de la valeur de détection voisé/non voisé. La valeur moyenne décalée 504 est toujours proportionnelle à l'énergie de trame, mais sur une base d'une trame à la fois, l'importance donnée au mode de détection voisé/non voisé change considérablement et rend plus précis le graphique, dans le temps. Ceci permet à la valeur de seuil de l'indicateur vocal 600 d'augmenter afin de séparer encore des trames qui ont une teneur vocale et des trames qui n'en ont pas. Au même instant, une grande partie du bruit de fond, qui est, pour la plus grande part, sinon purement fricatif, entraîne un produit de zéro dans le VSELP. L'enveloppe de la valeur moyenne décalée permet encore de passer des trames ayant une faible valeur de détection voisé/non voisé une fois que le haut-parleur est activé, mais le fait de baser la valeur moyenne décalée et la valeur de seuil de l'indicateur vocal sur le produit de la valeur de l'énergie de trame et de la valeur de détection
voisé/non voisé rend plus précise la prise de décision.
Une autre technique qui contribue à la clarté d'un téléphone à hautparleur dans un dispositif de communication portable est illustrée sur la figure 8, et concerne la détermination de la valeur de seuil de l'indicateur vocal. Etant donné que la valeur de seuil de l'indicateur vocal est la valeur qui détermine l'instant o la valeur moyenne décalée indique qu'une voix est présente dans les informations audio reçues, elle peut et elle doit être optimisée. Dans l'examen ci-dessus de la figure 6, la valeur de seuil de l'indicateur a été représentée comme une valeur
constante, qui donnera des résultats acceptables.
Toutefois, dans le mode de réalisation préféré, la valeur de seuil de l'indicateur vocal est dynamique, et change avec l'énergie de trame moyenne dans des conditions non voisées. Dans la pratique, et comme le montre la figure 8, une première moyenne de l'énergie de trame 800 est calculée, mais n'est remise à jour que lorsque la valeur de détection voisé/non voisé est suffisamment faible pour indiquer une trame non voisée, et que la valeur moyenne décalée est inférieure à la valeur de seuil de l'indicateur vocal. La moyenne est une moyenne glissante. Dans le mode de réalisation préféré, qui utilise le VSELP, la moyenne de l'énergie de trame n'est remise à jour que lorsque la valeur de détection voisé/non voisé est égale à zéro, et que la valeur moyenne décalée chute en dessous de la valeur de seuil de l'indicateur vocal précédente. Ainsi, pendant le moment compris entre l'instant t, et l'instant t2, la moyenne 800 reste constante. En dehors de ce moment, et en supposant que la valeur de détection voisé/non voisé soit suffisamment faible, la moyenne change avec l'énergie de trame. La moyenne peut, par exemple, être
calculée en utilisant la formule y[n] = a-y[n-1] + (1-
a).x[n], décrite ci-dessus en référence au calcul de la valeur moyenne décalée, mais sans les changements instantanés lorsque l'énergie de trameaugmente. La valeur de seuil dynamique de l'indicateur vocal 802 est calculée en ajoutant une constante présélectionnée pour obtenir un graphique identique à la moyenne décalée par la constante. Le calcul de la valeur de seuil de l'indicateur vocal de cette manière renforce le fonctionnement d'un téléphone à haut-parleur dans un dispositif de communication portable en mettant en marche le haut-parleur plus tôt, lorsque le signal reçu est relativement propre et exempt de bruit, et réduit la quantité de bruit entendue dans le haut-parleur lorsque le signal reçu contient une plus grande
quantité de bruit.
Une autre technique qui augmente, de manière significative, la qualité du fonctionnement du téléphone à haut-parleur dans un dispositif de communication portable selon la présente invention est décrite en référence à la figure 9. En référence à la figure 9, celle-ci est un graphique d'une valeur moyenne décalée dans le temps qui montre des zones séparées dans lesquelles la valeur moyenne décalée diminue à un rythme différent selon la zone actuelle,
selon un mode de réalisation de la présente invention.
En général, le problème, dans ce cas, consiste en ce que, lorsqu'on utilise une valeur moyenne décalée, si la personne distante arrête de parler et si la moyenne décalée est élevée, en particulier si on utilise le procédé par produit consistant à calculer la moyenne décalée, un retard excessif peut se produire par rapport au moment o la personne distante s'arrête de parler, et la valeur de la moyenne décalée chute suffisamment pour que les paroles soient déclarées absentes et que le microphone soit activé. Cela entraînerait que, si l'utilisateur du dispositif de communication portable commençait à parler immédiatement avoir entendu que la personne distante s'est arrêtée de parler, la partie initiale des paroles de l'utilisateur ne serait pas transmise puisque le microphone n'aurait pas été activé, et la personne distante n'entendrait pas cette partie des paroles de l'utilisateur. Pour résoudre ce problème, le facteur d'échelle utilisé dans le calcul de la diminution de la valeur moyenne décalée varie avec l'amplitude de la valeur moyenne décalée. En général, plus la valeur moyenne décalée est élevée, plus le facteur d'échelle
est faible. Aussi, dans l'équation y[n] = a-y[n-l + (1-
a)ex[n], o a est le facteur d'échelle, a décroît au fur
et à mesure que la valeur moyenne décalée augmente.
Ainsi, plus la valeur moyenne décalée est élevée, plus une valeur de l'énergie de trame ou une valeur de produit (rOodétection voisé/non voisé) plus faible aura de poids lors du calcul d'une nouvelle valeur moyenne décalée. Dans le mode de réalisation préféré, on a découvert qu'il était suffisant de définir des zones de la valeur moyenne décalée, et d'attribuer un facteur d'échelle différent à chaque zone. Ainsi, dans une première zone 900, un premier facteur d'échelle a, est utilisé, dans une deuxième zone 902, un deuxième facteur d'échelle a2 est utilisé, et dans une troisième zone 903, un troisième facteur d'échelle a3 est utilisé, avec al<a2<a3. En utilisant des facteurs d'échelle plus petits, sensiblement en donnant un poids plus important aux valeurs plus faibles dans le calcul de moyennage, il faut moins de temps avant de libérer le microphone et de couper le haut-parleur lorsque les paroles d'un signal reçu s'achèvent, ce qui évite le problème du hachage de la partie initiale des paroles de l'utilisateur du téléphone à haut- parleur. Tel que mentionné ci-dessus, l'étape consistant à couper le microphone, et plus particulièrement à ne pas transmettre un signal quelconque au cours du moment o le circuit de sortie audio passe les informations audio dans le haut-parleur, peut être effectuée de différentes façons. Un procédé par logiciel classique consisterait à éteindre le microphone de sorte qu'un signal audio n'est pas généré. Toutefois, dans les dispositifs de communication portables modernes, un tel procédé n'est pas aussi simple qu'il semble. Tout d'abord, le programme de détection d'activité vocale est effectué par un DSP. Afin de couper le microphone grâce à un logiciel, le DSP doit envoyer une demande au processeur hôte, la demande doit être traitée par le processeur hôte, et ainsi de suite. En général, une telle démarche entraînera un retard inacceptable dans
la coupure du microphone.
Un procédé plus simple et plus rapide peut être exécuté par le DSP. Dans un dispositif de communication portable qui fonctionne en mode audio en duplex total, tel un téléphone cellulaire, les circuits de traitement des signaux effectue une suppression de l'écho. L'écho est, de toute évidence un problème potentiel lorsque le téléphone à haut-parleur fonctionne, mais il peut également être un problème dans un téléphone standard si le volume du haut-parleur du pavillon est suffisamment fort. Un moyen classique de suppression de l'écho consiste à comparer le signal audio entrant provenant du microphone avec le signal audio sortant reçu en provenance de la station de base. Si les signaux sont suffisamment similaires, tel que déterminé par des moyens classiques, alors on déclare qu'il y a de l'écho. Une fois que la présence de l'écho a été déclarée, les circuits de traitement, au lieu d'envoyer le signal audio entrant qui contient l'écho, envoient
des informations d'inactivité de la parole.
Les informations d'inactivité de la parole sont dérivée du bruit de fond détecté au niveau du microphone. De manière classique, les informations d'inactivité de la parole sont utilisées pour réduire le drain de batterie dans les dispositifs de communication portables; si l'utilisateur du dispositif ne parle pas, plutôt que de continuer à transmettre, le dispositif transmet périodiquement des informations d'inactivité de parole qui sont utilisées par le matériel de réception, telle qu'une station de base, afin de reconstruire le bruit de fond. Ceci est connu de la technique sous le nom de transmission discontinue. Le type de transmission fournit à une personne qui écoute, un signal audible qui confirme la présence continue de la personne qui est en train de parler, en dépit de l'absence de paroles. Les informations d'inactivité de parole sont immédiatement disponibles dans de nombreux signaux vocodés, et, dans le VSELP, un type d'information d'inactivité de parole est fourni et on y fait référence comme étant un bruit d'attente. Lorsqu'on mesure l'écho dans le signal audio entrant, un seuil d'écho est sélectionné, et si la différence entre l'énergie du signal sortant et l'énergie du signal entrant est supérieure au seuil, la présence d'écho est déclarée et des informations d'inactivité de parole sont envoyées. Par ailleurs, si le seuil d'écho n'est pas dépassé, le signal entrant est traité comme normal. Pour couper le microphone pendant le fonctionnement de téléphone à haut-parleur,
chaque fois qu'une voix est détectée au niveau du haut-
parleur (on a déclaré la présence de paroles), le DSP fixe le seuil d'écho à une valeur très basse, de sorte que l'algorithme de suppression d'écho déclare la présence d'écho, ce qui entraîne l'envoi d'informations d'inactivité de parole uniquement. Au contraire, lorsque des paroles ne sont pas détectées dans le signal vocodé sortant reçu de la station de base, le haut-parleur est coupé, de sorte que l'écho n'est pas possible, et le seuil d'écho est fixé à une valeur très haute, de sorte que la présence d'écho n'est jamais déclarée. Il en résulte que le microphone est toujours actif, bien que, au cours des périodes de silence dans le signal audio entrant, des informations d'inactivité de parole soient toujours envoyées. Si le dispositif de communication fonctionne en mode téléphone standard, le
seuil d'écho est fixé à une valeur nominale.
Un exemple de ce processus est illustré sur la figure 10. Au début (1000) l'utilisateur du dispositif de communication a sélectionné le fonctionnement en mode téléphone à haut-parleur. Tout d'abord, l'étape consistant à déclarer la présence de paroles est
effectuée (1010), de préférence tel que décrit ci-
dessus. Si la présence de paroles a été déclarée (1020), le seuil d'écho est fixé à un niveau très bas pour être sûr que la présence d'écho sera toujours déclarée. Si des paroles n'ont pas été détectées dans le signal vocodé sortant reçu (1030), le seuil d'écho est fixé à une valeur élevée pour être sûr que la présence d'écho n'est pas déclarée. Ensuite, l'étape consistant à effectuer une détection d'écho (1040) est effectuée, en se basant sur le seuil d'écho. Cette étape est la même que celle effectuée par le dispositif de communication lorsqu'il fonctionne en mode téléphone standard. Si le seuil d'écho a été fixé à une valeur faible, la présence d'écho est déclarée (1045), et des informations d'inactivité de parole sont envoyées (1060). Si le seuil d'écho a été fixé à une valeur élevée, la présence d'écho n'est pas déclarée, et l'étape d'évaluation du contenu du signal audio entrant
en matière d'activité de parole est effectuée (1050).
L'étape d'évaluation (1050) peut être la même que celle utilisée par le dispositif de communication lorsqu'il fonctionne en mode téléphone standard. Si des paroles ne sont pas détectées, des informations d'inactivité de parole sont alors envoyées (1060), et si des paroles sont détectées dans le signal audio entrant, le signal audio entrant vocodé est transmis (1070). Le procédé représenté et décrit ici en référence à la figure 10 est répété tant que le dispositif de communication se trouve en mode téléphone à haut-parleur. Si le dispositif de communication est reconfiguré pour fonctionner en mode téléphone standard, le seuil d'écho
sera fixé à une valeur nominale.
Ainsi, la présente invention fournit un téléphone à haut-parleur dans un dispositif de communication portable et résout les problèmes associés à la technique antérieure. La technique fondamentale pour commander de manière efficace le fonctionnement du haut-parleur et du microphone en mode de fonctionnement de semi duplex est l'utilisation d'une valeur moyenne décalée ou enveloppe. La valeur moyenne décalée est proportionnelle à l'énergie de trame, peut être exclusivement basée sur l'énergie de trame, mais, dans le mode de réalisation préféré, c'est le produit de la valeur de l'énergie de trame et de la valeur de détection voisé/non voisé. Pour améliorer encore le fonctionnement du téléphone à haut-parleur, la valeur de seuil de l'indicateur vocal est dynamique, basée sur une moyenne de l'énergie de trame mise à jour uniquement lorsque la valeur de détection voisé/non voisé est suffisamment basse. Une troisième technique utilisée pour améliorer le fonctionnement du téléphone à haut- parleur consiste à régler le poids donné à des valeurs plus faibles lorsqu'on met à jour la valeur moyenne décalée, sur la base de la valeur actuelle de la moyenne décalée. Des valeurs moyennes décalées présentes entraînent qu'un poids plus important est donné à une énergie de trame plus faible ou au produit des valeurs de l'énergie de trame et de la détection
voisé/non voisé.
Alors que les modes de réalisation préférés de la présente invention ont été illustrés et décrits, il est clair que l'invention n'est pas limitée par ceux-ci. De nombreux changements, modifications, variantes et équivalents apparaîtront aux spécialistes de la technique sans que l'on s'éloigne de l'esprit ni du cadre de la présente invention telle que définie dans
les revendications jointes.

Claims (10)

REVENDICATIONS
1. Procédé de fonctionnement de téléphone à haut-
parleur dans un dispositif de communication portable, comprenant les étapes consistant à: recevoir un signal vocodé présentant une succession de trames, chaque trame contenant des informations audio et une valeur de l'énergie de trame correspondante; calculer une valeur moyenne décalée proportionnelle à la valeur de l'énergie de trame; fournir une valeur de seuil de l'indicateur vocal; passer les informations audio sur le haut-parleur lorsque la valeur moyenne décalée est supérieure à une valeur de seuil de l'indicateur vocal; et tout en effectuant l'étape consistant à passer les informations, couper le microphone du dispositif de
communication portable afin d'empêcher le retour audio.
2. Procédé de fonctionnement de téléphone à haut-
parleur tel que défini dans la revendication 1, dans lequel l'étape consistant à calculer une valeur moyenne décalée comprend: la comparaison d'une valeur de l'énergie de trame courante avec une valeur moyenne décalée actuelle; si la valeur de l'énergie de trame courante est supérieure à la valeur moyenne décalée actuelle, la fixation de la valeur moyenne décalée pour qu'elle soit égale à la valeur de l'énergie de trame courante; et si la valeur de l'énergie de trame courante est inférieure à la valeur moyenne décalée actuelle, le calcul d'une valeur moyenne décalée courante en réduisant la valeur moyenne décalée actuelle grâce à un
facteur de moyennage.
3. Procédé de fonctionnement de téléphone à haut-
parleur tel que défini dans la revendication 2, dans lequel, lors de l'étape de calcul, le facteur de moyennage se présente sous la forme de y[n] = aey[n-1] + (1-a)ex[n], o: y[n] est la valeur moyenne décalée courante; a est un facteur d'échelle ayant une valeur comprise entre zéro et un y[n-l] est la valeur moyenne décalée actuelle et x[n] est la valeur de l'énergie de trame courante.
4. Procédé de fonctionnement de téléphone à haut-
parleur tel que défini dans la revendication 1, dans lequel le signal vocodé comprend une valeur de détecteur voisé/non voisé, lors de l'étape de calcul de la valeur moyenne décalée, la valeur moyenne décalée est le produit de la valeur de l'énergie de trame et de
la valeur de la détection voisé/non voisé.
5. Procédé de fonctionnement de téléphone à haut-parleur tel que défini dans la revendication 4, dans lequel l'étape de calcul d'une moyenne décalée comprend: la comparaison d'un produit de la valeur de l'énergie de trame courante et d'une valeur de détection voisé/non voisé courante avec une valeur moyenne décalée actuelle; si le produit est supérieur à la valeur moyenne décalée actuelle, fixation de la valeur moyenne décalée pour qu'elle soit égale au produit; et si le produit est inférieur à la valeur moyenne décalée actuelle, calcul d'une valeur moyenne décalée courante en réduisant la valeur moyenne décalée
actuelle d'un facteur de moyennage.
6. Procédé de fonctionnement de téléphone à haut-
parleur tel que défini dans la revendication 1, dans lequel l'étape consistant à fournir une valeur de seuil de l'indicateur vocal comprend le calcul d'une moyenne glissante de l'énergie de trame lorsque la valeur moyenne décalée est inférieure à une valeur de seuil de l'indicateur vocal précédente et à une valeur de détection voisé/non voisé correspondant à la valeur de l'énergie de trame mentionnée comme étant une trame non
voisée.
7. Procédé de fonctionnement de téléphone à haut-
parleur tel que défini dans la revendication 1, dans lequel l'étape consistant à couper le microphone comprend: la fixation d'un seuil d'écho à une valeur suffisamment faible; l'exécution d'un programme de détection d'écho; la déclaration de la présence d'un écho; et la transmission d'informations d'inactivité de
parole.
8. Procédé de fonctionnement d'un dispositif de
communication portable en mode téléphone à haut-
parleur, le dispositif de communication portable ayant un haut-parleur permettant de passer des informations audio reçues, et un microphone permettant de recevoir des signaux audio, le procédé comprenant les étapes suivantes: établir une session de communication audio en duplex intégral avec une station de base; recevoir un signal vocodé présentant une succession de trames, chaque trame contenant des informations audio, une valeur de l'énergie de trame, et une valeur de détection voisé/non voisé de trame calculer une valeur moyenne décalée proportionnelle à la valeur de l'énergie de trame; fournir une valeur de seuil de l'indicateur vocal; passer des informations audio dans le haut- parleur lorsque la valeur décalée est supérieure à la valeur de seuil de l'indicateur vocal; tout en effectuant l'étape consistant à passer des informations, couper un microphone du dispositif de communication portable pour empêcher un retour audio; et supprimer la coupure du microphone lorsque l'étape de passage des informations n'est pas effectuée.
9. Procédé de fonctionnement d'un dispositif de communication portable en mode téléphone à haut-parleur tel que défini dans la revendication 8, dans lequel l'étape de calcul d'une valeur moyenne décalée comprend: la comparaison d'une valeur de l'énergie de trame courante avec une valeur moyenne décalée actuelle; si la valeur de l'énergie de trame est supérieure à la valeur moyenne décalée actuelle, fixation de la valeur moyenne décalée pour qu'elle soit égale à la valeur de l'énergie de trame courante; et si la valeur de l'énergie de trame est inférieure à la valeur moyenne décalée actuelle, calcul d'une valeur moyenne décalée courante en réduisant la valeur
moyenne décalée actuelle d'un facteur de moyennage.
10. Procédé de fonctionnement d'un dispositif de communication portable en mode téléphone à haut-parleur tel que défini dans la revendication 8, dans lequel dans l'étape de calcul de la valeur moyenne décalée, la valeur moyenne décalée est un produit de la valeur de l'énergie de trame et de la valeur de détection
voisé/non voisé.
FR9909515A 1998-07-31 1999-07-22 Procede et appareil permettant un fonctionnement en telephone a haut-parleur dans un dispostif de communication portable Expired - Fee Related FR2781970B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/127,348 US6223154B1 (en) 1998-07-31 1998-07-31 Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds

Publications (2)

Publication Number Publication Date
FR2781970A1 true FR2781970A1 (fr) 2000-02-04
FR2781970B1 FR2781970B1 (fr) 2001-08-17

Family

ID=22429656

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9909515A Expired - Fee Related FR2781970B1 (fr) 1998-07-31 1999-07-22 Procede et appareil permettant un fonctionnement en telephone a haut-parleur dans un dispostif de communication portable

Country Status (8)

Country Link
US (1) US6223154B1 (fr)
JP (1) JP2000059496A (fr)
CN (1) CN1128512C (fr)
BR (1) BRPI9902991B1 (fr)
FI (1) FI117496B (fr)
FR (1) FR2781970B1 (fr)
GB (1) GB2342011B (fr)
HK (1) HK1025444A1 (fr)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method
US6345187B1 (en) * 1999-05-24 2002-02-05 Agere Systems Guardian Corp. Receipt of type II caller identification in multi-cordless environment
KR100310342B1 (ko) * 1999-07-21 2001-11-01 윤종용 휴대폰에서 스피커폰 모드시 송/수신 음성신호의 스위칭방법
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US7062302B2 (en) * 2000-05-12 2006-06-13 Denso Corporation Mobile terminal having power saving function variable with microphone usage conditions
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6662027B2 (en) * 2001-03-16 2003-12-09 Motorola, Inc. Method of arbitrating speakerphone operation in a portable communication device for eliminating false arbitration due to echo
US6961324B2 (en) * 2001-05-02 2005-11-01 Ipr Licensing, Inc. System and method for interleaving compressed audio/video (A/V) data frames
US7161905B1 (en) * 2001-05-03 2007-01-09 Cisco Technology, Inc. Method and system for managing time-sensitive packetized data streams at a receiver
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
US20030100350A1 (en) * 2001-11-27 2003-05-29 Kevin Dotzler Speakerphone mute indicator
US20050223113A1 (en) * 2002-07-02 2005-10-06 Klaus Hoffmann Runtime-dependent switching off of the echo compensation in packet networks
BR0312973A (pt) * 2002-07-26 2005-08-09 Motorola Inc Método para estimativa dinâmica rápida do ruìdo de fundo
KR100736246B1 (ko) 2002-07-26 2007-07-06 모토로라 인코포레이티드 통신 디바이스에서 스피커폰 동작을 위한 시스템 및 그 방법
KR100652645B1 (ko) 2004-07-23 2006-12-06 엘지전자 주식회사 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법
US7123714B2 (en) * 2004-08-25 2006-10-17 Motorola, Inc. Speakerphone having improved outbound audio quality
KR100884425B1 (ko) 2004-08-25 2009-02-19 모토로라 인코포레이티드 외부 오디오 품질이 개선된 스피커폰을 제공하는 방법 및 전화
US20060104460A1 (en) * 2004-11-18 2006-05-18 Motorola, Inc. Adaptive time-based noise suppression
JP4650163B2 (ja) * 2005-08-25 2011-03-16 パナソニック電工株式会社 拡声通話装置
US9049402B2 (en) * 2005-09-19 2015-06-02 Nxp, B.V. Method of synchronizing the playback of an audio broadcast on a plurality of network output devices
US8290543B2 (en) * 2006-03-20 2012-10-16 Research In Motion Limited System and methods for adaptively switching a mobile device's mode of operation
DE602006002592D1 (de) * 2006-03-20 2008-10-16 Research In Motion Ltd System und Verfahren zum adaptiven Umschalten des Betriebsmodus eines Mobilgeräts
CN100573663C (zh) * 2006-04-20 2009-12-23 南京大学 基于语音特征判别的静音检测方法
US20080037451A1 (en) * 2006-07-28 2008-02-14 Motorola, Inc. Neutralization of acoustic echo cancellation in presence of signal clipping
ES2391228T3 (es) 2007-02-26 2012-11-22 Dolby Laboratories Licensing Corporation Realce de voz en audio de entretenimiento
CN101287274B (zh) * 2007-04-11 2012-07-04 深圳市维信联合科技有限公司 移动通信语音加密系统及其加密方法
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
GB2466454B (en) * 2008-12-18 2011-04-13 Motorola Inc Method and system for reducing howling in a half-duplex communication system
EP2633630A4 (fr) * 2010-10-27 2017-03-08 Hewlett-Packard Enterprise Development LP Systèmes, procédés et appareil pour autoriser une transmission audio dans une session de communication
JP6211256B2 (ja) * 2012-09-26 2017-10-11 株式会社ナビタイムジャパン 情報処理装置、情報処理方法、および情報処理プログラム
CN102904538B (zh) * 2012-10-10 2015-02-04 华平信息技术股份有限公司 音频模拟信号的agc增益参数调整方法
CN106713685A (zh) * 2016-11-25 2017-05-24 东莞市嘉松电子科技有限公司 免提通信控制方法
CN112243182B (zh) * 2019-07-17 2022-03-04 北京声智科技有限公司 拾音电路、方法及装置
CN113555024B (zh) * 2021-07-30 2024-02-27 北京达佳互联信息技术有限公司 实时通信音频处理方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4843621A (en) * 1987-04-24 1989-06-27 Motorola, Inc. Speakerphone using digitally compressed audio to detect acoustic feedback
US5737407A (en) * 1995-08-28 1998-04-07 Intel Corporation Voice activity detector for half-duplex audio communication system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4005276A (en) * 1975-03-20 1977-01-25 International Business Machines Corporation Digital voice signaling with digital echo detection and voice activity compression used to cancel echo
CA1181541A (fr) * 1982-05-21 1985-01-22 Mitel Corporation Telephone haut-parleur
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
CA1233925A (fr) * 1985-05-10 1988-03-08 Gordon J. Reesor Telephone numerique a haut-parleur
EP0235127B2 (fr) * 1985-09-03 1993-05-05 Motorola, Inc. Systeme de commande non-manuel pour radiotelephones
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4843621A (en) * 1987-04-24 1989-06-27 Motorola, Inc. Speakerphone using digitally compressed audio to detect acoustic feedback
US5737407A (en) * 1995-08-28 1998-04-07 Intel Corporation Voice activity detector for half-duplex audio communication system

Also Published As

Publication number Publication date
FR2781970B1 (fr) 2001-08-17
GB9916951D0 (en) 1999-09-22
FI991645A (fi) 2000-02-01
BRPI9902991B1 (pt) 2015-07-21
US6223154B1 (en) 2001-04-24
CN1128512C (zh) 2003-11-19
GB2342011A8 (en) 2001-04-05
CN1266312A (zh) 2000-09-13
GB2342011A (en) 2000-03-29
GB2342011B (en) 2000-12-13
FI117496B (fi) 2006-10-31
JP2000059496A (ja) 2000-02-25
BR9902991A (pt) 2000-08-01
HK1025444A1 (en) 2000-11-10

Similar Documents

Publication Publication Date Title
FR2781970A1 (fr) Procede et appareil permettant un fonctionnement en telephone a haut-parleur dans un dispostif de communication portable
US6138040A (en) Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
EP2100295B1 (fr) Procédé et circuit de suppression de bruit intégrant une pluralité de techniques de suppression de bruit
US5881373A (en) Muting a microphone in radiocommunication systems
EP0768770B1 (fr) Procédé et dispositif de création d&#39;un bruit de confort dans un système de transmission numérique de parole
JP4897173B2 (ja) ノイズ抑制
US6122531A (en) Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
US8750526B1 (en) Dynamic bandwidth change detection for configuring audio processor
JP2001510655A (ja) デジタル電話システムの機能素子を制御するために状態決定を使用する方法および装置
JP2008058983A (ja) 音声コーディングにおける雑音のロバストな分類のための方法
EP1401183B1 (fr) Procédé et dispositif d&#39;annulation d&#39;echo
US8873740B2 (en) Enhanced echo cancellation
US7246059B2 (en) Method for fast dynamic estimation of background noise
US9489958B2 (en) System and method to reduce transmission bandwidth via improved discontinuous transmission
FR2752349A1 (fr) Appareil et procede permettant de generer du bruit dans un recepteur numerique
EP1278360A1 (fr) Adaptation du volume sonore d&#39;un signal acoustique d&#39;appel entrant en fonction d&#39;un degré de confinement
US6711259B1 (en) Method and apparatus for noise suppression and side-tone generation
US9099095B2 (en) Apparatus and method of processing a received voice signal in a mobile terminal
JP3466049B2 (ja) 通話機の音声スイッチ
JP3466050B2 (ja) 通話機の音声スイッチ
FR2767941A1 (fr) Suppresseur d&#39;echo par transformation de sens et procede associe
EP0317862B1 (fr) Dispositif d&#39;amélioration du confort d&#39;écoute par suppression des phénomènes transitoires dans une chaîne de réception d&#39;un équipement FM/PM à bande étroite, notamment en radiotéléphonie
EP0762639B1 (fr) Dispositif de commande de volume sonore pour récepteur de signaux de parole codés par blocs
EP0822681B1 (fr) Procédé et dispositif d&#39;estimation de la qualité de blocs d&#39;information reçus via un système de transmission utilisant un codage par blocs
JPH0832526A (ja) 音声検出器

Legal Events

Date Code Title Description
TP Transmission of property

Owner name: MOTOROLA MOBILITY, INC., US

Effective date: 20110912

PLFP Fee payment

Year of fee payment: 18

CD Change of name or company name

Owner name: GOOGLE TECHNOLOGY HOLDINGS LLC, US

Effective date: 20171214

TP Transmission of property

Owner name: GOOGLE TECHNOLOGY HOLDINGS LLC, US

Effective date: 20171214

ST Notification of lapse

Effective date: 20180330