MÉTODOS Y APARATOS PARA GENERAR FIRMAS CAMPO DE LA DIVULGACIÓN La presente divulgación se refiere, en términos generales, al monitoreo de medios y, más particularmente, a métodos y aparatos para generar firmas para su uso en la identificación de información de medios . ANTECENDENTES DE LA INVENCIÓN La identificación de información de medios y más particularmente corrientes de audio (por ejemplo, información de audio) mediante el empleo de técnicas de correspondencia de firma es bien conocida. Técnicas conocidas de correspondencia de firmas se utilizan frecuentemente en aplicaciones para medir audiencia de televisión y de radio y se implementan utilizando varios métodos conocidos para generar y comparar firmas. Por ejemplo, en aplicaciones de medición de audiencia de televisión, se generan firmas en sitios de monitoreo (por ejemplo, hogares monitoreados) y sitios de referencia. Los sitios de monitoreo incluyen típicamente ubicaciones como, por ejemplo, hogares en donde se monitorean el consumo de los miembros de la audiencia. Por ejemplo, en un sitio de monitoreo, firmas monitoreadas pueden ser generadas con base en corrientes de audio asociadas con un canal seleccionado, estación de radio, etcétera. Las firmas monitoreadas pueden ser entonces enviadas a una instalación central de recopilación de datos para análisis.
En un sitio de referencia, firmas, típicamente conocidas como firmas de referencia, son generadas con base en programas conocidos que se ofrecen dentro de una región de difusión. Las firmas de referencia pueden estar almacenadas en el sitio de referencia y/o en una instalación de recopilación central de datos y comparadas con las firmas monitoreadas generadas en sitios de monitoreo. Se puede encontrar que una firma monitoreada corresponde a una firma de referencia y el programa conocido que corresponde a la firma de referencia correspondiente puede ser identificado como el programa que fue presentado en el sitio del monitoreo. BREVE DESCRIPCIÓN DE LOS DIBUJOS Las Figuras 1A y IB ilustran ejemplos de sistemas de identificación de corriente de audio para generar firmas espectrales digitales y para identificar corrientes de audio. La Figura 2 es una representación de dominio de tiempo de una corriente de audio monitoreada de ejemplo y de varios marcos de muestra de audio adquiridos a partir de la corriente de auido monitoreada. La Figura 3 es una representación de dominio de tiempo de una corriente de audio de referencia de ejemplo y varios marcos de muestra de audio adquiridos a partir de la corriente de audio de referencia de ejemplo. La Figura 4 es un diagrama de flujo de un método de ejemplo para generar firmas espectrales digitales con base en descomposiciones espectrales. La Figura 5 es un diagrama de flujo de un método de ejemplo para generar descriptores asociados con el método de ejemplo de la Figura 4. La Figura 6 es un diagrama de flujo de otro método de ejemplo para generar firmas espectrales digitales con base en descomposiciones espectrales. La Figura 7 es un diagrama de flujo de un método de ejemplo para generar descriptores asociados con el método de ejemplo de la Figura 6. La Figura 8 es un diagrama de flujo de un método de ejemplo para comparar las firmas espectrales digitales generadas mediante la utilización de los métodos de ejemplo de las Figuras 4-7. La Figura 9 es un diagrama de bloques de un sistema de generación de firmas de ejemplo para generar firmas espectrales digitales con base en corrientes de audio. La Figura 10 es un diagrama de bloques de otro sistema de generación de firmas de ejemplo para generar firmas espectrales digitales basadas en corrientes de audio. La Figura 11 es un diagrama de bloques de un sistema de comparación de firmas de ejemplo para comparar firmas espectrales digitales. La Figura 12 es un diagrama de bloques de un sistema de procesador de ejemplo que puede ser utilizado para implementar los métodos y aparatos descritos aqui. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Aún cuando se describen a continuación sistemas de ejemplo que incluyen, entre otros componentes, sofware ejecutado en hardware, se observará que tales sistemas son simplemente ilustrativos y no deben considerarse limitativos. Por ejemplo, se contempla que cualquiera o la totalidad de estos componentes de hardware y sofware podrían incorporarse exclusivamente en hardware, exclusivamente en sofware, o bien en cualquier combinación de hardware y sofware. Por consiguiente, la siguiente descripción presenta sistemas de ejemplos y las personas con conocimientos ordinarios en la materia observarán fácilmente que los ejemplos proporcionados no son la única forma de implementar dichos sistemas. Los métodos y aparatos descritos aquí se refieren generalmente a la generación de firmas espectrales digitales que pueden emplearse para identificar información de medios. En particular, los métodos y aparatos divulgados se describen con relación a la generación de firmas espectrales digitales con base en corrientes de audio (por ejemplo, información de audio) . Sin embargo, los métodos y aparatos descritos aquí pueden también utilizarse para generar firmas espectrales digitales con base en cualquier otro tipo de información de medios como por ejemplo información de video, páginas web, imágenes estáticas, datos de computadora, etcétera. Además, la información de medios puede estar asociada con información difundida (por ejemplo, información de televisión, información de radio, etcétera) , información reproducida a partir de cualquier medio de almacenamiento (por ejemplo, discos compactos (CD) , discos versátiles digitales (DVD) , etcétera) , o cualquier otra información asociada con una corriente de audio, una corriente de video, o cualquier otra información de medios para la cual se generan firmas espectrales digitales. En un ejemplo particular, las corrientes de audio son identificadas con base en firmas espectrales digitales que incluyen firmas digitales monitoreadas generadas en un sitio de monitoreo (por ejemplo, un hogar monitoreado) y firmas digitales de referencia generadas y/o almacenadas en un sitio de referencia y/o en una instalación central de recopilación de datos. De conformidad con lo descrito con detalles abajo, los métodos y aparatos descritos aquí identifican información de medios que incluye corrientes de audio basada en firmas espectrales digitales. Las firmas espectrales digitales pueden estar formadas mediante la utilización de descriptores digitales generado con base en los componentes espectrales de una corriente de audio y que pueden ser analizados empleando transformaciones de frecuencia y/o transformaciones de wavelet . A diferencia de métodos conocidos en la técnica anterior que utilizaron operaciones intermarcos (por ejemplo, operaciones basadas en datos de muestra dentro de marcos de muestra de datos diferentes) para generar firmas espectrales digitales, los métodos y aparatos descritos aquí pueden ser implementados utilizando operaciones 'intramarcos (por ejemplo, operaciones basadas en datos de muestra dentro de un solo marco) . Operaciones intramarco pueden incluir, por ejemplo, operaciones de comparación, determinación de diferencias porcentuales entre valores, etcétera que se efectúan en dos o más valores (por ejemplo, valores de potencia espectral) asociados únicamente con un solo marco o derivados de un solo marco. Por ejemplo, utilizando los métodos y aparatos descritos descritos aquí, se puede generar una firma espectral digital mediante la obtención de un marco de muestras de medios, determinando valores de potencia espectral mediante la realización de una transformada espectral (por ejemplo, una FFT, una transformada wavelet, etcétera) en el marco de muestras de medios, y efectuando una operación intramarco (por ejemplo, una comparación) con base en dos o más valores de potencia espectral asociados de manera única con el marco de muestras de medios. Componentes de frecuencia de una señal de audio son típicamente generados mediante la transformación de los datos de señal de audio (por ejemplo, una corriente de audio) del dominio de tiempo al dominio de frecuencia utilizando por ejemplo una Transformada de Fourier. La Transformada de Fourier puede ser utilizada para analizar los componentes de frecuencia en una corriente de audio y para identificar la potencia espectral de cada componente de frecuencia. Las potencias espectrales pueden ser entonces utilizadas para generar firmas espectrales digitales. Firmas espectrales digitales pueden también ser generadas con base en transformadas wavelet que transforman datos de audio del dominio de tiempo al dominio de wavelet. En general, las transformadas wavelet pueden ser utilizadas para descomponer bloques o marcos de datos (por ejemplo, muestras de audio de dominio de tiempo) en múltiples sub-bandas, permitiendo así analizar los conjuntos de datos en varias escalas y/o resoluciones. Mediante la separación de datos en múltiples sub-bandas, una transformación de wavelet puede ser utilizada para analizar cada intervalo de tiempo de datos en una escala o resolución deseada. Firmas monitoreadas pueden ser generadas en un sitio de monitoreo con base en corrientes de audio asociadas con información de medios (por ejemplo, una corriente de audio monitoreada) consumida por una audiencia. Por ejemplo, una firma monitoreada puede ser generada con base en la pista de audio de un programa de televisión presentado en un sitio de monitoreo. La firma monitoreada puede ser entonces enviada a una instalación de recopilación de datos central para comparación con una o varias firmas de referencia. Se generan firmas de referencia en un sitio de referencia y/o en una instalación de recopilación de un central de datos con base en corrientes de audio asociadas con información de medio conocida. La información de medio conocida puede incluir medio difundido dentro de una región, medio reproducido dentro un hogar, medio recibido a través de internet, etcétera. Cada firma de referencia está almacenada en una memoria con información de identificación de medio como por ejemplo título de una canción, título de una película, etcétera. Cuando una firma monitoreada es recibida en la instalación central de recopilación de datos, la firma monitoreada es comparada con una o varias firmas de referencia hasta encontrar una correspondencia. Esta información de conrrespondencia puede ser entonces utilizada para identificar la información de medio (por ejemplo, corriente de audio monitoreada) a partir de la cual se generó la firma monitoreada. Por ejemplo, se puede hacer referencia a una tabla de referencia o una base de datos para recuperar un título de medio, una identidad de programa, un número de episodio, etcétera. que corresponde a la información de medio para la cual se generó la firma monitoreada. De conformidad -con los descrito abajo con relación a las Figuras 2 y 3, más firmas de referecia son generadas en un sitio de referencia y/o en una instalación central de recopilación de datos para una corriente de audio dada que firmas monitoreadas generadas para una corriente de audio dada en un sitio de monitoreo. En particular, las firmas de referencia generadas para una corriente de audio (es decir, una corriente de audio de referencia) se empalman en el tiempo. Más especificamente, el tiempo de referencia inicial o sello de tiempo de cada firma de referencia es desplazado por una cantidad relativamente pequeña de tiempo a partir del tiempo de referencia inicial o sello de tiempo de una firma de referencia previa. De esta manera, una firma monitoreada generada en un sitio de monitoreo y que tiene un tiempo de referencia sustancialmente arbitrario puede ser alineada y/o puede ser correspondida con al menos una de las firmas de referencia generadas para una corriente de audio de referencia. Como resultado del número" relativamente pequeño de firmas monitoreadas generadas en el sitio de monitoreo, firmas monitoreadas pueden ser generados por sistemas de procesador y/o dispositivos de hardware que tienen una potencia de cómputo relativamente menor y/o una memoria relativamente menor que los sistemas de procesador y/o dispositivos de hardware utilizados para generar firmas de referencia . Las Figuras ÍA y IB ilustran sistemas de identificación 100 y 150 de corrientes de audio de ejemplo para generar firmas espectrales digitales y para identificar corrientes audio. Los sistemas de identificación de corrientes de audio 100 y 150 de ejemplo pueden ser implementados como un sistema de identificación de información difundida ¡ por televisión y un sistema de identificación de información difundida por radio, respectivamente. El sistema de identificación de corriente de audio de ejemplo 100 incluye un sitio de monitoreo 102 (por ejemplo, un hogar monitoreado) , un sitio de referencia 104, y una instalación central de recopilación de datos 106. El monitoreo de una información difundida por televisión incluye la generación de firmas monitoreadas en el sitio de monitoreo 102 con base en los datos de audio de información difundida por televisión y comunicar las firmas monitoreadas a la instalación central de recopilación de datos 106 a través de un red 108. Firmas de referencia pueden ser generadas en un sitio de referencia 104 y pueden también ser comunicadas a la instalación central de recopilación de datos 106 a través de la red 108. El contenido de audio representado por una firma monitoreada generada en el sitio de monitoreo 102 puede ser identificado en una instalación central de recopilación de datos 106 comparando la firma monitoreada con una o varias firmas de referencia hasta encontrar una correspondencia. Alternativamente, firmas monitoreadas pueden ser comunicadas a partir del ciclo de monitoreo 102 hacia el sitio de referencia 104 y comparadas contra una o varias firmas de referencia en el sitio de referencia 104. En otro ejemplo, las firmas de referencia pueden ser comunicadas al sitio de monitoreo 102 y comparadas con las firmas monitoreadas en sitio de monitoreo 102. El sitio de monitoreo 102 puede ser, por ejemplo, un hogar para el cual se monitorea el consumo de medio de una audiencia. En general, el sitio de monitoreo 102 puede incluir varios dispositivos de suministro de medios 110, varios dispositivos de presentación de medios 112, y un generadosr de firmas 114 utilizado para generar firmas monitoreadas asociadas con medios presentados en el sitio de monitoreo 102. Los varios dispositivos de suministro de medios 110 pueden ser, por ejemplo, sintonizadores de codificadores (por ejemplo, sintonizadores de televisión por cable, sintonizadores de televisión por satélite, etcétera) , reproductores de DVD, reproductores de CD, radios, etcétera. Algunos o todos los dispositivos de entrega de medios 110 como por ejemplo sintonizadores de codificadores pueden estar conectados para comunicación con uno o varios dispositivos de recepción de información difundida 116 que pueden incluir un cable, una antena de recepción de televisión por satélite, una antena, y/o cualquier dispositivo adecuado para recibir información difundida. Los dispositivos de suministro de medios 110 pueden estar configurados para reproducir información de medios (por ejemplo, información de audio, información de video, páginas web, imágenes estáticas, etcétera) con base, por ejemplo, en la información difundida y/o información almacenada. La información difundida puede ser obtenida a partir de los dispositivos receptores de información difundida 116 y la información almacenada puede obtenerse a partir de cualquier medio de almacenamiento de información (por ejemplo, un DVD, un CD, una cita, etcétera) . Los dispositivos de suministro de medios 110 están conectados de manera comunicativa con los dispositivos de presentación de medios 112 y pueden configurarse para comunicar información de medios a los dispositivos de presentación de medios 112 para presentación. Los dispositivos de presentación 112 pueden incluir televisores que tienen un dispositivo de despliegue y/o un conjunto de vocinas a través de las cuales miembros de la audiencia consumen, por ejemplo, información de televisión difundida con música, películas, etcétera. El generador de firmas 114 puede ser utilizado para generar firmas digitales monitoreadas basadas en información de audio de conformidad con lo descrito con mayores detalles abajo. En particular, en el sitio de monitoreo 102, el generador de firmas. 114 puede ser configurado' para generar firmas monitoreadas basadas en corrientes de audio monitoreadas reproducidas por los dispositivos de' suministro de medios 110 y/o presentadas por los dispositivos de presentación de medios 112. El generador de firmas 114 puede estar conectado de manera comunicativa con los dispositivos de suministro de medios 110 y/o con los dispositivos de presentación de medios 112 a través de una interfaz de monitoreo de audio 118. De esta manera, el generador de firmas 114 puede obtener corrientes de audio asociadas con infomación de medio reproducido por los dispositivos de suministro de medios 110 y/o presentados por los dispositivos de presentación de medio 112. Adicional o alternativamente, el generador de firmas 114 puede estar conectado de manera comunicativa con micrófonos
(no ilustrado) colocados en la cercanía de los dispositivos de presentación de medios 112 para detectar corrientes de audio. El generador de firmas 114 puede también estar conectado de manera comunicativa con la instalación central de recopilación de datos 106 a través de la red 108. La red 108 puede ser utilizada para comunicar firmas (por ejemplo, firmas espectrales digitales), información de control y/o información de configuración entre el sitio de monitoreo 102, el sitio de referencia 104, y la instalación central de recopilación de datos 106. Cualquier sistema de comunicación alámbrico o inalámbrico como por ejemplo una red por cable de banda ancha, una red DSL, una red de telefonía celular, una red satelital, y/o cualquier otra red de comunicación puede utilizarse para implementar la red 108.
Como se muestra en la Figura 1A, el sitio de referencia 104 puede incluir varios sintonizadores de información difundida 120, un generador de firmas de referencia 122, un transmisor 124, una base de datos o una memoria 126, y dispositivos de recepción de información difundida 128. El generador de firmas de referencia 122 y el transmisor 124 pueden estar conectados de manera comunicativa con la memoria 126 para almacenar firmas de referencia ahí y/o para recuperar firmas de referencia almacenadas a partir de ahí. Los sintonizadores de información difundida 120 pueden estar conectados de manera comunicativa con los dispositivos de recepción de información difundida 128 que pueden incluir un cable, una antena, una antena para recepción de televisión satelital, y/o cualquier otro dispositivo adecuado para recibir información difundida. Cada uno de los sintonizadores de información difundida 120 puede estar configurado para sitonizar un canal de difusión particular. En general, el número de sintonizadores en el sitio de referencia 104 es igual al número de canales disponibles en una región de difusión particular. De esta manera, se pueden generar firmas de referencia para toda la información de medios transmitida a través de todos los canales en una región de difusión. La porción de audio de la información de medios sintonizada puede ser comunicada a partir de los sintonizadores de información difundida 120 al generador de firmas de referencia 122. El generador de firmas de referencia 122 puede estar configurado para obtener la porción de audio de la totalidad de la información de medios disponible en una región de difusión particular. El generador de firmas de referencia 122 puede entonces generar varias firmas de referencia (de conformidad con lo descrito con mayores detalles abajo) con base en la información de audio y almacenar las firmas de referencia en la memoria 126. Aún cuando se muestra un generador de firmas de referencia en la Figura 1, se pueden utilizar varios generadores de firmas de referencia en el sitio de referencia 104. Por ejemplo, cada uno de los varios generadores de firmas puede estar conectado de manera comunicativa con un sintonizador respectivo de los sintonizadores de información difundida 120. El transmisor 124 puede estar conectado de manera comunicativa con la memoria 126 y configurado para recuperar firmas de ahí y comunicar las firmas de referencia a la instalación central de recopilación de datos 106 a través • de la red 108. La instalación central de recopilación de datos 106 puede estar configurada para comparar las firmas monitoreadas recibidas del sitio de monitoreo 102 con firmas recibidas del sitio de referencia 104. Además, la instalación central de recopilación de datos 106 puede estar configurada para identificar corrientes de audio monitoreadas mediante el hecho de hacer corresponder las firmas monitoreadas con firmas de referencia y utilizando la información de correspondencia para recuperar información de identificación de programas de televisión (por ejemplo, título de programa, hora de difusión, canal de difusión, etcétera) a partir de una base de datos. La instalación central de recopilación de datos incluye un receptor 130, un analizador de firmas 132, y una memoria 134, todos los cuales están conectados de manera comunicativa según lo ilustrado. El receptor 130 puede estar configurado para recibir firmas monitoreadas y firmas de referencia a través de la rede 108. El receptor 130 está conectado de manera comunicativa con la memoria 134 y configurado para almacenar las firmas monitoreadas y las firmas de referencia ahí. El analizador de firmas 132 puede ser utilizado para comparar firmas de referencia con firmas monitoreadas. El analizador de firmas 132 está conectado de manera comunicativa con la memoria 134 y configurado para recuperar las firmas monitoreadas y las firmas de referencia de ahí. El analizador de firmas 132 puede estar configurado para recuperar firmas de referencia y firmas monitoreadas a partir de la memoria 134 y comparar las firmas monitoreadas con las firmas de referecia hasta encontrar una correspondencia. La memoria 134 puede ser implementada empleando cualquier medio de almacenamiento de información accesible por máquina como por ejemplo una o varias unidades de disco duro, uno o varios dispositivos de almacenamiento óptico, etcétera. Aún cuando el analizador de firmas 132 esté localizado en la instalación central de recopilación de datos 106 en la Figura 1A, el analizador de firmas 132 puede estar localizado al contrario en el 'sitio de referencia 104. En dicha configuración, las firmas monitoreadas pueden ser comunicadas a partir del sitio de monitoreo 102 al sitio de referencia 104 a través de la red 108. Alternativamente, la memoria 134 puede estar localizada en el sitio de monitoreo 102 y firmas de referencia pueden ser agregadas periódicamente a la memoria 134 a través de la red 108 por el transmisor 124. Adicionalmente, aún cuando el analizador de firmas 132 es conocido como un dispositivo separado de los generadores de firma 114 y 122, el analizador de firmas 132 puede formarse de manera integral con el generador de firmas de referencia 122 y/o generador de firmas 114. Además, aún cuando la Figura 1 muestra un solo sitio de monitoreo (es decir, el sitio de monitoreo 102) y un solo sitio de referencia (es decir, el sitio de referencia 104), múltiples sitios de este tipo pueden estar conectados a través de la red 108 a la instalación central de recopilación de datos 106. El sistema de identificación de corrientes de audio 150 de la Figura IB puede estar configurado para monitorear e identificar corrientes de audio asociados con información difundida por radio. En general, el sistema de identificación de corriente de audio 150 se utiliza para monitorear el contenido difundido por varias estaciones de radio en una región de difusión particular. A diferencia del sistema de identificación de corriente de audio 100 utilizado para monitorear el contenido de televisión consumido por una audiencia, en sistema de identificación de corrientes de audio 150 de la Figura IB puede estar configurado para monitorear e identificar corrientes de audio asociados con información difundida por radio. En general, el sistema de identificación de corriente de audio 150 se utiliza para monitorear el contenido difundido por varias estaciones de radio en una región de difusión particular. A diferencia del sistema de identificación de corriente de audio 100 utilizado para monitorear el contenido de televisión consumido por una audiencia, el sistema de identificación de corriente de audio 150 puede ser utilizado para monitorear música, canciones, etcétera difundidas dentro de una región de difusión y el número de veces que son difundidas. Este tipo de rastreo de medios puede ser utilizado para determinar pagos de regalía, uso apropiado de derechos de autor, etcétera asociados con cada composición de audio. El sistema de identificación' de corrientes de audio 150 incluye un sitio de monitoreo 152, una instalación central de recopilación de datos 154, y la red 108. El sitio de monitoreo 152 está configurado para recibir toda la información difundida por radio disponible en una región de difusión particular y genera firmas monitoreadas basadas en la información difundida por radio. El sitio de monitoreo 152 incluye varios sintonizadores de información difundida 120, el transmisor 124, la memoria 126, y los dispositivos de recepción de información difundida 128, todos los cuales se describen arriba con relación a la Figura 1A. Además, el sitio de monitoreo 152 incluye un generador de firmas 156. Cuando se utilizan en el sistema de identificación de corrientes de audio 150, los dispositivos de recepción de información difundida 128 están configurados para recibir información difundida por radio y los sintonizadores de información difundida 120 están configurados para sintonizar las estaciones de difusión de radio. El número de sintonizadores de información difundida 120 en el sitio de monitoreo 152 puede ser igual al número de estaciones de difusión de radio en una región de difusión particular. El generador de firma 156 está configurado para recibir la información de audio sintonizada proveniente de cada uno de los sintonizadores de información difundida 120 y genera firmas monitoreadas para la misma. Aún cuando se muestra un generador de firmas (es decir, el generador de firmas 156) , el sitio de monitoreo 152 puede incluir varios generadores de firmas, cada uno de los cuales puede estar conectado de manera comunicativa con uno de los sintonizadores 120 de información difundida. El generador de firmas 156 puede almacenar unas firmas monitoreadas en la memoria 126. El transmisor 124 puede recuperar las firmas monitoreadas de la memoria 126 y comunicarlas a la instalación central de recopilación de datos 154 a través de la red 108. La instalación central de recopilación de datos 154 esta configurada para recibir firmas monitoreadas a partir del sitio de monitoreo 152, generar firmas de referencia con base en corrientes de audio de referencia y comparar las firmas monitoreadas con las firmas de referencia. La instalación central de recopilación de datos 154 incluye el receptor 130, el analizador de firmas 132, y la memoria 134, todos los cuales se describen con mayores detalles arriba con relación a la Figura 1A. Además, la instalación central de recopilación de datos 154 incluye un generador de firmas de referencia 158. El generador de firmas de referencia 158 está configurado para generar firmas de referencia con base en corrientes de audio de referencia. Las corrientes de audio de referencia pueden estar almacenadas en cualquier tipo de medio accesible por máquina como por ejemplo un CD, un DVD, una cinta de audio digital (DAT), etcétera. En general, artistas y/o compañías de producción de discos envían sus trabajos de audio (es decir, música, canciones, etcétera.) a la instalación central de recopilación de datos 154 para que se agregen a una biblioteca de referencia. El generador de firmas de referencia 158 puede leer los datos de audio provenientes del medio accesible a máquina y generar varias firmas de referencia con base en cada trabajo de audio (por ejemplo, la corriente de audio de referencia 302 de la Figura 3) . El generador de firmas de referencia 158 puede entonces almacenar las firmas de referencia en la memoria 134 para recuperación subsiguiente por parte del analizador de firmas 132. La información de identificación (por ejemplo, título de canción, nombre de artista, número de pista, etcétera) asociada con cada corriente de audio de referencia puede ser almacenada en una base de datos y puede ser index'ada con base en las firmas de referencia. De esta manera, la instalación central de recopilación de datos 154 incluye una base de datos de firmas de referencia e información de identificación que corresponde a todos los títulos de canción conocidos y disponibles . El receptor 130 está configurado para recibir firmas monitoreadas a partir de la red 108 y para almacenar las firmas monitoreadas en la memoria 134. Las firmas monitoreadas y las firmas de referencia son recuperadas de la memoria 134 por el analizador de firmas 142 para su uso en la identificación de corrientes de audio monitoreadas difundidas dentro de una región de difusión. El analizador de firmas 132 puede identificar las corrientes de audio monitoreadas efectuando una primera comparación de una firma monitoreada con una firma de referencia. La información de comparación y/o la comparación con una firma de referencia se utiliza entonces para recuperar la información de identificación (por ejemplo, título de una canción, pista de una canción, artista, etcétera) de una base de datos almacenada en la memoria 134. Aún cuando se muestra un sitio de monitoreo (por ejemplo, el sitio de monitoreo 152) la Figura IB, múltiples sitios de monitoreo pueden estar conectados de manera comunicativa con la red 158 y configurados para generas firmas monitoreadas. En particular, cada sitio de monitoreo puede estar localizada en una región de difusión respectiva y configurado para monitorear el contenido de las estaciones de difusión dentro de la región de difusión respectivo. La Figura 2 es una representación de dominio de tiempo 200 de una corriente de audio monitoreada de ejemplo 202 y varios marcos de muestras de audio 204, 206, 208 y 210 adquiridos a partir de la corriente de audio monitoreada 202. Una firma espectral digital monitoreada es generada en un sitio de monitoreo (por ejemplo, el sitio de monitoreo 102 de la Figura ÍA o el sitio de monitoreo 152 de la Figura IB) con base en muestras de audio adquiridas a partir de la corriente de audio monitoreada de ejemplo 202. La representación de dominio de tiempo 200 ilustra la relación de tiempo entre la corriente de audio monitoreada de ejemplo 202 y los marcos de muestra de audio 204, 206, 208 y 210 que son utilizados para generar firmas monitoreadas. En un ejemplo, la firma monitoreada de N-bits S?(t) se forma utilizando uno o varios descriptores de M-bits Bx ( to) , Bx( to+1) , BX ( to+2) , Bx(to+3) . Por ejemplo, una firma monitoreada de 32 bits Sx(t) incluye cuatro descriptores de 8 bits -3x(t0) ,-3x(t0+l) , Bx(t0+2) , Bx(t0+3) , cada uno de los cuales es generado con base en un marco correspondiente de los marcos de muestra de audio 204, 206, 208, y 210. Más específicamente, cada uno de los descriptores es generado empleando una o varias operaciones intramarco (por ejemplo, operaciones de comparación) con base en dos o más componentes espectrales asociado de manera única con un solo marco de muestra de audio. Los cuatro descriptores pueden ser generados con base en descomposiciones espectrales (por ejemplo, descomposiciones de frecuencia o descomposiciones de wavelet) de los marcos de muestra de audio 204, 206, 208, y 210 de conformidad con los descrito con detalles abajo con relación a las Figuras 4-7. Las descomposiciones espectrales son utilizadas para extraer características que son únicamente características de la corriene de audio 202 monitoreada de ejemplo. De la misma manera, una firma de referencia y una firma monitoreada generadas con base en la misma corriente de audio utilizando el mismo método de generación de firmas (por ejemplo, el mismo método basado en descomposición espectral) incluirá características similares y, por consiguiente podrá emplearse para identificar confiablemente la corriente de audio monitoreada 202 utilizando un algoritmo de correspondencia. Una firma monitoreada puede ser generada mediante el muestreo de la corriente de audio monitoreada de ejemplo 202 para generar los marcos de muestra de audio 204, 206, 208 y 210 generando los descriptores Bx ( t0) ,BX ( t0+l) ,BX ( 0+2) ,BX ( t0+3) con base en descomposiciones espectrales de los marcos de muestra de audio 204, 206, 208, y 210 y concatenando los descriptores . Los marcos de muestra de audio 204, 206, 208 y 210 son generados muestreando la corriente de audio monitoreada de ejemplo 202 durante cuatro intervalos de tiempo con una frecuencia de muéstreo /s. Por ejemplo, una frecuencia de muestreo /s de 6000 Hz generara 6000 muestras de datos de audio para cada uno de los marcos de muestra de audio 204, 206, 208 y 210 (considerando que los marcos de muestra se recopilan en intervalos de un segundo) . Sin embargo, cualquier otra frecuencia de muestreo fs adecuada puede seleccionarse. Como se muestra en la Figura 2, la duración de cada uno de los marcos de muestra de audio 204, 206, 208 y 210 es de un segundo (por ejemplo, de 0 a t0, de to a to+1, de to+1 a to+2 y de to+2 a t0+3) . Sin embargo, la duración puede ajustarse a cualquier lapso de tiempo. Los tiempos dentro de la corriente de audio monitoreada 202 durante los cuales firmas monitoreadas son generadas ' son sustancialmente similares o idénticos a los tiempos dentro de la corriente de audio de referencia durante los cuales se generan firmas de referencia correspondientes. Mediante la adquisición de marco de muestra de audio para firmas monitoreadas y firmas de referencia su sustancialmente en los mismos tiempos, las características extraídas de una corriente de audio monitoreada (por ejemplo, la corriente de audio monitoreada de ejemplo 202) y una corriente de audio de referencia correspondencia (por ejemplo, la corriente de audio de referencia de ejemplo 302 de la Figura 3) son sustancialmente similares o idénticas. Aún cuando los marcos de muestra de audio 204, 206, 208 y 210 se muestran en la Figura 2 como ocurriendo consecutivamente en el tiempo, los marcos de marco de audio 204, 206, 208, y 210 pueden ocurrir en cualquier momento y en cualquier secuencia dentro de la corriente de audio 202 monitoreada de ejemplo. Para asegurar que la firma monitoreada es comparada con una firma de referencia generada sustancialmente al mismo tiempo dentro de corrientes de audio respectivas, las firmas monitoreadas pueden ser generadas con relación a un tiempo de referencia que se utiliza durante el proceso de comparación de firmas para alinear una firma monitoreada con una firma de referencia. Más específicamente, durante la generación de una firma monitoreada, la corriente de audio monitoreada 202 de ejemplo es muestreado empezando en un tiempo indicado por un tiempo de referencia to, que puede seleccionarse con relación a un sello de tiempo integrada dentro de la corriente de audio de ejemplo 202, un tiempo de inicio de sistema, un tiempo recurrente diariamente (por ejemplo, medianoche), y/o cualquier otro tiempo de referencia que pueda ser una indicación del tiempo en el cual se genera una firma. Un sistema de correspondencia de firma (por ejemplo, analizado de' firmas 132 de las Figuras ÍA y IB) utiliza el tiempo de referencia t0 para recuperar una o varias firmas de referencia que corresponden sustancialmente al mismo tiempo dentro de corrientes de audio de referencia de conformidad con lo indicado por el tiempo de referencia to. Adicionalmente, una o varias firmas monitoreadas pueden ser generadas empleando la corriente de audio monitoreada de ejemplo 202 de tal manera que se comparen múltiples firmas para identificar la corriente de audio monitoreada de ejemplo 202. Por ejemplo, es posible que una o varias firmas monitoreadas generadas utilizando la corriente de audio monitoreada de ejemplo 202 sean sustancialmente- similares o idénticas a una o varias firmas de referencia de una corriente de audio de referencia (por ejemplo, la corriente de audio de referencia de ejemplo 302 de la Figura 3) que no corresponde a la corriente de audio 202 monitoreada de ejemplo. En este caso, para disminuir la posibilidad de identificación errónea de la corriente de audio de referencia equivoca, se generan más que una firma monitoreada para la corriente de audio monitoreada 202. Más específicamente, las firmas pueden ser generadas en múltiples tiempos a lo largo de la corriente de audio monitoreada de ejemplo 202. Además, un algoritmo de comparación puede ser configurado para comparar dos o más firmas monitoreadas con firmas de referencia correspondientes con el objeto de identificar con exactitud la corriente de audio monitoreada de ejemplo 202. La Figura 3 es una representación de dominio de tiempo 300 de ejemplo 302 y varios marcos de muestra de audio 304, 306, 308, y 310 que pueden ser adquiridos a partir de la corriente de audio de referencia de ejemplo 302. La representación de dominio de tiempo 300 muestra dos intervalos de tiempo de un segundo (por ejemplo, de o a t0 y de to a t0 + 1) y los varios marcos de muestra de audio 304, 306, 308, y 310 recopilados durante los intervalos de tiempo y subsiguientemente utilizados para generar varias firmas de referencia escalonadas en el- tiempo (es decir, con cambio de tiempo con relación entre ellas) . La corriente de audio de referencia de ejemplo 302 es muestreada en una frecuencia de muestreo /s para recopilar los marcos de muestra de audio 304, 306, 308, y 310 que son también utilizados para generar descriptores de M-bits BRn ( t) . Uno o varios de los descriptores BRn ( t) pueden concatenarse después para formar una firma de referencia de N-bits SRn ( t) . Típicamente, el número de descriptores en una firma de referencia es igual al número de descriptores en una firma monitoreada. Además, cada uno de los descriptores de M-bits BRn ( t) incluye el mismo número de bits que un descriptor de M-bits correspondiente Bx ( t) asociado con la corriente de audio monitoreada de ejemplo 202 (Figura 2) y por consiguiente cada firma de referencia de N-bits SRn ( t) incluye el mismo número de bits que una firma monitoreada de N-bits correspondiente Sx ( t) . Múltiples firmas de referencia son generadas para la corriente de audio de referencia de ejemplo 302 de una manera que provoca que las firmas de referencia estén desplazadas en el tiempo con relación entre ellas y se empalmen entre ellas en el tiempo. Más específicamente, el tiempo de inicio en donde se recopila un primer marco de muestra de audio (por ejemplo, el marco de muestra de audio 304) de una primera firma de referencia es desplazado o cambiado por una cantidad de tiempo 1/TS a partir del tiempo inicial en el cual se recopila un primer marco de muestra de audio (por ejemplo, el marco de muestra de audio 308) de una segunda firma de referencia. El valor Ts se relaciona con un número de segmentos iguales ("segmentos de muestras") en el cual cada intervalo (por ejemplo, de t0 a to + 1) está dividido. Por ejemplo, si el número de segmentos de muestra Ts en un intervalo de tiempo de un segundo se establece para que se igual a treinta, la recopilación de un nuevo conjunto de datos empezara cada 1/30 avo de segundo. Además si la frecuencia de muestreo fs es establecida igual a 6000 Hz, cada segmento de muestra incluirá 200 muestras. Cada marco de muestra de audio se utiliza para generar una sola firma. Más específicamente, un marco de muestra de audio es recopilado utilizando un número predeterminado de segmentos de muestra (por ejemplo, los segmentos de muestra 312a-312e) , los cuales están concatenados para formar el marco de muestra de audio (por ejemplo, el marco de muestra de audio 304) . Para lograr un empalme entre firmas generadas consecutivamente, cada firma es formada empleando un marco de muestra de audio que empalma parcialmente un marco de muestra de audio de audio utilizado para formar la firma previamente generada. Más específicamente, dos marcos de muestra de audio que se empalman incluyen un conjunto común de segmentos de muestra. Por ejemplo, los marcos de muestra de audio 304 y 308 incluyen un conjunto común de segmentos de muestra que comprenden los segmentos de muestra 312b-312e. El marco de muestra de audio 308 puede ser formado mediante la extracción la pluralidad común de muestras de medio o conjunto común de segmentos de muestra 312b-312e a partir del marco de muestra de audio 304 y adjuntando un segmento de muestra recientemente adquirido (por ejemplo, el segmento de muestra 312f) al conjunto común de segmentos de muestra 312b-312e. Además, dos marcos de muestra de audio que se empalman contienen también segmentos de muestra que se excluyen entre ellos de los marcos de muestra de audio (es decir, marcos de muestra de audio que se empalman contiene también segmentos de muestra que ocurren uno u otro de los marcos de muestra de audio pero no ocurren en ambos marcos) . Con el objeto de ilustrar adicionalmente la generación de firmas de referencia desplazadas en el tiempo y empalmadas, cada firma de referencia se forma a través de .cuatro k descriptores de referencia ftí«(fr>+~)>
•- k k ' b Bmik +lX Bp f?—+2). JSsriCío*—+3>- Los cuatro descriptores de
"**? ^í üS referencia están separados por intervalos de tiempo de un segundo y desplazados por K/Ts segundos con relación al tiempo de referencia ts, en donde 0 = k < Ts. Por ejemplo, los marcos de muestra de audio 304 y 306 (generados en fg+-— 0 • y í—0— Hf ) , respectivamente, en combinación con otros
'fs >Q dos marcos de muestra de audio generados en ¿o+—'+2 y (no ilustrado) , se utilizan para generar cuatro descriptores que forman una primera firma de referencia.
Adicionalmente, los marcos de muestra de audio 308 y 310 (generados en (f0+— 1-) y ?ß —1 +i) ) , respectivamente, se utilizan con dos marcos de muestra de audio adicionales generados en ¿+—?—+2) y (í%+- 1 H3) (no ilustrado) para generar cuatro descriptores que forman una segunda firma de referencia la cual presente un desplazamiento en el tiempo con relación a la primera firma de referencia por 1/TS segundos. De conformidad con lo descrito abajo con relación a la Figura 5, cada uno de los descriptores de referencia es generado empleando una o varias operaciones (por ejemplo, operaciones de comparación) basadas en dos o más componentes espectrales ambos asociados con el mismo marco de muestra de audio. Estas operaciones se conocen como operaciones intramarco puesto que se efectúan utilizando datos exclusivos de un solo marco de audio y no dependen de datos de muestra recopilados en otros marcos de audio. Durante un proceso de adquisición de muestras de ejemplo, los segmentos de muestra 312a-312e son recopilados y utilizados para formar el primer marco de muestra de audio 304 que es subsiguientemente utilizado para determinar un descriptor. Este descriptor es después utilizado para formar parte de una primera firma de referencia. Después se recopila un nuevo segmento de muestra 312f y se forma un segundo marco de muestra de audio 308 mediante la utilización de los segmentos de muestra 312b-312f. El segundo marco de muestra de audio 308 es después utilizado para -determinar un descriptor de referencia utilizado para formar parte de una segunda firma de referencia. Por consiguiente, el primer marco de muestra de audio 304 y el segundo marco de muestra de audio 308 incluyen un conjunto común de segmentos de muestra 312b-312e y cada uno del primer marco de muestra de audio y segundo marco de muestra de audio incluye además un segmento de muestra no incluido en el otro (es decir, el primer marco de muestra de audio 304 incluye un segmento de muestra 312a y el segundo marco de muestra de audio 308 incluye un segmento de muestra 312f) . De esta manera, la primera firma de referencia y la segunda firma de referencia son generadas empleando datos recopilados en puntos en la corriente de audio escalonados o desplazados en el tiempo por 1/TS segundos y generados empleando datos que se empalman. Además, la cantidad por la cual la primera firma y la segunda firma están desplazadas pueden ser ajustadas cambiando el valor de Ts permitiendo por consiguiente que la resolución de las firmas varíe según lo deseado. Específicamente, si se desea un conjunto de firmas que representan una corriente de audio con una mayor resolución, se puede incrementar Ts de manera correspondiente. De la misma manera, si se desea menos resolución, se puede disminuir Ts. Como se observará por parte de una persona con conocimientos ordinarios en la materia, el valor de Ts puede afectar la cantidad de firmas que pueden ser generadas para una corriente de audio dada. Por ejemplo, si el número de segmentos de muestra que se utiliza para formar una firma permanece constante, un valor mayor de T? resultara en la formación de un mayor número de marcos de muestra de audio que un valor más pequeño de Ts. Por consiguiente, la cantidad de memoria disponible para almacenar los datos de firma puede ser un factor para determinar el valor deseado de Ts. Como se describió arriba, con el objeto de identificar el título de una canción o el título de un programa asociado con una corriente de audio particular, un conjunto de firmas monitoreadas . generadas para una corriente de audio monitoreada se compara con una base de datos de firmas de referencia asociadas con varias corrientes de audio de referencia. En un sistema de ejemplo, un generador de firmas
(por ejemplo, el generador de firmas 114 de la Figura 1A) puede ser configurado para monitorear el audio emitido por una televisión específica (por ejemplo, uno de los dispositivos de presentación 112 de la Figura 1A) localizada en el hogar de un panelista especifico. Se generan firmas para el audio emitido por la televisión de la manera descrita arriba. Además, el tiempo en el cual se emitió el audio correspondiente a cada firma es registrado y almacenado como tiempo de referencia t0 con la firma monitoreada correspondiente en un dispositivo de memoria. Un dispositivo de temporización (por ejemplo, el dispositivo de temporización 903 de las Figuras 9 y 10) localizada en el sitio de monitoreo puede ser utilizado para accionar la recopilación de los datos de audio para la generación subsiguiente de firmas monitoreadas y para proporcionar los tiempos de recopilación de datos correspondientes (por ejemplo, tiempos de referencia to, sellos de tiempo, etcétera) a la memoria para almacenamiento con la firma correspondiente. Para permitir la identificación subsiguiente del audio emitido, un sitio de referencia (por ejemplo, el sitio de referencia 104 de la Figura 1A) localizado dentro de la misma región de banda ancha que el sitio de monitoreo (por ejemplo, el sitio de monitoreo 102 de la Figura 1A) está configurado para generar firmas de referencia que corresponden al difusión de audio en todos los canales de difusión de televisión en todas las horas del día. Un dispositivo de temporización (por ejemplo, el dispositivo de temporización 903 de las Figuras 9 y 10) localizada en el sitio de referencia puede ser utilizado para activar la recopilación de datos de audio en un conjunto de intervalos igualmente espaciados que corresponden al periodo de tiempo 1/TS para la generación subsiguiente de las firmas de referencia y para proporcionar un conjunto correspondiente de tiempos de recopilación de datos a una memoria de referencia (por ejemplo, a la memoria 126 de la Figura 1A) para almacenamiento. Por consiguiente, cada firma de referencia está almacena en un dispositivo de memoria localizado en el sitio de referencia junto con datos de sello de tiempo que indican el tiempo en el cual se recopilaron los datos de audio subyacentes. En un ejemplo, los dispositivos de temporización (por ejemplo, el dispositivo de temporización 903 de la Figura 9) localizados en el sitio de monitoreo y en el sitio de referencia están sincronizados de tal manera que los sellos de tiempo puedan utilizarse para alienar las firmas de referencia con las firmas monitoreadas para facilitar el proceso de comparación de firmas. De la misma manera, puesto que es probable que varios sitios de monitoreo estén localizados en la misma región de difusión como un solo sitio de referencia, en el mismo ejemplo, cada uno de los dispositivos de temporización 903 localizados en cada uno de dichos sitios de monitoreo puede ser sincronizado con el dispositivo de temporización 903 localizado en el sitio de referencia único. Sin embargo, debido al arreglo escalonado de las firmas de referencia descritas arriba con relación a la Figura 3, los dispositivos de temporización 903 en el sitio de monitoreo y en el sitio de referencia no tienen que estar sincronizados. Para compensar los desplazamientos entre los dispositivos de temporización localizados en los sitios de monitoreo y el sitio de referencia, se puede ajustar el valor de Ts. El valor de Ts se selecciona generalmente para agregar un incremento de desplazamiento de tiempo a una firma de referencia a partir de una firma de referencia previa de tal manera que una firma monitoreada generada en un tiempo de referencia arbitrario tenga una alta probabilidad de
"alinearse con una de las firmas de referencia con cambio de tiempo o escalonadas. Más específicamente, el incremento del
• valor de Ts provoca que el número de segmentos de muestra
(por ejemplo, los segmentos de muestra 312a-312f) se eleven y disminuya el desplazamiento o cambio de tiempo de una firma de referencia a la siguiente firma de referencia. Esto, a su vez, incrementa la probabilidad que los tiempos en los cuales se generan las firmas de referencia para una corriente de audio dada correspondan a tiempos de referencias sustancialmente similares o idénticos en los cuales se generan firmas monitoreadas para la misma corriente de audio. Firmas generadas en los mismos tiempos para el mismo programa deben ser idénticas o al menos suficientemente similares para provocar la detección de una correspondencia. Por consiguiente, el hecho de incrementar el valor de Ts eleva la probabilidad de una correspondencia entre un grupo de firmas de referencia y un grupo de firmas monitoreadas que corresponden al mismo programa de audio. Además, considerando que los dispositivos de temporización localizados en el sitio de referencia y en el sitio de monitoreo están sincronizados con una precisión suficiente, una . firma monitoreada generada para los datos recopilados en un tiempo T necesita solamente ser comparada con cada firma de referencia asociada con el mismo sello de tiempo T en lugar de todas las firmas de referencia generadas durante el mismo periodo de veinticuatro horas. Esta reducción de las comparaciones reduce el tiempo de procesamiento requerido para encontrar una correspondencia. De manera similar, considerando que existe un error conocido, E, entre los dispositivos de temporización ubicados en un sitio de monitoreo y en un sitio de referencia, cada firma monitoreada generada en el sitio de monitoreo en el tiempo T debe solamente ser comparada con todas las firmas de referencia generadas a partir de los datos recopilados dentro de una ventana de tiempo que abarca de T-E hasta T+E. En otro sistema de ejemplo (por ejemplo, el sistema de identificación de audio de ejemplo 150 de la Figura IB), se genera un conjunto de firmas monitoreadas para una corriente de audio monitoreada y después se compara con una base de datos de firmas de referencia asociadas con un conjunto de corrientes de audio de 'referencia que, idealmente, representan el universo de las corrientes de audio actualmente disponibles. Por ejemplo, de conformidad con lo descrito arriba, con relación a la Figura IB, firmas de referencia que corresponden a corrientes de audio de referencia pueden ser almacenadas en una base de datos la cual se almacena por ejemplo en la memoria 134. Para cada firma de referencia que corresponde a una firma monitoreada, la información de correspondencia y/o la firma de referencia puede utilizarse para recuperar información de identificación (por ejemplo, título de canción, pista de canción, artista, etcétera) de la base de datos. La información de identificaciones después utilizada para identificar la corriente de audio monitoreada. En un ejemplo, tiempos de referencia o o sellos de tiempo asociados con cada firma monitoreada pueden utilizarse para identificar el tiempo (del día) cuando " se difundieron las corrientes de audio monitoreadas . La Figura 4 es un diagrama de flujo de un método de ejemplo para generar firmas espectrales digitales con base en descomposiciones espectrales. En particular, el método de ejemplo de la Figura 4 puede ser utilizado para generar firmas espectrales digitales (por ejemplo, firmas de referencia y/o firmas monitoreadas) con base en métodos de descomposición de frecuencia utilizando una transformada de Fourier rápida (FFT) móvil. Como lo sabe una persona con conocimientos ordinarios en la materia, una FFT puede utilizarse para convertir una señal de dominio de tiempo (por ejemplo, las corrientes de audio de ejemplo 202 y 302 de las Figuras 2 y 3) en una representación de dominio de frecuencia de la misma señal que puede entonces utilizarse para analizar los componentes de frecuencia de la señal convertida.
Como lo observará una persona con conocimientos ordinarios en la materia, una FFT móvil ofrece ventajas en comparación con una FFT no móvil convencional para generar las firmas espectrales digitales. A diferencia de una FFT no móvil convencional, una FFT móvil puede ser utilizada para calcular incrementos de FFT. Por ejemplo, un enfoque de ejemplo para procesar las corrientes de audio 202 y 302 incluye la generación de datos de FFT para cada marco de muestra de audio independientemente de cualquier dato asociado con marcos de muestra de audio previos. En contraste una FFT móvil incluye la generación de datos de FFT para un marco de muestra de audio mediante la actualización de los datos de FFT generados con relación a un marco de muestra de audio previo. La actualización de los datos de FFT de marco previo es menos costosa en términos de cómputo que la generación de datos de FFT nuevamente para cada marco lo que provoca que la técnica de FFT móvil es más eficiente que el enfoque de FFT convencional no móvil. Además, el número de muestras que forman cada marco de muestra de audio (por ejemplo, los marcos de muestra de audio 204, 206, 208, y 210 de la Figura 2 o 304, 306, 308, y 310 de la Figura 3) no tienen que ser una potencia de dos, como se requiere en el caso del enfoque de FFT no móvil. Por consiguiente, cuando se utiliza un FFT móvil, las firmas espectrales digitales pueden ser generadas utilizando marcos de muestra de audio de cualquier tamaño arbitrario (es decir, cualquier número de muestra) adquiridos utilizando cualquier frecuencia de muestreo fs . Pasando ahora con detalles al método de ejemplo de la Figura 4, inicialmente el método de ejemplo incluye la obtención de una corriente de audio (bloque 402) (por ejemplo, la corriente de audio monitoreada de ejemplo 202 de la Figura 2 o la corriente de audio de referencia 302de la Figura 3) . Un tiempo de referencia to descrito arriba con relación a las Figuras 2 y 3 es determinado (bloque 404) para indicar el tiempo dentro de una corriente de audio cuando se genera una firma. Un conjunto de muestras de audio inicial se obtiene entonces (bloque 406) . Las muestras de audio pueden ser obtenidas mediante el muestreo de una corriente de audio analógica en una frecuencia de muestreo fs y efectuando una conversión de analógico a digital. Alternativamente, las muestras de audio pueden ser obtenidas mediante la extracción o adquisición de muestras a partir de la corriente de audio digital a una frecuencia de muestreo /s. El conjunto inicial de muestras de audio puede ser un marco de muestra de audio completa (por ejemplo, uno de los marcos de muestra de audío 204, 206, 208, y 210 de la Figura 2 o 304, 306, 308, y 310 de la Figura 3) o una porción del mismo. Una operación de FFT inicial se efectúa en el conjunto inicial de muestras de audio para establecer un espectro de frecuencia inicial (bloque 408) . El método para efectuar una FFT es bien conocido en la técnica y por consiguiente no se comenta con detalles aquí. Después de determinar el espectro de frecuencia inicial (bloque 408) se obtiene un siguiente conjunto de muestras de audio (bloque 410) . La FFT móvil puede ser utilizada entonces para actualizar el espectro de frecuencia inicial (generado en el bloque 408) con base en dos muestras más recientemente recopiladas vNs_2 y vNs-? de conformidad con la ecuación 1
Ecuación 1 La ecuación 1 puede utilizarse para actualizar el espectro de frecuencia de un marco de muestra de audio que tiene una cantidad de muestras Ns. La amplitud espectral ao[J] y el valor de fase cpo . J] forman el espectro de frecuencia existente ao[J]x exp (fo [ J] ) , que incluye las frecuencia indexadas por el índice de frecuencia J. Cuando las dos muestras de audio más reciente recopiladas vNs_2 y vNs_? son obtenidos, el espectro de frecuencia existente ao[<J]x exp (fo [ J] ) puede ser actualizado para determinar un nuevo espectro de frecuencia a?[J]x exp (fi [J] ) . Las dos muestras de audio más recientemente opiladas son insertadas en el marco de muestras de audio para remplazar las dos muestras recopiladas más antiguas vNs_2 y vNs_?. Como se muestra en la Ecuación 1 el espectro de frecuencia actualizado a?[J]x exp(f?[J]) es determinado utilizando uno o varias operaciones de multiplicación, operaciones de adición, y operaciones de resta con base exponentes complejos, las dos muestras recopiladas más antiguas v0 y vl r y las dos muestras recopiladas más recientemente vNs_2 y vNs_?. Inicialmente, el espectro de frecuencia existente a0[J]x exp (fo [ J] es multiplicado por un primer valor exponencial complejo
}2pf(2) extí , El producto de la multiplicación es agregado a un
N, producto determinado mediante la multiplicación de la primera muestra de audio más recientemente recopilada vHs_2 por un (O3tJQ?s -2) segundo valor exponencial complejo BSP El resultado es después agregado a un producto determinado por la multiplicación de la segunda muestra de audio más recientemente recopilada vNs-? por un tercer valor exponencial Ji2r jNs -Xj ) complejo ex \ ~—- . La primera muestra de audio más antiguamente recopilada v0 es después multiplicada por el primer val -,or exponencial -, compl iej •o expi i2A——{2] i y restada del resultado de la adición previa. La segunda muestra de audio más antiguamente recopilada vx es después multiplicada por un cuarto valor exponencial complejo exp — A- \ y restada del resultado de la resta previa. Se sabe bien en la técnica que inestabilidades, como por ejemplo oscilación o desbordamiento de datos pueden ser sustancialmente minimizadas cuando se implementa una FFT móvil mediante la multiplicación de las muestras de audio más recientemente recopiladas (por ejemplo, las muestras de audio más recientemente recopiladas vNs_2 y vNs-?) por un primer factor de estabilidad s ? y las muestras de audio más antiguamente recopiladas (por ejemplo, las muestras de audio más antiguamente recopiladas v0 y vi) por un segundo factor de estabilidad sf2. El primer factor de estabilidad sfi puede ser establecido para que sea igual a un valor lo más cercano posible a uno. En el caso de un marco de muestra de audio que tiene 6000 muestras, el primer factor de estabilidad s i puede ser establecido igual a 0.99995. El segundo factor de estabilidad sf2 puede ser establecido igual a (s/?)p_1, en donde el valor p es igual al número de ca bios de muestra requeridos para procesar un marco de muestra de audio utilizando la FFT móvil. Por ejemplo, un cambio de dos muestra es requerido para actualizar un marco de muestras de audio con base en las dos muestras de audio más recientemente recopiladas vNs_2 y vNs_?. En el caso del marco de muestras de audio que tiene 6000 muestras, el valor p puede establecerse para que sea igual a 3000. Después de haber determinado o calculado la FFT móvil en el bloque 412, se determina si un marco de muestras de audio completo (por ejemplo, uno de los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o uno de los marcos de muestras de audio 304, 306, 308, y 310 de la Figura 3) se ha obtenido (bloque 414) . En los sitios de monitoreo 102 (Figura 1A) y 152 (Figura IB) , se obtiene un marco de muestras de audio completo cuando se obtiene una pluralidad de Ns muestras más recientemente recopiladas. Por ejemplo, si un marco de muestras de audio incluye 6000 muestras, un marco de muestras de audio completo se obtiene después de la obtención de 6000 nuevas muestras. En el sitio de referencia 104 (Figura 1A) de la instalación central de recopilación de datos 154 (Figura IB) , un marco de muestras de audio completo se obtiene cuando un segmento de muestras más recientemente recopiladas (por ejemplo, uno de los segmentos de muestras 312a-312f de la Figura 3) se obtiene y se forma un marco de muestras de audio actual de conformidad con lo descrito con mayores detalles arriba con relación a la Figura 3. Si se determina en el bloque 414 que no se ha obtenido un marco completo de muestras de audio, el control retorna al bloque 410. Sin embargo, si se determina en el bloque 414 que se ha obtenido un marco completo de muestras de audio, se genera un descriptor (bloque 416) . Un método de ejemplo para generar descriptores basados en componentes de frecuencia se describe con mayores detalles abajo con relación a la Figura 5. Se determina entonces si se ha obtenido un conjunto completo de descriptores (bloque 418) . Un conjunto de descriptores incluye un número predeterminado de descriptores que se utilizan para formar una firma. Por ejemplo, si una firma de 32 bits es formada por descriptores de 8 bits, entonces un conjunto de descriptores incluirá cuatro descriptores. Si se determina en el bloque 418 que no se ha obtenido un conjunto completo de descriptores, el control retorna al bloque 410. Sin embargo, si determina en el bloque 418 que se ha obtenido un conjunto completo de descriptores, se genera una firma espectral digital mediante la concatenación de los descriptores del conjunto de descriptores (bloque 420) . Después de la generación de la firma espectral digital
(bloque 420) , se determina si se debe generar otra firma
(bloque 422) . Si se debe generar otra firma, el control retorna al bloque 404. La figura 5 es un diagrama de flujo de un método de ejemplo para generar descriptores asociados con el método de ejemplo de la Figura 4. En particular, el método de ejemplo de la Figura 5 puede ser utilizado para implementar el bloque 416 de la Figura 4. Un descriptor de M bits es generado mediante la selección de M pares de componentes de frecuencia fíb que están asociados de manera única con un marco de muestras de audio y mediante la determinación de cada bit del descriptor con base en comparaciones intramarco de las potencias espectrales Plb de los componentes de frecuencia fu,. Los componentes de frecuencia flb y las potencias espectrales Plb están indexados por un índice de componentes de frecuencia 1 y un índice de bits b, en donde O=K/ indexmaj£ y 0=£><M. El método de ejemplo selecciona inicialmente un primer par de componentes de frecuencia oo y /?o (bloque 502) . Aún cuando se seleccionan componentes de frecuencia consecutivos (es decir, /ob y ib/ /2 y f3br etcétera) en el método de ejemplo, los componentes de frecuencia pueden ser seleccionados a partir de cualquier ubicación en el espectro de frecuencia de un marco de muestras de audio (por ejemplo, uno de los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o uno de los marcos de muestras de audio 304, 306, 308, y 310 de la Figura 3) . Sin embargo, los índices 1 de componentes de frecuencia utilizados para seleccionar pares de componentes de frecuencia para generar una firma monitoreada son los mismos índices de componentes de frecuencia 1 utilizados para seleccionar pares de componentes de frecuencia para generar una firma de referencia correspondiente. Después de seleccionar el primer par de componentes de frecuencia /oo y f?or las potencias espectrales P0o y Pío que corresponden a los componentes de frecuencia seleccionados son determinadas (bloque 504) . Una persona con conocimientos ordinarios en la materia observará fácilmente que la potencia espectral para cada componente de frecuencia puede obtenerse con base en los resultados de la FFT móvil efectuada en el bloque 412 de la Figura 4. Un bit de descriptor es determinado con base en los componentes de frecuencia /oo y /?o mediante la comparación de la primera potencia espectral Poo con la segunda potencia espectral P10 (bloque 506) . Si la primera potencia espectral es mayor que la segunda potencia espectral (es decir oo > pío) , el bit de descriptor es establecido igual a uno. Al contrario, si la primera' potencia espectral es inferior o igual (es decir poo = Pío) r el bit descriptor es establecido igual a cero. Se determina después si otro bit de descriptor debe ser determinado (bloque 508) . Si otro bit de descriptor debe ser determinado, se selecciona otro par de componentes de frecuencia (por ejemplo, f2? y /31) (bloque 510) y el control retorna al bloque 504. Al contrario, si no debe determinarse otro bit de descriptor, se puede detener el método de ejemplo de la Figura 5. La Figura 6 es un diagrama de flujo de otro método de ejemplo para generar firmas espectrales digitales con base en descomposiciones espectrales. En particular, el método de' ejemplo de la Figura 6 puede ser utilizado para generar firmas espectrales digitales (por ejemplo, firmas de referencia y firmas monítoreadas) con base en descomposiciones wavelet de marcos de muestras de audio (por ejemplo, los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o 304, 306, 308, y 310 de la Figura 3) utilizando transformadas wavelet. Como se describió arriba, transformadas wavelet pueden ser empleadas para analizar datos empleando diferentes escalas y/o resoluciones mediante separación de bloques o marcos de datos (por ejemplo, los marcos de muestras de audio 204, 206, 208, 210, 304, 306, 308 y 310) en múltiples sub-bandas. Inicialmente, el método de ejemplo obtiene una -corriente de audio (bloque 602) (por ejemplo, la corriente de audio monitoreada de ejemplo 202 de la Figura 2 o la corriente de audio de referencia de ejemplo 3020 de la Figura 3) . Un tiempo de referencia t0 descrito arriba con relación a las
Figuras 2 y 3 es determinada (bloque 604) para indicar el tiempo dentro de una corriente de audio cuando se genera una firma. Se obtiene ,entonces un marco de muestras de audio
(bloque 606) . El marco de muestras de audio puede ser obtenido mediante el muestreo de una corriente de audio analógica a una frecuencia de muestreo fs y efectuando una conversión de analógico a digital. Alternativamente, el marco de muestras de audio puede ser obtenido mediante la extracción o adquisición de muestras a partir de una corriente de audio digital a una frecuencia de muestreo /s. Con base en el teorema de Nyquist, se evita el solapa iento (aliasing) mediante el muestreo de las muestras de audio en frecuencias dentro de un rango de cero a /s/ . Se ^determina entonces un descriptor (bloque 608) con base en la descomposición wavelet efectuada utilizando una trasformada wavelet. Un método de ejemplo para generar descriptores con base en una o varias descomposiciones wavelet se describe con mayores detalles con relación a la Figura 7. Después de la generación del descriptor, se determina si se ha obtenido un conjunto completo de descriptores (bloque 610) . Si no se ha obtenido un conjunto completo de descriptores, se obtiene un marco de muestras de audio siguiente (bloque 612) y el control retorna al bloque 608. Sin embargo, si se ha obtenido un conjunto completo de descriptores, se genera una firma espectral digital (bloque
614) mediante la concatenación de los descriptores del
- conjunto de descriptores. Después de la generación de la firma espectral digital, se determina si se debe generar otra firma (bloque 616) . Si se debe generar otra firma, el control retorna al bloque 604. De otra manera, se detiene el método de ejemplo. La Figura 7 es un diagrama de flujo de un método de ejemplo para generar descriptores asociados con el método de ejemplo de la Figura 6. En particular, el método de ejemplo de la Figura 7 puede ser utilizado para implementar el bloque 608 de la Figura 6. Un descriptor de M bits es generado mediante la efectuación de una descomposición wavelet de nivel M en un marco de muestras de audio (por ejemplo, uno de los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o uno de los marcos de muestras de audio 304, 306, 308, y 310 de la Figura 3) . Para descomposición wavelet de cada nivel, la energía de la señal de audio para cada sub-banda es determinada y se generan descriptores con base en comparaciones de las energías de sub-banda. Para cada descriptor, la descomposición wavelet de nivel M es implementada en una operación intramarco que se efectúa en energías espectrales asociadas de manera única con un marco de muestras de audio. Además, la descomposición wavelet de nivel M puede ser implementada utilizando cualquier transformada wavelet. Para propósitos de claridad, el método de ejemplo de la Figura 7 se describe en términos de la transformada de wavelet Daubechies bien conocido. Inicialmente, el método de ejemplo efectúa una descomposición wavelet de primer nivel (bloque 702) mediante la aplicación de la transformada Daubechies a un marco de muestras de audio. La primera aplicación de la transformada wavelet Daubechies resulta en un bloque sub-banda de baja frecuencia de valores filtrados i0 y un bloque de sub-banda de alta frecuencia de valores filtrados BO, cada uno de los cuales incluye Ns/2 valores filtrados. Pasando con mayores detalles a la implementación de la transformada wavelet Daubechies, los coeficientes Daubechies Co, C\, c2 y c3 son utilizados para generar una matriz de transformación N? x Ns en donde los coeficientes están colocados como se muestra abajo,
€» 1 , «1 '- ti 6% — c Los coeficientes son ordenados en la matriz de transformación, como se muestra arriba, empleando dos patrones dominantes. Las filas impares incluyen el primer patrón, que es un orden de los coeficientes que funciona como un filtro de alisamiento (por ejemplo, similar a un filtro móvil) . Las filas pares incluyen el segundo patrón, que es un orden de los coeficientes que funciona para proporcionar los detalles de datos (por ejemplo, el marco de muestras de audio) . La matriz de transformación es aplicada primero a todo el marco de muestras de audio 8por ejemplo, todas las Ns muestras) para generar valores filtrados que incluyen valores filtrados de sub-banda de baja frecuencia que alternan con valores filtrados de sub-banda de alta frecuencia. Los valores son desintercalados para generar los dos bloques de sub-banda L0 y B0, cada no de los cuales incluye ?s/2 muestras. El bloque de sub-banda de baja frecuencia L0 incluye valores filtrados asociados con frecuencias de sub-banda que se encuentran dentro de un rango de 0 cero a /s/4. El bloque de sub-banda de alta frecuencia BO incluye valores filtrados asociados con frecuencias de sub-banda dentro de un rango de /s/4 a fs/2 . Una matriz de transformación Ns/2 x Ns/2 de los coeficientes de Daubechies se aplica después al bloque de sub-banda de baja frecuencia Lo para generar dos bloques de sub-banda adicionales L . Y H\ . Para cada transformación, el número de valores filtrados en cada bloque de sub-banda es dividido a la mitad. Adicionalmente, para cada transformación, se genera un descriptor con base en un bloque de sub-banda de alta frecuencia (por ejemplo, B0, Hl r H2, etcétera) . Detalles adicionales relacionados con la implementación de las transformadas wavelet son bien conocidas en la técnica y se describen aquí. Después de la aplicación de la transformada wavelet de primer nivel, el bloque de sub-banda de alta frecuencia Bo es analizado mediante la separación de los valores filtrados en una primera mitad y una segunda mitad (bloque 704). Después, en un bloque 706, se determina un primer valor de energía E0 mediante elevar al cuadrado y sumar los valores filtrados de la primera mitad del bloque de sub-banda de alta frecuencia
B0 y se determina también un segundo valor de energía E
(bloque 706) mediante elevar al cuadrado y sumar los valores filtrados de la segunda mitad del bloque de sub-banda de alta frecuencia B0. Un bit de descriptores determinado mediante la comparación del primer valor de energía Bo con el segundo valor de energía E (bloque 708). Por ejemplo, si el primer valor de energía Bo es mayor que el segundo valor de energía E (es decir Bo > E ) , el primer bit de descriptor es establecido igual a uno. Si el primer valor de energía o es inferior o igual al segundo valor de energía E (es decir, B0 = Ex) , el primer bit de descriptor es establecido igual a cero. Se determina entonces si bit de descriptor debe ser determinado (bloque 710) . Si otro bit de descriptor debe ser determinado, se efectúa una descomposición wavelet de siguiente nivel (bloque 712) . Por ejemplo, como se describió arriba, si se efectúa una descomposición wavelet de segundo nivel, se aplica una matriz de transformación Ns x Ns/2) a los valores filtrados del bloque de sub-banda de baja frecuencia L0 para determinar' bloques de sub-banda filtrados Lx Y ?.? . Si se determina en el bloque 710 que otro bit de descriptor no tiene que ser determinado, se puede suspender el método de ejemplo de la Figura 7. La Figura 8 es un diagrama de flujo de un método de ejemplo para comparar las firmas espectrales digitales (por ejemplo, firmas monitbreadas y firmas de referencia) generadas empleando los métodos de ejemplo de las Figuras 4-7. En particular, el método de ejemplo puede ser utilizado para comparar una firma monitoreada con una firma de referencia, ambos generándose con base en una FFT móvil o una transformada wavelet. En general, el método de ejemplo de la Figura 8 puede ser utilizado para hacer corresponder una firma monitoreada con una firma de referencia mediante la comparación de la firma monitoreada con varias firmas de referencia. La información de identificación (por ejemplo, canal, título de programa, número de episodio, etcétera) asociada con una firma de referencia correspondiente puede entonces recuperarse por ejemplo a partir de una base de datos y utilizarse para generar información de calificaciones de medios. Las comparaciones pueden efectuarse comparando cualquier número de bits de una firma monitoreada con el mismo número de bits de una firma de referencia como por ejemplo una comparación de bit por bit una comparación de byte por byte, una comparación de palabra por palabra, etcétera. Debido al gran número de firmas de referencias disponibles para comparación, se puede utilizar una distancia de Hamming para las comparaciones con el objeto de eliminar rápidamente las no correspondencias, disminuyendo por consiguiente significativamente el tiempo requerido para compara una firma monitoreada con las firmas de referencia. Como lo sabe una persona con conocimientos ordinarios en la técnica, una distancia de Hamming entre dos valores puede ser identificada mediante la determinación de cuántos bits, números, caracteres, etcétera deben ser modificados para que los dos valores sean iguales. Por ejemplo, un primer valor binario de 0110 y un segundo valor binario de OlOltiene una distancia de Hamming de dos puesto que la ubicación de bit cero y la ubicación de bit uno deben ser modificadas para que el primer valor binario sea igual al segundo valor binario. Pasando ahora con detalles al método de ejemplo de la Figura 8, el método de ejemplo incluye primero la obtención de una firma monitoreada (bloque 802) . Un tiempo de referencia t0 para la firma monitoreada es después obtenida (bloque 804). Una primera firma de referencia que corresponde a un tiempo dentro de una corriente de audio de referencia indicado por el tiempo de referencia t0 se obtiene por ejemplo a partir de la memoria 134 de las Figuras 1A y IB (bloque 806) . El primer descriptor de la firma monitoreada y el primer descriptor de la firma de referencia se obtienen después (bloque 808). El primer descriptor de la firma monitoreada es comparado con el primer descriptor de la firma de referencia para determinar si los descriptores corresponden (bloque 810) . Si se detecta una correspondencia, se determina si todos los descriptores de la firma monitoreada y de la firma de referencia han sido comparados (bloque 812) . Si se determina en el bloque 812 que no todos los descriptores han sido comparados, los siguientes descriptores son obtenidos a partir de la firma monitoreada y de la firma de referencia (bloque 816) y el control retorna al bloque 810. Si se determina en el bloque 812 que todos los descriptores han sido comparados, la corriente de audio monitoreada es identificada con base en la firma de referencia correspondiente (bloque 814) . Alternativamente, el método de ejemplo puede ser implementado de tal manera que múltiples firmas monitoreadas de una sola corriente de audio tengan que corresponder a múltiples firmas de una corriente de audio de referencia antes de identificar la corriente de audio monitoreada. Si se determina en el bloque 810 que los descriptores no corresponden, entonces se determina si todas las firmas de referencia han sido comparadas (bloque 818) . Si todas las firmas de referencia no han sido comparadas, se obtiene la siguiente firma de referencia (bloque 820) y el control pasa al bloque 808. Sin embargo si se determina en el bloque 818 que todas las firmas de referencia han sido comparadas, el medio, canal, estación de radio, etcétera asociados con la corriente de audio monitoreada pueden no ser identificables y el método de ejemplo es detenido. Se puede establecer una bandera para indicar que la corriente de audio monitoreada no es identificable. Aun cuando el método de ejemplo de la Figura 8 se describe como comparando una firma de referencia a la vez, el método de ejemplo puede ser adaptado para comparar varias firmas de referencia con una firma monitoreada en paralelo (es decir, al mismo tiempo) . Por ejemplo, la operación de bloque 806 puede estar configurada para obtener varias firmas de referencia a la vez, cada uno de las cuales corresponde a una corriente de audio de referencia diferente. La operación del bloque 808 puede estar configurada para obtener el primer descriptor de cada una de las varias firmas de referencia recuperadas en el bloque 806. Los descriptores de cada una de las firmas de referencia pueden ser comparados con cada descriptor de la firma monitoreada hasta encontrar una correspondencia o hasta que las varis firmas de referencia obtenidas en el bloque 806 se han eliminadas, después de dicho tiempo se puede obtener en el bloque 820 otras varias firmas de referencia. Una persona con conocimientos ordinarios en la materia puede observar fácilmente que la aplicación de la distancia de Hamming al proceso de comparación puede reducir significativamente el tiempo requerido para comparar todas las firmas d referencia disponibles. Por ejemplo, después de la comparación del primer descriptor de cada una de las varias firmas de referencia con el descriptor de una firma monitoreada, se asocia el primer descriptor de cada una de las firmas de referencia con una distancia de Hamming. Solamente firmas de referencia que tienen primeros descriptores asociados con una distancia de Hamming inferior a un umbral de distancia de Hamming predeterminado son comparados adicionalmente con la firma monitoreada con base en el siguiente descriptor de cada una de las firmas de referencia y la firma monitoreada. Firmas de referencia que tienen descriptores asociados con una -distancia de Hamming mayor que un umbral predeterminado son desechadas. El número de firmas de referencia a comparar con base en los siguientes descriptores es reducido del número de firmas de referencia comparadas con la firma monitoreada con base en el primer descriptor. De esta manera, con cada iteración del proceso de comparación, el número de firmas de referencia que quedan por compara en iteraciones subsiguientes del proceso de comparación de firmas se reduce . rápidamente hasta que se determine que todos los descriptores de una sola firma de referencia están asociados con la distancia de Hamming inferior al umbral de distancia.de Hamming predeterminado. En casos en los cuales todos los descriptores de más de una firma de referencia están asociados con una lista de Hamming por debajo del umbral de distancia de Hamming predeterminado, más de una firma monitoreada puede tener que ser comparada con firmas de referencia respectivas de las corrientes de audio de referencia posiblemente correspondientes. Será relativamente improbable que todas las firmas monitoreadas generas con base en la corriente de audio monitoreada correspondan a todas las firmas de referencia de más de una corriente de audio de referencia y, por consiguiente una correspondencia errónea de más de una corriente de audio de referencia con la corriente de audio monitoreada puede evitarse. Los métodos de ejemplo descritos arriba con relación a las Figuras 4-8 pueden ser implementados por hardware, software y/o por cualquier combinación de los mismo. Más específicamente, los métodos de ejemplo pueden ser ejecutados en hardware definido por los diagramas de bloque s de las figuras 9-11. Los métodos de ejemplo pueden también ser implementados por software ejecutado en un sistema de procesador, como por ejemplo el sistema de procesador 1210 de la Figura 12. La Figura 9 es un diagrama de bloques de un sistema de generación de firmas de ejemplo 900 para generar firmas espectrales digitales. En particular, el sistema de generación de firmas de ejemplo 900 puede ser utilizado para generar firmas monitoreadas y/o firmas de referencia con base en una FFT móvil de conformidad con lo descrito arriba con relación "a los métodos de ejemplo de las Figuras 4 y 5. Por ejemplo, el sistema d generación de firmas de ejemplo 900puede ser utilizado para implementar los generadores de firmas 114 y 122 de la Figura 1A o los generadores de firma 156 y 158 de la Figura IB. Además, el sistema de generación de firmas de ejemplo 900 puede ser utilizado para implemetar los métodos de ejemplo de las figuras 4 y 5. Como se muestra en la Figura 9, el sistema de generación de firmas de ejemplo 900 incluye un generador de muestras 902, un dispositivo de temporización 903, un generador de tiempo de referencia 904, un módulo de FFT móvil 906, un identificador de frecuencia 908, un identificador de valor de potencia espectral 910, un comparador 912, un generador de descriptores 914, un concatenador 916, y una interfaz de comunicación de datos 918, todos los cuales pueden esta r conectados de manera comunicativa como se muestra. El sistema de generación de firmas de ejemplo 900 puede ser configurado para obtener una corriente de audio de ejemplo 920, adquirir varias muestras de audio a partir de la corriente de audio de ejemplo 920, y generar firmas espectrales digitales con base en las muestras de audio. El generador de muestras 902 puede estar configurado para obtener la corriente de audio de ejemplo 920 que puede ser cualquier corriente de audio analógica o digital. Si la corriente de audio de ejemplo 920 es una corriente de audio analógica, el generador de muestras 902 puede ser implementado utilizando un convertidor de analógico a digital. Si la' corriente de audio de ejemplo 920 es una corriente de audio digital, el generador de muestras 902 puede ser implementado utilizando el procesador de señal digital. Además, el generador de muestras 902 puede estar configurado para adquirir y/o extraer muestras de audio en cualquier frecuencia de muestreo deseada fs y modificar al generador de tiempo de referencia 904 cuando empieza un proceso de adquisición de muestras de audio. El generador de muestras 902 comunica muestras al módulo de FFT móbil 906. El generador de muestras 902 puede también estar configurado para modificar al identificador de frecuencias 908 cuando un marco de muestras de audio (por ejemplo, uno de los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o 304, 306, 308, y 310 de la Figura 3) de un segmento de muestras (por ejemplo, uno de los segmentos de muestras 312a-f de la Figura 3) ha sido generado. El dispositivo de temporización 903 puede estar configurado para generar datos de tiempo y/o información de sello de tiempo y puede ser implementado en un reloj, un temporizador, un conectador, y/o cualquier otro dispositivo adecuado. El dispositivo de temporización 903 puede estar conectado de manera comunicativa al generador de tiempo de referencia 904 y puede estar configurado para comunicar datos de tiempo y/o sellos de tiempo al generador de tiempo de referencia 904. El dispositivo de temporización 903 puede también estar conectado de manera de manera comunicativa al generador de muestras 902 y puede establecer una señal de inicio o interrumpir para dar instrucciones al género de muestras 902 para iniciar la recopilación o adquisición de datos de muestras de audio. En un ejemplo, el dispositivo de temporización 903 puede ser implementado por un reloj de tiempo real que tiene un periodo de 24 horas que rastrea el tiempo con una resolución de milisegundos. En este caso, el dispositivo de temporización 903 puede estar configurado para reinicializarse en cero a la media noche y rastrear el tiempo en ilisegundo con relación a la media noche. El generador de tiempo de referencia 904 puede inicializar un tiempo de referencia to cuando una notificación es recibida del generador de muestras 902. Como se describió arriba con relación a las Figuras 2 y 3, el tiempo de referencia t0 puede ser utilizado para indicar el tiempo dentro de una corriente de audio cuando se genera una firma. En particular, el generador de tiempo de referencia 904 puede ser configurado para leer datos de tiempo y/o valor de sello de tiempo a partir del dispositivo de temporización 903 cuando es notificado del inicio de un proceso de adquisición de muestras por el generador de muestras 902. El generador de tiempo de referencia 904 puede entonces almacenar el valor de sello de tiempo como el tiempo de referencia o. El modulo de FFT móvil 906 puede estar configurado para efectuara una FFT móvil empleando las muestras de audio obtenidas a partir del generador de muestras 902. De conformidad con lo descrito arriba con relación a la Figura 4, una FFT móvil puede actualizar datos de aspecto de frecuencia cada vez que se obtienen dos muestras (por ejemplo, las dos muestras más recientemente adquiridas vNs-2 y vs-i) del generador de muestras 902. El identificador de frecuencia 908 puede estar configurado para identificar uno o varios pares de frecuencias a partir de datos de aspecto de frecuencia en respuesta a una notificación proveniente del generador de muestras 902 en el sentido que se ha generado un nuevo marco de muestras de audio o un nuevo segmento de muestras de audio. Por ejemplo, si el sistema de generación de firmas de ejemplo 900 está configurado para generar firmas monitoreadas, el identificador de frecuencias 908 identifica pares de frecuencias a partir de los datos de aspecto de frecuencia en respuesta a una notificación de nuevo marco de muestra de audio. Alternativamente, si el sistema de generación de firmas de ejemplo 900 esta configurado para generar firmas de referencia, un marco de muestras de audio de datos se forma dentro de cada uno de los segmentos de muestras de conformidad con lo descrito arriba con relación a la Figura 3, por consiguiente, el identificador de frecuencias 908 identifica pares de frecuencias a partir de los datos de aspecto de frecuencia en respuesta a una notificación de nuevo segmento de muestras. El identificador de frecuencia 908 puede entonces configurarse para comunicar índices que identificar los componentes de frecuencia de los pares de frecuencias al identificador 910 de valor de potencia espectral . El identificador de valor de potencia espectral 910 puede estar configurado para obtener los índices asociados con los componentes de frecuencia de los pares de frecuencia a partir del idéntificador de frecuencia 908. El identificador de valor de potencia espectral 910 puede entonces determinar o identificar la potencia espectral de cada componente de frecuencia de los pares de frecuencias -mediante la recuperación del valor de potencia espectral para cada componente de frecuencia a partir de los datos de espectro de frecuencia generados por el módulo de FFT móvil 906. Los valores de potencia espectrales pueden entonces ser comunicados al comparador 912. De conformidad con lo descrito arriba con relación a la Figura 5, el comparador 912 y el generador de descriptores 914 pueden funcionar de manera coordinada para generar descriptores de M bits. El comparador 912 puede obtener los valores de potencia espectral y comparar los valores de potencia espectral para cada par de frecuencias . El generador de descriptores 914 puede estar configurado para obtener resultados de comparación a partir del comparador 912 y generar los bits de descriptor de un descriptor de M bits con base en los resultados de la comparación.
El concatenador 916 puede obtener valores de descriptor a partir del generador de descriptores 914. Cuando se obtiene un conjunto completo de descriptores, el concatenador 916 puede concatenar los descriptores 916 para formar una firma espectral digital. La interfaz de comunicación de datos 918 puede obtener las firmas espectrales digitales a partir del concatenador 916 y el tiempo de referencia to que corresponde a la firma espectral digital y comunicarlas a una memoria y/o sitio de referencia. Por ejemplo, si el sistema de regeneración de firmas de Ejemplo 900 está configurado para generar firmas monitoreadas en el sitio de monitoreo 102 (Figura 1A) , las firmas monitoreadas pueden ser comunicadas a la instalación central de recopilación de datos (Figura 1A) a través de la red 108 (Figura ÍA) . Alternativamente, si el sistema de generación de firmas de ejemplo 900 está configurado para generar firmas de referencia, las firmas de referencia pueden ser comunicadas a la instalación central de recopilación de datos 154 (Figura IB) y/o almacenadas en la memoria 134 (Figura IB) . La Figura 10 es un diagrama de bloque de otro sistema de generación de firmas de ejemplo 1000 para generar firmas digitales con base en corrientes de audio. En particular, el sistema de generación de firmas de ejemplo 1000 puede utilizarse para generar firmas monitoreadas y/o firmas de referencia con base en transformadas wavelet de conformidad con lo descrito arriba con relación a los métodos de ejemplo de las Figuras 6 y 7. Por ejemplo, el sistema de generación de firmas de ejemplo 1000 puede utilizarse para implementar los generadores de firmas 114 y 122 de la Figura 1A y para generar firmas monitoreadas. Adicional o alternativamente, el sistema de generación de firmas de ejemplo 1000 puede utilizarse para implementar los generadores de firmas 156 y 158 de la Figura IB. Además, el sistema de generación de firmas de ejemplo 1000 puede utilizarse para implementar los métodos de ejemplo de las Figuras 6 y 7. El sistema de generación de firmas de ejemplo 1000 incluye el generado de muestras 902, el dispositivo de temporización 903, el generador de tiempo de referencia 904, el comparado 912, el generador de descriptores 914, el concatenador 916, y la interfaz de comunicación de datos 918 del sistema de generación de firmas de ejemplo 900 descrito arriba con relación a la Figura 9. Adicionalmente, el sistema de generación de firmas de ejemplo 1000 incluye un módulo de transformada wavelet 1002, un identificador de bloque de sub-banda 1004, y un generador de valor de energía 1006, todos los cuales pueden estar conectados de manera comunicativa como se muestra. El módulo de tranformada wavelet 1002 puede estar configurado para aplicar transformadas wavelet a muestras de audio obtenidas del generador de muestras 902. Por ejemplo, el modulo de transformada wavelet 1002 puede obtener un marco de muestras de audio (por ejemplo, uno de los marcos de muestras de audio 204, 206, 208, y 210 de la Figura 2 o 304, 306, 308, y 310 de la Figura 3) a partir del generador de muestras 902 y efectuar una descomposición wavelet de nivel M en las muestras de audio para generar valores de datos filtrados empleando, por ejemplo, la transformada wavelet Daubechies de conformidad con lo descrito con relación a las Figuras 6 y 7. Los valores de datos filtrados pueden ser entonces comunicados al identificador de bloque de sub-banda 1004. El identificador de bloque de sub-banda 1004 puede estar configurada para obtener los valores de datos filtrados a partir del módulo de transformada wavelet 1002 y generar un bloque de sub-banda de baja frecuencia Lx y un bloque de sub-banda de alta frecuencia H? . Como se describió con mayores detalles arriba con relación a la Figura 7, los bloques de sub-banda Lx y Bx pueden ser identificados mediante el hecho de desintercalar los valores de datos filtrados. El bloque de sub-banda de baja frecuencia puede entonces ser comunicado al módulo de transformada wavelet 1002 para efectuar otra descomposición wavelet y el bloque filtrado de sub-banda de alta frecuencia puede ser comunicado al generador de valor de energía 1006. El generador de valor de energía 1006 puede estar configurado para generar valores de energía Bx con base en bloque de sub-banda de alta frecuencia. El generador de valor de energía 1006 puede estar configurado para analizar o separar el bloque de sub-banda de alta frecuencia en una primera mitad de valores de datos filtrados y una segunda mitad de valores de datos filtrados de conformidad con lo descrito con mayores detalles arriba con relación a la Figura 7. El generador de valores de energía 1006 puede entonces generar un primer valor de energía Bo mediante el hecho de elevar al cuadrado y sumar la primera mitad de los valores de datos filtrados. Un segundo valor de energía Ex puede ser generado meidante el eecho de elevar al cuadrado y sumar la segunda mitad de valores de datos filtrados. El comparador 912 y el generador de descriptores 914 puede configurarse para generar descriptores con base en valores de energía. Por ejemplo, el comparador 912 puede obtener valores de energía a partir del generador de valores de energía 1006 y comparar una primera energía con un segundo valor de energía. El generador de descriptores 914 puede obtener resultados de 'comparación a partir del comparador 912 y generar los bits de un descriptor de M bits con base en los resultados de la comparación. El concatenador 916 puede obtener descriptores a partir del generador de descriptores 914 y generar firmas espectrales digitales mediante la concatenación de varios resultores de conformidad con lo descrito arriba con relación a la Figura 9. La interfaz de comunicación de datos 918 puede entonces almacenar o transmitir firmas obtenidas a partir del concatenador 916 con tiempos de referencia correspondientes obtenidos a partir del generador de tiempo de referencia 904. La Figura 11 es un diagrama de bloques de un sistema de comparación de firmas de ejemplo 1100 para comparar firmas espectrales digitales. En particular, el sistema de comparación de firmas de ejemplo 1100 puede ser utilizado para comparar firmas monitoreadas con firmas de referencia. Por ejemplo, el sistema de comparación de firmas de ejemplo 1100 puede ser utilizado para implementar el analizador de firmas 132 de la Figura 1 para comparar firmas monitoreadas con firmas de referencia. Adicionalmente, el sistema de comparación de comparación de firmas de ejemplo 1100 puede ser utilizado para implementar el método de ejemplo de la Figura 8. El sistema de comparación de firmas de ejemplo 1100 incluye un receptor de firmas monitoreadas 1102, un receptor de firmas de referencia 1104, un comparador 1106, un filtro de distancia de Hamming 1108, un identificador de medios 1110 y una interfaz de tabla de referencia de identificación de medios 1112 todos los cuales pueden estar conectados de manera comunicativa como se muestra. El receptor de firmas monitoreadas 1102 puede estar configurado para obtener firmas monitoreadas a través de la red 106 (Figura 1) y comunicar las firmas monitoreadas al comparador 1106. El receptor de firmas de referencia 1104 puede ser configurado para obtener firmas de referencia a partir de la memoria 134 (Figuras 1A y IB) y comunicar las firmas de referencia al comparador 1106. El comparador 1106 y el filtro de distancia de Hamming 1108 pueden estar configurados para comparar firmas de referencia con firmas monitoreadas empleando distancias de Hamming. En particular, el comparado 1106 puede estar configurado para comparar descriptores de firmas monitoreadas con descriptores de varias firmas de referencia y para generar valores de distancia Hamming para cada comparación. El filtro de distancia de Hamming 1108 puede entonces obtener los valores de distancia de Hamming a partir del comparador 1106 y eleminar las firmas de referencia no correspondientes con base en los valores de distancia de Hamming de conformidad con lo descrito arriba con relación a la Figura 8. Después de encontrar una firma de referencia correspondiente, el identificador de medios 1110 puede obtener la firma de referencia correspondiente y en cooperación con la interfaz de tabla de referencia de identificación de medios 1112 puede identificar la información de medios asociada cpn una corriente de audio no identificada (por ejemplo, la corriente de audio monitoreada de e emplo 202 de la Figura 2) . Por ejemplo, la interfaz de tabla de referencia de identificación de medios 1112 puede estar conectada de manera comunicativa con una tabla de referencia de identificación de medios o una base de datos que se utiliza para referencia cruzada de información de identificación de medios (por ejemplo, título de película, título de espectáculo, título de canción, nombre de artista, número de episodio, etcétera) con base en firmas de referencia. De esta manera, el identificador de medios 1110 puede recuperar información de identificación de medios a partir de la base de datos de identificación de medios con base en las firmas de referencia correspondientes. La Figura 12 es un diagram de bloques de un sistema de procesador de ejemplo 1210 que puede utilizarse para implementar el aparato y métodos descritos aquí. Como se muestra en la Figura 12 el sistema de procesador 1210 incluye un procesador 1212 acoplado a un bus de interconexión o red 1214. El procesador 1212 incluye un conjunto de registrador o espacio de registrador 1216, que se muestra en la Figura 12 totalmente en circuito integrado o chip, pero que podría estar ubicado alternativamente total o parcialmente fuera del circuito integrado o chip y conectado directamente al procesador 1212 a través de conexiones eléctricas delicadas y/o através de red de interconexión o bus 1214. El procesor 1212 puede ser cualquier procesador adecuado, unidad de procesamiento o microprocesador. Aún cuando se muestra en la Figura 12, el sistema 1210 puede ser un sistema de multiprocesador y, por consiguiente, puede incluir uno o varios procesadores adicionales que son idénticos o similares al procesador 1212 y que están conectados de manera comunicativa con el bus de interconexión o red 1214. El procesador 1212 de la Figura 12 está conectado a un conjunto de circuitos integrados o chipset 1218 que incluye un controlador de memoria 1220 y un controlador de entrada/salida (E/S) 1222. Como se sabe bien, un conjunto de circuitos integrados o chipset proporciona típicamente E/S y funciones de administración de memoria así como varios registros para propósitos generales y/o propósitos específicos, temporizadores, etcétera que son accesibles o utilizados por uno o varios procesadores conectados al conjunto de circuitos integrados o chipset. El controlador de memoria 1220 efectúa funciones que habilitan al procesador 1212 (o procesadores si existen varios procesadores) para tener acceso a una memoria de sistema 1224 y una memoria de almacenamiento 1225. La memoria de sistema 1224 puede incluir cualquier tipo deseado de memoria volátil/ o no volátil como por ejemplo memoria de acceso aleatorio estática (SRAM) , memoria de acceso aleatoria dinámica (DRAM) , memoria instánea, memoria de solo lectura (ROM), etcétera. La memoria de almacenamiento masivo 1225 puede incluir cualquier tipo deseado de dispositivos de almacenamiento masivo incluyendo unidades de disco duro, unidades ópticas, dispositivos de almacenamiento de cinta, etcétera. El controlador de E/S 1222 efectúa funciones que permiten al procesador 1212 comunicar con dispositivos periféricos de entrada/salida (E/S) 1226 y 1228 a través de bus de E/S 1230. Los dispositivos de E/S 1226 y 1228 pueden ser cualquier tipo deseable de dispositivo E/S como por ejemplo un teclado, una ' pantalla de video con monitor, un ratón, etcétera. Mientras que el controlador de memoria 1220 y el controlador de E/S 1222 se ilustran en la Figura 12 como bloques funcionales separados dentro del conjunto de ciercuitos integrados o chipset 1218, las funciones efectuadas por estos bloques pueden estar integradas dentro de un solo circuito de semiconductor o bien pueden implementarse dos o más circuitos integrados separados. Los métodos descritos aquí pueden ser implementados utilizando instrucciones almacenadas en un medio legible en computadora que son ejecutadas por el procesador 1212. El medio legible en computadora puede incluir cualquier combinación deseada de medio de estado sólido, magnético y/u óptico implementado utilizando cualquier combinación deseada de dispositivos de almacenamiento masivo (por ejemplo, disco duro) , dispositivos de almacenamiento removibles (por ejemplo, discos blandos, tarjetas memoria o memorias tipo memory stic s, etcétera) y/o dispositivos de memoria integrada (por ejemplo, memoria de acceso aleatorio, memoria instantánea, etcétera) . Aún cuando ciertos métodos, aparatos y artículos de manufactura han sido descritos aquí, el alcanze de cobertura de esta patente no se limita a estos ejemplos. Al contrario, esta patente abarca todos los métodos, aparatos y artículos de manufactura que caen dentro del alcance de las reivindicaciones adjuntas ya sea literalmente o bien dentro del marco de la doctrina de los equivalentes.