WO2007138124A1

WO2007138124A1 - Método aparato y sistema aplicado en un protocolo de coherencia de una memoria cache

Info

Publication number: WO2007138124A1
Application number: PCT/ES2006/070074
Authority: WO
Inventors: Carlos Madriles Gimeno; Carlos GARCIA QUIÑONES; Pedro Marcuello; Jesús SANCHEZ; Fernando Latorre; Antonio Gonzalez
Original assignee: Intel Corporation
Priority date: 2006-05-30
Filing date: 2006-05-30
Publication date: 2007-12-06
Also published as: DE112006003917T5; US8185700B2; US20090083488A1; CN101449250A; CN101449250B

Abstract

En una realización, el presente invento incluye un método para recibir un mensaje de bus en una primera memoria cache correspondiente a un acceso especulativo a una parte de una segunda memoria cache por un segundo hilo, y determinar dinámicamente en la primera memoria cache si existe una dependencia entre hilos, entre el segundo hilo y un primer hilo asociado con la primera memoria cache con respecto a esa una parte. Se describen y se reivindican otras realizaciones.

Description

MÉTODO APARATO Y SISTEMA APLICADO EN UN PROTOCOLO DE COHERENCIA DE UNA MEMORIA CACHE

Antecedentes

Las realizaciones del presente invento se refieren a sistemas basados en procesador, y más en particular a la implantación de un protocolo de coherencia de la memoria dentro de uno de tales sistemas.

En los últimos años, los procesadores han incorporado un creciente soporte para el paralelismo a nivel de ejecución. Usualmente, el paralelismo a nivel de ejecución explotado por las arquitecturas es explícita o no especulativa. La utilización del paralelismo a nivel de ejecución especulativo ha sido propuesto para aumentar aun más los beneficios de las arquitecturas multihilo/multinúcleo. En tales soluciones, se divide el código en trozos que son ejecutados en paralelo especulativamente. La ejecución en memoria transaccional es una técnica similar en la que se permite que diferentes hilos tengan acceso especulativo y escriban en la memoria, ignorando las posibles dependencias de datos entre los hilos. En estos dos modelos de ejecución, el estado de memoria especulativa es encomendado atómicamente al estado de la arquitectura o bien desechado dependiendo de las comprobaciones del tiempo de ejecución (por ejemplo de las dependencias de la memoria entre hilos) . Para implantar eficazmente estos modelos de ejecución en procesadores actuales multihilo y multinúcleo, el soporte de equipo físico en el subsistema de la memoria se amplia con el soporte para manejar datos especulativos, detectar dependencia de datos entre hilos, y encomendar o aplastar el estado especulativo. De este modo, un subsistema de memoria puede ser capaz de mantener una versión especulativa diferente por hilo del mismo lugar de la memoria de modo que hilos especulativos de la misma aplicación puedan compartir el espacio de la memoria y escribir en los mismos lugares de la memoria. Un subsistema de memoria ampliado con soporte de especulación y multiversión se denomina una memoria cache multiversión (MVC) . Frecuentemente tales sistemas incluyen tablas centralizadas tales como una tabla para deshacer ambigüedades en la memoria para mantener la pista de los datos a los que se ha tenido acceso especulativamente. Sin embargo, tal soporte de equipo físico es costoso y requiere cantidades significativas de espacio y de energía. Tal soporte requiere además típicamente soporte de órdenes de lectura basadas en el equipo físico. Además, se requiere una comunicación significativa entre diversas memorias caches de cada sistema, incluyendo la transmisión de los propios datos especulativos, lo cual aumenta el tráfico en el bus y afecta perjudicialmente a las actuaciones y al consumo de energía. Breve Descripción de los Dibujos

La FIG. 1 es un diagrama bloque de una parte de un sistema de de acuerdo con una realización del presente invento.

La FIG. 2 es un organigrama de un método para efectuar la ejecución especulativa de acuerdo con una realización del presente invento.

La FIG. 3 es un organigrama de un método para efectuar operaciones especulativas adicionales de acuerdo con una realización del presente invento.

La FIG. 4 es un organigrama de un método para más operaciones especulativas de acuerdo con una realización del presente invento. La FIG. 5 es un organigrama de un método para procesar mensajes de bus recibidos de acuerdo con una realización del presente invento.

La FIG. 6 es un organigrama de un método para encomendar los resultados de una operación especulativa de acuerdo con una realización del presente invento.

La FIG. 7 es un organigrama de un método para aplastar una operación especulativa de acuerdo con una realización del presente invento.

La FIG. 8 es un diagrama de transición de estado que ilustra las respuestas a acontecimientos del procesador de acuerdo con una realización del presente invento. La FIG. 9 es un diagrama de transición de estado que ilustra las repuestas a mensajes de bus de acuerdo con una realización del presente invento.

La FIG. 10 es un diagrama bloque de un sistema multiprocesador de acuerdo con una realización del presente invento . Descripción Detallada

En varias realizaciones, se puede implantar un protocolo de memoria cache multiversión en un sistema para permitir procesado especulativo de múltiples hilos y/o transacciones. De este modo, se pueden obtener actuaciones mejoradas puesto que por los hilos se puede ejecutar en paralelo y un protocolo de coherencia de memoria cache, en combinación con software que maneje las órdenes por los hilos, puede determinar la validez de cualquier hilo especulativo dado.

Además, para deducir la complejidad del equipo físico, una memoria cache multiversión de acuerdo con una realización del presente invento no implanta la comunicación de los valores de la memoria especulativa entre hilos especulativos. Al no efectuar tal comunicación, se simplifica significativamente el equipo físico, dado que ello evita una lógica de control de versión centralizada. En consecuencia, se puede reducir al mínimo el equipo físico para implantar la ejecución por hilos especulativa, y además no hay necesidad de un directorio centralizado u otra estructura de memoria cache centralizada. Por el contrario, un controlador de memoria cache asociado con memorias cache locales puede recibir el tráfico del bus relativo a accesos especulativos y, sobre la base de esta información y del estado de equipo físico especulativo mínimo en la memoria cache, determinar si hay un conflicto a un lugar al que se tenga acceso. Si es asi, el controlador de la memoria cache puede enviar una señal a una capa de software, por ejemplo, a un manipulador de la aplicación para determinar la naturaleza del conflicto. Al determinar que uno o más hilos han de ser aplastados, el manipulador de la aplicación puede enviar un mensaje por el bus para producir el aplastamiento. El controlador (o controladores) de la memoria cache asociado (s) con el hilo (hilos) al ser anulados puede establecer en consecuencia el estado de una o más lineas de memoria cache asociadas con el hilo. En varias realizaciones, se puede implantar un protocolo de coherencia de memoria cache multiversión sobre la base de un protocolo convencional modificado, compartido, inválido (MSI) /modificado, exclusivo, compartido, inválido (MESI). El protocolo, al cual se puede aqui referencia como un protocolo MU[E]SLI, incluye estados adicionales (por ejemplo, un estado L correspondiente a un estado cargado especulativo, y un estado U correspondiente a un estado inseguro) y puede operar en la granularidad de la palabra, detectar dinámicamente las dependencias de la memoria entre hilos, y soportar una versión especulativa de un lugar en la memoria por cada memoria cache de datos. Es decir, que el protocolo puede soportar una versión especulativa de una palabra dada por hilo y por memoria cache de datos .

El estado de memoria especulativa puede mantenerse en cada memoria cache de datos local del núcleo y no se propaga a niveles superiores de una jerarquia de la memoria hasta ser encomendado. La expulsión de una linea de memoria cache modificada especulativamente puede originar la anulación de un hilo especulativo que discurra en ese núcleo. La actividad de coherencia debida a cargas y almacenamientos no especulativos puede operar en la granularidad de la linea. Para cargas y almacenamientos especulativos, el protocolo puede operar en la granularidad de la palabra para soportar versiones especulativas y reducir las anulaciones innecesarias debidas a falsa condición de compartir.

Las dependencias de la memoria entre hilos pueden verificarse dinámicamente. Cuando se detecta una dependencia de datos (por ejemplo, dependencia entre hilos de leer después de escribir (RAW) o escribir después de leer (WAR) , se puede invocar un manipulador de violación. El manipulador de violación puede ejecutar a nivel de aplicación y anular apropiadamente la actividad de especulación. Para reducir la complejidad del equipo físico, el protocolo no tiene concepto del orden de los hilos. En el caso de multihilo especulativo en el que existe un orden secuencial entre los hilos, se puede implantar una capa de software que gestione la relación de los hilos. Por ejemplo, en el caso de una violación de la dependencia de datos entre hilos, el manipulador de software invocado es responsable de comprobar si hay una dependencia de leer después de escribir antes de anular el hilo especulativo que haya efectuado una lectura (y todos sus sucesores) .

En varias realizaciones, se pueden manejar las expulsiones de lineas de memoria cache no especulativas de acuerdo con el protocolo MESI. Sin embargo, puesto que el estado de la memoria especulativa y el estado de la información se mantiene localmente en la memoria cache de datos y no se propaga a niveles superiores hasta que sea encomendado, cualquier expulsión de una linea de memoria cache a la que se tenga acceso especulativamente (es decir, de acceso de leer o escribir) origina una violación, similar a la de una dependencia de datos entre hilos.

Por otra parte, el protocolo puede permitir una mezcla de carga/almacenamientos especulativos y no especulativos en la misma memoria cache de datos local. Generalmente, cualquier carga/almacenamiento efectuado por un hilo especulativo se trata como especulativo. Sin embargo, las cargas/almacenamientos especiales, denominados accesos "seguros", pueden efectuarse por cualquier hilo (especulativo o no) para acceso a la memoria compartida y estos accesos pueden tratarse como no especulativos. Por consiguiente, pueden producirse algunas interacciones cuando las cargas/almacenamientos especulativos y no especulativos efectuados por acceso al mismo hilo a los mismos lugares. En ese caso, el protocolo puede resolver esta cuestión suscitando para ello un caso de violación siempre que una carga/almacenamiento no especulativo tenga acceso a un lugar de palabra a la que se tenga acceso especulativamente (es decir, con el conjunto de bits U o L) . En varias realizaciones, el protocolo de coherencia puede mantener dinámicamente la pista de las palabras de datos de la memoria a las que se ha tenido acceso especulativamente y verificar las dependencias de datos entre hilos con objeto de detectar las falsas especulaciones sobre la marcha. El mecanismo para comprobar dinámicamente las dependencias entre hilos puede estar basado en varios mensajes de bus. En una realización, tales mensajes pueden ser etiquetados con el identificador de hilo (ID) del hilo que genere el mensaje, la dirección de la linea de la memoria cache a la que se ha tenido acceso y al menos una máscara de palabra para indicar la palabra (palabras) a la que se haya tenido acceso dentro de la linea. Estos mensajes pueden adoptar diferentes formas en las diferentes realizaciones. Sin embargo, los mensajes pueden ser usados para indicar a otros controladores de la memoria cache el estado de los datos a los que se ha tenido acceso especulativamente. En respuesta, estos controladores de la memoria cache pueden tomar varias acciones como se describe con más detalle en lo que sigue. En una realización, los mensajes de bus que pueden ser generados sobre acceso especulativo pueden incluir un mensaje de verificación de lectura, un mensaje de verificación de escritura y un mensaje de verificación no especulativa de escritura (que se designan, respectivamente, como un mensaje de ChkRd, de ChkWr, y de ChkNSWr) . Aunque pueden implantarse realizaciones de diferentes sistemas, en una realización se puede usar una memoria cache multiversión en un sistema de múltiples procesadores. Por ejemplo, el sistema puede incluir múltiples procesadores, por ejemplo, núcleos de un procesador multinúcleo o múltiples procesadores de un sistema multiprocesador . Cada núcleo puede incluir o estar asociado con una memoria cache local, por ejemplo, una memoria cache de nivel 1 (Ll) que incluye un controlador de memoria cache.

Con referencia ahora a la FIG. 1, se ha representado un diagrama bloque de una parte de un sistema de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 1, el sistema 10 incluye un procesador 20 que está acoplado a una memoria 65 del sistema, en la cual puede usar una memoria de acceso directo dinámica (DRAM), en una realización. Como se ha ilustrado en la FIG. 1, el procesador 20 puede ser acoplado a la memoria 65 del sistema a través de una interfaz 60 fuera de chip, aunque el alcance del presente invento no queda limitado a este aspecto.

Como se ha ilustrado también en la FIG. 1, un procesador 20 incluye un núcleo 30 y una memoria cache 40. En una realización, el procesador 20 puede ser un procesador de un solo núcleo, aunque en otras implantaciones el procesador 20 puede ser un procesador multinúcleo, en el cual pueden estar otros núcleos configurados similarmente con un núcleo y una memoria cache asociada. La memoria cache 40 que puede ser una memoria cache Ll, incluye una matriz de memoria 42 y un controlador de memoria cache 50. La matriz de memoria 42 incluye una pluralidad de lineas de memoria cache 43a-43n (genéricamente la linea 43 de la memoria cache) . Cada linea 43 de la memoria cache puede almacenar múltiples palabras de datos en una parte de datos 49. Aunque el alcance del presente invento no queda limitado a este aspecto, en una realización la parte de datos 49 puede almacenar ocho palabras. Además del almacenamiento de datos, cada linea 43 de memoria cache puede incluir una etiqueta 44 asociada, la cual puede ser usada para tener acceso a la linea de memoria cache. Además, cada linea de memoria cache 43 puede incluir una primera parte de estado 45, la cual puede incluir a su vez una serie de bits o indicadores de acuerdo con un protocolo de coherencia de memoria cache seleccionado. Por ejemplo, en una realización, este puede ser un protocolo MESI. En otras realizaciones se pueden usar otros protocolos de memoria cache, tales como un protocolo MSI.

Continuando con referencia a la FIG. 1, cada linea 43 de memoria cache puede incluir además una tercera máscara especulativa 46, a la que también se hace referencia como una primera máscara de palabra. La primera máscara especulativa 46 puede incluir un bit asociado con cada palabra de la parte de datos 49. En consecuencia, en la realización de la FIG. 1, la primera máscara especulativa 46 puede incluir primeros indicadores especulativos 41i-41₈ (genéricamente primer indicador especulativo 41) cada uno de ellos asociado con una palabra correspondiente en la parte de datos 49. La primera máscara de palabra especulativa 46 puede usarse para indicar que se ha producido una lectura especulativa de la palabra asociada en la parte de datos 49.

Análogamente, una segunda máscara especulativa 48, a la que también se hace aqui referencia como una segunda máscara de palabra, puede incluir un bit asociado con cada palabra de la parte de datos 49. Como se ha ilustrado en la FIG. 1, la segunda máscara especulativa 48 puede incluir segundas indicaciones especulativas 47i~47₈ (genéricamente segundo indicador especulativo 47) cada uno asociado con una palabra correspondiente en la parte de datos 49. La segunda máscara de palabras especulativa 48 puede usarse para indicar que se ha producido una escritura especulativa de la palabra asociada en la parte de datos 49. En una realización, cada segundo indicador 47 de la segunda máscara de palabras especulativa 48 puede denominarse como un bit U (Inseguro) , que se establece cuando escribe un almacenamiento de un hilo especulativo o una región de transacción en la correspondiente palabra. Análogamente, cada primer indicador 41 de la primera máscara de palabras especulativa 46 puede denominarse como un bit L (Cargado Especulativamente) , lo cual indica que la palabra de datos ha sido leida por la transacción o hilo especulativo y que no fue producida por ese hilo/transacción. Una carga especulativa puede establecer ese bit en cualquier palabra leida que tenga el bit U despejado.

Por consiguiente, cuando se esté produciendo ejecución especulativa que proporciona acceso a datos en la memoria cache 40, el controlador de memoria cache 50 puede hacer que sean establecidos los indicadores apropiados en la primera máscara especulativa 46 y en la segunda máscara especulativa 48. Además, sobre la base del estado de una linea de memoria cache dada, el controlador de memoria cache 50 puede originar la generación y la transmisión de mensajes de bus para notificar a otros agentes del sistema, por ejemplo, a otros controladores de memoria cache, en relación con el estado de las diversas lineas de memoria cache. De este modo, el procesado especulativo puede ser implantado usando un equipo fisico añadido minimo. En varias realizaciones, el controlador de memoria cache 50 puede además estar configurado para recibir mensajes de bus que lleguen, por ejemplo, procedentes de otros controladores de memoria cache y determinar si existe un conflicto entre una dirección indicada por el mensaje de bus y un lugar en la memoria cache 40. De ser asi, el controlador de memoria cache 50 puede enviar un mensaje de violación de la dependencia de datos, por ejemplo, al núcleo 30 para hacer posible la ejecución de un manipulador apropiado para determinar el ordenamiento entre accesos en conflicto.

Como se ha ilustrado también en la FIG. 1, el procesador 20 puede incluir una interfaz 55 en el chip, la cual hace posible la comunicación entre varios núcleos dentro del procesador 20, en las realizaciones en las cuales el procesador 20 sea un procesador multinúcleo. Aunque se ha ilustrado con esta implantación particular en la realización de la FIG. 1, ha de quedar entendido que no queda limitado a este aspecto el alcance del presente invento. Con referencia ahora a la FIG. 2, se ha representado un organigrama de un método para efectuar operaciones especulativas de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 2, el método 100 puede empezar por ejecutar especulativamente un hilo (bloque 110) . Tal ejecución especulativa puede corresponder a un hilo al ser ejecutado, por ejemplo, sobre la base de la predicción en base de una rama de un camino probable para un flujo de programa. En otras implantaciones, la ejecución especulativa puede corresponder a la ejecución de una transacción en un sistema de memoria transaccional de acuerdo con una realización del presente invento. Durante la ejecución del hilo especulativo, puede determinarse si se ha de efectuar una operación de carga (rombo 115) . Si no es asi, el control pasa volviendo al bloque 110, antes considerado. Si se ha de efectuar una operación de carga, el control pasa al bloque 120. En este se puede tener acceso a los datos en una memoria cache local (bloque 120) . Por ejemplo, un núcleo que ejecute el hilo puede requerir datos que estén presentes en una memoria cache Ll. A continuación, puede determinarse si los datos a los que se ha tenido acceso fueron leidos o escritos durante la actual ejecución especulativa (rombo 125) . Por ejemplo, un bit U y un bit L asociados con los datos pueden verificarse para determinar el estado especulativo de los datos a que se ha tenido acceso. Si se determina que no se ha tenido acceso a los datos durante la ejecución especulativa, el control pasa al bloque 130. Para hacer posible la multiversión de los datos a los que se ha tenido acceso, un controlador de memoria cache asociado con la memoria cache Ll puede establecer un indicador de carga especulativa para los datos asociados proporcionados al procesador y además puede generar un mensaje de bus (bloque 130) . Más concretamente, el controlador de memoria cache puede enviar los datos requeridos al núcleo. Además, el controlador de memoria cache puede establecer uno o más indicadores de carga especulativa asociados con los datos. Por ejemplo, con referencia de nuevo a la FIG. 1, supongamos que el núcleo requiere datos de una linea de memoria cache entera 43. En tal hipótesis, el controlador de memoria cache establecerla todos los primeros indicadores 41i-41₈ de la primera máscara de palabra especulativa 46 para indicar que han sido cargados todos los datos correspondientes de una linea de memoria cache 43. Además, para mantener la coherencia entre los múltiples hilos, el controlador de memoria cache puede generar además un mensaje de bus. Obsérvese que este mensaje de bus solamente puede ser generado la primera vez que se tiene acceso especulativamente a un lugar de datos dados durante un hilo especulativo. De este modo, se realiza un tráfico de bus reducido, sin dejar por ello de proporcionar la información necesaria, es decir, que el hilo especulativo ha tenido acceso a un lugar de la memoria dado. En una realización, puede enviarse un mensaje de identificación para indicar que los datos en su memoria cache han sido cargados especulativamente en una realización, lo cual puede corresponder a un mensaje de bus de verificación de lectura, es decir, un ChkRd. Este mensaje puede ser enviado con la dirección y el contenido de la primera máscara de palabra. Este mensaje puede hacer que otros controladores de memoria cache determinan que no ha sido escrito almacenamiento de una palabra en esa máscara de palabra. El análisis de la máscara de palabra por otro controlador de memoria cache se considerará en lo que sigue. Obsérvese que el bloque 130, y sus operaciones de establecer un indicador de carga y generar un mensaje de bus, no se efectúan si los datos a los que se ha tenido acceso fueron leídos o escritos y almacenados en la memoria cache local durante la actual ejecución especulativa. En consecuencia, se deriva el bloque 130 y el método 100 concluye.

Con referencia ahora a la FIG. 3, se ha representado en ella un organigrama de un método para efectuar operaciones especulativas de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 3, un método 135 puede empezar por continuar la ejecución especulativa de un hilo (bloque 138) . A continuación, puede determinarse si se ha de efectuar una operación de almacenar (rombo 140) . Si no es asi, el control puede pasar de nuevo al bloque 138 para otra ejecución especulativa. Si por el contrario se ha de efectuar una operación de almacenar, el control puede pasar al bloque 145.

En este se puede tener acceso a los datos en la memoria cache local durante la ejecución especulativa (bloque 145) . A continuación, puede determinarse si los datos fueron producidos en la ejecución especulativa (rombo 150) . Si es asi, puede concluir el método 135. De no ser asi, el control pasa del rombo 150 al bloque 155. En este, se pueden almacenar los datos especulativos, y se puede establecer un indicador de escritura especulativa. Además, se puede generar un mensaje de bus (bloque 155) . Es decir, que además de almacenar los datos en la parte de datos 49 de una linea de memoria cache 43, se pueden establecer uno o más segundos indicadores 47 dentro de la segunda máscara especulativa 48 para indicar esta escritura de datos especulativos. Además, el controlador de memoria cache asociado puede enviar un mensaje de bus, por ejemplo, un mensaje de verificar escritura, es decir, un ChkWr, que puede ser recibido por otros controladores de memoria cache los cuales verifican entonces que ninguna carga ha leido datos de una palabra en la segunda máscara especulativa 48 correspondiente a un lugar a que se ha escrito. Al igual que con el mensaje de verificación de lectura descrito en lo que antecede, este mensaje de verificación de escritura puede únicamente ser enviado la primera vez que se proporciona un lugar de datos con datos de almacenamiento durante la ejecución de un hilo especulativo. Esto reduce el tráfico aun sin dejar de proporcionar la información necesaria, es decir, que ha sido modificado un lugar de datos dado durante la ejecución especulativa. Obsérvese que aunque se ha descrito con esta implantación particular en la realización de la FIG. 3, ha de quedar entendido que no queda por eso limitado el alcance del presente invento. Además, obsérvese que se pueden emprender acciones adicionales en un sistema para confirmar si la ejecución especulativa fue la apropiada y deberá ser encomendada o bien si la ejecución especulativa deberá ser anulada, como se describe con más detalle en lo que sigue.

Con referencia ahora a la FIG. 4, se ha representado en ella un organigrama de un método para todavia más operaciones especulativas de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 4, el método 200 puede empezar por completar el procesado especulativo (bloque 210) . Por ejemplo, tal proceso especulativo puede completarse cuando un hilo especulativo llega al final de su corriente de instrucción o bien cuando una transacción en un sistema de memoria transaccional complete su operación. En uno u otro caso, la ejecución especulativa puede escribir datos determinados especulativamente en una memoria cache local, por ejemplo una memoria cache Ll de un núcleo en el cual se haya producido la ejecución especulativa. Puede entonces determinarse si se ha validado la ejecución especulativa (rombo 220) . Para esta determinación se puede tener en cuenta si los datos usados por el núcleo para ejecución especulativa eran válidos. En diferentes realizaciones, la validación puede tener lugar de diferentes maneras y puede ser efectuada por diversos software en combinación con equipo físico.

Todavía con referencia a la FIG. 4, si se valida la ejecución especulativa, el control pasa al bloque 230, donde se puede encomendar el estado de la memoria especulativa al estado de la arquitectura (bloque 230) . Tal encomienda del estado del memoria cache local puede efectuarse de acuerdo con un organigrama que se considera en lo que sigue con respecto a la FIG. 6. Como alternativa, si no se ha validado la ejecución, el control pasa al bloque 240. En este se puede anular el estado especulativo. En una realización, tal anulación puede efectuarse de acuerdo con el organigrama de la FIG. 7, que se considera con más detalle en lo que sigue.

Como se ha descrito en lo que antecede, además de establecer indicadores y generar mensajes de bus durante la ejecución especulativa, un controlador de memoria cache puede también recibir mensajes de bus, por ejemplo, de otros controladores de memoria cache asociados con la ejecución especulativa. Estos mensajes de bus pueden incluir información relativa al estado especulativo de datos en lineas de memoria cache asociadas con el controlador de memoria cache que envia tales mensajes. Sobre la base de estos mensajes, un controlador de memoria cache de recepción puede determinar si se ha producido un impacto en un lugar en su memoria cache local.

Con referencia ahora a la FIG. 5, se ha representado un organigrama de un método para procesar mensajes de bus recibidos de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 5, por el método 300 se puede empezar por recibir un mensaje de bus asociado con la ejecución especulativa (bloque 310) . Como ejemplo, tal mensaje de bus puede ser recibido desde un controlador de memoria cache que esté asociado con un hilo que esté sometido a ejecución especulativa. Sobre la base del mensaje de bus recibido, puede determinarse si los datos correspondientes al mensaje de bus existen en la memoria cache que recibe el mensaje de bus (rombo 320) . Por ejemplo, sobre la base de la información de etiqueta enviada con el mensaje de bus puede determinarse si hay un bit en la memoria cache. Si no es asi, puede concluir el método 300.

Si por el contrario se produce un impacto, el control pasa al bloque 330. En este se puede determinar si existe un conflicto entre los datos del acceso especulativo y los datos en la memoria cache local. En varias realizaciones, el controlador de memoria cache puede determinar si existe un conflicto, por ejemplo, comparando para ello una máscara de palabra especulativa recibida con el mensaje con la máscara de palabra especulativa apropiada de la linea de memoria cache alcanzada. Como ejemplo, se puede efectuar una operación "Y" lógica con bits entre la máscara recibida y la máscara apropiada de la linea de datos alcanzada. Esta operación se considerará con más detalle en lo que sigue. Si se produce una coincidencia (es decir, que resulta un "uno" lógico de la operación "Y" lógica) ello indica un conflicto. En consecuencia, el control pasa al bloque 340. Si por el contrario no se producen impactos (es decir, que de una operación "Y" lógica resultan todos "ceros" lógicos) , no existe conflicto alguno y puede concluir el método 300. Todavía con referencia a la FIG. 5, si existe un conflicto, el controlador de memoria cache puede señalar una violación de la dependencia de datos (bloque 340) . Más concretamente, puede señalarse una violación de la dependencia de datos entre hilos. En una realización, el controlador de memoria cache que termina la violación puede enviar un mensaje determinado de violación (Viol) , por ejemplo, a su núcleo asociado juntamente con los identificadores de los hilos en conflicto. A su vez, el núcleo puede vectorizar a un manipulador de aplicación de efectúe una comparación de ordenación entre los hilos en conflicto. Sobre la base de la determinación de la dependencia de la ordenación, el manipulador de la aplicación puede generar mensajes de bus para indicar que uno o más hilos deberán ser anulados para evitar violaciones de datos. Aunque se ha ilustrado con esta implantación particular en la realización de la FIG. 5, ha de quedar entendido que pueden realizarse otras formas de manipulación de los mensajes de bus que llegan.

Con referencia ahora a la FIG. 6, representada en un organigrama de un método para encomendar los resultados de una operación especulativa a un estado de la arquitectura de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 6, por el método 400 se puede empezar por recibir un mensaje de encomendar a un bus (bloque 410) . Tal mensaje de encomendar a un bus puede ser recibido por un controlador de la memoria cache que reciba una indicación de que los datos almacenados en su memoria cache que fueron generados especulativamente han sido validados.

En consecuencia, el controlador de memoria cache puede restablecer el estado especulativo de la linea de datos a que se ha tenido acceso especulativamente en su memoria cache local (bloque 420) . Es decir, que ambas máscaras de palabras especulativas, la primera y la segunda, para cualesquiera lineas de memoria cache a las que tenga acceso especulativamente, pueden ser restablecidas. Además, cualquiera de estas lineas de memoria cache en las cuales fueran modificadas una o más palabras durante la ejecución especulativa, puede tener un estado de coherencia de memoria cache más actualizado. Más concretamente, se pueden establecer cualesquiera de tales lineas en un estado modificado (bloque 430) . Por ejemplo, en las implantaciones usando un protocolo MESI, se puede establecer el bit M. En consecuencia, tales acciones pueden actualizar efectivamente las correspondientes lineas de memoria cache a las que se ha tenido acceso especulativamente en la memoria cache local para reflejar su propio estado de arquitectura a la luz de la validación de la ejecución especulativa. Además, para efectuar un estado correcto de la arquitectura a través del sistema, el controlador de la memoria cache puede generar además un mensaje de bus de actualización. Más concretamente, el controlador de la memoria cache puede generar tales mensajes para datos compartidos que hayan sido modificados (bloque 440) . En una realización, se puede enviar un mensaje de actualización de bus, es decir, un mensaje DUpd.

En los implantes en los que hayan tenido lugar modificaciones a nivel de palabra, tales mensajes de bus pueden hacer que una o más memorias caches envíen un valor de la arquitectura de la linea de datos modificada inválida (bloque 460) . En consecuencia, al recibirse tal valor, la memoria cache local puede fundir sus palabras escritas especulativamente con el valor de la arquitectura de la linea para encomendar eventualmente el estado correcto de la arquitectura de la linea a la memoria (bloque 470) . Aunque se describe con este implante particular en la realización de la FIG. 6, ha de quedar entendido que el alcance del presente invento no queda limitado a este aspecto.

Un manipulador de la aplicación u otro agente puede determinar que la ejecución especulativa de una transacción o hilo dado viole una regla de dependencia de datos. Cuando ocurra esto, se puede enviar un denominado mensaje de bus de matar. Con referencia ahora a la FIG. 7, se ha representado un organigrama de un método para anular una operación especulativa de acuerdo con una realización del presente invento. En consecuencia, como se ha ilustrado en la FIG. 7, se puede empezar con el método 500 cuando se haya recibido un mensaje de bus de matar (bloque 510) . Por ejemplo, en una realización el mensaje puede ser recibido desde un núcleo que implante el manipulador de la aplicación. Sin embargo, en otras realizaciones el mensaje puede ser generado por un controlador de la memoria cache o por otro agente del sistema. Al recibir tal mensaje un controlador de una memoria cache que incluya los datos a que se ha tenido acceso especulativamente, el controlador de la memoria cache puede restablecer el estado especulativo de tales lineas de memoria cache a las que se ha tenido acceso especulativamente (bloque 520) . Por ejemplo, las máscaras de palabras especulativas primera y segunda pueden ser ambas borradas para cualesquiera lineas de la memoria cache a las que se haya tenido acceso especulativamente . A continuación, el controlador de la memoria cache puede invalidar el estado de cualesquiera lineas de memoria cache escritas especulativamente (bloque 530) . En consecuencia, pueden ser invalidadas cualesquiera lineas de la memoria cache que tengan indicadores establecidos en las segundas máscaras de palabra especulativas. Tal invalidación puede corresponder a un establecimiento del bit de inválido de un estado MESI de la linea de memoria cache asociada.

Siguiendo con referencia a la FIG. 7, a continuación puede determinarse si cualquiera de las lineas invalidadas estuviera en un estado exclusivo (rombo 540) . Es decir, que puede determinarse si las lineas invalidadas a las que se ha tenido acceso especulativamente eran de la propiedad exclusiva de la memoria cache local. Si no es asi, puede concluir el método 500. Si por el contrario cualesquiera lineas invalidadas estuvieran en un estado exclusivo, el control pasa al bloque 550. En este se puede enviar un mensaje de bus de liberar (es decir, un RelOwner) para estas lineas de memoria cache previamente exclusivas (bloque 550) . En consecuencia, el controlador de la memoria cache puede enviar un mensaje de bus que libere la propiedad de la linea o lineas de la memoria cache asociadas y por consiguiente devuelve la propiedad de la linea a la memoria. Aunque se describe con esta implantación particular en la realización de la FIG. 7, ha de quedar entendido que el alcance del presente invento no queda por eso limitado, y que en otras realizaciones se pueden realizar otras formas de desenvolver o anular transacciones o ejecuciones especulativas inválidas. Las FIGS. 8 y 9 son diagramas de transición de estado de acuerdo con una realización del presente invento. La FIG. 8 representa las respuestas a acontecimientos en el procesador, mientras que la FIG. 9 representa respuestas a mensajes de bus. No se han incluido los estados transitorios para mayor claridad. Las transiciones de estado se etiquetan con la siguiente nomenclatura: "acontecimientos o mensajes/acciones recibidas y/o mensajes generados". Los estados, acontecimientos, acciones y mensajes implicados en el protocolo que se ha ilustrado en las FIGS. 8 y 9, se describen en la Tabla 1.

Tabla 1

Como varios ejemplos de las transiciones representadas en las FIGS. 8 y 9, se genera un mensaje ChkRd mediante cualquier carga especulativa que tenga acceso a un lugar de palabra al que no se haya tenido previamente acceso (leida o escrita) por el mismo hilo. Por otra parte, el mensaje ChkWr es generado por cualquier almacenamiento especulativo en un lugar de palabra al que no se haya escrito anteriormente especulativamente (es decir, que no es inseguro) . Como se ha descrito en lo que antecede, los mensajes de verificación solamente pueden ser generados en la primera carga especulativa o almacenamiento en un lugar de palabra de la memoria cache. Los mensajes ChkNSWr pueden ser generados por cualquier almacenamiento no especulativo (es decir, un almacenamiento producido por un hilo no especulativo o bien un almacenamiento "seguro" producido por cualquier hilo) .

La verificación de dependencia real puede efectuarse siempre que un controlador de la memoria cache reciba un mensaje de comprobación y compare (por ejemplo, por medio de una operación "Y" de bits) la máscara de palabra del mensaje con los bits L o U de la linea de memoria cache a la que haya tenido acceso en consecuencia. En general, el mensaje ChkRd hace que el controlador de la memoria cache compare la máscara de palabra del mensaje frente a los bits U, mientras que los mensajes ChkWr y ChkNSWr la comparan frente a los bits L. En caso de que haya conflicto, es decir, de que la operación en "Y" de bits no dé como resultado cero, se detecta una dependencia de datos entre hilos y se puede suscitar un caso de violación. Esta violación invoca un manipulador de aplicación con las IDs (identidades) de los hilos del productor y del consumidor como parámetros. Cuando se genera la violación debido a un mensaje ChkNSWr, se puede hacer pasar una ID de hilo especial como parámetro del productor para notificar que el hilo del productor es no especulativo.

En varias formas de implantación, la aplicación a través del manipulador de la violación puede ser la responsable de gestionar la anulación de la actividad de especulación apropiadamente. En un modelo de ejecución multihilo especulativo, esto implica comprobar el orden entre los hilos de productor y de consumidor para verificar que la violación es causada por una dependencia de leer después de escribir. Si es asi, el manipulador puede enviar un mensaje para anular el hilo de consumidor y todos sus sucesores. En un sistema de memoria transaccional, puesto que no hay orden entre los hilos, solamente se anula el hilo de consumidor. Obsérvese que el protocolo puede soportar múltiples versiones del mismo lugar de palabra (una versión por cada hilo) , y por lo tanto la dependencia de datos de escribir después de escribir entre hilos no origina violación alguna.

Los accesos a las sub-palabras pueden ser manipulados especialmente. Un almacenamiento especulativo en un lugar de sub-palabra implica una violación cuando otro hilo escribe a la misma palabra debido a que de lo contrario no seria garantizada la coherencia de la memoria cache. Con objeto de conseguir esto, un almacenamiento especulativo de una sub-palabra puede hacer que un controlador de la memoria cache asociado establezca el bit U y envié un mensaje ChkWr, como se hace en una operación de almacenamiento especulativo. Además, el controlador de la memoria cache puede establecer el bit L y enviar un mensaje de ChkRd. Esto garantiza que siempre que otro hilo efectúe un almacenamiento en el mismo lugar de la palabra, será detectada una violación de la dependencia de datos entre hilos . Cuando se valide la actividad especulativa y no se detecte fallo alguno, el estado de especulativo de la memoria puede encomendarse al estado de la arquitectura. Para situar un proceso de encomendar, se envia un mensaje denominado de "BusCommit" ("Encomendar Bus") que incluye la ID de hilo del hilo especulativo o bien la región transaccional a ser encomendada. Cuando el controlador de la memoria cache recibe el mensaje de "BusCommit" correspondiente a la ID de hilo del mensaje, se inicia el proceso de encomendar la memoria especulativa. Este proceso puede efectuarse de acuerdo con el organigrama que se expone en LA FIG. 6. Además, como se ha ilustrado en Tabla 2 que sigue, se resumen las acciones efectuadas por la linea de memoria cache en cualquiera de los estados dados (es decir, la columna de "BusCommit".

Tabla 2

Obsérvese que el proceso de encomendar restablece todos los bits L y U en las lineas de la memoria cache local y pone en el estado M a aquellas lineas que tengan cualquier palabra escrita especulativamente (es decir, insegura) . Con objeto de hacer esto, se efectúa una exploración de la memoria cache de datos local. Aquellas lineas que estén en el estado SU o en el estado SUL producen la generación de una elevación del grado del bus (BusUpg) para invalidar otras copias de la linea de la memoria cache. De un modo similar, aquellas lineas que estén en el estado IU o IUL producen la generación de un mensaje exclusivo de leer bus (BusRdX) para solicitar el valor de la arquitectura de la linea y efectuar localmente una fusión con las palabras escritas especulativamente. Por otra parte, las lineas en los estados EU o EUL se cambian al estado M sin generar mensaje de bus alguno, dado que la linea está únicamente presente en esa memoria cache. En el caso de un fallo de especulación, se ha de anular la actividad especulativa. Un protocolo de acuerdo con una realización del presente invento puede ser el responsable de desechar todo estado de memoria especulativa producido por la región transaccional o el hilo anulado. Esto se implanta a través de un mensaje de bus, denominado "BusKill" en una realización que incluye la ID de hilo del hilo especulativo a ser anulada. Cuando se recibe el mensaje de BusKill por el controlador de memoria cache con la ID de hilo igual a la ID de hilo del mensaje, se inicia el proceso de anulación de la memoria especulativa. Este proceso puede llevarse a cabo de acuerdo con el organigrama que se expone en la FIG. 7. Además, en la Tabla 2 se han representado las acciones efectuadas por una linea de memoria cache en cada uno de los estados dados (es decir, la columna de BusKill) . Como se ha descrito en lo que antecede, este proceso de anulación incluye restablecer todos los bits L y U en la memoria cache de datos local. Además, aquellas lineas de memoria cache que tengan cualquier palabra especulativa (es decir, insegura) son invalidadas. Las lineas a las que se tiene acceso no especulativamente no se cambian. Por consiguiente, aquellas lineas que estén en cualquiera de los estados EU, EUL, SU, SUL, IU, o IUL cambian al estado I, y aquellas lineas que estén en uno cualquiera de los estados ML, EL, SL, o IL, cambian a M, E, S, e I, respectivamente. Obsérvese que las lineas en el estado EU o EUL liberan la propiedad de la linea a la memoria, a través de un mensaje de bus de liberar propietario (es decir, un RelOwner) , cuando cambian al estado de inválidas.

En consecuencia, en varias realizaciones, el ordenamiento de los hilos se manipula mediante software (por ejemplo, código generado por compilador) que es el responsable de filtrar las dependencias de la memoria entre hilos tal como en las operaciones de leer después de escribir. Un protocolo de acuerdo con una realización del presente invento puede también soportar la ejecución de la memoria transaccional, cuando el orden de los hilos sea irrelevante. Las realizaciones pueden implantarse en muchos tipos de sistemas diferentes. Con referencia ahora a la FIG. 10, se ha representado un diagrama bloque de un sistema de acuerdo con una realización del presente invento. Como se ha ilustrado en la FIG. 10, un sistema de interconexión de punto a punto 700 incluye un primer procesador 770 y un segundo procesador 780 acoplados a través de una interconexión de punto a punto 750. Aunque en la FIG. 10 se ha ilustrado como un sistema de interconexión punto a punto, ha de entenderse que el alcance del presente invento no queda limitado a este aspecto y que en otras realizaciones el sistema 700 puede ser de una arquitectura de bus de múltiples caldas u otro de tales tipos de sistema. Como se ha ilustrado en la FIG. 10, cada uno de los procesadores 770 y 780 puede ser un procesador multinúcleo, que incluya núcleos de procesador primero y segundo (es decir, núcleos de procesador 774a y 774b y núcleos de procesador 784a y 784b) . Los varios núcleos de procesador puede cada uno incluir una memoria cache local que implante un protocolo de coherencia de memoria cache de acuerdo con una realización del presente invento. En consecuencia, usando el sistema 700 se pueden efectuar transacciones y transmisiones multihilo especulativas.

El primer procesador 770 incluye además un centro controlador de la memoria (MCH) 772 e interfaces de punto a punto (P-P) 776 y 778. Análogamente, el segundo procesador 780 incluye un MCH 782 e interfaces P-P 786 y 788. Como se ha ilustrado en la FIG. 10, los MCH 772 y 782 acoplan los procesadores a las respectivas memorias, es decir a una memoria 732 y a una memoria 734, las cuales pueden ser partes de memoria principal unida localmente a los procesadores respectivos.

El primer procesador 770 y el segundo procesador 780 pueden ser acoplados a un juego de chips 790 a través de interfaces de P-P 752 y 754, respectivamente. Como se ha representado en la FIG. 10, el juego de chips 790 incluye interfaces de P-P 794 y 798. Además, el juego de chips 790 incluye una interfaz 792 para acoplar el juego de chips 790 con un motor de gráficos de actuaciones 738. En una realización, se puede usar un bus 739 de "Advanced Graphics Port (AGP) (Puerto de Gráficos Avanzado) para acoplar el motor de gráficos 738 al juego de chips 790. El bus 739 AGP puede adaptarse a la Accelerated Graphics Port Interface Spedification, Revisión 2.0 (Memoria de Especificación de Interfaz de Puerto de Gráficos Acelerados, Revisión 2.0) publicada con fecha 7 de mayo de 1998 por la Intel Corporation, Santa Clara, California (EE.UU.). Como alternativa, una interconexión de punto a punto 739 puede acoplar estos componentes .

A su vez, el juego de chips 790 puede ser acoplado a un primer bus 716 a través de una interfaz 796. En una realización, el primer bus 716 puede ser un bus de "Peripheral Component Interconnect (PCI) (Interconexión de Componentes Periféricos) tal como se define en la "PCI Local Bus Specification, Production Versión, Revisión 2.1", de fecha de junio de 1995, o bien un bus tal como el bus PCI Express u otro bus de interconexión de entrada/salida (I/O) de tercera generación, aunque el alcance del presente invento no queda limitado a eso.

Como se ha ilustrado en la FIG. 10, se pueden acoplar varios dispositivos 714 de I/O al primer bus 716, juntamente con un puente 718 de bus que acopla el primer bus 726 a un segundo bus 720. En una realización, el segundo bus 720 puede ser un bus LPC (de bajo PIN o Número de Identificación Personal) . Al segundo bus 720 pueden ser acoplados varios dispositivos incluyendo, por ejemplo, un teclado/ratón 722, dispositivos de comunicación 726 y la unidad de almacenamiento de datos 728 la cual puede incluir el código 730, en una realización. Además, se puede acoplar una I/O 724 de audio al segundo bus 720.

Las realizaciones pueden ser implantadas en forma de código y pueden ser almacenadas en un medio accesible para la máquina tal como en un medio de almacenamiento que tenga instrucciones almacenadas en el mismo que puedan ser usadas para programar un sistema para ejecutar las instrucciones. El medio de almacenamiento puede incluir, aunque sin quedar limitado a ellos, discos flexibles o disquetes, discos compactos de memoria de solo lectura (CD-ROMs) , discos compactos regrabables (CD- RWs) , y discos magneto ópticos, dispositivos semiconductores tales como memorias de solo lectura (ROMs) memorias de acceso directo (RAMs) tales como memorias de acceso directo dinámicas (DRAMs) , memorias de acceso directo estáticas (SRAMs) , memorias de solo lectura programables que pueden borrarse (EPROMs), memorias rápidas, memorias de solo lectura programables borrables eléctricamente (EEPROMs), tarjetas magnéticas u ópticas, o cualquier otro tipo de medios adecuados para almacenar instrucciones electrónicas.

Aunque se ha descrito el presente invento con respecto a un número limitado de realizaciones, quienes sean expertos en la técnica apreciarán numerosas modificaciones y variaciones del mismo. Se ha pretendido que las reivindicaciones que se acompañan abarquen todas esas modificaciones y variaciones en cuanto quedan comprendidas dentro del verdadero espíritu y del alcance de este presente invento.

Claims

Reivindicaciones

1. Un método que comprende : recibir un mensaje de bus en una primera memoria cache, correspondiendo el mensaje de bus a un acceso especulativo a una parte de una segunda memoria cache por un segundo hilo; y determinar dinámicamente en la memoria cache final si existe una dependencia entre hilos entre el segundo hilo y un primer hilo asociado con la primer memoria cache con respecto a esa una parte.

2. El método según la reivindicación 1, que comprende además señalar una violación de la dependencia a un manipulador de la aplicación asociada con una aplicación que incluye el primer hilo y el segundo hilo.

3. El método según la reivindicación 2, que comprende además: recibir en el manipulador de la aplicación el señalamiento de la violación de la dependencia y un identificador para el primer hilo y el segundo hilo; y determinar cual del primer hilo y del segundo hilo se ha de anular sobre la base de ordenar la información del primer hilo y del segundo hilo.

4. El método según la reivindicación 1, en el que la recepción del mensaje de bus comprende recibir una parte del mensaje, una parte de dirección y un identificador de hilo del segundo hilo, y no recibir la parte a la que se ha tenido acceso especulativamente .

5. El método según la reivindicación 1, que comprende además : establecer un primer indicador de estado especulativo para la parte a la que se ha tenido acceso especulativamente por el segundo hilo, y establecer un segundo indicador de estado especulativo para la parte a la que se ha tenido acceso especulativamente por el segundo hilo si la parte es escrita especulativamente por el segundo hilo.

6. El método según la reivindicación 1, en el que la determinación dinámicamente comprende: comparar una primera máscara del mensaje de bus con una primera máscara de una linea de memoria cache de la primera memoria cache que incluye la parte; y determinar la dependencia entre hilos sobre la base de la comparación .

7. Un aparato que comprende : una memoria cache que incluye una matriz de memoria y un controlador de memoria cache, en que la matriz de memoria ha de incluir una pluralidad de lineas que cada una tiene: una parte de estado para almacenar una primera máscara que tiene primeros indicadores especulativos cada uno para indicar un acceso especulativo a una palabra correspondiente de la linea, la parte de estado para almacenar además una segunda máscara que tiene segundos indicadores especulativos cada uno para indicar una escritura especulativa de una palabra correspondiente de la linea; y una parte de datos para almacenar una pluralidad de palabras; y el controlador de la memoria cache para transmitir y procesar los mensajes de bus asociados con los accesos a la memoria cache especulativos .

8. El aparato según la reivindicación 7, en el que la parte de estado y la parte de datos no incluyen información de ordenamiento.

9. El aparato según la reivindicación 7, en el que la parte de estado es para almacenar además un primer conjunto de indicadores correspondientes a un protocolo de coherencia modificada, exclusiva, compartida, e inválida.

10. El aparato según la reivindicación 9, en el que el primer conjunto de indicadores han de ser mantenidos sobre una base de linea y las máscaras primera y segunda han de ser mantenidas sobre una base de palabra.

11. El aparato según la reivindicación 7, en el que el controlador de la memoria cache es para afirmar una violación de la dependencia entre hilos a un manipulador de la aplicación.

12. El aparato según la reivindicación 11, en el que el controlador de la memoria cache es para afirmar la violación de la dependencia entre hilos si una u otra de una máscara primera o segunda que llegue enviada con un mensaje de bus de llegada está en conflicto con una máscara primera o segunda con la que coincida en la matriz de la memoria.

13. El aparato según la reivindicación 7, en el que el controlador de la memoria cache es para recibir un mensaje de bus para indicar la encomienda de un hilo especulativo si se ha validado el hilo especulativo.

14. El aparato según la reivindicación 13, en el que el controlador de la memoria cache es para dejar libre la primera máscara y la segunda máscara de lineas asociadas con el hilo especulativo si se ha validado el hilo especulativo.

15. El aparato según la reivindicación 7, en el que el controlador de la memoria cache es para verificar dinámicamente una dependencia de datos entre hilos sobre la base de un mensaje de bus que llega.

16. El aparato según la reivindicación 7, en el que el controlador de la memoria cache es para transmitir un primer mensaje de bus para indicar un acceso especulativo a una palabra de una linea, y para transmitir un segundo mensaje de bus para indicar una escritura especulativa a la palabra, en el que los mensajes de bus primero y segundo han de ser transmitidos sin la palabra.

17. El aparato según la reivindicación 16, en el que el primer mensaje de bus incluye la primera máscara y el segundo mensaje de bus incluye la segunda máscara.

18. Un articulo que comprende un medio de almacenamiento legible por máquina que incluye instrucciones que si son ejecutadas por una máquina capacitan a la máquina para poner en práctica un método que comprende: recibir un mensaje de bus en una primera memoria cache desde una segunda memoria cache para indicar una modificación de un valor de datos en la segunda memoria cache mediante una transacción de un sistema de memoria transaccional; y determinar en la primera memoria cache si la transacción está en conflicto con un primer hilo que ejecuta sobre un procesador asociado con la primera memoria cache sobre la base, al menos en parte, del mensaje de bus.

19. El articulo según la reivindicación 18, en el que el método comprende además enviar un mensaje de violación desde la primera memoria cache a un manipulador de la aplicación del procesador para determinar el ordenamiento entre la transacción y el primer hilo si se determina el conflicto.

20. El articulo según reivindicación 19, en el que el método comprende además recibir un mensaje desde el manipulador de la aplicación para anular la transacción basada en la determinación del ordenamiento.

21. El articulo según la reivindicación 20, en el que el método comprende además : restablecer indicadores especulativos en la segunda memoria cache asociados con el valor de datos; y enviar un mensaje de bus desde una segunda memoria cache para liberar la propiedad de una linea de memoria cache incluyendo el valor de datos si la segunda memoria cache poseía a la linea de memoria cache.

22. Un sistema que comprende: un primer procesador que tiene un primer núcleo y una primera memoria cache; un segundo procesador que tiene un segundo núcleo y una segunda memoria cache, en el que una determinación dinámica de una dependencia de datos entre memorias caches de un valor de datos presente tanto en la primera memoria cache como en la segunda memoria cache está basada en un mensaje de bus enviado entre la primera memoria cache y la segunda memoria cache; y una memoria de acceso directo dinámica (DRAM) acoplada al primer procesador y al segundo procesador.

23. El sistema según la reivindicación 22, en el que la primera memoria cache incluye un primer controlador de memoria cache para determinar dinámicamente la dependencia de datos entre memorias caches.

24. El sistema según la reivindicación 23, en el que el primer controlador de memoria cache es para generar un mensaje de violación para indicar una violación de la dependencia de datos entre memorias caches basada en el mensaje de bus.

25. Un sistema según la reivindicación 24, que comprende además un manipulador para recibir el mensaje de violación y para determinar el ordenamiento entre un hilo de productor y un hilo de consumidor.

26. El sistema según la reivindicación 25, que comprende además un programa de aplicación que incluye el hilo del productor y el hilo del consumidor, incluyendo además el programa de la aplicación el manipulador.

27. El sistema según la reivindicación 23, en el que el controlador de la primera memoria cache es para señalar una violación de la dependencia de datos entre memorias caches si tiene lugar un acceso especulativo a un lugar de acceso especulativamente en la primera memoria cache, en el que el acceso especulativo comprende una operación segura.