WO2008049938A1

WO2008049938A1 - Comunicación entre múltiples secuencias de procesamiento en un procesador

Info

Publication number: WO2008049938A1
Application number: PCT/ES2006/070162
Authority: WO
Inventors: Enric Gibert; Josep M. Codina; Fernando Latorre; José Alejandro Piñeiro; Pedro López; Antonio González
Original assignee: Intel Corporation
Priority date: 2006-10-27
Filing date: 2006-10-27
Publication date: 2008-05-02
Also published as: US20100005277A1; JP2010500679A; CN101529377A; DE112006004005T5; CN101529377B; US8261046B2

Abstract

En una realización, la presente invención incluye un método para el acceso a registros asociados con una primera secuencia de procesamiento al tiempo que se lleva a cabo o ej ecuta una segunda secuencia de procesamiento. En una realización semejante, un método puede incluir evitar que se lleve a cabo una instrucción de una primera secuencia de procesamiento que ha de acceder a un operando de fuente desde un archivo de registro de una segunda secuencia de procesamiento, en el caso de que un indicador de sincronización asociado al operando de fuente indique la falta de terminación de una operación productora de la segunda secuencia de procesamiento, y llevar a cabo la instrucción en el caso de que el indicador de sincronización indique la terminación de la operación productora de la segunda secuencia de procesamiento. Se describen y reivindican otras realizaciones.

Description

COMUNICACIÓN ENTRE MÚLTIPLES SECUENCIAS DE PROCESAMIENTO EN UN PROCESADOR

Antecedentes Los procesadores han llegado a ser máquinas muy complicadas que incluyen numerosas estructuras y complejas técnicas de control para permitir que las instrucciones y los datos pasen a través de la máquina con el fin de llevar a cabo diferentes operaciones solicitadas. Para mej orar el rendimiento del procesador, algunos procesadores se aprovechan del paralelismo en el nivel de las instrucciones (ILP - "instruction level parallelism"). Aunque tales técnicas pueden aumentar el rendimiento, pueden incrementar también el consumo de potencia y la complej idad del diseño. De acuerdo con ello, algunos procesadores están siendo diseñados con el propósito de permitir múltiples cadenas o secuencias de procesamiento en cooperación por medio de arquitecturas que dan soporte y se aprovechan del paralelismo en el nivel de las secuencias de procesamiento (TLP -"thread level parallelism"). Dichos procesadores pueden incluir múltiples núcleos, a menudo muchos núcleos pequeños tales como núcleos pequeños de múltiples secuencias de procesamiento simultáneas (SMT — "simultaneous multithreading") por orden.

Sin embargo, tales núcleos por orden pueden ser menos efectivos que los núcleos carentes de orden en el aprovechamiento del ILP. Es decir, mientras que los procesadores por orden pueden gestionar eficazmente aplicaciones en paralelo, las aplicaciones con una sola secuencia de procesamiento y las porciones de código en serie de las aplicaciones en paralelo pueden no comportarse de una manera eficaz en tales arquitecturas. De acuerdo con ello, ciertos procesadores pueden separar o dividir dichas aplicaciones con el fin de ej ecutar secuencias de procesamiento desgranadas al detalle con el fin de mantener una complejidad mínima al tiempo que se mejora la eficacia. Sin embargo, pütíuC pi'ü u-ilCii'ώQ una. k/Λi/tju α C-¿IΪI IÍ Ü.¿J.U Uo pTüoC S OS úc Oi^*gd.iiiZaCi üii cuando una primera secuencia de procesamiento trata de utilizar información de una segunda secuencia de procesamiento . Breve descripción de los dibujos

La Figura 1 es un diagrama de flujo de un método de acuerdo con una realización de la presente invención.

La Figura 2 es un diagrama de bloques de un cuadro marcador de acuerdo con una realización de la presente invención.

La Figura 3 es un diagrama de bloques de una implementación de la ejecución de instrucciones de acuerdo con una realización de la presente invención.

La Figura 4 es un diagrama de flujo de un método para generar información de marcas de flujo de acuerdo con una realización de la presente invención.

La Figura 5 es un diagrama de bloques de un sistema de acuerdo con una realización de la presente invención.

Descripción detallada

En las diversas realizaciones, una multiplicidad de secuencias de procesamiento que se llevan a cabo o ejecutan en un núcleo de procesador pueden acceder a valores contenidos en un archivo de registro asociado a otra secuencia de procesamiento. A través de semej ante canal de comunicación, las realizaciones pueden proporcionar un funcionamiento eficaz con múltiples cadenas o secuencias de procesamiento simultáneas (SMT -"simultaneous multithreading"). Como ej emplo, pueden llevarse a cabo unas primera y segunda secuencias de procesamiento en un único núcleo de procesador por orden, tal como un procesador de SMT. Puede proporcionarse un control con el fin de hacer posible un modelo de productor / consumidor en el que puede tenerse acceso a los valores de datos generados por la primera secuencia de procesamiento por parte de la segunda secuencia de procesamiento, y viceversa. Cada una de las secuencias de procesamiento puede ser capaz de leer el estado de los registros estructurales o de arquitectura de la otra secuencia de procesamiento durante la ej ecución,

una actividad de organización muy baj a.

Al objeto de garantizar la lectura de los valores correctos en los registros dados cuando se tiene acceso a ellos, puede proporcionarse un control de sincronización de tal manera que la secuencia de procesamiento consumidora lea los datos adecuados en la secuencia de procesamiento productora. En diversas realizaciones, una estructura de cuadro marcador tal como la que se puede utilizar en asociación con la emisión o la asignación de instrucciones, puede incluir indicadores de sincronización. Más específicamente, cada entrada en la estructura de cuadro marcador para un registro de una primera secuencia de procesamiento puede incluir un indicador de sincronización para el registro correspondiente de la segunda secuencia de procesamiento, y viceversa. El uso de este indicador puede impedir que una instrucción consumidora prosiga hasta que se lleve a cabo la instrucción productora correspondiente de la otra secuencia de procesamiento, de tal manera que esté presente el valor deseado en el archivo de registro del productor. Con el fin sacar provecho de dicho sistema de sincronización, ciertas realizaciones pueden proporcionar información de fluj o asociada a las instrucciones. Por ejemplo, pueden proporcionarse indicaciones o marcas de flujo junto con el contenido de una instrucción. En una realización, una instrucción puede incluir un código de operación, operandos de fuente y de destino, así como marcas de flujo para cada uno de los operandos de fuente y de destino. Como se describirá adicionalmente más adelante, diversos mecanismos pueden encargarse de la generación de marcas de fluj o para las instrucciones correspondientes. Por ejemplo, puede proporcionarse un soporte de compilador de tal modo que sea posible generar dichas marcas de fluj o durante la compilación de acuerdo con el soporte de instrucciones que se proporciona en una arquitectura de conjunto de instrucciones (ISA -"instruction set architecture"). En otras implementaciones, un mecanismo de optimización, tal como un dispositivo de optimización de hardware o de software, puede analizar el control del fluj o del código y generar marcas de flujo en consecuencia. De esta forma, pueden sincronizarse múltiples secuencias de procesamiento con un grado de desmenuzamiento o desgranamiento por instrucciones.

registro y la sincronización proporcionados por ciertas realizaciones de la presente invención. Por ejemplo, un mecanismo de depósito de secuencia de procesamiento de baja actividad de organización puede aprovecharse del acceso de los archivos de registro de otras secuencias de procesamiento. Puede evitarse de esta forma el gasto de copiar todos los registros del contexto de una secuencia de procesamiento depositante al contexto de una secuencia de procesamiento de depósito. Esto es así puesto que es posible marcar las instrucciones consumidoras apropiadas contenidas en la secuencia de procesamiento de depósito, de manera que lean, en su lugar, operandos procedentes del archivo de registro de la secuencia de procesamiento depositante.

De acuerdo con diversas realizaciones, es posible reducir los procesos de organización asociados con la ejecución cooperativa entre dos secuencias de procesamiento desgranadas al detalle, En consecuencia, pueden utilizarse ciertas realizaciones en asociación con el soporte del funcionamiento especulativo con múltiples secuencias de procesamiento, así como con el depósito de las secuencias de procesamiento. Aún adicionalmente, pueden utilizarse ciertas realizaciones en asociación con las denominadas secuencias de procesamiento de ayuda, a las que puede darse inicio con el fin de encargarse de tareas específicas que tienen lugar durante la ej ecución de otra secuencia de procesamiento. Sin embargo, ha de comprenderse que el ámbito de la presente invención no está limitado a este respecto, y que pueden utilizarse el acceso de registro y los mecanismos de sincronización en muchas implementaciones diferentes, incluyendo diferentes arquitecturas de procesador, sistemas y así sucesivamente.

Haciendo referencia, a continuación, a la Figura 1 , se muestra en ella un diagrama de flujo de un método de acuerdo con una realización de la presente invención. Como se muestra en Ia Figura 1 , el método 10 puede ser utilizado para llevar a cabo una instrucción de una primera cadena o secuencia de procesamiento que puede tener acceso a la información contenida en un archivo de registro de una segunda secuencia de procesamiento. Como se muestra en la Figura 1 , el método 10 puede comenzar con la recepción de una instrucción de la primera secuencia de procesamiento para su ejecución (bloque 20). Por ej emplo, üii uc atúunlCΛUuϊ uc ±IÍΛ U UC C IOÜCS ut uíl pi^'u C cSαuux p ucuc i cti un uñ descodificar la instrucción. En una realización, las instrucciones pueden incluir un código de operación, destinado a indicar un tipo de operación que se ha de llevar a cabo, así como una identificación de los operandos de fuente y de destino. Además de ello, la instrucción puede incluir información que indica si se ha de acceder a alguno de los operandos de fuente / destino desde un archivo de registro distante, por ejemplo, un archivo de registro asociado con una segunda secuencia de procesamiento, o si aquél se ha de proporcionar al mismo. Nótese que, si bien se ha descrito aquí como un archivo de registro distante, ha de comprenderse que pueden estar presentes un archivo de registro local y un archivo de registro distante en un único núcleo de un procesador, tal como un procesador múltiple o de muchos núcleos que incluya, por ejemplo, un cierto número de núcleos por orden. Haciendo aún referencia a la Figura 1 , puede determinarse a continuación si se ha de obtener algún operando de fuente de la instrucción a partir de una cadena o secuencia de procesamiento distante (rombo 30). Esto es, puede determinarse, basándose en la información de marca de flujo (en una de las realizaciones), si se ha de obtener algún operando de fuente a partir de una secuencia de procesamiento distante, por ejemplo, de una segunda secuencia de procesamiento que incluye un archivo de registro contenido dentro del núcleo de SMT. Si es así, el control pasa al rombo 40, donde puede determinarse si los indicadores de sincronización asociados con dicho operando o todos dichos operandos de fuente distante están activos. Es decir, puede analizarse un cuadro marcador u otro almacenamiento que identifique información de estado relativa a la disponibilidad de valores en registros dados, a fin de determinar si todos los operandos de fuente que se van a obtener del archivo de registro distante incluyen los valores deseados. En otras palabras, puede determinarse si una secuencia de procesamiento productora ha completado una operación de la que depende una instrucción dependiente de la primera secuencia de procesamiento. En el caso de que el (los) indicador(es) de sincronización no esté(n) activo(s), el rombo 40 puede retroalimentarse o cerrarse sobre sí mismo con el fin de encargarse de la ejecución de la instrucción hasta que estén presentes los indicadores de sincronización. Cuando los indicadores de

ÍjlilCl OiliZáCl üíi ¿ c ildo cil pi^"c S cϊil.c; a, lύ q ύ C Sigiϊi i í Cα ή uC CS iα±I pi^"Cá C.ii ι.C ≤ los valores deseados en el registro distante, el control pasa al rombo 45, que se expone en lo que sigue. Haciendo aún referencia a la Figura \ , si se determina que ningún operando de fuente procede de alguna secuencia de procesamiento distante (en el rombo 30), o que los indicadores de sincronización asociados con todos los operandos de fuente distantes están activos (según se determina en el rombo 40), el control pasa al rombo 45, donde puede determinarse si algún operando de fuente procede de la secuencia de procesamiento local (es decir, la primera secuencia de procesamiento) . Si es así, el control puede pasar al rombo 50, donde puede determinarse si se encuentran activos unos indicadores de preparación o disposición asociados al operando o a todos los operandos de fuente local. Por ej emplo, es posible acceder al cuadro marcador para determinar si está activo un indicador que indica que se ha completado una instrucción productora previa de la primera secuencia de procesamiento, de tal manera que la operación dependiente procedente de la misma secuencia de procesamiento puede llevarse a cabo utilizando el valor apropiado. En caso contrario, el rombo 50 puede realimentarse o cerrarse sobre sí mismo .

Desde los dos rombos 45 y 50, el control pasa al bloque 60, en el que la instrucción puede ser emitida para su ej ecución. Por ejemplo, un emisor de instrucciones, tal como un dispositivo de asignación, una estación de reserva u otra estructura que incluya un cuadro marcador o un almacenamiento de estado similar, puede emitir la instrucción para que sea llevada a cabo o ejecutada. De acuerdo con ello, una unidad de ejecución, tal como una unidad entera, una unidad de coma flotante (FPU -"floating point unit") u otra unidad semej ante, puede acceder a los operandos de fuente indicados a partir del archivo de registro específicamente identificado (bloque 70). Así pues, para operandos de fuente local, puede accederse al archivo de registro local asociado a la secuencia de procesamiento, con el fin de obtener los operandos de fuente, al tiempo que, para los operandos distantes, puede accederse al archivo de registro asociado a la segunda secuencia de procesamiento, por ejemplo, el archivo de registro distante.

Aún haciendo referencia a la Figura 1 , puede llevarse a cabo

1 _ : „ _ i ,„ . , _ „ : i a lu. u uvu υu ^

iU i( Ut O <J J . i ui tj tüip i u , t j p u si ux c i um αi u u s up ^i tiii uu a de fuente para obtener un resultado deseado, el cual ha de ser almacenado en un operando de destino, por ejemplo, un operando de destino del primer archivo de registro. Basándose en la finalización con éxito de la instrucción, pueden actualizarse diversos indicadores (bloque 90) . Más específicamente, es posible actualizar indicadores de disposición y de sincronización en tanto en cuanto sean aplicables en un cuadro marcador. Continuando con el ejemplo anteriormente descrito, en el caso de que se indique que el operando de destino es un operando local, puede aj ustarse en correspondencia el indicador de preparación o disposición asociado al registro de destino. Por otra parte, el indicador de sincronización de este registro puede ser restablecido con el fin de indicar que el valor no ha de ser sincronizado. Si, en lugar de ello, se indica que el operando de destino se ha de utilizar a distancia, es posible ajustar en consecuencia un indicador de sincronización del archivo de registro distante (por ej emplo, el segundo). Puede ajustarse, además, un indicador de disposición del archivo de registro local. De esta forma, tanto una secuencia de procesamiento distante como la secuencia de procesamiento local pueden acceder al operando de destino como un operando de fuente, lo que permite el funcionamiento de productor / consumidor eficaz, tanto dentro de la misma secuencia de procesamiento como entre secuencias de procesamiento. Si bien se muestra con esta implementación concreta en Ia realización de la Figura 1 , ha de comprenderse que el ámbito de la presente invención no está limitado a este respecto.

Pueden estar presentes diversas estructuras dentro de un procesador con el fin de hacer posibles el acceso de registro y mecanismos de sincronización de acuerdo con una realización de la presente invención. Haciendo referencia, a continuación, a la Figura 2, se muestra en ella un diagrama de bloques de un cuadro marcador de acuerdo con una realización de la presente invención, que incluye soporte para la sincronización entre múltiples secuencias de procesamiento . Como se muestra en la Figura 2, un cuadro marcador 100, que puede consistir en un almacenamiento presente dentro del núcleo de un procesador, puede incluir entradas destinadas a almacenar información de estado asociada a los registros de múltiples archivos de

1^'CglS ι.rG . Jl.5p£ C IIi C αj-TiCIl ι.C , C H ± α i^'Cα-iI ZciCíGii C[ uC o C Ill uC S tl ct CJ.1 i ά ± igltl d

2, cada una de una primera secuencia de procesamiento y una segunda secuencia de procesamiento pueden incluir entradas para cada registro existente en su archivo de registro. Así pues, según se muestra en la

Figura 2, una primera secuencia de procesamiento puede incluir una pluralidad de entradas 1 12a- 1 12n (genéricamente, entrada 1 12). Cada entrada 1 12 puede estar indexada mediante el uso de un identificador de registro (ID), y cada entrada puede incluir información de estado. En la realización específica que se muestra en la Figura 2, pueden estar presentes un indicador de preparación o disposición 1 14a-1 14n (genéricamente, indicador de disposición 1 14) y un indicador de sincronización 1 16a- 1 16n (genéricamente, indicador de sincronización 116). El indicador de disposición 114 puede ser utilizado para indicar cuándo el operando correspondiente que está almacenado en el registro identificado, está listo para ser utilizado por operaciones consumidoras de esa secuencia de procesamiento, en tanto que el indicador de sincronización 1 16 puede indicar si un operando distante al que se ha de acceder por parte de la secuencia de procesamiento local, está listo para el acceso por parte de la secuencia de procesamiento local, es decir, si una instrucción productora de la secuencia de procesamiento productora (distante) ha llevado a cabo y almacenado el valor apropiado en la posición deseada. Nótese que una segunda secuencia de procesamiento 120 puede incluir también una pluralidad de entradas 122a- 122n (genéricamente, entrada 122), cada una de las cuales está asociada con un registro de su archivo de registro. De forma similar, cada entrada 122 puede incluir un indicador de disposición correspondiente 124a- 124n (genéricamente, indicador de disposición 124), así como un indicador de sincronización 12óa- 126n (genéricamente, indicador de sincronización 126). En lugar de entradas independientes para cada secuencia de procesamiento, es posible instalar un cuadro marcador de tal forma que tenga una única entrada para cada registro correspondiente de las múltiples secuencias de procesamiento, de manera que haya diferentes porciones de la entrada asociadas a cada secuencia de procesamiento. Por otra parte, si bien se muestra con esta configuración particular en la realización de la Figura 2, ha de comprenderse que el ámbito de la presente invención no está limitado a este respecto y en las diversas l ealizaeiones p ueden iie vai se <x Ia. pi άu ticd. di íύ L en Les üittiici <ii> uc gcnci cu , almacenar y utilizar información de estado asociada con los archivos de registro de diferentes secuencias de procesamiento. Por ejemplo, diferentes arquitecturas de procesador pueden tener distintas configuraciones de control para analizar las instrucciones y emitirlas a una o más unidades de ej ecución del procesador. Algunos procesadores pueden incluir dispositivos de asignación, estaciones de reserva, cuadros marcadores, controladores y otras variedades de lógica con el fin de determinar cuándo una instrucción descodificada tiene disponibles varios recursos que son necesarios para la ej ecución, y seleccionar, ya sea según un criterio por orden o fuera de orden, la instrucción que se ha de proporcionar a una unidad de ejecución. En diversas realizaciones, el cuadro marcador 100 puede formar parte de un emisor de instrucciones, en una forma cualquiera que se encuentre disponible en una arquitectura de procesador dada, o bien puede estar conectado a dicho emisor de instrucciones o a otra lógica semej ante con el fin de permitir que se tomen las decisiones de emisión de las instrucciones basándose en la información presente en el cuadro marcador 100.

Como se ha descrito anteriormente, en las diversas realizaciones puede analizarse la información de flujo asociada a una instrucción con el fin de determinar si una instrucción ha de acceder a la información presente en un registro de otra secuencia de procesamiento, y/o si es posible acceder al resultado de la instrucción por parte de una secuencia de procesamiento diferente. Haciendo referencia, a continuación, a la Figura 3, se muestra en ella un diagrama de bloques de una implementación de la ejecución de instrucciones de acuerdo con una realización de la presente invención. Como se muestra en la Figura 3 , un sistema 200 puede incluir una unidad de ejecución 230 que lleva a cabo diversas operaciones en los datos que entran. En la realización que se muestra en la Figura 3, pueden estar conectados un primer archivo de registro 220 y un segundo archivo de registro 225 a la unidad de ejecución 230. En la realización de la Figura 3, el primer archivo de registro 220 puede estar asociado a una primera secuencia de procesamiento, en tanto que el segundo archivo de registro 225 puede estar asociado a una segunda secuencia de procesamiento. Aunque se muestran como archivos de registro independientes en la realización de la r ig ui a 3 , cuiíipi ciiudsc q ue p uede ei> ι<ii pi cíjciitc, en algunas. implementaciones, un archivo de registro global, de tal modo que una primera porción está asociada de forma lógica con la primera secuencia de procesamiento y una segunda porción está asociada de forma lógica con la segunda secuencia de procesamiento . Tal como se muestra en la Figura 3, una instrucción 205 procedente de la primera secuencia de procesamiento y que se ha de llevar a cabo por la unidad de ejecución 230, puede incluir un código de operación con el fin de identificar un cierto tipo de instrucción, por ejemplo, una operación de adición, de multiplicación u otra operación. La instrucción 205 identifica, además, un destino para el resultado, a saber, un operando de destino, que puede corresponder a un primer registro, rax. Asociado a este operando de destino existe un indicador de ubicación, que se identifica en la Figura 3 como DESTINO DISTANTE ("REMOTE_DEST). Como se muestra en la Figura 3, este indicador de ubicación tiene un valor de uno, lo que indica que se ha de acceder más tarde al operando de destino por parte de una secuencia de procesamiento distante, es decir, la segunda secuencia de procesamiento en el ejemplo de la Figura 3 , y se puede acceder a él también por parte de unas instrucciones consumidoras existentes en la secuencia de procesamiento local. Como se muestra adicionalmente, la instrucción 205 identifica también dos operandos de fuente, en particular un primer operando de fuente (SRC l ) que accede a un registro rbx. Debido a que un indicador de ubicación de este operando de fuente (es decir, el SRCJMSTANTE ~"REMOTE_SRC") se ajusta en un valor de uno, es posible acceder a este operando de fuente desde un archivo de registro distante, es decir, el archivo de registro 225. De forma similar, la instrucción 205 incluye un segundo operando de fuente (SRC2) que está destinado a acceder a un segundo registro, rcx, que puede ser obtenido a partir del primer archivo de registro 220, conforme el indicador local para este segundo operando de fuente (es decir, el SRC_DISTANTE) se ajusta en un valor de cero.

Debido a que ha de accederse a uno de los operandos de fuente desde un archivo de registro diferente, es decir, desde el segundo archivo de registro 225, puede no proseguirse con la instrucción 205 hasta que se encuentre activo (por ejemplo, se haya ajustado) un indicador de sincronización asociado a ese operando de fuente. Por otra páf tc, p uede iiu pfüScg uu Sc COn lá. ma u uuCión 205 lia.ϊ> La que ÜC ciic ueu u c también activo un indicador de disposición asociado con el segundo operando de fuente. Así pues, según se muestra en la Figura 3 , el cuadro marcador 100 incluye una primera entrada 1 12b, asociada con el primer operando de fuente, y una segunda entrada 1 12c, asociada con el segundo operando. Una vez que el valor del indicador de disposición 1 14c está ajustado y se ha ajustado también el valor del indicador de sincronización 1 16b, puede emitirse la instrucción 205 a la unidad de ej ecución 230. Esto es así puesto que están presentes los valores apropiados en los registros rbx, del primer archivo de registro 225 , y rcx, del segundo archivo de registro 220. De acuerdo con ello, la unidad de ejecución 230 puede leer el rcx en el primer archivo de registro 220, y leer el rbx en el segundo archivo de registro 225. Una vez que se ha llevado a cabo la instrucción, el resultado puede ser almacenado en el registro de destino rax del primer archivo de registro 220. Por otra parte, puede tener lugar la actualización de los diversos indicadores de disposición y de sincronización. Específicamente, como se muestra en la Figura 3, tras la ejecución, puede actualizarse una entrada 1 12a asociada a la primera secuencia de procesamiento, de manera que tenga un indicador de disposición 1 14a que presenta un valor de uno, y un indicador de sincronización 1 16, que tiene un valor de cero. Por otra parte, la entrada 126a asociada a la segunda secuencia de procesamiento puede tener un indicador de sincronización correspondiente 1 16a, ajustado en un valor de uno con el fin de indicar que está presente el valor apropiado en el registro rax, el cual actúa como operando de fuente para una instrucción consumidora de la segunda secuencia de procesamiento. Si bien se muestra con esta implementación particular en la realización de la Figura 3 , el ámbito de la presente invención no está limitado a este respecto. Como se muestra adicionalmente en la Figura 3, puede estar presente un controlador 250 dentro del sistema 200. El controlador 250 puede incluir diversas combinaciones de hardware o dispositivos físicos, software o programación, firmware o lógica instalada permanentemente en el hardware, o bien combinaciones de los mismos, a fin de encargarse de la emisión de instrucciones desde cada una de las secuencias de procesamiento hasta la unidad de ej ecución 230. Como se muestra en la Fig ui d 3 , el cυiiu υlddui 250 p uede ea ldi cυπdt iddü di c üddi ü íildi CduOi 100 con el fin de analizar la información de estado presente en las diversas entradas a él, al objeto de determinar si los operandos de fuente de una instrucción dada están listos para su ejecución, basándose en el análisis de los indicadores de disposición y/o de sincronización asociados. En una realización, el controlador 250 puede poner en práctica una capacidad funcional lógica con el fin de hacer posible la emisión de instrucciones cuando los operandos de fuente de la instrucción están disponibles. Por ejemplo, en una implementación, en el caso de que se indiquen las fuentes locales (es decir, los indicadores de ubicación asociados con los operandos de fuente apuntan localmente (por ej emplo, tienen un valor lógico baj o)), la capacidad funcional puede corresponder a una operación lógica Y ("AND") en la que los indicadores de disposición para los operandos de fuente local pueden ser analizados con el fin de determinar si son los dos indicativos de un estado de disposición o preparado. Si no es así, la instrucción puede ser mantenida hasta que los dos indicadores de disposición estén ajustados, por ej emplo, en un estado lógico alto, indicativo de un estado de disposición. Si, en lugar de ello, se indica que uno de los dos operandos de fuente es de un origen distante, la operación lógica puede corresponder a una operación lógica Y ("AND") en la que se comprueban un indicador de disposición local, para el operando local, y un indicador de sincronización local, para el operando distante, a fin de determinar si ambos son indicativos de la disponibilidad de los operandos. Si es así, la operación puede proseguir; en caso contrario, el controlador 250 puede suspender la operación hasta que estén listos dichos dos operandos de fuente, de acuerdo con lo que se indique por sus indicadores asociados de disposición y de sincronización. Si bien se ha descrito con esta implementación particular, el ámbito de la presente invención no está limitado a este respecto, y es posible poner en práctica muchas maneras diferentes de analizar la información contenida en un cuadro marcador o en otra estructura con el fin de determinar cuándo los operandos de fuente están listos para su uso en una instrucción consumidora. Por ejemplo, en otras implementaciones, un procesador de múltiples núcleos, tal como un procesador de doble núcleo o de muchos núcleos, puede llevar a la práctica de forma similar las realizaciones de la presente ilϊVciiC x uil . XMi αig uiitift ú έ (.αi ó S ii±ipi CIϊitili tαüi UltCi , uiiti. pümti ü a C L Utii n α de procesamiento que se lleva a cabo en un primer núcleo, puede acceder a un archivo de registro asociado con una secuencia de procesamiento diferente que se lleva a cabo en otro núcleo. Al hacerlo así, pueden emplearse, sin embargo, ciertas cantidades de procesos o actividades de organización para acceder a dichos archivos de registro distantes durante la ej ecución de una secuencia de procesamiento dada.

De acuerdo con ello, basándose en la información de flujo asociada a la instrucción, es decir, las indicaciones o marcas de flujo para los diversos operandos de fuente y de destino, puede hacerse posible el acceso ligero de un archivo de registro diferente y su sincronización. En las diversas implementaciones, diferentes entidades pueden generar secuencias de procesamiento y el código correspondiente, por ej emplo, un dispositivo de optimización dinámica, un compilador, un dispositivo de optimización de hardware, y así sucesivamente. Cualquiera que sea la entidad que genera dicho código, puede marcar las instrucciones con marcas de flujo apropiadas. Por otra parte, la entidad puede garantizar que un registro que está implicado en una relación de productor / consumidor no ha sido redefinido en la secuencia de procesamiento productora antes de ser leído por la secuencia de procesamiento consumidora. En las diversas realizaciones, pueden establecerse puntos de sincronización entre las secuencias de procesamiento, de tal forma que no se continúa con la secuencia de procesamiento productora hasta que la secuencia de procesamiento consumidora haya leído el valor asociado. Si bien el ámbito de la presente invención no está limitado a este respecto, en algunas realizaciones, dichos puntos de sincronización pueden ser implementados utilizando los indicadores de sincronización anteriormente descritos. Por ejemplo, aunque las marcas de flujo que se han descrito en la realización de la Figura 3 pueden ser indicadores de un único bit destinados a indicar si un operando está presente en una posición local o distante, otras realizaciones pueden extender dichos indicadores de ubicación a múltiples bits con el fin de indicar la presencia en más de dos de tales secuencias de procesamiento. Esto es, en algunas implementaciones, más de dos secuencias de procesamiento pueden estar ejecutándose en un núcleo o en múltiples núcleos dados. En el curso de la ejecución de una mαlq ui ci ct J c I HÜ sctucut icis u c JJÍ O ucaaiilicii Lu , jj ucde dUÉUCí sc <x I O Ϊ> archivos de registro asociados con las otras secuencias de procesamiento de acuerdo con marcas de flujo existentes en las instrucciones y con información contenida en un cuadro marcador o en otra estructura semejante, destinada a indicar la disponibilidad de los operandos distantes, por ejemplo, a través de los indicadores de sincronización asociados a los archivos de registro asociados con estas secuencias de procesamiento múltiples.

En algunas realizaciones, pueden generarse trazas de código por parte de un dispositivo de optimización dinámica. Sin embargo, en otras implementaciones, puede utilizarse un soporte basado en compilador u otros mecanismos a fin de generar instrucciones con la apropiada información de marca de fluj o. Haciendo referencia, a continuación, a la Figura 4, se muestra en ella un diagrama de fluj o de un método para generar información de marca de fluj o de acuerdo con una realización de la presente invención. Como se muestra en la Figura 4, el método 300 puede comenzar inicializando los indicadores de sincronización para las primera y segunda secuencias de procesamiento, en un estado no sincronizado (bloque 310). Por ejemplo, las dos secuencias de procesamiento pueden consistir en trazas de código generadas por un dispositivo de optimización dinámica. Es más, estas trazas múltiples pueden ser ejecutadas simultáneamente por diferentes secuencias de procesamiento de un único núcleo de procesador, a saber, las primera y segunda secuencias de procesamiento. Con el fin de garantizar la atribución adecuada de los diferentes operandos, pueden inicializarse los indicadores de sincronización en un estado no sincronizado, por ejemplo, un valor lógico de cero en algunas realizaciones. Nótese que, debido a que estas trazas son identificadas por el dispositivo de optimización dinámica, el dispositivo de optimización puede tener control sobre cuáles de los registros están implicados de una manera productora / consumidora, y, de esta forma, el dispositivo de optimización puede controlar también la presencia de un punto de sincronización, instante en el cual los operandos pueden ser sincronizados. Si bien un registro que es consumido a distancia puede ser definido muchas veces en la secuencia de procesamiento productora, el dispositivo de optimización puede garantizar que la última definición de un regisero antes de ser uiiiizadυ por un cυπ&uiniuoi es Ia definición que establece la relación de productor / consumidor.

Haciendo aún referencia a la Figura 4, el control puede pasar a continuación al rombo 320, en el que puede determinarse si un operando es tanto producido como consumido solamente por una única secuencia de procesamiento. En el caso de que un operando sea utilizado en una única secuencia de procesamiento, el control puede pasar al bloque 330, en el que puede indicarse la ubicación del uso en las marcas de fluj o de instrucciones que utilizan el operando. Específicamente, si se emplea este operando, ya sea como operando de fuente o de destino, un indicador de ubicación correspondiente, es decir, una marca de fluj o, puede estar en un estado restablecido (por ejemplo, un cero lógico) con el fin de indicar que ese operando se utiliza tan solo localmente.

Haciendo aún referencia a la Figura 4, si, en lugar de ello, se determina en el rombo 320 que un operando es utilizado por múltiples secuencias de procesamiento, el control puede pasar al rombo 340. En el rombo 340 puede determinarse si el operando identificado es un operando de destino que ha de ser consumido por otra secuencia de procesamiento. Si es así, el control pasa al bloque 350, donde pueden identificarse usos locales del operando de destino de acuerdo con marcas de flujo de instrucciones productoras hasta que se alcanza una última definición del operando de destino (es decir, la última definición antes del uso por parte de la secuencia de procesamiento consumidora). Una vez alcanzada esta última definición, el control pasa el bloque 360, en el que esta instrucción puede ser identificada con una marca de flujo al objeto de indicar el uso a distancia del operando de destino. En otras palabras, esta instrucción puede tener un indicador de ubicación para el operando de destino en un estado ajustado (por ejemplo, un uno lógico). Del bloque 360, el control pasa al rombo 370, en el que puede determinarse si se ha de producir un operando de fuente por parte de la otra secuencia de procesamiento. Si no es así, el control regresa de vuelta al bloque 330, anteriormente explicado y en el que las marcas de fluj o asociadas al operando pueden ser indicadas como locales (es decir, con un valor lógico de cero). Haciendo aún referencia a la Figura 4, si, en lugar de ello, se determina en el rombo 370 que el operando de fuente ha de ser producido

380, en el que el uso de un operando de fuente distante puede indicarse en marcas de flujo de instrucciones consumidoras de esa cadena o secuencia de procesamiento hasta que una instrucción contenida en esa misma secuencia de procesamiento redefina ese registro (bloque 380). Es decir, las instrucciones de la secuencia de procesamiento consumidora pueden acceder al valor de los datos del archivo de registro distante hasta que la secuencia de procesamiento consumidora redefina el registro . Cuando se produce dicho suceso (en caso de producirse), el control pasa al bloque 390, en el que el uso local del operando de fuente puede ser indicado en marcas de flujo de las instrucciones consumidoras. Es decir, cuando una instrucción consumidora redefine el registro de tal manera que inscribe un valor diferente que se utiliza entonces como operando de fuente para instrucciones ulteriores de esa misma secuencia de procesamiento, las instrucciones ulteriores de la misma secuencia de procesamiento pueden tener marcas de flujo asociadas a ellas con el fin de indicar que es posible obtener ahora de forma local el operando de fuente. Si bien se muestra con esta implementación particular en la realización de la Figura 4, el ámbito de la presente invención no está limitado a este respecto.

Así pues, en las diversas realizaciones, dos secuencias de procesamiento que discurren en el mismo núcleo pueden ser sincronizadas mediante el acceso directo cada una a los registros de la otra. Al acceder a la información en el nivel de registro, es posible reducir las actividades organizativas de sincronización asociadas a la obtención de información de una secuencia de procesamiento diferente a través de una memoria indirecta, y pueden aliviarse o paliarse los problemas de anchura de banda de memoria. A través del uso de registros de archivos de registro presentes en el núcleo, puede tener lugar la comunicación de valores de 64 bits o de 128 bits entre dos secuencias de procesamiento que discurren en el mismo núcleo. De esta forma, puede no haber necesidad de reproducir o copiar un estado de registro para una secuencia de procesamiento que se acaba de depositar, ya que los operandos que se han de utilizar por parte de la secuencia de procesamiento que se acaba de depositar pueden ser leídos directamente en el archivo de registro de la secuencia de procesamiento depositante. S i bien el áiííhiio de la pí eseme m v eiiüióii ιιu e& L¿ limi tado a. e& ιe respecto, ciertas realizaciones pueden ser utilizadas en paradigmas de procesamiento secuencial desgranado al detalle, tales como el funcionamiento en múltiples secuencias de procesamiento, el procesamiento en secuencia de ayuda y las secuencias de procesamiento de recorrido hacia delante, por ej emplo. De acuerdo con ello, las instrucciones presentes en dichas secuencias de procesamiento pueden ser reducidas, ya que puede evitarse la copia u otras instrucciones que reproduzcan el estado de arquitectura de un primer archivo de registro. En lugar de ello, estas secuencias de procesamiento adicionales pueden obtener directamente la información necesaria del archivo de registro de otra secuencia de procesamiento.

Las realizaciones pueden ser implementadas en muchos tipos de sistemas diferentes. Haciendo referencia a continuación a la Figura 5 , se muestra en ella un diagrama de bloques de un sistema de acuerdo con una realización de la presente invención. Como se muestra en la Figura 5, el sistema 500 de múltiples procesadores es un sistema interconectado de punto a punto, e incluye un primer procesador 570 y un segundo procesador 580 conectados a través de una interconexión de punto a punto 550. Como se muestra en la Figura 5, cada uno de los procesadores 570 y 580 puede ser un procesador de múltiples núcleos que incluye unos primer y segundo núcleos de procesador (esto es, los núcleos de procesador 574a y 574b, y los núcleos de procesador 584a y 584b). Nótese que cada uno de los núcleos puede incluir múltiples archivos de registro, cada uno de ellos destinado a ser utilizado por una secuencia de procesamiento diferente. Por otra parte, cada núcleo puede incluir hardware, software o firmware, o lógica instalada permanentemente en el hardware, a fin de permitir el acceso directo por parte de una secuencia de procesamiento consumidora a un archivo de registro de la secuencia de procesamiento productora, a través de marcas de fluj o e indicadores de sincronización, de acuerdo con una realización de la presente invención. Aún adicionalmente, en algunas implementaciones, una secuencia de procesamiento que discurre en el núcleo 574a de procesador puede acceder a un archivo de registro asociado con una secuencia de procesamiento que discurre en el núcleo 574b de procesador, y viceversa. El primer procesador 570 incluye adicionalmente interfaces

-1 _ _ , , _ i _ „ „ , , _ j _ m sr -i C - - C O π , r , „ „ -, ' „„ ' i - - i ~ . 1 uo p u±i LU α p ui± Lo yl ~ i j o 1 u y υ ¡ o . ±> t i Uí iiia. ύimi iαi , ti st g uuu υ procesador 580 incluye interfaces de P-P 586 y 588. Como se muestra en la Figura 5, unos dispositivos concentradores de controlador de memoria (MCH's -"memory controller hubs") 572 y 582 conectan los procesadores a respectivas memorias, a saber, una memoria 532 y una memoria 534, las cuales pueden ser porciones de una memoria principal fij ada localmente a los procesadores respectivos.

El primer procesador 570 y el segundo procesador 580 pueden estar conectados a una instalación de chip 590 a través de unas interconexiones de P-P 552 y 554, respectivamente. Como se muestra en la Figura 5, la instalación de chip 590 incluye unas interfaces de P-P 594 y 598. Por otra parte, la instalación de chip 590 incluye una interfaz 592 para conectar la instalación de chips 590 con un dispositivo generador de gráficos de alto rendimiento 538. En una realización, puede utilizarse un bus 539 de Puerta de Gráficos Avanzados (AGP -"Advanced Graphics Port") con el fin de conectar el dispositivo generador de gráficos 538 con la instalación de chip 590. El bus de AGP 539 puede adecuarse a la Especificación de Interfaz de Puerta de Gráficos Acelerada, Revisión 2.0, publicada el 4 de mayo de 1998 por la Intel Corporation, de Santa Clara, California. Alternativamente, una interconexión de punto a punto 539 puede conectar estos componentes.

A su vez, la instalación de chip 590 puede estar conectada a un primer bus 516 a través de una interfaz 596. En una realización, el primer bus 516 puede consistir en un bus de Interconexión de Componentes Periféricos (PCI -"Peripheral Component Interconnect"), según se define por la Especificación de Bus Local de PCI, Versión de Producción, Revisión 2, 1 , fechada en junio de 1995, o en un bus tal como un bus PCI Express™ u otro bus de interconexión de entrada / salida (E/S -"I/O") de tercera generación, si bien el ámbito de la presente invención no está limitado por ello.

Como se muestra en la Figura 5, pueden conectarse diversos dispositivos de E/S 514 a un primer bus 516, conjuntamente con un puente 518 de buses que conecta el primer bus 516 con un segundo bus 520. En una realización, el segundo bus 520 puede ser un bus de cómputo de patilla baj a (LPC -"low pin bus"). Pueden acoplarse diversos dispositivos al segundo bus 520, incluyendo, por ej emplo, un teclado /

„ ^ j- Λ — τ> -i : . ^ „ ; j. i „ . _ , A r.. „ „, _„ -, „ : „, ,, .-, ; .£ . , r í e . . , ., -, , - . ^• J _ ,τ ^ ^ o j „ l ü í u n u i ^ y j J U ϊ υ .) u. v un í c αv i o n -> u y una uüi uαu u t almacenamiento de datos, tal como un dispositivo de accionamiento de disco u otro dispositivo de almacenamiento masivo que puede incluir, en una realización, un código 530. Por otra parte, puede conectarse una E/S de audio 524 al segundo bus 520. Nótese que son posibles otras arquitecturas. Por ej emplo, en lugar de la arquitectura de punto a punto de la Figura 5, un sistema puede implementar un bus de acometida múltiple u otra arquitectura semejante.

Las realizaciones pueden ser implementadas en código y pueden almacenarse en un medio de almacenamiento que tenga, almacenadas en él, instrucciones que puedan ser utilizadas para programar un sistema de forma que lleve a cabo las instrucciones. El medio de almacenamiento puede incluir cualquier tipo de disco, incluyendo discos flexibles, discos ópticos, memorias de sólo lectura de disco compacto (CD-ROMs), discos compactos susceptibles de volver a inscribir en ellos (CD-RWs) y discos magneto-ópticos, dispositivos semiconductores tales como memorias de sólo lectura (ROMs)₅ memorias de acceso aleatorio (RAMs), tales como memorias de acceso aleatorio dinámicas (DRAMs), memorias de acceso aleatorio estáticas (SRAMs), memorias de sólo lectura programables y susceptibles de ser borradas (EPROMs), memorias de refrescamiento por impulsos ("flash memories"), memorias de sólo lectura programables y susceptibles de borrarse eléctricamente (EEPROMs), tarjetas magnéticas u ópticas, o cualquier otro tipo de medio adecuado para almacenar instrucciones electrónicas, si bien no está limitado por ellos.

Si bien la presente invención se ha descrito con respecto a un número limitado de realizaciones, los expertos de la técnica apreciarán numerosas modificaciones y variaciones partiendo de las mismas. Se pretende que las reivindicaciones que se acompañan cubran todas dichas modificaciones y variaciones en la medida en que caigan dentro del verdadero espíritu y ámbito de esta presente invención.

Claims

REIVINDICACIONES

1 . Un método que comprende: acceder a un archivo de registro de una segunda cadena o secuencia de procesamiento por parte de un núcleo con el fin de obtener un operando de fuente para una instrucción de una primera cadena o secuencia de procesamiento, durante la ejecución de la instrucción de la primera secuencia de procesamiento en el núcleo.

2. El método de acuerdo con la reivindicación I ₅ que comprende adicionalmente : evitar que la instrucción de la primera secuencia de procesamiento se lleve a cabo o ej ecute si un indicador de sincronización asociado con un registro identificado por el operando de fuente, se encuentra en un primer estado indicativo de la falta de terminación de una operación productora de la segunda secuencia de procesamiento; y llevar a cabo la instrucción de la primera secuencia de procesamiento si el indicador de sincronización asociado con el registro se encuentra en un segundo estado indicativo de la terminación de la operación productora de la segunda secuencia de procesamiento.

3. El método de acuerdo con la reivindicación 2, que comprende adicionalmente ajustar el indicador de sincronización en una entrada de un cuadro marcador para el registro, una vez que la operación productora se ha completado.

4. El método de acuerdo con la reivindicación 3, que comprende adicionalmente ajustar el indicador de sincronización en la entrada del cuadro marcador para el registro asociado con la primera secuencia de procesamiento, y restablecer el indicador de sincronización en la entrada del cuadro marcador para el registro asociado con la segunda secuencia de procesamiento, una vez que se ha completado la operación productora.

5. El método de acuerdo con la reivindicación 2, que

GOT±lprCΩu€ αuIC I OIiα-jiIllCil t C i iCv αl ¿¿ CcL D G id Op Ci αCiO il prOü-UC iO/ά CiC l a. segunda secuencia de procesamiento y la instrucción de la primera secuencia de procesamiento en el núcleo, de tal modo que el núcleo comprende un núcleo común en el cual se han de llevar a cabo tanto la primera secuencia de procesamiento como la segunda secuencia de procesamiento.

6. El método de acuerdo con la reivindicación 1 , que comprende adicionalmente descodificar la instrucción de la primera secuencia de procesamiento, de tal modo que Ia instrucción incluye un indicador de posición para el operando de fuente, de manera que el indicador de posición indica la posición del operando de fuente en un registro del archivo de registro de la segunda secuencia de procesamiento.

7. El método de acuerdo con la reivindicación 6, que comprende adicionalmente almacenar un resultado de la instrucción de la primera secuencia de procesamiento en un registro de destino y actualizar un indicador de sincronización para el registro de destino basándose en un indicador de posición para un operando de destino correspondiente existente en la instrucción de la primera secuencia de procesamiento.

8. Un aparato que comprende: un almacenamiento destinado a almacenar entradas, cada una de ellas correspondiente a un registro de un primer archivo de registro de una primera secuencia de procesamiento, de tal modo que cada una de las entradas ha de incluir un indicador de sincronización destinado a indicar si se ha completado una operación productora de una segunda secuencia de procesamiento que ha de utilizar un registro correspondiente de un segundo archivo de registro de la segunda secuencia de procesamiento, como operando de destino.

9. El aparato de acuerdo con la reivindicación 8, que comprende adicionalmente un controlador destinado a actualizar el indicador de sincronización de la primera secuencia de procesamiento de una entrada para el correspondiente registro, una vez que la segunda secuencia de procesamiento ha llevado a cabo una instrucción que utiliza el registro correspondiente del segundo archivo de registro como operando de destino, de tal modo que la instrucción incluye un indicador

U O p U i3 I ty i U ii y ClL CL U ± U p k/i αilU U U t U. C Λ lli±VJ , i UUi t U U V U U O i U iS VJ U ^ l correspondiente registro por parte de la primera secuencia de procesamiento.

1 0. El aparato de acuerdo con la reivindicación 8, en el cual el almacenamiento comprende un cuadro marcador de un núcleo.

1 1 . El aparato de acuerdo con la reivindicación 10, en el cual el núcleo ha de llevar a cabo o ejecutar simultáneamente la primera secuencia de procesamiento y la segunda secuencia de procesamiento utilizando el primer archivo de registro y el segundo archivo de registro.

12. El aparato de acuerdo con la reivindicación 1 1 , en el cual el núcleo ha de acceder al segundo archivo de registro durante la ej ecución de la primera secuencia de procesamiento.

13. El aparato de acuerdo con la reivindicación 12, en el cual el núcleo ha de acceder al segundo archivo de registro basándose en un indicador de posición para un operando de fuente de una instrucción de la primera secuencia de procesamiento.

14. El aparato de acuerdo con la reivindicación 13, en el cual el núcleo ha de acceder al segundo archivo de registro basándose adicionalmente en el indicador de sincronización de una entrada para el registro correspondiente.

15. El aparato de acuerdo con la reivindicación 8, de tal manera que el aparato comprende un núcleo que incluye el almacenamiento, el primer archivo de registro, el segundo archivo de registro y una unidad de ej ecución, de modo que la unidad de ejecución está destinada a obtener un operando de fuente a partir de un registro del segundo archivo de registro, para la ej ecución de una instrucción de la primera secuencia de procesamiento basándose en un indicador de ubicación de la instrucción.

16. El aparato de acuerdo con la reivindicación 1 5, en el cual ha de evitarse que se lleve a cabo o ejecute la instrucción de la primera secuencia de procesamiento si el indicador de sincronización de una entrada asociada con el registro del segundo archivo de registro, es indicativo de un estado de falta de terminación de una instrucción productora de la segunda secuencia de procesamiento.

17. Un sistema que comprende: un primer archivo de registro, que incluye una pluralidad de

¿^"c g± SÍi O S úS Stiii¿lCi C 5 α άüildC CilcLi^' tαci tG S út/ tilia pi i ill C i a _> έ C uCju.Ci a u t; procesamiento; un segundo archivo de registro, que incluye una pluralidad de registros destinados a almacenar datos de una segunda secuencia de procesamiento; una unidad de ejecución, conectada al primer archivo de registro y al segundo archivo de registro con el fin de llevar a cabo instrucciones de la primera secuencia de procesamiento y de la segunda secuencia de procesamiento, de tal manera que la unidad de ejecución está destinada a acceder al primer archivo de registro para obtener un operando de fuente para la ej ecución de una instrucción de la segunda secuencia de procesamiento; y una memoria de acceso aleatorio dinámica (DRAM — "dynamic random access memory"), conectada a la unidad de ej ecución.

18. El sistema de acuerdo con la reivindicación 17, en el cual la unidad de ej ecución está destinada a acceder al primer archivo de registro basándose en una indicación de la instrucción de la segunda secuencia de procesamiento, de tal modo que la indicación ha de indicar la presencia del operando de fuente en el archivo de registro.

19. El sistema de acuerdo con la reivindicación 1 8, que comprende adicionalmente un emisor de instrucciones, conectado a la unidad de ejecución para suspender la asignación de la instrucción de la segunda secuencia de procesamiento hasta que esté activo un indicador de sincronización asociado a un registro asociado con el operando de fuente.

20. El sistema de acuerdo con la reivindicación 19, en el cual el emisor de instrucciones está destinado a inscribir el indicador de sincronización asociado al registro una vez que se ha llevado a cabo una instrucción productora de la primera secuencia de procesamiento.

21 . El sistema de acuerdo con la reivindicación 20, en el cual el emisor de instrucciones está destinado a inscribir adicionalmente un indicador de preparación o disposición asociado al registro, una vez que se ha llevado a cabo la instrucción productora de la primera secuencia de procesamiento.

22. El sistema de acuerdo con la reivindicación 21 , en el cual el emisor de instrucciones está destinado a inscribir el indicador de siilCi UllizaCióil y el ífidiυctdυr ue disposición cu una criu'ctdd. ué tul C Uddx υ marcador correspondiente al registro.

23. El sistema de acuerdo con la reivindicación 17, que comprende adicionalmente un primer núcleo que incluye la unidad de ej ecución, el primer archivo de registro y el segundo archivo de registro, de tal manera que el primer núcleo ha de tratar o procesar las instrucciones de la primera secuencia de procesamiento y de la segunda secuencia de procesamiento.

24. El sistema de acuerdo con la reivindicación 23 , que comprende adicionalmente: un segundo núcleo, que incluye una segunda unidad de ejecución y un tercer archivo de registro, de tal manera que el segundo núcleo está destinado a procesar instrucciones de una tercera secuencia de procesamiento, de modo que el segundo núcleo ha de acceder al menos a uno de entre el primer archivo de registro y el segundo archivo de registro, a fin de obtener un operando de fuente para uso en la tercera secuencia de procesamiento.

25. El sistema de acuerdo con la reivindicación 17, que comprende adicionalmente un archivo de registro unificado que incluye el primer archivo de registro y el segundo archivo de registro.

26. Un medio legible por una máquina y que tiene, almacenadas en él, instrucciones que, si se llevan a cabo o ej ecutan por una máquina, hacen que la máquina realice un método que comprende: acceder a un archivo de registro de una primera cadena o secuencia de procesamiento con el fin de obtener un operando de fuente de registro para la ej ecución de una instrucción de una segunda secuencia de procesamiento, en el caso de que la instrucción incluya una indicación para el operando de fuente de registro que apunte a la primera secuencia de procesamiento.

27. El medio legible por una máquina, de acuerdo con la reivindicación 26, en el cual el método comprende adicionalmente acceder a un archivo de registro de la segunda secuencia de procesamiento con el fin de obtener un operando de fuente de registro para la ejecución de una instrucción de la primera secuencia de procesamiento, en el caso de que la instrucción incluya una indicación para el operando de fuente de registro que apunte a la segunda secuencia

28. El medio legible por una máquina, de acuerdo con la reivindicación 26, en el cual el método comprende adicionalmente evitar la ejecución de la instrucción de la segunda secuencia de procesamiento hasta que esté activo un indicador asociado a un registro identificado por el operando de fuente de registro, siendo el indicador indicativo de la terminación de una operación productora de la primera secuencia de procesamiento.

29. El medio legible por una máquina, de acuerdo con la reivindicación 26, en el cual el método comprende adicionalmente ejecutar la instrucción de la segunda secuencia de procesamiento y activar, tras ello, un indicador de sincronización asociado a un registro identificado por un operando de fuente de destino de registro de la instrucción de la segunda secuencia de procesamiento, en el caso de que la instrucción incluya una indicación para el operando de destino de registro que apunte a la primera secuencia de procesamiento.

30. El medio legible por una máquina, de acuerdo con la reivindicación 26, en el cual el método comprende adicionalmente depositar la segunda secuencia de procesamiento desde la primera secuencia de procesamiento sin la reproducción de un estado de la primera secuencia de procesamiento en la segunda secuencia de procesamiento, y hacer que la segunda secuencia de procesamiento acceda al archivo de registro de la primera secuencia de procesamiento durante la ejecución de la instrucción de la segunda secuencia de procesamiento.