EP1307713A2 - Method for examining macromolecules - Google Patents

Method for examining macromolecules

Info

Publication number
EP1307713A2
EP1307713A2 EP01945081A EP01945081A EP1307713A2 EP 1307713 A2 EP1307713 A2 EP 1307713A2 EP 01945081 A EP01945081 A EP 01945081A EP 01945081 A EP01945081 A EP 01945081A EP 1307713 A2 EP1307713 A2 EP 1307713A2
Authority
EP
European Patent Office
Prior art keywords
frequency
data
sequence
macromolecules
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP01945081A
Other languages
German (de)
French (fr)
Inventor
Helmut Bloecker
Gerhard Kauer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Helmholtz Zentrum fuer Infektionsforschung HZI GmbH
Original Assignee
Helmholtz Zentrum fuer Infektionsforschung HZI GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Helmholtz Zentrum fuer Infektionsforschung HZI GmbH filed Critical Helmholtz Zentrum fuer Infektionsforschung HZI GmbH
Publication of EP1307713A2 publication Critical patent/EP1307713A2/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the invention relates to a method for the investigation of macromolecules and a device for the exemplary implementation of the method and applications of the method and / or the device according to the independent claims.
  • Enormous amounts of data have been collected in the databases in the form of sequence-based data patterns for a wide variety of macromolecules. Such amounts of data are used to process biological questions that arise from information within macromolecular sequence data. These questions can currently only be dealt with using computer-aided methods, whereby the enormous amounts of data require a considerable amount of computing power, especially since the ever-increasing worldwide sequencing performance of current and planned genome projects increases to an unexpected extent. This creates the problem of efficiently applying the available algorithms to the corresponding problem without reaching the limits of the computing power.
  • the method according to the invention for solving the above problem when examining macromolecules thus comprises the following method steps:
  • This method enables a completely new technology for the efficient analysis of enormous sequence-based amounts of data from macromolecules.
  • the potential of this technology is m a significant increase in speed for the respective Ana ⁇ analyzes of the macromolecules on the one hand and n is the possibility of pop u la ⁇ lig new issues of information retrieval raise.
  • weighting, cataloging and / or Ty ⁇ pleiter a method of filtering information from a di- gital image analysis used.
  • This embodiment has the advantage that both the similarity of two one-dimensional patterns with a mutual local shift by i data points can be measured and a signal with a predetermined signal curve can be searched, a measure of similarities being obtained by an image analysis and thus conclusions about similarities can be concluded among the macromolecules.
  • This similarity becomes maximum when the shift produces a maximum match between the sequence of frequency data and the pattern.
  • This shift also gives the unique position of the one-dimensional pattern in the frequency data sequence via a reverse transformation and demodulation by the position of the pattern in a sequence.
  • a frequency analysis method is used for comparison, weighting, cataloging and / or typing.
  • the sequence data which were first converted into frequency-modulated data, are prepared in such a way that each element of a sequence is assigned unique frequency information in correlation to its neighbor.
  • the sequence information remains unaffected by this transformation and is only converted into complex frequency information with the same information content.
  • the advantage of this embodiment is that all mathematical methods of frequency analysis can be applied to this frequency-modulated wave. Spectra Central analysis of the information is of great benefit in this context.
  • stochastic information filtering in the Fourier space is used for comparison, weighting, cataloging and / or typing.
  • deviations from the ideal signal can be estimated stochastically, with which the expectation horizon can be designed depending on the biological problem.
  • the information units and / or structural information from multidimensional protein and / or DNA databases are encoded in corresponding sequence codes for creating sequence data.
  • the method according to the invention can preferably be carried out with a device which has a multiplicity of electronic components for modeling frequency data which simulate molecular sequences and a multiplicity of frequency filters for weighting, for cataloging and / or for typing the frequency data modeled by the multiplicity of electronic components.
  • a device which has a multiplicity of electronic components for modeling frequency data which simulate molecular sequences and a multiplicity of frequency filters for weighting, for cataloging and / or for typing the frequency data modeled by the multiplicity of electronic components.
  • the large number of electronic components and the large number of frequency filters are ascertained by means of computer-aided frequency analyzes and these are coupled to one another to form a hardware network which simulates the sequence of information units of macromolecules.
  • the information units are bases of the nucleic acids, amino acid residues of proteins and / or three-dimensional structural units of proteins and / or DNA, the sequence of which is simulated in a macromulecule by the hardware network.
  • the method and device of the invention are preferably used for the analysis of protein sequences.
  • Applications in the context of the analysis of DNA sequences are also advantageously possible.
  • Investigations and samples of multidimensional protein databases can also be used for this.
  • the information units of the databases in entspre ⁇ sponding sequence codes are to be offered, which can also be multidimensional. It is therefore necessary not restrictive, single ⁇ Lich to restrict spectral analyzes to one, two or three dimensions, especially in the preferred applications, the inventions can be used for a large number of information fragments.
  • multidimensional DNA structure information is examined for recurring patterns.
  • this invention makes it possible to investigate biological questions interactively and without delay for sequence-based amounts of data.
  • the sequence data are first converted into m frequency-modulated data.
  • each element of the sequence is assigned an unary frequency information in correlation to its neighbor.
  • the actual sequence m enters the background and, in the simplest case, m is transformed into a one-dimensional frequency-modulated wave.
  • the sequence information remains unaffected by this transformation and is only converted into complex frequency information with the same information content.
  • a Fast-Fou ⁇ er-Transformation is then applied to the frequency-modulated wave.
  • Appropriate filters are then applied to this transformed data.
  • IFFT inverse Fourier transform
  • IFFT inverse Fourier transform
  • a demodulation of the frequency data back into the sequence data the correspondingly filtered information is obtained.
  • Sequence patterns can thus be searched very efficiently in the performance spectrum, for example large genomic sections or entire genomes can be compared with one another or filtered out. Deviations from the ideal signal can be estimated stochastically, so that the horizon of expectation can be specifically designed depending on the biological problem.
  • the method according to the invention is not limited to the simplest case of a one-dimensional frequency-modulated wave. Rather, in a second example of an embodiment of the invention, three-dimensional or more ⁇ dimensional protein databases or multidimensional DNA structure information can also be examined in a very similar manner for corresponding patterns. To this end databases are their information units in corresponding sequence codes imple ⁇ zen.
  • the method according to the invention can also be used for assembling a large number of n-information fragments, as are present, for example, in “shotgun” organized data banks.
  • the sequence information is frequency-modulated, it is transformed according to the present invention by means of a Fast Fourier transform.
  • the correlation function ⁇ fg of two one-dimensional signals namely f (m) and g (m)
  • f (m) and g (m) is to be understood as a convolution of the signal f (m) with the signal g (-m).
  • G * (k) is the conjugate complex Fourier transform of g (m).
  • G * (k) is the conjugate complex Fourier transform of g (m).
  • a suitable mapping of the relevant "similarity function" of the components or groups of components involved into the frequency domain automatically results in structures that can be determined using proven filters. For example, analyzes with local power spectra can be used, which deal with the spectral energies of the sections to be examined.
  • 2 is the Fourier transform of the autocorrelation function of the signal f (m) and can therefore be used to measure the statistical bonds between the values of neighboring data of f (m).
  • a suitable weighting of the original function can be used to reduce disruptive parts in the range of services.
  • an inhibition function of the following type is used for texture detection before the Fourier transformation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Error Detection And Correction (AREA)

Abstract

The invention relates to a method for examining macromolecules which can be stored in frequency-based data patterns. The invention also relates to a device for carrying out said method and to different applications of both the method and device. The method itself is based on: the compilation of sequence data of molecular sequences of macromolecules; the conversion of the sequence data into frequency-modulated frequency data; the transformation of the frequency data into a Fourier space; the use of Fourier analyses for comparing, weighting, cataloging and/or typifying the frequency data and, finally, for re-transforming the weighted, cataloged and/or typified frequency data into sequence data provided in a weighted, cataloged and/or typified form.

Description

Verfahren zur Untersuchung von Makromolekülen Procedure for the study of macromolecules
Die Erfindung betrifft ein Verfahren zur Untersuchung von Makromolekülen und eine Vorrichtung zur modellhaften Durchführung des Verfahrens sowie Anwendungen des Verfahrens und/oder der Vorrichtung entsprechend den unabhängigen Ansprüchen.The invention relates to a method for the investigation of macromolecules and a device for the exemplary implementation of the method and applications of the method and / or the device according to the independent claims.
Enorme Datenmengen haben sich in den Datenbanken in Form von sequenzbasierten Datenmustern für die unterschiedlichsten Makromoleküle angesammelt. Derartige Datenmengen dienen der Bearbeitung biologischer Fragestellungen, die sich durch Informationen innerhalb makromolekularer Sequenzdaten erheben. Diese Fragestellungen können gegenwärtig nur mit rechnergestützten Verfahren bearbeitet werden, wobei die enormen Datenmengen eine erhebliche Rechnerleistung erfordern, zumal die ständig wachsende weltweite Sequenzierleistung laufender und geplanter Genomprojekte in ungeahntem Umfang anwächst. Damit ergibt sich die Problematik, die verfügbaren Algorithmen effizient auf die entsprechende Problematik anzuwenden, ohne an die Grenzen der Rechenleistungen zu stoßen.Enormous amounts of data have been collected in the databases in the form of sequence-based data patterns for a wide variety of macromolecules. Such amounts of data are used to process biological questions that arise from information within macromolecular sequence data. These questions can currently only be dealt with using computer-aided methods, whereby the enormous amounts of data require a considerable amount of computing power, especially since the ever-increasing worldwide sequencing performance of current and planned genome projects increases to an unexpected extent. This creates the problem of efficiently applying the available algorithms to the corresponding problem without reaching the limits of the computing power.
BESTATIGUNGSKOPIE Diese Problematik wird mit dem Gegenstand der unabhängigen Ansprüche gelost. Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Unteranspruchen.BESTATIGUNGSKOPIE This problem is solved with the subject of the independent claims. Advantageous developments of the invention result from the subclaims.
Das erfmdungsgemaße Verfahren zur Losung des obigen Problems bei der Untersuchung von Makromolekülen umfaßt somit folgende Verfahrensschritte :The method according to the invention for solving the above problem when examining macromolecules thus comprises the following method steps:
a) Erstellen von Sequenzdaten molekularer Sequenzen von Makromolekülen,a) creating sequence data of molecular sequences of macromolecules,
b) Umsetzen der Sequenzdaten in frequenzmodulierte Frequenzdaten,b) converting the sequence data into frequency-modulated frequency data,
c) Transformieren der Frequenzdaten m einen Fouπerraum,c) transforming the frequency data into a foot space,
d) Einsatz von Fourieranalysen zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Typisierung der Frequenzdaten,d) use of Fourier analyzes for comparison, for weighting, for cataloging and / or for typing the frequency data,
e) Rucktransformation der verglichenen, gewichteten, katalogisierten und/oder typisierten Frequenzdaten zu Sequenzdaten m gewichteter, katalogisierter und typisierter Form.e) reverse transformation of the compared, weighted, cataloged and / or typed frequency data to sequence data in weighted, cataloged and typed form.
Dieses Verfahren ermöglicht eine völlig neue Technologie zur effizienten Analyse enormer sequenzbasierter Datenmengen von Makromolekülen. Das Potential dieser Technologie liegt m einer erheblichen Geschwindigkeitssteigerung für die jeweiligen Ana¬ lysen der Makromoleküle einerseits und n der Möglichkeit, völ¬ lig neue Fragestellungen der Informationsgewinnung aufzuwerfen.This method enables a completely new technology for the efficient analysis of enormous sequence-based amounts of data from macromolecules. The potential of this technology is m a significant increase in speed for the respective Ana ¬ analyzes of the macromolecules on the one hand and n is the possibility of pop u la ¬ lig new issues of information retrieval raise.
In einer bevorzugten Ausfuhrungsform des Verfahrens wird zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Ty¬ pisierung ein Verfahren der Informationsfilterung aus einer di- gitalen Bildanalyse eingesetzt. Diese Ausführungsform hat den Vorteil, daß man sowohl die Ähnlichkeit zweier eindimensionaler Muster bei einer gegenseitigen örtlichen Verschiebung um i Datenpunkte messen kann als auch ein Signal mit einem vorgegebenen Signalverlauf suchen kann, wobei ein Maß für Ähnlichkeiten sich durch eine Bildanalyse ergibt und damit Rückschlüsse auf Ähnlichkeiten unter den Makromolekülen geschlossen werden kann. Diese Ähnlichkeit wird dann maximal, wenn die Verschiebung eine maximale Übereinstimmung zwischen der Folge von Frequenzdaten und dem Muster erzeugt. Über diese Verschiebung ist auch die eindeutige Position des eindimensionalen Musters in der Frequenzdatenfolge über eine Rücktransformation und eine Demodula- tion durch die Position des Musters in einer Sequenz eindeutig gegeben.In a preferred embodiment of the method for comparison, weighting, cataloging and / or Ty ¬ pisierung a method of filtering information from a di- gital image analysis used. This embodiment has the advantage that both the similarity of two one-dimensional patterns with a mutual local shift by i data points can be measured and a signal with a predetermined signal curve can be searched, a measure of similarities being obtained by an image analysis and thus conclusions about similarities can be concluded among the macromolecules. This similarity becomes maximum when the shift produces a maximum match between the sequence of frequency data and the pattern. This shift also gives the unique position of the one-dimensional pattern in the frequency data sequence via a reverse transformation and demodulation by the position of the pattern in a sequence.
Durch den Einsatz der Fouriertransformation wird die Detekti- onsfilterung über die Faltung vereinfacht und damit die Untersuchung in erheblichem Maße beschleunigt.The use of the Fourier transformation simplifies the detection filtering by means of the convolution and thus accelerates the examination to a considerable extent.
In einer weiteren Ausführungsform des Verfahrens wird zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Typisierung ein Verfahren der Frequenzanalyse eingesetzt. In dieser Ausführungsform sind die Sequenzdaten, die zunächst in frequenzmodulierte Daten umgesetzt wurden, derart aufbereitet, daß jedem Element einer Sequenz in Korrelation zu seinem Nachbarn eine eindeutige Frequenzinformation zugeordnet ist. Zwar tritt die eigentliche Sequenz auf diese Weise in den Hintergrund und wird im einfachsten Fall in eine eindimensionale frequenzmodulierte Welle transformiert, jedoch bleibt die Sequenzinformation von dieser Transformation unberührt und wird lediglich in eine komplexe Frequenzinformation gleichen Informationsgehalts umgesetzt. Der Vorteil dieser Ausführungsform ist, daß alle mathematischen Methoden der Frequenzanalyse auf diese frequenzmodulierte Welle angewendet werden können. Insbesondere die Spek- tralanalyse der Informationen sind in diesem Zusammenhang von größtem Nutzen.In a further embodiment of the method, a frequency analysis method is used for comparison, weighting, cataloging and / or typing. In this embodiment, the sequence data, which were first converted into frequency-modulated data, are prepared in such a way that each element of a sequence is assigned unique frequency information in correlation to its neighbor. Although the actual sequence takes a back seat in this way and is transformed in the simplest case into a one-dimensional frequency-modulated wave, the sequence information remains unaffected by this transformation and is only converted into complex frequency information with the same information content. The advantage of this embodiment is that all mathematical methods of frequency analysis can be applied to this frequency-modulated wave. Spectra Central analysis of the information is of great benefit in this context.
In einer weiteren Ausführungsform des Verfahrens wird zum Vergleich, zur Gewichtung, zum Katalogisieren und/oder zum Typisieren eine stochastische Informationsfilterung im Fourierraum eingesetzt. Bei dieser Ausführungsform können in vorteilhafter Weise Abweichungen vom Idealsignal stochastisch abgeschätzt werden, womit der Erwartungshorizont je nach biologischer Fragestellung gestaltbar ist.In a further embodiment of the method, stochastic information filtering in the Fourier space is used for comparison, weighting, cataloging and / or typing. In this embodiment, deviations from the ideal signal can be estimated stochastically, with which the expectation horizon can be designed depending on the biological problem.
In einer weiteren bevorzugten Ausführungsform des Verfahrens werden die Informationseinheiten und/oder Strukturinformationen von mehrdimensionalen Protein- und/oder DNA-Datenbanken in entsprechende Sequenzcodes zum Erstellen von Sequenzdaten codiert. Dieses hat den Vorteil, daß bei der Untersuchung von Makromolekülen und biologischen Fragestellungen zu Makromolekülen auf mehrdimensionale Protein- und/oder DNA-Datenbanken zurückgegriffen werden kann, die entsprechend mit Hilfe des erfindungs¬ gemäßen Verfahrens dann auswertbar und analysierbar sind, ohne daß die Grenzen der Effizienz der eingesetzten Verfahren und die erheblichen Rechenleistungen überschritten werden.In a further preferred embodiment of the method, the information units and / or structural information from multidimensional protein and / or DNA databases are encoded in corresponding sequence codes for creating sequence data. This has the advantage that it can be used during the analysis of macromolecules and biological problems to macromolecules to multidimensional protein and / or DNA databases, the method according to invention using the Inventive ¬ then be evaluated and analyzed, without the boundaries of the The efficiency of the processes used and the considerable computing power are exceeded.
Das erfindungsgemäße Verfahren kann vorzugsweise mit einer Vorrichtung durchgeführt werden, die eine Vielzahl elektronischer Bausteine zur Modellierung von Frequenzdaten, die molekulare Sequenzen simulieren und eine Vielzahl von Frequenzfiltern zum Gewichten, zum Katalogisieren und/oder zum Typisieren der durch die Vielzahl elektronischer Bausteine modellierten Frequenzdaten aufweist. Ein wesentlicher Vorteil nämlich des erfindungsgemäßen Verfahrens ist es, daß es leicht möglich ist, die not¬ wendigen Algorithmen und Filtersysteme einerseits auf einem Rechner zu entwickeln, aber hernach die gefundenen Methoden in elektronische Schaltkreise umzusetzen, um dann die betreffenden Algorithmen nicht mehr rechnergestutzt, sondern in einem Hoch- frequenzschaltkreis durchzufuhren. Mit einer derartigen Vorrichtung ist es somit möglich, sehr große sequenzbasierte Datenmengen, beispielsweise ganze Genome, rasch und nahezu verzo- gerungsfrei interaktiv zu untersuchen.The method according to the invention can preferably be carried out with a device which has a multiplicity of electronic components for modeling frequency data which simulate molecular sequences and a multiplicity of frequency filters for weighting, for cataloging and / or for typing the frequency data modeled by the multiplicity of electronic components. A significant advantage of the fact the inventive method is that not to develop ¬ manoeuvrable algorithms and filter systems on the one hand on a computer, it is easily possible, but the methods found in electronic circuits thereafter implement, then the relevant Algorithms no longer supported by a computer, but to be carried out in a high-frequency circuit. With such a device it is thus possible to investigate very large sequence-based amounts of data, for example entire genomes, quickly and virtually without any delays.
Bei einer bevorzugten Ausfuhrungsform der Vorrichtung ist die Vielzahl elektronischer Bausteine und die Vielzahl von Frequenzfiltern mittels rechnergestutzten Frequenzanalysen ermittelt und sind diese zu einem Hardwarenetzwerk untereinander gekoppelt, das die Abfolge von Informationseinheiten von Makromolekülen simmuliert. In diesem Zusammenhang sind die Informationseinheiten Basen der Nukleinsäuren, Ammosaurereste von Proteinen und/oder dreidimensionale Srukturemheiten von Proteinen und/oder DNA, deren Abfolge in einem Makromulekul durch das Hardwarenetzwerk simuliert werden. Mit dieser Ausfuhrungsform der Vorrichtung wird erreicht, daß nicht nur ein schneller Vergleich großer sequenzbasierter Datenmuster möglich wird, sondern daß darüber hinaus biologische Fragestellungen unmittelbar durch das Makromoleküle nachbildende Hardwarenetzwerk mit Lichtgeschwindigkeit bearbeitet und mit entsprechend hoher Ge¬ schwindigkeit beantwortet werden können.In a preferred embodiment of the device, the large number of electronic components and the large number of frequency filters are ascertained by means of computer-aided frequency analyzes and these are coupled to one another to form a hardware network which simulates the sequence of information units of macromolecules. In this context, the information units are bases of the nucleic acids, amino acid residues of proteins and / or three-dimensional structural units of proteins and / or DNA, the sequence of which is simulated in a macromulecule by the hardware network. With this embodiment of the device that not only a quick comparison of large sequence-based data pattern is possible, but that about biological questions can be processed directly by the macromolecules simulating hardware network the speed of light and answered speed with a correspondingly high Ge ¬ addition is achieved.
Bevorzugt werden Verfahren und Vorrichtung der Erfindung zur Analyse von Proteinsequenzen angewendet. Ebenso sind Anwendungen im Rahmen der Analyse von DNA-Sequenzen in vorteilhafter Weise möglich. Dazu können auch Untersuchungen und Bemusterun- gen mehrdimensionaler Proteindatenbanken herangezogen werden. Dazu sind die Informationseinheiten der Datenbanken in entspre¬ chenden Sequenzcodes anzubieten, die auch mehrdimensional sein können. Es ist folglich nicht einschränkend notwendig, ledig¬ lich Spektralanalysen auf eine, zwei oder drei Dimensionen zu beschranken, zumal bei den bevorzugten Anwendungen die Erfin- dung für eine große Anzahl von Informationsfragmenten angewendet werden kann.The method and device of the invention are preferably used for the analysis of protein sequences. Applications in the context of the analysis of DNA sequences are also advantageously possible. Investigations and samples of multidimensional protein databases can also be used for this. For this, the information units of the databases in entspre ¬ sponding sequence codes are to be offered, which can also be multidimensional. It is therefore necessary not restrictive, single ¬ Lich to restrict spectral analyzes to one, two or three dimensions, especially in the preferred applications, the inventions can be used for a large number of information fragments.
In einer bevorzugten Anwendung der Erfindung werden mehrdimensionale DNA-Struktuπnformationen auf wiederkehrende Muster untersucht. Insbesondere wird es mit dieser Erfindung möglich, biologische Fragestellungen interaktiv und verzogerungsfrei für sequenzbasierte Datenmengen zu untersuchen.In a preferred application of the invention, multidimensional DNA structure information is examined for recurring patterns. In particular, this invention makes it possible to investigate biological questions interactively and without delay for sequence-based amounts of data.
Die Erfindung wird nun anhand von Ausfuhrungsbeispielen naher erläutert .The invention will now be explained in more detail using exemplary embodiments.
In einem ersten Ausfuhrungsbeispiel werden die Sequenzdaten zunächst m frequenzmodulierte Daten umgesetzt. So erhalt jedes Element der Sequenz in Korrelation zu seinem Nachbarn eine una- re Frequenzinformation zugeordnet. Die eigentliche Sequenz tritt auf diese Weise m den Hintergrund und wird im einfachsten Fall m eine eindimensionale frequenzmodulierte Welle transformiert. Die Sequenzinformation bleibt von dieser Transformation unberührt und wird lediglich in eine komplexe Frequenzinformation gleichen Informationsgehalts umgesetzt.In a first exemplary embodiment, the sequence data are first converted into m frequency-modulated data. In this way, each element of the sequence is assigned an unary frequency information in correlation to its neighbor. In this way, the actual sequence m enters the background and, in the simplest case, m is transformed into a one-dimensional frequency-modulated wave. The sequence information remains unaffected by this transformation and is only converted into complex frequency information with the same information content.
Der Vorteil dieser Methode ist, daß nun alle mathematischen Methoden zur Signalverarbeitung auf diese frequenzmodulierte Welle angewendet werden können. Besonders die Spektralanalysen der Information ergeben in diesem Zusammenhang den größten Nutzen.The advantage of this method is that all mathematical methods for signal processing can now be applied to this frequency-modulated wave. The spectral analyzes of the information in particular provide the greatest benefit in this context.
Auf die frequenzmodulierte Welle wird anschließend eine Fast- Fouπer-Transformation (FFT) angewandt. Auf diese transformierten Daten werden dann entsprechende Filter angewandt. Nach der Rucktransformation, der sogenannten inversen Fourier- Transformation (IFFT) und einer Demodulation der Frequenzdaten zurück in die Sequenzdaten wird die entsprechend gefilterte Information erhalten. Somit können Sequenzmuster sehr effizient im Leistungsspektrum gesucht, beispielsweise große genomische Abschnitte oder ganze Genome miteinander verglichen bzw. ausgefiltert werden. Abweichungen vom Idealsignal sind stochastisch abschätzbar, womit der Erwartungshorizont je nach biologischer Fragestellung gezielt gestaltet werden kann. Damit ergibt sich der wesentliche Vorteil des erfindungsgemäßen Verfahren, daß es leicht möglich ist, die notwendigen Algorithmen und Filtersysteme auf einem Rechner zunächst zu entwickeln und danach die gefundenen Methoden in elektronische Schaltkreise umzusetzen. Dann müssen die betreffenden Algorithmen nicht mehr in einem Computer, sondern können in einem Hochfrequenzschaltkreis prozessiert werden. Mit dieser Ausführungsform der Erfindung ist es somit möglich, sehr große sequenzbasierte Datenmenge, z.B. ganze Genome, rasch und verzögerungsfrei interaktiv zu untersuchen.A Fast-Fouπer-Transformation (FFT) is then applied to the frequency-modulated wave. Appropriate filters are then applied to this transformed data. After the jerk transformation, the so-called inverse Fourier transform (IFFT) and a demodulation of the frequency data back into the sequence data, the correspondingly filtered information is obtained. Sequence patterns can thus be searched very efficiently in the performance spectrum, for example large genomic sections or entire genomes can be compared with one another or filtered out. Deviations from the ideal signal can be estimated stochastically, so that the horizon of expectation can be specifically designed depending on the biological problem. This results in the essential advantage of the method according to the invention that it is easily possible to first develop the necessary algorithms and filter systems on a computer and then to implement the methods found in electronic circuits. Then the algorithms in question no longer have to be in a computer, but can be processed in a high-frequency circuit. With this embodiment of the invention, it is thus possible to examine very large, sequence-based data, for example entire genomes, quickly and without interactivity.
Das erfindungsgemäße Verfahren ist jedoch nicht auf den einfachsten Fall einer eindimensional frequenzmodulierten Welle beschränkt. Vielmehr können in einem zweiten Beispiel einer Ausführungsform der Erfindung auch dreidimensionale oder mehr¬ dimensionale Proteindatenbanken oder mehrdimensionale DNA- Strukturinformationen in ganz ähnlicher Art und Weise auf entsprechende Muster untersucht werden. Hierzu werden Datenbanken ihre Informationseinheiten in entsprechende Sequenzcodes umset¬ zen. Auch für einen Zusammenbau einer großen Anzahl von n- Informationsfragmenten, wie sie beispielsweise in "Shotgun"- organisierten Datenbänken vorliegen, kann die erfindungsgemäße Methode angewandt werden. Diese n-Informationsfragmente stellen in ihrer Summe die Gesamtinformation einer logischen Einheit N dar. Dabei kann die Summe aller Teilelemente der Fra_gmente we¬ sentlich größer sein, als die Summe der Teilelemente der Gesam¬ tinformation N: n >> N; Y {n 3 N}However, the method according to the invention is not limited to the simplest case of a one-dimensional frequency-modulated wave. Rather, in a second example of an embodiment of the invention, three-dimensional or more ¬ dimensional protein databases or multidimensional DNA structure information can also be examined in a very similar manner for corresponding patterns. To this end databases are their information units in corresponding sequence codes imple ¬ zen. The method according to the invention can also be used for assembling a large number of n-information fragments, as are present, for example, in “shotgun” organized data banks. This n-pieces of information set in their sum total, the information of a logical unit N constitutes this case, the sum of all elements of the Fra_gmente we be ¬ sentlich greater than the sum of the partial elements of TOTAL ¬ TInformation N.: n >>N; Y {n 3 N}
Nachdem die Sequenzinformation frequenzmoduliert vorliegt, wird gemäß der vorliegenden Erfindung diese mittels einer Fast- Fourier-Transformation transformiert. Dabei ist im einfachsten Fall die Korrelationsfunktion φfg zweier eindimensionaler Signale, nämlich f (m) und g (m) als eine Faltung des Signals f (m) mit dem Signal g(-m) aufzufassen.After the sequence information is frequency-modulated, it is transformed according to the present invention by means of a Fast Fourier transform. In the simplest case, the correlation function φ fg of two one-dimensional signals, namely f (m) and g (m), is to be understood as a convolution of the signal f (m) with the signal g (-m).
n n
Mit dieser Verfahrensweise kann sowohl die Ähnlichkeit zweier eindimensionaler Muster bei einer gegenseitigen örtlichen Verschiebung um i-Bildpunkte gemessen werden, als auch in einem Signal f ( ) nach einem durch g ( ) vorgegebenen Signalverlauf gesucht werden. φfg ist dabei das Maß für die Ähnlichkeit. Dieses Maß wird dann maximal, wenn die Verschiebung i eine maximale Übereinstimmung zwischen der Welle f (m) und dem Muster g (m) erzeugt. Über diese Verschiebung ist dann auch die eindeutige Position des eindimensionalen "Musters" in der Welle gegeben. Über die Rücktransformation und die Demodulation ist die Position des Musters in der Sequenz eindeutig feststellbar. Durch die FFT vereinfacht sich vorteilhaft diese Detektionsfilterung über die Faltung. Die Fouriertransformierten Φfg und F werden aus φfg und f berechnet und weisen folgende Relation auf:With this procedure, both the similarity of two one-dimensional patterns with a mutual local shift by i-pixels can be measured, and a signal f () can be searched for a signal curve given by g (). φ fg is the measure of the similarity. This measure becomes maximum when the displacement i produces a maximum correspondence between the wave f (m) and the pattern g (m). This shift then also gives the unique position of the one-dimensional "pattern" in the shaft. The position of the pattern in the sequence can be clearly determined via the reverse transformation and demodulation. This detection filtering via the convolution is advantageously simplified by the FFT. The Fourier transforms Φ fg and F are calculated from φ fg and f and have the following relation:
Φfq (k) F(k)G*(k)Φ fq (k) F (k) G * (k)
wobei G*(k) die konjugiert komplexe Fouriertransformierte von g (m) ist. Bei den vorliegenden enormen Datenmengen sequenzbasierter Datenmuster von Makromolekülen ist in diesem Fall die Operation im Fourierraum vorteilhaft, da für die angesprochene Problematik ausgedehnte Musterfunktionen bereits vorliegen. Eine exakte Übereinstimmung von f (m) und g(m) liefert für φfg die Signalenergie von f (m) und g (m) .where G * (k) is the conjugate complex Fourier transform of g (m). In this case, given the enormous amount of data of sequence-based data patterns of macromolecules Operation in the Fourier space is advantageous since extensive pattern functions are already available for the problem addressed. For φ fg, the signal energy of f (m) and g (m) is exactly the same as f (m) and g (m).
Als ein drittes Beispiel werden nun die zweidimensionalen Relationen aufgeführt:As a third example, the two-dimensional relations are now listed:
φfg (i,j) =∑mn f (m,n)g(m-i,n-j) , bzw. Φfg(k,l) = F ( k, 1) G* ( k, 1)φ fg (i, j) = ∑ mn f (m, n) g (mi, nj), or Φ fg (k, l) = F (k, 1) G * (k, 1)
Dabei stellt sich durch eingehende Analysen der informa- tiosstragenden biologischen Makromoleküle heraus, daß den reinen Sequenzinformationen erhebliche Informationsgehalte überlagert sind, die sich aus chemisch verwandten Mustern benachbarter Bausteine oder z.B. mehrdimensionaler Ortssignale ergeben.In-depth analysis of the information-bearing biological macromolecules reveals that the pure sequence information is overlaid with considerable amounts of information that result from chemically related patterns of neighboring building blocks or e.g. result in multi-dimensional location signals.
Die oben beispielhaft beschriebenen Verfahren für eindimensionale und zweidimensionale Relationen können derartige zusätzliche Informationsgehalte rasch durch geeignete stochastisch wirkende Filter im Frequenzraum ermitteln.The methods for one-dimensional and two-dimensional relations described by way of example above can quickly determine such additional information contents by means of suitable stochastically acting filters in the frequency domain.
Durch eine geeignete Abbildung der relevanten "Ähnlichkeitsfunktion" beteiligter Bausteine oder Bausteingruppen in den Frequenzraum hinein ergeben sich automatisch Strukturen, die sich durch bewährte Filter ermitteln lassen. So können beispielsweise Analysen mit lokalen Leistungsspektren angewendet werden, die sich mit den Spektralenergien der zu untersuchenden Abschnitte beschäftigen.A suitable mapping of the relevant "similarity function" of the components or groups of components involved into the frequency domain automatically results in structures that can be determined using proven filters. For example, analyzes with local power spectra can be used, which deal with the spectral energies of the sections to be examined.
Das Leistungsspektrum |F(k)|2 ist die Fouriertransformierte der Autokorrelationsfunktion des Signals f (m) und kann daher zur Messung der statistischen Bindungen zwischen den Werten benachbarter Daten von f (m) herangezogen werden. Werden die Lei- stungsspektren innerhalb lokaler Fenster berechnet, so lassen sich auf diese Weise auch ortsinstationäre Muster beschreiben. Eine geeignete Gewichtung der Originalfunktion kann eingesetzt werden, um störende Anteile im Leistungsspektrum zu reduzieren. In der digitalen Bildanalyse wird für die Texturdetektion vor der Fouriertransformation beispielsweise eine Hemming-Funktion der folgenden Art angewandtThe range of services | F (k) | 2 is the Fourier transform of the autocorrelation function of the signal f (m) and can therefore be used to measure the statistical bonds between the values of neighboring data of f (m). Are the leads power spectra calculated within local windows, this way, even stationary patterns can be described. A suitable weighting of the original function can be used to reduce disruptive parts in the range of services. In digital image analysis, for example, an inhibition function of the following type is used for texture detection before the Fourier transformation
h(m,n) = FI (θ,54-0.46 cos ( 2Tli_ ) ) i = m, n 15 h (m, n) = FI (θ, 54-0.46 cos (2Tli_)) i = m, n 15

Claims

Patentansprüche claims
1. Verfahren zur Untersuchung von Makromolekülen mit folgenden Verfahrensschritten: a) Erstellen von Sequenzdaten molekularer Sequenzen von Makromolekülen b) Umsetzen der Sequenzdaten in frequenzmodulierte Frequenzdaten c) Transformieren der Frequenzdaten in einen Fourierraum d) Einsatz von Fourieranalysen zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Typisierung der Frequenzdaten e) Rücktransformation der verglichenen, gewichteten, katalogisierten und/oder typisierten Frequenzdaten zu Sequenzdaten in gewichteter, katalogisierter und/oder typisierter Form.1.Procedure for the investigation of macromolecules with the following process steps: a) creating sequence data of molecular sequences of macromolecules b) converting the sequence data into frequency-modulated frequency data c) transforming the frequency data into a Fourier space d) using Fourier analyzes for comparison, weighting, cataloging and / or for typing the frequency data e) back-transforming the compared, weighted, cataloged and / or typed frequency data to sequence data in weighted, cataloged and / or typed form.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Typisierung Verfahren der Informationsfilterung aus der digitalen Bildanalyse eingesetzt werden.2. The method according to claim 1, characterized in that for comparing, weighting, cataloging and / or typing methods of filtering information from digital image analysis are used.
3. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, daß zum Vergleich, zur Gewichtung, zur Katalogisierung und/oder zur Typisierung Verfahren der Frequenzanalyse eingesetzt werden.3. The method according to claim 1 or claim 2, characterized in that methods of frequency analysis are used for comparison, for weighting, for cataloging and / or for typing.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß zum Vergleich, zur Gewichtung, zur Ka¬ talogisierung und/oder zur Typisierung eine stochastische Informationsfilterung im Fourierraum eingesetzt wird. 4. The method according to any one of the preceding claims, characterized in that a stochastic information filtering in the Fourier space is used for comparison, for weighting, for Ka ¬ talogisierung and / or for typing.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß Informationseinheiten und Strukturin- formation von mehrdimensionalen Protein- und/oder DNA- Datenbanken in entsprechende Sequenzcodes zum Erstellen von Sequenzdaten codiert werden.5. The method according to any one of the preceding claims, characterized in that information units and structural information from multidimensional protein and / or DNA databases are encoded in corresponding sequence codes for creating sequence data.
6. Vorrichtung zur Untersuchung von Makromolekülen mit einer Vielzahl elektronischer Bausteine zur Modellierung von Frequenzdaten, die molekulare Sequenzen simulieren, und mit einer Vielzahl von Frequenzfiltern zum Vergleichen, zum Gewichten, zum Katalogisieren und/oder zum Typisieren der durch die Vielzahl elektronischer Bausteine modellierten Frequenzdaten .6. Apparatus for examining macromolecules with a multiplicity of electronic components for modeling frequency data that simulate molecular sequences, and with a multiplicity of frequency filters for comparing, weighting, cataloging and / or for typing the frequency data modeled by the multiplicity of electronic components.
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, daß die Vielzahl elektronischer Bausteine und die Vielzahl von Frequenzfiltern mittels rechnergestützten Frequenzanalysen ermittelt und rechnergestützt untereinander zu einem Hardwarenetzwerk gekoppelt sind, das die Abfolge von Informationseinheiten von Makromolekülen simmuliert.7. The device according to claim 6, characterized in that the plurality of electronic components and the plurality of frequency filters are determined by means of computer-aided frequency analyzes and are computer-aided coupled to one another to form a hardware network which simulates the sequence of information units of macromolecules.
8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, daß die Informationseinheiten Basen der Nukleinsäuren, Aminosäurereste von Proteinen und/oder dreidimensionale Sruk- tureinheiten von Proteinen und/oder DNA sind.8. The device according to claim 7, characterized in that the information units are bases of nucleic acids, amino acid residues of proteins and / or three-dimensional structure units of proteins and / or DNA.
9. Anwendung des Verfahrens nach einem der Ansprüche 1 bis 5 oder der Vorrichtung nach Anspruch 6, 7 oder 8 zur Analyse von Proteinsequenzen.9. Application of the method according to one of claims 1 to 5 or the device according to claim 6, 7 or 8 for the analysis of protein sequences.
10. Anwendung des Verfahrens nach einem der Ansprüche 1 bis 5 oder der Vorrichtung nach Anspruch 6, 7 oder Anspruch 8 zur Analyse von DNA-Sequenzen. 10. Use of the method according to one of claims 1 to 5 or the device according to claim 6, 7 or claim 8 for the analysis of DNA sequences.
11. Anwendung des Verfahrens nach einem der Ansprüche 1 bis 5 oder der Vorrichtung nach Anspruch 6, 7 oder 8 zur Untersuchung und Bemusterung dreidimensionaler Proteindatenbanken.11. Application of the method according to one of claims 1 to 5 or the device according to claim 6, 7 or 8 for the examination and sampling of three-dimensional protein databases.
12. Anwendung des Verfahrens nach einem der Ansprüche 1 bis 5 oder der Vorrichtung nach Anspruch 5, 6 oder 8 zur Untersuchung dreidimensionaler DNA-Strukturinformationen auf wiederkehrende Muster.12. Application of the method according to one of claims 1 to 5 or the device according to claim 5, 6 or 8 for examining three-dimensional DNA structure information for recurring patterns.
13. Anwendung des Verfahrens nach einem der Ansprüche 1 bis 5 oder der Vorrichtung nach Anspruch 5, 6 oder 8 zur interak¬ tiven verzögerungsfreien Untersuchung von sequenzbasierten Datenmengen unterschiedlich strukturierter Makromoleküle. 13. Application of the method according to any one of claims 1 to 5 or the apparatus of claim 5, 6 or 8 tive to interac ¬ instantaneous study of sequence-based data sets of differently structured macromolecules.
EP01945081A 2000-05-05 2001-05-03 Method for examining macromolecules Withdrawn EP1307713A2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10021689 2000-05-05
DE10021689A DE10021689A1 (en) 2000-05-05 2000-05-05 Procedure for the study of macromolecules
PCT/EP2001/005023 WO2001086247A2 (en) 2000-05-05 2001-05-03 Method for examining macromolecules

Publications (1)

Publication Number Publication Date
EP1307713A2 true EP1307713A2 (en) 2003-05-07

Family

ID=7640744

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01945081A Withdrawn EP1307713A2 (en) 2000-05-05 2001-05-03 Method for examining macromolecules

Country Status (9)

Country Link
US (1) US20040029126A1 (en)
EP (1) EP1307713A2 (en)
KR (1) KR20030005318A (en)
AU (1) AU2001267403A1 (en)
CA (1) CA2406694A1 (en)
DE (1) DE10021689A1 (en)
EE (1) EE200200618A (en)
IL (1) IL152512A0 (en)
WO (1) WO2001086247A2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100839580B1 (en) * 2006-12-06 2008-06-19 한국전자통신연구원 Apparatus and method for protein structure comparison using 3D RDA and fourier descriptor
US9146248B2 (en) 2013-03-14 2015-09-29 Intelligent Bio-Systems, Inc. Apparatus and methods for purging flow cells in nucleic acid sequencing instruments
US9591268B2 (en) 2013-03-15 2017-03-07 Qiagen Waltham, Inc. Flow cell alignment methods and systems
EP3082056B2 (en) * 2015-04-14 2022-02-09 Peaccel Method and electronic system for predicting at least one fitness value of a protein, related computer program product
EP3598327B1 (en) * 2018-07-20 2021-05-05 Peaccel Method and electronic system for predicting at least one fitness value of a protein via an extended numerical sequence, related computer program product

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6054711A (en) * 1997-11-12 2000-04-25 Millennium Pharmaceuticals, Inc. Methods for identifying biological macromolecule interactions with compounds, particularly in complex mixtures

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0186247A2 *

Also Published As

Publication number Publication date
IL152512A0 (en) 2003-05-29
KR20030005318A (en) 2003-01-17
AU2001267403A1 (en) 2001-11-20
US20040029126A1 (en) 2004-02-12
WO2001086247A2 (en) 2001-11-15
EE200200618A (en) 2004-04-15
CA2406694A1 (en) 2001-11-15
WO2001086247A3 (en) 2003-02-13
DE10021689A1 (en) 2001-12-06

Similar Documents

Publication Publication Date Title
DE69332975T2 (en) DIGITAL FILTER WITH HIGH ACCURACY AND EFFICIENCY
EP1301993B1 (en) Method and device for compressing and/or decompressing data as well as for analyzing and representing data
DE60223982T2 (en) Coding of concentric data
DE10039538B4 (en) Apparatus and method for analyzing the performance of a computer program
DE60223391T2 (en) Tone height determination method and apparatus for spectral analysis
EP3370046B1 (en) Method and device for determining machine speeds
EP0844590A1 (en) Method for fractal image coding and device for carrying out the method
EP1307713A2 (en) Method for examining macromolecules
DE102004028693B4 (en) Apparatus and method for determining a chord type underlying a test signal
DE102004028694B3 (en) Apparatus and method for converting an information signal into a variable resolution spectral representation
WO1999010819A1 (en) Method and system for computer assisted determination of the relevance of an electronic document for a predetermined search profile
DE102005002188A1 (en) Broadband system models
DE3143626A1 (en) METHOD AND DEVICE FOR RECORDING THREE-DIMENSIONAL CORE RESONANCE SPECTRA
DE2057660A1 (en) Method and device for evaluating a signal
EP2302554A2 (en) Method for identifying a section of computer program contained in a computer storage system
DE60110452T2 (en) TIME MATCHING IN A CDMA SYSTEM
EP0843864B1 (en) Method of classification and recognition of patterns according to which a signature is produced by smoothing a polygon outline
JPH07234132A (en) Signal processing device
DE10341191B4 (en) Method and computer program for modeling a glitch on a vehicle electrical system
DE4225401C1 (en) Method for determining spectral components of a signal and device for carrying out the method
DE4227112A1 (en) Determining Fourier spectrum components in vibration analysis - iteratively approximating spectrum using peak values in input spectrum for comparison
EP1097367B1 (en) Method for making available absorption coefficients
DE102013106333B4 (en) SIGNAL GENERATING DEVICE AND METHOD IN A COMMUNICATION SYSTEM
EP0392287A1 (en) Fourier transform method using number theoretic transforms
DE2257534A1 (en) METHOD AND DEVICE FOR SPECTRAL ANALYSIS

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20021022

AK Designated contracting states

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN WITHDRAWN

18W Application withdrawn

Effective date: 20060907