Bioinformatiker erstellen Karte zur Evolution von Proteinen
Archivmeldung vom 08.06.2006
Bitte beachten Sie, dass die Meldung den Stand der Dinge zum Zeitpunkt ihrer Veröffentlichung am 08.06.2006 wiedergibt. Eventuelle in der Zwischenzeit veränderte Sachverhalte bleiben daher unberücksichtigt.
Freigeschaltet durch Thorsten SchmittProteine als die wichtigsten Bausteine des Lebens sind Produkte einer Optimierung über Jahrmillionen. Ihre Eigenschaften, entscheidend für ihre Rolle im zellulären Geschehen, lassen sich nicht einfach aus der Folge der Aminosäurebausteine ablesen. Das wichtigste Werkzeug ist dabei der Vergleich der Sequenzen untereinander. Proteinähnlichkeiten geben Hinweise auf die Verwandschaftsverhältnisse zwischen Proteinen.
Verwandte Proteine haben oft gleiche oder ähnliche Eigenschaften und Funktionen
im Organismus, da sie sich im Lauf der Evolution nur langsam verändern. Da man
derzeit viel mehr Proteinsequenzen kennt als man eingehend in Labors untersuchen
kann, werden die experimentellen Erkenntnisse über ein Protein auch auf dessen
Verwandte übertragen.
Die Anfrage der Biologen "welche Proteine sind mit meinem
Protein verwandt" wird täglich hunderttausendfach von den Computern weltweit
bearbeitet. Daraus entstand die Idee, alle bekannten Proteine zu vergleichen
("alle gegen alle") und damit eine ultimative Lösung des Problems anzubieten.
Mit dem Ergebnis in Form einer Datenbank, können nicht nur Anfragen rasch und
effizient beantwortet werden, der entstandene Datensatz ist eine ideale Basis
zur Beantwortung vieler Fragen der Molekularbiologen. SIMAP ("Similarity Matrix
of Proteins") ist ein Gemeinschaftsprojekt des Lehrstuhls für Genomorientierte
Bioinformatik der Technischen Universität München und des Instituts für
Bioinformatik (MIPS/IBI) am Forschungszentrum für Umwelt und Gesundheit (GSF)
bei München. Mit SIMAP steht eine vollständige Matrix aller bekannten
Proteinverwandtschaften zur Verfügung, die ständig aktualisiert
wird.
Aktuell sind die Sequenzen von ungefähr vier Millionen Proteinen
öffentlich bekannt. Die vollständige Berechnung der Sequenzähnlichkeiten
erfordert eine enorme Rechenkapazität. Auf einem einzelnen Computer würde die
Berechnung der 16.000 Milliarden Vergleiche etwa 80 Jahre dauern. Daher
entschloss sich das Team um Dr. Thomas Rattei, Roland Arnold und Prof. Dr.
Hans-Werner Mewes, auf die Hilfe von Freiwilligen zurückzugreifen, welche die
ungenutzte Rechenkapazität ihrer Computer zur Verfügung stellen. Diese
Technologie nennt sich Community Grid Computing, prominentestes Beispiel ist das
SETI@HOME Projekt, welches seit vielen Jahren Radiowellen aus dem Weltraum nach
Signalen außerirdischer Intelligenz durchsucht. SIMAP@HOME ist das erste
deutsche Community Grid Projekt und hat seit Dezember 2005 rund 5000 Freiwillige
mit über 10000 Computern aus mehr als 50 Ländern gewinnen können. Die momentane
Rechenkapazität liegt bereits im Leistungsbereich eines Supercomputers mit weit
mehr als 2 Teraflops, eine Leistung, die die Kapazität vieler Rechenzentren bei
weitem übertrifft.
Die vorhandene Information über Gen- und somit
Proteinsequenzen steigt durch die schnell wachsende Zahl an
Genomsequenzierprojekten rapide an. Durch die Hilfe der weltweiten Community
wird das SIMAP-Projekt in der Lage sein, auch in Zukunft mit dieser Entwicklung
Schritt zu halten und wertvolle Daten für zahlreiche Analysen in der Genom- und
Gesundheitsforschung zeitnah zu liefern.
Die gewonnen Informationen
stehen jedem Wissenschaftler zur Verfügung und können über die Projekt-Webseite
abgerufen werden: http://boinc.bio.wzw.tum.de/boincsimap.
Quelle: Pressemitteilung Informationsdienst Wissenschaft e.V.