![]() | IBIMA Forschung Lehre Dienstleistungen Aktuelles ROBISYS |
| GUI zum Vergleich von Proteinstrukturen im FASTA-Format Autoren: Dagmar Steffen, Lothar Gierl, Klaus Muscheites |
ProblemstellungDieses Programm wurde im Rahmen der Zusammenarbeit mit dem Institut für Immunologie zur Problematik der Zinkfingerproteine entwickelt. Das hier benutzte FASTA-Format ist die gebräuchlichste Verschlüsselung der Proteinstrukturen in der Datenverarbeitung (im HEADER steht der Name des Proteins und notwendige Zusatzinformationen, gefolgt von den DATEN - einer Anreihung von Buchstaben, die die einzelnen Aminosäuren charakterisieren).Bei der Analyse von Zinkfingerproteinen der Hefe (Saccharomyces cerevisiae) und ihrem Vergleich mit dem Hefegenom ergab sich die Notwendigkeit, die Aminosäuresequenzen zu visualisieren, um durch farbige Markierung der Zinkfingerdomänen und der Start- und Stopsequenzen eine schnelle visuelle Beurteilung zu ermöglichen. Zum anderen sollte es möglich sein, eine komplette Proteinsequenz auf dem Genom zu markieren und anschließend als Datei auszugeben. Dieses Visualiserungsprogramm sollte plattformunabhängig sein.
MethodikNach der Suche der Zinkfingerdomänen sowohl in den Proteinen als auch auf den Genomen stand der Vergleich der bekannten Zinkfingerproteine mit dem Genom und die Identifizierung noch unbekannter Zinkproteine auf den Genomen an. Hierzu wurde die folgende graphische Benutzerschnittstelle entwickelt. Als Programmiersprache wurde die Skriptsprache "Tool Command Language" benutzt. Das Softwarepaket TCL und das hierzugehörende Toolkit TK ist sowohl für UNIX, als auch Mac-OS und Ms-Windows verfügbar und die Skripte sind meist ohne Anpassung auf allen Systemen lauffähig. Zum anderen sind die Skripte auch ohne detaillierte Programmierkenntnisse änderbar, so daß sich das Paket an andere Problemstellungen anpassen läßt.Zur Analyse der Proteine und des Genoms wurde als Datenformat das übliche FASTA-Format benutzt. Zu diesem Zweck wurden die 6 möglichen Open-Reading-Frames der einzelnen Chromosomen zunächst in Stücke zu 50.000 Aminosäureeinheiten gespalten, die sich jeweils um 5000 Einheiten überlappen. Um bei der Visualisierung die Positionierung auf dem Genom zu erleichtern wird der zu untersuchende FASTA-File 'x' in Blöcke zu 1000 Einheiten zusammengefaßt und diese in Abschnitten von 100 Aminosäuren angezeigt. Die Position auf dem File wird nach Anklicken mit der linken Maustaste angezeigt. Durch Markieren mit der mittleren bzw. rechten Maustaste läßt sich Anfang und Ende eines Proteinabschnittes festlegen. Dieser kann danach als FASTA-Datei ausgegeben werde. Zusätzlich zu dem oben beschriebenen File können noch 2 Referenzfiles 'a' und 'b' angezeigt werden (in der Anzeige 'b' werden neben der Aminosäuresequenz auch die Kopfzeile des FASTA-Files dargestellt ). Die farbige Markierung der Zinkfingerdomänen bzw. der Start- und Stoppsequenzen kann durch Anklicken der entsprechenden Buttons ein- und ausgeschaltet werden.
|
LiteraturTcl und Tk: Entwicklung graphischer Benutzerschnittstellen für das X Window System / John.K.Ousterhout. - Addison-Weslay 1995 |
zuletzt geändert: 30.10.2005 |