Chapter, 2023

Datenbanken und Proteinstrukturen

Einführung in die Bioinformatik in der Mikrobiologie 978-3-031-31211-3, 978-3-031-31212-0, Pages 29-57

Editors: Henrik Christensen

Publisher: Springer Nature

DOI: 10.1007/978-3-031-31212-0_3

Contributors

Christensen, Henrik 0000-0003-4238-4658 (Corresponding author) [1] De Vries, Lisbeth Elvira 0000-0002-9380-5208 [2]

Affiliations

  1. [1] University of Copenhagen
  2. [NORA names: KU University of Copenhagen; University; Denmark; Europe, EU; Nordic; OECD];
  3. [2] University College Copenhagen
  4. [NORA names: KP University College Copenhagen; College; Denmark; Europe, EU; Nordic; OECD]

Abstract

Bioinformatik-Datenbanken enthalten biologische Daten aus wissenschaftlichen Experimenten, vor allem DNA- und Proteinsequenzen und Proteinstrukturen. Datenbanken mit veröffentlichter Literatur, computergestützte Analyse von Primärdaten und Metadaten sind ebenfalls wichtig. Primäre und sekundäre Datenbanken beziehen sich auf die Art und Quelle der gespeicherten Daten. Primäre Datenbanken wie GenBank und ENA werden auch als Archive oder Repositories bezeichnet. Sie erhalten Informationen direkt vom einzelnen Forscher, und die Daten gehören dem Einreichenden, der das Recht hat, die Daten zu ändern. Die Nukleotid-Datenbanken DDBJ, EMBL und GenBank werden automatisch auf Proteinebene übersetzt, wenn die DNA-Sequenzen codieren. Die sekundären Datenbanken (z. B. Swiss-Prot und PDB) werden kuratiert und führen eine Qualitätskontrolle und Sortierung der Informationen durch, bevor diese der Öffentlichkeit zugänglich gemacht werden. Diesen Datenbanken gelingt es besser, Redundanz zu reduzieren. Sie können auch die Einreichungen von Einträgen in den primären Datenbanken umgehen, die nicht mehr aktualisiert werden. Domänen sind kompakte Einheiten von Proteinen, die sich unabhängig verhalten und mit bestimmten Funktionen verbunden sein können. Motive sind konservierte Regionen von Proteinen, die Teil von Domänen sein können. Die Vorhersage von Domänen kann auf der Grundlage einzelner Motive, mehrerer Motive und vollständiger Domänen oder unter Verwendung von Verfahren erfolgen, die verschiedene Methoden kombinieren. Die Funktion eines Proteins kann über eine eher geringe Identität mit anderen bekannten Proteinen bei einer eher kurzen Vergleichslänge und eine eher geringe Ähnlichkeit zu Proteinstrukturen vorhergesagt werden. Die Proteomik befasst sich mit der Vorhersage von Proteinen auf der Grundlage der Messung von Masse-zu-Ladung-Verhältnissen (m/z). Die Vorhersage von Proteinen erfolgt dann mit Programmen wie Mascot, bei denen die m/z-Koordinaten aus einer Analyse mit dem überprüften Teil von UniProt abgeglichen werden.

Data Provider: Digital Science