Chapter, 2023

DNA-Sequenzmontage und Genannotation

Einführung in die Bioinformatik in der Mikrobiologie 978-3-031-31211-3, 978-3-031-31212-0, Pages 11-28

Editors: Henrik Christensen

Publisher: Springer Nature

DOI: 10.1007/978-3-031-31212-0_2

Contributors

Christensen, Henrik 0000-0003-4238-4658 (Corresponding author) [1] Moodley, Arshnee 0000-0002-6469-3948 [1]

Affiliations

  1. [1] University of Copenhagen
  2. [NORA names: KU University of Copenhagen; University; Denmark; Europe, EU; Nordic; OECD]

Abstract

Dieses Kapitel beschreibt die verschiedenen Sequenzierungsstrategien sowie die Vor- und Nachteile der verschiedenen Strategien, um Ihnen bei der Auswahl der optimalen DNA-Sequenzierungsstrategie für Ihre Forschungsfrage zu helfen, und wie man DNA-Sequenzen zusammenfügt und annotiert. DNA-Sequenzierung ist die Bestimmung der Reihenfolge der Nukleotide von Teilen oder ganzen Chromosomen von Organismen und Viren. DNA-Sequenzierung kann für ein einzelnes Gen, ein ganzes Genom oder viele Genome gleichzeitig durchgeführt werden, wie z. B. bei der Metagenomik. Eine der beliebtesten Sequenzierungsmaschinen ist die MiSeq von Illumina, die in der Lage ist, kleine Ganzgenom-Sequenzierungen, Transkriptomik und 16S-rRNA-Metagenomik durchzuführen. Es ist möglich, durch die Verwendung einzigartiger Kombinationen von spezifischen Barcodes und Indizes zu multiplexen. Die Echtzeit-Sequenzierung einzelner Moleküle ermöglicht die Sequenzierung der nativen DNA, was zu deutlich größeren Leselängen und zu Sequenzinformationen führt, die verfügbar sind, wenn die Basen eingebaut werden, d. h. Informationen, die in Echtzeit verfügbar sind. Base Calling ist der erste Schritt bei der Sequenzierung, bei dem das elektronische Signal, das in der Sequenzierungsmaschine erzeugt wird, von zufälligem Rauschen getrennt und in Nukleotidinformationen umgewandelt wird. Dann müssen die Nukleotidinformationen zu DNA-Sequenzen zusammengefügt werden, die der ursprünglich sequenzierten DNA so gut wie möglich ähneln. Dies kann entweder de novo ohne Referenz oder mit einer Referenz erfolgen, wenn das Genom des Organismus oder Virus gut bekannt ist. Der wichtigste Qualitätsparameter, den man berücksichtigen sollte, ist die Abdeckung. Ein weiterer wichtiger Parameter ist N50. Vergleiche zwischen verschiedenen Assemblies können mit Quast durchgeführt werden. Die „Mindestinformationen über eine Genomsequenz“ (MIGS) geben eine erschöpfende Liste der Informationen an, die für genomische Sequenzen erforderlich sind, einschließlich Anforderungen an Metadaten. Die Genomannotation ist die Identifizierung und Kennzeichnung aller relevanten Merkmale der genomischen Sequenz. Zunächst umfasst dies die Koordinaten, die als Nukleotidpositionen angegeben werden, an denen codierende Regionen vorhergesagt werden. Es handelt sich hauptsächlich um eine Vorhersage von codierenden Genen; jedoch werden auch andere strukturelle Gene wie rRNA identifiziert.

Data Provider: Digital Science