DNA-Analyse: Wohin mit den Rohdaten? Zu GEDmatch!

Im April 2017 habe ich angefangen, mich mit dem Thema DNA-Analyse für die Ahnenforschung zu beschäftigen. Das Gebiet der DNA-Genealogie ist für mich zu dem Zeitpunkt völliges Neuland gewesen. Wie es dazu kam, mich auf dieses so spannende wie komplexe Terrain zu begeben, habe ich in meinem Blogbeitrag DNA-Analyse: im Dienst der Wissenschaft … und der eigenen Neugier beschrieben. Im zweiten Teil DNA-Analyse: Die Reise ins Neuland geht weiter kannst Du lesen, wie so ein DNA-Test für Ahnenforscher abläuft. Im dritten Beitrag der Reihe habe ich mir angeschaut, wie die Testergebnisse aussehen. Hier kommt nun Teil 4 meiner persönlichen DNA-Saga.


Im vorigen Beitrag meiner kleinen Reise in die Welt der DNA-Genealogie habe ich mir die Ergebnisse meines DNA-Tests angeschaut, die mir Living DNA* selbst in einem geschützten Bereich bereitstellt. Diese sind schon sehr spannend und auch optisch schön aufbereitet. Aber das ist nur eine Seite der Medaille.

Wir erinnern uns:

Mit DNA-Tests für Genealogen lassen sich Erkenntnisse zu zwei großen Themenkomplexen gewinnen:

  • zur ethnischen und geographischen Herkunft in den letzten Jahrtausenden
    • insgesamt (über die atDNA – autosomale DNA)
    • der rein weiblichen Vorfahrenlinie (über die mtDNA – Mitochondrien-DNA)
    • der rein männlichen Vorfahrenlinie (über die yDNA)
  • zu gemeinsamen Vorfahren mit anderen Personen über das sogenannte Matching – den Vergleich der atDNA von 2 oder mehr Personen auf gemeinsame Abschnitte hin

Für den ersten Bereich – die Ethnizitätseinschätzungen und Herkunftsanalyse – bietet uns Living DNA* also schon mal ordentlich Futter. Aber was ist mit dem zweiten Thema? Da hinkt Living DNA* den anderen Anbietern etwas hinterher, denn es gibt (noch) keine eigene Matching-Datenbank. Also, was tun?

Export der Rohdaten

Es gibt bei Living DNA* die Möglichkeit, im persönlichen Bereich die eigenen Rohdaten der Testergebnisse herunterzuladen und somit anderweitig weiterverwenden zu können.

Für weibliche Testpersonen kann man unter dem Menüpunkt Download Raw Data zwei Dateien mit den folgenden Datenarten herunterladen:

  • autosomale Rohdaten unter Download autosomal (family ancestry) raw marker data
  • mitochondriale DNA-Daten unter Download mtDNA (motherline) list of positive SNPs

Bei Männern gibt es (vermutlich) noch eine dritte Datei mit yDNA-Daten. Living DNA* führt für männliche Testpersonen ja auch noch einen yDNA-Test durch, der bei Frauen wegen des fehlenden y-Chromosoms nicht möglich ist.

Die Datei mit den autosomalen Rohdaten ist im .txt-Format und sieht bei mir so aus:

# rsid chromosome position genotype
rs9283150 1 565508 AA
1:726912 1 726912 AA
rs116587930 1 727841 GG
rs3131972 1 752721 GG

Die mtDNA-Datei liegt im csv-Format vor und hat nur wenig Inhalt, der bei mir ungefähr so aussieht:

263G
1438G
3010A
4769G
8468T

Zwar kann man diese Rohdaten von Living DNA* derzeit leider (noch) nicht direkt bei anderen Anbietern von DNA-Tests hochladen, um damit deren Datenbanken für das Matching nutzen zu können. Aber es gibt Abhilfe: Die Plattform GEDmatch. Sie ist sozusagen das Verbindungsstück für DNA-Daten aus Tests aller Anbieter von DNA-Tests.

Was ist GEDmatch?

GEDmatch ist eine Analyseplattform für genealogische Daten – DNA und GEDCOM. Gedmatch arbeitet nach dem Freemium-Prinzip: die meisten (und wichtigsten) Werkzeuge sind kostenlos zugänglich, darüber hinaus gibt es ein paar sehr vielversprechende Premium-Funktionen, die man über eine 1- oder mehrmonatige Mitgliedschaft bzw. ein Abo – dem sogenannten Tier 1 – kostenpflichtig dazubuchen kann. Ein Monat kostet dabei $10.

Für Living DNA-Nutzer ist GEDmatch jedenfalls das erste Mittel der Wahl, um weitere Erkenntnisse aus den eigenen DNA-Daten zu ziehen. Jeder, der bei einem der vielen Anbieter von genealogischen DNA-Tests die eigene DNA hat analysieren lassen, sollte die Rohdaten also auf jeden Fall bei GEDmatch hochladen, denn so kann man die Erforschung und den Vergleich von DNA-Daten von immer mehr Menschen unterstützen.

 

Remember that no man (or woman) is an island. Collaboration and sharing genealogical and genetic information is crucial to everyone.

(Tim Janzen)

 

GEDmatch ist nur in englischer Sprache verfügbar. Um es nutzen zu können, sollte man also schon (etwas) Englisch lesen können und sich ggfs. mit Wörterbuch und Online-Übersetzungswerkzeuge behelfen.

Folgende kostenlose Funktionen stehen bei GEDmatch zur Verfügung:

  • Matching, d.h. Abgleich mit atDNA-Daten von Personen, die bei Living DNA* oder anderen Anbietern haben testen lassen
  • Werkzeuge für die Analyse der mit anderen Menschen gemeinsamen DNA
  • Ethnizitätsschätzungen bzw. Herkunftsanalyse, die sogenannten Admixture-Berichte
  • und viele weitere Werkzeuge wie z.B. Phasing und ein 3D-Chromosomen-Browser

Wichtig zu wissen für Living DNA-Nutzer:

GEDmatch besteht aus zwei Bereichen:  GEDmatch und GEDmatch Genesis.

GEDmatch Genesis ist die experimentelle Version von GEDmatch. In diesem Bereich werde zum einen neue Applikationen und Algorithmen getestet, zum anderen werden dort die Analysewerkzeuge für DNA-Daten aus Tests der Anbieter bereitgestellt, die bisher noch nicht von GEDmatch unterstützt werden, wie es z.B. bei Living DNA der Fall ist. Es ist geplant, die Funktionalitäten von GEDmatch Genesis früher oder später mit denen der regulären GEDmatch-Seite zusammenzuführen.

WICHTIG: Bis dahin können Daten aus Tests von Living DNA nur im Genesis-Bereich analysiert werden.

 

GEDmatch nutzen

Um GEDmatch nutzen zu können, sind folgende 3 Schritte notwendig:

  1. bei GEDmatch registrieren
  2. Rohdaten von Living DNA herunterladen
  3. Rohdaten bei GEDmatch Genesis hochladen

1. Registrierung bei GEDmatch

Zuallerst registrierst Du Dich auf der GEDmatch-Anmeldeseite als neuer Nutzer. In die Felder gibst Du nacheinander folgende Daten ein:

  • Deinen Vornamen und Nachnamen
  • ein Pseudonym (optional – wenn Du nicht möchtest, daß anderen Nutzern Dein echter Name angezeigt wird)
  • Deine e-Mail-Adresse (hier ggfs. ebenfalls eine eigene pseudonymisierte e-Mail-Adresse nutzen)
  • Deine e-Mail-Adresse zur Bestätigung wiederholen
  • Dein gewünschtes Paßwort (mit mindestens 6 Zeichen und davon mindestens 1 Ziffer oder 1 Symbol)
  • Dein Paßwort zur Bestätigung wiederholen

Dann klickst Du zum Anmelden auf Register und siehst dann eine Seite, auf der sich das Feld für einen Bestätigungscode befindet.

Du bekommst nun eine e-Mail mit dem Betreff GEDmatch.Com Registration Confirmation Code. Den dort enthaltenen (roten) Code trägst Du in das Feld auf der Webseite ein und bestätigst mit Confirm.

 

 

2. Rohdaten von Living DNA herunterladen

Wenn Du in Deinem Konto bei Living DNA eingeloggt bist, klicke bitte im (auf Desktop-Rechnern links oben zu findenden) orangefarbenen Menü auf den Unterpunkt Download Raw Data. Nun wird Dir ein langer englischer Hinweistext angezeigt, den Du ganz unten mit einem Häkchen bestätigen mußt, um die Rohdaten herunterladen zu können.

In dem Text wird u.a. darauf hingewiesen, daß:

  • die Rohdatendateien die allererste Version der Daten sind, die zum Herunterladen bereitgestellt werden
  • sich der Inhalt der Dateien immer wieder ändern kann, da der Living DNA Orion-Chip für die Analyse der DNA-Daten kontinuierlich  weiterentwickelt wird
  • Living DNA Wert darauf legt, daß Du selbst die Kontrolle über Deine Daten hast, die Daten jederzeit herunterladen kannst und daß Du verstehst, was Du herunterlädst und welche Bedeutung diese Informationen haben können
  • die Testergebnisse nicht für medizinische Diagnosezwecke geeignet sind
  • und viele andere sehr grundlegende Punkte, die Du natürlich ausreichend reflektiert haben solltest

Stimmst Du dem zu, wird Dir – voilà – unter dem Text die Möglichkeit eingeblendet, die o.g. 2 oder 3 Dateien einzeln herunterzuladen und z.B. lokal auf Deinem Rechner abzuspeichern.

 

3. atDNa-Daten bei GEDmatch Genesis hochladen

Nun laden wir schließlich noch die Datei mit Deiner autosomalen DNA zu GEDmatch Genesis hoch. Dafür sind die folgenden Schritte notwendig:

  • Logge Dich mit Deinen GEDmatch-Anmeldedaten bei GEDmatch Genesis ein
  • Klicke rechts im Bereich Upload your DNA files – for Genesis BETA ONLY  auf Generic Uploads (23andme, FTDNA, AncestryDNA, most others)
  • Fülle die Felder auf der Seite wie folgt aus:
    • Name of donor – Name des Spenders :: Vor- und Nachname der person, deren atDNA-Daten Du hochladen möchtest
    • Alias – Pseudonym :: bitte leer lassen, sofern Du den obigen Namen angezeigt haben möchtest, optional kannst Du ein Pseudonym eintragen, das statt des richtigen namens angezeigt werden soll
    • Sex of donor – Geschlecht des Spenders :: male (männlich) oder female (weiblich) auswählen
    • What is your Mitochondrial haplogroup (if known)? – Was ist Deine mitochondriale Haplogruppe (sofern bekannt)? :: hier die Bezeichnung Deiner Haplogruppe oder noch besser: der gesamten Subclade eintragen, die Du auf der Informationsseite zur Motherline (mütterliche Linie) unten rechts findest (bei mir ist es die Haplogruppe H1 und die Subclade H1a3a3)
    • Males Only (or females with a male sibling who has been tested): What is your Y haplogroup (if known)? – Nur Männer (oder Frauen mit einem getesteten Bruder): Was ist Deine Y-Haplogruppe (sofern bekannt)? :: hier bitte die Bezeichnung der Y-Haplogruppe angeben
    • Name of Testing Company, or other source  Company or Source – Name des Testanbieters oder andere Quelle :: hier Deinen Testanbieter (Living DNA) auswählen
    • Please acknowledge that any sample you submit is either your DNA or the DNA of a person for whom you are a legal guardian or have obtained authorization to upload their DNA to GEDmatch (You will not be able to upload the DNA if you do not answer yes) – hier mußt Du zustimmen, daß es sich entweder um Deine DNA oder die einer Person handelt, deren Vormund Du bist oder über deren Vollmacht zum Hochladen der Daten Du verfügst – stimmst Du hier nicht zu, können die Daten nicht hochgeladen werden
    • Please acknowledge that this DNA is available for comparison and public display of matches (You will not be able to upload the DNA if you do not answer yes. This can be changed after upload with kit management.) – hier mußt Du zustimmen, daß die DNA-Daten für Vergleiche und die Darstellung von „Matches“ zur Verfügung stehen, andernfalls können die Daten nicht hochgeladen werden, diese Einstellung kann später in der „Kit“-Verwaltung geändert werden
  • Click on „Browse“ to find the raw DNA data file on your computer. Your data must be Build 37 (GRCh37/hg19) – Klicke „Durchsuchen“ um die Rohdatendatei auf Deinem Rechner zu finden :: bitte achte darauf, daß es sich bei dem für den Test verwendeten Referenzgenom um Build 37 (GRCh37/hg19) handelt – diese Information findest Du in der Datei mit der atDNA (Bezeichnung nach dem Muster living-dna-xxxxxxxxx-autosomal.txt) in den Kopfzeilen: bei mir steht da z.B. Human Genome Reference Build 37 (GRCh37.p13)
  • Click „Upload“ to send your DNA data to GEDmatch – Klicke „Hochladen“, um die DNA-Daten zu GEDmatch zu schicken

Geschafft! Jetzt heißt es Geduld haben.

Bitte laß auf jeden Fall das Browserfenster offen, solange das Hochladen noch nicht abgeschlossen ist!

 

Zunächst solltest Du auf dem Bildschirm einen Text wie den folgenden sehen:

Upload Time: 2017-Sep-12 11:51:57 UTC
Software Ver: 2017-Sep-08 02:06:27
Email: ich@meinanbieter.xx
Donor Name: Vorname Nachname
Your IP: 93.104.xx.xxx
Your Browser: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36
Upload Filename: living-dna-LDxxxxxxxx-autosomal.txt

Upload File Size: 15757098 Bytes

Your DNA data file has been successfully received at the server. Processing milestones are listed below.
You should see the word ‚Finished‘ at the bottom of the page when processing is complete. If you leave this page before it is finished, your data may be lost.
Processing normally takes less than a minute.
If you see the word ‚ERROR‘, then your file did not complete processing, and you will need to try your upload again.

Processing file…

File is Build 37 format
Processing Chromosomes…
1 ….2 …..3 …..4 ….5 …6 …..7 …8 …9 …10 …11 …12 …13 ..14 ..15 ..16 ..17 .18 ..19 ..20 .21 .22 .X .Kit Num: KFxxxxxxx

 

Wenn alles klappt, erscheint auf dem Bildschirm nach einigen Minuten:

Upload complete

Assigned kit number: KFxxxxxxx Write this number down. You will need it to access your DNA data on this site

Donor Name: Vorname Nachname

You should be able to use one-to-one comparisons, and some other utilities on this site within a few minutes.

Batch processing usually takes a few hours, but may take up to 2 days to complete depending on server load.
After batch processing completes, your results should be available in the ‚one-to-many‘ comparison utility and other applications listed on your GEDmatch home page.

Finished.

 

Status des DNA-Kits | Foto: Screenshot Anja Klein, genesis.gedmatch.com

Status des DNA-Kits | Foto: Screenshot Anja Klein, genesis.gedmatch.com

Sobald die Rohdaten dann vollständig hochgeladen sind, fängt GEDmatch an, diese Stück für Stück mit der gesamten Datenbank abzugleichen. Das  kann von einigen Stunden bis hin zu einigen Tage dauern. Bis dahin kannst Du aber schon einige der Werkzeuge von GEDmatch nutzen, z. B. die Ethnizitätsschätzungen unter Admixture (heritage)  oder den 1-zu-1-Vergleich unter One-to-One Autosomal DNA Comparison. Die restlichen frei zugänglichen Funktionen sind dann im Normalfall nach 1 bis 2 Tagen zugänglich. Also schau am besten immer mal wieder nach.

 

Wenn alles gut geklappt hat, erscheint auf Deiner Profilseite links im Bereich Your DNA kits below  ein kleines blaues Häkchen rechts neben Deinem Namen.

 

Im nächsten Teil meiner Artikelreihe zur DNA-Genealogie schauen wir uns dann an, was ich anhand meiner atDNA-Daten bei GEDmatch so alles entdecken kann. Bleib gespannt!

 

Mehr Informationen zur DNA-Genealogie, zu GEDmatch und zu Living DNA* findest Du z.B. unter:

 


Nach Teil 1: DNA-Analyse: im Dienst der Wissenschaft … und der eigenen Neugier, Teil 2: DNA-Analyse: Die Reise ins Neuland geht weiter und Teil 3: ist dies nun der 4. Teil meiner kleinen Reihe zum Thema genealogischer DNA-Test zur Herkunftsanalyse

 

Bildnachweis:

  • Screenshots Anja Klein – gedmatch.com, genesis.gedmatch.com, my.livingdna.com

 

Merken

Merken

Merken

Merken

Merken

Merken

Hinterlasse einen Kommentar

Benachrichtige mich über:
avatar
wpDiscuz