DNA-Analyse: Wohin mit den Rohdaten? Zu GEDmatch!
Im April 2017 habe ich angefangen, mich mit dem Thema DNA-Analyse für die Ahnenforschung zu beschäftigen. Das Gebiet der DNA-Genealogie ist für mich zu dem Zeitpunkt völliges Neuland gewesen. Wie es dazu kam, mich auf dieses so spannende wie komplexe Terrain zu begeben, habe ich in meinem Blogbeitrag DNA-Analyse: im Dienst der Wissenschaft … und der eigenen Neugier beschrieben. Im zweiten Teil DNA-Analyse: Die Reise ins Neuland geht weiter kannst Du lesen, wie so ein DNA-Test für Ahnenforscher abläuft. Im dritten Beitrag der Reihe DNA-Analyse: Die Ergebnisse sind da! Was nun? habe ich mir angeschaut, wie die Testergebnisse aussehen. Hier kommt nun Teil 4 meiner persönlichen DNA-Saga.
Im vorigen Beitrag meiner kleinen Reise in die Welt der DNA-Genealogie habe ich mir die Ergebnisse meines DNA-Tests angeschaut, die mir Living DNA* selbst in einem geschützten Bereich bereitstellt. Diese sind schon sehr spannend und auch optisch schön aufbereitet. Aber das ist nur eine Seite der Medaille.
Wir erinnern uns:
Mit DNA-Tests für Genealogen lassen sich Erkenntnisse zu zwei großen Themenkomplexen gewinnen:
- zur ethnischen und geographischen Herkunft in den letzten Jahrtausenden
- insgesamt (über die atDNA – autosomale DNA)
- der rein weiblichen Vorfahrenlinie (über die mtDNA – Mitochondrien-DNA)
- der rein männlichen Vorfahrenlinie (über die yDNA)
- zu gemeinsamen Vorfahren mit anderen Personen über das sogenannte Matching – den Vergleich der atDNA von 2 oder mehr Personen auf gemeinsame Abschnitte hin
Für den ersten Bereich – die Ethnizitätseinschätzungen und Herkunftsanalyse – bietet uns Living DNA* also schon mal ordentlich Futter. Aber was ist mit dem zweiten Thema? Da hinkt Living DNA* den anderen Anbietern etwas hinterher, denn es gibt (noch) keine eigene Matching-Datenbank. Also, was tun?
Export der Rohdaten
Es gibt bei Living DNA* die Möglichkeit, im persönlichen Bereich die eigenen Rohdaten der Testergebnisse herunterzuladen und somit anderweitig weiterverwenden zu können.
Für weibliche Testpersonen kann man unter dem Menüpunkt Download Raw Data zwei Dateien mit den folgenden Datenarten herunterladen:
- autosomale Rohdaten unter Download autosomal (family ancestry) raw marker data
- mitochondriale DNA-Daten unter Download mtDNA (motherline) list of positive SNPs
Bei Männern gibt es (vermutlich) noch eine dritte Datei mit yDNA-Daten. Living DNA* führt für männliche Testpersonen ja auch noch einen yDNA-Test durch, der bei Frauen wegen des fehlenden y-Chromosoms nicht möglich ist.
Die Datei mit den autosomalen Rohdaten ist im .txt-Format und sieht bei mir so aus:
# rsid chromosome position genotype rs9283150 1 565508 AA 1:726912 1 726912 AA rs116587930 1 727841 GG rs3131972 1 752721 GG
Die mtDNA-Datei liegt im csv-Format vor und hat nur wenig Inhalt, der bei mir ungefähr so aussieht:
263G 1438G 3010A 4769G 8468T
Zwar kann man diese Rohdaten von Living DNA* derzeit leider (noch) nicht direkt bei anderen Anbietern von DNA-Tests hochladen, um damit deren Datenbanken für das Matching nutzen zu können. Aber es gibt Abhilfe: Die Plattform GEDmatch. Sie ist sozusagen das Verbindungsstück für DNA-Daten aus Tests aller Anbieter von DNA-Tests.
Was ist GEDmatch?
GEDmatch ist eine Analyseplattform für genealogische Daten – DNA und GEDCOM. Gedmatch arbeitet nach dem Freemium-Prinzip: die meisten (und wichtigsten) Werkzeuge sind kostenlos zugänglich, darüber hinaus gibt es ein paar sehr vielversprechende Premium-Funktionen, die man über eine 1- oder mehrmonatige Mitgliedschaft bzw. ein Abo – dem sogenannten Tier 1 – kostenpflichtig dazubuchen kann. Ein Monat kostet dabei $10.
Für Living DNA-Nutzer ist GEDmatch jedenfalls das erste Mittel der Wahl, um weitere Erkenntnisse aus den eigenen DNA-Daten zu ziehen. Jeder, der bei einem der vielen Anbieter von genealogischen DNA-Tests die eigene DNA hat analysieren lassen, sollte die Rohdaten also auf jeden Fall bei GEDmatch hochladen, denn so kann man die Erforschung und den Vergleich von DNA-Daten von immer mehr Menschen unterstützen.
Remember that no man (or woman) is an island. Collaboration and sharing genealogical and genetic information is crucial to everyone.
(Tim Janzen)
GEDmatch ist nur in englischer Sprache verfügbar. Um es nutzen zu können, sollte man also schon (etwas) Englisch lesen können und sich ggfs. mit Wörterbuch und Online-Übersetzungswerkzeuge behelfen.
Folgende kostenlose Funktionen stehen bei GEDmatch zur Verfügung:
- Matching, d.h. Abgleich mit atDNA-Daten von Personen, die bei Living DNA* oder anderen Anbietern haben testen lassen
- Werkzeuge für die Analyse der mit anderen Menschen gemeinsamen DNA
- Ethnizitätsschätzungen bzw. Herkunftsanalyse, die sogenannten Admixture-Berichte
- und viele weitere Werkzeuge wie z.B. Phasing und ein 3D-Chromosomen-Browser
GEDmatch nutzen
Um GEDmatch nutzen zu können, sind folgende 3 Schritte notwendig:
- bei GEDmatch registrieren
- Rohdaten von Living DNA herunterladen
- Rohdaten bei GEDmatch Genesis hochladen
1. Registrierung bei GEDmatch
Zuallerst registrierst Du Dich auf der GEDmatch-Anmeldeseite als neuer Nutzer. In die Felder gibst Du nacheinander folgende Daten ein:
- Deinen Vornamen und Nachnamen
- ein Pseudonym (optional – wenn Du nicht möchtest, daß anderen Nutzern Dein echter Name angezeigt wird)
- Deine e-Mail-Adresse (hier ggfs. ebenfalls eine eigene pseudonymisierte e-Mail-Adresse nutzen)
- Deine e-Mail-Adresse zur Bestätigung wiederholen
- Dein gewünschtes Paßwort (mit mindestens 6 Zeichen und davon mindestens 1 Ziffer oder 1 Symbol)
- Dein Paßwort zur Bestätigung wiederholen
Dann klickst Du zum Anmelden auf Register und siehst dann eine Seite, auf der sich das Feld für einen Bestätigungscode befindet.
Du bekommst nun eine e-Mail mit dem Betreff GEDmatch.Com Registration Confirmation Code. Den dort enthaltenen (roten) Code trägst Du in das Feld auf der Webseite ein und bestätigst mit Confirm.
2. Rohdaten von Living DNA herunterladen
Wenn Du in Deinem Konto bei Living DNA eingeloggt bist, klicke bitte im (auf Desktop-Rechnern links oben zu findenden) orangefarbenen Menü auf den Unterpunkt Download Raw Data. Nun wird Dir ein langer englischer Hinweistext angezeigt, den Du ganz unten mit einem Häkchen bestätigen mußt, um die Rohdaten herunterladen zu können.
In dem Text wird u.a. darauf hingewiesen, daß:
- die Rohdatendateien die allererste Version der Daten sind, die zum Herunterladen bereitgestellt werden
- sich der Inhalt der Dateien immer wieder ändern kann, da der Living DNA Orion-Chip für die Analyse der DNA-Daten kontinuierlich weiterentwickelt wird
- Living DNA Wert darauf legt, daß Du selbst die Kontrolle über Deine Daten hast, die Daten jederzeit herunterladen kannst und daß Du verstehst, was Du herunterlädst und welche Bedeutung diese Informationen haben können
- die Testergebnisse nicht für medizinische Diagnosezwecke geeignet sind
- und viele andere sehr grundlegende Punkte, die Du natürlich ausreichend reflektiert haben solltest
Stimmst Du dem zu, wird Dir – voilà – unter dem Text die Möglichkeit eingeblendet, die o.g. 2 oder 3 Dateien einzeln herunterzuladen und z.B. lokal auf Deinem Rechner abzuspeichern.
3. atDNa-Daten bei GEDmatch Genesis hochladen
Nun laden wir schließlich noch die Datei mit Deiner autosomalen DNA zu GEDmatch Genesis hoch. Dafür sind die folgenden Schritte notwendig:
- Logge Dich mit Deinen GEDmatch-Anmeldedaten bei GEDmatch Genesis ein
- Klicke rechts im Bereich Upload your DNA files – for Genesis BETA ONLY auf Generic Uploads (23andme, FTDNA, AncestryDNA, most others)
- Fülle die Felder auf der Seite wie folgt aus:
- Name of donor – Name des Spenders :: Vor- und Nachname der person, deren atDNA-Daten Du hochladen möchtest
- Alias – Pseudonym :: bitte leer lassen, sofern Du den obigen Namen angezeigt haben möchtest, optional kannst Du ein Pseudonym eintragen, das statt des richtigen namens angezeigt werden soll
- Sex of donor – Geschlecht des Spenders :: male (männlich) oder female (weiblich) auswählen
- What is your Mitochondrial haplogroup (if known)? – Was ist Deine mitochondriale Haplogruppe (sofern bekannt)? :: hier die Bezeichnung Deiner Haplogruppe oder noch besser: der gesamten Subclade eintragen, die Du auf der Informationsseite zur Motherline (mütterliche Linie) unten rechts findest (bei mir ist es die Haplogruppe H1 und die Subclade H1a3a3)
- Males Only (or females with a male sibling who has been tested): What is your Y haplogroup (if known)? – Nur Männer (oder Frauen mit einem getesteten Bruder): Was ist Deine Y-Haplogruppe (sofern bekannt)? :: hier bitte die Bezeichnung der Y-Haplogruppe angeben
- Name of Testing Company, or other source Company or Source – Name des Testanbieters oder andere Quelle :: hier Deinen Testanbieter (Living DNA) auswählen
- Please acknowledge that any sample you submit is either your DNA or the DNA of a person for whom you are a legal guardian or have obtained authorization to upload their DNA to GEDmatch (You will not be able to upload the DNA if you do not answer yes) – hier mußt Du zustimmen, daß es sich entweder um Deine DNA oder die einer Person handelt, deren Vormund Du bist oder über deren Vollmacht zum Hochladen der Daten Du verfügst – stimmst Du hier nicht zu, können die Daten nicht hochgeladen werden
- Please acknowledge that this DNA is available for comparison and public display of matches (You will not be able to upload the DNA if you do not answer yes. This can be changed after upload with kit management.) – hier mußt Du zustimmen, daß die DNA-Daten für Vergleiche und die Darstellung von „Matches“ zur Verfügung stehen, andernfalls können die Daten nicht hochgeladen werden, diese Einstellung kann später in der „Kit“-Verwaltung geändert werden
- Click on „Browse“ to find the raw DNA data file on your computer. Your data must be Build 37 (GRCh37/hg19) – Klicke „Durchsuchen“ um die Rohdatendatei auf Deinem Rechner zu finden :: bitte achte darauf, daß es sich bei dem für den Test verwendeten Referenzgenom um Build 37 (GRCh37/hg19) handelt – diese Information findest Du in der Datei mit der atDNA (Bezeichnung nach dem Muster living-dna-xxxxxxxxx-autosomal.txt) in den Kopfzeilen: bei mir steht da z.B. Human Genome Reference Build 37 (GRCh37.p13)
- Click „Upload“ to send your DNA data to GEDmatch – Klicke „Hochladen“, um die DNA-Daten zu GEDmatch zu schicken
Geschafft! Jetzt heißt es Geduld haben.
Bitte laß auf jeden Fall das Browserfenster offen, solange das Hochladen noch nicht abgeschlossen ist!
Zunächst solltest Du auf dem Bildschirm einen Text wie den folgenden sehen:
Upload Time: 2017-Sep-12 11:51:57 UTC
Software Ver: 2017-Sep-08 02:06:27
Email: ich@meinanbieter.xx
Donor Name: Vorname Nachname
Your IP: 93.104.xx.xxx
Your Browser: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36
Upload Filename: living-dna-LDxxxxxxxx-autosomal.txt
Upload File Size: 15757098 Bytes
Your DNA data file has been successfully received at the server. Processing milestones are listed below.
You should see the word ‚Finished‘ at the bottom of the page when processing is complete. If you leave this page before it is finished, your data may be lost.
Processing normally takes less than a minute.
If you see the word ‚ERROR‘, then your file did not complete processing, and you will need to try your upload again.
Processing file…
File is Build 37 format
Processing Chromosomes…
1 ….2 …..3 …..4 ….5 …6 …..7 …8 …9 …10 …11 …12 …13 ..14 ..15 ..16 ..17 .18 ..19 ..20 .21 .22 .X .Kit Num: KFxxxxxxx
Wenn alles klappt, erscheint auf dem Bildschirm nach einigen Minuten:
Upload complete
Assigned kit number: KFxxxxxxx Write this number down. You will need it to access your DNA data on this site
Donor Name: Vorname Nachname
You should be able to use one-to-one comparisons, and some other utilities on this site within a few minutes.
Batch processing usually takes a few hours, but may take up to 2 days to complete depending on server load.
After batch processing completes, your results should be available in the ‚one-to-many‘ comparison utility and other applications listed on your GEDmatch home page.
Finished.
Sobald die Rohdaten dann vollständig hochgeladen sind, fängt GEDmatch an, diese Stück für Stück mit der gesamten Datenbank abzugleichen. Das kann von einigen Stunden bis hin zu einigen Tage dauern. Bis dahin kannst Du aber schon einige der Werkzeuge von GEDmatch nutzen, z. B. die Ethnizitätsschätzungen unter Admixture (heritage) oder den 1-zu-1-Vergleich unter One-to-One Autosomal DNA Comparison. Die restlichen frei zugänglichen Funktionen sind dann im Normalfall nach 1 bis 2 Tagen zugänglich. Also schau am besten immer mal wieder nach.
Wenn alles gut geklappt hat, erscheint auf Deiner Profilseite links im Bereich Your DNA kits below ein kleines blaues Häkchen rechts neben Deinem Namen.
Im nächsten Teil meiner Artikelreihe zur DNA-Genealogie schauen wir uns dann an, was ich anhand meiner atDNA-Daten bei GEDmatch so alles entdecken kann. Bleib gespannt!
Mehr Informationen zur DNA-Genealogie, zu GEDmatch und zu Living DNA* findest Du z.B. unter:
- Portal DNA-Genealogie von CompGen
- GenWiki: GEDmatch
- DNA Projekt: Eine Familie – Die Deutschen im CompGen-Blog
Nach Teil 1: DNA-Analyse: im Dienst der Wissenschaft … und der eigenen Neugier, Teil 2: DNA-Analyse: Die Reise ins Neuland geht weiter und Teil 3: DNA-Analyse: Die Ergebnisse sind da! Was nun? ist dies nun der 4. Teil meiner kleinen Reihe zum Thema genealogischer DNA-Test zur Herkunftsanalyse.
Hast Du eigene Erfahrungen mit Living DNA? Dann teile sie gern mit uns im Kommentarbereich unten.
Bildnachweis:
- Screenshots Anja Klein – gedmatch.com, genesis.gedmatch.com, my.livingdna.com
Hallo, ich bin selbst noch ein richtiger Amateur. Habe aber jetzt mal meine DNA Daten zu GEDmatch hochgeladen.
Wird es eine Vorführung dieses Blog Beitrags geben ?
Wäre da wirklich stark daran interessiert, da ich mich dort nicht wirklich auskenne, und mir die Möglichkeiten aber vielschichtig erscheinen.
Hallo Radim,
schön, daß Du Deine Daten bei GEDmatch hochgeladen hast. Ich hoffe, Du bist schon damit weitergekommen?
Gute Idee, da mal einen (Online-)Workshop daraus zu machen. Ich habe da auch schon dran gedacht und hoffe, daß ich in den nächsten Monaten mal was dazu entwickeln kann.
Themenwünsche sind willkommen :-)
Bis dahin abonniere gern meinen Newsletter.
Beste Grüße, Anja
Nabend,
jetzt musst du uns nur noch erklären was oder wie man die Ergebnisse liest. Vielen Dank…. ?
Population Chr–> 1 2
North_Atlantic 36.3% 19.1%
Hallo liebe Anja, kann man unter Admixture (heritage), nachdem man seine Rohdaten hochgeladen hat, seine eigene Ethnizitätsschätzungen anschauen? Könntest du mir verraten wie die einzelnen Schritte sind? Ich verlier bei der Auswahl total den Überblick. Mein englisch ist auch leider sehr schlecht. Schlage mich gerade mit Google Übersetzung durch ?
Liebe Grüße Nina Luzia
Hey Anja :)
Kommt denn noch der nächste Teil mit deinen Ergebnissen ?
Hallo Svea,
ja, jetzt kommt ja die dunklere Jahreszeit und da ist wieder mehr Zeit :-) Ich habe schon fleißig rund um die DNA-Genealogie weitergelernt und auch noch einen weiteren Test gemacht. So habe ich wieder viel neue Ideen und Inhalte für neue Beiträge :-)
Hast Du schon meinen Newsletter abonniert? Dann bekommst Du immer alle Neuigkeiten zugeschickt.