oziemblowski banner
flag_UK
English version

Strona g堯wna

Pochodzenie nazwiska

Migracje Oziemb這wskich

Nasze "Ma貫 Ojczyzny"
(miejscowo軼i i regiony)

Rozmieszczenie nazwiska w Polsce w 2002 roku

Genealogia klasyczna

Genealogia genetyczna

Dokumenty

Zdj璚ia

Inna grafika

Opracowania (PDF)

Spis Oziemb這wskich

毒鏚豉

_Strona g堯wna > Genealogia genetyczna Oziemb這wskich (Ozi瑿這wskich) > Analiza statystyczna haplotyp闚 Y67 subkladu I1-M253P (I1-ASP)
Genealogia genetyczna Y-DNA Oziemb這wskich (Ozi瑿這wskich)
Genetic genealogy Y-DNA of Oziemb這wski (Ozi瑿這wski) Families
Analiza statystyczna haplotyp闚 STR Y-DNA subkladu
I1-M253P (I1-ASP) z wykorzystaniem "skalowania wielowymiarowego" i "analizy skupie"
autor: Maciej Oziemb這wski
[subklad ASP tj. anglosaski w wersji polskiej, pomorskiej, pruskiej]
Poni窺zy artyku w wersji angielskiej / ENGLISH VERSION:
Statistical investigation of STR Y-DNA haplotypes in I1-M253P (I1-ASP) subclade
using of "multidimensional scaling" and "cluster analysis"

Haplotypy dw鏂h Oziemb這wskich (zestaw 169071 i 191847) s w praktyce identyczne (dla Y67) i zaliczone zosta造 do subkladu I1-M253P (I1-ASP). W dalszej cz窷ci niniejszego tekstu wyst瘼uj one jako haplotyp "Oziemb這wski" (I1-ASP). Wi璚ej o samym subkladzie mo積a znale潭 na mojej innej podstronie, gdzie jest on om闚iony w ramach projektu FT-DNA "Normanowie Europy Kontynentalnej" (Normans-CE). Chcia貫m sprawdzi jak z wykorzystaniem standardowych technik statystycznych (pakiet Statistica 9.0) b璠 wygl康a造 "grupowania" haplotyp闚 w ramach subkladu I1-ASP (wed逝g stanu na 10.10.2010) i skutkiem tego jest poni窺zy artyku.

Przygotowanie danych

1) 20 haplotyp闚 STR Y-DNA (67 markerowych) zosta這 pozyskanych z projektu Normans-CE za 2 haplotypy uzyskano z bazy danych Ysearch (Matz, Reck). Dwa ostatnie haplotypy by造 zakwalifikowane do tego subkladu przez Peter'a Gwozdz'a. Tak wi璚 do bada wykorzystano w sumie 22 haplotypy. Warto軼i marker闚 STR Y-DNA dla tych 22 haplotyp闚 (os鏏) znajduj si w Tab. 1 (trzy cz窷ci: 1a, 1b, 1c).

Tab. 1a
Tab. 1b
Tab. 1c

2) W drugim etapie dokonano standaryzacji danych, aby markery o wysokich warto軼iach np. ok. 34-35 nie by造 w modelu "silniejsze" od tych marker闚 z ni窺zymi warto軼iami, np. 8-9 (Tab. 2a i 2b). Poniewa dla 22 marker闚 warto軼i by造 identyczne dla wszystkich haplotyp闚 (os鏏), to ostatecznie po standaryzacji do dalszych bada wykorzystano warto軼i 45 marker闚 (67-22=45), dla kt鏎ych wyst瘼owa這 jakiekolwiek zr騜nicowanie w ramach tych瞠 22 haplotyp闚 (os鏏).

Tab. 2a
Tab. 2b

3) Na podstawie Tab. 2 utworzona zosta豉 macierz odleg這軼i (Tab. 3). Im wi瘯sza wyst瘼uje liczba dla danej pary haplotyp闚 tym ma miejsce mniejsze ich podobie雟two genetyczne. Ni窺ze liczby = wi瘯sze podobie雟two genetyczne.

Tab. 3

SKALOWANIE WIELOWYMIAROWE

4) Macierz z Tab. 3 by豉 wyj軼iow dla metody "Skalowanie wielowymiarowe". Wykres osypiska wskazuje, 瞠 model 2 lub 3-wymiarowy b璠zie dobrze opisywa zale積o軼i. Wybrano model 2-D (Rys. 1). Diagram Shepard'a (Rys. 2) potwierdza, 瞠 konfiguracja dwuwymiarowa w odpowiedni spos鏏 opisuje podobie雟twa pomi璠zy analizowanymi haplotypami STR (punkty s blisko "schodk闚"). Ka盥y punkt reprezentuje jedn por闚nywan par haplotyp闚. W kilku przypadkach punkty "nachodz" na siebie, ale wszystkich "par" dla 22 haplotyp闚 jest 231 co wynika z dwumianu Newtona lub pro軼iej - z obliczenia wyra瞠nia: (22*21)/2.

Rys. 1
Wykres osypiska (dla 22 os鏏=haplotyp闚)

 

Rys. 2
Diagram Shepard'a (dla 22 os鏏=haplotyp闚)

5) Model dwuwymiarowy, czyli p豉szczyzna (Rys. 3) pokazuje wzajemne podobie雟twa pomi璠zy analizowanymi haplotypami. Im punkty reprezentuj帷e dane haplotypy s bli瞠j siebie, tym wi瘯sze jest ich podobie雟two genetyczne. Trzech uczestnik闚 ma mocno r騜ni帷e si haplotypy od pozosta造ch 19 os鏏, dlatego punkty ich reprezentuj帷e znajduj si w obszarze nazwanym przeze mnie "Far Outer Space".

Rys. 3
Podobie雟two 22 haplotyp闚 dla modelu dwuwymiarowego 2D

 

6) "Przybli瘸j帷 si" do pozosta造ch 19 punkt闚 (zoom-in) wida, 瞠 mo積a by dokona manualnego podzia逝 na dwie grupy (Rys. 4): "Middle Outer Space" oraz "Inner Space". Te 19 punkty s przesuni皻e nieco w prawo od pocz徠ku uk豉du wsp馧rz璠nych (0,0), gdy po lewej stronie znajduj si dwa punkty (Rys. 3) na "Far Outer Space", a po prawej tylko jeden, gdy model uwzgl璠nia wszystkie 22 punkty.

Rys. 4
Podobie雟two 22 haplotyp闚 dla modelu dwuwymiarowego 2D
(ale "zoom-in" tylko na 19 haplotyp闚)

7) Dokonano wykluczenia z modelu 3 najbardziej "odstaj帷ych" od reszty haplotyp闚. Dla pozosta造ch 19 powt鏎zono kroki: osypisko - model 2-D (Rys. 5), diagram Shepard'a (Rys. 6) - OK, bo punkty blisko schodk闚, par do por闚nania mniej: 171 = (19*18)/2 oraz na koniec wykre郵ono 2-wymiarowy model dla 19 profili (Rys. 7). Tutaj te utworzy si "rdze" (10 profili) w centralnym po這瞠niu uk豉du wsp馧rz璠nych. W samym centrum jest profil os鏏: Bembnista, Pietruszewski. Najbli瞠j 10 osobowego rdzenia z "Middle outer space" jest Johnsen. Jest rzecz oczywist, 瞠 dodawanie lub odejmowanie z modelu okre郵onych haplotyp闚 wp造wa na wzajemn konfiguracj "punkt闚" na p豉szczy幡ie, gdy ka盥y haplotyp co do og鏊nego modelu "wnosi" lub "zabiera" je郵i go wykluczamy.

Rys. 5
Wykres osypiska (dla 19 os鏏=haplotyp闚)

 

Rys. 6
Diagram Shepard'a (dla 19 os鏏=haplotyp闚)

 

Rys. 7
Podobie雟two 19 haplotyp闚 dla modelu dwuwymiarowego 2D

ANALIZA SKUPIE
8) Opr鏂z "Skalowania wielowymiarowego" dokonano pr鏏y okre郵enia wzajemnych powi您a ("grupowa") na podstawie "Analizy Skupie". Wyj軼iowymi danymi by豉 macierz z Tab. 3.

9) Wykre郵ono 5 diagram闚 drzewa (Rys. 8-12) gdzie zastosowano nieco r騜ni帷e si metody "wi您ania", a mianowicie metod wi您ania pojedynczego (Rys. 8), wi您ania pe軟ego (Rys. 9), 鈔ednich po陰cze (Rys. 10), 鈔odk闚 ci篹ko軼i (Rys. 11) oraz metod Warda (Rys. 12). Diagramy zasadniczo potwierdzaj obserwacje z metody skalowania wielowymiarowego, ale nale篡 pami皻a, 瞠 w obu metodach materia貫m wyj軼iowym by豉 ta sama macierz.

Rys. 8
Podobie雟two 22 haplotyp闚 w metodzie "wi您ania pojedynczego"

 

Rys. 9
Podobie雟two 22 haplotyp闚 w metodzie "wi您ania pe軟ego"

 

Rys. 10
Podobie雟two 22 haplotyp闚 w metodzie "鈔ednich po陰cze"

 

Rys. 11
Podobie雟two 22 haplotyp闚 w metodzie "鈔odk闚 ci篹ko軼i"

 

Rys. 12
Podobie雟two 22 haplotyp闚 w metodzie "Ward'a"

10. PODSUMOWANIE: Obydwie metody, tj. "skalowanie wielowymiarowe" oraz "analiza skupie" okaza造 si przydatne w "grupowaniach" opartych na podobie雟twie analizowanych haplotyp闚 STR. "Drzewka filogenetyczne" otrzymywane za pomoc specjalistycznego software'u mog by bardzo przydatne w dok豉dniejszym "wykalibrowaniu" powy窺zych metod, kt鏎e mog造by by stosowane jako uzupe軟ienie tradycyjnych sposob闚 "grupowania" haplotyp闚 STR Y-DNA w odniesieniu do wybranych subklad闚.
_Strona g堯wna > Genealogia genetyczna Oziemb這wskich (Ozi瑿這wskich) > Analiza statystyczna haplotyp闚 Y67 subkladu I1-M253P (I1-ASP)
Kontakt: maciej@oziemblowski.eu
Strona "oziemblowski.eu" istnieje od grudnia 2009 roku. Data ostatniej aktualizacji: 01.01.2011 - Maciej Oziemb這wski (c)