oziemblowski banner
flag_UK
English version

Strona g³ówna

Pochodzenie nazwiska

Migracje Oziemb³owskich

Nasze "Ma³e Ojczyzny"
(miejscowo¶ci i regiony)

Rozmieszczenie nazwiska w Polsce w 2002 roku

Genealogia klasyczna

Genealogia genetyczna

Dokumenty

Zdjêcia

Inna grafika

Opracowania (PDF)

Spis Oziemb³owskich

¬ród³a

_Strona g³ówna > Genealogia genetyczna Oziemb³owskich (Oziêb³owskich) > Analiza statystyczna haplotypów Y67 subkladu I1-M253P (I1-ASP)
Genealogia genetyczna Y-DNA Oziemb³owskich (Oziêb³owskich)
Genetic genealogy Y-DNA of Oziemb³owski (Oziêb³owski) Families
Analiza statystyczna haplotypów STR Y-DNA subkladu
I1-M253P (I1-ASP) z wykorzystaniem "skalowania wielowymiarowego" i "analizy skupieñ"
autor: Maciej Oziemb³owski
[subklad ASP tj. anglosaski w wersji polskiej, pomorskiej, pruskiej]
Poni¿szy artyku³ w wersji angielskiej / ENGLISH VERSION:
Statistical investigation of STR Y-DNA haplotypes in I1-M253P (I1-ASP) subclade
using of "multidimensional scaling" and "cluster analysis"

Haplotypy dwóch Oziemb³owskich (zestaw 169071 i 191847) s± w praktyce identyczne (dla Y67) i zaliczone zosta³y do subkladu I1-M253P (I1-ASP). W dalszej czê¶ci niniejszego tekstu wystêpuj± one jako haplotyp "Oziemb³owski" (I1-ASP). Wiêcej o samym subkladzie mo¿na znale¼æ na mojej innej podstronie, gdzie jest on omówiony w ramach projektu FT-DNA "Normanowie Europy Kontynentalnej" (Normans-CE). Chcia³em sprawdziæ jak z wykorzystaniem standardowych technik statystycznych (pakiet Statistica 9.0) bêd± wygl±da³y "grupowania" haplotypów w ramach subkladu I1-ASP (wed³ug stanu na 10.10.2010) i skutkiem tego jest poni¿szy artyku³.

Przygotowanie danych

1) 20 haplotypów STR Y-DNA (67 markerowych) zosta³o pozyskanych z projektu Normans-CE za¶ 2 haplotypy uzyskano z bazy danych Ysearch (Matz, Reck). Dwa ostatnie haplotypy by³y zakwalifikowane do tego subkladu przez Peter'a Gwozdz'a. Tak wiêc do badañ wykorzystano w sumie 22 haplotypy. Warto¶ci markerów STR Y-DNA dla tych 22 haplotypów (osób) znajduj± siê w Tab. 1 (trzy czê¶ci: 1a, 1b, 1c).

Tab. 1a
Tab. 1b
Tab. 1c

2) W drugim etapie dokonano standaryzacji danych, aby markery o wysokich warto¶ciach np. ok. 34-35 nie by³y w modelu "silniejsze" od tych markerów z ni¿szymi warto¶ciami, np. 8-9 (Tab. 2a i 2b). Poniewa¿ dla 22 markerów warto¶ci by³y identyczne dla wszystkich haplotypów (osób), to ostatecznie po standaryzacji do dalszych badañ wykorzystano warto¶ci 45 markerów (67-22=45), dla których wystêpowa³o jakiekolwiek zró¿nicowanie w ramach tych¿e 22 haplotypów (osób).

Tab. 2a
Tab. 2b

3) Na podstawie Tab. 2 utworzona zosta³a macierz odleg³o¶ci (Tab. 3). Im wiêksza wystêpuje liczba dla danej pary haplotypów tym ma miejsce mniejsze ich podobieñstwo genetyczne. Ni¿sze liczby = wiêksze podobieñstwo genetyczne.

Tab. 3

SKALOWANIE WIELOWYMIAROWE

4) Macierz z Tab. 3 by³a wyj¶ciow± dla metody "Skalowanie wielowymiarowe". Wykres osypiska wskazuje, ¿e model 2 lub 3-wymiarowy bêdzie dobrze opisywa³ zale¿no¶ci. Wybrano model 2-D (Rys. 1). Diagram Shepard'a (Rys. 2) potwierdza, ¿e konfiguracja dwuwymiarowa w odpowiedni sposób opisuje podobieñstwa pomiêdzy analizowanymi haplotypami STR (punkty s± blisko "schodków"). Ka¿dy punkt reprezentuje jedn± porównywan± parê haplotypów. W kilku przypadkach punkty "nachodz±" na siebie, ale wszystkich "par" dla 22 haplotypów jest 231 co wynika z dwumianu Newtona lub pro¶ciej - z obliczenia wyra¿enia: (22*21)/2.

Rys. 1
Wykres osypiska (dla 22 osób=haplotypów)

 

Rys. 2
Diagram Shepard'a (dla 22 osób=haplotypów)

5) Model dwuwymiarowy, czyli p³aszczyzna (Rys. 3) pokazuje wzajemne podobieñstwa pomiêdzy analizowanymi haplotypami. Im punkty reprezentuj±ce dane haplotypy s± bli¿ej siebie, tym wiêksze jest ich podobieñstwo genetyczne. Trzech uczestników ma mocno ró¿ni±ce siê haplotypy od pozosta³ych 19 osób, dlatego punkty ich reprezentuj±ce znajduj± siê w obszarze nazwanym przeze mnie "Far Outer Space".

Rys. 3
Podobieñstwo 22 haplotypów dla modelu dwuwymiarowego 2D

 

6) "Przybli¿aj±c siê" do pozosta³ych 19 punktów (zoom-in) widaæ, ¿e mo¿na by dokonaæ manualnego podzia³u na dwie grupy (Rys. 4): "Middle Outer Space" oraz "Inner Space". Te 19 punkty s± przesuniête nieco w prawo od pocz±tku uk³adu wspó³rzêdnych (0,0), gdy¿ po lewej stronie znajduj± siê dwa punkty (Rys. 3) na "Far Outer Space", a po prawej tylko jeden, gdy¿ model uwzglêdnia wszystkie 22 punkty.

Rys. 4
Podobieñstwo 22 haplotypów dla modelu dwuwymiarowego 2D
(ale "zoom-in" tylko na 19 haplotypów)

7) Dokonano wykluczenia z modelu 3 najbardziej "odstaj±cych" od reszty haplotypów. Dla pozosta³ych 19 powtórzono kroki: osypisko - model 2-D (Rys. 5), diagram Shepard'a (Rys. 6) - OK, bo punkty blisko schodków, par do porównania mniej: 171 = (19*18)/2 oraz na koniec wykre¶lono 2-wymiarowy model dla 19 profili (Rys. 7). Tutaj te¿ utworzy³ siê "rdzeñ" (10 profili) w centralnym po³o¿eniu uk³adu wspó³rzêdnych. W samym centrum jest profil osób: Bembnista, Pietruszewski. Najbli¿ej 10 osobowego rdzenia z "Middle outer space" jest Johnsen. Jest rzecz± oczywist±, ¿e dodawanie lub odejmowanie z modelu okre¶lonych haplotypów wp³ywa na wzajemn± konfiguracjê "punktów" na p³aszczy¼nie, gdy¿ ka¿dy haplotyp co¶ do ogólnego modelu "wnosi" lub "zabiera" je¶li go wykluczamy.

Rys. 5
Wykres osypiska (dla 19 osób=haplotypów)

 

Rys. 6
Diagram Shepard'a (dla 19 osób=haplotypów)

 

Rys. 7
Podobieñstwo 19 haplotypów dla modelu dwuwymiarowego 2D

ANALIZA SKUPIEÑ
8) Oprócz "Skalowania wielowymiarowego" dokonano próby okre¶lenia wzajemnych powi±zañ ("grupowañ") na podstawie "Analizy Skupieñ". Wyj¶ciowymi danymi by³a macierz z Tab. 3.

9) Wykre¶lono 5 diagramów drzewa (Rys. 8-12) gdzie zastosowano nieco ró¿ni±ce siê metody "wi±zania", a mianowicie metodê wi±zania pojedynczego (Rys. 8), wi±zania pe³nego (Rys. 9), ¶rednich po³±czeñ (Rys. 10), ¶rodków ciê¿ko¶ci (Rys. 11) oraz metodê Warda (Rys. 12). Diagramy zasadniczo potwierdzaj± obserwacje z metody skalowania wielowymiarowego, ale nale¿y pamiêtaæ, ¿e w obu metodach materia³em wyj¶ciowym by³a ta sama macierz.

Rys. 8
Podobieñstwo 22 haplotypów w metodzie "wi±zania pojedynczego"

 

Rys. 9
Podobieñstwo 22 haplotypów w metodzie "wi±zania pe³nego"

 

Rys. 10
Podobieñstwo 22 haplotypów w metodzie "¶rednich po³±czeñ"

 

Rys. 11
Podobieñstwo 22 haplotypów w metodzie "¶rodków ciê¿ko¶ci"

 

Rys. 12
Podobieñstwo 22 haplotypów w metodzie "Ward'a"

10. PODSUMOWANIE: Obydwie metody, tj. "skalowanie wielowymiarowe" oraz "analiza skupieñ" okaza³y siê przydatne w "grupowaniach" opartych na podobieñstwie analizowanych haplotypów STR. "Drzewka filogenetyczne" otrzymywane za pomoc± specjalistycznego software'u mog± byæ bardzo przydatne w dok³adniejszym "wykalibrowaniu" powy¿szych metod, które mog³yby byæ stosowane jako uzupe³nienie tradycyjnych sposobów "grupowania" haplotypów STR Y-DNA w odniesieniu do wybranych subkladów.
_Strona g³ówna > Genealogia genetyczna Oziemb³owskich (Oziêb³owskich) > Analiza statystyczna haplotypów Y67 subkladu I1-M253P (I1-ASP)
Kontakt: maciej@oziemblowski.eu
Strona "oziemblowski.eu" istnieje od grudnia 2009 roku. Data ostatniej aktualizacji: 01.01.2011 - Maciej Oziemb³owski (c)