Nasze
"Ma³e Ojczyzny" Rozmieszczenie nazwiska w Polsce w 2002 roku
|
_Strona g³ówna > Genealogia genetyczna Oziemb³owskich (Oziêb³owskich) > Analiza statystyczna haplotypów Y67 subkladu I1-M253P (I1-ASP) |
Genealogia
genetyczna Y-DNA Oziemb³owskich (Oziêb³owskich) Genetic genealogy Y-DNA of Oziemb³owski (Oziêb³owski) Families |
|
Analiza
statystyczna haplotypów STR Y-DNA subkladu I1-M253P (I1-ASP) z wykorzystaniem "skalowania wielowymiarowego" i "analizy skupieñ" autor: Maciej Oziemb³owski |
|
[subklad
ASP tj. anglosaski w wersji polskiej,
pomorskiej, pruskiej] |
|
Poni¿szy artyku³
w wersji angielskiej / ENGLISH VERSION: Statistical investigation of STR Y-DNA haplotypes in I1-M253P (I1-ASP) subclade using of "multidimensional scaling" and "cluster analysis" |
|
Haplotypy dwóch Oziemb³owskich (zestaw 169071 i 191847) s± w praktyce identyczne (dla Y67) i zaliczone zosta³y do subkladu I1-M253P (I1-ASP). W dalszej czê¶ci niniejszego tekstu wystêpuj± one jako haplotyp "Oziemb³owski" (I1-ASP). Wiêcej o samym subkladzie mo¿na znale¼æ na mojej innej podstronie, gdzie jest on omówiony w ramach projektu FT-DNA "Normanowie Europy Kontynentalnej" (Normans-CE). Chcia³em sprawdziæ jak z wykorzystaniem standardowych technik statystycznych (pakiet Statistica 9.0) bêd± wygl±da³y "grupowania" haplotypów w ramach subkladu I1-ASP (wed³ug stanu na 10.10.2010) i skutkiem tego jest poni¿szy artyku³. |
|
Przygotowanie
danych |
|
1) 20 haplotypów STR Y-DNA (67 markerowych) zosta³o pozyskanych z projektu Normans-CE za¶ 2 haplotypy uzyskano z bazy danych Ysearch (Matz, Reck). Dwa ostatnie haplotypy by³y zakwalifikowane do tego subkladu przez Peter'a Gwozdz'a. Tak wiêc do badañ wykorzystano w sumie 22 haplotypy. Warto¶ci markerów STR Y-DNA dla tych 22 haplotypów (osób) znajduj± siê w Tab. 1 (trzy czê¶ci: 1a, 1b, 1c). |
|
2) W drugim etapie dokonano standaryzacji danych, aby markery o wysokich warto¶ciach np. ok. 34-35 nie by³y w modelu "silniejsze" od tych markerów z ni¿szymi warto¶ciami, np. 8-9 (Tab. 2a i 2b). Poniewa¿ dla 22 markerów warto¶ci by³y identyczne dla wszystkich haplotypów (osób), to ostatecznie po standaryzacji do dalszych badañ wykorzystano warto¶ci 45 markerów (67-22=45), dla których wystêpowa³o jakiekolwiek zró¿nicowanie w ramach tych¿e 22 haplotypów (osób). |
|
3) Na podstawie Tab. 2 utworzona zosta³a macierz odleg³o¶ci (Tab. 3). Im wiêksza wystêpuje liczba dla danej pary haplotypów tym ma miejsce mniejsze ich podobieñstwo genetyczne. Ni¿sze liczby = wiêksze podobieñstwo genetyczne. |
|
SKALOWANIE
WIELOWYMIAROWE |
|
4) Macierz z Tab. 3 by³a wyj¶ciow± dla metody "Skalowanie wielowymiarowe". Wykres osypiska wskazuje, ¿e model 2 lub 3-wymiarowy bêdzie dobrze opisywa³ zale¿no¶ci. Wybrano model 2-D (Rys. 1). Diagram Shepard'a (Rys. 2) potwierdza, ¿e konfiguracja dwuwymiarowa w odpowiedni sposób opisuje podobieñstwa pomiêdzy analizowanymi haplotypami STR (punkty s± blisko "schodków"). Ka¿dy punkt reprezentuje jedn± porównywan± parê haplotypów. W kilku przypadkach punkty "nachodz±" na siebie, ale wszystkich "par" dla 22 haplotypów jest 231 co wynika z dwumianu Newtona lub pro¶ciej - z obliczenia wyra¿enia: (22*21)/2. Rys.
1
Rys.
2 |
|
5) Model dwuwymiarowy, czyli p³aszczyzna (Rys. 3) pokazuje wzajemne podobieñstwa pomiêdzy analizowanymi haplotypami. Im punkty reprezentuj±ce dane haplotypy s± bli¿ej siebie, tym wiêksze jest ich podobieñstwo genetyczne. Trzech uczestników ma mocno ró¿ni±ce siê haplotypy od pozosta³ych 19 osób, dlatego punkty ich reprezentuj±ce znajduj± siê w obszarze nazwanym przeze mnie "Far Outer Space". Rys.
3
|
|
6) "Przybli¿aj±c siê" do pozosta³ych 19 punktów (zoom-in) widaæ, ¿e mo¿na by dokonaæ manualnego podzia³u na dwie grupy (Rys. 4): "Middle Outer Space" oraz "Inner Space". Te 19 punkty s± przesuniête nieco w prawo od pocz±tku uk³adu wspó³rzêdnych (0,0), gdy¿ po lewej stronie znajduj± siê dwa punkty (Rys. 3) na "Far Outer Space", a po prawej tylko jeden, gdy¿ model uwzglêdnia wszystkie 22 punkty. Rys.
4 |
|
7) Dokonano wykluczenia z modelu 3 najbardziej "odstaj±cych" od reszty haplotypów. Dla pozosta³ych 19 powtórzono kroki: osypisko - model 2-D (Rys. 5), diagram Shepard'a (Rys. 6) - OK, bo punkty blisko schodków, par do porównania mniej: 171 = (19*18)/2 oraz na koniec wykre¶lono 2-wymiarowy model dla 19 profili (Rys. 7). Tutaj te¿ utworzy³ siê "rdzeñ" (10 profili) w centralnym po³o¿eniu uk³adu wspó³rzêdnych. W samym centrum jest profil osób: Bembnista, Pietruszewski. Najbli¿ej 10 osobowego rdzenia z "Middle outer space" jest Johnsen. Jest rzecz± oczywist±, ¿e dodawanie lub odejmowanie z modelu okre¶lonych haplotypów wp³ywa na wzajemn± konfiguracjê "punktów" na p³aszczy¼nie, gdy¿ ka¿dy haplotyp co¶ do ogólnego modelu "wnosi" lub "zabiera" je¶li go wykluczamy. Rys.
5
Rys.
6
Rys.
7 |
|
ANALIZA
SKUPIEÑ |
|
8)
Oprócz "Skalowania
wielowymiarowego" dokonano próby okre¶lenia wzajemnych powi±zañ ("grupowañ")
na podstawie "Analizy Skupieñ". Wyj¶ciowymi danymi by³a macierz
z Tab. 3. |
|
9) Wykre¶lono 5 diagramów drzewa (Rys. 8-12) gdzie zastosowano nieco ró¿ni±ce siê metody "wi±zania", a mianowicie metodê wi±zania pojedynczego (Rys. 8), wi±zania pe³nego (Rys. 9), ¶rednich po³±czeñ (Rys. 10), ¶rodków ciê¿ko¶ci (Rys. 11) oraz metodê Warda (Rys. 12). Diagramy zasadniczo potwierdzaj± obserwacje z metody skalowania wielowymiarowego, ale nale¿y pamiêtaæ, ¿e w obu metodach materia³em wyj¶ciowym by³a ta sama macierz. Rys.
8
Rys.
9
Rys.
10
Rys.
11
Rys.
12 |
|
10.
PODSUMOWANIE: Obydwie metody, tj. "skalowanie wielowymiarowe"
oraz "analiza skupieñ" okaza³y siê przydatne w "grupowaniach"
opartych na podobieñstwie analizowanych haplotypów STR. "Drzewka
filogenetyczne" otrzymywane za pomoc± specjalistycznego software'u
mog± byæ bardzo przydatne w dok³adniejszym "wykalibrowaniu"
powy¿szych metod, które mog³yby byæ stosowane jako uzupe³nienie tradycyjnych
sposobów "grupowania" haplotypów STR Y-DNA w odniesieniu do
wybranych subkladów. |
|
_Strona g³ówna > Genealogia genetyczna Oziemb³owskich (Oziêb³owskich) > Analiza statystyczna haplotypów Y67 subkladu I1-M253P (I1-ASP) | |
Kontakt: maciej@oziemblowski.eu
|
|
Strona "oziemblowski.eu"
istnieje od grudnia 2009 roku. Data ostatniej aktualizacji: 01.01.2011
- Maciej Oziemb³owski (c) |