3.1样本和分布图

知识类型: 析出资源
查看原文
内容出处: 《中国姓氏群体遗传和人口分布》 图书
唯一号: 131020020210012263
颗粒名称: 3.1样本和分布图
分类号: K810.2
页数: 4
页码: 58-61
摘要: 样本和分布图概括了样本就是能客观和全面地反映总体的一群代表,通过对样本的分析和样本的统计,来推断总体的数值,以此来描绘和了解总体,这是群体遗传学中常用的研究方法。就是用已有数值的点来推测未取得数值的点。取得了全部点的值以后,对全部点按若干不同的值归类,不同值的点用不同的颜色或灰度来表示,最终展示在大家面前的是一幅幅清晰直观的姓氏遗传地形彩图
关键词: 姓氏 分布图 群体遗传

内容

样本就是能客观和全面地反映总体的一群代表,通过对样本的分析和样本的统计,来推断总体的数值,以此来描绘和了解总体,这是群体遗传学中常用的研究方法。既然我们研究的是样本,根据实际条件,对样本就有一定的要求和统计学的检验,这样才能获得最理想的样本。从总体中抽取的样本的首要原则是随机性,其次是样本数量的最小原则。
  当代姓氏的样本是国家统计局人口统计司提供的1982年全国人口万分之五,三阶段整群抽样资料(国家统计局,1984年)。
  最小样本数目确定的公式: 理论上最少的样本数为53万人。实际上1982年随机取样数为57万余人,把握程度有效地超过了设计要求。
  三阶段整群抽样方法是按三个层次进行的,省(自治区、直辖市)抽县(市、区),县(市、区)抽乡(街道),乡(街道)抽居民点(村民小组、居民区)。各层次均有其概率比例(国家统计局1984年人口变动情况抽样调查方法)。
  我们对以上的样本点和姓氏进行了验证,根据姓氏分布的要求,几个点的样本人数太少不能用,可用的样本点为291个,除了少数民族外,又剔除了一些姓氏不明的样本,共获得汉族样本537421人。
  台湾地区的姓氏数据来自1967年的全台湾四分之一的抽样(陈绍馨和傅瑞德《台湾人口姓氏分布》,1968年),共有19个抽样县(市),我们按万分之五的比例获得台湾的样本4841个。所以,当今全国姓氏的总样本为542262个,抽样点310个,图3.1为抽样点的分布图。
  宋、元、明三朝的历史姓氏资料来自近千部的文献中的人物,组成的样本并不完全的随机,我们根据当时的各省的人口分布情况加以调整,并用“中性等位基因分布”的理论进行检验,说明了宋、元、明三朝的历史姓氏资料的可信程度。详细的说明见第二章的有关章节。
  每一同姓人群在各地的分布都不平衡,不同姓氏人群的分布也都不一致,任何文字和数据都不能完整地说明它们的分布形状和与其他同姓人群的关系。绘制姓氏遗传地形图就是为了能在地图上直观地看到每一同姓人群的分布状况,包括其分布的形状、同姓人群的分布中心、聚集区域、扩散趋势、人口密度以及在各地的总人口中所占的比例。
  我们利用当代姓氏的全国抽样样本,绘制了当今最常见100个姓氏的全国遗传地形图。每一个姓氏的遗传地形图包括两幅图:密度分布图和频率分布图。密度分布图说明某同姓人群在全国的绝对分布情况,即在每平方公里内某姓人口数。频率分布图将揭示某同姓人群在全国的相对分布情况,即某姓占当地总人口的比例。全部200幅分布图已展示在书前并在下编中逐一地给以详细的说明。
  绘制遗传地形图的原理是:根据全国310个抽样点上的全部姓氏的分布值,对全国其他没有取得数值的点进行插值,获得每一点上的全部姓氏的推算分布值(Shepard1968,Piazza et al.1981,Piazza and Menozzi1983)。换句话说,就是用已有数值的点来推测未取得数值的点。取得了全部点的值以后,对全部点按若干不同的值归类,不同值的点用不同的颜色或灰度来表示,最终展示在大家面前的是一幅幅清晰直观的姓氏遗传地形彩图。全国分成93938个插值点,每一点的某一姓氏的插值由310个抽样点上的这一姓氏的分布值来决定,由于每一点到310个抽样点的距离不同,理论上讲距离越远,抽样点的值对其影响越小,反之则越大,原点的影响为最大。修正的插值公式如下:公式中di代表第i个抽样点到插值点的距离,〓和〓i分别代表插值点和第i个抽样点的纬度,y和yi分别代表插值点和第i个抽样点的经度,当然,地理距离的计算不是直线的,还要作些其他的处理。I代表全部310个抽样点,p代表插值点的某姓氏的插值,wi代表第i个抽样点到插值点的距离系数,pi代表第i个抽样点的某姓氏的分布值。
  用抽样点绘制的遗传地形图也存在缺憾,由于是全国千分之零点五的抽样数据,存在一些点的数据有较大的误差,特别是新疆地区的姓氏数据(参见第二章的表2.2b),主要表现在经插值后新疆等地区的值偏高,在下编中的100个大姓遗传地形图上将会有所显示。但作为整体数据是符合设计要求的,其所反映的每一种姓氏的全国分布图形和发展趋势基本上与现状相符,不合理的地方正是我们在今后需要改正的。但在这次绘制中不能轻易地撤去这些点,以免造成整体不平衡,失去统计学的意义。

知识出处

中国姓氏群体遗传和人口分布

《中国姓氏群体遗传和人口分布》

出版者:华东师范大学出版社

本书内容包括:中国姓氏群体遗传(绪论、姓氏分布、遗传地形图、姓氏与血型),当代大姓及其分布规律。

阅读