【竞赛分享】正大杯第十三届第5期:市场调研应如何进行抽样设计?该选择哪种抽样方法?怎么进行质量控制?如何计算样本容量? | 您所在的位置:网站首页 › 随机抽样样本量计算方法 › 【竞赛分享】正大杯第十三届第5期:市场调研应如何进行抽样设计?该选择哪种抽样方法?怎么进行质量控制?如何计算样本容量? |
抽样步骤抽样概念 抽样:是指从一个较大的群组(范围或总体)的一个子集(样本)获得信息的过程。 设计抽样方案步骤Step1定义同质总体(地域特征、人口统计学特征、使用情况、认知程度等) Step2选择资料收集方法 Step3选择抽样框(总体的数据目录或者单位的名单,从中可以抽出样本单位) Step4选择抽样方法 Step5确定样本容量 Step6制定选择样本单位的操作程序 Step7实施抽样计划 抽样方法依据是否遵循随机原则抽取样本,抽样方法可以分为两类:一类是非概率抽样,一类是概率抽样。选择使用哪种方法主要取决于研究者是否打算对总体进行推断。 非概率抽样一、含义及优缺点 含义:非概率抽样没有严格的定义,其抽取样本方法的一个共同特点是用一种主观的(非随机的)方法从总体中抽取单元。 优点: 1、快速简单 2、费用相对较低 3、不需要任何抽样框 4、非概率抽样对探索性研究和调查的设计开发很有用 缺点: 1、为了对总体进行推断,需要对样本的代表性做很强的假定。 2、由于不可能确定总体单元的入样概率,故不可能得到可靠的估计值以及抽样误差的估计值。 二、非概率抽样方法 1、方便抽样(偶遇抽样): ⑴几乎没有或完全没有计划; ⑵常用方式为“街道拦截”; ⑶优点:简便易行,能及时取得所需信息,省时省力,节约成本 ⑷缺点:易受到调查员的倾向性影响,偏差大 2、志愿者抽样: ⑴适用场景:医学研究中志愿者招聘,活动参与者志愿者招聘,小组座谈或深层访谈人员 ⑵缺点:较大的抽样偏差 3、判断抽样(目的抽样): ⑴适用场景:探索性研究,如抽选参加小组座谈或深层访谈的人员 ⑵局限性:不适用于预调查 4、配额抽样 5、滚雪球抽样: ⑴适用范围:特征稀少的、小的、特殊总体;特定工作群体 ⑵基本步骤:根据研究目的和相关特征找出少数样本单位→通过这些样本单位了解更多的样本单位→……以此类推 ⑶优点:有针对性的找到具有某种特征的被调查者,提高抽样效率 ⑷局限性:样本单位直接必须有一定联系且愿意保持和提供这种关系 概率抽样一、含义及优缺点 1.含义:遵循随机原则从总体中抽选单元组成样本进行调查的方法 2.基本准则: ⑴样本单元按随机原则抽取 ⑵调查总体中的每一个单元都有一定的概率被抽中 ⑶优点:能得到总体的可靠估计值,能计算每个估计值的抽样误差,能对总体进行推断,即用一个相对小的样本,就能对一个大的总体进行推断;节约资源并提高效率 ⑷缺点:较为复杂耗时,成本高 二、概率抽样方法 1.简单随机抽样(纯随机抽样) (1)含义:假设调查总体共有N个单元,从中随机抽取n个单元作为样本,每个单元都有同样的机会被抽中,也即有相同的入样概率,这个概率为P,它等于n/N (2)抽取方法:抽签法或抓阄法、随机数表法、利用SPSS实现简单随机抽样 (3)优点: ①简单直观,比较容易理解和掌握 ②不需要其他辅助信息就能对抽样框进行抽样 ③已建立了成熟的例论,有现成的、易掌握的公式 (4)缺点: ①估计的统计效率较其他利用辅助信息的抽样设计要低 ②采用棉纺调查、费用较高 ③有可能抽到一个不好的随机样本 ④单调费时 2.系统抽样(等距抽样) (1)含义:将研究总体按一定的标志排序后,每隔一定的间隔抽取一个单元直至抽到所需样本量的抽样方法 (2)抽取方法: ①等间隔随机起点抽取样本 ②对称等距抽取样本 (3)优点: ①可代替简单随机抽样 ②不需要辅助的抽样框信息 ③样本分布比较好(具体取决于抽样间隔及名录如何排列) ④有较好的理论支持,估计值容易计算 ⑤比简单随机抽样简单 (4)缺点: ①可能抽样间隔正好碰上总体变化的某种未知周期性,形成系统偏误 ②抽样策略的效率不高 ③不能预先知道最终样本量 ④系统抽样的抽样方差,没有一个无偏的估计量 ⑤在总体大小N不能被样本量n整除且不使用圆形抽样法时,会得到不同样本量大小的样本 3.与单元大小成比例的概率抽样(PPS) ⑴含义:采用抽选的概率与单元规模大小成比例 ⑵抽样方法:随机法(包括随机放回的PPS抽样和随机不放回的PPS抽样)、系统PPS抽样方法、随机系统抽样法 ⑶优点: ①提高了抽样效率 ②显著减少抽样误差 ⑷缺点: ①抽样框中的所有单元,都要有高质量的、能使用大小度量的辅助信息 ②成本高,较为复杂 ③并非适用于任何情况 ④对于与大小变量不相关的调查变量,PPS抽样会导致抽样效率很低 ⑤估计量抽样方差计算复杂 ⑥当单元大小度量不准确或不稳定时PPS抽样不适用(此时最好的办法是将单元按大小分组并使用分层抽样) 4.分层抽样(分类抽样或类型抽样或分层随机抽样) ⑴含义:在抽样之前将总体分层(同质的、互不重叠的若干子总体称为层),然后在每个层中独立地抽取样本 ⑵采用分层抽样的主要理由: ①提高抽样效率 ②需要对子总体进行估计 ③通过分层可以避免得到很差的样本 ⑶优点: ①提高对总体估计值的精度,使抽样效率更高 ②能保证样本对被定义为层的那些子总体的代表性,从而得到有效的域估计 ③操作与管理方便 ④避免得到一个“差的”样本 ⑤在不同的层中可以使用不同的抽样框和不同的抽样方法 ⑷缺点: ①要求抽样框中的所有单元都必须有高质量的、能用于分层的辅助变量 ②成本高 ③如果调查变量与分层变量不相关,抽样效率将大大降低 ④估计值的计算稍为复杂 5.整群抽样 ⑴含义:将总体划分为若干个有联系的基本单元所组成的群,以群为抽样单元抽取样本的方法 ⑵应用整群抽样的原因: ①抽样框对选用抽样方法有影响 ②抽样群能大大降低数据收集的费用 ⑶具体方法: 将总体划分为若干群(群内单元可以相等,也可以不等)→抽选群的样本→调查样本群中的所有单元 ⑷优点: ①费用较低 ②创建自然形成群的名录较容易 ③一定条件下有较高的抽样效率 ⑸缺点: ①若调查变量群内单元有趋同性,则整群抽样的统计效率较低(对此项效率的损失可通过增加群的抽取数量来弥补) ②通常无法提前知道调查总样本量 ③调查的组织比其他方法复杂 ④方差估计较复杂 6.多阶段抽样(多级抽样) ⑴含义:用两个或更多个连续的阶段抽取样本的过程 ⑵方法: ①常规方法 ②阶数的选择 ③多阶段中的抽样方法选择 ⑶优点: ①以调查变量衡量的群特征差异不大时,抽样效率更高 ②样本更集中,采用面访调查的时间和费用都大为降低 ③只要有关于初级抽样单元的好抽样框以及在以后各阶段抽样中有被抽中单元的完整名录即可 ⑷缺点: ①抽样效率:简单随机抽样>多阶段抽样>单阶段整群抽样 ②不能提前知道样本量 ③调查组织较为复杂 ④估计值与抽样方差计算较为复杂 7.多相抽样 ⑴含义:在同一抽样框中,先抽一个含有很多单元的大样本,收集基本的信息,然后在这个大样本中抽一个子样本,收集更详细信息的抽样方法 ⑵使用多相抽样的原因 ①获得分层信息 ②经费有限条件下获得更详细信息 ⑶优点: ①显著提高估计值精度 ②能用来获得抽样框中所没有的辅助信息(特别是分层信息) ⑷缺点: ①调查时间长 ②费用较高 ③调查的组织比较复杂 ④估计值和抽样误差的计算相当复杂 ⑤适用于某些调查指标的数据收集费用特别高,或会给被调查者带来较重负担的情况 误差分析样本结果的准确性受到两种误差的影响:一种是抽样误差,另一种是非抽样误差(测量误差) 抽样误差 1)含义:指所选样本的结果不能完全代表总体而导致的误差。2)分类:随机误差和管理性误差 3)随机误差:由于偶然事件引起,无法避免。可通过增加样本量使之缩小。 4)管理性误差:样本的设计和执行中有缺陷而不是样本不能代表总体,可以避免或使之极小化。 5)可计算性:抽样误差虽然无法避免,但调查人员可以知道抽样误差有多大,并采用适当的方法对其进行控制 非抽样误差1)含义:由于计算的不准确和偏见等原因产生的不同于抽样误差的各种误差。 2)不可计算性:不可能随着样本量的增大而变小。 质量控制市场调研质量控制原则①客观的控制 ②全面的控制 ③超前控制:要求所有调研人员放弃那种在合适出现问题才在何时解决问题的被动控制方式,根据事实和经验对可能出现误差加以预防控制 ④质量控制应适当处理好与其他相关问题的关系 市场调研质量控制步骤①确定控制点(质量控制点是指影响调查完成的要害问题及其所在的环节)和控制标准(质量控制标准是反映质量控制点的各种误差标准,它是控制的依据,通常采用能容许的最高误差控制率) ②对调查过程进行检查 ③对误差进行纠正 市场调研质量控制的具体实施结合质量控制的原则,遵循质量控制的步骤在调查的不同阶段实施质量控制 ①调查前的质量控制 ②调查中的质量控制 (1)文献调查法 (2)抽样调查法:应遵循随机原则,并对抽样误差进行控制。现常用的抽样原则除在培训中有特别的规定外,通常有按照“右手原则”和“隔十抽一”原则进行(补充:图片) (3)访问调查法 相关因素:问卷的质量、访问员的访问技能 ③调查后的质量控制:主要对调查所得的资料进行整理和质量验收 (1)调查问卷的登记与编码 (2)数据录入的质量控制: 预值控制法:对于需要录入的一些编码和指标数据,事先规定一定的控制范围值,并编入程序。 平衡检测法:在调查问卷中设置平衡项,平衡项就是把报表中各项指标的数值相加作为平衡项。如果录入的平衡项数值与电脑计算的数值相同,则说明录入无误差,如果数据不等,电脑作出显示,录入人员可及时查找原因进行纠正,对于那些超过标准的要退回检查。 样本容量的计算概率抽样中样本容量的确定①可支配预算:某一研究对象的样本容量通常是确定的,至少也会间接地受到可支配预算的限制。 ②经验法则:一些客户会在征求建议书中要求样本容量,这个数据的确定有时候是出于对抽样误差的考虑,而有时则只是依据以往的经验。如果调研人员确定要求地样本容量不能充分支持调研计划的目标,这时他们就有职责向客户提出夸大样本容量的建议,并让客户做出最后地决定。 ③拟分析的“子群数”:在其他条件不变的条件下,要分析的子群数目越多,样本容量也就越大。 ④传统的统计方法 对样本结果进行必要的估计时需要三条信息:总体标准差的估计值、抽样的允许误差范围、抽样结果在实际总体值的特定范围内(抽样结果+-抽样误差)的允许置信水平。 样本容量的确定①平均数问题 对于估计平均数问题,计算其所需要的样本容量的公式是 (计算中要用到的置信水平和允许误差E必须由调研人员与客户进行磋商后才能确定)②定性调研下的样本容量 由于定性调研中使用的样本容量较小,我们上面所讨论的计算样本容量计算方法没有办法解决这个问题。专家根据经验给出建议:考虑到一个小组异常不具代表性的可能性比较大,一个建议是每个话题要有两个及以上的小组,另一指导方针则是一直采样,直到达到饱和,即受访者不再出现新观点为止。 ③总体容量和样本容量 通常总体容量与在一定误差和置信水平范围内估计总体参数所需要的样本容量之间没有直接点关系。实际上,只有样本容量相对它而言过大时才会起作用。根据经验,当样本容量超过总体的5%时,就需要调整样本容量了。 当样本容量占总体5%以上,调研人员可以通过FPC(优先总体修正系数)来减少所需的样本容量。计算公式如下: 问题关键不是样本容量大小与总量大小的关系,而是选取的样本是否能真实代表总体的特征。 样本代表性1.含义: 样本代表性又称样本的外在效度。抽样调查中所选择样本的有效性,即样本能够代表总体的程度,是影响抽样调查结果准确与否的一个重要因素。根据随机原则抽选的样本估算总体,存在代表性误差叫抽样误差。误差大,样本的代表性小,反之样本的代表性就大。 2.意义: 样本代表性误差取决于总体各单位的差异程度和样本容量大小以及抽样组织方式,并可以精确地计算出误差范围和通过抽样程序加以控制。由于多数抽样调查要求反映一种趋势,要求不十分严格,同时受到人力、资金、时间限制,这样严格的抽样设计,提高样本代表性的样本检定就变得更为重要 3.如何保证代表性: 1)按随机的原则抽取,在总体中每一个单位被抽取的机会均等,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强; 2)以抽取的全部样本单位作为一个代表团,用整个代表团来代表总体,而不是用随意挑选的个别单位代表总体; 3)所抽选的调查样本数量,根据调查误差的要求,经过科学的计算确定,在调查样本的数量上有可靠的保证; 4)抽样调查的误差,在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,提高调查结果的准确程度。 4.影响样本对总体代表性的因素: (1)总体本身的离散性 (2)所抽取样本容量的大小 (3)抽样方法 往期推荐【竞赛信息】正大杯第十三届第1期:市场调研如何选题? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/597488605 【竞赛信息】正大杯第十三届第2期:问卷设计要掌握哪些要领? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/598555205 【竞赛信息】正大杯第十三届第3期:市场调研的深度访谈要怎么做? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/600119601 【竞赛信息】正大杯第十三届第4期:市场调研焦点小组访谈要怎么做?与深度访谈有何异同? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/609844294 点击连接关注赛否公众号,解锁更多竞赛信息和资料哦~ https://mp.weixin.qq.com/cgi-bin/settingpage?t=setting/index&action=index&token=931691823&lang=zh_CN&token=931691823&lang=zh_CN |
CopyRight 2018-2019 实验室设备网 版权所有 |