如何计算置信区间
有网友在看了我以前写的文章《用户体验设计中用到的统计学方法》后,对如何验证结果的误差和置信度感兴趣,希望展开说明。其实我在文章里提到的误差的计算方法,其实就是一个统计学公式。
文章里是提到的问题是:计算样本人群的一个特征数值(百分比)和真实结果之间(百分比)的误差。具体的例子是,一个网站有200万注册用户,随机发给每个用户问卷,征询是否支持某项改进方案,结果收到1500份有效问卷,其中有52%的人支持改进。那么误差范围到底有多少呀?1500分有效的回答到底多大程度上可以代表200万注册用户呢?计算方法请看下面的图片。遇到具体的情况(如计算样本人群的平均值和真实结果平均之间的误差),要换具体的公式。由于最近比较忙先说到这里。

需要说明的是:我在文章里提到的误差,是由于每次采样不同,造成的样本和真实结果之间的误差,并不包括研究人员在设计或者执行研究实验时由于偏见或者失误的误差。
另外,补充两个计算置信区间的在线计算工具,它们在预估可用性测试数据的误差时是比较常用的。
回返,呵呵。有空记得去我那踩踩哦?
猫咪:嘻嘻。
学习了,上次考到用户研究统计方法不会做,,
以后常来跟你学习啊!
精彩博文,顶一下。有空记得去我那踩踩哦?
我喜欢夜晚行动,呵呵。挺有风格的博客,顶一下。
学习了,我只懂得采集数据,分析用户数据还不会,关注你的网站学习,期望经常更新
被点名批评了。:P 最近比较忙,现在11月底了,下个月会增加更新频率的。多谢关注。:)
如何确保这个这个52% 的支持是准确的?只有这么点误差吗?
回答第一个问题:无法确定52%的支持是100%准确,但是可以用以下措施提高准确度。
1.尽量确保被调研的人是你的目标人群
2.在保证第一条的前提下,尽量做到随机抽取样本
3.整理数据时剔除无效数据
4.设计问题和做调研的时候,不要诱导用户
回答第二个问题,引用我在结尾说的话:“我在文章里提到的误差,是由于每次采样不同,造成的样本和真实结果之间的误差,并不包括研究人员在设计或者执行研究实验时由于偏见或者失误的误差。” :)
数学不好的话 唉
补充一下,这个公式是用来计算重复抽样的误差,如果是不重复抽样,公式还是有差别的,http://wiki.mbalib.com/wiki/%E6%8A%BD%E6%A0%B7%E8%AF%AF%E5%B7%AE
什么是重复抽样可以见这里:http://wiki.mbalib.com/wiki/%E4%B8%8D%E9%87%8D%E5%A4%8D%E6%8A%BD%E6%A0%B7
多谢补充~^^
哈哈,有机会找你好好探讨啊
请问 对于200万用户随机发放问卷结果收到1500份结果 这1500份代表200万的有效程度有多大?
也就是说这1500人和200万人的同质性有多大?
如果只发放1500份问卷 返回1500份问卷的话 这样计算应该正确,但是究竟发送了多少份之后收到的这1500份呢?也就是说问卷的回收率有多大?这回收率会对置信区间有多大的影响? 求解答^^