统计学离散型变量和连续型变量有什么区别?

哎,这玩意儿说起来简单,做起来真容易踩坑。
我跟你说个事儿,去年我在帮一个哥们儿做市场调研,他非要我把客户购买次数按天统计,做成连续型变量。
我说这不对啊,买几次是能数清楚的,是离散的。
他愣是没听进去,结果数据一分析,完全歪了。
你看,人口数这种就是离散的,你总不能说有1 2 3 .4 5 个人吧?一天温度这种是连续的,理论上可以从零下一度一直变到五十度,中间无数个数都能取。

我之前在厂里做质检,测量零件尺寸,那肯定是连续型变量。
你得用卡尺,量出来可能是9 .8 毫米,也可能是9 .9 毫米,差那么零点几都有意义。
要是统计工人每天生产了多少个零件,那就是离散型。
一天造了1 2 0个,明天可能就1 1 5 个,这能连续着数吗?不能。

所以啊,你看清楚数据是什么类型的再下手,别想当然。
用错方法,结果就是一锅粥。
连续的用离散的方法,离散的用连续的方法,那肯定不对。
我给你说,这事儿没得商量,得看准了再动手。

什么是离散变量和连续变量?

上周有个客人问我,什么是离散变量和连续变量啊?我给他解释了一下。
首先,离散变量就像你数数一样,只能取整数,比如投掷硬币,结果只能是正面或反面,不能是半面。
这就是离散变量,它有固定的几个值。

然后,连续变量就像是身高、体重这样的,可以取任意的小数值,就像你在尺子上量身高,可以是1 .7 5 米,也可以是1 .7 5 1 米,甚至更精确。
这就是连续变量。

接着,离散变量的值是可以数的,比如1 ,2 ,3 ,4 ,而连续变量的值是无限的,你可以在1 和2 之间取任意一个数。
描述它们的方法也不同,离散变量用频数和频率,连续变量用均值和标准差。

最后,分析它们的方法也不同,离散变量用条形图、饼图,连续变量用直方图、折线图。
总之,离散变量和连续变量虽然都是变量,但是它们在数据分析和建模时要用不同的方法来处理。
反正你看着办,根据你的数据类型来选择合适的分析方法吧。
我还在想这个问题,感觉挺有意思的。

统计学离散型变量和连续型变量有什么区别?

连续变量是像身高这样的数值可以无限分割的,离散变量像企业数量这样的只能整数计数。

连续变量如身高,可以精确到0.01 米,离散变量如企业数,只能是个位数。

离散变量分组,人数少用单项,人多用区间。
如1 0人以下用单项,1 00人以上用区间。

离散变量概率分布,常见二项、泊松。
你自己掂量。