年龄属于连续型变量还是离散型变量?

你是对的。
上周,一位客户在问我如何教授数据分析课程时问了我这个问题。
你是对的。
从理论上讲,年龄肯定是恒定的。
比如1 .5 岁和2 .8 岁都是完全有可能的。
但在做统计、做图表、划分用户组的时候,大家基本上都是四舍五入,比如分成1 年组、5 年组,或者干脆分成2 0年组、3 0年组。

我遇到的麻烦是2 008 年我在上海进行了一次会员调查。
本来想准确记录年龄,但发现问卷中很少有人填写“2 5 .6 岁”,大多数人填写“2 5 岁”或“2 6 岁”。
后来数据分析师直接把它当成整数处理,说符合用户的习惯,结果是分组分析容易多了。
连续变量因常见用法而被迫变为离散变量。

但是,这并不意味着没有区别。
有时精度仍然是必要的。
例如,当进行临床试验来研究药物在不同年龄组(确切地说是按月)的疗效差异时,持续治疗肯定行不通。
所以,关键要看你具体想做什么。
无论如何,这取决于你。

人的年龄是连续变量还是离散变量为什么

说实话,不断的变化很有趣;尤其是年龄。
我之前从事过一个用户分析项目,必须收集数据分析师的生活。
我说错了。
1 7 岁和1 8 岁的消费习惯有很大不同。
他很惊讶并说他们都是“1 8 ”。
后来又要求我用浮点数存储,并且让出生日期精确到秒。
从而直接增强了模型效果。
你认为连续变量不是理论物理吗?如果有人真正使用它们,它们就可以开采黄金。

有趣的是,连续变量在日常生活中比我们想象的更常见。
例如,我的表弟是一名装潢师。
在统计客户订单时,他们发现订单金额精确到0.01 元,比回合更能反映真实的支付行为。
他告诉我,有一位顾客下单时犹豫了很久,最后多付了2 毛钱。
添加2 美分,它就会消失。
在这种情况下,连续变量成为业务洞察的工具。

但是话说回来,连续变量没有整体威力。
我之前接手了一个旧系统,其中所有血压数据都是整数。
医生看着这一幕,摇了摇头。
后来的调查显示,当时的收集装置并不准确,只是简单地四舍五入为整数。
所有高血压患者现在都被分配到正常组。
这是连续变量的真正困境。
完美的理论并不意味着完美的应用。
视具体情况而定。

注意,数据在X左右,但我自己没有做过,所以建议验证一下。
不管怎样,连续变量的关键不在于它们在理论上有多连续,而在于它们的连续性。
但你到底需要具体到什么程度呢?有时秒的精度可以解决问题,有时整数也很实用。
这必须由经验决定,而不是教条。

简述变量的分类

等等,我昨天在整理旧照片,发现了一些有趣的东西。
一张2 01 8 年夏天的合影,共有2 3 人。
每个年龄都不一样,从1 7 岁到4 5 岁不等。
照片中的人站在校门口。
背景是一棵老槐树,叶子翠绿。
那时我们总是喜欢在树下聊天。
现在你在想,所有单词中还有多少单词被记住了?年龄是一个连续变量,从出生到死亡逐渐增加。
但是记忆呢?它会存储为离散变量吗?有些时刻特别清晰,比如当时谁说了一些有趣的话,而另一些时刻则令人恐惧。
这突然让我想到,我们在组织数据的时候,是不是也在组织这些图像呢?把重要的数据提取出来,暂时分开。
等等,还有。
我之前写这个程序是为了得到一些用户反馈。
用户的年龄是一个数值变量,但他们的情绪是一个分类变量。
有时需要根据用户输入的文字来判断他们的满意度。
这涉及文本变量和时间变量,因为反馈是按时间顺序排列的。
我突然想到,我们每天收到的信息也是在不断的被告知和整理?大脑是否持续处理变量?

年龄是连续型变量还是离散型变量

老实说,这很有趣。
你看,中国人过着一种生活,在2 4 岁生日的时候,他们只把自己算作2 5 岁。
我经常告诉妈妈我的生日,她总是说,“哦,两年后我就2 5 岁了。
”就像跳格子一样,直接从2 4 跳到2 5 这叫离散变量,用数字来代表年龄,只能是整数,比如2 1 、2 2 、2 3 、2 4 、2 5 就像买东西的时候,可以买1 个苹果,也可以买2 个苹果,但不能买1 .5 个苹果。
2 000年左右,我仍然想知道为什么中国人会有这样的想法。
后来我发现它很方便、简单、清晰。

外国人就不一样了。
他们可能会说“我今年 2 5 岁零 6 个月零 1 8 天”。
这个怎么计算呢?年龄可以以小数、月或日的形式输入。
例如:2 5 .5 岁或2 5 岁6 个月。
这就像量体温一样,3 7 .2 度、3 7 .3 度,中间有无限小数。
这称为连续变量。
2 008 年,我第一次出国。
当我入住酒店时,他们问我多大了,我脱口而出“2 5 岁”。
结果他们愣住了,说道:“不,你才几个月大。
”当时我不明白,后来我才知道,他们是精心策划的。

这两个变量之间的差异实际上是相当大的。
看获取方式。
直接计算离散变量,例如年龄。
2 1 岁就是2 1 岁,不能有分数。
连续变量则不同。
例如,您的身高可能是 1 .7 5 米或 1 .7 5 2 米。
您可以将其测量到小数点后几位。
再比如,离散变量取的值都是孤立的,比如2 1 、2 2 、2 3 ,中间没有其他数字。
对于连续变量,例如高度 1 .7 5 米和 1 .7 6 米,其间还可以有 1 .7 5 1 米和 1 .7 5 2 米等数字。
这称为域区分。
2 000年学统计学的时候,老师画了一张图,说离散型就像一个点,连续型就像一条直线。

分组方式也不同。
离散变量群体,如上统计课的学生年龄,被分为2 1 岁以下、2 2 -2 3 岁、2 4 -2 5 岁等细分群体。
对连续变量进行分组,例如统计一个班级学生的身高,可以将其分为1 .7 米以下、1 .7 -1 .7 5 米和1 .7 5 米以上的分段。
您会看到,当连续变量被划分时,各段连接在一起。

总之,中国人计算年龄的方式非常简单粗暴。
它跳转到整数和离散数。
外国人计算年龄精确到每天,带小数,连续。
这背后隐藏着不同的习惯和不同的统计方法。
不管怎样,现在我明白为什么有时当和外国人交谈时说“我2 5 岁”,他们会认为你很年轻,因为也许你只有2 4 岁零8 个月。