冗余度是什么意思?

上周有个客人问我,说他们公司数据库里的数据重复太多,不知道怎么解决。
我就跟他说,这个问题其实就是信息冗余度的问题。
简单来说,就是他们存储了不需要重复的信息。

我举个例子,比如一家公司的员工信息,可能每个部门都有一个员工表,而员工表里有些信息是重复的,比如员工的姓名、身份证号等。
这种情况下,数据冗余度就很高。

在计算机科学里,这会导致几个问题。
首先,存储空间被浪费了。
比如,如果公司有1 000个员工,每个员工信息重复存储三次,那实际上就需要3 000个员工信息占用的存储空间。
其次,更新数据时也变得复杂,因为你要确保所有重复的数据都同步更新。

通信系统里,冗余度是提高通信质量的一种手段。
比如,发送数据时会加入一些校验码,这样接收方就能检测并纠正错误。

生物学里,冗余度体现在生物体的设计上。
比如,人体有两个肾脏,一个肾脏出现问题,另一个还能工作,这样提高了生存率。

所以,你看,冗余度这个概念在各个领域都有应用。
但是,它也有两面性。
用得好,可以提高效率和可靠性;用得不好,就是资源浪费。
我建议他先分析一下他们公司的数据,看看哪些信息是重复的,然后根据实际情况来决定如何优化。
反正你看着办,我觉得这个事情还是得具体问题具体分析。
我还在想这个问题,看看还有没有更好的解决方案。

数据库的冗余度越小越好么

数据冗余度小,独立性和可扩展性高。

别这么干,数据冗余会导致更新异常和存储浪费。

什么是冗余率?

哎哟喂,你这说的也太绕了吧... 听得我头都大了。

冗余率啊... 简单说就是数据里头重复的东西多不多。
就像你发微信消息,有时候一个字复制粘贴好几次,这就是冗余。

你后面说的那个公式R=1 -(Q/mn)... 我没太看懂,数学不是我的强项哈。
不过我懂你说的意思,就是在一个表格里头,如果这一列的数据跟那一列的数据经常是一样的,或者这一行的数据跟下一行的数据经常是一样的,那这个表格就有冗余。

比如啊,你有个客户表,里面有“客户姓名”和“客户电话”。
如果很多客户名字都叫“张三”,但是他们的电话都不同,那“客户姓名”这一列就有冗余。
因为只要知道“张三”这个客户,你就能查到他的电话,没必要重复存一遍。

我之前在做一个项目,就是处理一个特别大的数据库,里面全是重复数据。
搞得我电脑CPU直冒烟,内存都快烧了。
后来我们改了设计,把重复的数据都去重了,一下子处理速度就快了好多。

所以你看,冗余率这个玩意儿,有时候是好事(比如像你说的提高抗干扰能力),有时候就是累赘(比如浪费存储空间和计算资源)。
关键得看用在什么地方。
反正你看着办吧。