数据分析用什么数据库

EXCEL和MySQL在数据分析中的对比

结论:Excel适合轻量、易用,而MySQL适合优化,需要扩展。

操作简单,Excel方便,MySQL更专业。

Excel 对于小数据量速度很快,而 MySQL 对于大数据量稳定。

存储 Excel 文件并管理 MySQL 数据库。

Excel计算简单,MySQL逻辑深刻。

Excel链接灵活,MySQL链接严格。

Excel的性能有限,而MySQL的性能充足。

数据分析常用的数据库知识

对数据库的了解是数据分析的基础。

创建 DDL 表。
例如,MySQL 创建一个学生表,主键为 Student_id。

DML 的添加、删除和更改。
例如,INSERT INTO 表名(字段) VALUES(值)。

DCL权限管理。
例如,GRANT SELECT ON 表名 TO 用户。

DQL 查询。
例如,SELECT FROM 表名 WHERE 子句。

Hive导入数据时使用本地传入路径加载数据。

MySQL使用CREATE TABLE来创建表。

SELECT 查询顺序:FROM->WHERE->GROUP BY->HAVING->SELECT->ORDER BY->LIMIT。

优化首先使用WHERE来过滤数据。

WHERE支持=、>、<、LIKE等。

查询IN时,先放一个小表。

ABS具有绝对值。
ROUND 是圆形的。

CONCAT 连接字符串。
SUBSTR 截取子字符串。

CURDATE 当前日期。
DATE_ADD 添加日期。

最大值 MAX。
最小值 MIN.平均AVG值。

COUNT 计数。
排名评级。

Join 用于相关查询。
左加入。

MySQL8 .0的安全导入,设置路径。

数据仓库分为ODS、DW和DM级别。

ODS 原始数据级别。
DW 数据仓库层。

DM 数据集市级别。

数据分析中的数据是什么?

简单来说,数据分析中的数据是信息的载体。
它记录了客观事物的符号,有不同的类型,是在不同的活动中产生的。
其实很简单。
数据可分为连续型、层次型和子类型,按显示方式可分为结构化数据和非结构化数据。

首先,我们来谈谈最重要的事情:身高、体重等连续数据,优秀、良好、平均等分层数据,以及晴天、阴天、雨天等分类数据。
一开始我以为只有连续数据才有用,后来发现层次数据和分类数据在市场分析、用户分类等方面同样重要。

还有一点:数据的展示方式也很关键。
结构化数据是数字和符号的组合,比如:B.分数、金额等,而非结构化数据则包括文本、图像、音频、视频等。
等等,还有别的。
产生的数据量是巨大的。
例如,全球每天有 5 0 亿次在线搜索,一辆特斯拉汽车每天产生 4 TB 数据。

这实际上很混乱。
很多人不重视数据的价值。
热数据、暖数据和冷数据具有不同的值。
热数据是实时动态的。
暖数据有一定的近期性,而冷数据变化不大,但具有较高的长期价值。

我认为值得尝试的一个方法是在收集和存储数据时考虑数据的温度属性和距离属性。
例如,在存储选择时,应尽量选择离自己较近的温数据进行存储。
这样可以节省成本并提高数据分析的效率。

总之,数据分析中的数据是多种多样的,对其的理解和分类对于提高数据分析的准确性和效率至关重要。