六星源课堂:SQL和Python比起来,哪个更容易学?

sql和python有什么区别?

数据分析工具excel、powerbi、python、sql、r…哪一个更

说白了,选择数据分析工具就像选择菜刀。
Python是万事通,SQL是厨房必备工具,Excel是必备的家庭工具,PowerBI是海报绘制大师,R是科学研究工具。

首先,我们来谈谈Python中最重要的几点。
去年开展的电商项目数据量达到3 000万条。
使用 Pandas 进行清理和特征工程可以节省两周的人力。
Scikit-learn 仅用了一天时间就调整了模型并将其上线。
但说实话,这很棘手。
初学者很容易对环境配置和包依赖性感到沮丧。

还有一点需要注意的是,去年我们用SQL重建数据仓库时,由于动态SQL脚本,我们的ETL效率从8 小时变成了2 小时。
使用嵌套WITH语句编写的子查询比临时表快3 0%以上。
但是等等,还有别的事情。
如今,许多 NoSQL 查询比 SQL 更快。
这取决于场景。

一开始我以为PowerBI只是画饼图,但后来发现我错了。
他们实现了动态仪表板连接过滤,直接节省了 1 0 名报告编写者与 1 个销售板的工作量。
然而,很多人并没有注意到这一点。
PowerBI 的内存管理很差,您不应该直接链接数百万行数据。

还有另一个重要的细节。
去年R语言合作基因测序时,Bioconductor包直接解决了8 0%的基因问题,但感觉就像在玩命令行,初学者花了一周时间才上手。

首先查看数据量是个好主意。
对于少量数据使用 Excel 或 PowerBI,对于大量数据使用 Python/R 和 SQL。
但我认为 R 值得一试。
对于某些统计模型来说它比Python快1 00倍,但是打包时你必须要有耐心。