Data Scientist vs. Data Engineer vs. Statistician

数据科学家、数据工程师以及统计学家的相似点和不同点

Posted by Paradise on February 20, 2022

简介

  • Data Scientist:使用相应技术,提取数据价值;
  • Data Engineer:确保服务端和客户端的数据流不会中断;
  • Statistician:理解统计学理论,并应用到实际问题。

工作职责

  • Data Scientist:
    • 根据业务需求计划开发数据分析项目
    • 贡献数据挖掘架构、建模标准、分析报告、以及数据分析方法论
    • 将数据挖掘结果集成到现有系统
    • 监测数据挖掘系统性能,提升系统的效率
  • Data Engineer:
    • 设计、构造、安装、测试以及维护高度量化的数据管理系统
    • 优化数据基础程序和参考标准
    • 在现有架构中集成新的数据管理技术和软件工具
    • 开发定制软件组件以及分析应用
  • Statistician:
    • 应用统计理论解决不同产业中的实际问题
    • 设计数据获取方法
    • 设计调查和实验收集数据
    • 分析、解析、以及实施数据分析
    • 报告分析结果

技能要求

  • Data Scientist:编程、数理、业务理解、统计学、数据可视化、机器学习
  • Data Engineer:数据库设计、产品编码、数据采集、数据仓库、数据转换
  • Statistician:技术分析技能、数理、实施调查、写作、分析建模解析数据、以简单形式解析复杂概念

工具

  • Data Scientist:Python、R、SPSS、Matlab、Julia、Spark、Tableau
  • Data Engineer:MapReduce、PHP、Spark、MongoDB、js、SQL、Oracle、Apache、HBase
  • Statistician:R、Matlab、Excel(还有些没见过[尴尬])

书籍推荐

  • Data Scientist: R Cookbook, Machine Learning, Python for Data Analysis, Agile Data Science (O’REILLY)
  • Data Engineer: The Second Machine Age, The Human Face of Big Data, Data Smart, Dataclysm
  • Statistician: The Elements of Statistical Leanring

其他

数据分析技能地图 | 提取码:asoa

其余还有工资水平、入门项目、职业路径、招聘公司等方面的对比,详见下图: