邮箱:mscds@cuhk.edu.cn    中文 | EN

返回上一页首页 > 新闻资讯

活动回顾 | 业界讲座 - 字节跳动

2021-09-16 阅读:479

主讲人:Mark 老师

本科 - 中国人民大学

博士 - 美国德克萨斯农工大学

目前就职于 - 字节跳动 广告业务方向数据科学家


Part 1. 关于数据科学

数据科学是一个研究领域,涉及通过使用各种科学方法、算法和过程从大量数据中提取见解;是一个跨科学领域,允许从结构化或非结构化数据中提取知识,帮助人们从原始数据中发现隐藏的模式。随着社会的不断发展,对能够有效利用、处理、分析并深入剖析大数据的专业人才的需求正快速增长。因此,数据科学已在商业、自然科学、生命与医疗科学,以及其他科研领域受到广泛的关注。



Part 2. 关于因果判断

【 相关 ≠ 因果 】

基于相关的推断能帮助你做出准确度很高的预测,但不能直接指导决策;而因果关系可以用来指导业务决策!在实践中,数据分析师的很多工作都是辅助决策。而且不止数据分析师,凡是需要从数据中得到结论的工作者,都经常需要超越简单的相关关系,去努力搞清楚事物之间的因果联系,这样才能做出高质量的决策。


因果关系试图回答的是 what-if 的问题。即假如其他一切不变,只改变 X,如果 Y 的取值发生了改变,则认为 X-Y 有因果关系,更准确地说是 X 导致了 Y。


而如何从数据中识别因果关系,如何应用我们对业务的理解来得到准确的结论。则可以用 DAG (Directed Acyclic Graph-有向无环图) 把假设可视化呈现。而这其中会影响我们得到正确因果关系的大敌对有两种

- 混杂偏差 (Confounding Bias): Common Cause

- 选择偏差 (Selection Bias): Conditioning on Common Effects



Part 3. 行业经验分享

(1)作为字节商业化部门的Data scientist,平时一定会对接一些数据产品经理、商业化产品经理,因为之后的规划是往PM方向发展,所以您对一个好的产品会有哪些期待呢

  • 要有责任心。对于所做的业务有较强的责任心,能够为产品细节负责;
  • 具备一定的项目管理能力,能够协调好开发、数据科学、市场等资源,排列组合,推动需求落地;
  • 数据敏感度。对于业务要有较好的数据敏感度,用数据来驱动业务发展。


(2)在工作中,面对有些不合理的需求,如何据理力争?

就事论事。首先要对齐业务目标,双方一定要做好正确的假设,然后针对实现路径上的问题,客观合理的讨论。



Part 4. 总结

数据科学在学习的过程中,可以多去想想自己未来的职业规划。数据科学的职业一般可以分为两大方向,一种是对某一板块工作经验的不断积累和实践,在某个业务领域中的商业板块下发展成为很好的带领者;另一种则是需要掌握更高的专业性知识,懂得如何更好的去设计实验,例如面对控制成本时是否可以利用非实验的方法,用其他更多迭代的方式或方法等。


关于我们