AI内参_146_139_成为香饽饽的数据科学家如何衡量他们的工作呢

你好，我是洪亮杰。

今天我和你分享的主题是成为香饽饽的数据科学家。

如何衡量他们的工作呢？本周我们聊了在构建一个数据科学家团队时，从筛选简历入手，到电话评试，再到on set面试这一系列的流程从无到有。

建立一个数据科学家或者人工智能团队，的确是一件煞费苦心的事情。

那么今天我们来聊一聊数据科学家团队管理的下一个重要的步骤。

那就是如何来衡量数据科学家或者人工智能工程师在团队中的业绩，有时候也被称为是绩效评定。

绩效评定的种种规则，必须在团队建立的初期就明确，否则就会出现一些不定因素。

对于招聘培训以及留住人才都有着不可估量的影响。

如何对数据科学家团队进行绩效评定呢？这个问题的核心其实是要回答数据科学家或者人工智能工程师究竟应该为你的公司或者组织带来什么核心价值。

只有梳理清楚这个核心问题，才能真正建立起衡量数据科学家团队的价值体系，从而达到为公司和组织赋能的目的。

那么数据科学家团队或者人工智能工程师团队应该为企业或组织带来什么样的价值呢？对于这类相对来说比较抽象的问题，其实很难有一个标准答案。

每一个组织或者公司都有自己的一套衡量价值的方式。

这里我们并不追求一个统一的答案，而是希望能够为这个问题提供一些参考。

那于这个问题在我们前面的一些分享中，其实已经提到过，那就是数据科学团队最重要的一部分。

价值来自于为企业或者团队引入数据驱动的决策过程。

这是数据科学团队或者人工智能团队的一个核心价值。

很多企业或者组织在没有这些团队之前，是无法真正做到数据驱动持续决策的。

也就是说，数据驱动和持续决策，这两点可以看作是数据科学家团队的主要价值体现。

那么怎么衡量数据科学家团队这个问题也就变成了如何来衡量这些团队在围绕这两个方面的工作中做的怎么样。

注意，我在这里其实并没有明确提及数据科学团队和人工智能团队对产品直接带来的效果。

比如点击率升高了多少，用户存留增加了多少，什么产品又上线了等等，主要是出于以下两点考虑。

第一，每一个公司、每一个组织，甚至是每一个产品在这些价值上都有不一样的需求，没有一个统一的模式。

第二，如果数据科学团队为组织建立起了数据驱动的持续决策过程，那么很多产品级别的性能提高或者核心功能的实现，就会成为顺理成章、水到渠成的结果。

相反，如果仅仅强调某一个产品性能的提升，或者某一个单点技术的突破，很可能无法真正建立有效的人工智能团队，并且团队的战斗力也无法真正得到最大程度的发挥。

刚才我们从一个比较大的概念上做了一个讨论，看数据科学家团队的价值应该如何来评价。

但在实际操作中，往往存在两种比较明显的误区。

第一种误区是为技术论，那就是觉得人工智能团队能够快速帮助公司组织，甚至是项目很快打开突破口。

希望人工智能技术能够给公司业务带来突破性的发展，从而对人工智能团队有过高的预期。

在这种思路的指导下，往往可能在前期有一个比较大的热情，能够招聘到不少的人才，或者能够拉起团队开始一些不错的项目。

但很快，由于急功近利的心态和不切实际的需求，常常又让人工智能团队深陷绝境。

而这个时候最容易产生的一种情绪是走另外一个极端，那就是从为技术论到技术无用论。

在这样的背景下，产品遇到的任何困难、任何失败都有可能归因到人工智能团队上。

第二种误区是对人工智能、团队或者数据科学家、团队心存怀疑，本质上觉得这些团队都无法真正能够帮助到团队。

因此从一开始就不信任这些团队，蹑手蹑脚在政策和发展上限制这些团队。

由于这种不信任，使得人工智能团队不能真正发挥作用，因此催生了进一步的不信任恶性循环。

最终得出这样的结论，人工智能是花瓶没有用。

这两种误区的核心其实是一种行为，那就是忽略了人工智能团队需要一个生态环境。

什么生态环境呢？比如产品部门、数据部门以及其他的工程部门必须协调发展。

绝大多数数据科学团队和人工智能团队都需要依赖一个比较强有力的数据部门的支持。

同时产品上如果人工智能的算法或者模型并不能和产品有一个有机的结合，那无论如何都是无法真正帮助产品为产品赋能的。

我们之前也提过，其实在很多时候，人工智能都是锦上添花的部分，而产品的整体呈现才是最为重要，最需要认真思考的问题。

有了前面这些思路作为基础。

我们现在来看一看数据科学家的评定的问题。

我主要从下面三个方面来讲，第一，对于数据科学家或者人工智能工程师来说，我们需要看他们是否对于建立完善和推动数据驱动的持续决策这一长期任务有不间断的贡献。

具体来说，那就是数据科学家或者工程师是不是在帮助建立和推动数据驱动的链路，是不是在思考如何能够更快更好的解决数据的问题。

这里的数据包括获取数据、整理数据分析数据以及利用数据的持个决程。

我们的数据科学家或者人工智能工程师应该持续在这几个方面有所贡献。

你可能会有疑问，这不是数据工程师的责任吗？没错，这确实是数据工程师的职责。

但是，如果我们的科学家并不清楚数据的情况，并不了解如何进一步推动数据链路的进步，那产品线将来肯定会出问题。

同理，数据科学家也需要在帮助持续决策上不断做出贡献。

这里主要指的是实验的平台，以及围绕着实验平台进行决策的工具，比如图表，比如更加复杂的假设检验工具，比如因果推断的工具等等。

数据科学家和人工智能工程师必须要具备这样的敏感度。

第二，那就是考察数据科学家和人工智能工程师本身的职责和专长。

针对某一个产品能否提出切实可行的机器学习解决方案，能否和产品部门以及其他工程部门本身让解决方案落地这一点检验的就是解决方案的落地能力。

当然，这里不仅仅依赖于解决方案，本身还依赖于其他的因素，比如数据，比如产品。

这里面有一部分是第一点的内容，主要是评定数据。

科学家或者人工智能工程师对于跨部门合作以及共同构建一个人工智能生态系统的能力。

这一条的重点是评定在一个较小工围内落地解决方案的能力。

第三，那就是数据。

科学家和人工智能工程师必须能够不断提高自我修养，能够持续学习不断进步。

这一点可能是在所有的工程团队和产品团队里面都比较突出的。

虽然所有的团队都需要不断进步，然而人工智能这个领域实在是变化太快。

因此，在这个方面，人工智能相关的工作都必须要有比较不一样的评价标准。

在一些企业中，数据科学家的持续学习主要体现为参加会议、发表论文、参与学术讨论、发表开源软件等形式。

如果在一些初创公司或者是暂时没有这些能力的组织中，我们也要思考如何来评价员工，是不是在积极的持续学习。

今天我们分析了组建一个数据科学家或人工智能团队后，你怎样来认识这个团队的价值，怎么来评价员工的工作，简单的做一个总结。

第一，我们讲了数据科学家团队对于推动数据驱动持续决策这一目标的作用。

第二，我们梳理了面对人工智能团队上可能存在的两个误区。

第三，我们简单聊了聊如何在大的方面来评定数据科学家的工作。

希望这些内容能给你带来一些启发和借鉴。

最后给你留一个思考题，需不需要把人工智能团队的工作和企业的KPI挂钩呢？如果需要该怎么挂？如果你觉得不需要，又是什么理由呢？欢迎你给我留言，和我一起讨论。