AI内参_157_150_聊一聊谷歌特立独行的混合型研究

你好，我是洪亮杰。

今天我和你分享的主题是聊一聊谷歌特立独行的混合型研究。

上一讲，我们介绍了微软研究院发展早期的一段故事，一起讨论了为什么说微软研究院是工业界研究院的楷模。

今天我们来看另外一种混合型的工业界研究机构模式，聊一聊谷歌研究院一起来讨论。

这种模式是不是更加适合互联网企业的需求。

谷歌的创立比微软晚了将近二十年，但两个公司有一些相似的地方，其中之一就是创始人都是中断了学业，投身到创业的浪潮中。

不过，拉里佩奇和谢尔盖布林当时是在攻读博士学位，不于如何进行网页搜索的。

最初想法是从他们的博士研究课题衍生出来的。

由此可见，谷歌从一开始就和研究类项目有着千丝万缕的联系。

佩奇和布林的论文发表在一九九八年的国际万维网大会上，这篇论文介绍了page rank算法。

在当时，这简直就是一个石破天惊的算法。

那它和当时其他搜索引擎的关键技术相比，独特之处在哪里呢？计算网页的相关度，或者说是重要度，完全不依赖于文本信息。

而仅仅依靠有网页之间关系组成的图，而且能够得到一种非常稳定的排序。

或许就是因为这个独特的算法，让两个斯坦福大学的年轻人放弃了继续攻读博士学位的想法，转身在硅谷找了一个车库，从而演绎了一个传奇的创业故事。

或许就是因为两位创始人的背景，我们可以看到，谷歌对学术界的最新研究成果有一种特殊的青睐。

在谷歌发展的路上，屡屡上演收购案例，收购的很多公司都是因为有一些研究成果而成立的小公司。

举几个例子，同样来自斯坦福的博士毕业生塔哈尔哈威利瓦拉改进了佩置rank算法。

他创办的公司在二零零三年的时候被谷歌收购。

二零一零年，达蒙霍洛维兹和瑟潘达卡姆瓦尔在当时的国际斯坦福大会上发表了一篇社交搜索的论文论文标题都与跟佩奇和布林当年发布的page rank论文有异曲同工之妙。

两个作者所在的公司很快就被谷歌收购了。

最近的例子就是我们都熟知的杰弗利辛顿所创办的公司，以及位于英国的deep met公司，也都是因为在深度学习方面的重要贡献被谷歌先后收购。

尽管谷歌对于学术研究有一种天然的亲近。

然而，在很长一段时间里，谷歌其实并没有真正成立完全独立的基础研究部门。

所以很多学术圈的研究人员还有工业界的研究，同人都对谷歌产生了一种误解。

二零一二年的时候，谷歌的研发总监彼得诺维格发表了一篇文章，来介绍谷歌的研究模式。

谷歌的研究模式到底是怎样的呢？简单来说，就是让研究和产品的研发紧密结合起来，而不完全建立独立运行的研究院。

当然这个模式在收购了deep mat之后，算是被打破了。

但是在谷歌二十年的发展历史上，混合型研究一直是谷歌研发的主流。

诺维格在文章中解释到，谷歌研究工作的一大重要目的，就是为终端用户带来重要的和实际的好处。

很明显，这一目的和纯粹的学术研究有很大的距离。

我们来看微软研究院和雅虎研究院，他们的重要贡献指标，就是学术论文发表的质量和数量。

我们再具体来看看这两种道路的差异。

传统的学术研究是这样的，研究人员首先构想一个学术课题，然后在一种比较受限的环境中，对这个课题进行研究。

这里说的受限的环境，往往是说数据并不是全量数据，而是采样过后的数据。

这些数据在学者们的笔记本或者小型集群中就能进行计算。

甚至在有的情况下，研究人员会使用完全虚拟的数据。

另外，在这种受限的环境中进行研究，还会带来这样一个问题，由于开发的代码和软件不需要重复使用，也不需要开发产生环境的代码，所以这些代码质量都比较低。

那谷歌的研究工作是怎样做的呢？谷歌研究要求从一开始就使用生产环境来编写代码，这些代码和普通的产品代码没有区别，也使用和一般产品线代码相同的数据相同的流程。

这样一旦有了研究成果，就可以无缝接入。

现在的产品线中，这样的要求对于研究者来说，其实是拔高了研究的难度。

但是对于研究成果和产品对接来说，就把困难降低到了最小。

总结一下，让工程和研究结合在一起，并且有意模糊。

这两者的区别就是谷歌混合型研究的核心思想工程师和科学家在同样的项目中工作。

大家都面临同样的限制，所样就可以让研究的课题不至于完全铁马行空，而是能够落到实处。

我们上面介绍了谷歌的研究背景，以及在这种背景基础上慢慢形成的混合型研究模式。

那为什么这条道路在谷歌就能够落地实施呢？我想这里面有一个非常重要的先决条件，就是诺维格的文章里没有提到的那就是大量高素质人才的涌入。

在这些人才中，博士生比比皆是，甚至有很多教授。

所以谷歌的工程团队中有很多博士生担任着普通工程师的角色。

说的通俗一点，谷歌用博士生在干硕士生，甚至是本科生就可以胜任的工作。

这样一个团队中的工程师和科学家并没有本质的区别，这才使得任何一个科研想法都可以很容易的在工程层面得以实现。

由此我们可以看到，从某种意义上来说，谷歌其实并不需要单独的研究机构，四己工程团队的水平就已经非常出色了。

我们从TESORFLW、语言翻译等知名项目就可以看出来，这些项目都是工程团队达到了很高的研究水平。

当然，在这种模式下，谷歌歌基础础研究其实是受限的。

在购购deep mat后，谷歌歌开始依靠这样单独的研发机构来推动和产品结合的不那么紧密的研究方向。

今天我为你介绍了谷歌与众不同的混合型研究模式。

这种模式对工程团队的水平要求比较高，如果没有高水平的工程团队，研究人员和工程师就会产生隔阂，沟通不畅，研发就会有问题。

从这个角度来看，建立单独的研究机构或许更能实现很多公司的初衷。

讲到这里，如果我们要借鉴谷歌的这种混合型模式，你觉得挑战是什么？如果有了高水平工程团队这一保障后，你觉得想要成功，还有什么挑战呢？欢迎你给我留言，和我一起讨论。