你不该错过的计算机会议

2017-11-01 08:28:00 oilbeater 我的观点

这个会议不是 InfoQ 那种技术会议或者各种技术团体的 Meetup,而是计算机学术领域的会议,也就是全是论文的会议 —— SOSP (Symposium on Operating Systems Principles), 你可能会觉得自己又不是搞学术的,没事看论文干什么(如果你是搞学术的应该早就知道这个会议的量级了),我就来简单介绍一下这个会议的论文,为啥搞 IT 技术的都该去看看,看完后你会发现这个会议真的离你很近。


第一届 SOSP 在 1967 年举办,主要是操作系统领域的会议,算是计算机领域历史相当悠久的会议了,并且每两年才开一次,不像现在很多水会一个季度开一次,过分的期刊可能一个月就一次。 SOSP 每次大概不到 10 个 session,每个 session 只有 3 到 4 篇论文甚至更少,每两年也就二三十篇的录取量。对比下来,现在大热的机器学习,人工智能领域顶级会议可能一年都会录上百篇。由于 session 开的少,录取量又特别少,基本上 SOSP 只要开一个 session 这个领域内这两年里最好的论文都会投这个会议。尽管 SOSP 最早是作为操作系统的会议,但他只要开软工,安全,分布式相关的 session,尽管这些方向都有各自的顶级会议但是各自方向最好的工作都会保留到这个会议上发表。甚至 SOSP 几乎不涉及的机器学习和人工智能,只要开这个方向,那么肯定也是当年最好的论文。因此在这个会议上汇聚了计算机各个领域最好的工作,很多工作都对之后的学术界以及工业界产生了翻天覆地的影响,开创了一个又一个火热的产业。


由于录取量实在太少于是 94 年又开了新的一个会议 OSDI(Operating Systems Design and Implementation) 和 SOSP 性质基本一样,都是以操作系统起家的顶级会议,都是以录取难文明于圈内,而且评审和能参加这两个会的基本都是一拨人,唯一的区别就是一个在奇数年开,一个在偶数年开,所以基本大家也把他们看成是一样的。下面我会列举一下这两个会议的工作,也都以 SOSP 代称了,让你看一下有哪些你已经习以为常的东西其实是源于这个会议。


MapReduce, GFS, Bigtable : 这是 Google 的老三篇了,也可以说是名气最大的几篇,全部出于这个会议。这三篇开启了大数据处理的时代,解决了如何对海量数据进行计算,存储,以及高可用,故障处理等工程问题。这三篇的后果就是直接把大数据炒火了,因为有了可行的技术方案,谁都觉得自己能做了。同样也开启了 Apach 基金会的以个黄金时代,仿造的开源作品 Hadoop,HDFS,HBase 成为了几乎所有公司需要处理大数据的标配,无数公司因此诞生并发展。对学术圈的冲击就是由于 Google 的老三篇和数据关联很近,直接把很多和数据库相关的顶级会议搞水了,一时间所有数据库的会议都在优化 hadoop。同样这个势头也慢慢延伸到了其他计算机领域,安全、软工、通信几乎所有的领域都被大数据占据了。


Chubby:依然是 Google 的产品,直接催生了 Zookeeper 的诞生,成为了分布式一致性服务的一个工程标准,在 raft 协议和 etcd 诞生之前,Zookeeper 几乎是能找到的最好的开源分布式一致性服务的一个实现。


Dapper: 还是 Google 的分布式 trace 跟踪系统,为分布式系统的监控提供了一个技术方案,现在很多 APM 的公司,包括一些大公司内部的探针,阿里的鹰眼,美团点评的 CAT 系统,都从中有所借鉴。


Spark:内存计算和流式计算目前最主流的开源产品,也被人给予厚望认为能颠覆 hadoop 的大数据处理的模式,依然来自这个会议。值得提一下 Spark 出身 UC Berkeley,他们组花了很多年时间做这个系统,从最早的一个 poster,到 short paper 最后终于发到了顶级会议上。而之后 Spark 的成功大家应该也都知道了。


Parameter Server: 最早说了 SOSP 基本上和机器学习的关系不大,而且也不像其他会议狂开机器学习相关的 session 但是,一旦开了那就会有最好的工作来。基本上 Parameter Server 已经成为了各个公司处理分布式深度学习的标配。


Tensorflow: 可能是当下最火的机器学习框架了,同样出自这个会议。


列举了这些知名的产品,你心里大概就有点概念了,这个会议尽管是学术圈的但是基本上很多工作还是会影响的工业界的进程。还有很多别的知名工作,比如 Google 的新三篇,Spanner, Amazon 的 DynamonDB,VMware 早期的一些虚拟化技术,P2P 的早期技术等等也都源于这个会议。


尽管时下最流行的是人工智能,深度学习,大数据,云计算这些概念,但是这些概念都是要有底层系统的支撑才能实现的。以深度学习为例,深度学习这些年的发展很大程度还是由于硬件可以更快的进行计算,软件系统又可以很好的处理大规模的存储和分布式的计算。可以想一下没有上面提到的这些底层的系统产品,人工智能、大数据这些概念应该如何实现。


能入选 SOSP 的论文一般都有这么两个特点:

  1. 工程量特别大:一般系统的实现没个一两年根本达不到门槛,像 Google 都是运行了近十年的才能拿出来,学校里的基本也是这个方向积累了很多年才拿出来。

  2. 解决的问题特别难:基本上都是超出常规想象能力的问题,或者基本认知是不可能达到的事情,这种事情居然做出来了,才有可能中。

这是这两个原因导致这个会议几乎没有办法灌水,大家也都会拼劲全力往里挤,每一篇论文都是值得反复精读,从中获取营养的。不过读完也经常会感叹,要么我没有这么大规模的量,要么没有这么苛刻的需求,要么就是这个对我很有用可是实在是实现太难了,我做不到呀!


现在你应该有冲动去看这个会议的论文了吧?