阅读架构师:来自硅谷/亚洲研究院的经验与思考

2017-09-13 08:06:01 ArchSummit InfoQ

谈起硅谷,我们可能想到“The Future is Here"(未来在这里)”的著名金句,一个位于美国加州的一片狭长地带,蕴藏着这世界上最前沿的互联网技术与创新想法,自然吸引了诸如阿里、腾讯、百度、小米、京东等中国企业前来朝圣。

而北京作为中国的硅谷,也吸引了不少跨国公司前来驻足,1995 年 IBM 中国研究院设立于北京,1998 年英特尔设立中国研究院,2001 年微软将中国研究院更名为“微软亚洲研究院”,国际知名科技巨头纷纷前来贡献并享受中国飞速发展的红利。

那么外企科技公司在国内创建研究中心,与中国企业在美国创立实验室,身在其中的架构师会有怎样的经验与思考?

在此次 12 月份的 ArchSummit 全球架构师峰会 北京站上,InfoQ 中国团队邀请了京东硅谷研究院主任研究员李维(博士)与微软亚洲研究院的首席研究经理 Kevin Zeng 前来分享,如果大会上有你感兴趣的话题,不妨识别下方二维码或点击文末 阅读原文 了解更多的内容,在这里我们简单分享在大会上你可能感兴趣的内容。

自动深度语法分析是自然语言应用的核武器

李维博士现任京东硅谷研究院主任研究员,领导 Y 事业部硅谷 NLP(文本自然语言处理)团队,研发自然语言深度分析平台及其 NLP 应用,目前聚焦于大数据情报和舆情挖掘,以及智慧供应链应用。

NLP 是人工智能的重要方向,是继图像和语音处理技术(感知技术)突破之后的一个令人期待的关涉认知技术的核心环节。

迄今为止的自然语言应用大多局限于浅层分析或者端对端的系统,并没有做到语言的结构分析和语义理解,而后者才是自然语言表达信息的奥秘所在。自然语言深度分析的技术正在成熟,已经到了显示威力的前夕。

在此次分享中,李维博士将结合知识图谱和大数据舆情挖掘,来展示深度语法分析(deep parsing)的原理和威力。

负责互联网媒体与计算组的 Kevin Zeng

首席研究经理 Kevin Zeng 在微软亚洲研究院负责互联网媒体与计算组,在此之前,他在密苏里大学担任了 14 年全职教授,2000 年到 2003 年 Kevin Zeng 在 PacketVideo 担任 CTO Staff。

如果你对图像/录像等处理与计算的问题,欢迎前来此次大会上与 Kevin Zeng 有更多的交流。

Uber 如何使用深度学习优化司机和乘客的体验

在 Uber 内部,个性化团队的工程经理 Yefei Peng 所在的团队被称为 Personalization,使命是为合适的乘客在合适的时间提供最优的产品体验。

目前基于 Uber 的大数据基础设施,Uber 的深度学习解决方案 “learns” 和 “adapts” 可以清晰的知道乘客的个人偏好,并且随时可以在后台工作,采用各种办法让乘客有更愉悦的体验。

目前该深度学习的实践方案仍在 Uber 内快速迭代中,一年已经提供了四代解决方案,在此之前 Uber 使用了基于规则的处理方法,之后采取了基于机器学习的排序,Yefei Peng 将分享这段经历中的架构设计和迭代思路。

Twitter 实时流系统 Heron 的异常检测和恢复

吴惠君博士,现任 Twitter 工程师,致力于实时流处理引擎 Heron 的研究和开发,是 Apache Heron 的 committer。

应近年来大规模实时分析的需求,很多流处理系统被开发出来。Twitter Heron 开源系统就是其中的代表项目之一。

这类系统要求在软件或者硬件失败的极端情况下能有较好的服务水平。为了达到这种要求,Twitter Heron 系统添加了 Dhalion 异常检测和恢复框架来保障 Heron 系统的服务水平。

Dhalion 异常检测和恢复框架使用 polocy(策略)来整合 detector(检测器)和 resolver(执行器)模块。整个系统非常灵活,通过替换 policy 或者 detector 或者 resolver 能进行各种检测和恢复任务,包括检测 back pressure(反压)指标并进行扩容,和检测负载指标并重新调度容器等等,Dhalion 框架的应用给 Heron 系统带来了初步的自行规范调整机制。

百度 MPP 数据仓库 Palo 开源架构解读与应用

牟宇航在百度担任大数据部工程架构团队经理,先后领导过数据平台团队,OLAP 团队、在线数据团队。

面对业务量增加,数据量翻番,并且需要处理数百 TB ~ PB 级别的数据量,且是结构化数据,并达到毫秒 / 秒级分析,在这种情况下应该寻求哪种解决方案选型,并且采取怎样的工程来实现?

百度目前采取的技术选型在技术特性上可以支持 MySQL、高并发小查询、大查询高吞吐、高容错、列式存储、物化视图、在线表结构修改等特征需求,如果做到的?欢迎前来交流。

从零到千万在线后台服务的演进之路与黑产对抗

黄斯亮在腾讯音乐担任后台技术总监,目前在腾讯 9 年多互联网产品研发经验。

在这次分享中,黄斯亮计划讲述全民 K 歌从零到千万在线的产品发展过程中,后台服务架构的演进。

通过对 UGC 系统、流媒体上传下载体系、道具礼物体系、注册登陆系统、排行系统等核心模块的不断优化与重构,已经适应了快速增长的用户规模,从根本上保证了产品的高速增长。

同时在产品发展过程中面对层出不穷的黑色产业模式,业务应该如何与各式各样的黑产做对抗,为用户提供了一个相对安全,干净,公平的平台,保障用户的利益,黄斯亮将解释其中的对抗细节。


在中国享有互联网圣地的北京届时会迎来哪些重磅嘉宾和技术分享?ArchSummit 还会提供怎样的精彩活动?敬请期待。

需要特别注明的是,每年 ArchSummit 大会门票都会在开幕前售罄,及早预定可提前确保席位,并享受更低折扣。此次大会的 8 折报名优惠 即将结束,团体购票(5 人及以上)将享有更多优惠,详请咨询大会票务经理豆包(微信:aschina666),或直接致电 15201647919。