人们往往对日常生活中无处不在的便利习以为常,只有在这种便利的供需产生波动时,才会吸引人们关注的目光。经历了云生活、宅经济的爆发,在线教育与远程办公等行业迎来了突如其来的春天,而与此同时,也有相当多的行业暴露出了自身网络基础设施建设不足、上云脚步落后的弊端。大考当前,这既是对各行各业一次严苛的实战检验,也是一个弥补自身短板、进行弯道超车的良机。而如何利用这一时机,一步达成性能生态两手抓,使企业迅速吃上数据中心的一顿超值套餐,则着实是个不小的考验。
超越参数,全面优化才是硬道理
近日,英特尔宣布英特尔®至强®可扩展平台正式迎来针对性能和性价比优化的全新英特尔®至强®可扩展处理器。
平均来说,全新第二代英特尔至强金牌处理器相比第一代至强金牌处理器,性能提升达1. 36 倍,性价比提升1. 42 倍。
为打造这种级别的性能和价值,英特尔从多个方面优化了这些全新服务器处理器,包括增加核数、提高缓存或提升处理器频率。同时,作为覆盖市场范围最为广泛的服务器处理器平台,英特尔第二代至强可扩展处理器目前依然是市面上唯一集成人工智能加速的主流服务器处理器,且已经创下英特尔历史上产品销量增长之最的记录。
然而如何才能最大程度释放性能,提升价值?这就要求供需双方跳出参数党的思维模式,软硬结合,全面优化,提供基于工作负载优化的真实性能,才会真正成为客户期待的解决方案。
英特尔中国区云计算软件性能优化团队总监李宏曾表示,在性能优化方面,同样的解决方案,在不同的使用场景之下对系统的压力和带来的效果可能是完全不同的。基于这个也直接就决定了后期的优化和整体上进行相应择优的最佳思路和最佳实践也就完全不同。在这里要理解这一点,主要依赖的是对合作伙伴工作负载的深刻理解。
李宏所在的团队由来已久,作为其中的一员老将,他已经与客户并肩作战超过 15 年。“英特尔在合作伙伴和软件方面的投入是长期、持续性的,到今天为止我们和中国区的合作伙伴已经对近百个应用程序进行了优化。”这也得益于英特尔在中国所拥有的近 3000 人的庞大工程师团队,其中有近一半都长期从事着软件和系统的优化工作,并长期身处一线服务于本地客户针对各类工作负载的定制化、调优需求。
优化所涵盖的范围也十分广泛,其中包括:搜索引擎、媒体处理、存储等等,尤其是AI,有超过一半的项目是和AI相关。尤其是基于使用场景的优化,能够使得AI应用更加便于部署和使用,获得更高的性能。此外,大部分的程序经过优化之后能够达到2- 4 倍的性能提升,个别能够提高 10 倍。
长期以来,英特尔在和ISV合作,以及AI方面投入了相当大的资源和精力,其中通过软件方面的调优,便可以最大化的应用到英特尔架构的优势。唯有软硬兼施,才能更好地满足未来计算的需求。 我们做的事情使我们所有的硬件的每一个晶体管都能够充分发挥作用。”李宏表示。
生态高端局里的中国赢家
再说到生态系统,这无疑是一笔隐性资产。从一款叫好又叫座的单一产品,到完备精良的全套产品组合,这都还只算厂商的内功修炼,如何成功破局,组局,建设立体多元的生态系统,打通壁垒,实现共赢,就考验着行业内外长期的信任与积淀。
英特尔亚洲人工智能销售技术总监伊红卫曾坦言:“在英特尔的十几年中,学会的最重要的一个词就是赋能。“这么多年来,不管是操作系统提供商,还是软件厂商、系统集成商都与我们保持密切合作,包括OEM、ODM,英特尔希望可以帮助整体的生态变好,我们一直为此而努力。”
而通过 20 余年在数据中心领域的积淀,英特尔本身也已具备得天独厚的优势,去将业内的重要伙伴联合起来,共同降低各种架构和工作负载下的开发复杂性,并加速创新技术的大规模部署。
从Broadwell到Skylake,在深度学习方面的软硬结合带来了高达 277 倍的机器学习的性能。从Skylake到Cascade Lake 增长了 28 倍,其中通过硬件提升了 4 倍左右,剩下的全部是由软件优化带来的。 “这得益于我们在和中国的客户在交流的过程中,理解了他们的工作负载后所做的特殊优化。我们的这些优化过的框架,已经广泛的部署在“谷歌云”、亚马逊的AWS、Facebook、腾讯、阿里巴巴、今日头条等客户上。”英特尔亚太研发中心机器学习首席工程师林晓东回忆道,“ 20 年前,中国的软件刚刚起步,讲的是世界的软件到中国做本地化,而现在我们紫竹的团队真正做到了在中国、根据中国的具体需求,创造软件、服务全球。”
结语:
回首从至强 5500 到如今的全新第二代至强可扩展处理器,已经过了 10 年的时间,曾经的英特尔也摇身一变,成为了具备至强、傲腾内存与存储产品、网络传输产品、可编程FPGA、一整套人工智能解决方案在内的数据中心全栈式解决方案供应商。很显然,英特尔已经不再止步于计算,它所需求的甚至不是“计算存储两开花”,而是多点爆破,全面突进。
“可扩展”三个字的一层含义就是如此。以往,每当增加核数都需要更新一代产品。比如第一代至强E5 的 8 核心到第二代的 12 核心到第三代的 18 核心到第四代的 24 核心,每次更新的数量都不多。但是从可扩展处理器的 28 核心直接跳到 56 核心,说明“可扩展”的Mesh架构真的是可以随意扩展。
如今的至强代表英特尔已经不局限于计算的单一领域,而是扩展到了包括存储、网络、加速、安全、软件等一系列软硬件基础设施的层面。可以说,在这一代平台中,英特尔给出了“全家福”方案——通过整合平台,实现一切!