大家好,我是阿里云毅丽。这是第二次在QCon与大家在线上交流。今天,我分享阿里云在原生领域的实践和思考,以及我们对未来的一些判断。首先,数以中心作为数字经济的动力引擎,其能耗增长已经成为云计算产业发展中不可忽略的问题。据报道,2020年数以中心的耗电量超过国内总电量的2.3%,而且占比将持续逐年增加。阿里云在身体例行的推动、绿色计算、比如利用、寂寞式的夜冷服务器来降低数以中心的POE。此外,我们可以看到,在数以中心中,计算效率也有很大提升空间。据统计,全球数以中心的平均资源利用率不达20%,这是巨大资源和能源的浪费。云计算的本质就是把离算的算力聚合成更大资源池,通过优化的资源调度来实现消风填骨,提供极致的能效比。在阿里集团实现了全面上云之后,我们启动了一个新的计划。利用云生技术对阿里集团分布在全球数十个地域的数千万核服务器资源进行统一的调度,全面提升资源利用率。通过阿里集团阿里云众多团队的共同努力,今年双十一统一调度项目圆满结束交出了一份闪亮的打卷。通过Covernetis和阿里自研的统一调度器CyberNetis,通过一个调度协议,一套系统架构,对底层多样化的计算资源进行智能化的调度向上支撑多种不同的工作负载的混合部署。在保障应用SLO的前提下,提升资源利用率,让电商的微服、中年键等应用、搜推广、MS Compute的大数据和N业务全部运行在一个统一的容器平台之上。为阿里集团可以每年减少数万台服务器算力的采购,带来数亿元资源成本的优化。在这个过程中,单容器集团的规模超过上万节点,百万核算力。任务调度的效率可以达到每秒两万个,可以满足向搜索、大数据、AI等需要高吞吐低延迟、任务调度的编排需求。性能非常优秀。此外,统一调度可以帮助阿里在双十一大速期间计算成本降低50%,生产环境常态化CPU利用率可以达到65%,业界领先。多摩台预讯链AI塔模型被广泛认为是迈向通用化人工智能的关键路径,大家熟知的像GDP3用千亿级的参数在某些场景可以实现比肩人类的自然语言理解能力。阿里巴巴达摩院最新发布的超大规模预讯链模型M6已经进入了10万亿参数的时代。M6拥有多摩台的中文任务处理能力,尤其擅长设计、写作、问答。在电商、服装制造、科学研究等领域有广泛的应用前景。Kubernetes对于GPU对于深度学习的任务支持已经逐渐成熟,然而对超大规模的模型训练依然是非常具有挑战的一件事情。万一及参数模型训练,动辄需要数千张GPU卡、数10T的显存的计算资源,花费数10天才能完成训练。为了应略这些挑战,Separated在原生的Kubernetes基础上扩展了面向大规模AI任务的调度能力。通过高效的易购算力的调度、数据感知和访问加速有效的提升了GPU的计算效率,通过错峰调度可以充分利用集群中的空闲资源。它也支持了来计算平台原生的PiWare框架提供的高效的并行模型训练。基于上面的全占优化M6可以仅用512张GPU卡在10天之内就完成10万一级规模的超大模型训练。极大提升了模型训练的效率、资源利用率与国际同等规模模型相比,其能耗下降超过80%、真正实现了绿色AI。我们能看到像5G、互联网、ARVR这些技术在加速数字世界与物理世界的进步融合。OpenYard是业界首个开源的零侵入云原生边缘计算项目。去年11月由阿里巴巴向Sinsap进行了贡献成为的杀项项目。边缘计算面临着向算力分散、资源易购以及综网连接等众多的技术挑战。OpenYard及Kubernetes构建了云边协同计算框架,在过去两年已经在视频直播、云游戏、交通物流、智能制造等众多行业进行了落地。在今年我们一直在思考一件事,西方能够以云原生的方式来实现设备乱生,高效的解决互联网场景下海量分布设备的管理和运萎挑战。OpenYard和IJX方坠社区、VMVR、Intel等工程师一起合作,实现了对端设备和运用管理的统一建模和统一管理。下面我们将介绍一个利用OpenYard来实现无处不在计算的案例。我们都知道,像机场的运用效率对质疑增长的客流和物流需求是至关重要的。与此同时,机场的安全性方面的挑战也预发突出。在智慧机场项目中,通过OpenYard构建的云边端一体化架构,完成了摄像头传感器边缘AI一体机构住的机场改织层,和基于云平台搭建的全机统一管理和大数据平台,从而实现了机场全局的数据共享和视频分析,进一步实现机场全景视频拼接,安全权益监控,物理可视全视野等能力。随着移动互联网、互联网的筷子发展,在加速创新和方便我们生活的同时,无处不在的计算时时刻刻在产生着海量的信息。如何让这些技术设施变得更加可信,保障一些隐私数据不被窃取、篡改和滥用成为重要的挑战。随着国家数据安全法的实施,隐私增强计算业务得到了越来越多行业的一些重视。据加拿大预测,到2025年60%的大型机构将采用隐私增强计算来处理不可信环境或多方数据分析用力中的数据。隐私增强计算有不同的既有分支,其中重要的一个领域,是通过基于硬件的可信指引环境T1E来实现数据保护。T1E的安全边界非常小而且存在于硬件芯片本身。T1E内制成的应用,不会受到来自其他应用其他租户或者平台方的威胁。将容器技术与可信指引环境相结合的机密容器技术,进一步提升了对敏感信息的保护。一方面,容器与完整的OS相比,它的攻击面更小。另外一方面,基于容器的安全软件供应链,可以保障应用来源的可信、可追溯。Inclavial Container是阿里开源的业界第一个面向机密计算的容器运行室项目,在今天9月已经成为CNC App的杀项项目,机密容器可以将机密计算,底层的各种各样的复杂性都进行隐藏,遵循既有的云原生标准化的接口和规范,兼容现有的应用生态,这将加速这个技术的普及。在社区协作中,我们也看到来自于Cata Container社区的工程师,跟我们有相同的一些理念和思考,也在不同的技术方向进行探索。如图所示,由InCava Container支持的SCX机密容器和由Cata Confidential Container项目支持的基于Micro VM的机密容器,在技术形态上具备高度的相似性,为此,两个项目的开发者在积极地展开合作,会相互附用彼此技术组建,最大化技术价值,并为不同的提议实现统一的开发者体验,这也正体现了开源社区的魅力和力量。OK,再次感谢大家的观看,我们相信,绿色无处不在,可信的云计算,将进一步推动产业的发展,帮助我们实现更加美好的明天。谢谢!