微比恩 > 信息聚合 > 阿里巴巴开源深度学习训练框架EPL,可支持10万亿参数超大模型

阿里巴巴开源深度学习训练框架EPL,可支持10万亿参数超大模型

2022-03-04 16:33:39来源: 猎云网

【猎云网北京】3月4日报道3月4日消息,阿里巴巴宣布完全开源支持10万亿模型的自研分布式深度学习训练框架EPL(Easy Parallel Library,原名whale),进一步完善深度学习生态。EPL由阿里云机器学习平台PAI团队自主研发,PAI是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、编译优化、推理部署在内的AI开发全链路服务,内置140多种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。EPL是PAI团队一次面向大规模深度学习分布式自动化训练的探索,EPL希望能够简化深度学习模型从单机训练到分布式开发调试的流程。EPL通过对不同并行化策略进行统一抽象、封装,在一套分布式训练框架中支持多种并行策略,并进行显存、计算、通信等全方位优化来提供易用、高效的分布式训练框架。EPL适合不同场景的模型,在阿里巴巴内部已经支持图像、推荐、语音、视频、自然语言、

关注公众号