华为发布盘古大模型3.0,“没时间做诗”
(编辑/吕栋)
7月7日,第六届世界人工智能大会(WAIC)正在上海如火如荼地进行,大模型是绝对的关键词,而正当各大厂商的大模型“争奇斗艳”时,华为却推出了一个“不做诗”的大模型。
(资料图片)
“盘古大模型不做诗,也没有时间做诗,因为它要深入到各行各业中去,让AI赋予各行各业价值。”7月7日下午,在华为开发者大会2023(Cloud)上,华为云CEO张平安说道。
张平安在会上宣布,盘古大模型3.0正式发布,该模型是一个完全面向行业的大模型系列。
华为云CEO张平安
据他介绍,盘古大模型3.0包括“5+N+X”三层架构:
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,都可以供客户和伙伴企业直接调用。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
据披露,盘古大模型采用完全分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
“盘古为行业而生,就要为行业着想”,张平安表示 ,如今盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。
“大家知道其他人都可以使用行业里最成熟的GPU,最成熟的软件,但是华为不可以,所以华为只能依赖我们自己打造的AI的根技术。”他说道。
张平安透露,华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。
“基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。”他表示。
算力是训练大模型的基础。
在本次大会上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。例如,美图仅用30天就将70个模型迁移到了昇腾,同时华为云和美图团队一起进行了30多个算子的优化以及流程的并行加速,AI性能较原有方案提升了30%。
此外,在大模型训练过程中经常会遇到GPU故障,研发人员不得不经常重启训练,时间长,代价大。昇腾AI云服务可以提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。
关键词:
推荐阅读
月壤形成的主要原因 月壤与土壤有什么区别
月壤形成的主要原因月壤形成过程没有生物活动参与,没有有机质,还极度缺水干燥;组成月壤的矿物粉末基本是由陨石撞击破砰形成,因此,粉末 【详细】
域名抢注是是什么意思?投资角度来看什么域名好?
域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】
捷达保养费用是多少?捷达是哪个国家的品牌?
捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】
天然气泄露会造成爆炸吗?天然气泄漏怎么办?
天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】
四部门明确App收集个人信息范围 个人信息保护范围判断标准
四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】
相关新闻
- 华为发布盘古大模型3.0,“没时间做诗”
- 龙泉股份:预计2023年前半年盈利240万元-350万元 同比扭亏为盈
- 【聚看点】中国航天专家被策反,出卖航天情报,被捕后:每月有1000美元报酬
- 12306网站:让天下没有难买的火车票,开发技术独步全球
- 全球聚焦:中国航天被严重低估了!2023上半年最重要1次发射,你可能没看懂
- 苏大发现生物力学因素对勃起功能的作用,为功能障碍治疗提供视角
- 德州市新增1家省院士工作站
- 风华高科:公司正积极开拓和推进汽车电子新客户产品认证工作
- 闽台共话工业设计魅力
- 中信重工大型水电主轴锻件锻造成功
- 16家车企签署价格承诺书 价格战或终结
- 一定量的某种气体进行如图所示的循环过程(一定量的液态化合物XY2,在一定量的O2中恰好完全燃烧)
- 留抵抵欠怎么操作处理_有关留抵抵欠问题简答
- 廉价突破!中国实现0.4元/立方米海水制氢,做好迎接革命准备了吗|全球速看
- 看点:港珠澳大桥香港段混凝土报告造假-囚徒困境
- 危害身心的成人网站,为什么国家不能将它彻底关闭?-全球信息
- 外国人体验中国高铁后,怒提3个“缺点”,国人却表示很有道理? 天天微动态
- 【环球速看料】一个装傻充愣的人是如何把一个经过专业培训的骗子逼疯的
- 英国房地产因利率上升陷入困境 房价正以2011年来最快速度下跌
- 厄尔尼诺威胁!农业、电力、家电 哪类板块领衔“夏日行情”?