文章详情
在 OCI 上以几十亿次运算量训练大型语言人工智能模型
曹彬峰
5958
2024-02-23
使用人工智能(AI)和机器学习(ML)的核心目的是通过建立训练有素的模型来理解大量数据。

使用人工智能(AI)和机器学习(ML)的核心目的是通过建立训练有素的模型来理解大量数据。就像运动员在即将到来的比赛中需要训练以获得极佳表现一样,ML 模型也必须经过训练才能在部署到生产中时获得非常好的表现。训练有素的模型可以在计算基础设施上快速、经济高效地提供准确结果,并对失败有较小的容忍度。

大型语言模型(LLM)使用海量数据,例如在互联网上部署的数年数据。它从这些信息中学习,以各种方式帮助我们,包括总结文本、检测犯罪、编写软件以及以下示例用例:

以 ChatGPT 为例

ChatGPT 由人工智能研发实验室 Open AI 开发,是一种流行的人工智能,可以对一般问题生成人类可读的回答。由于它的多功能性,ChatGPT 可以发展当今的搜索引擎,为搜索结果补充更有洞察力的答案。

Superclusters 以及在大语言模型训练中的角色

使用大型语言模型训练人工智能应用(如ChatGPT)需要能够处理海量数据的强大计算基础设施集群。这些 Superclusters 包含数百或数千个由高性能网络结构连接的裸机计算实例。这些计算实例共同提供了大规模处理训练数据集的能力。Meta AI 估计,随着模型变得越来越大、越来越复杂、适应性越来越强,这些 Superclusters 必须能够每秒执行五万亿次操作。

甲骨文云基础架构(OCI)的人工智能基础架构已经能够帮助 Adept 和 SoundHound 等客户处理大量数据,以训练大型语言模型。我们对 OCI 的集群网络进行了优化,以使用 RDMA over converged ethernet (RoCE)支持超低延迟。您可以通过我们的 Oracle 网站了解更多有关我们的大规模 Superclusters 网络以及使其成为可能的工程创新的信息。

下图展示了具有 RDMA 网络连接的 Superclusters。每个 GPU 节点有 8 个 NVIDIA A100 Tensor Core GPU,与网络结构的全双工连接总计 1.6Tbps(1600Gbps)。网络结构被设计为无阻塞,并为所有主机提供全分段带宽。(分段带宽是指网络任意两部分之间可用的 minimum 带宽)。

图片7.png

OCI 与 AWS 以及谷歌云平台(GCP)的比较

训练大型语言模型是极其耗费网络资源的。训练这些模型需要在成百上千台独立服务器之间协调和共享信息。OCI GPU 通过使用 RDMA 的简单、高性能以太网连接。OCI 提供的带宽是 AWS 和 GCP 的 4-16 倍,这反过来又减少了 ML 训练的时间和成本。三家供应商公布的带宽分别为

OCI 的集群网络技术得到了 Adept、MosaicML 和 SoundHound 等尖端 AI/ML 创新企业的验证。在发布时,AWS 和谷歌云平台使用的互连技术类型并不完全透明:Infiniband、以太网或其他技术。与OCI的简单性相比,AWS EFA 等增强功能在配置和软件方面造成了复杂性,在用于 ML 训练之前必须进行彻底测试。通过保持互连的简单和快速,OCI 为训练大型语言模型提供了非常好的环境。

想要了解更多?

OCI 提供云工程师支持,用于训练大型语言模型和大规模部署人工智能。要了解有关 Oracle 云基础架构功能的更多信息,请联系我们或查看以下资源:

AI 基础架构(https://www.oracle.com/cn/ai-infrastructure/)

OCI 计算: GPU 实例(https://www.oracle.com/cloud/comput)

云计算
版权说明
本文内容来自于甲骨文云技术,本站不拥有所有权,不承担相关法律责任。文章内容系作者个人观点,不代表快出海对观点赞同或支持。如有侵权,请联系管理员(zzx@kchuhai.com)删除!
企业推荐
更多
IPIDEA全球IP代理
IPIDEA成立于2019年,总部坐落于江苏徐州,作为一家全球领先的企业级海外IP服务商,已按照国家要求在相关部门备案,并取得了合法经营的资质。从业多年,始终专注于为全球用户提供多方位的优质海外IP解决方案,凭借优质的服务和良好的口碑,已同全球10万+跨境企业达成深度合作!
AdsPower 指纹浏览器
AdsPower 是一款专为跨境人打造的指纹浏览器,致力于解决出海账号矩阵安全管理问题,目前已通过所有网站检测。平台提供独特的指纹配置、专业的浏览器自动化、高效的团队协作功能,为您的账号环境保驾护航!
kookeey 可壳海外代理IP
kookeey,中文名可壳,是全球代理IP行业第一梯队企业,主打不同出海业务方向高纯净度代理 ip产品及服务,服务着国内众多跨境电商等互联网出海企业,拥有《中华人民共和国增值电信业务许可证》且已通过ISP、IDC、支付宝、微信支付等业务核心认证,工信部备案,合法合规经营。
TopOn
全球领先的移动广告聚合变现平台
甲骨文
甲骨文公司 (NYSE:ORCL) 创立于 1977 年,总部位于美国德克萨斯州。甲骨文公司是一家全球性的企业云技术提供商,致力于赋能各种规模的企业的数字化转型。甲骨文公司提供自治数据库、大数据、分析及机器学习等高科技产品,及在销售、服务、市场营销、人力资源、财务、供应链和生产制造等基于云技术平台的集成应用。
活动推荐
更多
Adjust Ignite 移动应用出海营销峰会(深圳)
Adjust Ignite 移动应用出海营销峰会(深圳)
2024-10-17 15:30 至 21:00
深圳
立即报名
第九届GGCC全球对接会
第九届GGCC全球对接会
2024-11-06 09:00 至 17:30
广州
立即报名
甲骨文
甲骨文
甲骨文公司 (NYSE:ORCL) 创立于 1977 年,总部位于美国德克萨斯州。甲骨文公司是一家全球性的企业云技术提供商,致力于赋能各种规模的企业的数字化转型。甲骨文公司提供自治数据库、大数据、分析及机器学习等高科技产品,及在销售、服务、市场营销、人力资源、财务、供应链和生产制造等基于云技术平台的集成应用。
+ 关注