谢谢您的订阅!
当新的内容发布后您将开始接收邮件。您也可以点击邮件内的链接随时取消订阅。关闭Close

利用开源机器学习基础架构加速 AI 发展

by Canonical on 13 June 2025

人工智能技术在迅速发展,对稳健强大且可扩展的基础架构具有迫切需求。为应对这些挑战,我们精心打造了一套全面的参考架构(RA),充分利用了开源工具与尖端硬件的强大功能与性能。这套架构基于 Canonical 的 MicroK8s 和 Charmed Kubeflow 构建,运行于 Dell PowerEdge R7525 服务器之上,并借助NVIDIA NIM 微服务实现加速,为部署和管理机器学习工作负载提供了一个简便高效的途径。

为数据科学家与工程师赋能

该解决方案旨在为数据科学家和机器学习工程师赋能,使其能够实现更快迭代、无缝扩展以及强有力的安全保障。对于基础架构构建者、解决方案架构师、DevOps 工程师以及首席技术官(CTO)而言,这套参考架构提供了一条畅通无阻的途径,既能推进人工智能项目,又能应对大规模部署所带来的复杂性问题。

这套架构的核心在于 Canonical 与 NVIDIA 之间的协同合作。我们通过合作确保从 Ubuntu Server 和 Ubuntu Pro 到 Charmed Kubeflow 的整个软件栈,都针对 NVIDIA 认证系统进行优化。这样的集成可以实现卓越的性能和可靠性,使企业组织能够提升其 AI 运行效率。

Dell PowerEdge R7525:高性能 AI 的硬件基础

Dell PowerEdge R7525 服务器在这套架构中起着至关重要的作用,其为处理高要求的 AI 工作负载提供了稳健可靠的硬件基础。这是一款 2U 机架式服务器,专为高性能计算、虚拟化以及数据密集型任务而设计。

R7525 配备双插槽 AMD EPYC 处理器,具备出色的可扩展性、高级的记忆功能以及灵活的存储选项。因此,它非常适合必须要处理大规模数据集和复杂模型的 AI 和机器学习环境。R7525 的设计可以确保企业组织能够在运行变革性 AI 系统的同时对传统 IT 应用程序进行虚拟化处理,为多样化的工作负载提供一个统一的平台。

利用 NVIDIA NIM 和 A100 GPU 之优势

这套架构利用 NVIDIA AI Enterprise 软件平台随附的 NVIDIA NIM 微服务,可以实现安全可靠的 AI 模型推理。再结合 NVIDIA A100 GPU 的强大功能,能够为高要求的 AI 工作负载提供所需的计算能力。通过在 Charmed Kubeflow 平台上部署基于 NVIDIA NIM 的 LLM,企业组织可实现从模型开发到生产的无缝衔接。

Canonical 的开源组件

Canonical 推出的 MicroK8s 是一款 CNCF 认证的 Kubernetes 发行版,可提供一个轻量高效的容器编排平台。Charmed Kubeflow 可以简化 AI 工作流的部署与管理,并且提供一个庞大的工具和框架生态系统。二者结合可以确保机器学习生命周期流程的顺畅高效运转。

利用开源工具部署企业级 AI 项目

Canonical 解决方案全览

架构的主要优点

这套架构具有迭代速度更快、可扩展性提升以及强有力的安全保障等众多优点。NVIDIA 与 Canonical 产品的深度集成,确保了该解决方案开箱即用的无缝运行体验,以及更快的漏洞修复速度和及时的安全更新。此外,Ubuntu 提供的硬件基础还可以提供安全稳定的运行环境。

这套参考架构不仅是一纸蓝图,更是一套实用性指南。文档中包含硬件规格、软件版本以及关于使用 NIM 部署 LLM 的分步教程。文档中还介绍了设备集群监测与管理,为用户呈现系统运行的全貌。

解锁新机遇

凭借 Canonical、Dell 和 NVIDIA 三方专业技术的强强联合,企业组织可在各自的领域中解锁新机遇。该解决方案可以提升数据分析能力,优化决策流程,并彻底改变客户体验。

即刻行动

这套参考架构可为部署 AI 工作负载奠定坚实基础。凭借 Canonical、Dell 和 NVIDIA 三方专业技术的强强联合,企业组织能够提升数据分析能力,优化决策流程,并彻底改变客户体验。综上所述,企业组织可放心采用这一解决方案,推动创新进程,加速 AI 应用进程。

准备好推动您的 AI 项目迈向新高度了吗?

立即下载 Reference architecture

订阅博客文章

订阅您感兴趣的主题

在提交此表格的同时,我确认已阅读和同意的隐私声明隐私政策。

查看更多内容

Canonical 宣布将在 Ubuntu 中分发 NVIDIA DOCA-OFED

继此前宣布分发 NVIDIA CUDA 工具包之后,Ubuntu 发行商 Canonical 将把NVIDIA DOCA-OFED网络驱动程序集成至 Ubuntu 并进行分发,进一步加快 NVIDIA 平台的落地应用。 NVIDIA DOCA-OFED 是一套被广泛采用的高性能网络协议栈,常用于大规模 AI 工厂和 HPC 集群。通过开放 RDMA(远程直接内存访问)和 NVIDIA GPUDirect等高级功能,NVIDIA DOCA-OFED 可对 CPU 负载卸载,降低并稳定尾部延迟,同时在负载下保持持续吞吐量。实现超低延迟、高吞吐量的数据传输,这对于训练大语言模型(LLM)和运行复杂分布式仿真至关重要。DOCA-OFED 以 DOCA-Host 网络驱动栈的形式提 […]

Ubuntu Pro 部署 Nutanix 裸机 Kubernetes

Nutanix 与 Canonical 扩大合作,为容器化工作负载提供更多选择 企业级 Kubernetes® 正逐步发展为高度灵活的多架构模型。随着 AI/ML 及数据密集型工作负载对硬件吞吐量的要求不断提升,企业在追求裸机性能的同时,也希望兼顾云平台的运维一致性。 为满足这一需求,Nutanix 与 Canonical 已将 Ubuntu Pro 服务拓展至裸机环境下运行的 Nutanix Kubernetes 平台 (NKP) 实例,涵盖最新发布的 NKP Metal 解决方案。本次功能拓展基于双方 2025 年达成的合作,彼时搭载安全补丁的 Ubuntu 操作系统可支持虚拟机环境下运行的 NKP 实例。安全补丁服务隶属于 Ubuntu Pro,是 Canonica […]

Canonical 发布 Ubuntu Core 26

Ubuntu Core 26 推出精准化 Linux 构建、优化的 OTA 更新、实时内核补丁,以及面向关键任务部署的增强型硬件级安全防护。 2026 年 5 月 19 日,Canonical 宣布正式发布 Ubuntu Core 26。该系统为极简不可变操作系统,提供长达 15 年的安全维护支持。  Ubuntu Core 26 针对关键任务操作与低延迟 AI 工作负载实现重大系统改进:安装时长缩短、OTA 更新包体积缩减 90%,并借助 Chisel 工具实现精准化系统构建。与以往版本一致,所有组件均为经过沙箱隔离、加密签名的 Snap 软件包,构建可信启动链,仅允许运行经验证的软件。凭借这款全新长期支持(LTS)版本,Ubuntu Core 仍是适用于关键任务系统的 […]