文| Juny编辑| VickyXiao
从算力到服务,英伟达在AI赛道上毫不松懈。
在最近风起云涌的AI圈里,每一片英伟达H100 GPU的走向都被大家紧盯着。原因无它,就因为H100是当前进行人工智能训练的最强引擎。
(相关资料图)
如今,全球约90%以上的大模型都在使用英伟达的GPU芯片,作为生成式AI时代下最为关键的基础硬件,几乎所有人工智能企业都在四处搜寻H100的踪影。一定程度上来说,谁拥有了更多的H100,谁就在当前AI竞赛中占据着上风。
而今天,在洛杉矶的SIGGRAPH大会上,英伟达宣布了新一代GH200 Grace Hopper超级芯片平台的到来。GH200专门为加速计算和生成人工智能时代而打造,旨在处理世界上最复杂的生成式人工智能工作负载,涵盖大型语言模型、推荐系统和矢量数据库,并将提供多种配置。
不仅仅只是超级芯片,围绕着生成式AI的方方面面,英伟达今天还发布了一系列更新,包括全新AI服务平台、推出了4款新显卡、服务器等等,试图全方位加速和简化生成式AI项目的开发、训练、部署和应用。
此次,全新的Grace Hopper 超级芯片该平台配备了全球首款 HBM3e 处理器,通过大幅增加带宽和内存,将为更大的 AI 模型提供训练和计算能力。该配置经过优化,GH200还可以执行 AI 推理功能,从而有效地为 ChatGPT 等生成式 AI 应用程序提供支持。
英伟达之所以称GH200为“超级芯片”,因为它将基于 Arm 的 Nvidia Grace CPU 与 Hopper GPU 架构结合在了一起。GH200 与目前最高端的 AI 芯片 H100 具有相同的 GPU,H100 拥有 80GB 内存,而新款 GH200 的内存高达141GB同时与 72 核 ARM 中央处理器进行了配对。
新版本的GH200采用了全球最快的内存技术HBM3e。英伟达表示,HBM3e内存技术带来了50%的速度提升,总共提供了10TB/秒的组合带宽。因此,新平台能够运行比先前版本大3.5倍的模型,并以3倍的内存带宽提高性能。
拥有更大的内存也意味着未来可以让模型驻留在单个 GPU 上,而不必需要多个系统或多个 GPU 才能运行。
不仅能力得到了大幅提升,英伟达还Nvidia 还发布了NVIDIA NVLink™服务器设计对GH200进行了扩展。NVIDIA NVLink™将允许Grace Hopper超级芯片可以与其他超级芯片连接组合,这一技术方案为GPU提供了完全访问CPU内存的途径。
英伟达表示,目前正在开发一款新的双GH200基础NVIDIA MGX服务器系统,将集成两个下一代Grace Hopper超级芯片。在新的双GH200服务器中,系统内的CPU和GPU将通过完全一致的内存互连进行连接,这个超级GPU可以作为一个整体运行,提供144个Grace CPU核心、8千万亿次的计算性能以及282GB的HBM3e内存,从而能够适用于生成式AI的巨型模型。
GH200还能够兼容今年早些时候在COMPUTEX上公布的NVIDIA MGX™服务器规格。有了MGX,制造商可以迅速且经济高效地将Grace Hopper技术整合到100多种服务器变体中。
NVIDIA首席执行官黄仁勋强调,数据中心需要应对生成型AI的激增需求,因此也需要有更具针对性的加速计算平台,GH200平台正是为满足这一需求而生。
“你几乎可以将任何你想要的大型语言模型放入其中,它会疯狂地进行推理。大型语言模型的推理成本将大幅下降,同时将大幅提高数据中心的运作效率和性能。”
目前,英伟达计划销售GH200的两种版本:一种是包含两个可供客户集成到系统中的芯片,另一种则是结合了两种 Grace Hopper 设计的完整服务器系统。
英伟达表示,全新的GH200将大大降低训练成本和提升训练速度,预计将于明年第二季度上市。
除了全新的超级芯片平台,英伟达今天还宣布了推出了一个新的AI服务——AI Workbench,这是一个易于使用的统一工具包,让开发人员能够在 PC 或工作站上快速创建、测试和自定义预训练的生成式 AI 模型,然后将其扩展到几乎任何数据中心、公共云或NVIDIA DGX™ 云。
英伟达认为,当前企业级AI的开发过程太过繁琐和复杂,不仅需要在多个库中寻找合适的框架和工具,当项目需要从一个基础设施迁移到另一个基础设施时,过程可能会变得更加具有挑战性。
研究机构KDnuggets曾进行过一个调查,80%或更多的项目在部署机器学习模型之前停滞不前。Gartner的另一项研究也显示,由于基础设施的障碍,有接近85%的大数据项目失败。
总体来看,企业模型投入生产的成功率总体较低,世界各地的企业都在寻找合适的基础设施来构建生成AI模型和应用。而此次,AI Workbench则为这个过程提供了简化的路径。
黄仁勋在会议上表示,为了推动AI技术普惠,必须让其有可能在几乎任何地方运行。因此,AI Workbench将支持在本地机器上进行模型的开发和部署,而不是云服务上。
AI Workbench提供了一个简单的用户界面,开发人员能够将模型、框架、SDK 和库从开源资源整合到统一的工作区中,可以在本地计算机上运行并连接到 HuggingFace、Github以及其他流行的开源或商用 AI 代码存储库。也就是说,开发人员可以在一个界面上轻松访问大部分AI开发所需资源,不用打开不同的浏览器窗口。
英伟达表示,使用 AI Workbench 的一些主要优势包括:
易于使用的开发平台。AI Workbench 通过提供单一平台来管理数据、模型和计算资源,支持跨机器和环境的协作,从而简化了开发流程。
与 AI 开发工具和存储库集成。AI Workbench 与 GitHub、NVIDIA NGC 和 Hugging Face 等服务和 Git 服务器集成,用户可以使用 JupyterLab 和 VS Code 等工具跨平台和基础设施进行开发,具有高度的可重复性和透明度。
增强协作。该项目结构有助于自动化围绕版本控制、容器管理和处理机密信息的复杂任务,同时还支持跨团队协作。
访问加速计算资源:AI Workbench 部署是客户端-服务器模型,用户能够开始在其工作站中的本地计算资源上进行开发,并随着训练作业的规模扩大而转向数据中心或云资源。
英伟达表示,目前戴尔、惠普、Lambda、联想等人工智能基础设施提供商已经采用了 AI Workbench服务,并看到了其提升最新一代多 GPU 能力的潜力。在实际用例中,Workbench 可以帮助用户从单台 PC 上的开发转向更大规模的环境,在所有软件都保持不变的情况下帮助项目投入生产。
此次,围绕着生成式 AI 和数字化时代的开发和内容创作,英伟达还一口气推出了多项的新产品和服务,可以说是涵盖了生成式AI开发的方方面面。
在桌面AI工作站方面,推出了RTX 6000、RTX 5000、RTX 4500和RTX 4000四款新显卡,旨在为全球专业人士提供最新的 AI图形和实时渲染技术。并基于新GPU推出了一套一站式解决方案 RTX Workstation。
针对 AI 训练和推理、3D 设计和可视化、视频处理和工业数字化等计算密集型应用的需求,推出了配备 Nvidia L40S GPU 的 Nvidia OVX 服务器,旨在加速多个行业的工作流程和服务。
发布最新版本的企业软件平台 Nvidia AI Enterprise 4.0,同时引入用于构建和定制生成式 AI 基础模型的端到端框架 Nvidia NeMo,旨在为企业提供在其运营中集成和部署生成式 AI 模型的工具,但以安全的方式和稳定的 API 连接。
推出了GPU 加速的软件开发套件和云原生微服务 Maxine,让专业人士、团队和创作者能够利用人工智能的力量并创造高质量的音频和视频效果,从而改进实时通信服务。此外Nvidia Research 还宣布推出人工智能驱动的 3D 视频技术,在沉浸式通信领域取得进展。
随着英伟达一个接一个新产品和新服务的揭晓,我们似乎也看到生成式AI的生产力爆炸时代正在加速到来。
在人工智能的驱动下,英伟达今年的来收益和股价节节攀升,公司市值一度突破万亿美元。但越是风光,竞争对手就越是虎视眈眈。随着人工智能芯片荒的加剧,巨头们都开始加大投资、奋起直追。
比如,就在今天的大会不久前,AMD刚刚发布了自己“大模型专用”的AI芯片MI300X,直接对标H100。此外,谷歌、亚马逊、特斯拉等也都在设计自己的定制人工智能推理芯片。但目前来看,在越来越激烈的赛道上,跑在最前边的英伟达丝毫没有松懈。
靠AI“翻身”的英伟达,显然还想要乘着AI的风跑得更快、更远。
*参考资料:Nivida Technical Blog
标签:
精彩推荐
智通财经获悉,8月8日,第一太平戴维斯发布2023年第二季香港写字楼租赁
药明康德:SummerBloomInvestments(I)Pte Ltd拟减持不超1%公司股份:药
相信大家对轩逸1 6lxe和xl什么区别,轩逸1 6xe和xl是什么意思?的问题
在这一场焦点战开打之前,足协就上一轮绝平球被吹一事向成都蓉城道歉,
心理过程——注意,是教资考试中一个必备考点,考查形式多为识记类题目
中集安瑞科(03899)现涨超4%,截至发稿,涨3 78%,报7 68港元,成交额10
佛州州长德桑蒂斯(RonDeSantis)继批评前总统特朗普的选举舞弊论之
随着英国央行接近结束紧缩周期,英镑年内出乎预期的涨势可能气数已尽。
刘海波被带走涉及何事,目前尚未有官方说法。
导读1、可信很多东西不用钱当然也有要钱的不过都比淘宝天猫的价格低用
2023年8月8日,台湾食药署发布边境查验不合格食品名单显示,菲律宾一批
抗洪物资专车持续开行,超10万件救援物资送至京津冀及东北(图为:菜鸟
近日,经省政府审定同意,省消防安全委员会印发了《云南省消防安全委员
让我们在更深层次上维护好、管理好、运用好大运遗产,不断推动体育强国
今年有多热2023?据了解,空调销售在近期延续了今年以来同比量价齐升的
原标题:主产区已完成预计旺季收购量六成左右——(引题)我国夏粮购销
央视网消息:最近,吉林舒兰市持续降雨造成部分桥梁、道路损毁。北部战
近日,京津冀遭遇强降水,在抢险救援中,北京市房山区蓝天救援队队员王
地震前天空出现红光?地震时猫狗都有哪些异常?地震后为什么感到头痛?
马斯克的大脑芯片初创公司Neuralink完成了新一轮2 8亿美元融资,由“硅
8月7日,江苏舜天(600287)融资买入117 85万元,融资偿还245 08万元,
1、排卵期一般在下一次月经前的14天,而不是在这一次开始后的14天。2、
大皖新闻讯“我当时交了1万块钱房屋认购定金,拿到认购书才发现付款日
英国演艺界的宝藏,本·金斯利,他的演艺传奇令人惊叹。作为一位多才多
1、大行sp18和p8的区别:出厂时间不同:sp18是一个全新的折叠运动自行
资讯News
06-20
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...