GN7是全球首个公有云上基于NVIDIA T4以及vComputeServer的虚拟化实例,能够加速人工智能、机器学习和数据科学的工作负载。
今日,腾讯云正式对外发布基于 NVIDIA T4 的虚拟GPU(vGPU)计算产品GN7实例,这也是全球首家公有云实现了基于NVIDIA T4 GPU及 NVIDIA vComputeServer 软件 的vGPU实例。
基于多精度支持,NVIDIA T4拥有可加速深度学习训练和推理、机器学习以及数据科学工作负载的 Tensor Core,以及丰富的平台堆栈,包括用于深度学习的cuDNN、用于数据分析和机器学习的NVIDIA RAPIDS、用于云工作站图形的NVIDIA Quadro虚拟工作站和用于云游戏的NVIDIA游戏软件。结合用于GPU虚拟化的 vComputeServer软件,腾讯云客户可以灵活选择在虚拟环境中运行GPU加速的工作负载,从而在提高安全性和利用率的同时降低成本。
腾讯云副总裁刘颖表示:“人工智能的迅速发展对算力需求提出了各种挑战,而我们专注解决这些问题,为客户提供全方位的产品解决方案。腾讯云GN7实例通过部署NVIDIA T4 GPU,提供丰富多样的实例规格,满足从计算视觉到语音以及NLP等不同层次的算力需求。NVIDIA vComputeServer进一步丰富了算力粒度,为用户提供了更多选择的可能,最终为客户节省成本。”
NVIDIA专业可视化业务副总裁Bob Pette表示:“企业正在迅速实施人工智能(AI)策略,AI策略需要依靠现代应用程序才能实现,而现代应用程序则需强大算力的支持。如今,在NVIDIA vComputeServer的助力之下,腾讯云可以轻松地帮助客户实施并扩展数据分析、机器学习、AI以及企业中的其他工作负载。”
多重特性,广泛适用不同AI场景
凭借强大的计算能力和弹性能力,GN7实例在海量数据处理和人工智能领域都具有广阔的应用价值。它既可以满足诸如搜索、大数据分析等需要对海量数据进行处理的业务场景,也可以作为深度学习训练和推理的系统平台。GN7实例的虚拟化特性也十分适合互联网业务中人工智能业务的批量部署以及云游戏,AR/VR在云端的应用。目前GN7实例已经在腾讯云自有的智能钛弹性模型服务(TI-EMS)上实现了应用。该平台通过使用vGPU做小模型推理,帮助用户解决复杂模型部署和GPU利用成本效益等问题。
进一步降低成本
GN7实例降低了GPU加速的初始投资成本,是初创企业、大学和企业在评估AI时的经济选择。 NVIDIA vComputeServer软件通过对NVIDIA T4进行虚拟化,使多台虚拟机(VM)可以同时访问GPU或者使一台虚拟机可以访问多颗 GPU,从而实现性能的最大化。因此,腾讯云用户可以根据工作负载的需求灵活选择对应的GPU加速量。
比如在进行简单模型推理这一类低算力需求的应用时,用户无须再像以往必须使用单颗物理GPU,而是可以根据自身业务具体类型对GPU算力的需求,灵活选择匹配的vGPU资源,提升了计算资源的利用率,从而有效降低用户的使用成本,避免因配置不足或配置过度而产生成本。比如,通过使用1/2 vGPU实例规格,成本相对单卡实例降低了50%。
更出色的安全性
一直以来,腾讯云都在致力于通过最新虚拟化技术研发为用户提供最安全最便利的异构计算产品。GN7实例具有更出色的性能与安全性,能够安全隔离公有云上的实例。 相比过往进程级别的虚拟化GPU,GN7的升级点在于其提供的设备级虚拟化vGPU是完全模拟出来一个GPU设备,在支持GPU硬件的绝大多数特性的同时,还能够做到操作系统级别的隔离,而且不同的用户使用也不用担心资源争抢的问题。
下周,在于苏州举办的GTC大会上,腾讯云海将会演示NVIDIA GPU加速的云服务,并介绍如何从云端部署AI工作负载。