中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片单芯片混合精度浮点算力达到了 896 TFLOPS,性能较其前代产品「刹那」提升了三倍。在 8-bit 推理方面,算力更是达到了 1792 TOPS,能够应对需要处理大量词元且高并发的推理任务。与上一代相比,「须臾」在显存容量和芯片内部互联速度方面均有显著增强,并支持极长的上下文长度。该芯片的额定功耗为 600W,相较于传统的算力芯片,功耗降低了 50%,有助于推广低碳数据中心。
值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整体系统软件均由中昊芯英完全自主研发,不依赖任何海外核心技术,从而能够满足政务、金融、电网等行业在安全合规方面的要求。
在此次发布会上,「泰则 2.0」高性能智算平台也一同亮相。「泰则 2.0」被定位为高性能智算平台中的基础计算单元,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。其物理形态表现为一台通用 CPU 服务器连接一台高性能 TPU 算力加速设备,整体算力可达 7.168 PFLOPS(混合精度)。在执行相同任务时,该平台的整体能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在模型训练方面,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。目前,该平台已深度适配了 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使得开发者能够高效地完成模型的迁移工作。

资深球迷
凭借其全面的功能和卓越的赛事覆盖,本平台为您提供无与伦比的观赛体验。
回复