联想AI服务器首次实现低于1TB本地部署DeepSeek满血大模型
1其乐融融 发布于 2025/03/04 02:02:07
联想实测数据显示,在512 token标准测试环境下,该系统可支持100个并发用户持续获得每秒10 token的稳定输出,首token响应时间压缩至30秒内。即便面对4K长序列复杂场景,仍能保持25个并发用户同等性能表现。
阅读()评论(0)赞 ()
其乐融融 发布于 2025/03/04 02:02:07
联想实测数据显示,在512 token标准测试环境下,该系统可支持100个并发用户持续获得每秒10 token的稳定输出,首token响应时间压缩至30秒内。即便面对4K长序列复杂场景,仍能保持25个并发用户同等性能表现。
阅读()评论(0)赞 ()
其乐融融 发布于 2023/10/29 02:02:26
8月18日,在2023中国算力大会上,联想重磅发布两款AI服务器新品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。
阅读()评论(0)赞 ()
其乐融融 发布于 2023/08/18 23:01:13
8月18日,在2023中国算力大会上,联想重磅发布两款AI服务器新品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。
阅读()评论(0)赞 ()