GPU 云服务器的软件系统设计和实践
14其乐融融 发布于 2025/03/05 02:02:10
大模型推理需求的爆发,将使得成本的关注变得非常敏感。相比算力的提高,大模型推理对 GPU 显存的大小和互联带宽有着更高的需求,从 DeepSeek R1/V3 可见一斑。
阅读(123)评论(0)赞 (9)
其乐融融 发布于 2025/03/05 02:02:10
大模型推理需求的爆发,将使得成本的关注变得非常敏感。相比算力的提高,大模型推理对 GPU 显存的大小和互联带宽有着更高的需求,从 DeepSeek R1/V3 可见一斑。
阅读(123)评论(0)赞 (9)
其乐融融 发布于 2023/10/28 02:02:26
自建机房,如果 macOS 集群规模比较小,对自动化要求不高,建议购买高配的 apple 硬件,然后通过 Virtualization.Framework 虚拟化出多台 macOS 机器,整体架构比较简单,也能解决问题。
阅读(440)评论(0)赞 (11)
其乐融融 发布于 2023/10/25 02:08:25
对于API的暴露,研究发现大多数的容器(2,920个)属于亚马逊AWS这类云服务器提供商,其中部分属于Stripe这样的金融服务。
阅读(419)评论(0)赞 (14)
其乐融融 发布于 2023/08/07 04:10:14
对于API的暴露,研究发现大多数的容器(2,920个)属于亚马逊AWS这类云服务器提供商,其中部分属于Stripe这样的金融服务。
阅读(468)评论(0)赞 (15)
其乐融融 发布于 2023/06/21 23:01:23
自建机房,如果 macOS 集群规模比较小,对自动化要求不高,建议购买高配的 apple 硬件,然后通过 Virtualization.Framework 虚拟化出多台 macOS 机器,整体架构比较简单,也能解决问题。
阅读(423)评论(0)赞 (10)