LLM Infra 你需要知道的一切 GPT 3 GPT 模型是 LLM 模型的起点,你如果说 Transformer 是,那也没错。既然我们要讨论 LLM Infra,那么我们需要知道我们的系统架构以及设计是给
你好,我是 xieydd
AI Infra Engineer's Blog
加入 Tensorchord 已经一年有余,一直也没有时间静下心来写一些文章。主要是有了彤彤女儿后,事情多了很多。中间也经历过业务从 Serverless 模型推理 Modelz pivot 到向量搜索领域 VectorChord 的
之前在做 Serverless 模型推理 Modelz,虽然现在已经 pivot 了,但是还是想分享一下如何优化模型推理的冷启动问题。由于我们的服务是基于容器调度,所以这里也涉