xieydd
xieydd

你好,我是 xieydd

AI Infra Engineer's Blog

LLM Infra 你需要知道的一切

LLM Infra 你需要知道的一切 GPT 3 GPT 模型是 LLM 模型的起点,你如果说 Transformer 是,那也没错。既然我们要讨论 LLM Infra,那么我们需要知道我们的系统架构以及设计是给

向量数据库中的门门道道

加入 Tensorchord 已经一年有余,一直也没有时间静下心来写一些文章。主要是有了彤彤女儿后,事情多了很多。中间也经历过业务从 Serverless 模型推理 Modelz pivot 到向量搜索领域 VectorChord 的

优化模型推理的冷启动

之前在做 Serverless 模型推理 Modelz,虽然现在已经 pivot 了,但是还是想分享一下如何优化模型推理的冷启动问题。由于我们的服务是基于容器调度,所以这里也涉

全部文章