之前在做 Serverless 模型推理 Modelz,虽然现在已经 pivot 了,但是还是想分享一下如何优化模型推理的冷启动问题。由于我们的服务是基于容器调度,所以这里也涉
最近在研究 Postgres 高可用的方案,这里记录一下。 Postgres 高可用 高可用目标 Postgres 高可用一般有两个目标: RPO(Recovery Point Objective)即数据恢复点
最近在搞在内部自研平台上做一些 NUMA 感知调度的工作,涉及到 kubernetes 节点资源拓扑的发现以及调度方面的内容。但是无奈才疏学浅,遇到问题查问题,一知半解的始
加入 Tensorchord 已经一年有余,一直也没有时间静下心来写一些文章。主要是有了彤彤女儿后,事情多了很多。中间也经历过业务从 Serverless 模型推理 Modelz pivot 到向量搜索领域 VectorChord 的