rui 的 blog

NoSuchUpload 复盘:为什么 Ceph RGW 在 Complete 阶段更不容易翻车

在一次真实 multipart 上传故障里,NoSuchUpload/InvalidUploadID 并不等于“客户端传错 uploadID”。本文基于 JuiceFS gateway 与 Ceph RGW 源码,给出完整证据链与修复优先级。

Administrator Administrator 发布于 2026-03-02

A2A 初理解:让 AI Agent 真正“互相协作”的通用协议

A2A 初理解:让 AI Agent 真正“互相协作”的通用协议 最近在补 Agent 方向时,我发现一个很关键但容易被忽略的问题: 我们现在能很快做出“单个 Agent”,但真正难的是让多个 Agent 跨框架、跨团队、跨系统稳定协作。 A2A (Agent2Agent) 就是为这个问题设计的。

Administrator Administrator 发布于 2026-02-28

模型即芯片:AI 推理新分叉

从“模型是软件”到“模型即芯片”:这条路会不会是 AI 推理的新分叉? 最近看到一条很有意思的消息: 一家叫 Taalas 的公司在推一个叫 Atlas 的芯片方案,核心思路不是“做一块更通用的 GPU”,而是把训练好的模型直接“固化”成硬件结构来跑推理。 这件事最吸引我的点,不是它喊了多高的性能数

Administrator Administrator 发布于 2026-02-24

训练初了解:把大模型看成一个复杂函数(通俗版)

最近开始看训练相关的东西(主要是了解,不持续学习是不行的),先不搞复杂框架,先把最核心的一条线搞明白。 我现在的理解很朴素: 大模型就是一个很复杂的函数,参数非常多。 训练这件事,本质上就是不断调这些参数(通常写成 w),让输出越来越接近目标答案。 背景 我之前主要做存储和后端,习惯先把链路走通,再

Administrator Administrator 发布于 2026-02-22

raft leader选举

raft leader选举 raft介绍 是一种 强一致性、 去中心化、 高可用 的分布式协议,是一种leader-based的共识算法;

Administrator Administrator 发布于 2025-01-18

cas 无锁编程

cas 无锁编程 引言 引言 最近面试 经常问到多线程的问题,如多个线程操作一个数据,如何保证数据同步一

Administrator Administrator 发布于 2024-11-11

kafka 的创建topic 流程(一)更新中

kafka 的创建topic 流程(一)更新中 kafka 版本 2.6 创建一个 topic 后,kafka 底层做了什么?生成了什么元数据以及存放在哪?

Administrator Administrator 发布于 2024-10-13

kafka 的删除策略

kafka 的删除策略 前段时间客户咨询了个Kafka过期策略删除的问题,趁着机会,深入理解下 kafka 日志数据若是设置了清除策

Administrator Administrator 发布于 2024-10-12

编译过程<2>(目标文件)

编译过程<2>(目标文件) 前言 前言 从源码到可执行文件,中间的过程中会生成 .o 文件,也就是目标文件

Administrator Administrator 发布于 2024-04-19

性能定位过程

性能定位过程 前言 前言 近期做一些性能调优的事,很折腾人,麒麟的OS 和 centos OS 读写性能差距很大,尤

Administrator Administrator 发布于 2024-03-21
上一页 下一页