速率限制

服务商对你每秒或每分钟能发出的请求数量设定的上限——既是限制,也是保护。

它在做什么?

速率限制就是服务商在说:"你每分钟最多只能向我发送 60 个请求,超过的我就不接了。"

当你的请求超过了这个限制,服务会返回一个错误(通常是 429 Too Many Requests),告诉你"太快了,请稍后再试"。

为什么它对你是好事?

速率限制虽然看起来是一种约束,但它实际上也是一种保护。如果你的代码里不小心出现了一个死循环,不停地调用某个付费接口,速率限制会在一定程度上"刹车"——阻止你的请求以无限制的速度消耗额度。

当然,仅靠速率限制并不能完全防止费用失控(它只是限制了速度,不是限制了总量),所以你还是需要设置预算告警和用量上限。

有什么需要注意的?

如果你的应用在正常使用中触发了速率限制,说明要么你的请求频率确实太高了,要么你需要升级到更高的服务套餐。你也可以让 AI 在你的代码中加入"退避重试"的逻辑——遇到限流时等待几秒后自动重试。

也叫

Rate LimitRate Limiting限流请求频率限制

和谁相连

参见