速率限制
服务商对你每秒或每分钟能发出的请求数量设定的上限——既是限制,也是保护。
它在做什么?
速率限制就是服务商在说:"你每分钟最多只能向我发送 60 个请求,超过的我就不接了。"
当你的请求超过了这个限制,服务会返回一个错误(通常是 429 Too Many Requests),告诉你"太快了,请稍后再试"。
为什么它对你是好事?
速率限制虽然看起来是一种约束,但它实际上也是一种保护。如果你的代码里不小心出现了一个死循环,不停地调用某个付费接口,速率限制会在一定程度上"刹车"——阻止你的请求以无限制的速度消耗额度。
当然,仅靠速率限制并不能完全防止费用失控(它只是限制了速度,不是限制了总量),所以你还是需要设置预算告警和用量上限。
有什么需要注意的?
如果你的应用在正常使用中触发了速率限制,说明要么你的请求频率确实太高了,要么你需要升级到更高的服务套餐。你也可以让 AI 在你的代码中加入"退避重试"的逻辑——遇到限流时等待几秒后自动重试。
也叫
Rate LimitRate Limiting限流请求频率限制
和谁相连
参见