scenarios/workload-genai/policies/fragments/rate-limiting/rate-limiting-workaround.xml

<fragment>   <rate-limit-by-key calls="500" renewal-period="60" counter-key="GlobalTokensLimit" increment-condition="@(context.Response.StatusCode >= 200 && context.Response.StatusCode < 400)" increment-count="@(context.Response.Body.As<JObject>(true).SelectToken("usage.total_tokens").ToObject<int>())" remaining-calls-variable-name="globalRemainingTokens" remaining-calls-header-name="x-apim-global-remaining-tokens"/> </fragment>

scenarios/workload-genai/policies/fragments/rate-limiting/rate-limiting-workaround.xml (9 lines of code) (raw):