scenarios/workload-genai/policies/fragments/rate-limiting/rate-limiting-by-tokens.xml

scenarios/workload-genai/policies/fragments/rate-limiting/rate-limiting-by-tokens.xml (7 lines of code) (raw):

<fragment>  <azure-openai-token-limit counter-key="@(String.Concat(context.Subscription.Id,"-max-token"))" tokens-per-minute="500" estimate-prompt-tokens="true" remaining-tokens-header-name="x-apim-max-remaining-tokens" tokens-consumed-header-name="x-apim-max-consumed-tokens"/> </fragment>