optimum/quanto/library/extensions/cuda/awq/v2/gemm

optimum/quanto/library/extensions/cuda/awq/v2/gemm_cuda.h (2 lines of code) (raw):

#include <torch/extension.h> torch::Tensor awq_v2_gemm_f16i4(torch::Tensor _in_feats, torch::Tensor _kernel, torch::Tensor _scales, torch::Tensor _zeros);