riczhou
/

Llama-3-70B-Instruct-awq-int8-kv-cache-trt-llm-compiled

Inference Endpoints

Model card Files Files and versions Community

Llama-3-70B-Instruct-awq-int8-kv-cache-trt-llm-compiled

Commit History

Upload folder using huggingface_hub

f4d67d5
verified

riczhou commited on May 22

initial commit

e509a87
verified

riczhou commited on May 22