Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

1,241

Full-text search

Active filters: llama.cpp

CHHIEVTONG/chhievtong-ly-gguf

8B • Updated about 14 hours ago

NhatCuong22/functiongemma-gguf

0.3B • Updated about 14 hours ago

ChetanCh/qwen3

0.6B • Updated about 13 hours ago

jessitoi/LlamaTrader

8B • Updated about 11 hours ago

RinKana/Qwen2.5-3B-Deconstruct-V2-103-GGUF

3B • Updated about 10 hours ago

vural2123/Qwen3-14B-Reasoning-Premium

15B • Updated about 5 hours ago

LyBunleang/ly_bunleang-gguf

8B • Updated about 8 hours ago

antony9952/Qwen_McMillan_Model

2B • Updated about 8 hours ago

notgoodkeeper/My_Evo_Llama_GGUF

8B • Updated about 7 hours ago

WarlordHermes/Chekhov-10B-Test-GGUF

9B • Updated about 5 hours ago

AbdelilahYounsi/Qwen2.5-0.5B-Instruct-summarization-GGUF

0.5B • Updated about 2 hours ago