Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

1,199

Full-text search

Active filters: nvidia

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated 6 days ago • 90.1k • 200

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated about 3 hours ago • 263k • 524

nvidia/Qwen2.5-CascadeRL-RM-72B

Text Generation • 71B • Updated 5 days ago • 20 • 8

nvidia/gliner-PII

Token Classification • Updated 29 days ago • 3.04k • 53

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-Base-BF16

Text Generation • 32B • Updated about 3 hours ago • 8.28k • 86

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Text Generation • 32B • Updated about 3 hours ago • 552k • 218

nvidia/Cosmos-Reason2-8B

Image-Text-to-Text • 9B • Updated 17 days ago • 18.3k • 20

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated 25 days ago • 20.6k • 17

nvidia/Cosmos-Predict2.5-2B

Updated 18 days ago • 41k • 43

nvidia/Nemotron-Cascade-8B-Thinking

Text Generation • 8B • Updated 5 days ago • 1.45k • 30

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 7 days ago • 227 • 4

nvidia/Cosmos-Reason2-2B

Image-Text-to-Text • Updated 17 days ago • 6.94k • 11

nvidia/Cosmos-Reason1-7B

Image-Text-to-Text • 8B • Updated 27 days ago • 73.4k • 224

nvidia/OpenMath-Nemotron-14B

Text Generation • 15B • Updated Apr 30, 2025 • 190 • 16

nvidia/Qwen3-Nemotron-235B-A22B-GenRM

Text Generation • 235B • Updated 22 days ago • 270 • 16

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 7 days ago • 1.78k • 2

nvidia/Nemotron-Cascade-8B

Text Generation • 8B • Updated 5 days ago • 4.27k • 45

Ex0bit/Elbaz-NVIDIA-Nemotron-3-Nano-30B-A3B-PRISM

Text Generation • 32B • Updated 18 days ago • 2.34k • 5

nvidia/Mistral-NeMo-12B-Base

Updated Jul 18, 2024 • 159 • 41

nvidia/Llama-3.1-Nemotron-70B-Reward

Updated Apr 13, 2025 • 20 • 78

nvidia/Llama-3.1-Nemotron-70B-Instruct

Updated Apr 13, 2025 • 49 • 568

nvidia/Cosmos-1.0-Diffusion-7B-Text2World

Text-to-Video • Updated May 7, 2025 • 3.39k • 230

roleplaiapp/Llama-3.1-Nemotron-70B-Instruct-HF-Q4_K_M-GGUF

Text Generation • 71B • Updated Jan 19, 2025 • 202 • 2

nvidia/Cosmos-Guardrail1

Updated Apr 1, 2025 • 17.9k • 14

nvidia/Nemotron-H-8B-Base-8K

Text Generation • 8B • Updated Aug 21, 2025 • 11.3k • 53

nvidia/Cosmos-Predict2-2B-Text2Image

Text-to-Image • Updated Jun 17, 2025 • 135 • 65

nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated Jul 23, 2025 • 1.6k • 34

nvidia/Cosmos-Predict2-14B-Video2World

Image-to-Video • Updated Jul 23, 2025 • 116 • 28

unsloth/AceReason-Nemotron-14B-GGUF

Text Generation • 15B • Updated May 23, 2025 • 426 • 8

bartowski/nvidia_AceReason-Nemotron-14B-GGUF

Text Generation • 15B • Updated May 23, 2025 • 429 • 10