Spaces:

ButterM40
/

local-inference

Running

App Files Files Community

ButterM40 commited on Nov 1

Commit

ef99828

2 Parent(s): 1fdc612 b92dfa7

Merge Space README with project README

Browse files

Files changed (2) hide show

.gitattributes +35 -0
README.md +20 -17

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,12 @@
 # AI Chat & Summarization Web App 🤖
 A beautiful web-based AI application featuring **Chat Generation** and **Text Summarization** powered by Hugging Face models.
@@ -41,18 +50,13 @@ python server.py
 4. Open your browser to `http://localhost:8000`
-## Deploy to Render 🚀
-### Option 1: One-Click Deploy (Recommended)
-1. Fork this repository to your GitHub account
-2. Go to [Render Dashboard](https://dashboard.render.com/)
-3. Click "New +" → "Web Service"
-4. Connect your GitHub repository
-5. Render will automatically detect the `render.yaml` file
-6. Click "Create Web Service"
-### Option 2: Manual Deploy
 1. Go to [Render Dashboard](https://dashboard.render.com/)
 2. Click "New +" → "Web Service"
@@ -66,12 +70,12 @@ python server.py
 5. Click "Create Web Service"
-### Important Notes for Render Deployment
 - ⚠️ **First startup takes 5-10 minutes** as models download (1.5GB+)
 - 💾 **Disk space**: Free tier has 512MB, models need ~1.5GB. Use **Starter plan** or higher
 - 🔄 **Auto-sleep**: Free tier sleeps after 15min of inactivity, takes ~30s to wake up
-- 🎯 **Recommendation**: Use **Starter plan ($7/month)** for:
   - More disk space
   - Better performance
   - No auto-sleep
@@ -125,13 +129,13 @@ LocalInference/
 - **Backend**: FastAPI, PyTorch, Transformers
 - **Frontend**: HTML5, CSS3, JavaScript (Vanilla)
 - **Models**: Hugging Face Transformers
-- **Deployment**: Render
 ## Troubleshooting
-### Models not loading on Render
-- Upgrade to Starter plan for more disk space
-- Check logs in Render dashboard
 ### Slow first response
 - Models load on first request, subsequent requests are faster
@@ -139,7 +143,7 @@ LocalInference/
 ### Out of memory errors
 - Reduce `max_new_tokens` in chat requests
-- Use Starter plan or higher for more RAM
 ## License
@@ -152,4 +156,3 @@ Pull requests are welcome! For major changes, please open an issue first.
 ---
 Made with ❤️ using Hugging Face Transformers

+---
+title: Local Inference
+emoji: 👀
+colorFrom: pink
+colorTo: gray
+sdk: docker
+pinned: false
+---
 # AI Chat & Summarization Web App 🤖
 A beautiful web-based AI application featuring **Chat Generation** and **Text Summarization** powered by Hugging Face models.
 4. Open your browser to `http://localhost:8000`
+## Deploy Options
+### Option 1: Hugging Face Spaces (Docker)
+See [DEPLOY_TO_SPACES.md](DEPLOY_TO_SPACES.md) for detailed instructions.
+### Option 2: Render Manual Deploy
 1. Go to [Render Dashboard](https://dashboard.render.com/)
 2. Click "New +" → "Web Service"
 5. Click "Create Web Service"
+### Important Notes for Deployment
 - ⚠️ **First startup takes 5-10 minutes** as models download (1.5GB+)
 - 💾 **Disk space**: Free tier has 512MB, models need ~1.5GB. Use **Starter plan** or higher
 - 🔄 **Auto-sleep**: Free tier sleeps after 15min of inactivity, takes ~30s to wake up
+- 🎯 **Recommendation**: Use **Starter plan** for:
   - More disk space
   - Better performance
   - No auto-sleep
 - **Backend**: FastAPI, PyTorch, Transformers
 - **Frontend**: HTML5, CSS3, JavaScript (Vanilla)
 - **Models**: Hugging Face Transformers
+- **Deployment**: Hugging Face Spaces, Render
 ## Troubleshooting
+### Models not loading
+- Check disk space in deployment platform
+- Check logs in platform dashboard
 ### Slow first response
 - Models load on first request, subsequent requests are faster
 ### Out of memory errors
 - Reduce `max_new_tokens` in chat requests
+- Use plan with more RAM
 ## License
 ---
 Made with ❤️ using Hugging Face Transformers