Architecture : [RTX 5090] → [Ollama] → [Open WebUI / API] → [Utilisateur / n8n / LangChain]
🤖 Modèles LLM déployés
FamilleModèlesUsage
MetaLlama 3.xLLM généraliste haute qualité
Mistral AIMistral 7B/22BLLM efficace, bon rapport perf/taille
GoogleGemma 2LLM compact et rapide
MicrosoftPhi-3LLM petit format
NousResearchHermesAgent IA avancé
🖥️ Interfaces & Outils
OutilRôlePort
Open WebUIInterface chat (type ChatGPT)3000
Ollama APIAPI REST pour intégrations11434
n8nOrchestration workflows IA5678
💻 Commandes Ollama
bash
# Lister les modèles installés
ollama list

# Télécharger un modèle
ollama pull mistral
ollama pull llama3

# Inférence directe
ollama run mistral

# API REST
curl http://localhost:11434/api/generate \\
  -d '{"model": "mistral", "prompt": "Résume en 3 points :", "stream": false}'
🎯 Compétences acquises
  • Hébergement local de LLM (infrastructure IA privée, sans cloud)
  • Comparaison et sélection de modèles LLM selon les besoins
  • Configuration Ollama (modèles, API, paramètres d'inférence)
  • Déploiement Open WebUI comme interface utilisateur
  • Intégration LLM dans des pipelines via API REST
  • Architecture agents IA avec Hermes + n8n

Pages liées