Assistia - Modèles Ollama
Retour accueil

Modèles compatibles Ollama pour PC local

Cette sélection garde uniquement des modèles réalistes pour une machine locale, du laptop i5 avec 16 Go de RAM au PC gamer équipé d'un GPU dédié.

Lecture rapide

Les tailles indiquées correspondent aux poids publiés dans la bibliothèque Ollama. La mémoire réellement utilisée dépend aussi de la taille du contexte, du système d'exploitation, du nombre de conversations ouvertes et de l'utilisation CPU ou GPU.

  • Laptop 16 Go RAM : privilégier les modèles jusqu'à 8B, idéalement entre 1B et 7B.
  • PC confortable 16-32 Go RAM : les modèles 8B à 14B deviennent intéressants, surtout avec un GPU.
  • PC gamer 32-64 Go RAM ou GPU 16-24 Go VRAM : les modèles 27B à 32B sont envisageables, mais plus lents et plus gourmands.

Tableau des modèles

Consommation Modèle Ollama Taille Usage conseillé Machine cible Commande
Très léger nomic-embed-text 274 MB Embeddings, recherche documentaire, RAG. Pas un modèle de chat. Tous les PC ollama pull nomic-embed-text
Très léger smollm2:135m 271 MB Tests, réponses très simples, contraintes fortes. Tous les PC ollama run smollm2:135m
Très léger qwen2.5-coder:0.5b 398 MB Petites aides de code, autocomplétion légère. Tous les PC ollama run qwen2.5-coder:0.5b
Très léger qwen3:0.6b 523 MB Assistant minimal, reformulation, tâches rapides. Tous les PC ollama run qwen3:0.6b
Très léger tinyllama 638 MB Découverte d'Ollama, essais rapides, faible qualité attendue. Tous les PC ollama run tinyllama
Léger gemma3:1b 815 MB Questions simples, résumé court, usage multilingue léger. Laptop 16 Go RAM ollama run gemma3:1b
Léger qwen2.5-coder:1.5b 986 MB Code léger, explication de scripts, petites corrections. Laptop 16 Go RAM ollama run qwen2.5-coder:1.5b
Léger deepseek-r1:1.5b 1.1 GB Raisonnement léger, math simple, brouillons. Laptop 16 Go RAM ollama run deepseek-r1:1.5b
Léger llama3.2:1b 1.3 GB Assistant général très compact, reformulation, résumé. Laptop 16 Go RAM ollama run llama3.2:1b
Léger qwen3:1.7b 1.4 GB Assistant général léger, meilleur compromis que les modèles sub-1B. Laptop 16 Go RAM ollama run qwen3:1.7b
Léger smollm2:1.7b 1.8 GB Assistant compact, tâches simples en local. Laptop 16 Go RAM ollama run smollm2
Standard qwen2.5-coder:3b 1.9 GB Code local léger, revue de fonctions, aide TypeScript/Python. Laptop 16 Go RAM ollama run qwen2.5-coder:3b
Standard llama3.2 2.0 GB Assistant général recommandé pour machines modestes. Laptop 16 Go RAM ollama run llama3.2
Standard qwen3:4b 2.5 GB Très bon compromis général, raisonnement et rédaction. Laptop 16 Go RAM ollama run qwen3:4b
Standard gemma3:4b 3.3 GB Assistant général avec support image, résumé, Q/R. Laptop 16 Go RAM ou GPU léger ollama run gemma3:4b
Confort mistral 4.4 GB Assistant général rapide, bon choix par défaut en 7B. Laptop 16 Go RAM, mieux avec GPU ollama run mistral
Confort qwen2.5-coder 4.7 GB Code local polyvalent, génération et correction. Laptop 16 Go RAM, mieux avec GPU ollama run qwen2.5-coder
Confort llava:7b 4.7 GB Analyse d'images, questions visuelles simples. PC 16-32 Go RAM ou GPU ollama run llava
Confort deepseek-r1:7b 4.7 GB Raisonnement local, math, logique, étapes détaillées. PC 16-32 Go RAM ou GPU ollama run deepseek-r1:7b
Confort qwen3 5.2 GB Assistant général solide, raisonnement et outils. PC 16-32 Go RAM ou GPU ollama run qwen3
Lourd gemma3:12b 8.1 GB Meilleure qualité générale, vision, rédaction longue. PC 32 Go RAM ou GPU 12 Go VRAM ollama run gemma3:12b
Lourd qwen2.5-coder:14b 9.0 GB Code plus fiable, refactorings et explications complexes. PC 32 Go RAM ou GPU 12 Go VRAM ollama run qwen2.5-coder:14b
Lourd deepseek-r1:14b 9.0 GB Raisonnement plus robuste, math/code plus lents. PC 32 Go RAM ou GPU 12 Go VRAM ollama run deepseek-r1:14b
Lourd qwen3:14b 9.3 GB Assistant général qualitatif, bon niveau de raisonnement. PC 32 Go RAM ou GPU 12 Go VRAM ollama run qwen3:14b
PC gamer gemma3:27b 17 GB Qualité élevée, vision, tâches longues. Plus lent sans gros GPU. PC gamer 32-64 Go RAM ou GPU 24 Go VRAM ollama run gemma3:27b
PC gamer qwen3:30b 19 GB Raisonnement avancé, contexte long, usage exigeant. PC gamer 32-64 Go RAM ou GPU 24 Go VRAM ollama run qwen3:30b
PC gamer qwen2.5-coder:32b 20 GB Code avancé, génération multi-fichiers, raisonnement technique. PC gamer 32-64 Go RAM ou GPU 24 Go VRAM ollama run qwen2.5-coder:32b
PC gamer qwen3:32b 20 GB Assistant général puissant, mais gourmand. PC gamer 32-64 Go RAM ou GPU 24 Go VRAM ollama run qwen3:32b
PC gamer deepseek-r1:32b 20 GB Raisonnement avancé, logique, math, code avec temps de réponse plus long. PC gamer 32-64 Go RAM ou GPU 24 Go VRAM ollama run deepseek-r1:32b

Recommandations rapides

Meilleur départ sur laptop 16 Go llama3.2, qwen3:4b ou mistral.
Meilleur choix pour coder qwen2.5-coder en 7B, puis qwen2.5-coder:14b si la machine le permet.
Meilleur choix pour raisonner deepseek-r1:7b ou deepseek-r1:14b, selon les ressources disponibles.
Meilleur choix avec images gemma3:4b pour commencer, puis gemma3:12b ou llava sur une machine plus confortable.

Sources principales : bibliothèque officielle Ollama pour les modèles disponibles, Qwen3, Gemma 3, Llama 3.2, DeepSeek-R1, Qwen2.5-Coder, Mistral, LLaVA, SmolLM2, TinyLlama et nomic-embed-text.