Modèles compatibles Ollama pour PC local

Cette sélection garde uniquement des modèles réalistes pour une machine locale, du laptop i5 avec 16 Go de RAM au PC gamer équipé d'un GPU dédié.

Lecture rapide

Les tailles indiquées correspondent aux poids publiés dans la bibliothèque Ollama. La mémoire réellement utilisée dépend aussi de la taille du contexte, du système d'exploitation, du nombre de conversations ouvertes et de l'utilisation CPU ou GPU.

Laptop 16 Go RAM : privilégier les modèles jusqu'à 8B, idéalement entre 1B et 7B.
PC confortable 16-32 Go RAM : les modèles 8B à 14B deviennent intéressants, surtout avec un GPU.
PC gamer 32-64 Go RAM ou GPU 16-24 Go VRAM : les modèles 27B à 32B sont envisageables, mais plus lents et plus gourmands.

Tableau des modèles

Consommation	Modèle Ollama	Taille	Usage conseillé	Machine cible	Commande
Très léger	nomic-embed-text	274 MB	Embeddings, recherche documentaire, RAG. Pas un modèle de chat.	Tous les PC	`ollama pull nomic-embed-text`
Très léger	smollm2:135m	271 MB	Tests, réponses très simples, contraintes fortes.	Tous les PC	`ollama run smollm2:135m`
Très léger	qwen2.5-coder:0.5b	398 MB	Petites aides de code, autocomplétion légère.	Tous les PC	`ollama run qwen2.5-coder:0.5b`
Très léger	qwen3:0.6b	523 MB	Assistant minimal, reformulation, tâches rapides.	Tous les PC	`ollama run qwen3:0.6b`
Très léger	tinyllama	638 MB	Découverte d'Ollama, essais rapides, faible qualité attendue.	Tous les PC	`ollama run tinyllama`
Léger	gemma3:1b	815 MB	Questions simples, résumé court, usage multilingue léger.	Laptop 16 Go RAM	`ollama run gemma3:1b`
Léger	qwen2.5-coder:1.5b	986 MB	Code léger, explication de scripts, petites corrections.	Laptop 16 Go RAM	`ollama run qwen2.5-coder:1.5b`
Léger	deepseek-r1:1.5b	1.1 GB	Raisonnement léger, math simple, brouillons.	Laptop 16 Go RAM	`ollama run deepseek-r1:1.5b`
Léger	llama3.2:1b	1.3 GB	Assistant général très compact, reformulation, résumé.	Laptop 16 Go RAM	`ollama run llama3.2:1b`
Léger	qwen3:1.7b	1.4 GB	Assistant général léger, meilleur compromis que les modèles sub-1B.	Laptop 16 Go RAM	`ollama run qwen3:1.7b`
Léger	smollm2:1.7b	1.8 GB	Assistant compact, tâches simples en local.	Laptop 16 Go RAM	`ollama run smollm2`
Standard	qwen2.5-coder:3b	1.9 GB	Code local léger, revue de fonctions, aide TypeScript/Python.	Laptop 16 Go RAM	`ollama run qwen2.5-coder:3b`
Standard	llama3.2	2.0 GB	Assistant général recommandé pour machines modestes.	Laptop 16 Go RAM	`ollama run llama3.2`
Standard	qwen3:4b	2.5 GB	Très bon compromis général, raisonnement et rédaction.	Laptop 16 Go RAM	`ollama run qwen3:4b`
Standard	gemma3:4b	3.3 GB	Assistant général avec support image, résumé, Q/R.	Laptop 16 Go RAM ou GPU léger	`ollama run gemma3:4b`
Confort	mistral	4.4 GB	Assistant général rapide, bon choix par défaut en 7B.	Laptop 16 Go RAM, mieux avec GPU	`ollama run mistral`
Confort	qwen2.5-coder	4.7 GB	Code local polyvalent, génération et correction.	Laptop 16 Go RAM, mieux avec GPU	`ollama run qwen2.5-coder`
Confort	llava:7b	4.7 GB	Analyse d'images, questions visuelles simples.	PC 16-32 Go RAM ou GPU	`ollama run llava`
Confort	deepseek-r1:7b	4.7 GB	Raisonnement local, math, logique, étapes détaillées.	PC 16-32 Go RAM ou GPU	`ollama run deepseek-r1:7b`
Confort	qwen3	5.2 GB	Assistant général solide, raisonnement et outils.	PC 16-32 Go RAM ou GPU	`ollama run qwen3`
Lourd	gemma3:12b	8.1 GB	Meilleure qualité générale, vision, rédaction longue.	PC 32 Go RAM ou GPU 12 Go VRAM	`ollama run gemma3:12b`
Lourd	qwen2.5-coder:14b	9.0 GB	Code plus fiable, refactorings et explications complexes.	PC 32 Go RAM ou GPU 12 Go VRAM	`ollama run qwen2.5-coder:14b`
Lourd	deepseek-r1:14b	9.0 GB	Raisonnement plus robuste, math/code plus lents.	PC 32 Go RAM ou GPU 12 Go VRAM	`ollama run deepseek-r1:14b`
Lourd	qwen3:14b	9.3 GB	Assistant général qualitatif, bon niveau de raisonnement.	PC 32 Go RAM ou GPU 12 Go VRAM	`ollama run qwen3:14b`
PC gamer	gemma3:27b	17 GB	Qualité élevée, vision, tâches longues. Plus lent sans gros GPU.	PC gamer 32-64 Go RAM ou GPU 24 Go VRAM	`ollama run gemma3:27b`
PC gamer	qwen3:30b	19 GB	Raisonnement avancé, contexte long, usage exigeant.	PC gamer 32-64 Go RAM ou GPU 24 Go VRAM	`ollama run qwen3:30b`
PC gamer	qwen2.5-coder:32b	20 GB	Code avancé, génération multi-fichiers, raisonnement technique.	PC gamer 32-64 Go RAM ou GPU 24 Go VRAM	`ollama run qwen2.5-coder:32b`
PC gamer	qwen3:32b	20 GB	Assistant général puissant, mais gourmand.	PC gamer 32-64 Go RAM ou GPU 24 Go VRAM	`ollama run qwen3:32b`
PC gamer	deepseek-r1:32b	20 GB	Raisonnement avancé, logique, math, code avec temps de réponse plus long.	PC gamer 32-64 Go RAM ou GPU 24 Go VRAM	`ollama run deepseek-r1:32b`

Recommandations rapides

Meilleur départ sur laptop 16 Go llama3.2, qwen3:4b ou mistral.

Meilleur choix pour coder qwen2.5-coder en 7B, puis qwen2.5-coder:14b si la machine le permet.

Meilleur choix pour raisonner deepseek-r1:7b ou deepseek-r1:14b, selon les ressources disponibles.

Meilleur choix avec images gemma3:4b pour commencer, puis gemma3:12b ou llava sur une machine plus confortable.

Sources principales : bibliothèque officielle Ollama pour les modèles disponibles, Qwen3, Gemma 3, Llama 3.2, DeepSeek-R1, Qwen2.5-Coder, Mistral, LLaVA, SmolLM2, TinyLlama et nomic-embed-text.