Lecture rapide
Les tailles indiquées correspondent aux poids publiés dans la bibliothèque Ollama. La mémoire réellement utilisée dépend aussi de la taille du contexte, du système d'exploitation, du nombre de conversations ouvertes et de l'utilisation CPU ou GPU.
- Laptop 16 Go RAM : privilégier les modèles jusqu'à 8B, idéalement entre 1B et 7B.
- PC confortable 16-32 Go RAM : les modèles 8B à 14B deviennent intéressants, surtout avec un GPU.
- PC gamer 32-64 Go RAM ou GPU 16-24 Go VRAM : les modèles 27B à 32B sont envisageables, mais plus lents et plus gourmands.
Tableau des modèles
| Consommation | Modèle Ollama | Taille | Usage conseillé | Machine cible | Commande |
|---|---|---|---|---|---|
| Très léger | nomic-embed-text | 274 MB | Embeddings, recherche documentaire, RAG. Pas un modèle de chat. | Tous les PC | ollama pull nomic-embed-text |
| Très léger | smollm2:135m | 271 MB | Tests, réponses très simples, contraintes fortes. | Tous les PC | ollama run smollm2:135m |
| Très léger | qwen2.5-coder:0.5b | 398 MB | Petites aides de code, autocomplétion légère. | Tous les PC | ollama run qwen2.5-coder:0.5b |
| Très léger | qwen3:0.6b | 523 MB | Assistant minimal, reformulation, tâches rapides. | Tous les PC | ollama run qwen3:0.6b |
| Très léger | tinyllama | 638 MB | Découverte d'Ollama, essais rapides, faible qualité attendue. | Tous les PC | ollama run tinyllama |
| Léger | gemma3:1b | 815 MB | Questions simples, résumé court, usage multilingue léger. | Laptop 16 Go RAM | ollama run gemma3:1b |
| Léger | qwen2.5-coder:1.5b | 986 MB | Code léger, explication de scripts, petites corrections. | Laptop 16 Go RAM | ollama run qwen2.5-coder:1.5b |
| Léger | deepseek-r1:1.5b | 1.1 GB | Raisonnement léger, math simple, brouillons. | Laptop 16 Go RAM | ollama run deepseek-r1:1.5b |
| Léger | llama3.2:1b | 1.3 GB | Assistant général très compact, reformulation, résumé. | Laptop 16 Go RAM | ollama run llama3.2:1b |
| Léger | qwen3:1.7b | 1.4 GB | Assistant général léger, meilleur compromis que les modèles sub-1B. | Laptop 16 Go RAM | ollama run qwen3:1.7b |
| Léger | smollm2:1.7b | 1.8 GB | Assistant compact, tâches simples en local. | Laptop 16 Go RAM | ollama run smollm2 |
| Standard | qwen2.5-coder:3b | 1.9 GB | Code local léger, revue de fonctions, aide TypeScript/Python. | Laptop 16 Go RAM | ollama run qwen2.5-coder:3b |
| Standard | llama3.2 | 2.0 GB | Assistant général recommandé pour machines modestes. | Laptop 16 Go RAM | ollama run llama3.2 |
| Standard | qwen3:4b | 2.5 GB | Très bon compromis général, raisonnement et rédaction. | Laptop 16 Go RAM | ollama run qwen3:4b |
| Standard | gemma3:4b | 3.3 GB | Assistant général avec support image, résumé, Q/R. | Laptop 16 Go RAM ou GPU léger | ollama run gemma3:4b |
| Confort | mistral | 4.4 GB | Assistant général rapide, bon choix par défaut en 7B. | Laptop 16 Go RAM, mieux avec GPU | ollama run mistral |
| Confort | qwen2.5-coder | 4.7 GB | Code local polyvalent, génération et correction. | Laptop 16 Go RAM, mieux avec GPU | ollama run qwen2.5-coder |
| Confort | llava:7b | 4.7 GB | Analyse d'images, questions visuelles simples. | PC 16-32 Go RAM ou GPU | ollama run llava |
| Confort | deepseek-r1:7b | 4.7 GB | Raisonnement local, math, logique, étapes détaillées. | PC 16-32 Go RAM ou GPU | ollama run deepseek-r1:7b |
| Confort | qwen3 | 5.2 GB | Assistant général solide, raisonnement et outils. | PC 16-32 Go RAM ou GPU | ollama run qwen3 |
| Lourd | gemma3:12b | 8.1 GB | Meilleure qualité générale, vision, rédaction longue. | PC 32 Go RAM ou GPU 12 Go VRAM | ollama run gemma3:12b |
| Lourd | qwen2.5-coder:14b | 9.0 GB | Code plus fiable, refactorings et explications complexes. | PC 32 Go RAM ou GPU 12 Go VRAM | ollama run qwen2.5-coder:14b |
| Lourd | deepseek-r1:14b | 9.0 GB | Raisonnement plus robuste, math/code plus lents. | PC 32 Go RAM ou GPU 12 Go VRAM | ollama run deepseek-r1:14b |
| Lourd | qwen3:14b | 9.3 GB | Assistant général qualitatif, bon niveau de raisonnement. | PC 32 Go RAM ou GPU 12 Go VRAM | ollama run qwen3:14b |
| PC gamer | gemma3:27b | 17 GB | Qualité élevée, vision, tâches longues. Plus lent sans gros GPU. | PC gamer 32-64 Go RAM ou GPU 24 Go VRAM | ollama run gemma3:27b |
| PC gamer | qwen3:30b | 19 GB | Raisonnement avancé, contexte long, usage exigeant. | PC gamer 32-64 Go RAM ou GPU 24 Go VRAM | ollama run qwen3:30b |
| PC gamer | qwen2.5-coder:32b | 20 GB | Code avancé, génération multi-fichiers, raisonnement technique. | PC gamer 32-64 Go RAM ou GPU 24 Go VRAM | ollama run qwen2.5-coder:32b |
| PC gamer | qwen3:32b | 20 GB | Assistant général puissant, mais gourmand. | PC gamer 32-64 Go RAM ou GPU 24 Go VRAM | ollama run qwen3:32b |
| PC gamer | deepseek-r1:32b | 20 GB | Raisonnement avancé, logique, math, code avec temps de réponse plus long. | PC gamer 32-64 Go RAM ou GPU 24 Go VRAM | ollama run deepseek-r1:32b |
Recommandations rapides
Sources principales : bibliothèque officielle Ollama pour les modèles disponibles, Qwen3, Gemma 3, Llama 3.2, DeepSeek-R1, Qwen2.5-Coder, Mistral, LLaVA, SmolLM2, TinyLlama et nomic-embed-text.