Agentic AI Ecosystem

Ollama Small Models

Agentic AI Ecosystem

Ayush7614/agentic-ai-ecosystem

Home
Guides
Guides
- Qwen Agentic RAG
  Qwen Agentic RAG
  - Overview
  - Full tutorial
- OpenClaw + Gemma + RAG
  OpenClaw + Gemma + RAG
  - Overview
  - Full tutorial
- OpenClaw + MiniCPM-V
  OpenClaw + MiniCPM-V
  - Overview
  - Full tutorial
- Claude Code .claude/
  Claude Code .claude/
  - Overview
  - Full tutorial
- Awesome Hermes Agent
  Awesome Hermes Agent
- Hermes vs OpenClaw
  Hermes vs OpenClaw
- MCP Visual Guide
  MCP Visual Guide
  - Overview
  - Full tutorial
- Stripe Projects MCP Server
  Stripe Projects MCP Server
  - Overview
  - Full tutorial
- MiniCPM-V MCP Server
  MiniCPM-V MCP Server
  - Overview
  - Full tutorial
- MiniCPM-V Benchmark
  MiniCPM-V Benchmark
  - Overview
  - Full tutorial
- ML Model in 6 Steps
  ML Model in 6 Steps
  - Overview
  - Full tutorial
- Solo Engineer Stack
  Solo Engineer Stack
- Loop Engineering
  Loop Engineering
  - Overview
  - Full tutorial
- Harness Engineering
  Harness Engineering
  - Overview
  - Full tutorial
- LLM Fine-Tuning
  LLM Fine-Tuning
  - Overview
  - Full tutorial
- AI Agents Masterclass
  AI Agents Masterclass
  - Overview
  - Full tutorial
- Hermes Agent Masterclass
  Hermes Agent Masterclass
  - Overview
  - Full tutorial
- Hermes Profile Builder
  Hermes Profile Builder
  - Overview
  - Full tutorial
- OpenClaw
  OpenClaw
  - Overview
  - Full tutorial
- OpenCode Agent Masterclass
  OpenCode Agent Masterclass
  - Overview
  - Full tutorial
- ZeroClaw Agent Masterclass
  ZeroClaw Agent Masterclass
  - Overview
  - Full tutorial
- OpenClaude Agent Masterclass
  OpenClaude Agent Masterclass
  - Overview
  - Full tutorial
- PicoClaw Agent Masterclass
  PicoClaw Agent Masterclass
  - Overview
  - Full tutorial
- Ollama Small Models
  Ollama Small Models
  - Overview
  - Full tutorial
- Anthropic Cybersecurity Skills
  Anthropic Cybersecurity Skills
Publishing

Overview

Which Ollama tags fit 8 GB vs 16 GB laptops (disk size ≠ RAM at inference)
New 2026 models: Gemma 4, Qwen 3.5/3.6, GLM-4.7-Flash, LFM2.5, MiniCPM-V, North Mini Code
Terminal workflow: ollama pull → ollama run → streaming response → REST API
Task-specific picks: chat, coding, vision, embeddings, tool/agent loops
Wiring models into OpenClaw, PicoClaw, and MCP stacks

RAM tiers — 8 GB vs 16 GB model picks

One-GIF overview (blog hero): mega-ollama-small-models.gif

RAM tiers

Full tutorial — Parts 1–16 (RAM math → model catalog → agents)
Examples — pull scripts for 8 GB / 16 GB, OpenClaw snippet, Modelfile
Assets — diagram + terminal GIFs (pull, run, response), blog poster

Read the full tutorial → Ollama models → GitHub →