Jakedismo
diff --git a/‎.codegraph.toml.example‎
Lines changed: 27 additions & 8 deletions b/‎.codegraph.toml.example‎
Lines changed: 27 additions & 8 deletions
diff --git a/‎.env.example‎
Lines changed: 22 additions & 3 deletions b/‎.env.example‎
Lines changed: 22 additions & 3 deletions
@@ -5,16 +5,21 @@
 # Embedding Configuration
 # ============================================================================
 [embedding]
-# Provider: "auto", "onnx", "ollama", or "openai"
+# Provider: "auto", "onnx", "ollama", "openai", or "lmstudio"
 # "auto" will detect available models automatically
-provider = "auto"
+# "lmstudio" recommended for MLX + Flash Attention 2 (macOS)
+provider = "lmstudio"
 
 # Model path or identifier
 # For ONNX: Absolute path to model directory (auto-detected from HuggingFace cache)
 # For Ollama: Model name (e.g., "all-minilm:latest")
+# For LM Studio: Model name (e.g., "jinaai/jina-embeddings-v3")
 # For OpenAI: Model name (e.g., "text-embedding-3-small")
-# Leave empty for auto-detection
-model = ""
+# Recommended: jinaai/jina-embeddings-v3 (1536-dim, optimized for code)
+model = "jinaai/jina-embeddings-v3"
+
+# LM Studio URL (default port 1234)
+lmstudio_url = "http://localhost:1234"
 
 # Ollama URL (only used if provider is "ollama")
 ollama_url = "http://localhost:11434"
@@ -23,6 +28,9 @@ ollama_url = "http://localhost:11434"
 # Can also be set via OPENAI_API_KEY environment variable
 # openai_api_key = "sk-..."
 
+# Embedding dimension (1536 for jina-code-embeddings-1.5b, 384 for all-MiniLM)
+dimension = 1536
+
 # Batch size for embedding generation (GPU optimization)
 batch_size = 64
 
@@ -34,16 +42,25 @@ batch_size = 64
 # Set to false for maximum speed if using an external agent
 enabled = false
 
+# LLM provider: "ollama" or "lmstudio"
+# "lmstudio" recommended for MLX + Flash Attention 2 (macOS)
+provider = "lmstudio"
+
 # LLM model identifier
+# For LM Studio: lmstudio-community/DeepSeek-Coder-V2-Lite-Instruct-GGUF/DeepSeek-Coder-V2-Lite-Instruct-Q4_K_M.gguf
 # For Ollama: Model name (e.g., "qwen2.5-coder:14b", "codellama:13b")
-# Leave empty if disabled
-model = ""
+# Recommended: DeepSeek Coder v2 Lite Instruct Q4_K_M (superior performance)
+model = "lmstudio-community/DeepSeek-Coder-V2-Lite-Instruct-GGUF"
+
+# LM Studio URL (default port 1234)
+lmstudio_url = "http://localhost:1234"
 
 # Ollama URL
 ollama_url = "http://localhost:11434"
 
 # Context window size (tokens)
-context_window = 8000
+# DeepSeek Coder v2 Lite: 32768 tokens
+context_window = 32000
 
 # Temperature for generation (0.0 = deterministic, 1.0 = creative)
 temperature = 0.1
@@ -75,7 +92,9 @@ max_concurrent_requests = 4
 # ============================================================================
 [logging]
 # Log level: "trace", "debug", "info", "warn", "error"
-level = "info"
+# Use "warn" during indexing for clean TUI output (recommended)
+# Use "info" for development/debugging
+level = "warn"
 
 # Log format: "pretty", "json", "compact"
 format = "pretty"
@@ -13,7 +13,7 @@ CODEGRAPH_EMBEDDING_PROVIDER=auto
 
 # Embedding Provider Configuration
 # ----------------------------------
-# Provider options: "auto", "onnx", "ollama", or "openai"
+# Provider options: "auto", "onnx", "ollama", "openai", or "lmstudio"
 # CODEGRAPH_EMBEDDING_PROVIDER=auto
 
 # ONNX: Specify model path (or leave empty for auto-detection from HuggingFace cache)
@@ -23,6 +23,13 @@ CODEGRAPH_EMBEDDING_PROVIDER=auto
 # CODEGRAPH_EMBEDDING_MODEL=all-minilm:latest
 # CODEGRAPH_OLLAMA_URL=http://localhost:11434
 
+# LM Studio: Best for MLX + Flash Attention 2 (recommended on macOS)
+# Default: jina-code-embeddings-1.5b (1536 dimensions)
+# CODEGRAPH_EMBEDDING_PROVIDER=lmstudio
+# CODEGRAPH_EMBEDDING_MODEL=jinaai/jina-embeddings-v3
+# CODEGRAPH_LMSTUDIO_URL=http://localhost:1234
+# CODEGRAPH_EMBEDDING_DIMENSION=1536
+
 # OpenAI: Model name (API key configured below in Security section)
 # CODEGRAPH_EMBEDDING_MODEL=text-embedding-3-small
 
@@ -31,19 +38,31 @@ CODEGRAPH_EMBEDDING_PROVIDER=auto
 # Leave empty to use context-only mode (fastest, recommended for agents like Claude/GPT-4)
 # Set to enable local LLM insights generation
 
+# LM Studio with DeepSeek Coder v2 Lite Instruct (recommended)
+# Superior MLX support and Flash Attention 2 on macOS
+# CODEGRAPH_LLM_PROVIDER=lmstudio
+# CODEGRAPH_MODEL=lmstudio-community/DeepSeek-Coder-V2-Lite-Instruct-GGUF/DeepSeek-Coder-V2-Lite-Instruct-Q4_K_M.gguf
+# CODEGRAPH_LMSTUDIO_URL=http://localhost:1234
+# CODEGRAPH_CONTEXT_WINDOW=32000
+# CODEGRAPH_TEMPERATURE=0.1
+
+# Ollama (alternative)
 # LLM model (e.g., "qwen2.5-coder:14b", "codellama:13b")
 # CODEGRAPH_MODEL=qwen2.5-coder:14b
+# CODEGRAPH_OLLAMA_URL=http://localhost:11434
 
 # LLM context window size (tokens)
-# CODEGRAPH_CONTEXT_WINDOW=128000
+# CODEGRAPH_CONTEXT_WINDOW=32000
 
 # LLM temperature (0.0 = deterministic, 1.0 = creative)
 # CODEGRAPH_TEMPERATURE=0.1
 
 # Logging
 # -------
 # Log level: trace, debug, info, warn, error
-RUST_LOG=info
+# Use "warn" during indexing for clean TUI output (recommended)
+# Use "info" for development/debugging
+RUST_LOG=warn
 
 # ============================================================================
 # Security Configuration (for production deployments)