Use reserveTokens for branch summary (tokens left for prompt + response)

- tokenBudget = contextWindow - reserveTokens - Default 16384, same as compaction - Consistent naming with CompactionSettings.reserveTokens
2026-04-19 21:00:30 +00:00 · 2025-12-29 21:36:23 +01:00 · 2025-12-29 21:36:23 +01:00 · dc5fc4fc40
commit dc5fc4fc40
parent f5f39f08f1
3 changed files with 12 additions and 8 deletions
--- a/packages/coding-agent/src/core/agent-session.ts
+++ b/packages/coding-agent/src/core/agent-session.ts
@ -1656,7 +1656,7 @@ export class AgentSession {
 				apiKey,
 				signal: this._branchSummaryAbortController.signal,
 				customInstructions: options.customInstructions,
-				maxTokens: branchSummarySettings.maxTokens,
+				reserveTokens: branchSummarySettings.reserveTokens,
 			});
 			this._branchSummaryAbortController = undefined;
 			if (result.aborted) {
--- a/packages/coding-agent/src/core/compaction/branch-summarization.ts
+++ b/packages/coding-agent/src/core/compaction/branch-summarization.ts
@ -53,8 +53,8 @@ export interface GenerateBranchSummaryOptions {
 	signal: AbortSignal;
 	/** Optional custom instructions for summarization */
 	customInstructions?: string;
-	/** Maximum tokens to include in summary context (default 100000) */
+	/** Tokens reserved for prompt + LLM response (default 16384) */
-	maxTokens?: number;
+	reserveTokens?: number;
 }
 // ============================================================================
@ -321,9 +321,13 @@ export async function generateBranchSummary(
 	entries: SessionEntry[],
 	options: GenerateBranchSummaryOptions,
 ): Promise<BranchSummaryResult> {
-	const { model, apiKey, signal, customInstructions, maxTokens = 100000 } = options;
+	const { model, apiKey, signal, customInstructions, reserveTokens = 16384 } = options;
-	const { messages, fileOps } = prepareBranchEntries(entries, maxTokens);
+	// Token budget = context window minus reserved space for prompt + response
 	const contextWindow = model.contextWindow || 128000;
 	const tokenBudget = contextWindow - reserveTokens;
 	const { messages, fileOps } = prepareBranchEntries(entries, tokenBudget);
 	if (messages.length === 0) {
 		return { summary: "No content to summarize" };
--- a/packages/coding-agent/src/core/settings-manager.ts
+++ b/packages/coding-agent/src/core/settings-manager.ts
@ -9,7 +9,7 @@ export interface CompactionSettings {
 }
 export interface BranchSummarySettings {
-	maxTokens?: number; // default: 100000 (max tokens to include in branch summary context)
+	reserveTokens?: number; // default: 16384 (tokens reserved for prompt + LLM response)
 }
 export interface RetrySettings {
@ -260,9 +260,9 @@ export class SettingsManager {
 		};
 	}
-	getBranchSummarySettings(): { maxTokens: number } {
+	getBranchSummarySettings(): { reserveTokens: number } {
 		return {
-			maxTokens: this.settings.branchSummary?.maxTokens ?? 100000,
+			reserveTokens: this.settings.branchSummary?.reserveTokens ?? 16384,
 		};
 	}