Fix token counts in google-gemini-cli.ts for anthropic models.

2026-04-17 08:00:59 +00:00 · 2025-12-20 18:58:26 +01:00 · 2025-12-20 18:58:26 +01:00 · 2a0283ecfd
commit 2a0283ecfd
parent 24f89cf070
1 changed files with 5 additions and 2 deletions
--- a/packages/ai/src/providers/google-gemini-cli.ts
+++ b/packages/ai/src/providers/google-gemini-cli.ts
@ -335,12 +335,15 @@ export const streamGoogleGeminiCli: StreamFunction<"google-gemini-cli"> = (
 					}

 					if (responseData.usageMetadata) {
+						// promptTokenCount includes cachedContentTokenCount, so subtract to get fresh input
+						const promptTokens = responseData.usageMetadata.promptTokenCount || 0;
+						const cacheReadTokens = responseData.usageMetadata.cachedContentTokenCount || 0;
 						output.usage = {
-							input: responseData.usageMetadata.promptTokenCount || 0,
+							input: promptTokens - cacheReadTokens,
 							output:
 								(responseData.usageMetadata.candidatesTokenCount || 0) +
 								(responseData.usageMetadata.thoughtsTokenCount || 0),
-							cacheRead: responseData.usageMetadata.cachedContentTokenCount || 0,
+							cacheRead: cacheReadTokens,
 							cacheWrite: 0,
 							totalTokens: responseData.usageMetadata.totalTokenCount || 0,
 							cost: {