还在被token计费搞懵？LLM Provider Usage Statistics帮你把OpenAI/Anthropic/Gemini的账算清楚🔥-Skill优仓

这个Skill是干嘛的

做AI应用开发，最头疼的事之一就是对账——明明感觉用了不多，账单却高得离谱。更烦的是，OpenAI、Anthropic、Gemini三家的token计费逻辑压根不一样，混在一起用的时候，根本搞不清楚钱花哪儿去了。LLM Provider Usage Statistics这个Skill就是专门解决这个问题的，它是一份精准的跨平台token计费与前缀缓存参考手册，直接内嵌到你的AI编程助手上下文里，随时查、随时用。

核心功能

这个Skill的核心价值在于把三家主流LLM提供商的计费差异，用一张张对比表格说清楚，不废话。

token计数语义对比：OpenAI的input_tokens是含缓存的总量，Anthropic的input_tokens却只算非缓存部分，Gemini和OpenAI一样是总量。这个差异如果不知道，Anthropic的账单你永远算不对。正确算法是：total_input = input_tokens + cache_read_input_tokens + cache_creation_input_tokens。
前缀缓存（Prefix Caching）机制对比：三家的最低缓存token门槛都是1024，但启用方式差很多。OpenAI和Gemini 2.0+是自动缓存，Anthropic需要手动在请求里加cache_control断点才能触发，TTL也各不相同（OpenAI约5-10分钟，Anthropic 5分钟，Gemini是动态的）。
推理/思考token追踪：OpenAI的o1、o3系列有reasoning_tokens字段，Gemini 2.0开启thinking模式后有thoughts_token_count，Anthropic的thinking内容则藏在content blocks里，没有独立的usage字段。
分provider详细参考文档：Skill内部还链接了OpenAI、Anthropic、Gemini各自的详细参考文件，覆盖Chat Completions vs Responses API的差异、beta headers配置、usage_metadata字段说明等细节。

适用平台

这个Skill完美适配当前主流的AI编程助手，包括Cursor、GitHub Copilot、Claude Code、OpenAI Codex、Gemini Code Assist、文心快码、腾讯云CodeBuddy、华为云CodeArts等。把它加载进去之后，AI在帮你写token统计、成本分析、缓存优化相关代码时，能直接拿到准确的字段名和计算逻辑，不会再给你生成一堆基于错误假设的代码。对于重度使用多家LLM API的团队来说，这个Skill就是上下文理解能力的”最强外挂”。

实操代码示例

以下是针对Anthropic计费的正确token汇总写法，这也是最容易踩坑的地方：

// Anthropic: input_tokens 不含缓存，必须手动加
const usage = response.usage;
const totalInput = usage.input_tokens
  + (usage.cache_read_input_tokens || 0)
  + (usage.cache_creation_input_tokens || 0);

console.log('实际总输入token:', totalInput);
console.log('缓存命中token:', usage.cache_read_input_tokens || 0);

对比OpenAI，就简单多了：

// OpenAI: input_tokens 已经包含 cached_tokens，直接用
const usage = response.usage;
console.log('总输入token:', usage.input_tokens);
console.log('其中缓存命中:', usage.prompt_tokens_details?.cached_tokens || 0);

优势分析

市面上关于LLM计费的文章不少，但大多数要么只讲一家，要么信息已经过时。这个Skill的优势在于：

三家横向对比，一次看清：不用在三个官方文档之间反复跳转，关键差异直接列表呈现。
直接嵌入开发上下文：作为Skill加载后，AI助手在生成相关代码时能实时参考，减少幻觉和字段名写错的概率。
覆盖推理模型的特殊字段：o1/o3、Gemini thinking模式这些新特性的token追踪方式，很多开发者还不清楚，这里都有说明。
聚焦调试场景：Skill描述里明确写了”Use when debugging token counts or optimizing prefix caching”，定位精准，不是泛泛的科普。

应用场景

多模型成本对比系统：同时接入OpenAI和Anthropic的应用，需要统一口径计算每次请求的实际token消耗，用这个Skill生成的代码能保证计算逻辑正确。
前缀缓存命中率监控：想知道Anthropic的cache_control断点设置是否有效，或者OpenAI的自动缓存到底省了多少钱，这个Skill提供了正确的字段来源。
AI应用账单异常排查：月底账单比预期高，但不知道哪里出了问题，用这个Skill辅助AI助手快速定位是缓存没命中、还是推理token超出预期。
LLM网关/代理开发：做统一的LLM调用层时，需要标准化不同provider的usage字段，这个Skill是最直接的参考来源。