Token Waste Audit Benchmark

Measures whether a model gets to the answer efficiently or burns tokens on preambles, repetition, hedging, retries, dead-end reasoning, and formatting overhead.

Tasks

Task Types