Ліміти Claude — яку модель коли вибирати і як не вилетіти на півдня
Перше, з чим стикається кожен новачок у Claude — ліміти. Вони злітають швидко. Розповідаю, чому це працює саме так, які три моделі є і коли яку вибирати.

У ChatGPT за 20 доларів на місяць я ніколи не уявляв, як можна вибити ліміт. У Claude за 20 доларів я вибив його у перший день. І потім ще пів-тижня вчився, як цього не робити.
Тому одразу пишу те, що я б хотів знати на старті.
Як працюють ліміти
Є сесійний ліміт. Сесія — 5 годин. Витратили ліміт за годину, чекаєте ще 4. Дратує, але звикаєте.
Є тижневий ліміт. Він окремий, поверх сесійних. Можете вилетіти у вівторок і чекати неділі. Найбільший біль.
Є можливість докинути 5 доларів овер-ліміт. Не безкоштовно, але і не велике зло. Для багатьох виходить адекватно пережити перевантажений день.
Хороша новина: нещодавно Claude підписав договір з SpaceX про дата-центр Colossus, і ліміти у п'ятигодинній сесії збільшили вдвічі. Стало значно простіше жити.
Три моделі — коли яку обирати
У Claude зараз три основні моделі:
- Opus 4.7 — спеціально під кодинг. Найдорожча у плані лімітів.
- Opus 4.6 — універсальна, сильна для повсякденки. Моя дефолтна.
- Sonnet — швидша і легша.
- Haiku — найпростіша і найшвидша, для рутини.
Логіка така:
Робите сайт або складний код — Opus 4.7. Він спеціально для цього і у ньому помітно краще.
Пишете контент, готуєте ТЗ, складаєте стратегію, працюєте з документами — Opus 4.6. Найрозумніша універсальна.
Швидко відповісти, перевірити факт, написати короткий мейл — Sonnet. Економить ліміт.
Рутинні цикли, агенти, які роблять багато одноманітних викликів — Haiku. Бо вона списується мінімально.
Найбільша помилка новачка — поставити Opus 4.7 на все підряд. Потім дивуватися, чого ліміт згорів за годину. Я сам так робив.
Чому ліміт може злетіти з одного питання
У мене реально було так: задаю одне коротке питання — і одразу великий шматок ліміту з'їдено. Дивно, бо я ж тільки спитав «котра година у Києві».
Виявилось — у Project налаштована інструкція «Завжди перевіряй Notion, Google Docs і Figma перед відповіддю». Тому Claude на кожну дрібницю ходив у всі мої сервіси, читав усе що міг. Контекст роздувався, ліміт танув.
Урок: не давайте Claude перевіряти все підряд. У Project-інструкціях пишіть конкретно: «Йди у Notion тільки коли запит стосується контенту». Якщо ліміти тануть швидше за очікуване, перевіряйте насамперед це.
Що ще економить ліміт
Видаляйте старі повідомлення в чаті. Кожне нове повідомлення тягне з собою всю історію. Чим довша історія, тим дорожче.
Починайте новий чат для нової теми. Не треба сидіти у одному чаті 8 годин, питаючи то про сайт, то про обід.
Не використовуйте Extended Thinking, якщо не треба. Це режим «думай довше», і він жере ліміт у 2-3 рази більше. Для запуску ракет — окей. Для звичайного запиту — зайве.
Слідкуйте у налаштуваннях за використанням.У Claude є індикатор, скільки залишилось. Не ігноруйте його, особливо у п'ятницю ввечері.
Підсумок
Ліміти Claude — реально перша болячка, з якою стикаєтесь. Але вона управляється. Через пару тижнів ви інстинктивно перемикаєте моделі, чистите чати, обмежуєте доступи. Стає звичкою.
Зараз я майже не натрапляю на ліміти. Хоча працюю з Claude фактично весь день. Просто навчився не палити його на дурницях.
Все це є на курсі — у форматі покрокового шляху.
Пишу туди те, що не входить у блог: скіли, MCP-знахідки, міні-кейси, реальні промпти, які зараз тестую. @claudehero