Задати питання
← усі статті
практика·13 травня 2026·6 хв

Ліміти Claude — яку модель коли вибирати і як не вилетіти на півдня

Перше, з чим стикається кожен новачок у Claude — ліміти. Вони злітають швидко. Розповідаю, чому це працює саме так, які три моделі є і коли яку вибирати.

Обкладинка статті

У ChatGPT за 20 доларів на місяць я ніколи не уявляв, як можна вибити ліміт. У Claude за 20 доларів я вибив його у перший день. І потім ще пів-тижня вчився, як цього не робити.

Тому одразу пишу те, що я б хотів знати на старті.

Як працюють ліміти

Є сесійний ліміт. Сесія — 5 годин. Витратили ліміт за годину, чекаєте ще 4. Дратує, але звикаєте.

Є тижневий ліміт. Він окремий, поверх сесійних. Можете вилетіти у вівторок і чекати неділі. Найбільший біль.

Є можливість докинути 5 доларів овер-ліміт. Не безкоштовно, але і не велике зло. Для багатьох виходить адекватно пережити перевантажений день.

Хороша новина: нещодавно Claude підписав договір з SpaceX про дата-центр Colossus, і ліміти у п'ятигодинній сесії збільшили вдвічі. Стало значно простіше жити.

Три моделі — коли яку обирати

У Claude зараз три основні моделі:

  • Opus 4.7 — спеціально під кодинг. Найдорожча у плані лімітів.
  • Opus 4.6 — універсальна, сильна для повсякденки. Моя дефолтна.
  • Sonnet — швидша і легша.
  • Haiku — найпростіша і найшвидша, для рутини.

Логіка така:

Робите сайт або складний код — Opus 4.7. Він спеціально для цього і у ньому помітно краще.

Пишете контент, готуєте ТЗ, складаєте стратегію, працюєте з документами — Opus 4.6. Найрозумніша універсальна.

Швидко відповісти, перевірити факт, написати короткий мейл — Sonnet. Економить ліміт.

Рутинні цикли, агенти, які роблять багато одноманітних викликів — Haiku. Бо вона списується мінімально.

Найбільша помилка новачка — поставити Opus 4.7 на все підряд. Потім дивуватися, чого ліміт згорів за годину. Я сам так робив.

Чому ліміт може злетіти з одного питання

У мене реально було так: задаю одне коротке питання — і одразу великий шматок ліміту з'їдено. Дивно, бо я ж тільки спитав «котра година у Києві».

Виявилось — у Project налаштована інструкція «Завжди перевіряй Notion, Google Docs і Figma перед відповіддю». Тому Claude на кожну дрібницю ходив у всі мої сервіси, читав усе що міг. Контекст роздувався, ліміт танув.

Урок: не давайте Claude перевіряти все підряд. У Project-інструкціях пишіть конкретно: «Йди у Notion тільки коли запит стосується контенту». Якщо ліміти тануть швидше за очікуване, перевіряйте насамперед це.

Що ще економить ліміт

Видаляйте старі повідомлення в чаті. Кожне нове повідомлення тягне з собою всю історію. Чим довша історія, тим дорожче.

Починайте новий чат для нової теми. Не треба сидіти у одному чаті 8 годин, питаючи то про сайт, то про обід.

Не використовуйте Extended Thinking, якщо не треба. Це режим «думай довше», і він жере ліміт у 2-3 рази більше. Для запуску ракет — окей. Для звичайного запиту — зайве.

Слідкуйте у налаштуваннях за використанням.У Claude є індикатор, скільки залишилось. Не ігноруйте його, особливо у п'ятницю ввечері.

Підсумок

Ліміти Claude — реально перша болячка, з якою стикаєтесь. Але вона управляється. Через пару тижнів ви інстинктивно перемикаєте моделі, чистите чати, обмежуєте доступи. Стає звичкою.

Зараз я майже не натрапляю на ліміти. Хоча працюю з Claude фактично весь день. Просто навчився не палити його на дурницях.

на курс