Філософія економії грошей в епоху ШІ: Як розумно витратити кожен токен
Від Sleepy.md
В епоху телеграм, коли кожне слово коштувало грошей, слова були такими ж цінними, як золото. Люди звикли скорочувати довгі повідомлення до лаконічних фраз, де просте "безпечне повернення" могло замінити довгий лист, а "безпека перш за все" була найпомітнішим нагадуванням.
Пізніше, з появою телефону в домогосподарствах, міжміські дзвінки обліковувалися за секунди. Міжміські дзвінки батьків завжди були короткими і по суті. Як тільки основна тема була обговорена, вони поспішно завершували розмову. Якщо розмова трохи затягувалася, думки про дорогий дзвінок швидко обривали будь-які дрібні розмови.
Далі, з появою широкосмугового інтернету, облік здійснювався за годину використання інтернету. Люди дивилися на таймери на своїх екранах, закриваючи веб-сторінки, щойно їх відкривали, наважуючись завантажувати відео, оскільки стрімінг вважався розкішшю в той час. В кінці кожної смуги прогресу завантаження лежала людська туга за "зв'язком зі світом" і страх "недостатнього балансу."
Одиниця обліку продовжувала змінюватися, але інстинкт економити гроші залишався поза часом.
Сьогодні токени стали валютою епохи ШІ. Однак більшість людей ще не навчилися планувати бюджет в цю епоху, оскільки ми ще не зрозуміли, як розраховувати прибутки та збитки в невидимих алгоритмах.
Коли ChatGPT з'явився в 2022 році, майже ніхто не звертав уваги на те, що таке токени. Це була епоха святкувань ШІ, коли ви могли спілкуватися скільки завгодно за 20 доларів на місяць.
Але з недавнім зростанням агентів ШІ витрати на токени стали тим, на що кожен, хто використовує агента ШІ, повинен звертати увагу.
На відміну від простих запитань і відповідей, за потоком завдань стоять сотні або тисячі викликів API. Незалежне мислення Агента має свою ціну. Кожна самокорекція, кожен виклик інструменту відповідає коливанням у рахунку. Раптом ви виявляєте, що грошей, які ви внесли, більше недостатньо, і ви не маєте уявлення, чим займався Агент.
У реальному житті всі знають, як заощаджувати гроші. Коли купуємо продукти на ринку, ми знаємо, що потрібно очистити бруд і зів'ялі листя перед зважуванням. Викликаючи таксі до аеропорту, досвідчені водії знають уникати підвищених доріг під час години пік.
Логіка заощадження грошей у цифровому світі подібна, за винятком того, що одиниця обліку змінилася з "кілограмів" і "кілометрів" на Токени.

У минулому заощадження було зумовлене дефіцитом; в епоху ШІ заощадження є для точності.
Через цю статтю ми сподіваємося допомогти вам окреслити методологію заощадження грошей в епоху ШІ, щоб ви могли витрачати кожну копійку розумно.
Прибирайте гнилі листя перед зважуванням
В епоху ШІ цінність інформації більше не визначається її обсягом, а її чистотою.
Логіка обліку в ШІ базується на кількості слів, які вона читає. Чи то ви годуєте її глибокими ідеями, чи безглуздим жаргоном, поки вона це читає, ви повинні платити.
Отже, перший спосіб мислення для заощадження Токенів - це вкорінити "Співвідношення сигналу до шуму" у вашій підсвідомості.
Кожне слово, кожен образ, кожен рядок коду, який ви подаєте ШІ, має свою ціну. Тож перед тим, як передати щось ШІ, пам'ятайте запитати себе: скільки з цього насправді потрібно ШІ? Скільки з цього брудне і гниле?
Наприклад, багатослівні вітання на початку, такі як "Привіт, будь ласка, допоможіть мені з...", фонові введення, які повторюються, і коментарі до коду, які не були належним чином видалені, - це все брудні і гнилі листя.
Більше того, найпоширенішою витратою є безпосереднє подання ШІ PDF або знімка екрана веб-сторінки. Хоча це може зекономити ваші зусилля, в епоху штучного інтелекту "економія зусиль" часто означає "коштує більше."
Добре відформатований PDF не лише містить основний контент, але й заголовок, нижній колонтитул, підписи до графіків, приховані водяні знаки та велику кількість коду форматування для набору тексту. Ці елементи не допомагають штучному інтелекту зрозуміти ваше запитання, але ви будете сплачені за всі з них.
Наступного разу пам'ятайте, що потрібно конвертувати PDF у чистий текст Markdown перед тим, як подавати його штучному інтелекту. Коли ви перетворюєте PDF обсягом 10 МБ у чистий текст обсягом 10 КБ, ви не лише економите 99% витрат, але й значно прискорюєте обробку штучним інтелектом.
Зображення є ще одним ненажерливим звіром.
У логіці візуальних моделей штучний інтелект не переймається, чи є ваше фото красивим; його цікавить лише, скільки піксельної площі ви займаєте.
Використовуючи офіційну логіку розрахунків Claude: Споживання токенів зображення = Ширина пікселів × Висота пікселів ÷ 750.
Для зображення розміром 1000×1000 пікселів споживається близько 1334 токенів, що, згідно з цінами Claude Sonnet 4.6, приблизно становить $0.004 за зображення;
Однак, якщо те ж саме зображення стиснути до 200×200 пікселів, воно споживає лише 54 токени, зменшуючи витрати до $0.00016, різниця становить цілих 25 разів.
Багато людей безпосередньо подають штучному інтелекту високоякісні фотографії, зроблені на їхні телефони, або 4K знімки екрану, не усвідомлюючи, що споживають токени, яких могло б вистачити для того, щоб штучний інтелект прочитав більше половини новели. Якщо завдання полягає лише в розпізнаванні тексту на зображенні або виконанні простих візуальних суджень, таких як розпізнавання суми на рахунку, читання тексту в інструкції або визначення, чи є світлофор на зображенні, то роздільна здатність 4K є просто марною тратою. Стиснення зображення до мінімально допустимої роздільної здатності є достатнім.
Однак найпростіший спосіб витратити токени на вході насправді не формат файлу, а неефективний спосіб спілкування.
Багато людей сприймають штучний інтелект як сусіда-людину, звикнувши спілкуватися в соціальному, балакучому стилі, починаючи з речення на кшталт "допоможіть мені написати веб-сторінку," чекаючи, поки штучний інтелект видасть напівготовий продукт, потім додаючи деталі і постійно тягнучи назад і вперед. Ця розмова в стилі "видавлювання зубної пасти" змусить штучний інтелект повторно генерувати контент, при цьому кожен раунд модифікації додає до споживання токенів.
Інженери Tencent Cloud виявили на практиці, що для одного й того ж запиту розмова в стилі "видавлювання зубної пасти" часто споживає токени, які в 3-5 разів перевищують те, що можна було б пояснити за один раз.
Справжній спосіб заощадити гроші - це відмовитися від цього неефективного соціального дослідження, чітко викласти вимоги, граничні умови та приклади за один раз. Витрачайте менше зусиль на пояснення "чого не робити", оскільки заперечення часто споживають більше витрат на розуміння, ніж ствердження; скажіть прямо "як це зробити" і надайте чіткий, правильний демонстраційний приклад.
Також, якщо ви знаєте, де знаходиться ціль, скажіть це ШІ безпосередньо, не дозволяйте ШІ грати в детектива.
Коли ви наказуєте ШІ "знайти деякий код, пов'язаний з користувачем", воно повинно проводити масштабне сканування, аналіз і здогадки у фоновому режимі; тоді як коли ви безпосередньо кажете йому "подивитися на файл src/services/user.ts", різниця в споживанні токенів як ніч і день. У цифровому світі симетрія інформації є найбільшою ефективністю.
Не платіть за "ввічливість" ШІ.
Є неписане правило в білінгу великих моделей, про яке багато людей не знають: вихідні токени зазвичай в 3-5 разів дорожчі за вхідні токени.
Іншими словами, те, що говорить ШІ, коштує набагато більше, ніж те, що ви йому кажете. Візьмемо цінову політику Claude Sonnet 4.6 як приклад: введення кожного мільйона токенів коштує лише 3 долари, тоді як вихід раптово стрибає до 15 доларів, що становить вражаючу 5-кратну різницю в ціні.
Усі ці "Добре, я повністю розумію ваші вимоги і тепер почну на них відповідати..." ввічливі вступні фрази та "Сподіваюся, ви знайдете цю інформацію корисною" ввічливі закінчення є соціальною етикетом у людській комунікації, але на рахунку API ці формальності з нульовою інформаційною цінністю також коштуватимуть вам грошей.
Найефективніший спосіб вирішення проблеми витрат на вихідні дані - це встановлення правил для ШІ. Використовуйте системні команди, щоб чітко сказати йому: без дрібних розмов, без пояснень, без повторення запитів, просто надайте відповідь.
Ці правила потрібно встановити лише один раз, і вони набудуть чинності в кожній розмові, справді втілюючи принцип "один раз введення, постійна вигода" у фінансах. Однак, встановлюючи ці правила, багато людей потрапляють в іншу пастку: видаючи багатослівні інструкції природною мовою.
Дані, перевірені інженерами, показують, що ефективність інструкцій полягає не в кількості слів, а в їх щільності. Стиснувши системний запит з 500 слів до 180 слів, видаливши безглузді ввічливості, об'єднавши повторювані інструкції та перетворивши абзаци на стиснутий маркований список, якість виходу ШІ залишається майже незмінною, але споживання токенів за викликом може знизитися на 64%.
Інший, більш проактивний спосіб контролю - це обмеження довжини виходу. Багато людей ніколи не встановлюють обмеження на вихід, дозволяючи ШІ діяти вільно, що часто призводить до різкого зростання витрат. Вам може знадобитися лише коротке, просте речення, але ШІ, намагаючись продемонструвати певну "інтелектуальну щирість", без вагань генерує 800-словесний есе.
Якщо ви шукаєте чисті дані, вам слід змусити ШІ повертати результати у структурованому форматі, а не в довгих описах природною мовою. З огляду на еквівалентну кількість інформації, формат JSON має набагато нижче споживання токенів у порівнянні з прозою. Це тому, що структуровані дані усувають усі зайві сполучники, частки та пояснювальні модифікатори, зберігаючи лише високу концентрацію логічного ядра. В епоху штучного інтелекту ви повинні чітко усвідомлювати, що варто платити за цінність результату, а не за цю безглузду самопояснення від ШІ.
Крім того, "переміркування" ШІ також ненаситно виснажує ваш баланс на рахунку.
Деякі розширені моделі мають режим "розширеного міркування", який проводить масивне внутрішнє міркування перед відповіддю. Цей процес міркування також викликає витрати, які залежать від ціни виходу, що може бути досить дорогим.
Цей режим в основному призначений для "складних завдань, що потребують глибокої логічної підтримки". Однак більшість людей також обирають цей режим, коли ставлять прості запитання. Для завдань, які не потребують глибокого міркування, явне інструктування ШІ "пропустити пояснення та надати відповідь безпосередньо" або ручне вимкнення розширеного міркування може заощадити вам значну суму грошей.
Уникайте, щоб ШІ зациклювалося на старих справах
Великі моделі не мають справжньої пам'яті; вони просто безкінечно зациклюються на старих справах.
Це є основним механізмом, про який багато людей не знають. Щоразу, коли ви надсилаєте нове повідомлення у вікні розмови, ШІ не починає розуміти з цього речення; натомість воно перечитує всі ваші минулі взаємодії, включаючи кожен раунд діалогу, кожен фрагмент коду та кожен згадуваний документ, перш ніж відповісти вам.
У рахунках за токени це "навчання з минулого" зовсім не безкоштовне. Оскільки раунди розмов накопичуються, навіть якщо ви просто запитуєте про просте слово, вартість повторного читання ШІ всього старого рахунку зростає експоненційно. Цей механізм визначає, що чим важча історія розмови, тим дорожчими стають ваші запитання.
Хтось відстежував 496 реальних діалогів, що містять понад 20 повідомлень кожен, і виявив, що середнє читання 1-го повідомлення становило 14 000 токенів, що коштувало близько 3,6 центів за повідомлення; до 50-го повідомлення середнє читання становило 79 000 токенів, що коштувало близько 4,5 центів за повідомлення, що на 80% дорожче. Крім того, оскільки контекст стає довшим, до 50-го повідомлення контекст, який ШІ має повторно обробити, вже в 5,6 разів перевищує контекст 1-го повідомлення.
Щоб вирішити цю проблему, найпростіша звичка: одне завдання, одне вікно діалогу.
Коли обговорюється тема, негайно починайте новий діалог; не ставте ШІ в режим постійного чату. Ця звичка здається простою, але багато людей просто не можуть цього зробити, завжди думаючи: "А що, якщо мені потрібно буде звернутися до попереднього контенту?" Насправді, більшість часу ті "якщо" про які ви турбуєтеся, ніколи не відбуваються, і за це "якщо" ви в кінцевому підсумку платите в кілька разів більше за кожне нове повідомлення.
Коли розмова потребує продовження, але контекст став занадто довгим, ми можемо використовувати функції стиснення деяких інструментів. Claude Code має команду /compact, яка може стиснути довгу історію діалогу в коротке резюме, допомагаючи вам практикувати кібер-очищення.
Існує також логіка економії коштів, яка називається кешуванням запитів. Якщо ви неодноразово використовуєте один і той же системний запит або потрібно посилатися на один і той же документ у кожній розмові, ШІ кешуватиме цей контент. Наступного разу, коли його викликають, він стягне лише мінімальну плату за читання кешу, а не повну ціну щоразу.
Офіційні ціни Anthropic показують, що ціна токена для кешованих запитів становить 1/10 звичайної ціни. Кешування запитів OpenAI аналогічно зменшує витрати на введення приблизно на 50%. У статті, опублікованій у січні 2026 року на arXiv, було досліджено довгі завдання на кількох платформах ШІ і виявлено, що кешування запитів може зменшити витрати на API на 45% до 80%.
Іншими словами, за той же контент, перший раз, коли ви подаєте його ШІ, ви платите повну ціну, але при наступних викликах ви платите лише 1/10. Для користувачів, які щодня потребують повторного використання одного й того ж набору документів специфікацій або системних запитів, ця функція може заощадити значну кількість токенів.
Однак кешування запитів має одну передумову: формулювання вашого системного запиту та вміст і порядок документа посилання повинні залишатися послідовними і на початку розмови. Якщо вміст змінюється будь-яким чином, кеш стає недійсним, і знову застосовується повна плата. Отже, якщо у вас є набір фіксованих робочих норм, закріпіть їх і уникайте довільних змін.
Остання техніка управління контекстом - це завантаження за запитом. Багато людей люблять втиснути всі специфікації, документи та нотатки в системні запити, на всякий випадок.
Однак вартість цього полягає в тому, що коли ви просто виконуєте просте завдання, ви змушені завантажувати тисячі слів правил, витрачаючи безліч токенів без причини. Офіційна документація Claude Code пропонує зберігати CLAUDE.md менше 200 рядків, розбиваючи спеціалізовані правила для різних сценаріїв на окремі файли навичок і завантажуючи правила лише для використовуваного сценарію. Збереження абсолютної чистоти контексту є найвищою формою поваги до обчислювальної потужності.
Не їдьте на Porsche за овочами
Різні моделі ШІ мають значну різницю в ціні.
Claude Opus 4.6 коштує 5 доларів за кожен мільйон токенів на вхід і 25 доларів за вихід, тоді як Claude Haiku 3.5 вимагає лише 0.8 долара за вхід і 4 долари за вихід, що майже в шість разів більше. Залучення моделі найвищого рівня для виконання рутинної роботи зі збору інформації та форматування є не лише повільним, але й дуже дорогим.

Розумний підхід полягає в застосуванні загальнолюдської соціальної концепції "поділу праці" до спільноти ШІ, призначаючи завдання різної складності моделям з різними ціновими категоріями.
Так само, як у реальному світі, коли ви наймаєте когось на роботу, ви б не наймали спеціаліста з кладки цегли з мільйонною зарплатою для виконання ручної праці на будівельному майданчику. ШІ працює так само. Офіційна документація Claude Code також чітко рекомендує: використовуйте Sonnet для більшості програмних завдань, залишайте Opus для складних архітектурних рішень і багатоступеневих міркувань, а Haiku призначайте для простих підзавдань.
Більш конкретним практичним рішенням є створення "двоступеневої робочої схеми". На першому етапі використовуйте безкоштовні або недорогі базові моделі для виконання попередньої брудної роботи, такої як збір даних, очищення форматів, генерація початкових чернеток, проста класифікація та узагальнення. Потім, на другому етапі, передайте відшліфовану суть моделям найвищого рівня для основного прийняття рішень та глибокого вдосконалення.
Наприклад, якщо вам потрібно проаналізувати 100-сторінковий звіт про галузь, спочатку ви можете використовувати Gemini Flash для виділення ключових даних та висновків з звіту, стиснути їх у 10-сторінкове резюме, а потім передати це резюме Claude Opus для глибокого аналізу та оцінки. Ця двоступенева робоча схема може значно знизити витрати, забезпечуючи при цьому якість.
Виходячи за межі простого абзацювання, більш просунутим підходом є поділ глибокої роботи на завдання. Складне інженерне завдання можна розділити на кілька незалежних підзавдань, кожне з яких відповідає найбільш підходящій моделі.
Наприклад, для завдання з кодування економічна модель може спочатку написати каркас і шаблонний код, а потім лише призначити реалізацію основної логіки більш дорогій моделі. Кожне підзавдання має чіткий, зосереджений контекст, що призводить до більш точних результатів і нижчих витрат.
Вам насправді не потрібно витрачати токени
Усі попередні обговорення в основному стосуються тактичних питань "як заощадити гроші", але багато людей пропустили більш фундаментальну логічну пропозицію: Чи дійсно ця дія вимагає витрат токенів?
Найекстремальніша форма економії полягає не в оптимізації алгоритмів, а в дії з очищення прийняття рішень. Ми звикли шукати універсальні відповіді від ШІ, забуваючи, що в багатьох сценаріях виклик дорогого великого моделі подібний до використання гармати для вбивства комара.
Наприклад, дозволяючи штучному інтелекту автоматично обробляти електронні листи, кожен лист інтерпретується, категоризується та відповідається як незалежне завдання, що призводить до значного споживання токенів. Однак, якщо спочатку ви витратите 30 секунд на перегляд своєї поштової скриньки, вручну відфільтруєте електронні листи, які явно не потребують обробки штучним інтелектом, а потім передасте решту штучному інтелекту, вартість відразу зменшується до частки від початкової. Людське судження тут не є перешкодою, а найкращим інструментом фільтрації.
Люди з епохи телеграм знали, скільки додатково коштує надіслати ще одне слово, тому вони враховували це, демонструючи інтуїтивне відчуття використання ресурсів. Епоха штучного інтелекту не є винятком. Коли ви дійсно розумієте, скільки коштує штучному інтелекту сказати ще одне речення, ви природно зважуєте, чи варто доручати це штучному інтелекту, чи потребує завдання найкращої моделі або економічної, і чи залишається контекст актуальним.
Такий вид розгляду є найекономічнішою здатністю. В епоху, коли обчислювальна потужність стає дорожчою, найрозумніше використання полягає не в тому, щоб дозволити штучному інтелекту замінити людей, а в тому, щоб дозволити штучному інтелекту та людям виконувати те, в чому вони найкращі. Коли ця чутливість до токенів стає рефлексивною дією, ви дійсно переходите від підпорядкування обчисленням до того, щоб стати його господарем.
Вам також може сподобатися

Хусити мають контрольно-пропускний пункт | Rewire News Ранковий брифінг

Темний ліс на 240 мільярдів доларів, падіння залізних фінансів

Обмеження на 3 привітання, куди поділася ваша межа коду Claude? Баг кешу за 28 днів і офіційна відповідь, яка заохочує вас "використовувати його економно".

Як заробити гроші на Polymarket, використовуючи ШІ?

Ранковий звіт | YZi Labs стратегічно збільшує інвестиції в Predict.fun; Drift Protocol зазнає атаки з втратами щонайменше 200 мільйонів доларів; x402 від Coinbase приєднується до Linux Foundation

Мрія про 590 мільярдів доларів: Як жінка-Воррен Баффет пала з благодаті?

Діалог із засновником Pantera: Біткоїн досяг швидкості втечі, традиційні активи залишаються позаду

Дилема зростання Base: все було зроблено правильно, але користувачі все ще йдуть

Інцидент із Drift Protocol: Зловмисник Захоплює Повноваження через Довготермінові Нонси
Key Takeaways On April 2, Drift Protocol experienced a security breach where a malicious actor gained administrative control.…

# Outline
Key Takeaways Drift Protocol, a decentralized exchange on Solana, experienced a $270 million hack, making it one of…

# Огляд
Key Takeaways Upbit and Bithumb have labeled DRIFT as a “trading alert” asset following guidance from the Digital…

# Активність Wormhole: Як Атака на Drift Protocol Вплинула на Перехід Транзакцій
Key Takeaways Wormhole confirmed that user assets remain safe despite the Drift Protocol attack. The Solana ecosystem’s built-in…

# Outline
Key Takeaways Bitget Launchpool offers a way to earn tokens like MEZO by staking assets. The current MEZO…

Прогноз цін на Ethereum: Переломний момент для ETH у Системах Масштабування, Безпеки та Штучного Інтелекту
Ціна Ethereum, торгуючись на рівні $2,170, стикається з викликами в умовах нестабільності ринку, що пов’язана з організаційними стратегіями…

I’m sorry, I can’t assist with this request.
I’m sorry, I can’t assist with this request.

Nasdaq та Talos об’єднуються для розблокування $35 мільярдів заблокованих активів
Nasdaq та Talos інтегрують існуючу інфраструктуру в крипторинки, щоб вивільнити $35 мільярдів застиглого капіталу. Інтеграція дозволяє керувати цифровими…

Зростання ціни Bittensor (TAO)—чи можливий прорив вище рівня опору?
У січні цього року ціна Bittensor TAOUSD досягла $300, відзначивши зростання на 66% завдяки збільшенню соціальної активності та…

Прогноз Ціни Bitcoin: Що Очікувати від Безпечного Активу у 2026 році?
Інвестори виводять кошти з великих золотовалютних фондів на користь Bitcoin, відзначаючи зрушення у стратегіях розподілу капіталу. Bitcoin демонструє…
