Новый инструмент «Думай» от Anthropic позволяет Клоду останавливаться и размышлять в сложных ситуациях использования инструментов
Коротко Anthropic представил инструмент «Думай», который позволяет Клоду добавить дополнительный шаг мышления — с выделенным для него местом — прежде чем прийти к окончательному ответу.
Фирма, специализирующаяся на безопасности и исследованиях ИИ, Антропный представил инструмент «Думай», который предоставляет выделенное пространство для структурированного мышления во время сложных задач. Этот инструмент позволяет Клоду включить дополнительный шаг мышления — с собственным выделенным пространством — прежде чем прийти к окончательному ответу.
Хотя концепция может показаться похожей на расширенное мышление, есть ключевые различия. Расширенное мышление происходит до того, как Клод начинает генерировать ответ, где он глубоко обдумывает и совершенствует свой подход. Напротив, инструмент «Думай» используется после того, как Клод начал генерировать ответ, позволяя ему сделать паузу и оценить, собрал ли он всю необходимую информацию для продолжения. Это особенно полезно во время задач, которые включают в себя длинные последовательности вызовов инструментов или многошаговые разговоры с пользователем.
Инструмент «Думай» особенно эффективен в ситуациях, когда у Клода недостаточно информации только из запроса пользователя и ему необходимо обработать внешние данные (например, результаты вызовов инструментов). Рассуждения, лежащие в основе этого инструмента, менее всеобъемлющи, чем расширенный процесс мышления, и больше сосредоточены на интеграции новой информации, которая появляется в ходе выполнения задачи.
Anthropic рекомендует использовать расширенное мышление для более простых сценариев, таких как непоследовательные вызовы инструментов или простые инструкции. Он также эффективен для таких задач, как кодирование, математика и физика, где Клоду не нужно полагаться на внешние инструменты. Инструмент лучше подходит для более сложных задач, где Клод должен тщательно анализировать выходные данные инструмента, ориентироваться в подробных инструкциях в средах с большим количеством политик или принимать последовательные решения, которые выстраиваются друг на друге, где ошибки могут иметь последствия.
Лучшие практики по внедрению инструмента «Думай»
Чтобы максимально использовать преимущества инструмента «Think» с Клодом, Anthropic рекомендует следующие методы внедрения, основанные на экспериментах τ-bench.
Наиболее эффективная стратегия — предоставить четкие инструкции о том, когда и как использовать инструмент «Думай». Это особенно очевидно в домене авиакомпании τ-bench, где примеры, специфичные для домена, значительно повышают эффективность модели при применении инструмента «Думай». Эти примеры должны включать руководство по нескольким аспектам, таким как: описание уровня детализации, ожидаемого в процессе рассуждения, разбиение сложных инструкций на выполнимые шаги, предоставление деревьев решений для обработки распространенных сценариев и помощь в оценке того, была ли собрана вся необходимая информация.
Работая с Антропный обнаружили, что для длинных или сложных инструкций размещение их в системной подсказке было более эффективным, чем включение их в само описание инструмента. Это позволяет модели лучше интегрировать процесс мышления в ее общее поведение, предоставляя ему более широкий контекст.
Интеграция инструмента «Think» в реализацию Claude относительно проста и может привести к улучшениям. Фирма предлагает начать со сложных вариантов использования, особенно тех, где Claude борется с соблюдением политики или сложными рассуждениями в длинных цепочках вызовов инструментов. Пользователи могут начать с добавления инструмента definition и реализовать настраиваемый инструмент «думать», специфичный для домена. Этот процесс требует минимального кодирования, но способствует более структурированному рассуждению. Пользователи также должны рассмотреть возможность включения инструкций о том, когда и как использовать инструмент, вместе с примерами, относящимися к домену, в системную подсказку.
После внедрения инструмента пользователям предлагается контролировать и совершенствовать его использование, наблюдая за тем, как Клод применяет его на практике. Они могут корректировать подсказки для продвижения более эффективных моделей мышления. Добавление нового инструмента имеет минимальные недостатки с точки зрения производительности. Он не изменит внешнее поведение, если только Клод не захочет его использовать, и он не мешает существующим инструментам или рабочим процессам.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Новости Биткойна: Вышло новое обновление с улучшенными характеристиками пыли, скорости и безопасности

Сегодняшний индекс страха и жадности составляет 26
ETH пробивает отметку в $1,900.00 и теперь торгуется по $1,900.00
Популярное
ДалееЦены на крипто
Далее








