Bitget App
Trading lebih cerdas
Beli KriptoPasarTradingFuturesBotsEarnCopy
Alat 'Think' Baru dari Anthropic Memungkinkan Claude Berhenti Sejenak dan Berpikir dalam Situasi Penggunaan Alat yang Kompleks

Alat 'Think' Baru dari Anthropic Memungkinkan Claude Berhenti Sejenak dan Berpikir dalam Situasi Penggunaan Alat yang Kompleks

MPOSTMPOST2025/03/24 11:44
Oleh:MPOST

Singkatnya Anthropic memperkenalkan alat “Think”, yang memungkinkan Claude menambahkan langkah berpikir tambahan—lengkap dengan ruang yang ditentukan—sebelum sampai pada jawaban akhirnya.

Perusahaan yang mengkhususkan diri dalam keselamatan dan penelitian AI, Antropik memperkenalkan alat “Think”, yang menyediakan ruang khusus untuk berpikir terstruktur selama mengerjakan tugas yang rumit. Alat ini memungkinkan Claude untuk memasukkan langkah berpikir tambahan—lengkap dengan ruang yang telah ditentukan—sebelum mencapai jawaban akhirnya.

Meskipun konsepnya mungkin tampak mirip dengan pemikiran yang diperluas, ada beberapa perbedaan utama. Pemikiran yang diperluas terjadi sebelum Claude mulai membuat respons, di mana ia mempertimbangkan dan menyempurnakan pendekatannya secara mendalam. Sebaliknya, alat "Think" digunakan setelah Claude mulai membuat respons, yang memungkinkannya untuk berhenti sejenak dan menilai apakah ia telah mengumpulkan semua informasi yang diperlukan untuk melanjutkan. Ini sangat bermanfaat selama tugas yang melibatkan rangkaian panggilan alat yang panjang atau percakapan multi-langkah dengan pengguna.

Alat "Think" sangat efektif dalam situasi ketika Claude tidak memiliki cukup informasi dari kueri pengguna saja dan perlu memproses data eksternal (seperti hasil dari panggilan alat). Alasan di balik alat ini kurang komprehensif dibandingkan proses berpikir yang diperluas dan lebih terfokus pada pengintegrasian informasi baru yang muncul selama tugas.

Anthropic merekomendasikan penggunaan pemikiran yang diperluas untuk skenario yang lebih sederhana, seperti panggilan alat yang tidak berurutan atau instruksi yang lugas. Ini juga efektif untuk tugas-tugas seperti pengodean, matematika, dan fisika, di mana Claude tidak perlu bergantung pada alat eksternal. Alat ini lebih cocok untuk tugas-tugas yang lebih kompleks, di mana Claude harus menganalisis keluaran alat dengan saksama, menavigasi pedoman terperinci dalam lingkungan yang sarat kebijakan, atau membuat keputusan berurutan yang saling membangun, di mana kesalahan dapat menimbulkan konsekuensi.

Praktik Terbaik untuk Menerapkan Alat 'Think'

Untuk memaksimalkan manfaat alat “Think” dengan Claude, Anthropic merekomendasikan praktik implementasi berikut berdasarkan eksperimen τ-bench-nya. 

Strategi yang paling efektif adalah dengan menawarkan instruksi yang jelas tentang kapan dan bagaimana menggunakan alat "Think". Hal ini khususnya terlihat jelas dalam domain maskapai penerbangan τ-bench, di mana contoh-contoh khusus domain sangat meningkatkan efektivitas model dalam menerapkan alat "think". Contoh-contoh ini harus mencakup panduan tentang beberapa aspek, seperti: menguraikan tingkat detail yang diharapkan dalam proses penalaran, memecah instruksi yang rumit menjadi langkah-langkah yang dapat ditindaklanjuti, menyediakan pohon keputusan untuk menangani skenario umum, dan membantu menilai apakah semua informasi yang diperlukan telah dikumpulkan.

Selain itu, Antropik menemukan bahwa untuk instruksi yang panjang atau rumit, menempatkannya dalam perintah sistem lebih efektif daripada memasukkannya dalam deskripsi alat itu sendiri. Hal ini memungkinkan model untuk lebih mengintegrasikan proses berpikir ke dalam perilaku keseluruhannya dengan menyediakan konteks yang lebih luas.

Mengintegrasikan alat “Think” ke dalam implementasi Claude relatif mudah dan dapat menghasilkan peningkatan. Perusahaan menyarankan untuk memulai dengan kasus penggunaan yang menantang, terutama kasus di mana Claude kesulitan dengan kepatuhan kebijakan atau penalaran yang rumit dalam rangkaian panjang panggilan alat. Pengguna dapat memulai dengan menambahkan alat definition dan menerapkan alat "berpikir" yang disesuaikan khusus untuk domain tersebut. Proses ini memerlukan pengkodean minimal tetapi memfasilitasi penalaran yang lebih terstruktur. Pengguna juga harus mempertimbangkan untuk menyertakan petunjuk tentang kapan dan bagaimana menggunakan alat tersebut, bersama dengan contoh-contoh yang relevan dengan domain dalam perintah sistem.

Setelah alat ini tersedia, pengguna didorong untuk memantau dan menyempurnakan penggunaannya dengan mengamati bagaimana Claude menerapkannya dalam praktik. Mereka dapat menyesuaikan perintah untuk mendorong pola pikir yang lebih efektif. Penambahan alat baru memiliki sedikit kekurangan dalam hal kinerja. Alat ini tidak akan mengubah perilaku eksternal kecuali Claude memilih untuk menggunakannya, dan alat ini tidak mengganggu alat atau alur kerja yang ada.

0

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Kunci untuk token baru.
APR hingga 12%. Selalu aktif, selalu dapat airdrop.
Kunci sekarang!

Kamu mungkin juga menyukai

Mengapa Chronicle, oracle pertama Ethereum, menggalang putaran pendanaan awal tujuh tahun setelah peluncuran

Quick Take Chronicle, oracle pertama yang diluncurkan di Ethereum, telah mengumpulkan dana awal sebesar $12 juta setelah tujuh tahun sejak peluncurannya. Co-founder Niklas Kunkel berpendapat bahwa protokol ini menemukan cara untuk menghadirkan transparansi nyata ke dalam ruang aset dunia nyata, yang sedang mengalami pertumbuhan signifikan. Pendanaan ini dipimpin oleh Strobe Ventures dengan partisipasi dari Brevan Howard Digital, Robot Ventures, dan Gnosis Venture, serta beberapa angel investor termasuk DeFi OGs Rune Christensen, Andre Cronje, dan Stani Kulechov.

The Block2025/03/26 16:56
Mengapa Chronicle, oracle pertama Ethereum, menggalang putaran pendanaan awal tujuh tahun setelah peluncuran

Rep. French Hill mengatakan versi revisi dari undang-undang struktur pasar kripto akan segera hadir seiring dengan semakin berkembangnya RUU di Kongres

Ketua Komite Jasa Keuangan DPR, French Hill, R-Ark., mengisyaratkan bahwa draf revisi dari RUU struktur pasar akan segera hadir setelah pekerjaan yang dilakukan tahun lalu di komitenya. RUU struktur pasar belum diperkenalkan di Kongres ini. Rep. Bryan Steil juga mengatakan bahwa teks lengkap dari RUU stablecoin DPR akan diperkenalkan nanti pada hari Rabu dan akan ada penandaan dalam "waktu dekat."

The Block2025/03/26 16:56
Rep. French Hill mengatakan versi revisi dari undang-undang struktur pasar kripto akan segera hadir seiring dengan semakin berkembangnya RUU di Kongres

Hyperliquid menghapus daftar memecoin JELLYJELLY di tengah skandal manipulasi paus

Hyperliquid dengan cepat menghapus kontrak perpetual untuk memecoin berbasis Solana, JELLYJELLY, setelah seorang paus memanipulasi harga onchain. Tekanan ini menyebabkan vault HLP yang dimiliki komunitas mengalami kerugian belum terealisasi sekitar $12 juta pada awalnya. Setidaknya dua bursa terpusat besar mencatatkan perdagangan berjangka JELLYJELLY di tengah kekacauan ini, yang menimbulkan risiko bagi vault Hyperliquid.

The Block2025/03/26 16:56
Hyperliquid menghapus daftar memecoin JELLYJELLY di tengah skandal manipulasi paus