kapynDev Tools

Evaluate AI agents systematically with Agent-EvalKit

Agent-EvalKit is an open-source toolkit for systematic AI agent evaluation. It integrates with AI coding assistants and offers six evaluation phases, demonstrated with a travel research agent example built on Strands Agents SDK and Amazon Bedrock.

AWS ML Blog·Jun 11, 2026

Opening Kapyn…