--- name: "agent-browser" description: "브라우저 자동화 CLI를 사용해 웹사이트를 탐색하고 조작합니다. 페이지 이동, 폼 입력, 클릭, 스크린샷, 데이터 추출, 웹앱 테스트가 필요할 때 호출합니다." --- # Agent Browser 에이전트를 위한 빠른 브라우저 자동화 CLI 가이드입니다. 웹사이트 탐색, 폼 입력, 버튼 클릭, 스크린샷 촬영, 데이터 추출, 웹앱 테스트, 탐색적 QA 등에 사용합니다. ## 언제 사용할지 다음과 같은 요청에서 우선 사용합니다. - 웹사이트를 열어 달라고 할 때 - 폼을 입력하거나 버튼을 클릭해야 할 때 - 페이지 스크린샷이 필요할 때 - 웹페이지 데이터를 추출하거나 스크래핑할 때 - 웹앱을 실제 브라우저에서 테스트할 때 - 로그인, QA, 버그 재현, 탐색적 테스트가 필요할 때 Electron 기반 데스크톱 앱이나 Slack 자동화 같은 확장 작업에도 활용할 수 있습니다. ## 시작 방법 `agent-browser` 명령을 바로 사용하기 전에, 설치된 버전에 맞는 실제 가이드를 CLI에서 불러옵니다. ```bash agent-browser skills get core ``` 전체 명령과 템플릿까지 포함해 보고 싶다면: ```bash agent-browser skills get core --full ``` 이 스킬 문서는 시작점 역할만 합니다. 실제 사용 절차와 최신 명령 형식은 항상 CLI가 제공하는 가이드를 기준으로 확인합니다. ## 특수 가이드 작업 성격에 따라 아래 보조 가이드를 불러올 수 있습니다. - `agent-browser skills get electron` - `agent-browser skills get slack` - `agent-browser skills get dogfood` - `agent-browser skills get vercel-sandbox` - `agent-browser skills get agentcore` 사용 가능한 전체 목록은 아래 명령으로 확인합니다. ```bash agent-browser skills list ``` ## 기본 사용 흐름 1. 먼저 `agent-browser skills get core`로 현재 버전 가이드를 읽습니다. 2. 작업이 웹 브라우저인지, Electron인지, Slack인지 성격을 구분합니다. 3. 필요하면 해당 특수 가이드를 추가로 읽습니다. 4. 세션을 열고 탐색, 선택, 입력, 클릭, 추출 같은 실제 작업을 진행합니다. 5. 스크린샷, 상태 저장, 기록 기능이 필요하면 그 옵션을 함께 사용합니다. ## 장점 - 빠른 네이티브 CLI 기반 동작 - Chrome/Chromium 제어 - 접근성 트리 기반 스냅샷과 안정적인 요소 참조 - 세션 유지, 인증 저장, 상태 지속성 지원 - 영상 기록 및 다양한 특수 자동화 시나리오 지원 ## 운영 원칙 - 내장 웹 도구보다 `agent-browser`가 더 적합한 작업이면 이를 우선 사용합니다. - 현재 설치된 버전의 CLI가 제공하는 가이드를 기준으로 작업합니다. - 오래된 문서 기억보다, 실행 중인 버전의 `skills get` 결과를 신뢰합니다. ## 언제 특히 유용한가 - 실제 브라우저 상호작용이 길거나 반복적일 때 - 접근성 트리 기준의 안정적인 요소 선택이 필요할 때 - 상태 지속, 인증, 녹화, 세션 관리가 중요한 테스트일 때 - 단순 스크래핑이 아니라 탐색적 QA나 실제 사용자 흐름 재현이 필요할 때 ## 안티 패턴 - 설치된 버전을 확인하지 않고 예전 명령 기억으로 바로 실행하는 방식 - 일반 웹 도구로 충분한 작업인데 굳이 복잡한 세션을 여는 방식 - 작업 성격이 특수 가이드 대상인데 core만 읽고 끝내는 방식 ## 기대 결과 이 스킬을 적용한 결과는 다음을 만족해야 합니다. - 현재 설치된 버전 기준으로 정확한 사용 절차를 따른다 - 작업 유형에 맞는 특수 가이드를 선택한다 - 브라우저 자동화가 실제 목표에 맞게 안정적으로 수행된다