---
name: "agent-browser"
description: "브라우저 자동화 CLI를 사용해 웹사이트를 탐색하고 조작합니다. 페이지 이동, 폼 입력, 클릭, 스크린샷, 데이터 추출, 웹앱 테스트가 필요할 때 호출합니다."
---

# Agent Browser

에이전트를 위한 빠른 브라우저 자동화 CLI 가이드입니다. 웹사이트 탐색, 폼 입력, 버튼 클릭, 스크린샷 촬영, 데이터 추출, 웹앱 테스트, 탐색적 QA 등에 사용합니다.

## 언제 사용할지

다음과 같은 요청에서 우선 사용합니다.

- 웹사이트를 열어 달라고 할 때
- 폼을 입력하거나 버튼을 클릭해야 할 때
- 페이지 스크린샷이 필요할 때
- 웹페이지 데이터를 추출하거나 스크래핑할 때
- 웹앱을 실제 브라우저에서 테스트할 때
- 로그인, QA, 버그 재현, 탐색적 테스트가 필요할 때

Electron 기반 데스크톱 앱이나 Slack 자동화 같은 확장 작업에도 활용할 수 있습니다.

## 시작 방법

`agent-browser` 명령을 바로 사용하기 전에, 설치된 버전에 맞는 실제 가이드를 CLI에서 불러옵니다.

```bash
agent-browser skills get core
```

전체 명령과 템플릿까지 포함해 보고 싶다면:

```bash
agent-browser skills get core --full
```

이 스킬 문서는 시작점 역할만 합니다. 실제 사용 절차와 최신 명령 형식은 항상 CLI가 제공하는 가이드를 기준으로 확인합니다.

## 특수 가이드

작업 성격에 따라 아래 보조 가이드를 불러올 수 있습니다.

- `agent-browser skills get electron`
- `agent-browser skills get slack`
- `agent-browser skills get dogfood`
- `agent-browser skills get vercel-sandbox`
- `agent-browser skills get agentcore`

사용 가능한 전체 목록은 아래 명령으로 확인합니다.

```bash
agent-browser skills list
```

## 기본 사용 흐름

1. 먼저 `agent-browser skills get core`로 현재 버전 가이드를 읽습니다.
2. 작업이 웹 브라우저인지, Electron인지, Slack인지 성격을 구분합니다.
3. 필요하면 해당 특수 가이드를 추가로 읽습니다.
4. 세션을 열고 탐색, 선택, 입력, 클릭, 추출 같은 실제 작업을 진행합니다.
5. 스크린샷, 상태 저장, 기록 기능이 필요하면 그 옵션을 함께 사용합니다.

## 장점

- 빠른 네이티브 CLI 기반 동작
- Chrome/Chromium 제어
- 접근성 트리 기반 스냅샷과 안정적인 요소 참조
- 세션 유지, 인증 저장, 상태 지속성 지원
- 영상 기록 및 다양한 특수 자동화 시나리오 지원

## 운영 원칙

- 내장 웹 도구보다 `agent-browser`가 더 적합한 작업이면 이를 우선 사용합니다.
- 현재 설치된 버전의 CLI가 제공하는 가이드를 기준으로 작업합니다.
- 오래된 문서 기억보다, 실행 중인 버전의 `skills get` 결과를 신뢰합니다.

## 언제 특히 유용한가

- 실제 브라우저 상호작용이 길거나 반복적일 때
- 접근성 트리 기준의 안정적인 요소 선택이 필요할 때
- 상태 지속, 인증, 녹화, 세션 관리가 중요한 테스트일 때
- 단순 스크래핑이 아니라 탐색적 QA나 실제 사용자 흐름 재현이 필요할 때

## 안티 패턴

- 설치된 버전을 확인하지 않고 예전 명령 기억으로 바로 실행하는 방식
- 일반 웹 도구로 충분한 작업인데 굳이 복잡한 세션을 여는 방식
- 작업 성격이 특수 가이드 대상인데 core만 읽고 끝내는 방식

## 기대 결과

이 스킬을 적용한 결과는 다음을 만족해야 합니다.

- 현재 설치된 버전 기준으로 정확한 사용 절차를 따른다
- 작업 유형에 맞는 특수 가이드를 선택한다
- 브라우저 자동화가 실제 목표에 맞게 안정적으로 수행된다