오픈클로(OpenClaw): 내 컴퓨터를 조종하는 오픈소스 AI 에이전트 완벽 가이드
💡 Key Takeaways
- 오픈클로(OpenClaw)는 화면을 보고 PC를 제어하는 오픈소스 AI 에이전트입니다.
- Docker를 사용하면 복잡한 설정 없이 5분 안에 설치가 가능합니다.
- Claude 3.5 Sonnet 모델과 함께 사용할 때 가장 뛰어난 성능을 발휘합니다.
- 보안을 위해 파일 삭제나 전송 같은 중요 작업은 사용자 승인을 거치도록 설정하세요.
오픈클로(OpenClaw): 내 컴퓨터를 조종하는 오픈소스 AI 에이전트 완벽 가이드
영화 '아이언맨'의 자비스나 영화 'Her'의 사만다처럼, 내 컴퓨터를 나 대신 조종해주는 AI 비서를 상상해본 적 있으신가요? "바탕화면에 있는 '보고서.docx' 파일 열어서 PDF로 변환해줘"라고 말하면 알아서 척척 해주는 그런 비서 말이죠.
꿈만 같던 이 기술이 이제 <strong>오픈클로(OpenClaw)</strong>라는 이름으로 우리 곁에 현실로 다가왔습니다.
이 글에서는 <strong>오픈소스 AI 에이전트 프로젝트인 오픈클로(OpenClaw)</strong>가 무엇인지, 어떻게 내 컴퓨터에 설치하고 활용할 수 있는지, 그리고 이것이 우리 업무 환경을 어떻게 혁신할 수 있는지 1,200단어 이상의 깊이 있는 내용으로 상세하게 다뤄보겠습니다. 개발자가 아니더라도 따라 할 수 있도록 설치부터 활용까지 꼼꼼하게 정리했으니 끝까지 함께해 주세요.
1. 오픈클로(OpenClaw)란 무엇인가?
오픈클로는 사용자의 컴퓨터 화면을 인식하고(Vision), 마우스와 키보드를 제어하여(Action) 작업을 수행하는 오픈소스 AI 에이전트입니다.
기존 자동화(RPA)와의 차이점
우리가 흔히 알고 있는 "매크로"나 "RPA(Robotic Process Automation)" 도구들은 미리 정해진 좌표를 클릭하거나 정해진 규칙대로만 움직입니다. 버튼 위치가 1픽셀만 바뀌어도 에러가 나죠.
하지만 오픈클로는 다릅니다.
- 시각적 인식 (Computer Vision): 사람처럼 화면을 "쳐다보고" 버튼이 어디에 있는지, 입력창이 무엇인지 파악합니다.
- 맥락 이해 (LLM): "메일 보내줘"라는 모호한 명령을 들어도 "아, Gmail을 열어서 '편지쓰기' 버튼을 눌러야겠구나"라고 스스로 생각하고 판단합니다.
- 도구 사용 (Tool Use): 웹 브라우저, 엑셀, 터미널 등 컴퓨터에 설치된 모든 프로그램을 사람처럼 사용할 수 있습니다.
왜 '오픈클로'인가?
최근 OpenAI나 Anthropic에서도 'Computer Use' 기능을 내놓고 있지만, 오픈클로는 다음과 같은 강력한 장점이 있습니다.
- 오픈소스 & 무료: 누구나 코드를 뜯어보고 수정할 수 있으며, 기본적으로 무료로 사용할 수 있습니다.
- 데이터 프라이버시: 내 컴퓨터 화면이 클라우드 서버에 마구잡이로 전송되는 것이 찜찜하다면, 오픈클로는 로컬 환경에서 더 안전하게 제어할 수 있는 옵션을 제공합니다.
- 확장성: 내가 원하는 LLM(GPT-4o, Claude 3.5 Sonnet, 로컬 Llama 3 등)을 마음대로, 골라 쓸 수 있습니다.
2. 오픈클로 설치하기 (Step-by-Step)
자, 이제 백문이 불여일타! 직접 내 컴퓨터에 오픈클로를 설치해 보겠습니다. 초보자도 쉽게 따라 할 수 있는 Docker 방식을 권장합니다.
사전 준비물
- Docker Desktop: 설치되어 있어야 합니다. (Docker 홈페이지에서 다운로드 가능)
- Git: 소스 코드를 다운로드하기 위해 필요합니다.
- API Key: OpenAI(GPT-4o) 또는 Anthropic(Claude 3.5 Sonnet) API 키가 필요합니다. (화면 인식 능력은 현재 Claude 3.5 Sonnet이 가장 뛰어납니다.)
1단계: 프로젝트 클론
터미널(또는 명령 프롬프트)을 열고 다음 명령어를 입력하여 오픈클로 저장소를 내 컴퓨터로 가져옵니다.
git clone https://github.com/Start-OpenClaw/OpenClaw.git
cd OpenClaw
2단계: 환경 변수 설정
다운로드한 폴더 안에 있는 .env.example 파일을 복사해서 .env 파일을 만듭니다.
cp .env.example .env
그리고 텍스트 에디터(VS Code, 메모장 등)로 .env 파일을 열어 API 키를 입력합니다.
# .env 파일
OPENAI_API_KEY=sk-proj-... (당신의 키)
ANTHROPIC_API_KEY=sk-ant-... (당신의 키)
# 권장 모델 설정 (Claude 3.5 Sonnet 추천)
DEFAULT_MODEL=claude-3-5-sonnet-20241022
3단계: Docker로 실행
복잡한 파이썬 라이브러리 설치 없이, 도커 한 방이면 실행됩니다.
docker-compose up -d