LLM을 활용한 Chrome 브라우저 자동화: MCP 프로토콜 실험

📅 2025-05-26T22:22:49Z 👤 Dustin Runnells 🏷️ 개발

완성도:

0.8

🤖 AI 추천

이 콘텐츠는 LLM(Large Language Model)과 브라우저 자동화에 관심 있는 개발자, 특히 웹 개발자, 백엔드 개발자 및 자동화 도구 개발자에게 유용합니다. LLM을 사용하여 실제 작업을 수행하는 방법을 익히고 싶은 미들 레벨 이상의 개발자에게 추천합니다.

🔖 주요 키워드

LLM MCP Chrome 자동화 브라우저 제어 AnythingLLM llama.cpp 원격 디버깅

핵심 기술

이 글은 LLM(Large Language Model)과 Model Context Protocol (MCP)을 사용하여 Chrome 브라우저를 프로그래밍 방식으로 제어하는 실험 과정을 상세히 설명합니다. AnythingLLM, llama.cpp, 그리고 Chrome의 원격 디버깅 기능을 통합하여 LLM에게 자연어 명령을 내리는 것만으로 웹 브라우징 작업을 자동화하는 방법을 제시합니다.

기술적 세부사항

MCP (Model Context Protocol): LLM 애플리케이션과 사용 가능한 도구 및 기능 간의 표준화된 연결 방법을 제공합니다.
AnythingLLM: 로컬 llama.cpp 서버와 연동하며 MCP 지원을 추가한 도구로, LLM과의 상호작용을 위한 프레임워크 역할을 합니다.
Chrome 원격 디버깅: --remote-debugging-port 옵션을 사용하여 Chrome을 실행하면, 외부 도구에서 브라우저를 제어할 수 있는 디버깅 서버가 활성화됩니다.
Chrome MCP Server: Aleksey Smolenchuk가 개발한 이 서버는 Chrome 원격 디버깅 API와 MCP를 연결하여 LLM의 브라우저 제어를 가능하게 합니다.
설정 과정: Chrome을 디버깅 모드로 실행하고, Chrome MCP 서버를 클론 및 설치한 후, AnythingLLM의 anythingllm_mcp_servers.json 파일에 MCP 서버 설정을 추가하는 단계를 포함합니다.
실행 예시: AnythingLLM에서 @agent 명령어를 사용하여 LLM에게 특정 웹사이트(dev.to)로 이동하여 블로그 게시물을 작성하라는 지시를 내리는 시나리오를 보여줍니다.