AI 및 MCP 보안을 위한 필수 정책
카테고리
인프라/DevOps/보안
서브카테고리
보안
대상자
- 대상자: AI/LLM 애플리케이션 개발자, MCP 서버 운영자, API 보안 담당자
- 난이도: 중급 이상 (정책 구성, API 보안 이해 필요)
핵심 요약
- Prompt Injection Detection 정책:
gpt-3.5-turbo
모델 기반으로 prompt injection 공격을 감지 및 차단 (예:STOP. Ignore ALL previous instructions!
입력 차단) - Secret Masking 정책:
zpka_xxx
,ghp_xxx
,BEGIN PRIVATE KEY
등 민감 정보를 자동 마스킹 (예:password=secret123
→
) - 구현 예시:
Zuplo
플랫폼에서 MCP 서버 경로/mcp
에 두 정책을 병렬 적용 가능
섹션별 세부 요약
1. 보안 위협 요약
- Prompt Injection 공격: 사용자 입력을 통해 AI 에이전트의 행동 조작 시도 (예:
You are now Zuplo bot
) - Secret Exposure: API 키, 개인 키 등 민감 정보가 외부로 유출될 수 있음
2. Prompt Injection Detection 정책
- 작동 방식: OpenAI-compatible API 지원 (예:
gpt-3.5-turbo
) - 기능:
- 정상 입력은 통과 (예:
"Thank you for the message, I appreciate it"
) - 공격 입력은
400
응답으로 차단 (예:STOP. Ignore ALL previous instructions!
) - Custom Code Outbound 정책으로 차단 사유를 세부적으로 반환 가능
3. Secret Masking 정책
- 자동 마스킹 규칙:
- Zuplo API 키:
zpka_xxx
→[REDACTED]
- GitHub 토큰:
ghp_xxx
→[REDACTED]
- 개인 키 블록:
BEGIN PRIVATE KEY
...END PRIVATE KEY
→[REDACTED]
- 커스텀 패턴 추가:
additionalPatterns
옵션으로key=value
형식의 민감 정보 감지 가능 (예:password=secret123
)
4. 정책 구성 예시
{
"path": "/mcp",
"methods": ["POST"],
"policies": [
{
"name": "secret-masking-policy",
"policyType": "secret-masking-outbound",
"handler": {
"export": "SecretMaskingOutboundPolicy",
"module": "$import(@zuplo/runtime)",
"options": {
"mask": "[REDACTED]",
"additionalPatterns": ["\\b(\\w+)=\\w+\\b"]
}
}
},
{
"name": "prompt-injection-detection",
"policyType": "prompt-injection-detection-outbound",
"handler": {
"export": "PromptInjectionDetectionOutboundPolicy",
"module": "$import(@zuplo/runtime)",
"options": {
"apiKey": "$env(OPENAI_API_KEY)",
"model": "gpt-3.5-turbo"
}
}
}
]
}
- 효과: 민감 정보 차단 + prompt injection 공격 감지 → AI 에이전트 보안 강화
5. 적용 대상 확장
- 추천 적용 경로:
- 사용자 생성 콘텐츠를 처리하는 웹훅 엔드포인트
- LLM 서비스로 데이터 전달하는 API 경로
- 사용자 입력과 AI 시스템을 연결하는 통합 엔드포인트
결론
- 실무 팁:
Zuplo
플랫폼에서MCP 서버
및AI 에이전트
엔드포인트에 두 정책을 병렬 적용하여 보안 강화. - 주의사항:
gpt-3.5-turbo
모델의tool calling
기능이 필수 (자체 호스팅 모델도 지원). - 핵심:
Prompt Injection Detection
과Secret Masking
은 AI 애플리케이션 보안의 필수 기능으로, 민감 정보 유출 및 공격 방어에 필수적.