LLM이 어떻게 파일을 읽고, 웹을 검색하고, 명령을 실행할 수 있을까요?
답은 단순합니다. 모델 자체가 마법처럼 세상을 직접 바꾸는 것이 아니라, tool-calling interface를 통해 움직이기 때문입니다.
짧게 말하면, agent는 모델이 도구를 고르고, 인자를 넘기고, 결과를 해석하고, 그 루프를 안정적으로 반복할 수 있을 때 실용적인 시스템이 됩니다.
이 글은 agent skill이 무엇인지, 어떤 도구 범주가 중요한지, 실제 시스템은 어디서 자주 망가지는지를 설명합니다.
agent skill은 실제로 무엇인가
agent skill은 AI 시스템이 외부 세계와 상호작용할 수 있게 해주는 인터페이스입니다.
예를 들면 아래와 같습니다.
- 웹 검색
- 코드 실행 sandbox
- 파일 읽기와 쓰기
- 내부 API
- 브라우저 자동화
모델은 어떤 도구가 있는지 알고, 현재 작업에 맞는 도구를 골라 구조화된 인터페이스를 통해 사용합니다.
왜 skill이 그렇게 중요한가
도구가 없으면 모델은 설명은 할 수 있습니다. 도구가 있으면 실제로 확인하고, 가져오고, 계산하고, 수정하고, 검증할 수 있습니다.
즉 차이는 아래와 같습니다.
- 어떻게 해야 하는지 설명하는 것
- 실제로 하도록 돕는 것
그래서 agent 시스템은 일반 채팅 인터페이스보다 훨씬 더 실전적으로 느껴집니다.
대표적인 skill 범주
| Skill | Role |
|---|---|
| web search | fetch current information |
| code execution | compute, analyze, validate scripts |
| file I/O | read and edit code or documents |
| external API calls | connect to Slack, Jira, databases, email |
실전에서는 이 중 최소 두 가지 이상이 함께 돌아갈 때 가치가 크게 올라갑니다.
왜 function calling이 중요한가
중요한 점은 모델이 세상을 직접 바꾸는 것이 아니라, 어떤 함수를 어떤 인자로 호출해야 하는지 결정한다는 데 있습니다.
일반적인 루프는 아래와 같습니다.
- 개발자가 사용할 도구를 정의합니다
- 모델이 적절한 도구를 고릅니다
- 함수 이름과 인자를 반환합니다
- 애플리케이션이 함수를 실행합니다
- 실행 결과가 다시 모델로 돌아갑니다
이 루프 덕분에 파일 수정, 실시간 조회, 내부 워크플로우 자동화, 코딩 보조가 가능해집니다.
어떤 조합이 가장 가치가 큰가
1. 검색과 요약
문서, 리서치, 최신 정보 작업에 유용합니다.
2. 코드 실행과 검증
계산, 스크립트, 구조화된 분석, 차트, 검증에 유용합니다.
3. 파일 수정과 build 명령
코딩 agent에서 가장 핵심적인 루프 중 하나입니다.
4. 내부 API와 workflow logic
업무 자동화에서 특히 큰 가치를 만드는 조합입니다.
흔한 설계 실수
1. tool 설명이 너무 모호하다
파라미터와 의도가 불분명하면 모델이 잘못 고를 가능성이 커집니다.
2. 도구를 한 번에 너무 많이 노출한다
선택지가 많아질수록 판단 품질이 오히려 떨어질 수 있습니다.
3. 실패 경로를 설계하지 않는다
실제 시스템은 아래를 계속 처리해야 합니다.
- API 에러
- 빈 결과
- 권한 실패
- 부분 성공
4. 보안 경계가 약하다
파일 쓰기, 명령 실행, 내부 API 접근은 명확한 제한이 필요합니다.
5. tool 출력이 모델이 쓰기 어렵다
도구가 기술적으로는 성공해도, 출력이 너무 시끄럽거나 구조가 나쁘면 모델은 제대로 활용하기 어렵습니다.
skill을 보는 실전 관점
skill은 단순한 기능 목록이 아니라 운영 경계이기도 합니다.
각 skill은 아래를 정의합니다.
- agent가 무엇을 할 수 있는가
- 어떤 입력 형태를 받는가
- 어떤 출력 형태를 돌려주는가
- 어떤 위험을 시스템이 감싸야 하는가
그래서 좋은 skill 설계는 모델 품질만큼 중요할 때가 많습니다.
FAQ
Q. skill과 function calling은 사실상 같은 말인가요?
실무 설명에서는 거의 비슷하게 이해해도 됩니다. function calling은 메커니즘이고, skill은 그 위에 올라간 시스템 개념에 가깝습니다.
Q. 처음 붙여볼 만한 skill은 무엇인가요?
검색, 파일 읽기, 코드 실행이 보통 가장 시작하기 쉽고 가치도 바로 체감됩니다.
Q. 왜 agent가 갑자기 더 똑똑해 보이나요?
모델 성능 향상도 있지만, 더 큰 이유는 도구 덕분에 모델 밖의 정보와 행동에 접근할 수 있게 되었기 때문입니다.
Q. 도구 수가 많은 게 더 중요한가요, 좋은 도구가 더 중요한가요?
보통은 좋은 도구가 더 중요합니다. 잘 설명되고 신뢰할 수 있는 작은 도구 세트가 큰 잡탕 도구 모음보다 낫습니다.
Read Next
- 개념부터 다시 보고 싶다면 AI Agent Beginner Guide를 보세요.
- 코딩 워크플로우 관점이 궁금하면 OpenAI Codex Guide for Software Engineers를 보세요.
- agent 스타일 코딩 도구를 비교하고 싶다면 Claude Code vs Cursor vs Codex를 보세요.
Related Posts
- AI Agent Beginner Guide
- OpenAI Codex Guide for Software Engineers
- Claude Code vs Cursor vs Codex
- Claude Code Skills Guide
먼저 읽어볼 가이드
검색 유입이 많은 핵심 글부터 이어서 보세요.
- 미들웨어 트러블슈팅 가이드: Redis, RabbitMQ, Kafka 중 어디부터 볼까 Redis, RabbitMQ, Kafka가 함께 있는 시스템에서 지금 보이는 장애가 어느 계층에 더 가까운지, 첫 10분 안에 무엇을 확인하고 어떤 글로 들어가야 하는지 정리한 실전 허브 가이드입니다.
- Kubernetes CrashLoopBackOff: 먼저 볼 것들 startup failure, probe, config, resource limit 관점에서 CrashLoopBackOff를 어떻게 나눠서 봐야 하는지 정리한 가이드입니다.
- Astro 기술 블로그 SEO 체크리스트: 트래픽 기다리기 전에 먼저 고칠 것 Astro 기술 블로그를 위한 실전 SEO 체크리스트입니다. 배포 호스트 확인, robots.txt, sitemap, canonical, hreflang, 구조화 데이터, 페이지별 메타데이터, noindex 판단, 검증 명령까지 우선순위대로 정리합니다.
- 다국어 블로그 canonical과 hreflang 설정 가이드: 무엇을 확인하고 어디서 깨질까 다국어 블로그에서 canonical과 hreflang을 어떻게 설정해야 하는지 실전 기준으로 정리합니다. self-canonical, 상호 연결되는 hreflang 묶음, x-default, 카테고리 페이지, 최종 렌더 HTML 점검, 한 언어 버전이 다른 언어 버전을 눌러버리는 실수까지 다룹니다.
- OpenAI Codex CLI 설치 가이드: 설치, 인증, 첫 작업까지 OpenAI Codex CLI를 실전 기준으로 설치하는 방법을 정리했다. 설치, 로그인, 첫 실행, Windows 주의점, 첫 작업을 어떻게 시작하면 좋은지까지 다룬다.