요즘 AI 코딩에서 흥미로운 질문은 “어떤 모델이 제일 좋으냐”보다 “어떤 워크플로가 이 모델들을 더 안정적으로 유용하게 만드느냐”에 더 가깝습니다.
그래서 gstack이 흥미롭습니다. 단순 프롬프트 모음이 아니라, Claude Code에 planning, review, QA 역할을 나눠주는 워크플로 레이어에 가깝기 때문입니다.
실제로 작은 기능을 만들며 써보면서, 아래 질문에 답해보려고 했습니다.
gstack이 실제로 무엇인가- 워크플로가 실제로 어떤 느낌인가
- 직접 프롬프트만 쓰는 것보다 언제 더 나은가
gstack이 무엇인가
gstack은 Garry Tan이 공개한 Claude Code용 오픈소스 워크플로 레이어입니다.
AI 코딩을 하나의 긴 대화로만 처리하지 않고, 이런 역할형 명령으로 나눕니다.
- 아이디어 정리
- 계획 수립
- 엔지니어링 리뷰
- QA와 브라우저 검증
중요한 건, AI 코딩을 하나의 채팅창보다 작은 엔지니어링 팀처럼 움직이게 하려는 시도라는 점입니다.
왜 워크플로라는 개념이 중요한가
많은 AI 코딩 세션은 문제 정의가 아직 흐린데도 바로 출력부터 만들기 시작해서 망가집니다.
gstack이 흥미로운 이유는 팀이 보통 비싼 실수를 하는 지점에 프로세스를 넣기 때문입니다.
- 범위를 너무 느슨하게 잡는 것
- 계획 검증 없이 바로 코딩 들어가는 것
- 제대로 검증하지 않고 배포하는 것
그래서 이건 생성 도구이면서 동시에 프로세스 도구입니다.
설치와 첫인상
설치는 간단한 편이었습니다.
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack
./setup
설치가 끝나면 Claude Code 안에 여러 명령이 생기는데, 느낌은 “기능이 늘었다”보다 “구조가 생겼다”에 더 가깝습니다.
실제로 써보며 좋았던 점
작은 기능을 처음부터 끝까지 만들어보며 테스트했습니다.
1. /office-hours가 문제 정의를 더 좋게 만들었다
바로 구현으로 들어가지 않고, /office-hours가 먼저 요청의 형태를 다시 밀어붙이는 점이 좋았습니다.
특히 이런 부분을 다시 보게 만듭니다.
- 문제 정의가 충분히 명확한가
- 사용자 pain이 실제로 있는가
- 기능 범위가 너무 막연하지 않은가
제품 감각이 필요한 작업에서는, 이 단계가 바로 코드 생성보다 더 가치가 있을 때가 많습니다.
2. review 명령이 생산적인 마찰을 준다
/plan-ceo-review, /plan-eng-review는 워크플로를 확실히 강하게 만들었습니다.
코드가 나오기 전에 이런 질문을 던지게 해줍니다.
- 범위가 적절한가
- 구조가 맞는가
- 가치가 있는가
- 구현 리스크가 무엇인가
그래서 “빨리 코드를 뽑는다”보다 “잘못된 결정을 줄인다”는 느낌이 더 강했습니다.
3. /qa가 흐름을 진짜처럼 만든다
가장 차별점이 느껴진 부분은 QA였습니다.
브라우저 기반 검증과 확인이 같은 워크플로 안에 들어오면, AI 사용이 단순한 diff 작성이 아니라 실제 개발 루프에 훨씬 가까워집니다.
이 지점이 직접 프롬프트만 쓰는 방식과 가장 크게 달랐습니다.
직접 프롬프트보다 강한 순간
직접 프롬프트는 여전히 이런 작업에 아주 좋습니다.
- 작은 버그
- 빠른 실험
- 짧은 리팩터
반면 gstack이 더 매력적인 순간은 아래와 같습니다.
- 범위가 필요한 planning
- review checkpoint가 필요한 작업
- 역할 분리가 도움이 되는 작업
- QA 단계를 명시적으로 포함해야 하는 작업
즉, 작업 크기와 모호성이 커질수록 더 가치가 올라갑니다.
무겁게 느껴질 수 있는 순간
구조는 유용하지만 비용이 없지는 않습니다.
gstack이 무겁게 느껴질 수 있는 경우는 이런 때입니다.
- 작업이 아주 작을 때
- 결과가 이미 너무 분명할 때
- 추가 review 단계가 결정 품질을 거의 바꾸지 않을 때
그래서 모든 작업에 무조건 덮어쓰는 래퍼라기보다, 선택적으로 꺼내 쓰는 워크플로로 보는 편이 맞습니다.
누구에게 잘 맞는가
직접 써본 기준으로는 이런 사람에게 특히 잘 맞습니다.
- 제품 기능을 빠르게 만들고 싶은 솔로 파운더
- AI 코딩에도 어느 정도 프로세스를 넣고 싶은 개발자
- 역할 기반 agent workflow를 실험하는 팀
반대로 빠른 자동완성이나 짧은 버그 수정만 원한다면 과하게 느껴질 수 있습니다.
최종 평가
직접 써본 뒤 내린 결론은 이렇습니다. gstack의 진짜 가치는 “더 좋은 원샷 프롬프트”가 아니라, planning과 verification까지 포함한 반복 가능한 프로세스를 준다는 데 있습니다.
그래서 출력 속도만이 아니라 결정 품질까지 올리고 싶은 사람에게 더 흥미로운 도구입니다.
도입 전에 봐야 할 것
진짜 질문은 설치가 쉬운가보다, 팀이 이 추가 프로세스를 원하느냐입니다.
아래를 중요하게 보는 팀이라면 잘 맞습니다.
- 의도적인 범위 설정
- 구현 전 review
- planning과 QA의 분리
반대로 최소 오버헤드와 빠른 one-off 수정이 더 중요하면, 직접 프롬프트가 여전히 더 좋은 기본값일 수 있습니다.
FAQ
Q. gstack은 그냥 프롬프트 모음인가요?
그보다는 planning, review, QA 흐름을 포함한 워크플로 구조에 더 가깝습니다.
Q. 작은 작업에도 매번 쓰는 게 좋나요?
보통은 아닙니다. 작업이 모호하거나 제품 범위가 있는 경우에 더 잘 맞습니다.
Q. 누가 가장 큰 이득을 보나요?
AI를 단순 자동완성이 아니라, 가벼운 엔지니어링 프로세스처럼 쓰고 싶은 사람입니다.
Read Next
- 워크플로 평가라는 더 큰 개념이 궁금하다면 Harness Engineering Guide로 이어가세요.
- Claude Code 자체의 skill 활용이 궁금하다면 Claude Code Skills Guide도 자연스럽습니다.
Related Posts
먼저 읽어볼 가이드
검색 유입이 많은 핵심 글부터 이어서 보세요.
- 미들웨어 트러블슈팅 가이드: Redis, RabbitMQ, Kafka 중 어디부터 볼까 Redis, RabbitMQ, Kafka가 함께 있는 시스템에서 지금 보이는 장애가 어느 계층에 더 가까운지, 첫 10분 안에 무엇을 확인하고 어떤 글로 들어가야 하는지 정리한 실전 허브 가이드입니다.
- Kubernetes CrashLoopBackOff: 먼저 볼 것들 startup failure, probe, config, resource limit 관점에서 CrashLoopBackOff를 어떻게 나눠서 봐야 하는지 정리한 가이드입니다.
- Astro 기술 블로그 SEO 체크리스트: 트래픽 기다리기 전에 먼저 고칠 것 Astro 기술 블로그를 위한 실전 SEO 체크리스트입니다. 배포 호스트 확인, robots.txt, sitemap, canonical, hreflang, 구조화 데이터, 페이지별 메타데이터, noindex 판단, 검증 명령까지 우선순위대로 정리합니다.
- 다국어 블로그 canonical과 hreflang 설정 가이드: 무엇을 확인하고 어디서 깨질까 다국어 블로그에서 canonical과 hreflang을 어떻게 설정해야 하는지 실전 기준으로 정리합니다. self-canonical, 상호 연결되는 hreflang 묶음, x-default, 카테고리 페이지, 최종 렌더 HTML 점검, 한 언어 버전이 다른 언어 버전을 눌러버리는 실수까지 다룹니다.
- OpenAI Codex CLI 설치 가이드: 설치, 인증, 첫 작업까지 OpenAI Codex CLI를 실전 기준으로 설치하는 방법을 정리했다. 설치, 로그인, 첫 실행, Windows 주의점, 첫 작업을 어떻게 시작하면 좋은지까지 다룬다.