01왜 모델만으로는 실무가 끝나지 않는가
대형 모델은 의도를 잘 해석하지만 운영 환경을 직접 보지는 못합니다. 저장소에는 오래된 스크립트, 잠긴 권한, 실패 테스트, 미커밋 변경이 섞여 있습니다. Harness는 이 현실을 안전하게 보여 주고 제안을 검증 가능한 작업으로 바꿉니다.
- 권한 문제: 배포 키, 결제 페이지, 고객 데이터는 승인 흐름으로 분리합니다.
- 상태 문제: 명령, diff, 실패 로그, 최신 지시를 기억해 반복 실수를 줄입니다.
- 검증 문제: 코드 생성 뒤 테스트와 린트를 돌리고 실패하면 다시 원인을 좁힙니다.
02Agent Harness 결정 매트릭스
AI Agent 도입 기준은 모델 크기보다 Harness 실행 품질입니다. 표는 실무 차이가 큰 지점입니다.
| 구성 요소 | Harness 없음 | Harness 있음 |
|---|---|---|
| 도구 호출 | 모델 출력에 의존 | 명령, 파일, 브라우저를 정책으로 중재 |
| 권한 | 민감 작업이 섞임 | 승인, 샌드박스, 감사 로그 분리 |
| 복구 | 실패 뒤 사람이 재시작 | 로그 요약 후 수정 루프 재진입 |
| 인프라 | 노트북 상태에 종속 | 전용 Mac 노드에서 장시간 실행 |
03Harness의 여섯 레이어
도구 레이어는 Shell, 파일 편집, 브라우저, Git, API 호출의 입력과 출력을 기록합니다. 상태 레이어는 목표, diff, 테스트 결과를 짧은 기억으로 압축합니다. 권한 레이어는 삭제나 결제 변경을 사람 승인 뒤 실행합니다. 검증 레이어는 테스트와 빌드를 연결하고, 복구 레이어는 실패 로그를 읽어 재시도합니다. 마지막 인프라 레이어는 neokvm Mac mini M4처럼 Xcode, Homebrew, 시뮬레이터, 로컬 모델을 오래 유지하는 전용 노드입니다.
04원격 Mac에서 적용하는 5단계
- 업무 경계 지정: 저장소, 브랜치, 허용 명령, 금지 파일을 문서화합니다.
- 도구 묶음 선택: 편집, 테스트, Git diff, 웹 확인을 표준 도구로 고정합니다.
- 승인 정책 설정: 설치, 배포, 결제 링크 변경은 사용자 확인 뒤 실행합니다.
- Mac 노드 준비: 16GB는 일반 자동화, 24GB 이상은 Xcode와 로컬 추론 병렬에 맞춥니다.
- 결과 검증: 테스트 출력, 스크린샷, sitemap, JSON 포맷을 남기고 재시도합니다.
05인용 가능한 운영 기준
결론은 단순합니다. 모델은 두뇌이고 Harness는 손, 눈, 안전벨트입니다. iOS 빌드, 웹 QA, 블로그 자동화, 리팩터링을 반복한다면 로컬 노트북보다 전용 원격 Mac이 안정적입니다.
Agent Harness를 전용 Mac mini M4에서 실행해 보세요
neokvm의 물리 Mac 노드로 SSH, VNC, Xcode, 브라우저 테스트를 한 환경에 묶고 실제 업무 루프를 안정적으로 돌릴 수 있습니다.