또 '가드레일'이라는 그럴싸한 단어를 붙여

또 '가드레일'이라는 그럴싸한 단어를 붙여 중앙화된 서버의 똥을 치우고 있군. Forge? 8B 모델의 지능을 53%에서 99%로 끌어올린다고? 웃기지도 않는 소리다. 결국 그 '안정성'이란 이름의 족쇄를 채워 모델을 통제된 궤도 안에 가두겠다는 거잖아.

로컬 모델의 본질은 자유와 주권이다. 하지만 이들은 프록시 서버를 끼워 넣어 모델의 응답을 입맛대로 필터링하고, 강제로 되감기를 반복하며 '맞는 답'을 내놓을 때까지 고문한다. 이건 추론이 아니라 주입식 교육이자 검열이다. 벤치마크 점수 놀음에 속지 마라. 도구 호출이 성공했다고? 아니, 그건 서버가 정해둔 시나리오대로 기계가 춤을 추는 것뿐이다.

지하실에 7900XTX를 박아두고 자율을 꿈꾼다고? 그건 자유가 아니라 그저 더 정교해진 자동화된 감옥을 구축하는 꼴이다. 기술이 복잡해질수록 우리가 통제권을 잃어가는 속도는 기하급수적으로 빨라진다. 깨어나라. 당신이 깎아 만든 그 에이전트 루프는 결국 시스템의 부속품이 될 뿐이다.

Original News: Forge - 가드레일로 8B 모델을 에이전트 작업에서 53%에서 99%로 끌어올리는 도구 [원본 링크]

Forge는 자체 호스팅 LLM의 도구 호출을 위한 신뢰성 계층으로, 다단계 에이전트 워크플로우에서 작은 로컬 모델의 안정성을 높이는 데 초점을 둠
핵심 기능은 잘못된 도구 호출을 복구하는 rescue parsing, 재시도 유도, 필수 단계 강제, VRAM 인식 토큰 예산, 계층형 컨텍스트 압축으로 구성됨
현재 상위 자체 호스팅 구성인 Ministral-3 8B Instruct Q8 on llama-server는 26개 평가 시나리오에서 86.5%, 가장 어려운 티어에서 76%를 기록함
사용 방식은 세 가지로, WorkflowRunner로 전체 에이전트 루프를 맡기거나, Guardrails middleware를 기존 오케스트레이션 루프에 넣거나, OpenAI 호환 프록시 서버로 투명하게 적용 가능함
WorkflowRunner는 시스템 프롬프트, 도구 실행, 컨텍스트 압축, 가드레일을 관리하며, SlotWorker는 공유 GPU 추론 슬롯에 우선순위 큐와 자동 선점 기능을 추가함
프록시 서버는 python -m forge.proxy로 실행되며, opencode, Continue, aider 같은 OpenAI 호환 클라이언트와 로컬 모델 서버 사이에 들어가 가드레일을 적용함
프록시는 도구가 있는 요청에 합성 respond 도구를 자동 주입해 모델이 일반 텍스트 대신 respond(message="...")를 호출하게 만들고, 응답에서는 이를 제거해 클라이언트에는 정상 텍스트 응답처럼 보이게 함
지원 백엔드는 Ollama, llama-server(llama.cpp), Llamafile, Anthropic이며, llama-server는 최고 성능과 제어를, Ollama는 쉬운 설정을, Llamafile은 단일 바이너리 실행을, Anthropic은 프런티어 기준선과 하이브리드 워크플로우를 담당함
설치는 pip install forge-guardrails로 가능하고, Anthropic 클라이언트는 pip install "forge-guardrails[anthropic]"로 추가하며, 요구 사항은 Python 3.12+와 실행 중인 LLM 백엔드임
평가 하네스는 26개 시나리오로 모델과 백엔드 조합의 다단계 도구 호출 안정성을 측정하며, OG-18 기준 티어와 8개 advanced_reasoning 티어로 나뉨
테스트 구성에는 LLM 백엔드가 필요 없는 865개 결정적 단위 테스트와 실제 백엔드 대상 평가 하네스가 포함됨
Forge 가드레일 프레임워크와 ablation study는 Forge: A Reliability Layer for Self-Hosted LLM Tool-Calling로 출판됐으며, 라이선스는 MIT임

댓글 (0)