앤트로픽은 수천 건의 오류를 발견한 후 새로운 AI 모델을 비공개로 유지했습니다.

Artificial Intelligence20 hours ago

Anthropic has withheld its most powerful AI model, Claude Mythos Preview, from public release after it discovered thousands of cybersecurity vulnerabilities across major platforms. Through Project Glasswing, the company is sharing the model exclusively with leading tech organisations and committing $100 million to help secure critical infrastructure.

첨단 AI 기술 활용 방식에 있어 극적인 변화를 예고하는 움직임으로, 앤트로픽은 주요 운영 체제와 웹 브라우저 전반에서 수천 건의 알려지지 않은 사이버 보안 취약점을 발견한 자사의 가장 진보된 인공지능 모델을 공개하지 않기로 결정했습니다. 상용 출시 대신, 앤트로픽은 전 세계 디지털 인프라 보안을 담당하는 기관들에 조용히 접근 권한을 제공했습니다.

무슨 일이 있었나: 프로젝트 글래스윙 및 클로드 미토스 프리뷰

문제의 모델은 Claude Mythos Preview라고 불리며, Anthropic이 현재까지 개발한 시스템 중 가장 뛰어난 성능을 자랑합니다. 내부 테스트에서 Mythos는 보안 결함을 식별하는 탁월한 능력을 보여주었으며, 현재 사용 중인 모든 주요 운영 체제 및 브라우저 생태계에서 수천 건의 취약점을 발견했습니다.

앤트로픽은 이를 단순한 제품 출시 기회로 여기기보다는 '프로젝트 글래스윙'이라는 새로운 이니셔티브를 시작했습니다. 이 프로그램은 미토스의 역량을 핵심 소프트웨어를 개발하고 유지 관리하는 기업 및 재단에 직접 제공합니다. 초기 파트너 명단에는 아마존 웹 서비스, 애플, 브로드컴, 시스코, 크라우드스트라이크, 구글, JP모건체이스, 리눅스 재단, 마이크로소프트, 엔비디아, 팔로알토네트웍스 등 세계 기술 업계의 주요 기업들이 포함되어 있습니다.

초기 참여 기관들을 넘어, 필수 소프트웨어 인프라를 개발하거나 유지 관리하는 40개 이상의 기관으로 접근 권한이 확대되었습니다. 이러한 노력을 재정적으로 지원하기 위해 앤트로픽은 최대 1억 달러 상당의 사용 크레딧을 제공하여 파트너들이 자체 코드베이스에서 Mythos를 실행할 수 있도록 할 예정입니다.

이것이 중요한 이유: 책임감 있는 AI 배포를 위한 새로운 패러다임

이번 결정은 여러 가지 이유로 매우 중요한 의미를 지닙니다. 첫째, 이는 인공지능 연구소가 보안상의 이유로 획기적인 모델의 상업적 잠재력을 의도적으로 제한한 가장 명확한 사례 중 하나입니다. 제품 출시 경쟁이 치열하다는 비판이 끊이지 않는 업계에서 앤트로픽은 신중한 태도를 보였으며, 이는 주목할 만한 점입니다.

둘째, 발견된 취약점의 규모는 실로 엄청납니다. 여러 플랫폼에서 수천 개의 취약점을 발견했다는 것은 Mythos가 인간 보안 연구원이나 기존 자동화 도구가 비슷한 시간 내에 달성할 수 있는 수준을 훨씬 뛰어넘는 코드 분석 능력을 갖추고 있음을 시사합니다. 예를 들어, 공개적으로 알려진 사이버 보안 취약점을 추적하는 글로벌 표준 데이터베이스인 CVE 데이터베이스에는 일반적으로 연간 약 25,000~30,000건의 새로운 항목이 등록됩니다. 단일 AI 모델이 단기간에 수천 건의 취약점을 발견했다는 것은 연간 전 세계 공개 취약점 수의 상당 부분을 차지하는 수치입니다.

셋째, 이러한 접근 방식은 취약점 연구의 경제성을 재정의할 수 있습니다. 마이크로소프트 오픈소스 툴킷이 런타임 시 AI 에이전트를 보호하는 방법 에 대한 저희 보도를 보셨다면, 버그 바운티 프로그램과 침투 테스트가 여전히 비용이 많이 들고 노동 집약적이라는 것을 아실 겁니다. 이러한 작업을 대규모로 수행할 수 있는 AI 모델은 기업들이 침해 관련 비용으로 수십억 달러를 절감하는 데 도움이 될 수 있습니다.

배경: 앤트로픽의 안전 제일주의 이미지

앤트로픽은 다리오 아모데이와 다니엘라 아모데이 남매를 포함한 전 오픈AI 연구원들이 2021년에 설립했습니다. 이 회사는 책임감 있는 확장 정책을 상세히 발표하고 정렬 연구에 막대한 투자를 하는 등, 최첨단 AI 경쟁에서 안전을 최우선으로 생각하는 대안 기업으로 자리매김해 왔습니다. 앤트로픽의 클로드(Claude) 모델군은 오픈AI의 GPT 시리즈 및 구글의 제미니(Gemini)와 직접 경쟁합니다.

Mythos를 공개하지 않기로 한 결정은 그러한 정신과 일맥상통합니다. 대규모로 제로데이 취약점을 식별할 수 있는 모델을 공개하는 것은 양날의 검과 같습니다. 방어자에게는 매우 유용하지만, 패치가 배포되기 전에 악의적인 공격자가 접근하여 동일한 취약점을 악용할 경우 잠재적으로 치명적인 결과를 초래할 수 있습니다.

이러한 긴장감은 보안 연구원들이 "공격-방어 비대칭" 문제라고 부르는 것의 핵심에 자리 잡고 있습니다. 공격자는 악용 가능한 취약점 하나만 찾으면 되지만, 방어자는 모든 취약점을 찾아 패치해야 합니다. 방어자에게 유리하게 균형을 기울일 수 있는 AI는, 그 기능이 신중하게 통제될 경우에만, 바로 그러한 종류의 도구로서 제한적인 배포 모델을 요구합니다.

인류와 산업에 대한 전략적 함의

비즈니스 관점에서 볼 때, 글래스윙 프로젝트는 단기적인 수익 감소를 감수하더라도 탁월한 전략입니다. 전략적 이점을 고려해 보세요.

핵심 인프라와의 심층적인 통합: Anthropic은 Mythos를 AWS, Microsoft, Google 등의 워크플로에 통합함으로써 어떤 마케팅 캠페인으로도 살 수 없는 의존성과 신뢰를 구축합니다.
규제 당국과의 우호적인 관계 구축: 전 세계 정부가 인공지능 관련 법안을 마련하는 가운데, 책임감 있는 자제력을 보여주는 것은 정책 결정에 중요한 영향을 미칠 신뢰를 얻는 데 필수적입니다.
데이터 피드백 루프: 파트너 조직이 확인하고 수정하는 모든 취약점은 미래의 Anthropic 모델을 더욱 강력하게 만드는 데 필요한 귀중한 학습 신호를 생성합니다.
경쟁 우위 확보: OpenAI나 Google DeepMind는 이와 유사한 규모의 솔루션을 발표한 적이 없어 Anthropic은 기업 보안 시장에서 독보적인 위치를 차지하고 있습니다.

JP모건체이스의 참여는 특히 주목할 만합니다. 금융 기관들은 끊임없는 사이버 공격에 직면하고 있으며, 세계에서 가장 엄격한 규제 체계 하에서 운영되고 있습니다. JP모건체이스의 참여는 Mythos가 이미 기술 분야를 넘어 가치를 입증했음을 보여줍니다. AI가 금융 서비스를 어떻게 변화시키고 있는지 궁금하시다면, Google AI가 자동화된 연구를 위한 PaperOrchestra를 공개한 기사를 확인해 보세요.

다음에는 무엇이 올까요?

여전히 해결되지 않은 질문들이 남아 있습니다. 앤트로픽은 가장 심각한 취약점들이 패치된 후, 미토스를 공개할까요? 파트너 조직들이 발견된 사항에 대해 시의적절하게 조치를 취하고 있는지 어떻게 검증할까요? 그리고 윤리적 안전장치 없이 적대 세력들이 자체적인 취약점 탐지 AI 모델을 개발하게 된다면 어떻게 될까요?

업계 전반에서도 이러한 협력적이고 준자선적인 접근 방식이 하나의 모델이 될지 주목할 것입니다. 만약 사이버 보안 방어에 1억 달러를 투자하여 침해 감소, 패치 속도 향상, 더욱 안전한 인터넷 환경 조성과 같은 가시적인 성과를 거둔다면, 다른 AI 연구소들도 유사한 방식을 따라야 한다는 압력을 받게 될 것입니다.

또한 정부가 이러한 책임 있는 정보 공개 체계를 의무화할지 여부에 대한 의문도 제기됩니다. 미국의 사이버보안 및 인프라 보안국(CISA)은 이미 광범위한 임무의 일환으로 AI 기반 취약점 탐지에 관심을 표명했습니다.

결론

앤트로픽이 클로드 미토스 프리뷰를 공개하지 않기로 한 결정은 올해 AI 업계에서 가장 중요한 움직임 중 하나입니다. 화려함보다 보안을 우선시한 앤트로픽은 가장 강력한 AI 모델이 항상 제품으로만 존재하는 것이 아니라, 때로는 모두를 보호하는 데 가장 적합한 사람들이 조용히 사용하는 도구가 되어야 한다는 계산된 판단을 내린 것입니다. 이러한 전략이 성공할지는 실행력, 투명성, 그리고 업계 전체가 개인의 이익보다 집단적 방어를 우선시하는 방향을 따를 의향이 있는지에 달려 있습니다.