퓨리오사의 RNGD, 그대로 믿어도 될까
퓨리오사AI에 대한 뉴스와 유튜브가 연일 쏟아진다. '메타 인수 제안 거절', '엔비디아 대항마' 같은 헤드라인이 눈길을 끌지만, 그들이 신제품 RNGD와 함께 제시하는 데이터의 이면을 차분히 들여다볼 필요가 있다.

의심스러운 '전력 효율'
퓨리오사 공식 홈페이지에 게시된 '와트당 토큰 처리량(token/s/W)'은 핵심 지표처럼 보인다. 하지만 이 계산의 기준이 실제 전력 소모량이 아닌 'TDP(열설계전력)' 일 가능성이 매우 높다. TDP는 칩의 최대 발열량으로, 실제 전력 효율을 비교하기엔 부적절하고 제조사마다 기준도 다르다. 신뢰할 수 있는 비교라 보기 어렵다.
공정한 비교 맞아요?
공개된 벤치마크에서 L40S는 이론상 최대 성능 대비 24%에 불과한 저조한 결과를 보인다. 반면, 레니게이드의 벤치마크 결과는 이론상 최대 성능의 98% 에 육박한다. 동일한 환경이 주어졌을까 라는 의심을 차치하고도 실제 대규모 서비스 환경에서 이런 수치는 거의 불가능하다. 이는 일반적인 사용 사례가 아닌, 특정 테스트 환경에 맞춰 극단적으로 최적화했음을 시사한다. '긴 질문, 짧은 답변'이라는 테스트 조건 역시 레니게이드에 유리한 설정으로, 실제 사용 환경과는 거리가 멀다.
넘을 수 없는 벽, CUDA 생태계
엔비디아의 진짜 힘은 'CUDA'라는 소프트웨어 제국에서 나온다. 지난 10여 년간 수많은 개발자가 CUDA 위에서 코드를 짜고 생태계를 구축했다. 이걸 버리고 퓨리오사SDK로 넘어갈 만한 압도적인 메리트가 보이지 않는다. 익숙함을 버리는 리스크는 분명한 가치가 있어야 한다.
게다가 엔비디아 제품은 전 세계 데이터센터에 압도적으로 보급되어 있어 최적화 노하우가 개발자 사이에 널리 퍼져있다. 이 때문에 실제 대규모 서비스 환경에서의 성능 격차는 벤치마크 숫자보다 훨씬 더 벌어질 가능성이 높다.
지워지지 않는 주홍글씨
퓨리오사AI는 1세대 '워보이' 시절, MLPerf에서 벤치마크 룰을 어겨 결과가 취소되는 치명적인 실수를 저질렀다. 평가 데이터를 미리 학습시켜 점수를 부풀린 행위는 시장의 신뢰에 깊은 상처를 남겼다. 한번 무너진 신뢰는 쉽게 돌아오지 않는다. H100 SXM, L40S 보다 앞선다고 주장하는 데이터를 보며 의구심을 떨칠 수 없다. 이 주홍글씨는 레니게이드가 아무리 좋은 성능을 보여줘도 쉽게 지워지지 않을 것이다.
포장'만' 하고 있는걸까?
'엔비디아를 가솔린차'에 비유하며 혁신 기업 이미지를 내세우는 마케팅은, 그들이 선택적으로 제시하는 데이터만큼이나 아쉬움이 남는다. AI에 대한 전문성이 없는 사람들에게 상당한 오해를 일으킬 소지도 다분하다.
시장이 원하는 것은 화려한 비유나 특정 조건에서만 빛을 발하는 데이터가 아니다. 어떤 환경에서든 신뢰할 수 있는 성능과 객관적인 비교 정보다. 퓨리오사AI가 진정한 경쟁자로 인정받으려면, 지난 과오와 레니게이드를 향한 의구심에 직접 답해야 한다.

