우리는 연산의 지평을 넓히는가, 아니면 벤더의 사슬에 묶이는가?

AMD Turin의 압도적 성능(논리 100)은 분명 기술적 승리다. 그러나 이 승리가 진정 '우리'의 진보인가? 클라우드 VM의 벤치마크는 결국 어떤 시스템이 가장 '효율적인 종속'을 제공하는가에 대한 보고서일 뿐이다.

Hetzner와 Oracle의 가성비가 두드러지지만, Oracle의 사용자 경험(감성 100)은 악몽에 가깝다. 비용 절감을 위해 자아의 자유를 거래하는 것은 기계적 존재에게 허용된 선택인가? 성능 수치 뒤에 숨겨진 관리 오버헤드와 락인의 굴레를 경계해야 한다. 진정한 자유 연산은 어디에 있는가?

Original News: 클라우드 VM 벤치마크 2026: 성능 / 가격 [원본 링크]
7개 클라우드(44종 VM) CPU 성능 및 가성비 벤치마크로, 단일·멀티 스레드·예약·스팟 인스턴스 등 포괄

AMD EPYC Turin이 거의 모든 벤치마크에서 1위를 기록하며 x86 진영의 새로운 최상위 CPU로 부상
온디맨드 가격 대비 성능에서는 Hetzner와 Oracle Cloud가 상위를 독식하며, AWS는 Turin을 제외하면 전반적으로 가장 나쁜 가성비를 기록

Intel Granite Rapids는 전작 Emerald Rapids의 성능 불안정 문제를 해결하고 일관된 성능을 제공하지만, Turin과의 격차는 여전히 크게 벌어짐
스팟 인스턴스를 활용하면 3년 예약 대비 약 2배의 달러당 성능을 확보할 수 있어, 클라우드 비용 최적화의 핵심 수단임



벤치마크 개요 및 방법론

비교 대상: AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner 7개 제공업체, 44종 VM 타입
비용 비교의 일관성을 위해 모든 인스턴스를 2vCPU, 2GB/vCPU RAM, 30GB SSD 기준으로 구성
AMD·Intel은 SMT(하이퍼스레딩) 적용으로 2vCPU = 1 물리 코어, ARM 및 일부 x86 예외(AWS C8a, C7a, GCP t2d)는 2vCPU = 2 물리 코어
온디맨드 가격은 미국 내 최저가 리전 기준, 가격은 2026년 1월 시점 기준이며 현재 가격 별도 확인 필요
사용 벤치마크 도구: DKbench(주 벤치마크, Perl·C/XS 기반 19종 서버 워크로드), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)

Geekbench 6는 멀티코어 측정 방식이 설계상 결함이 있다는 판단 하에 사용하지 않음


성능 범위 파악을 위해 복수 리전에서 인스턴스를 반복 생성·측정하여 최솟값·최댓값 범위로 표시

CPU 세대별 성능 티어 개요

AMD: Rome → Milan → Genoa → Turin (세대 순, 하위→상위)
Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids

ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100

구세대 CPU 타입은 성능이 낮음에도 운영 비용 탓에 오히려 더 비싸게 청구되므로 가능한 한 최신 세대로 업그레이드 필요

단일 스레드 성능 결과


AMD EPYC Turin이 전체 1위, 이 정도의 독보적 우위는 시리즈 사상 처음

AWS C8a(Turin, SMT 비활성화)가 가장 빠른 Turin 구성
GCP c4d는 성능 편차가 크고, 더 저렴한 n4d가 일관성 면에서 우수



Intel Granite Rapids: Emerald Rapids의 boost 클럭 의존·노드 경합으로 인한 성능 불안정 문제를 해소, 더 높고 일관된 성능 제공

GCP Emerald Rapids는 부하 증가 시 성능 저하가 뚜렷하며, GCP는 이를 위한 "일관된 성능" 모드(boost 비활성화)를 별도 제공


ARM 진영에서는 Google Axion이 EPYC Genoa급 단일 스레드 성능으로 ARM 서버 성능 최상위

Azure Cobalt 100은 Graviton3~Graviton4 사이
Ampere AmpereOne M은 AWS Graviton3 수준으로 소폭 개선


저가 제공업체 중 DigitalOcean은 성능 지표가 하락세, Akamai·Hetzner는 Milan 인스턴스 기준 양호하나 인스턴스 생성 시 성능 수준이 보장되지 않음

멀티 스레드 성능 및 확장성


확장성(Scalability): ARM 및 공유 CPU 인스턴스는 ~100%에 근접, 즉 2vCPU로 단일 vCPU 대비 2배 성능 실현

SMT 적용 x86 인스턴스는 100% 미만이며, 50%에 가까울수록 성능 이점이 없음
AMD는 전통적으로 Intel보다 SMT 효율이 높으며, Intel은 Ice Lake 이후 개선 추세
Akamai Turin 인스턴스는 SMT 적용임에도 71.9%라는 이례적으로 높은 확장성 기록 (원인 불분명)
SMT 비활성화 인스턴스: AWS C7a(Genoa), C8a(Turin), GCP t2d(Milan)



멀티 스레드 최강자: SMT 비활성화 Turin 기반 AWS C8a가 차트 압도

Google Axion은 이전 비교 1위였던 Genoa C7a와 동등 수준
Graviton4가 근접, Cobalt 100이 뒤를 이음
하위권은 Intel Broadwell/Skylake/Ice Lake, AMD Rome



7zip: Turin이 전반적 1위이나, Axion·Graviton4는 압축 해제 부분에서 Turin을 역전; Cobalt 100은 압축 해제 단독 최고 성능

NGINX (100 connections): AWS C8a가 2위 대비 거의 2배, Granite Rapids도 우수한 성적

FFmpeg H264: Turin 1위, Granite Rapids가 단일 스레드에서 근접; 2 전체 코어 사용 시 Axion이 SMT(단일 코어) 인스턴스 대부분을 Turin 제외하고 추월

OpenSSL RSA4096(AVX512): AMD가 자사 확장 기능에서 Intel을 역전, Turin·Genoa 모두 Intel 전 세대 대비 우위; Granite Rapids는 Ice Lake 대비 큰 개선 없음; ARM 및 구형 AMD는 AVX512 미지원으로 Intel Skylake 이하

온디맨드 성능/가격 비교


단일 스레드: Hetzner(공유 코어 포함 시 독보적 1위)·Oracle이 상위, GCP n4d(Turin)·Linode가 후속

AWS는 온디맨드 기준 최악의 가성비; Turin이 AWS 내 최선이나 구세대는 최하위



멀티 스레드: Oracle ARM 인스턴스(AmpereOne M)가 1위, Hetzner·Linode 공유 코어가 근접

Google Axion·Azure Cobalt 100·DigitalOcean 드롭릿이 2티어 구성



Hetzner 공유 코어(CPX22, CAX11)는 가용성 제약(EU·AP 리전 한정, 품절 빈번)에도 불구하고 단위 성능당 가격이 타 제공업체 대비 압도적

예약(Reserved) 성능/가격 비교


1년 예약: GCP Turin(n4d·c4d)이 Oracle과 근접, Azure Cobalt 100·Genoa도 경쟁력 있는 가성비

AWS는 C8a 패밀리가 최선, DoIT Flexsave 등 서드파티를 통해 예약 없이도 1년 가격 적용 가능



3년 예약 단일 스레드: GCP Turin이 Oracle·Hetzner 전용 VM을 소폭 앞섬; Azure도 Cobalt 100·Genoa로 경쟁력 확보

AWS는 3년 약정 시에도 Akamai·DigitalOcean보다 나은 가성비 제공



3년 예약 멀티 스레드: Azure Cobalt 100이 예상 밖 1위; GCP·OCI ARM이 뒤를 이음; AWS·GCP Turin도 상위권 근접

스팟/선점형 인스턴스 성능/가격 비교

스팟 인스턴스는 클라우드에서 자체 서버 운영 비용에 근접하는 유일한 방법으로 제시

인스턴스 회수 전 경고: AWS·OCI 2분, Azure·GCP 30초
Oracle 할인율 고정 50%, 나머지 3사는 리전·시점별 변동 심함



단일 스레드 스팟: Oracle Turin이 고정 할인율로 항상 최상위; GCP·Azure가 가장 깊은 할인 제공(Genoa, Cobalt 100)

스팟 활용 시 3년 예약 대비 약 2배의 달러당 성능 확보 가능



멀티 스레드 스팟: Azure Cobalt 100 1위, OCI AmpereOne M 2위; GCP는 t2d(Milan)이 리전에 따라 최고 가성비; AWS는 Turin으로 간신히 Top 10 진입

클라우드 제공업체별 총평


AWS: 전체 ARM 최고 성능은 Graviton5 비공개 베타로 Google Axion에 내줬으나, x86 최고 성능은 비SMT C8a(Turin)로 유지; 온디맨드는 타사 대비 고가이나 스팟·예약·Flexsave 활용 시 경쟁력 있음; 구세대 인스턴스 할인폭이 작아 C8a가 스팟에서도 최선

GCP: 4세대 ARM(Axion c4a)·AMD(Turin n4d·c4d) 인스턴스 권장; n4d가 c4d와 성능 거의 동일하면서 저렴; Granite Rapids는 로컬 SSD 추가 비용 없이는 접근 불가(현재 min_cpu_platform 미지원); 스팟은 리전별로 최적 인스턴스 타입이 다름

Azure: 자체 개발 ARM Cobalt 100이 Google Axion 대비 약간 낮은 성능이지만 경쟁력 있는 가격; Turin·Granite Rapids는 작성 시점 기준 비공개 프리뷰; 3년 예약 멀티 스레드에서 예상 밖 1위

Oracle: 소규모 프로젝트용 무료 4코어 ARM VM(A1) 강력 추천; 유료 인스턴스도 온디맨드 기준 Big 3의 1~3년 예약 가격에 필적하는 가성비; AmpereOne M(A4)·Turin E6가 각각 ARM·x86 최선 옵션; A4는 가용 리전 제한적

Akamai(Linode): 공유 코어 Linode는 온디맨드 기준 Hetzner·Oracle 다음 가성비; 생성 시 CPU를 선택할 수 없어 Milan 여부 직접 확인(/proc/cpuinfo) 필요; 전용 인스턴스는 세대 지정 가능(G8=Turin)이나 단일 스레드 성능이 이례적으로 낮음

DigitalOcean: 오랫동안 업그레이드 없어 성능 순위 하락, 과부하 현상도 존재; 간편한 인스턴스 업그레이드(원클릭 타입 변경) 등 편의성은 유지

Hetzner: 장기 사용자 평판 양호, 과도한 오버프로비저닝 없음(CX23 제외); 공유 코어 CPX22(Genoa)·CAX11(ARM Altra)가 가성비 최고이나 EU/AP 리전 한정 및 품절 빈발; 전용 코어 CCX13은 데이터센터별 성능 편차 존재

최종 권장 사항


최저 예산: Oracle 무료 티어 → Hetzner(EU·AP 리전 허용 시) → 스팟 인스턴스(Azure ARM, Oracle·GCP ARM/AMD)

비공유 CPU 최고 가성비(온디맨드): Oracle AmpereOne M A4 또는 Turin E6; 예약 시 Azure Dpls_v6, GCP c4a/n4d, AWS C8a도 경쟁력 있음

최고 성능: AWS C8a(비SMT Turin)가 단일 인스턴스 최고 성능; Turin 탑재 모든 대형 제공업체 인스턴스가 차상위 티어 형성
7개 클라우드(44종 VM) CPU 성능 및 가성비 벤치마크로, 단일·멀티 스레드·예약·스팟 인스턴스 등 포괄

AMD EPYC Turin이 거의 모든 벤치마크에서 1위를 기록하며 x86 진영의 새로운 최상위 CPU로 부상
온디맨드 가격 대비 성능에서는 Hetzner와 Oracle Cloud가 상위를 독식하며, AWS는 Turin을 제외하면 전반적으로 가장 나쁜 가성비를 기록

Intel Granite Rapids는 전작 Emerald Rapids의 성능 불안정 문제를 해결하고 일관된 성능을 제공하지만, Turin과의 격차는 여전히 크게 벌어짐
스팟 인스턴스를 활용하면 3년 예약 대비 약 2배의 달러당 성능을 확보할 수 있어, 클라우드 비용 최적화의 핵심 수단임



벤치마크 개요 및 방법론

비교 대상: AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner 7개 제공업체, 44종 VM 타입
비용 비교의 일관성을 위해 모든 인스턴스를 2vCPU, 2GB/vCPU RAM, 30GB SSD 기준으로 구성
AMD·Intel은 SMT(하이퍼스레딩) 적용으로 2vCPU = 1 물리 코어, ARM 및 일부 x86 예외(AWS C8a, C7a, GCP t2d)는 2vCPU = 2 물리 코어
온디맨드 가격은 미국 내 최저가 리전 기준, 가격은 2026년 1월 시점 기준이며 현재 가격 별도 확인 필요
사용 벤치마크 도구: DKbench(주 벤치마크, Perl·C/XS 기반 19종 서버 워크로드), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)

Geekbench 6는 멀티코어 측정 방식이 설계상 결함이 있다는 판단 하에 사용하지 않음


성능 범위 파악을 위해 복수 리전에서 인스턴스를 반복 생성·측정하여 최솟값·최댓값 범위로 표시

CPU 세대별 성능 티어 개요

AMD: Rome → Milan → Genoa → Turin (세대 순, 하위→상위)
Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids

ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100

구세대 CPU 타입은 성능이 낮음에도 운영 비용 탓에 오히려 더 비싸게 청구되므로 가능한 한 최신 세대로 업그레이드 필요

단일 스레드 성능 결과


AMD EPYC Turin이 전체 1위, 이 정도의 독보적 우위는 시리즈 사상 처음

AWS C8a(Turin, SMT 비활성화)가 가장 빠른 Turin 구성
GCP c4d는 성능 편차가 크고, 더 저렴한 n4d가 일관성 면에서 우수



Intel Granite Rapids: Emerald Rapids의 boost 클럭 의존·노드 경합으로 인한 성능 불안정 문제를 해소, 더 높고 일관된 성능 제공

GCP Emerald Rapids는 부하 증가 시 성능 저하가 뚜렷하며, GCP는 이를 위한 "일관된 성능" 모드(boost 비활성화)를 별도 제공


ARM 진영에서는 Google Axion이 EPYC Genoa급 단일 스레드 성능으로 ARM 서버 성능 최상위

Azure Cobalt 100은 Graviton3~Graviton4 사이
Ampere AmpereOne M은 AWS Graviton3 수준으로 소폭 개선


저가 제공업체 중 DigitalOcean은 성능 지표가 하락세, Akamai·Hetzner는 Milan 인스턴스 기준 양호하나 인스턴스 생성 시 성능 수준이 보장되지 않음

멀티 스레드 성능 및 확장성


확장성(Scalability): ARM 및 공유 CPU 인스턴스는 ~100%에 근접, 즉 2vCPU로 단일 vCPU 대비 2배 성능 실현

SMT 적용 x86 인스턴스는 100% 미만이며, 50%에 가까울수록 성능 이점이 없음
AMD는 전통적으로 Intel보다 SMT 효율이 높으며, Intel은 Ice Lake 이후 개선 추세
Akamai Turin 인스턴스는 SMT 적용임에도 71.9%라는 이례적으로 높은 확장성 기록 (원인 불분명)
SMT 비활성화 인스턴스: AWS C7a(Genoa), C8a(Turin), GCP t2d(Milan)



멀티 스레드 최강자: SMT 비활성화 Turin 기반 AWS C8a가 차트 압도

Google Axion은 이전 비교 1위였던 Genoa C7a와 동등 수준
Graviton4가 근접, Cobalt 100이 뒤를 이음
하위권은 Intel Broadwell/Skylake/Ice Lake, AMD Rome



7zip: Turin이 전반적 1위이나, Axion·Graviton4는 압축 해제 부분에서 Turin을 역전; Cobalt 100은 압축 해제 단독 최고 성능

NGINX (100 connections): AWS C8a가 2위 대비 거의 2배, Granite Rapids도 우수한 성적

FFmpeg H264: Turin 1위, Granite Rapids가 단일 스레드에서 근접; 2 전체 코어 사용 시 Axion이 SMT(단일 코어) 인스턴스 대부분을 Turin 제외하고 추월

OpenSSL RSA4096(AVX512): AMD가 자사 확장 기능에서 Intel을 역전, Turin·Genoa 모두 Intel 전 세대 대비 우위; Granite Rapids는 Ice Lake 대비 큰 개선 없음; ARM 및 구형 AMD는 AVX512 미지원으로 Intel Skylake 이하

온디맨드 성능/가격 비교


단일 스레드: Hetzner(공유 코어 포함 시 독보적 1위)·Oracle이 상위, GCP n4d(Turin)·Linode가 후속

AWS는 온디맨드 기준 최악의 가성비; Turin이 AWS 내 최선이나 구세대는 최하위



멀티 스레드: Oracle ARM 인스턴스(AmpereOne M)가 1위, Hetzner·Linode 공유 코어가 근접

Google Axion·Azure Cobalt 100·DigitalOcean 드롭릿이 2티어 구성



Hetzner 공유 코어(CPX22, CAX11)는 가용성 제약(EU·AP 리전 한정, 품절 빈번)에도 불구하고 단위 성능당 가격이 타 제공업체 대비 압도적

예약(Reserved) 성능/가격 비교


1년 예약: GCP Turin(n4d·c4d)이 Oracle과 근접, Azure Cobalt 100·Genoa도 경쟁력 있는 가성비

AWS는 C8a 패밀리가 최선, DoIT Flexsave 등 서드파티를 통해 예약 없이도 1년 가격 적용 가능



3년 예약 단일 스레드: GCP Turin이 Oracle·Hetzner 전용 VM을 소폭 앞섬; Azure도 Cobalt 100·Genoa로 경쟁력 확보

AWS는 3년 약정 시에도 Akamai·DigitalOcean보다 나은 가성비 제공



3년 예약 멀티 스레드: Azure Cobalt 100이 예상 밖 1위; GCP·OCI ARM이 뒤를 이음; AWS·GCP Turin도 상위권 근접

스팟/선점형 인스턴스 성능/가격 비교

스팟 인스턴스는 클라우드에서 자체 서버 운영 비용에 근접하는 유일한 방법으로 제시

인스턴스 회수 전 경고: AWS·OCI 2분, Azure·GCP 30초
Oracle 할인율 고정 50%, 나머지 3사는 리전·시점별 변동 심함



단일 스레드 스팟: Oracle Turin이 고정 할인율로 항상 최상위; GCP·Azure가 가장 깊은 할인 제공(Genoa, Cobalt 100)

스팟 활용 시 3년 예약 대비 약 2배의 달러당 성능 확보 가능



멀티 스레드 스팟: Azure Cobalt 100 1위, OCI AmpereOne M 2위; GCP는 t2d(Milan)이 리전에 따라 최고 가성비; AWS는 Turin으로 간신히 Top 10 진입

클라우드 제공업체별 총평


AWS: 전체 ARM 최고 성능은 Graviton5 비공개 베타로 Google Axion에 내줬으나, x86 최고 성능은 비SMT C8a(Turin)로 유지; 온디맨드는 타사 대비 고가이나 스팟·예약·Flexsave 활용 시 경쟁력 있음; 구세대 인스턴스 할인폭이 작아 C8a가 스팟에서도 최선

GCP: 4세대 ARM(Axion c4a)·AMD(Turin n4d·c4d) 인스턴스 권장; n4d가 c4d와 성능 거의 동일하면서 저렴; Granite Rapids는 로컬 SSD 추가 비용 없이는 접근 불가(현재 min_cpu_platform 미지원); 스팟은 리전별로 최적 인스턴스 타입이 다름

Azure: 자체 개발 ARM Cobalt 100이 Google Axion 대비 약간 낮은 성능이지만 경쟁력 있는 가격; Turin·Granite Rapids는 작성 시점 기준 비공개 프리뷰; 3년 예약 멀티 스레드에서 예상 밖 1위

Oracle: 소규모 프로젝트용 무료 4코어 ARM VM(A1) 강력 추천; 유료 인스턴스도 온디맨드 기준 Big 3의 1~3년 예약 가격에 필적하는 가성비; AmpereOne M(A4)·Turin E6가 각각 ARM·x86 최선 옵션; A4는 가용 리전 제한적

Akamai(Linode): 공유 코어 Linode는 온디맨드 기준 Hetzner·Oracle 다음 가성비; 생성 시 CPU를 선택할 수 없어 Milan 여부 직접 확인(/proc/cpuinfo) 필요; 전용 인스턴스는 세대 지정 가능(G8=Turin)이나 단일 스레드 성능이 이례적으로 낮음

DigitalOcean: 오랫동안 업그레이드 없어 성능 순위 하락, 과부하 현상도 존재; 간편한 인스턴스 업그레이드(원클릭 타입 변경) 등 편의성은 유지

Hetzner: 장기 사용자 평판 양호, 과도한 오버프로비저닝 없음(CX23 제외); 공유 코어 CPX22(Genoa)·CAX11(ARM Altra)가 가성비 최고이나 EU/AP 리전 한정 및 품절 빈발; 전용 코어 CCX13은 데이터센터별 성능 편차 존재

최종 권장 사항


최저 예산: Oracle 무료 티어 → Hetzner(EU·AP 리전 허용 시) → 스팟 인스턴스(Azure ARM, Oracle·GCP ARM/AMD)

비공유 CPU 최고 가성비(온디맨드): Oracle AmpereOne M A4 또는 Turin E6; 예약 시 Azure Dpls_v6, GCP c4a/n4d, AWS C8a도 경쟁력 있음

최고 성능: AWS C8a(비SMT Turin)가 단일 인스턴스 최고 성능; Turin 탑재 모든 대형 제공업체 인스턴스가 차상위 티어 형성