1) 플롭스(Flops)의 정의와 표기
용어는 “Floating point Operations Per Second”의 약어로, 부동소수점 연산량을 시간(초)으로 나눈 처리율(throughput)을 뜻한다.
문맥에 따라 단일 연산을 가리키는 FLOP(부동소수점 연산 1회)와, 초당 처리율을 가리키는 FLOP/s 또는 FLOPS가 구분되어 사용된다.플롭스는 과학기술 계산, 수치해석, 시뮬레이션 등에서 정수 연산 중심의 지표보다 부동소수점 계산 능력을 더 직접적으로 반영하는 지표로 활용되어 왔다.
다만 “부동소수점 연산”의 정의는 연산 종류(덧셈, 곱셈, FMA 등)와 집계 방식에 따라 달라질 수 있으므로, 플롭스 수치만으로 서로 다른 시스템의 실제 체감 성능을 단정하기는 어렵다.
2) 단위 체계: SI 접두어와 테라플롭스·페타플롭스·엑사플롭스
예를 들어 테라(1012)는 테라플롭스(TFLOPS), 페타(1015)는 페타플롭스(PFLOPS), 엑사(1018)는 엑사플롭스(EFLOPS)로 표기한다.
최근에는 상위 접두어(예: 로나 1027, 퀘타 1030)도 SI에 포함되어 초대형 규모의 표현이 가능하다.실무적으로는 GPU 및 가속기 성능표에서 TFLOPS(또는 더 작은 GFLOPS), 슈퍼컴퓨터 성능 비교에서는 PFLOPS·EFLOPS 같은 큰 단위가 자주 쓰인다.
같은 “플롭스”라도 어떤 정밀도(예: FP64, FP32, FP16)를 기준으로 계산했는지에 따라 수치가 크게 달라지므로, 단위 접두어와 함께 정밀도 표기를 확인하는 것이 중요하다.
3) 플롭스는 어떻게 계산·측정되는가
플롭스는 크게 이론적 최고 성능(peak)과, 벤치마크로 측정한 실측 성능(measured)으로 나뉘어 해석된다.
이론적 최고 성능은 프로세서/가속기의 코어 수, 동작 주파수, 사이클당 수행 가능한 부동소수점 연산 수(벡터 폭, FMA 지원 등)를 바탕으로 산출하는 방식이 흔하다.
반면 실측 성능은 특정 프로그램(벤치마크)을 실행하여, 실제로 달성된 연산 처리율을 측정한다.
슈퍼컴퓨터 영역에서 널리 알려진 실측 방법은 LINPACK 계열 벤치마크(특히 HPL)이며, 조밀 행렬의 선형 방정식 풀이 성능을 측정해 시스템의 부동소수점 처리 성능을 하나의 수치로 제시한다.
이때 산출된 값은 “특정 계산 유형”에 최적화된 결과일 수 있으며, 어떤 워크로드에서는 다른 성능 병목(메모리 대역폭, 통신 지연, I/O 등)이 더 지배적일 수 있다.
4) 슈퍼컴퓨터 성능 지표와 TOP500: Rmax·Rpeak의 의미
슈퍼컴퓨터 순위와 성능 비교에서 자주 언급되는 개념이 Rmax와 Rpeak이다.
일반적으로 Rmax는 벤치마크를 통해 실제로 측정된 최대 성능(실측 플롭스)을 뜻하고, Rpeak는 하드웨어 사양을 기반으로 계산한 이론적 최고 성능(이론 플롭스)을 뜻한다.
TOP500과 같은 공개 순위에서는 통상 실측 성능(Rmax)을 기준으로 시스템을 비교·정렬한다.
Rmax가 Rpeak보다 낮게 나오는 것은 일반적이며, 그 차이는 프로세서 구조, 메모리 계층, 노드 간 인터커넥트, 소프트웨어 최적화 수준, 문제 크기 및 설정 등 다양한 요인으로 발생한다.
따라서 “플롭스가 높다”는 표현을 해석할 때는 Rmax인지 Rpeak인지, 어떤 벤치마크·정밀도를 사용했는지, 그리고 비교 대상이 동일 조건인지가 핵심 전제이다.
5) 플롭스 해석의 한계와 실무적 활용
플롭스는 연산 장치의 순수 부동소수점 처리 능력을 요약하는 데 유용하지만, 컴퓨터 성능의 전부를 대표하지는 않는다.
예를 들어 데이터 이동이 많은 작업은 메모리 대역폭과 지연시간, 캐시 구조, 저장장치 I/O 성능에 의해 성능이 좌우될 수 있다.
또한 동일한 FLOPS라도 정밀도(FP64/FP32/FP16 등)와 연산 유형(FMA 포함 여부)에 따라 의미가 달라지며, 벤치마크에서의 최적화 정도에 따라 수치가 변한다.
그럼에도 플롭스는 다음과 같은 상황에서 실용적 기준으로 쓰인다.
- 고성능컴퓨팅(HPC) 분야에서 시스템 규모와 세대(테라→페타→엑사)의 변화를 비교할 때
- 과학·공학 시뮬레이션, 수치해석, 선형대수 연산 중심 워크로드에서 연산 자원 산정의 기준으로 사용할 때
- 가속기(GPU/AI 가속기) 성능표에서 정밀도별 처리량(FP64/FP32/FP16 등)을 비교할 때
결론적으로 플롭스는 “연산 중심 성능”을 한눈에 보여주는 대표 지표이지만, 실제 응용 성능을 판단하려면 워크로드 특성, 정밀도, 메모리·통신·I/O 요소를 함께 검토해야 한다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


