리눅스 htop/top에 보이는 숫자들, 대충 보지 말고 제대로 읽기
htop과 top에 나오는 업타임, 로드 애버리지, 프로세스 상태, 메모리 지표가 실제로 어디서 오고 무엇을 뜻하는지 풀어낸 긴 해설이다. /proc 파일시스템, strace, fork/exec/wait, signal, niceness, VIRT/RES/SHR 같은 기본기를 실제 명령 예제로 연결해 보여준다. 2019년 글이지만 리눅스 서버를 만지는 개발자에게 여전히 실무 가치가 높다.
- 1
로드 애버리지는 CPU 사용률 그 자체가 아니라 실행 중이거나 실행 대기 중인 프로세스와 uninterruptible 상태 프로세스의 지수 이동 평균이다
- 2
htop, top, ps 같은 도구는 대부분 /proc 아래의 커널 노출 정보를 읽어서 사람이 보기 좋게 보여준다
- 3
프로세스 상태 R, S, D, Z, T, t는 장애 분석에서 바로 쓰이는 신호이며 특히 D 상태와 좀비 프로세스는 오해가 많다
- 4
VIRT, RES, SHR, MEM%는 각각 다른 의미라서 메모리 사용량을 단일 숫자로 판단하면 쉽게 헷갈린다
htop을 ‘CPU 많이 먹는 프로세스 찾는 화면’ 정도로만 쓰면 장애 때 놓치는 게 많다. 이 글의 가치는 각 숫자가 어떤 커널 인터페이스에서 왔는지까지 연결해, 운영 감각을 한 단계 낮은 레이어로 내려준다는 데 있다.
관련 기사
클라우드가 멈추면 앱도 AI도 멈춘다, EU와 한국이 책임 묻기 시작했다
EU가 AWS와 Microsoft Azure를 디지털시장법상 게이트키퍼로 지정하려는 움직임을 보이면서, 소비자 앱 너머 클라우드 인프라까지 빅테크 책임을 묻는 흐름이 커지고 있어. 한국에서도 CDN과 클라우드 사업자에게 서비스 안정 의무를 부과하는 전기통신사업법 개정 논의가 진행 중이야.
AI 추론비 폭탄 맞은 기업들, 퍼블릭 클라우드에서 다시 내려오는 중
생성형 AI가 실험 단계를 넘어 상시 서비스로 들어가면서, 퍼블릭 클라우드의 GPU 사용료와 데이터 전송 비용이 부담으로 커지고 있어. 기업들은 학습과 실험은 퍼블릭 클라우드에 두고, 사용량이 일정한 추론 업무는 프라이빗 클라우드나 자체 서버로 옮기는 하이브리드 전략을 택하고 있어.
동남아 데이터센터 붐, 빠른 유튜브 뒤에 물 부족이 따라왔다
구글, 마이크로소프트, 아마존웹서비스, 엔비디아 같은 빅테크가 동남아에 클라우드 리전과 인공지능 인프라 투자를 늘리고 있음. 하지만 태국 라용·촌부리, 말레이시아 조호르처럼 데이터센터가 몰리는 지역에서는 물 부족, 소음, 분진, 전력 부담이 실제 주민 갈등으로 번지고 있음.
AI 데이터센터, GPU보다 먼저 전력·냉각 인프라 속도가 병목이 됐다
버티브 코리아는 AI 데이터센터 경쟁에서 이제 성능만큼 중요한 변수가 구축 속도라고 봤다. GPU를 확보해도 전력·냉각 인프라가 늦으면 바로 구형 인프라가 될 수 있고, 랙당 발열이 과거 1~3kW에서 현재 100~200kW 수준으로 커지면서 모듈형 인프라와 액체냉각의 중요성이 커지고 있다.
클라우드가 멈추면 앱도 AI도 같이 멈춘다, 이제 책임은 누가 질까
유럽연합이 아마존과 마이크로소프트의 클라우드를 디지털시장법상 게이트키퍼로 지정하려는 움직임을 보이고 있다. 소비자 앱뿐 아니라 그 뒤에서 서비스를 떠받치는 클라우드 인프라까지 빅테크 책임 규제의 대상으로 보겠다는 흐름이다. 한국도 B2B 클라우드와 글로벌 인프라 기업이 규제 사각지대에 남지 않도록 서비스 안정화법 개정을 추진 중이다.
댓글
댓글
댓글을 불러오는 중...