본문으로 건너뛰기
피드

팀스톤, 온튠을 서버 모니터링에서 풀스택 옵저버빌리티 플랫폼으로 확장

devops 약 5분
vote
0
댓글
북마크

팀스톤이 서버 모니터링 솔루션 온튠을 서버·네트워크·데이터베이스·쿠버네티스·애플리케이션까지 묶는 통합 관제 플랫폼으로 개편했다. 하반기에는 APM을 추가하고, 이상 탐지·장애 연관 분석·근본 원인 분석 같은 AIOps 기능도 붙일 계획이다.

  • 1

    온튠 V5는 서버 중심 관제에서 인프라 전반을 보는 풀스택 옵저버빌리티 플랫폼으로 확장됨

  • 2

    쿠버네티스 관제는 파드 상태뿐 아니라 서비스 간 실제 통신 흐름과 병목 지점을 보여주는 방향으로 강화됨

  • 3

    시스코, 주니퍼, 팔로알토, 포티넷 등 주요 네트워크 장비를 지원하는 NMS 기능이 통합됨

  • 4

    하반기에는 WAS 응답시간, 트랜잭션, SQL, 서비스 호출 흐름을 분석하는 APM 솔루션을 내놓을 예정임

  • 팀스톤이 서버 모니터링 솔루션 온튠(onTune)을 통합 관제 플랫폼으로 확장함

    • 기존 온튠은 유닉스, 리눅스, 윈도 서버의 성능 데이터를 수집·분석하는 솔루션으로 공급돼 왔음
    • 이번 개편은 서버만 봐서는 복잡한 기업 IT 환경의 장애 원인을 찾기 어렵다는 문제의식에서 출발함
  • 새 방향은 풀스택 옵저버빌리티임. 서버 하나만 보는 게 아니라 서비스가 지나가는 전체 경로를 보겠다는 얘기임

    • 관제 대상은 서버, 네트워크, 데이터베이스, 쿠버네티스, 애플리케이션으로 넓어짐
    • 기존에는 각 영역이 별도 솔루션으로 운영돼서 장애가 나도 어느 구간이 문제인지 찾는 데 시간이 걸렸음
    • 온튠 V5는 서비스가 어떤 인프라를 거쳐 동작하는지, 장애가 어떤 영역에 영향을 주는지 함께 분석하는 방향으로 확장됨

중요

> 포인트는 “모니터링 항목이 늘었다”가 아니라 “장애 원인 구간과 서비스 영향도를 한 플랫폼에서 엮어 보겠다”는 데 있음.

  • 쿠버네티스 관제 기능도 강화됨

    • 컨테이너 실행 단위인 파드(Pod)가 정상 동작하는지만 보여주는 수준에서 그치지 않음
    • 서비스 간 실제 통신 흐름을 제시해서 운영자가 어떤 서비스 흐름에서 병목이 생기는지 직관적으로 볼 수 있게 하겠다는 방향임
    • 쿠버네티스 환경에서는 파드가 재시작되고 서비스 경로가 바뀌기 쉬워서, 단순 상태 체크만으로는 원인 파악이 빡셈
  • 네트워크 모니터링 시스템(NMS) 기능도 온튠 안으로 들어옴

    • 시스코, 주니퍼, 팔로알토, 포티넷 등 주요 장비를 지원함
    • 서버와 네트워크를 한 플랫폼에서 관리하게 해, 인프라 계층 사이의 장애 연관성을 보기 쉽게 만들려는 의도임
  • 데이터베이스, 그래픽처리장치(GPU), 퍼블릭 클라우드 관제 기능도 확대 중임

    • GPU 관제는 AI 워크로드가 늘어나는 기업 환경에서 점점 더 중요해지는 영역임
    • 퍼블릭 클라우드까지 포함하면 온프레미스와 클라우드가 섞인 하이브리드 환경을 겨냥한다고 볼 수 있음
  • 하반기에는 애플리케이션 성능 모니터링(APM) 솔루션도 출시할 계획임

    • 웹애플리케이션서버(WAS) 응답시간, 트랜잭션, SQL, 서비스 호출 흐름 분석을 지원할 예정임
    • 이게 붙으면 인프라 관제에서 애플리케이션 레벨 병목 분석까지 이어지는 그림이 됨
  • 인공지능 기반 IT 운영(AIOps) 기능도 추가될 예정임

    • 이상 탐지, 장애 연관 분석, 근본 원인 분석(RCA), 서비스 영향도 분석 등이 대상임
    • 관제 데이터가 많아질수록 사람이 직접 상관관계를 찾기 어려우니, 운영 효율성을 AI로 보완하겠다는 전략임

기술 맥락

  • 팀스톤이 온튠을 서버 모니터링에서 통합 관제로 확장하는 이유는 장애 원인이 더 이상 서버 하나에 깔끔하게 머물지 않기 때문이에요. 요즘 서비스는 네트워크, 데이터베이스, 쿠버네티스, 애플리케이션 호출이 얽혀 있어서 한 계층만 보면 증상만 보고 끝나기 쉽거든요.

  • 쿠버네티스 관제에서 파드 상태보다 서비스 간 통신 흐름을 강조한 것도 같은 맥락이에요. 파드가 살아 있어도 특정 서비스 호출 경로가 막히거나 느려지면 사용자는 장애로 느껴요. 그래서 “정상 작동 여부”보다 “어디서 병목이 생겼는지”가 더 중요해져요.

  • NMS를 통합하는 선택은 운영팀의 화면 전환 비용을 줄이려는 쪽에 가까워요. 서버 모니터링 도구와 네트워크 장비 관제 도구가 따로 있으면 장애 순간에 사람이 두 시스템을 맞춰 봐야 하니까, 원인 분석 시간이 길어질 수밖에 없어요.

  • APM과 AIOps까지 붙이겠다는 계획은 관제 플랫폼을 단순 대시보드에서 분석 도구로 끌어올리려는 움직임이에요. 응답시간, SQL, 호출 흐름, 이상 탐지를 한데 묶으면 장애가 인프라 문제인지 애플리케이션 문제인지 더 빨리 좁힐 수 있어요.

국내 엔터프라이즈 운영 환경은 여전히 서버·네트워크·DB·쿠버네티스 관제가 따로 노는 경우가 많음. 온튠 개편은 ‘장애가 난 지점’이 아니라 ‘장애가 서비스에 미친 영향’을 보겠다는 방향이라, 말 그대로 되면 운영팀 입장에선 꽤 현실적인 문제를 건드리는 셈임.

댓글

댓글

댓글을 불러오는 중...

devops

SaaS 늘어나는데 ERP·CRM 운영팀은 아직 온프레미스 시절에 멈춰 있음

클라우드와 하이브리드 전환이 빨라지면서 ERP, CRM, HRIS 같은 엔터프라이즈 애플리케이션 지원 조직의 역할이 흔들리고 있음. 인포테크리서치그룹은 업무량 데이터, 역할 재설계, 자원 산정을 기반으로 지원 조직을 다시 짜야 한다고 봄.

devops

eBPF로 USB 전송을 실시간으로 훔쳐보는 시스템 전체 스니퍼

usbsnoop은 리눅스 시스템 전체의 USB 트래픽을 실시간으로 보여주는 eBPF 기반 도구다. 컨트롤러별 트레이스포인트나 usbmon 없이, 모든 호스트 컨트롤러 드라이버가 지나가는 URB 제출과 완료 지점을 잡아 전송 내용, 지연시간, 에러, SCSI 명령까지 확인할 수 있다.

devops

선거철마다 쏟아지는 인공지능·데이터센터 공약, 전기랑 물 계획은 어디 갔나

6·3 지방선거 광역단체장 후보 54명 중 약 70%가 인공지능이나 데이터센터 관련 공약을 내놨지만, 전력·용수 조달 계획은 비어 있는 경우가 많다는 지적이 나왔다. 데이터센터 유치가 지역 경제 공약으로 포장되고 있지만, 실제로는 재생에너지, 송전망, 냉각수, 화석연료 의존까지 같이 따져야 하는 인프라 이슈다.

devops

무료 풀 BGP 피드, 실험실 라우터에 IPv4·IPv6 라우팅 테이블 넣어보기

이 글은 실험 환경에서 유럽 기준 풀 BGP 피드를 받아볼 수 있게 IPv4뿐 아니라 IPv6까지 제공한다는 안내다. 사용자는 ASN 65001, 상대 ASN 57355, eBGP 멀티홉, 긴 타이머 등을 맞춰 라우터에 세션을 구성해야 한다. 운영망에 가볍게 붙일 성격은 아니고, BGP 학습이나 랩 테스트용으로 자기 책임하에 써야 하는 자료다.

devops

미국 AI 클라우드는 상장 러시, 한국 MSP는 수익성 벽에 막혔다

미국에서는 AI 인프라와 클라우드 기업들이 성장성을 바탕으로 증시에 입성하는 반면, 한국 MSP 기업들은 낮은 수익성과 CSP 의존 구조 때문에 IPO 문턱을 넘기 어렵다는 분석이 나왔다. 메가존클라우드는 지난해 매출 1조7496억원을 냈지만 영업이익은 2억3300만원에 그쳐 사실상 0%대 영업이익률로 평가받고 있다.