01-20 19:43
Notice
Recent Posts
Recent Comments
관리 메뉴

Scientific Computing & Data Science

[Data Science / Articles] 빅데이터용 하드웨어, 이제 ‘범용성’ 집착을 버릴 때가 됐다 본문

Data Science/Articles

[Data Science / Articles] 빅데이터용 하드웨어, 이제 ‘범용성’ 집착을 버릴 때가 됐다

cinema4dr12 2014. 2. 20. 15:10

원문: http://www.itworld.co.kr/news/86041

값싸고 강력한 범용 서버(commodity server)가 넘쳐나는 가운데, 빅데이터에 더 적합한 새로운 컴퓨팅 플랫폼으로 이전해야 한다고 주장한다면 다소 이상하게 보일 수도 있을 것이다. 그러나 사실이다.

기업들이 빅데이터를 적극적으로 도입하면서 빅데이터에 맞는 서버 기술이 무엇인가에 대한 논의가 활발하다. 빅데이터로 인해 여러 가지 작업을 동시에, 효과적으로, 그리고 싼 값에 처리할 수 있는 인지 컴퓨팅(cognitive computing)과 정교한 분석 작업이 크게 발달하고 있다. 당연한 말이지만 처음부터 빅데이터를 염두에 두고 제작된 서버일수록 그렇지 않은 서버보다 새로운 작업 부하량을 더 잘 처리할 수 있다.

특히 센서 달린 기기로 데이터를 수집해 전송하는 사물 인터넷의 등장으로, 기업들은 경쟁 우위를 점하기 위해 ‘빅데이터’에서 ‘빅 인사이트(big insights)’로 시각의 무게중심을 이동하고 있다. 사물 인터넷을 위해서는 다양한 기기에서 테라바이트 단위의 데이터를 스트리밍 할 수 있어야 하고 이 데이터의 바다에서 원하는 종류의 정보를 실시간으로 꺼내올 수 있어야 한다.

기업들이 빅데이터 인사이트의 중요성을 인지함에 따라, ‘모으고, 연결하고, 생각하고, 적응하는’ 빅데이터의 네 영역은 앞으로 10여 년을 좌우할 비즈니스의 핵심 가치로 부상하고 있다.

빅데이터 트렌드가 가속화하면서 대기업과 중소기업을 막론하고 정교한 분석 작업도 더 늘어날 것이다. 가브리엘 컨설팅 그룹(Gabriel Consulting Group)이 빅데이터 사용자를 대상으로 사용 중인 워크로드(workloads)의 종류를 조사한 결과 (당연한 일이지만) 맵리듀스(MapReduce) 워크로드가 꼴찌였다. 기업 애널리틱스, 복합 이벤트 프로세싱(complex event processing), 시각화(visualization), 데이터 마이닝(data mining)은 이보다 순위가 높았다.

일부에서는 정적 데이터 분석 모델과 처리량이 적고 회전 지연 시간이 긴 멀티머신(multimachine) 서버를 이용해 빅데이터 부하량을 해결하려 하기도 했다. 그러나 이들에게 진짜 필요한 것은 이들 작업 부하량의 새로운 성질이나 데이터 스케일을 이해하면서 높은 컴퓨트 집적도(compute intensity)와 데이터 병렬성, 데이터 파이프라이닝(pipelining), ‘데이터-인-모션’의 실시간 애널리틱 프로세싱 등을 고려한 새로운 소프트웨어와 하드웨어 환경이다.

점점 더 컴퓨트 집적도가 높아지면서 기업 애널리틱스/빅데이터 작업량은 과학 기술 분야 컴퓨팅 애플리케이션과 비슷해지고 있다. 적절한 가격과 시간에 작업을 처리하려면 고도로 병렬화된 소규모 시스템 집단을 사용해야 한다.

일부에서는 서버 환경에서 높은 수준의 소프트웨어 커스터마이제이션(software customization)을 구현하는 것이 해결책이라고 주장한다. 그러나 이는 자원의 낭비, 비효율성, 에너지 및 공간 부족, 보안 문제, 소프트웨어 라이선스 비용 등의 문제로 이어질 가능성이 높다. 결국, 현대의 빅데이터 분석 작업에 적합한 기업용 서버는 다음과 같은 요건이 필요하다.

- 높은 컴퓨트 집적도(오퍼레이션과 I/O의 높은 비율)
- 병렬 처리 능력 향상
- 코어(core)별 처리 가능한 가상머신 증가
- 고급 시각화 능력
- 모듈러 시스템 디자인
- 유연한 확장성
- 보안 및 컴플라이언스, 그리고 하드웨어 암호화
- 메모리 및 프로세서 활용 증가

더 강력한 기업용 서버는 하드웨어와 펌웨어, 하이퍼바이저, 운영 체제, 데이터베이스, 그리고 미들웨어 전반에 걸친 통합과 최적화를 통해 빌트-인 탄력성(built-in resiliency)을 제공한다. 이러한 시스템들은 대개 설계와 구축, 조정, 지원이 동시에 이루어져 확장과 관리가 쉽다.

실제로 많은 대형 금융 기관이 수익을 높이기 위해 예측 분석 프로그램을 적극적으로 도입하고 있다. 그리고 이는 다시 현재의 컴퓨트 인프라를 더 확장해야 할 수요 증가로 이어진다. 범용 서버 대신 기업용 서버를 활용하는 것은 이러한 기업이 수 천 개의 작업을 병렬로 처리해 분석 서비스를 더 빠르게 전달하고, 또 서버 활용과 사업부 전체 서버 자원 공유를 강화하는 가상 환경을 구축하는 데도 유리하다. 서버 통합과 가상화를 도입하면 기업 운영에 필요한 물리적 서버의 수를 줄이고 데이터 센터 공간을 절약할 수 있다. 또한, 전력 및 냉각, 하드웨어 유지, 소프트웨어 라이선싱, 관리 비용 등을 절감하는 데도 도움이 된다.

하지만 여기서 끝이 아니다. 기업용 서버 장비를 더 효율적으로 배치하기 위해서는 빅데이터 워크로드와 관련한 3가지 주요한 컴퓨팅 요구를 고려해야 하나.

- 고급 빅데이터 분석은 병렬 프로세싱 기능과 고밀도, 모듈형 패키징(modular packahing)을 갖춘 확장성 높은 시스템이 필요하다. 더 많은 메모리와 대역폭, 그리고 자원 처리량을 갖춘 컴퓨트 시스템은 복수의 작업을 동시에 처리하고 수백만 건을 초 단위에 처리한다. 또한, 고급 분석 알고리즘의 병렬 처리 역시 초 단위로 처리할 수 있다.

- 빅데이터는 높은 신뢰성과 탄성을 갖춘 컴퓨팅 시스템을 요구하며, 중단 혹은 아키텍처 변경 없이도 일시적인 수요 증대를 감당할 수 있다. 보안 유출 사고를 예방하고 다운타임 없이, 혹은 매우 짧은 다운타임으로 워크로드 성능을 강화할 수 있다.

- 새로운 빅데이터 워크로드를 지원하려면 오픈소스 기술로 컴퓨팅 시스템을 구축하고, 오픈소스 환경의 혁신을 지원할 수 있어야 한다. 최신 가상화 및 클라우드 솔루션을 통해 오픈소스 아키텍처는 더 높은 상호운용성과 유연성을 구현하며 새로운 워크로드의 관리 작업도 간소화한다.

빅데이터는 여전히 새롭고 낯선 영역이지만 이 자원을 잘 활용하면 기업들은 새로운 경쟁력을 확보할 수 있다. 빅데이터를 실시간으로 분석하면 기업은 고객을 더 잘 지원하고, 새로운 시장 기회를 발견할 뿐만 아니라 시장에 대한 정확한 시각으로 신속하게 의사 결정을 내릴 수 있다. 결국, 빅데이터의 이러한 장점을 실제 수익으로 연결하기 위해 가장 필요한 것은 기존의 낡은 테크놀로지에 대한 집착을 버리고, 새로운, 그리고 더 발전한 대안을 받아들일 수 있는 열린 태도를 갖추는 것이다.

Comments