일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 빅데이터
- 빅 데이타
- 딥러닝
- MongoDB
- R
- probability
- Deep learning
- Machine Learning
- No SQL
- 인공지능
- node.js
- 빅데이타
- WebGL
- Big Data
- openCV
- 데이터 과학
- 김양재 목사님
- data science
- c++
- 우리들교회
- 빅 데이터
- nodeJS
- 확률
- 김양재 목사
- 통계
- 몽고디비
- 주일설교
- Artificial Intelligence
- 김양재
- Statistics
- Today
- Total
목록Big Data (126)
Scientific Computing & Data Science
오늘날 마켓에는 수많은 벤더들이 비즈니스를 위한 빅데이터 솔루션 니즈의 증가에 대응하고 있다. 빅데이터 솔루션을 제공하는 몇몇 흥미로운 기업들에 대해 소개하고자 한다:IBM은 빅데이터에 대해 기업용 솔루션 개발에 초점을 맞추고 있으며 IBM이 보유한 분석법을 임베드하거나 번들형을 포함한 플랫폼 통합형 솔루션을 제공하고 있다. IBM 제품들은 빌트입 데이터 마이닝을 갖는 웨어하우스 (InfoSphere warehouse)를 포함한다. IBM의 새로운 PureData Systems(통합형 시스템 플랫폼으로 고급 분석법 기술을 패키지화)는 다양한 통합 분석 패키지를 포함한다. IBM의 InforSphere Streams 제품은 사회과학 전문 통계 소프트웨어(SPSS)와 밀접하게 통합되어 실시간 데이터에 기반한..
빅데이터의 도전적 과제를 해결하는데 있어 연산 및 데이터에 집중적인 어플리케이션 사용과 함께 고도로 분산된 데이터 저장소 관리가 필요하다. 가상화는 빅데이터 플랫폼을 현실로 만들어 줄 수 있는 효율성에 힘을 실어준다. 가상화가 빅데이터 분석에 대한 기술적 요구사항은 아니더라도 소프트웨어 프레임웍은 가상화 환경에서 보다 효율적이다.가상화는 빅데이터 환경에서 요구하는 확장성 및 운영 효율성을 지원하는 세 가지 특성을 지닌다:분할: 가상화에 있어 많은 어플리케이션과 운영 시스템들은 활용가능한 자원을 분할함으로서 단일 물리적 시스템만으로도 지원된다.분리: 각 가상머신은 물리적 호스트 시스템과 기타 가상화머신으로부터 분리된다. 이러한 분리로 인해 만약 하나의 가상 인스턴스가 충돌할 경우, 다른 가상머신과 호스트 ..
빅데이터 분석의 장점 중 한 가지는 아마도 사기 예방일 것이다. 수많은 평가를 통해 보험 회사가 지급하는 보험료의 적어도 10퍼센트는 사기에 대한 것이며, 전세계의 사기 피해로 인한 보상은 수백만에서 수억 달러 규모에 이른다. 보험 사기가 새로운 문제는 아니지만 문제의 심각성은 나날이 증가하고 있으며 보험 사기의 가해자의 수법 또한 정교해지고 있다. 그렇다면 과연 보험 회사가 사기를 감지하는 방안에 있어 빅데이터가 할 수 있는 역할은 무엇일까? 보험 회사는 가급적 초기에 사기를 방지하려고 한다. 월급, 의료비 청구, 변호사 비용, 인구 통계, 날씨 데이터, 콜센터 기록, 음성 데이터 기록 등의 과거 데이터 및 실시간 데이터를 기반으로 한 예측 모델을 개발하여 회사들은 초기 단계에 사기성이 있는 수상한 클..
맵 리듀스는 빅데이터에 있어 이상적인 소프트웨어 프레임웍이다. 왜냐하면 프로세서 분산 그룹 상에서 방대한 양의 비정형(unstructured) 데이터를 병렬로 처리할 수 있는 프로그램을 개발할 수 있는 도구이기 때문이다. 빅데이터를 위한 맵 함수맵(map) 함수는 다년간 많은 함수형 프로그래밍 언어의 일부였다. 맵은 데이터 요소의 처리 항목에 있어 핵심 기술로 새로운 활력을 불어 넣었다.함수형 언어의 운용자들은 데이터의 구조를 변경하지 않았다; 이들은 결과 출력을 위해 새로운 데이터 구조를 만들어냈다. 본래의 데이터 자체 또한 변경되지 않았다. 따라서 맵 함수를 무사히(?) 사용할 수 있는데 이는 여러분의 소중한 데이터에 어떤 해도 가하지 않을 것이기 때문이다.함수형 프로그래밍의 또다른 장점은 데이터의 ..
하둡(Hadoop, 이하 하둡)은 HDFS (하둡 분산 파일 시스템, Hadoop Distributed File System)와 맵 리듀스(Map Reduce, 이하 맵 리듀스)를 이용하여 하드웨어 클러스터(즉, 분산 컴퓨팅 환경) 상에서 빅데이터를 분석하는 오픈-소스 소프트웨어 프레임웍이다.하둡 분산 파일 시스템(HDFS)은 기업들이 간단하고도 실용적인 방식으로 거대한 양의 데이터를 보다 쉽게 관리할 수 있도록 개발된 것이다. 하둡은 큰 문제를 보다 작은 요소를 분할하여 신속한 분석과 비용에 있어서도 효과적이도록 하였다. HDFS는 빅데이터 환경에 있어 파일 관리를 위한 다목적의 탄력있는 클러스터 접근법이다.HDFS는 파일 관리의 최종 목적지가 아니다. 이는 데이터 볼륨과 벨라서티(velocity)가 ..
빅데이터가 매우 활용가치가 높은 것은 누구나 알고 있는 사실이지만 분석 방법에 대해 아는 이들은 그리 많지 않다. Amazon과 Google 등은 빅데이터를 분석하는 최고의 역량을 지닌 기업들이다. 또한 이들 기업은 경쟁력 우위를 점하기 위한 지식을 보유하고 있다.Amazon의 추천 엔진을 생각해 보자. 이 엔진은 꽤 훌륭한 상품 추천을 위해 여러분의 구매 이력과 함께 구매 패턴, 여러분과 유사한 구매자의 구매 패턴까지도 알고 있다. 이것은 마켓팅 머쉰이며 이것의 빅데이터 분석 능력은 Amazon을 성공으로 이끌었다.빅데이터 분석 능력은 여러분의 조직에도 독특한 기회를 제공한다. 여러분이 할 수 있는 분석 방법을 늘릴 수 있을 것이다. 샘플링 된 큰 데이터 셋에 제한되는 대신, 분석을 위한 보다 자세하고..