일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Deep learning
- Statistics
- 인공지능
- 데이터 과학
- nodeJS
- c++
- 딥러닝
- 통계
- 몽고디비
- 우리들교회
- 김양재 목사님
- 주일설교
- probability
- Big Data
- node.js
- openCV
- 빅데이타
- MongoDB
- 김양재 목사
- 빅데이터
- 김양재
- WebGL
- Machine Learning
- data science
- Artificial Intelligence
- R
- 빅 데이타
- 빅 데이터
- 확률
- No SQL
- Today
- Total
목록빅 데이터 (130)
Scientific Computing & Data Science
Written by cinema4d1. Add the following in "Environment Path / System Variables" on your system %MONGODB_HOME%/bin 2. Create "data\db" directory at any place you want, i.e. c:\mongdb\data\db. 3. Execute console using "cmd" command through "Windows key + R". 4. On your console type the following: mongod -dbpath [FULL PATH OF data/db] For instance, "mongod -dbpath c:\mongdb\data\db"
Written by cinema4dMongoDB 서버가 실행된 상태에서 (./mongod) Terminal을 하나 더 실행한 후 MongoDB의 path로 이동하여 다음과 같이 입력한다../mongo MongoDB shell version: 2.4.8 connecting to: test Welcome to the MongoDB shell. For interactive help, type "help". For more comprehensive documentation, see http://docs.mongodb.org/ Questions? Try the support group http://groups.google.com/group/mongodb-user Server has startup warnings:..
Written by cinema4dMac에서 Terminal을 실행하여 MongoDB가 설치된 곳으로 path 이동한다.cd [root_path]/mongodb-osx-x86_64-2.4.8/bin다음과 같이 입력해 본다. (Windows에서는 "mongod.exe"를 실행한다)./mongod ./mongod --help for help and startup options Mon Jan 13 22:52:41.258 [initandlisten] MongoDB starting : pid=674 port=27017 dbpath=/data/db/ 64-bit host=Geol-ui-MacBook-Pro.local Mon Jan 13 22:52:41.259 [initandlisten] Mon Jan 13 22:5..
빅데이터 시장에서 텍스트를 분석하는 도구에 대해 알아보기로 하겠다. 일부는 유명하지 않으며 다른 일부는 이름만 들으면 누구나 아는 것들이다. 일부는 빅데이터 텍스트 분석용이라고 불리우며, 다른 일부는 단지 텍스트 분석용으로 일컬어진다. Attensity Attensity는 10년 이전부터 제품을 개발하고 판매하는 원조 텍스트 분석 기업 중 하나이다. 그 당시, 150개가 넘는 기업 고객들을 보유하고 있었으며 세계 최대의 NLP 개발 그룹이었다. Attensity는 텍스트 분석을 위한 다양한 엔진을 제공한다. 이들 엔진은 자동 분류, 개체 추출, 완벽 추출을 포함한다. '완벽 추출'은 Attensity의 핵심 기술이며 파싱된 텍스트로부터 자동으로 정보를 추출하고 추출된 정보를 조직화한다. 이 기업은 소셜 ..
오늘날 마켓에는 수많은 벤더들이 비즈니스를 위한 빅데이터 솔루션 니즈의 증가에 대응하고 있다. 빅데이터 솔루션을 제공하는 몇몇 흥미로운 기업들에 대해 소개하고자 한다:IBM은 빅데이터에 대해 기업용 솔루션 개발에 초점을 맞추고 있으며 IBM이 보유한 분석법을 임베드하거나 번들형을 포함한 플랫폼 통합형 솔루션을 제공하고 있다. IBM 제품들은 빌트입 데이터 마이닝을 갖는 웨어하우스 (InfoSphere warehouse)를 포함한다. IBM의 새로운 PureData Systems(통합형 시스템 플랫폼으로 고급 분석법 기술을 패키지화)는 다양한 통합 분석 패키지를 포함한다. IBM의 InforSphere Streams 제품은 사회과학 전문 통계 소프트웨어(SPSS)와 밀접하게 통합되어 실시간 데이터에 기반한..
빅데이터의 도전적 과제를 해결하는데 있어 연산 및 데이터에 집중적인 어플리케이션 사용과 함께 고도로 분산된 데이터 저장소 관리가 필요하다. 가상화는 빅데이터 플랫폼을 현실로 만들어 줄 수 있는 효율성에 힘을 실어준다. 가상화가 빅데이터 분석에 대한 기술적 요구사항은 아니더라도 소프트웨어 프레임웍은 가상화 환경에서 보다 효율적이다.가상화는 빅데이터 환경에서 요구하는 확장성 및 운영 효율성을 지원하는 세 가지 특성을 지닌다:분할: 가상화에 있어 많은 어플리케이션과 운영 시스템들은 활용가능한 자원을 분할함으로서 단일 물리적 시스템만으로도 지원된다.분리: 각 가상머신은 물리적 호스트 시스템과 기타 가상화머신으로부터 분리된다. 이러한 분리로 인해 만약 하나의 가상 인스턴스가 충돌할 경우, 다른 가상머신과 호스트 ..
맵 리듀스는 빅데이터에 있어 이상적인 소프트웨어 프레임웍이다. 왜냐하면 프로세서 분산 그룹 상에서 방대한 양의 비정형(unstructured) 데이터를 병렬로 처리할 수 있는 프로그램을 개발할 수 있는 도구이기 때문이다. 빅데이터를 위한 맵 함수맵(map) 함수는 다년간 많은 함수형 프로그래밍 언어의 일부였다. 맵은 데이터 요소의 처리 항목에 있어 핵심 기술로 새로운 활력을 불어 넣었다.함수형 언어의 운용자들은 데이터의 구조를 변경하지 않았다; 이들은 결과 출력을 위해 새로운 데이터 구조를 만들어냈다. 본래의 데이터 자체 또한 변경되지 않았다. 따라서 맵 함수를 무사히(?) 사용할 수 있는데 이는 여러분의 소중한 데이터에 어떤 해도 가하지 않을 것이기 때문이다.함수형 프로그래밍의 또다른 장점은 데이터의 ..
하둡(Hadoop, 이하 하둡)은 HDFS (하둡 분산 파일 시스템, Hadoop Distributed File System)와 맵 리듀스(Map Reduce, 이하 맵 리듀스)를 이용하여 하드웨어 클러스터(즉, 분산 컴퓨팅 환경) 상에서 빅데이터를 분석하는 오픈-소스 소프트웨어 프레임웍이다.하둡 분산 파일 시스템(HDFS)은 기업들이 간단하고도 실용적인 방식으로 거대한 양의 데이터를 보다 쉽게 관리할 수 있도록 개발된 것이다. 하둡은 큰 문제를 보다 작은 요소를 분할하여 신속한 분석과 비용에 있어서도 효과적이도록 하였다. HDFS는 빅데이터 환경에 있어 파일 관리를 위한 다목적의 탄력있는 클러스터 접근법이다.HDFS는 파일 관리의 최종 목적지가 아니다. 이는 데이터 볼륨과 벨라서티(velocity)가 ..
빅데이터가 매우 활용가치가 높은 것은 누구나 알고 있는 사실이지만 분석 방법에 대해 아는 이들은 그리 많지 않다. Amazon과 Google 등은 빅데이터를 분석하는 최고의 역량을 지닌 기업들이다. 또한 이들 기업은 경쟁력 우위를 점하기 위한 지식을 보유하고 있다.Amazon의 추천 엔진을 생각해 보자. 이 엔진은 꽤 훌륭한 상품 추천을 위해 여러분의 구매 이력과 함께 구매 패턴, 여러분과 유사한 구매자의 구매 패턴까지도 알고 있다. 이것은 마켓팅 머쉰이며 이것의 빅데이터 분석 능력은 Amazon을 성공으로 이끌었다.빅데이터 분석 능력은 여러분의 조직에도 독특한 기회를 제공한다. 여러분이 할 수 있는 분석 방법을 늘릴 수 있을 것이다. 샘플링 된 큰 데이터 셋에 제한되는 대신, 분석을 위한 보다 자세하고..
1. 하둡(Hadoop)은 분산 빅데이터 관리에 있어 버팀목이 되어 가고 있다.하둡은 방대한 양의 데이터를 처리하고 분석하는데 있어 맵리듀스(Map Reduce)와 연동하여 사용되는 분산 파일 시스템이며, 빅데이터 트렌드를 이끌어가는 원동력이다. 하둡은 데이터 웨어하우스 기술과 접목되어 구조형(structured) 및 비구조형(unstructured) 데이터를 보다 효과적으로 통합될 수 있도록 한다. 2. 빅데이터는 센서 데이터 수집을 통해 전혀 새로운 비즈니스 결과를 가져온다.점점 더 많은 비즈니스가 매우 정교한 센서 장비를 이용하고 있다. 빅데이터 기술의 혁신은 이러한 모든 데이터 분석을 가능하게 하여 문제 해결 능력을 진보시키고 결과적으로 비즈니스를 보호할 수 있는 장치를 마련한다. 3. 빅데이터는..