Big Data에 대해
Big Data
###빅데이터란?
기존의 데이터 베이스로 관리가 불가한 정형 또는 비정형데이터. 그 중에서도 특히 비정형 데이터를 가르키는데 많이 사용한다.
등장배경
모바일 체제, 클라우드 환경,SNS의 폭발적 사용으로 늘어난 네트워크 데이터들을 처리하기 위해
빅데이터 플랫폼
플랫폼
어플리케이션을 실행 또는 개발할 수 있는 환경.
빅데이터플랫폼
빅데이터 어플리케이션을 실행 또는 개발할 수 있는 플랫폼.
다양한 구성요소들이 있지만 하둡, 알 정도만 알아도 시작하는데 무리가 없다.
시스템
입력을 결과로 바꾸어주는 체계
R의 단점
멀티코어를 제공하지 않는다. 싱글코어라서 처리속도 느림. so. 파이썬이나 기타언어 사용 추천.
하둡 엔지니어 연봉 평균 약 $133,000
우리가 예상치 못한 정보를 빅데이터를 통해 얻을 수 있음.
ex)성형수술 부작용과 관련이 많은 단어 -변호사