빅데이터

    빅데이터 기술 정리 - 上(상 편)

    빅데이터와 빅데이터 기술에 대한 것을 정리해 놓은 글이며, 상편과 하편으로 올릴 예정이다. 빅데이터란? 데이터의 크기가 방대하여 기존의 시스템으로는 획득, 저장, 관리, 혹은 분석이 불가능한 데이터를 빅데이터라고 부른다. (Mckinsey Global Institute, 2011). 기존에는 정형 데이터들만 처리하여 관계형 데이터베이스 관리 시스템으로 처리가 가능하였으나, 멀티미디어 파일이나 형태가 고정되어 있지 않은 수 많은 비정형 파일들의 전송 및 처리때문에 등장하게 되었다. 특히 이러한 빅데이터들은 큰 서버라 할지라도 처리하기가 힘들어서 동시에 여러대의 서버가 처리하는 것이 매우 효율적이라 분산처리시스템을 이용한다. 분산 처리 시스템이란? 분산 처리 시스템이란 여러대의 서버가 네트워크를 통해 하나의..