본문 바로가기

아이티뱅크/* DB 빅데이터

빅데이터란? 정의와 접근방식에 대해

 

 

 

 

 

 

 

 

'빅데이터'

 

 

단어 자체의 뜻으로 의미를

유추하자면 그냥 큰 데이터입니다.

 

 

 

 

 

대부분의 사람들이

빅데이터라하면 뉴스나 기사들에서

보아온 기사들 등을 보아

 

 

'그냥 큰 데이터들 사이에서

필요한 정보 분석하는 것'

정도의 인지는 갖고계십니다.

 

 

 

 

 

 

 

하지만 정확하게 얘기하자면

단순히 큰 데이터만을

지칭하는 것은 아닙니다.

 

 

 

 

빅데이터의 핵심적인

특징들이 몇 가지 있습니다만

 

 

그중 하나가 바로 '비정형'입니다.

 

 

 

 

 

 

'비정형데이터' 즉, 형식이 정해지지 않은

데이터를 말하고

 

 

기존에 데이터베이스(정보저장소)에

저장이 가능했던 형식이 있는

숫자, 문자의 데이터 뿐만 아니라

 

 

 

형식이 없는 동영상, 이미지, 음성,

소셜 데이터 등의 모든 이미지까지

포괄하여 수집하고 분석하여

이로운 정보들을 뽑아내는게

빅데이터의 정의입니다.

 

 

 

여기서 또 하나의 특징이 있는데,

 

 

데이터수집 분석의 단위가

기존엔 하나의 서버단위,

즉 한대의 PC단위로

이뤄졌었는데 이젠 하나의 서버단위로는

아무리 서버를 크게 늘려도

(슈퍼컴퓨터처럼) 한계가 있고

 

 

서버를 늘리는데에는 비용과 공간에 대한

제한이 발생하기 때문에

다른 방법이 필요해졌습니다.

 

 

 

 

 

그때 등장한게 구글에서 만든

데이터분석 시스템인 '맵리듀스'

 

 

 

맵리듀스를 기반으로 만들어진

하둡이 빅데이터 시대를 열었습니다.

 

 

 

하둡의 핵심은

분산처리 + 분산저장

 

 

 

하나의 서버로 처리하는게 아닌,

여러 서버로 분산하여 처리하여

 

 

지금의 방대한 양의

데이터를 처리할 수 있게 된 것입니다.

 

 

 

 

이러한 분산처리 시스템에

R이라는 통계분석 프로그램과의

연동을 통해 지금의

빅데이터 분석이 활용되고 있습니다.

 

 

 

 

 

 

 

 

빅데이터를 위해 시작해야하는 것은

데이터 분석이나, 하둡 R같은

빅데이터 고유기술이 아닌

 

 

 

 

프로그래밍을 배움으로써

IT를 이해하고

하둡을 배우기 위한

프로그래밍과 리눅스시스템에 대한 이해

(하둡을 다룸에 있어서 프로그래밍이

사용되고 분산저장은 리눅스서버로

저장이 된다)

 

 

 

그리고 빅데이터 채용에 있어서

필요한 요구조건들에 맞는

준비가 필요합니다.

(자바와 파이썬을 기반으로 한

개발능력과 리눅스서버 운용능력)

 

 

 

 

빅데이터 분야로의 진로희망

혹은 관심이 있으신가요?

 

 

 

 

 

 

 

상황에 맞는 계획과

로드맵을 그려드리고 있습니다.

 

 

 

아래 정보를 참고하여

문의주세요 친절히

안내 도와드리겠습니다.

 

 

 

 

감사합니다^^

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 KG아이티뱅크(창립:2002년)
 정보통신분야 취업률 1위
 자격증 취득률 93%

 2016년


 -전국 8개 전 지점 고용노동부 우수훈련기관 선정
 -고용노동부 훈련기관 인증평가 전국 8개 전 지점 최고등급획득
 2017년


 -고용노동부 훈련이수자 평가 A등급 선정
 -직업능력개발 유공자 국무총리표창 수상