본문 바로가기

아이티뱅크/* DB 빅데이터

R프로그래밍을 배운다고 빅데이터를 배우는게 아닙니다.

 

 

 

 

 

R프로그래밍은 통계프로그램입니다.

 

 

 

통계라는 학문은 아주 오랫동안

존재해왔고 시대의 변화에 따라

컴퓨터가 보급되고 모든게

프로그램으로 진행됨에 따라

 

 

통계 또한, 손이나 소도구,

주판 등을 이용해왔다가

컴퓨터보급에 의해

통계학자들이 디자인한

통계프로그램으로 R이

탄생된 것입니다.

 

 

 

 

 

R은 이공계가 아닌 인문계열의

다양한 학과에서도 배울 수 있고

다루고 있는 프로그램입니다.

 

 

 

 

R외에도 SPSS, SAS등의

통계프로그램들이 있습니다.

 

 

 

국내에선 아직은 R보단

SPSS, SAS가 많이 사용되며

R보다도 더 체계적인

분석이 가능한 프로그램들입니다.

 

 

 

 

 

 

 

하지만 R이 많이 쓰이는 이유는

무료면서도 빅데이터기술의 핵심인

하둡과 연동이 된다는 장점이 있습니다.

 

 

 

무료라는 점이 큰 메리트인 이유는

빅데이터분석을 하기위해

 

 

분석대상을 선정하고

인력이 배치되고 수집하고

필요 정보를 뽑아내는 과정에서

모든게 다 돈이 들어갑니다.

 

 

 

게다가 분석을 한다고 반드시

필요한 정보를 뽑아내리란 보장도

없습니다 그렇기에 그러한 과정에서

비용절감이 가능한 R프로그래밍의

무료라는 장점은 기업들에

크나큰 매력으로 다가오기에

 

 

 

R의 점유율이 지속적으로

확대되는 추세입니다.

 

 

 

 

 

 

허나 데이터분석은

빅데이터 이전에도 존재해왔고

데이터는 분석의 대상입니다.

 

 

데이터분석을 위해

R프로그래밍을 배우는 것은

말그대로 데이터분석 수단을

배우는 것뿐이지

 

 

빅데이터를 배운다는 의미는 아닙니다.

 

 

 

 

 

 

빅데이터라는 개념을 불러온

기술은 하둡입니다.

 

 

하둡의 핵심은

분산처리(맵리듀스)+분산저장(HDFS)

입니다 무엇을 분산하느냐?

 

 

서버를 분산한다는 의미입니다.

 

 

 

기존엔 데이터수집분석이

모두 한대단위의 서버(PC)

이뤄졌었습니다.

 

 

 

 

 

데이터가 늘어날 수록 서버의

규모가 커졌었고 그렇게

대량의 데이터를 처리하기 위해

나타난게 슈퍼컴퓨터였습니다.

 

 

 

허나 이젠 한대의 서버로는

처리할 수 있는 데이터의 양보다

훨씬 더 많은 데이터들이

발생하고 있습니다.

 

 

그래서 여러 서버를 하나로 묶어

분산처리할 수 있는 하둡의 존재와

더불어 분석수단인 R이 주목받는

빅데이터의 핵심기술인 것 입니다.

 

 

 

 

 

 

R은 배움에 있어서 조건이 없지만,

하둡은 있습니다.

 

 

프로그래밍을 알아야하고

리눅스를 알아야하고

네트워크를 알아야합니다.

 

 

 

한마디로 전반적인

IT에 대한 지식이 갖춰져야

배울 수 있는 것이 하둡입니다.

 

 

 

 

 

 

 

이러한 이해를 바탕으로

빅데이터로의 진로를

희망하시는 분들은

 

 

 

다시한번 계획을 세워보셔야

할 것이고 그러한 업무를

담당하고 있는 상담사로써

 

 

 

질문, 고민 진로사항은

아래 정보를 참고하시면

직접 안내 도와드리겠습니다.

 

 

 

감사합니다^^

 

 

 

 

 

 

 



 KG아이티뱅크(창립:2002년)
 정보통신분야 취업률 1위
 자격증 취득률 93%

 2016년


 -전국 8개 전 지점 고용노동부 우수훈련기관 선정
 -고용노동부 훈련기관 인증평가 전국 8개 전 지점 최고등급획득
 2017년


 -고용노동부 훈련이수자 평가 A등급 선정
 -직업능력개발 유공자 국무총리표창 수상