데이터 분석이 처음이라면?ㅣ 데이터 산업 전망과 독학 방법

데이터를 공부하고 싶지만 어떻게 시작해야 할지 막막할 분들을 위해 데이터 독학을 처음 시작할 때 방법을 알려드릴게요.
데이터 분석이 처음이라면?ㅣ 데이터 산업 전망과 독학 방법
안녕하세요, 코드잇 스프린트입니다.
이전 글에서 데이터 분석가가 하는 일을 알게 되었다면, 이제 본격적으로 데이터 분석 공부를 시작해볼까요? 그런데.. 데이터 공부는 어떤 것부터 시작해야하는걸까요? 데이터를 공부하고 싶지만 어떻게 시작해야 할지 막막할 분들을 위해 데이터 독학을 처음 시작할 때 방법을 알려드릴게요.
 
 

데이터 분석은 점점 더 중요해진다

 
공부 방법을 소개하기 전, 데이터 분석을 공부하면 ‘먹고 살 수 있을지’를 걱정하시는 분들을 위해 한국데이터산업진흥원에 24년 5월 30일에 올라온 따끈따끈한 자료인 <2023 데이터산업현황조사 보고서>에 따른 데이터 산업의 시장 규모와 앞으로의 전망을 말씀드릴게요.
 
자료 출처: 한국데이터산업진흥원
자료 출처: 한국데이터산업진흥원
 
국내 데이터 산업 시장규모는 2016년도부터 꾸준히 증가되어 왔어요.
2019년부터 2023년 예상치까지 연평균 증감률(CAGR)은 21.2%를 기록하면서 지속적인 성장세를 이어갈 것으로 조사되었어요. 특히, 데이터 산업의 시장 규모가 2019년 약 10조 원에서 2023년에는 23조 원을 넘어설 것으로 예측되면서, 데이터 기반 의사결정의 중요성이 더욱 강조되고 있습니다.
 
자료 출처: 한국데이터산업진흥원
자료 출처: 한국데이터산업진흥원
데이터 직무별 인력 현황 및 수요 자료에 따르면, 향후 5년 내에 필요한 데이터 인력 대비 부족률은 12.6%에 이릅니다. 파란색 꺾은선 그래프인 ‘부족률’을 보면 직무에 상관 없이 데이터 분야 전반적으로 인력이 부족하다는 것을 알 수 있어요.
데이터 산업의 인력 공급이 수요보다 적다는 점은 공부를 시작하는 입장에서는 매우 긍정적인 소식이겠죠!
 
 

데이터 분석 공부, 이렇게 시작하세요

 
필요성이 점점 더 커지고 있는 데이터 분석 공부, 어떻게 시작하면 좋을지 알려드릴게요.
필요성이 점점 더 커지고 있는 데이터 분석 공부, 어떻게 시작하면 좋을지 알려드릴게요.
 

STEP 1. 목표 설정과 계획 세우기

먼저, 왜 데이터 분석을 공부하려는지 명확한 목표를 설정하는 것이 중요합니다. 예를 들어, 비즈니스 인사이트를 도출하고 싶은지, 데이터 기반의 의사결정을 돕고 싶은지에 따라 학습 내용이 달라질 수 있습니다. 목표를 설정한 후에는 구체적인 학습 계획을 세워야 하는데요, 다음 스텝에서 말씀드릴게요!
 
 

STEP 2. 기본 개념 이해하기

✅ 데이터 리터러시 갖추기

데이터 분석은 방대한 분야이고 정말 많은 주제가 있기 때문에, 순차적으로 학습을 하는 게 중요합니다. 데이터를 올바르게 읽고 이해할 수 있는 '데이터 리터러시'를 갖추는 것부터 시작해서, 역량과 스킬을 쌓고 데이터 분석가나 데이터 사이언티스트 같은 커리어로 나아가는 걸 추천드려요. 데이터 리터러시는 데이터 분야 커리어를 준비하는 분과 그렇지 않은 분 모두에게 해당되는 공통 역량이기 때문이에요.
 

✅ 데이터 직접 만져보기

데이터 리터러시를 갖추는 것의 첫 발걸음은, 작은 데이터라도 직접 만져 보는 겁니다. 내가 가진 데이터를 원하는 대로 바꿔 보기도 하고, 탐색도 해 보는 거예요. 데이터를 특정 값들끼리 모아서 볼 수도 있고, 그래프로 시각화를 해 볼 수도 있죠. 데이터를 구해서 따로 연습해 보셔도 좋습니다. 나의 카드 사용 내역일 수도 있고, 스포츠나 영화에 대한 데이터도 좋습니다. 이렇게 직접 데이터로 이것저것 하다보면, 실제 내 주변의 데이터를 바라보고 해석하는 연습이 자연스럽게 될 겁니다.
 
 

STEP 3. 데이터 스킬 쌓기

✅ 커리어에 맞는 스킬 배우기

기본적인 데이터 리터러시를 갖추고 난 후에는 원하는 주제와 스킬을 선택해서 쌓아가면 됩니다. 데이터 분석 역량을 기르고 싶다면 통계 분야를 더 공부해 보거나, 클러스터 분석과 같은 분석 방법에 대해 더 알아보시는 것도 좋습니다. 인터넷이나 데이터베이스에서 원하는 데이터를 구하는 역량을 키우고 싶다면, 웹 크롤링이나 SQL 같은 스킬을 배우시는 것도 추천드려요.
 

✅ R vs 파이썬

데이터 분야에서 양대 산맥을 이루고 있는 프로그래밍 언어는 바로 R과 파이썬인데요, 이 두 언어는 목적이 다르기 때문에 가지고 있는 특징도 다르답니다. R은 통계와 시각화에 특화된 언어이기 때문에 데이터 분석이나 시각화를 할 수 있는 툴이 아주 많습니다.
하지만 통계와 시각화만을 위한 툴이기 때문에 R을 배운다고 해서 다른 프로그래밍을 할 수 있는 건 아니겠죠. 파이썬은 다양한 분야에서 사용되기 때문에 데이터 사이언스를 하기 위해서 파이썬을 배웠다가 웹 개발 등 다른 분야로 넘어갈 수 있다는 장점이 있습니다.
 

✅ 데이터 분석과 프로그래밍이 처음이라면

프로그래밍을 처음 배우는 입장에서 R은 조금 어려울 수 있어요. 통계학자들이 통계를 위해 만든 언어이기 때문에 일반적인 프로그래밍 언어와는 다른 특이한 점이 있는데요. 파이썬은 간단하고 직관적인 언어이기 때문에 프로그래밍을 처음 배우기에 좋은 언어입니다. 그리고 대부분의 언어들과 비슷하기 때문에 프로그래밍을 이미 해봤다면 아무 문제 없이 문법을 배울 수 있을 겁니다.
어떤 언어를 택할지는 상황에 따라 다르겠지만 일반적으로 추천하는 것은 활용 범위가 넓은 파이썬입니다. 앞서 설명드린 것처럼 배우기 쉽고, 추후 다른 프로그래밍 분야에도 도전할 수 있으며 또 파이썬이 정말 빠른 속도로 인기가 높아지고 있기 때문입니다.
 
 

가장 중요한 것은 ‘실제’ 데이터의 경험

 

📊 경험이 전공보다 중요하다

데이터 리터러시를 갖추는 방법에서도 말씀드렸지만, 데이터 분석 학습에서 가장 중요한 것은 ‘실제 데이터’의 경험인데요, 데이터 취업 시장에서 지원자를 가르는 중요한 기준 중 하나 역시 ‘데이터 관련 전공을 했는지’가 아닌, ‘실제 데이터 프로젝트의 경험’입니다.
실제 데이터와 마주하게 되면 예상치 못한 문제들이 발생할 수 있고, 이를 해결하는 과정에서 진정한 실력이 쌓입니다. 예를 들어, 데이터의 누락이나 이상치 처리, 다양한 데이터 소스로부터의 통합, 실제 비즈니스 문제에 대한 통찰력 도출 등은 이론만으로는 해결하기 어려운 부분이겠죠.
 

📊 프로젝트 경험, 독학으로 어렵다면?

그 중에서도, 실제 기업의 프로덕트 데이터와 유저 데이터를 분석해보는 경험이 매우 중요합니다.
이러한 데이터는 혼자 학습할 때는 직접 구하기 어렵습니다. Kaggle, Dacon 등에서 다른 사람들이 만든 데이터셋으로 혼자 연습해보는 것도 좋은 방법이지만, 실제 기업의 데이터를 사용해보는 경험이 포트폴리오의 차이를 만들어내는 결정적인 요소가 되는데요. 앞서 말씀드린 모든 과정을 혼자 해내기 막막하게 느껴진다면, 코드잇 스프린트와 함께 기초 단계부터 실무 단계까지 현직자의 멘토링을 받으면서 배워보는 것을 추천드립니다.
 

📊 스프린트에서는 이 모든 것을 무료로

스프린트를 수료한 수강생들의 평가가 등록되는 HRD-net 만족도 평가에서 5점 만점 중 4.8점이라는 최고의 만족도를 이끌어낸 스프린트에서는 아래 모든 것을 무료로 제공해드려요.
  • 실제 기업 데이터를 활용한 3번의 프로젝트
  • 라이브 멘토링과 현직자 멘토의 과제 리뷰
  • 1:1 맞춤형 커리어 코칭
  • 현직자들과 함께 하는 모의 알고리즘 인터뷰
  • 현업 트렌드를 반영한 최신 기술 스택 커리큘럼
    • 파이썬 기초
    • Numpy, Matplotlib, pandas 사용법
    • 머신러닝 입문 및 적용
    • Tableau, SQL
 
 
 
오늘 알려드린 방법으로 데이터 분석 독학을 시작할 수 있지만, 현직자의 피드백으로 부족한 부분을 보완하고 성장하면서 단시간 내에 더 효과적으로 학습할 수 있어요. 혼자서 막막했던 데이터 분석 공부, 코드잇 스프린트와 함께라면 더욱 쉽게 시작할 수 있습니다. 데이터 분석 전문가로 성장하는 첫 걸음을 코드잇 스프린트와 함께 하세요! ⚡️
 
 
 
🔽 아래에서 뉴스레터를 구독하고, IT커리어 팁을 쉽게 받아 보세요!
 
Share article

코드잇 스프린트 블로그